CN111479830A - 使用铂talen的t细胞受体的完全取代技术 - Google Patents

使用铂talen的t细胞受体的完全取代技术 Download PDF

Info

Publication number
CN111479830A
CN111479830A CN201880079381.3A CN201880079381A CN111479830A CN 111479830 A CN111479830 A CN 111479830A CN 201880079381 A CN201880079381 A CN 201880079381A CN 111479830 A CN111479830 A CN 111479830A
Authority
CN
China
Prior art keywords
amino acid
dna binding
tcr
terminus
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880079381.3A
Other languages
English (en)
Inventor
一户辰夫
山本卓
佐久间哲史
本庶仁子
川濑孝和
美山贵彦
铃木隆二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genesis Genesis Corp
Hiroshima University NUC
Original Assignee
Genesis Genesis Corp
Hiroshima University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genesis Genesis Corp, Hiroshima University NUC filed Critical Genesis Genesis Corp
Priority to CN202311565442.6A priority Critical patent/CN117820491A/zh
Publication of CN111479830A publication Critical patent/CN111479830A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/462Cellular immunotherapy characterized by the effect or the function of the cells
    • A61K39/4621Cellular immunotherapy characterized by the effect or the function of the cells immunosuppressive or immunotolerising
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4632T-cell receptors [TCR]; antibody T-cell receptor constructs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/46433Antigens related to auto-immune diseases; Preparations to induce self-tolerance
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464484Cancer testis antigens, e.g. SSX, BAGE, GAGE or SAGE
    • A61K39/464488NY-ESO
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/46449Melanoma antigens
    • A61K39/464491Melan-A/MART
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/464838Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10041Use of virus, viral particle or viral elements as a vector
    • C12N2740/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Communicable Diseases (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Hybrid Cells (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供一种排除在导入TCR基因时因内源性TCR导致的影响的技术。本发明使用基因组编辑酶来编辑TCR基因,作为基因组编辑酶的特征之一在于,其DNA结合结构域所包含的DNA结合模块中的两个特定的位置的氨基酸呈现出按4个DNA结合模块各不相同的重复模式。避免因与内源性TCR的错配导致的导入TCR表达效率的降低和/或自身反应性TCR的出现。

Description

使用铂TALEN的T细胞受体的完全取代技术
技术领域
本发明涉及T细胞的生物工程学操作。
背景技术
抗原特异性T细胞受体(TCR)基因导入技术,作为针对恶性肿瘤或病毒感染的效应T细胞(Teff)的过继转移免疫疗法的手段,近年来需求不断提高。然而,迄今为止开发的方法无法完全避免驻留在T细胞中的TCR和已导入的新 TCR共表达的影响。
并且,调节性T细胞(Treg)为在体内的免疫应答调节中起到主要作用的细胞群,其调节作用被认为是抗原非特异性,近年来,已经明确存在有与特定的自身抗原、同种抗原反应来发挥免疫调节作用的抗原特异性Treg。据报道,抗原特异性Treg在自身免疫疾病的模型中发挥出高于以往Treg的有效性。然而,迄今为止还未开发出对于任意所期望的抗原、在制备对该抗原特异性的Treg 时在防止与内源性TCR共表达的影响的同时、将外源性TCR导入Treg中的技术。
发明内容
用于解决课题的方法
在本发明一个方面,提供用于编辑内源性TCR基因的、基因组编辑酶修饰 TALEN或包含其的组合物。可通过用修饰TALEN编辑并切断内源性TCR基因来制备出不表达内源性TCR的T细胞。在一个实施方式中,将被称为铂TALEN (Platinum TALEN)的TALEN用作修饰TALEN。铂TALEN的特征之一为:其DNA结合结构域所包含的DNA结合模块中的两个特定位置的氨基酸呈现出按4个DNA结合模块各不相同的重复模式。铂TALEN具有如下特征:同时实现因功能结构域带来的高功能性和针对DNA序列的高识别特异性。
在本发明一个方面,提供一种方法,包括使用本发明的修饰TALEN来去除调节性T细胞中的内源性TCR基因的步骤。例如,使用修饰TALEN切断从外周血分离的Treg的TCR基因,可以抑制内源性TCR的表达。本发明的修饰 TALEN由于高的切断效率而可进一步完全抑制内源性TCR的表达,此外,由于序列识别特异性高,所以可以将因T细胞中的脱靶基因修饰带来的危险性抑制得较低。
在本发明一个方面,可提供一种方法,包括将TCR基因导入通过本发明的修饰TALEN去除了内源性TCR基因的Treg中的步骤。根据以上特性,认为在与TCR的编辑一同导入新的TCR时本发明的修饰TALEN是有用的。由此,可制备出表达TCR(所期望抗原特异性地显示高结合能力)的Treg。
在一个方面,本发明提供用于编辑TCR基因的组合物或试剂盒。在又一个方面,提供用于制备TCR修饰T细胞的组合物或试剂盒。
在本发明中,还提供利用本发明的方法制备的T细胞(例如,调节性T细胞)。此类调节性T细胞在所期望的免疫抑制的各种情况下是有用的。例如,本发明的调节性T细胞可用于自身免疫疾病、过敏性疾病或移植时的移植物抗宿主病(GVHD)、排斥反应或移植失败的治疗或预防。在本发明中还提供用于在本发明的方法中使用的物质。
另外,根据上述特性,本发明的修饰TALEN在具有如下特征的方法中的使用方面是有用的。在以T细胞(例如,调节性T细胞)中使效应T细胞的T 细胞受体(TCR)表达作为特征的方法中的使用方面,本发明的修饰TALEN 是有用的。在一个实施方式中,本发明的方法包括将全部或部分TCR基因导入调节性T细胞中的步骤,该步骤中以TCRα及TCRβ成对表达的方式导入。在与所期望的抗原反应的效应T细胞中,鉴定和/或分离具有高抗原结合能力的TCR,并可用于向T细胞的导入。本发明的一个实施方式的特征之一在于,在通过本发明的修饰TALEN使内源性TCR缺损的调节性T细胞(Treg)中,仅表达从与所期望的抗原反应的效应T细胞(Teff)获得的高抗原结合能力的TCR。可基于对抗原具有特异性的效应T细胞群中存在的T细胞受体(TCR)克隆的频率,鉴定高抗原结合能力的TCR。TCR的鉴定可使用测定TCR库的方法,所述方法包括无偏差地(no-bias)扩增TCR的核酸序列的步骤。在本发明中,可使用鉴定和/或分离抗原结合能力高的TCRα和TCRβ对的方法。例如,可使用HLA四聚体等分离与所期望的抗原特异性反应的效应T细胞(Teff)群,并获得包含它们表达的TCRα链·TCRβ链的抗原识别区域的基因序列。进而,针对每个所得TCR克隆型对所期望抗原的结合能力,进行评估。
例如,本发明提供以下发明。
(项目1)一种用于编辑TCR基因的组合物,含有包含DNA结合结构域及功能结构域的多肽或编码所述多肽的核酸,
其中,所述DNA结合结构域和所述功能结构域通过由35~55个氨基酸组成的多肽连接,
DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,
在此,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数。
(项目2)如上述项目所述的组合物,其中,
所述DNA结合结构域和所述功能结构域通过由40~50个氨基酸组成的多肽相连接,
所述DNA结合结构域从N末端侧起连续地包含16~20个由34个氨基酸组成的DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32 个氨基酸的组合以及从N末端起第4n个DNA结合模块中的第4个氨基酸和第 32个氨基酸的组合互不相同,
在此,n为1~5的自然数,所述DNA结合结构域的来源为TALE。
(项目3)根据上述任一项所述的组合物,其中,所述功能结构域为DNA 切断结构域。
(项目4)根据上述任一项所述的组合物,其中,所述DNA结合结构域与 TCRα基因或TCRβ基因特异性结合。
(项目5)根据上述任一项所述的组合物,其中,所述DNA结合结构域与 TRAC外显子1、TRBC1外显子1或TRBC2外显子1特异性结合。
(项目6)根据上述任一项所述的组合物,其中,所述DNA结合结构域与序列号80的核酸序列、序列号81的核酸序列、序列号82的核酸序列、序列号 83的核酸序列、序列号84的核酸序列或序列号85的核酸序列特异性结合。
(项目7)根据上述任一项所述的组合物,其中,包含表达载体,所述表达载体含有编码所述多肽的所述核酸。
(项目8)根据上述任一项所述的组合物,其中,以mRNA的形式包含编码所述多肽的所述核酸。
(项目9)一种编辑TCR基因的方法,包括将上述任一项所述的组合物导入细胞的步骤。
(项目10)根据上述项目所述的方法,包括:
所述DNA结合结构域与TCRα基因特异性结合的、将上述任一项所述的组合物导入细胞的步骤;以及
所述DNA结合结构域与TCRβ基因特异性结合的、将上述任一项所述的组合物导入细胞的步骤。
(项目11)根据上述任一项所述的方法,其中,所述TCR基因的编辑为内源性TCR基因的去除。
(项目A1)根据上述任一项所述的方法,其中,还包括将外源性TCR基因导入所述细胞的步骤。
(项目A1-1)根据上述任一项所述的方法,其中,所述导入步骤包括通过微同源介导的末端连接(MMEJ)来将所述外源性TCR基因敲入所述细胞的基因组。
(项目A1-2)根据上述任一项所述的方法,其中,所述导入步骤包括将编码所述外源性TCR基因的载体导入所述细胞。
(项目A2)根据上述任一项所述的方法,其中,所述外源性TCR具有对NY-ESO-1的特异性。
(项目A3)一种TCR修饰T细胞,其通过上述任一项所述的方法制备。
(项目A4)一种包含上述任一项所述的TCR修饰T细胞的组合物,用于治疗对象的癌症。
(项目A5)根据上述任一项所述的组合物,其中,所述癌症为NY-ESO-1 阳性的癌症。
(项目12)一种用于编辑TCR基因的组合物,其特征在于,
所述组合物包含编码包含DNA结合结构域的多肽的核酸,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合以及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,
在此,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数, x和y为不同的自然数,
所述组合物与编码包含功能结构域的多肽的核酸配合使用。
(项目12A)根据上述项目所述的组合物,其具有上述项目的任意一个或多个中记载的特征。
(项目13)一种用于编辑TCR基因的组合物,其特征在于,
所述组合物包含编码包含功能结构域的多肽的核酸,所述组合物与编码包含DNA结合结构域的多肽的核酸配合使用,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合以及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,
在此,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数, x和y为不同的自然数。
(项目13A)根据上述项目所述的组合物,其具有上述项目的任意一个或多个中记载的特征。
(项目14)一种用于编辑TCR基因的配合物,其特征在于,
所述配合物包含编码包含DNA结合结构域的多肽的核酸和编码包含功能结构域的多肽的核酸,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合以及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数, x和y为不同的自然数。
(项目14A)根据上述项目所述的配合物,其具有上述项目的任意一个或多个中记载的特征。
(项目15)一种多肽,包含DNA结合结构域及功能结构域,
其中,所述DNA结合结构域和所述功能结构域通过由35~55个氨基酸组成的多肽相连接,
DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合以及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数, x和y为不同的自然数,
所述DNA结合结构域与TCRα基因或TCRβ基因特异性结合。
(项目15A)根据上述项目所述的多肽,其具有上述项目的任意一个或多个中记载的特征。
(项目16)根据上述任一项所述的多肽,其中,
所述DNA结合结构域和所述功能结构域通过由40~50个氨基酸组成的多肽连接,
所述DNA结合结构域从N末端侧起连续地包含16~20个由34个氨基酸组成的DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同;
从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同;
从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同;
从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同;
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32 个氨基酸的组合及从N末端起第4n个DNA结合模块中的第4个氨基酸和第 32个氨基酸的组合互不相同,
在此,n为1~5的自然数,所述DNA结合结构域的来源为TALE。
(项目17)根据上述任一项所述的多肽,其中,所述功能结构域为DNA 切断结构域。
(项目18)根据上述任一项所述的多肽,其中,所述DNA结合结构域与 TRAC外显子1、TRBC1外显子1或TRBC2外显子1特异性结合。
(项目19)根据上述任一项所述的多肽,其中,所述DNA结合结构域与序列号80的核酸序列、序列号81的核酸序列、序列号82的核酸序列、序列号 83的核酸序列、序列号84的核酸序列或序列号85的核酸序列特异性结合。
(项目20)根据上述任一项所述的多肽,其中,所述DNA结合结构域包含序列号86的氨基酸序列、序列号87的氨基酸序列、序列号88的氨基酸序列、序列号89的氨基酸序列、序列号90的氨基酸序列或序列号91的氨基酸序列。
(项目21)一种核酸,该核酸编码上述任一项所述的多肽的全部或一部分。
(项目22)一种用于编辑TCR基因的试剂盒,包含:
上述任一项所述的组合物或上述任一项所述的配合物;以及
确认内源性TCR基因变异的构件和/或确认内源性TCR基因去除的构件。
(项目23)一种用于编辑TCR基因的试剂盒,包含:
上述任一项所述的组合物或上述任一项所述的配合物;以及
导入外源性TCR基因的构件和/或检测已导入基因的细胞的机件。
(项目24)根据上述任一项所述的试剂盒,用于用外源性TCR基因取代内源性TCR基因。
(项目25)根据上述任一项所述的试剂盒,用于制备TCR修饰调节性T 细胞。
(项目25A)根据上述项目所述的试剂盒,其具有上述项目的任意一个或多个中记载的特征。
(项目B1)根据上述任一项所述的试剂盒,用于制备TCR修饰T细胞,所述TCR修饰T细胞表达具有对NY-ESO-1特异性的外源性TCR。
(项目X)一种包含目标外源性TCR的细胞的细胞群,其中,包含除所述目标外源性TCR以外的外源性TCR的细胞在所述细胞群中的比率小于10%。
(项目X1)根据上述任一项所述的细胞群,其中,所述外源性TCR具有对NY-ESO-1的特异性。
(项目X2)一种制备上述任一项所述的细胞群的方法,包括:
从细胞中去除内源性TCR的步骤;以及
将编码所述外源性TCR的核酸导入已去除所述内源性TCR的所述细胞中的步骤。
(项目X2-1)根据上述任一项所述的方法,其中,所述导入步骤包括通过微同源介导的末端连接(MMEJ)来将所述外源性TCR基因敲入所述细胞的基因组。
(项目X2-2)根据上述任一项所述的方法,其中,所述导入步骤包括将编码所述外源性TCR基因的载体导入所述细胞。
(项目X3)根据上述任一项所述的方法,其中,所述外源性TCR具有对NY-ESO-1的特异性。
本发明中,对于上述一个或多个特征,除了所明示的组合之外,还可进一步组合提供。对于本发明的进一步的实施方式及优点,在根据需要阅读以下详细说明能够理解时,即为本领域技术人员所知。
发明的效果
能够降低或避免因与T细胞中的内源性TCRα链、TCRβ链的错配导致的导入TCR表达效率的降低、或自身反应性TCR的出现。由此,可将特定TCR 基因导入T细胞(例如,人T细胞),使所期望的TCR表达。
附图说明
图1为表示单个细胞的CMV NLV特异性TCRα及TCRβ库的图。表示从两名HLA A2抗原阳性及CMV抗体阳性的健康供体(V001及V004)所获得的细胞的CMV NLV特异性TCRα及TCRβ对。对分别来自V001及V004的118 个及29个T细胞进行分析,分别鉴定了3种(TCR ID;001-17、48及41)、6 种(TCR ID;004-66、22、63、30、28及71)的CDR3α及CDR3β对。各CDR3 序列对应于序列号93~110。
图2为表示各TCR对在TCR库中的存在频率与对抗原的亲和性之间的关系的散布图。纵轴表示读段(read)的频率,横轴表示结合亲和性。
图3为通过TALEN去除了内源性TCR基因时与对照相比的CD3表达的变化的直方图(右图)。图3左表示利用TALEN-TCR mRNA的实验方案、以及根据GFP-A及SSC-A的FACS分析结果。CD3表达可用作TCR表达的标志物,与对照相比,CD3表达转为阴性,因此表示成功去除了内源性TCR基因。
图4为表示T7E1测定结果(表示利用TALEN成功地切断TCR基因)的电泳图。表示在源自人T细胞的Jurkat细胞株中TRA·TRB基因被切断(分别为左图和右图)。
图5为用于导入TCR的表达载体的一个示例的示意图。
图6为表示通过去除内源性TCR及导入外源性抗原特异性TCR、能够用抗原特异性TCR完全地取代多克隆性Treg的TCR的图。
图7为表示利用本发明的方法进行的内源性TCR的去除及外源性抗原特异性TCR的导入的顺序的示意图。表示各步骤中的细胞的CD3表达的状态。中段表示通过CD3表达进行分选前的细胞群的CD3表达分布,下段表示通过CD3 表达进行分选之后的细胞群的CD3表达分布。
图8为将多克隆调节性T细胞(Poly-Treg)和导入有CD8+T细胞所识别的CMV抗原(QYD516)特异性TCR的调节性T细胞(QYD-Treg)的、对抗原(QYD516)的亲和性进行比较的图。左列表示GFP标记,右列表示QYD- 四聚体标记。可以理解的是,在各细胞群的功能性亚群(CD4+)中,与多克隆相比,在导入有抗原特异性TCR的群中获得了对抗原的亲和性。
图9为表示使用本发明的技术的、巨细胞病毒特异性细胞毒性T细胞的制备(人外周血T细胞)。表示针对细胞毒性T细胞进行TCR导入的结果。上段表示基于TCRαβ的表达量进行分析所得的结果,下段表示利用NLV-四聚体对 CMV抗原结合能力进行分析所得的结果。左列表示基于具有内源性TCR的T 细胞进行的分析,右列示出基于去除了内源性TCR并导入有NLV特异性TCR 的T细胞进行的分析。可以理解能够不受内源性TCR干扰地进行TCR替换。
图10为表示抗原特异性调节性T细胞(右端列)、多克隆调节性T细胞(左起第二列)及TCR敲除调节性T细胞(右起第二列)与对照(CD25为阴性的 CD4阳性T细胞级分;左端列)的、表面标志物的表达的点图。上段表示基于 CD127与CD25的分析,从上起第2段表示基于CD25与FoxP3的分析,从上起第3段表示基于FoxP3与CTLA4的分析,以及从上起第4段表示基于FoxP3 与HELIOS的分析。
图11为表示抗原特异性调节性T细胞、多克隆调节性T细胞及TCR敲除调节性T细胞与对照(CD25为阴性的CD4阳性T细胞级分)的表面标志物的表达的直方图。上段左起表示基于CD25、CD127、FoxP3的分析,下段左起表示基于CTLA4、HELIOS的分析。
图12为表示由抗原刺激引起的抗原特异性效应T细胞的增殖的图。从左起分别表示第0天、第3天、第5天。可以理解的是,响应于抗原刺激,QYD-516 特异性效应T细胞增殖。
图13为表示响应于抗原刺激的QYD-516特异性Treg的增殖。表示响应于由抗原呈递细胞引起的抗原刺激、QYD516-特异性Treg增殖。调节性T细胞的增殖在多克隆调节性T细胞中未观察到,但在抗原特异性调节性T细胞群中被观察到。
图14为表示通过抗原特异性调节性T细胞来抑制由抗原刺激引起的抗原特异性效应T细胞的增殖的图。表示在QYD-Teff增殖的抑制方面QYD-Treg 优于Poly-Treg。
图15为表示通过抗原特异性调节性T细胞来抑制由抗原刺激引起的抗原特异性效应T细胞的增殖的图。表示在QYD-Teff增殖的抑制方面QYD-Treg 优于Poly-Treg。
图16为表示实施例6中的使用动物模型的实验概要的图。
图17为表示一些修饰TALEN的示例的图。关于DNA结合结构域中的结合模块的部分,示出具体的序列的例。下划线为RVD,在图中将HD(对应于碱基C的RVD)作为一例记载。给出了Voytas TALEN、使Voytas TALEN的结合模块的第4个及第32个氨基酸序列改变的ZhangTALEN的结构的例,但这些TALEN,在全部模块中它们的部分的氨基酸残基相同。另一方面,在铂 TALEN中,结合模块的第4个及第32个氨基酸序列每个模块周期性地变化。图中,Voytas TALEN的DNA结合模块的例及铂TALEN的DNA结合模块的例的从上起第1个对应于序列号1,以下从上依次对应于序列号111~114。
图18为表示本发明的优选实施方式的一例的图。通过本发明,例如,可实现使用高功能性TCR的抗原特异性Treg移入疗法。
图19A表示Dolomite Bio公司制的单细胞RNA-Seq系统。图19B表示Oligo 珠粒的概况。Oligo珠粒中的SMART序列对应于序列号45。图19C表示显微镜下的Oligo珠粒。图19D表示微芯片内的珠流和液滴。珠粒在中心线(黄色) 流动,与两条细胞线(白色)混合之后,被注入到油线(红色),从而形成液滴 (左图)。在珠粒通过的时间点,随机封入液滴中。回收的液滴(白色)与油层 (透明)分离,能够容易地回收。
图20为表示本发明的修饰TALEN的制备方法的示意图。
图21为表示利用逐步TCR基因组编辑(Stepwise TCR genome editing)法制备1G4TCR表达T细胞的步骤的示意图。示出在各步骤中的细胞的CD3表达状态。中段表示通过CD3表达进行分选前的细胞群的CD3表达分布,下段表示通过CD3表达进行分选之后的细胞群的CD3表达分布。
图22为表示向TCR未表达T细胞株(αβnull Jurkat细胞)导入1G4TCR 的结果的图。左图表示所导入的TCR的表达效率,右图表示TCR导入细胞对 SLL肽四聚体的结合能力。左图和右图中获得相同效率,因此表示所表达的几乎全部TCR识别SLL肽。由此显示pMX载体对基因组编辑T细胞的适应性。
图23为表示1G4TCR导入人外周血T细胞的结果的图。
图24为表示TAL-PITCh载体设计的示意图。图中的序列分别对应于序列号120及121。
图25为表示TAL-PITCh载体设计的示意图。图中的序列分别对应于序列号120及121。
图26为表示1G4表达基因组编辑T细胞对SLL肽表达LCL的特异性细胞杀伤活性的图。表示1G4表达基因组编辑T细胞以细胞数依赖性方式发挥对源自NY-ESO-1的SLL肽表达LCL的细胞毒活性。
图27为表示使用TAL-PITCh载体制备内在性TCR缺陷NY-ESO-1特异性 T细胞的结果的图。表示在内在性TCR缺陷细胞的15.7%中表达掺入 TAL-PITCh载体中的1G4TCR。
图28表示通过使用在用于小鼠TCR切断时所制作的3种铂TALEN (TRA2-TALEN、TRB1-TALEN、TRB2-TALEN)的报告质粒的测定法(SSA 测定)进行切断活性评价的结果。当将锌指核酸酶(Zinc finger nuclease)对照组(pSTL-ZFA36/ZFA36)的切断活性设为1时,小鼠TRA2-TALEN、小鼠 TRB1-TALEN及小鼠TRB2-TALEN对靶切断位点的活性分别为3.09倍、3.79 倍及3.41倍。pSTL为ZFA36的阴性对照组,TRA2、TRB1及TRB2分别为在 TALEN不存在下的仅报告的阴性对照组,TRA2-TALEN/ZFA36、 TRB1-TALEN/ZFA36及TRB2-TALEN/ZFA36分别为报告基因为ZFA36时的阴性对照组。
具体实施方式
以下,示出本发明最优选的方式的同时进行说明。应当理解,在本说明书中,除非另有说明,否则单数形式也包括其复数形式的概念。因此,除非另有说明,单数形式的冠词(例如,英语中的“a”、“an”、“the”等)也包括其复数形式的概念。另外,应当理解,除非另有说明,否则本说明书中使用的术语具有本领域中常规使用的含义。因此,除非另有定义,本说明书中使用的所有专业术语及科学技术术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。在出现冲突的情况下,以本说明书(包括定义)优先。
(1.定义及基本技术的说明)
以下,对本说明书中特别使用的术语的定义和/或基本的技术内容进行适当说明。
在本说明书中,“效应T细胞”是指将由树突状细胞、巨噬细胞、B细胞等抗原呈递细胞呈递的抗原通过T细胞受体来进行识别、并激活分化的T细胞。在本说明书中,也存在记载为“Teff”等的情况。
在本说明书中,“调节性T细胞(Regulatory T cell)”是指Foxp3表达为阳性且示出免疫抑制作用的CD4阳性T细胞。在本说明书中,也可被称为“Treg”。也可将CD25强阳性及CD127表达弱阳性用作调节性T细胞的指标。Treg大致分为内源性T细胞(NaturallyOccurring Regulatory T cell,nTreg)、和从Naive CD4阳性T细胞分化的自我识别能力低的诱导性T细胞(Inducible Regulatory T cell,iTreg)。
在本说明书中,“流式细胞术”是指测定悬浮于液体中的细胞、个体及其他生物颗粒的颗粒数量以及每个个体的物理·化学·生物学特性的技术。利用该技术的装置被称为为“流式细胞仪”。
在本说明书中,“克隆型”是指源自编码T细胞受体或者免疫球蛋白分子或它们的一部分的T细胞或B细胞的重组序列。常规的体细胞的基因组序列在个体中是相同的,但在T细胞或B细胞的受体的编码序列中,每个细胞均发生重组,因此在个体中的T细胞或B细胞中存在多个克隆型。
在本说明书中,“优势”克隆是指以比本领域技术人员适当设定的一定阈值高的频率存在于克隆群体中的克隆。
在本说明书中,“T细胞受体(TCR)”是指存在于T细胞中的受体。TCR 是由两条TCR多肽链组成的异二聚体受体分子,存在常规的T细胞表达的αβ型TCR和具有特殊功能的γδ型TCR。α及β链TCR分子与多个CD3分子(CD3ζ链、CD3ε链、CD3γ链、CD3δ链)形成复合体,传导抗原识别后的细胞内信号,并引发各种免疫应答。伴随着病毒感染在细胞中增殖的病毒抗原或来自癌症细胞的癌症抗原等的内源性抗原,在MHC I类分子上作为抗原肽呈递。并且,源自外来微生物的抗原通过内噬作用掺入抗原呈递细胞中,经处理后呈递至 MHC II类分子上。这些抗原分别通过CD8+T细胞或CD4+T细胞所表达的 TCR识别。还已知,对于通过TCR分子进行的刺激而言,CD28、ICOS、OX40 分子等的共刺激分子是重要的。在本说明书中,关于主要目的之一的αβ型TCR,α及β的各个基因产物通过独特的组合来表达特异性。
利用免疫系统的生体防御机制很大程度上取决于主要由T细胞或B细胞承担的特异性免疫。原则上,T细胞或B细胞不与自身的细胞或分子反应,而是可特异性识别病毒、细菌等的外来型病原体并进行攻击。因此,T细胞或B细胞具有通过在细胞表面上表达的受体分子来识别并辨识自身抗原以及源自其他生物的各种抗原的机构。在T细胞中,T细胞受体(T cell receptor,TCR)充当抗原受体。细胞内信号通过来自这些抗原受体的刺激被传递,加速炎症性细胞因子、趋化因子等的产生,增进细胞增殖,并引发各种免疫应答。
TCR通过识别与在抗原呈递细胞上表达的主要组织相容性复合体(Majorhistocompatibility complex,MHC)的肽结合槽相结合的肽(peptide-MHC complex,pMHC),来辨识自身与非自身并识别抗原肽(Cell 1994,76,287-299)。
TCR基因由在基因组上被编码在不同区域的多个V区域(variable region, V)、J区域(joining region,J)、D区域(diversity region,D)及恒定区C区域 (constantregion,C)组成。在T细胞的分化过程中,这些基因片段以各种组合进行了基因重排,α链及γ链TCR表达由V-J-C组成的基因,β链及δ链TCR 表达由V-D-J-C组成的基因。通过这些基因片段的重排来创造出多样性,同时在V与D或D与J基因片段之间产生一个以上的碱基的插入或缺失,使得形成随机的氨基酸序列,并制成多样性更高的TCR基因序列。
TCR分子与pMHC复合体表面直接结合的区域(TCR足迹)由V区域中富含多样性的互补决定区(complementarity determining region,CDR)CDR1、 CDR2及CDR3区域构成。其中,CDR3区域包括V区域的一部分、通过随机序列形成的V-D区域(α链及γ链)或V-D-J区域(β链及δ链)以及J区域的一部分,并形成多样性最高的抗原识别位点。另一方面,其他区域被称为FR (framework region),起到形成称为TCR分子骨架的结构的作用。在胸腺中的 T细胞的分化成熟过程中,β链TCR首先进行基因重排,并与pTα分子缔合,形成pre-TCR复合体分子。然后,α链TCR被重排以形成αβTCR分子,同时,在未形成功能性αβTCR的情况下,另一个α链TCR基因等位基因中发生重排。已知,通过胸腺中的正/负的选择来选择具有适当亲和性的TCR以获得抗原特异性(Annual Review Immunology,1993,6,309-326)。
T细胞产生对特定抗原具有高特异性的1种TCR。在生体中存在多个抗原特异性T细胞,因此可形成多种TCR库(Repertoire),作为对各种病原体的防御机构来有效地发挥功能。
在本说明书中,“高功能性TCR”是指在对某抗原具有结合性的TCR之中,具有与其他TCR相比较高的结合性的TCR,某TCR是否为高功能性TCR可通过如下方法判断,例如,将使该TCR表达的细胞与一定浓度(例如,10μg/ml) 的抗原四聚体-PE复合体进行培养之后,测定是否能够以TCRαβ阳性细胞中的 MFI(平均荧光强度)超过一定值(例如,5000)这样的亲和性与其抗原结合。
(2.优选实施方式)
以下说明本发明的优选实施方式。以下所提供的实施方式是为了更好地理解本发明而提供,可以理解的是,本发明的范围不应限定于以下说明。因此,显而易见的是,本领域技术人员可参照本说明书中的描述,在本发明的范围内进行适当的修改。并且,可以理解的是,本发明的以下实施方式可单独使用或组合使用。
并且,在下文中所描述的实施方式均为表示概括或具体的示例的实施方式。以下实施方式中示出的数值、形状、材料、结构要素、结构要素的配置位置以及连接形态,步骤,步骤的顺序等为示例,并非旨在限定发明要求保护范围。另外,针对以下实施方式中的结构要素之中、表示最上位概念的独立权利要求中未记载的结构要素,作为任意的结构要素来进行说明。
(2.1.1.修饰TALEN)
在本发明的一个方面中,提供用于编辑TCR基因的组合物,所述组合物含有包含DNA结合结构域及功能结构域的多肽或编码该多肽的核酸。DNA结合结构域及功能结构域可单独提供。因此,在本发明的一个实施方式中,提供一种用于编辑TCR基因的组合物,所述组合物包含编码包含DNA结合结构域的多肽的核酸,其特征在于,与编码包含功能结构域的多肽的核酸配合使用。或者,提供一种用于编辑TCR基因的组合物,所述组合物包含编码包含功能结构域的多肽的核酸,其特征在于,与编码包含DNA结合结构域的多肽的核酸配合使用。在另一个实施方式中,提供一种用于编辑TCR基因的配合物,所述配合物包含:编码包含DNA结合结构域的多肽的核酸和编码包含功能结构域的多肽的核酸。本发明的基因组编辑酶优选为TALEN,更优选为铂TALEN。
铂TALEN通过形成周期性配置(使TALEN的DNA结合重复序列所包含的34个氨基酸中的第4个和第32个氨基酸变异),能够使活性比Voytas TALEN 上升(Sakuma et al.,SciRep,2013)。优选地,在本发明的方法中利用铂TALEN 编辑内源性TCR基因。在日本特开2016-175922中记载了有关铂TALEN的内容,其全部内容作为参考引用在本说明书中。本发明的修饰TALEN可以为例如具有以下记载的特征。
在本发明一实施方式中,可以同时实现由功能结构域带来的高功能性及针对DNA序列的高识别特异性,能够以高概率安全地发挥所期望的功能,并且,使用能够通过简单的操作来制备的多肽或编码该多肽的核酸进行内源性TCR 基因的修饰。
对于DNA结合结构域和功能结构域通过包含35~55个氨基酸的多肽相连、且DNA结合结构域所包含的DNA结合模块中的两个特定位置的氨基酸每 4个DNA结合模块呈现不同的重复模式的多肽,能够同时实现由功能结构域带来的高功能性和对DNA序列的高识别特异性。用于使该多肽表达的载体可通过使用具有特定特征的载体集及具有特定特征的载体库来简单制备。
在本发明一实施方式中,本发明可使用包含DNA结合结构域及功能结构域的多肽。在该多肽中,可利用如下多肽或编码其的核酸,即,DNA结合结构域及功能结构域由包含35~55个氨基酸的多肽连接,DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意的n相同,从N末端起第4n-2 个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意的n相同,从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意的n相同,从N末端起第4n个DNA结合模块中的第x个氨基酸和第 y个氨基酸的组合对于任意的n相同,从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,在此,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数。功能结构域可以为DNA切断结构域。包含编码多肽的多聚核苷酸。
另外,本发明可利用用于制备载体(该载体包含用于编码上述多肽的多聚核苷酸)的载体库,其中,载体库由从5’末端依次具有第一限制酶切断位点、编码4个DNA结合模块的多聚核苷酸及第二限制酶切断位点的多个载体形成,其中,第一限制酶切断位点及第二限制酶切断位点的组合为A型限制酶切断位点及B型限制酶切断位点的组合、A型限制酶切断位点及C型限制酶切断位点的组合、A型限制酶切断位点及D型限制酶切断位点的组合、A型限制酶切断位点及E型限制酶切断位点的组合、B型限制酶切断位点及C型限制酶切断位点的组合、C型限制酶切断位点及D型限制酶切断位点的组合、以及D型限制酶切断位点及E型限制酶切断位点的组合中的任一个,其中,A型限制酶切断位点~E型限制酶切断位点通过利用相同限制酶进行的切断均产生互不相同的切断末端,4个DNA结合模块中,从5’末端起第一个DNA结合模块中的第x 个氨基酸和第y个氨基酸的组合对于任意载体相同,从5’末端起第二个DNA 结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意载体相同,从5’末端起第三个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意载体相同,从5’末端起第4个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于任意载体相同,从5’末端起第一个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从5’末端起第二个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从5’末端起第三个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从5’末端起第4个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合互不相同,在此,x为1~40的自然数,y为1~ 40的自然数,x和y为不同的自然数。
本发明还可利用用于制备上述载体库的载体集。其中,该载体集含有从5’末端开依次包含第一个限制酶切断位点、DNA结合模块及第二个限制酶切断位点的多个载体,第一个限制酶切断位点及第二个限制酶切断位点通过利用相同限制酶进行的切断产生互不相同的切断末端,DNA结合模块中的第x个氨基酸和第y个氨基酸的组合为4个不同组合的任一个,其中,x为1~40的自然数, y为1~40的自然数,x和y为不同的自然数。
上述多肽在实现由功能结构域产生的高功能性的同时,实现对DNA序列的高识别特异性,因此通过将包含编码上述多肽的多聚核苷酸的载体导入至细胞,能够安全且高概率地实现所期望的TCR基因的修饰。并且,使用上述载体库时,可简单且快速地制备多肽表达用载体,该多肽表达用载体能够同时实现由功能结构域产生的高功能性及对DNA序列的高识别特异性。
作为DNA结合结构域的来源,可例举植物病原菌Xanthomonas的TALE(Transcription Activator-Like Effector)、锌指(Zinc finger)等。
作为功能结构域,可例举编码酶、转录调节因子,报告蛋白等的结构域。作为酶,可例举重组酶、核酸酶、连接酶、激酶、磷酸酶等DNA修饰酶;以内酰胺酶等其他酶。在本说明书中,将编码核酸酶的结构域称为DNA切断结构域。作为转录调节因子,包括活化剂、抑制子等。作为报告蛋白,例举绿色荧光蛋白(GFP)、人源化海肾绿色荧光蛋白(humanizedRenilla reniformis green fluorescent protein)(hrGFP)、增强绿色荧光蛋白(eGFP)、增强蓝色荧光蛋白 (eBFP)、增强青色荧光蛋白(eCFP)、增强黄色荧光蛋白(eYFP)、红色荧光蛋白(RFP或DsRed)、mCherry等荧光蛋白;萤火虫荧光素酶、海肾荧光素酶等生物发光蛋白;碱性磷酸酶、过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶等转换化学发光底物的酶。优选地,DNA切断结构域接近其他DNA切割结构域形成多聚体,获得提高的核酸酶活性。作为这种DNA切断结构域,例举衍生自FokI的DNA切断结构域。
DNA结合结构域及功能结构域通过由35~55个、优选由40~50个、更优选由45~49个、最优选由47个氨基酸组成的多肽连接。
DNA结合结构域从N末端侧起连续地包含多个DNA结合模块。一个DNA 结合模块特异性识别1个碱基对。从同时实现功能结构域的高功能性和高DNA 序列识别特异性的观点来看,DNA结合结构域中包含的DNA结合模块的数量优选为8~40个,更优选为12~25个,进一步优选为15~20个。作为DNA 结合模块,例如可例举TAL效应重复序列(effectorrepeat)等。作为一个DNA 结合模块的长度,例如可例举20~45、30~38、32~36或34等。DNA结合结构域中包含的DNA结合模块的长度,优选关于全部DNA结合模块而言相同。作为DNA结合模块,例如可例举LTPDQVVAIASHDGGKQALETVQRLLPVLCQDHG(序列号1) 的序列。例如,认为当在本序列的第12个氨基酸和第13个氨基酸依次为H、 D时,该DNA结合结构域识别C为碱基,而当它们依次为N、G时,该DNA 结合结构域识别T为碱基,当依次为N、I时,该DNA结合结构域识别A为碱基,当依次为N、N时,该DNA结合结构域识别G为碱基。另外,作为DNA 结合模块,例如可例举与序列号1的氨基酸序列具有85%、90%、95%或97%的同源性且实质上保持识别一个碱基对的功能的多肽。
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合可对于任意的n相同。另外,从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合可对于任意的n相同。另外,从N末端起第 4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合可对于任意的n 相同。另外,从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合可对于任意的n相同。在此,n可以为1~10的自然数,优选为1~ 7的自然数,更优选为1~5的自然数。n优选为足以指示DNA结合结构域中包含的所有DNA结合模块的自然数。另外,x为1~40的自然数,优选为1~ 10的自然数,更优选为2~6的自然数,进一步优选为3~5的自然数,最优选为自然数4。另外,y为1~40的自然数,优选为25~40的自然数,更优选为 30~36的自然数,进一步优选为31~33的自然数,最优选为自然数32。x和y为不同的自然数。x及y的数值可根据使用的DNA结合模块的长度而不同。x 优选为表示与由34个氨基酸组成的DNA结合模块中的第2个氨基酸的位置相当的数值。y优选为表示与由34个氨基酸组成的DNA结合模块中的第32个氨基酸的位置相当的数值。
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,可互不相同。其中,n为1~10的自然数,优选为1~7的自然数,更优选为1~5的自然数。n优选为足以指示DNA结合结构域中包含的所有DNA 结合模块的自然数。另外,x为1~40的自然数,优选为1~10的自然数,更优选为2~6的自然数,进一步优选为3~5的自然数,最优选为自然数4。另外,y为1~40的自然数,优选为25~40的自然数,更优选为30~36的自然数,进一步优选为31~33的自然数,最优选为自然数32。x和y为不同的自然数。优选地,从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y 个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y 个氨基酸的组合,可分别选自由以x和y的顺序为D和D的组合、E和A的组合、D和A的组合及A和D的组合组成的组中。
作为可使用的载体,可例举质粒载体、粘粒载体、病毒载体、人工染色体载体等。作为人工染色体载体,可例举酵母人工染色体载体(YAC)、细菌人工染色体载体(BAC)、P1人工染色体载体(PAC)、小鼠人工染色体载体(MAC)、人体人工染色体载体(HAC)。另外,作为载体的成分,可例举DNA、RNA等核酸、GNA、LNA、BNA、PNA、TNA等核酸类似物。载体还可通过糖类等除了核酸以外的成分来修饰。
上述多肽可通过将载体导入细胞等中使并表达来制备。另外,通过将载体导入细胞等中使其表达,从而可在细胞内实现DNA重组、DNA切割等DNA 修饰;转录调节等其他酶活性的表达;利用报告蛋白进行的DNA结构域的标记化等的根据功能结构域的所期望的功能。当功能结构域为DNA切割结构域时,可通过将多个、优选两个载体导入细胞等中使其表达,从而使在导入了载体的细胞的基因组DNA上产生碱基序列特异性的双链切割,可在细胞的基因组上导入变异。作为导入载体的细胞的来源,可例举果蝇、斑马鱼、小鼠等哺乳动物、拟南芥等植物、ES细胞、iPS细胞等培养细胞等。
2.1.2.修饰TALEN的制备方案
对于与某个识别序列相对应的铂TALEN,可通过与预先准备的或新制备的载体库中的载体组合、配制编码铂TALEN的核酸从而进行制备。例如,利用铂TALEN的制备试剂盒(Platinum Gate TALEN Kit, http://www.addgene.org/kits/yamamoto-platinumgate/),制备与所期望的识别序列相对应的铂TALEN。当新设立铂TALEN的载体集时,可根据图20所示的制备方案进行制备。
载体库中的各载体例如可包含4个DNA结合模块。对于1个载体中的4 个DNA结合模块,可具有如上所述的铂TALEN的周期性序列变化(例如,结合模块的第4个及第32个氨基酸的变化)的一周期量的变化。各DNA结合模块根据所具有的RVD来规定对应的识别碱基。根据4个DNA结合模块识别的碱基序列可存在按照44=256的序列,识别4碱基序列的载体也可全面性地存在于载体库中,但只要仅存在制备所期望的结合结构域所需要的则足够。
具体地,从载体库选择与DNA结合结构域(与所期望的识别序列结合) 中包含的DNA结合模块的序列对应的载体,通过切断A型限制酶切断位点~E 型限制酶切断位点的限制酶,消化所选的载体,进而连接通过消化所获得的载体片段,从而制备编码DNA结构域的载体。构成载体库的全部载体具有两个被相同限制酶切断的限制酶切断位点,且其限制酶切断位点通过由所述酶进行的切断而产生互不相同的切断末端。因此,当制备编码铂TALEN的载体时,所选的载体的消化及载体片段的连接可分别在相同反应液中进行。因此,利用载体库可非常简单地制备编码铂TALEN的载体。
此外,对于针对限制酶切断位点的A型~E型,是为了示出限制酶切断位点的性质的差异而在本说明书中简易设置的标记。当类型不同时,限制酶切断位点的性质互不相同,而当类型相同时,限制酶切断位点的性质是共同的。在载体库中,A型限制酶切断位点~E型限制酶切断位点被相同限制酶切断。另外,A型限制酶切断位点~E型限制酶切断位点通过由相同限制酶进行的切断从而均产生互不相同的切断末端。作为这种限制酶切断位点,可例举通过限制酶(例如,BsaI、BbsI、BsmBI等)形成的切断位点,该限制酶切断与限制酶的识别位点相邻的任意位点。
对于从5’末端起第1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于构成载体库的任意的载体而言相同。同样,从5’末端起第2个 DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于构成载体库的任意的载体而言相同。另外,从5’末端起第3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于构成载体库的任意的载体而言相同。另外,从5’末端起第4个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合对于构成载体库的任意的载体而言相同。
(2.2.内源性TCR基因的去除)
(2.2.1内源性TCR的去除机构)
本发明的修饰TALEN可用于去除内源性TCR。以下,对内源性TCR的去除进行说明。
在TCR的导入中,有时优选去除内源性TCR。在Proc Natl Acad Sci U S A.2010Jun 15;107(24):10972-7(PMID:20534461)中已报道:当存在内源性 TCR时,通过导入TCR,形成混合二聚体,能出现新型抗原反应性。
当形成TCR混合二聚体(一对内源性TCR链和外源性TCR链)时,导入的TCR链及内源性TCR链的表达降低,特异性的反应性受损,不仅如此,该混合二聚体有可能潜在地具有有害特异性。在上述文献中还报道:通过导入 TCR,出现新反应性,大部分的新反应性为异体HLA反应性,但也发现具有自身反应活性。另外,Mol Biol Rep.2010Dec;37(8):3951-6(PMID:20373027) 中,作为定量检测因错配产生的TCR的技术,记载有FRET法。
内源性TCR的去除可通过内源性TCR基因的修饰来进行。内源性TCR的去除可通过例如内源性TCR基因的敲低来进行,可利用反义法或RNAi等。内源性TCR的去除还可通过内源性TCR基因的敲除来进行。内源性TCR基因的修饰可通过例如全部或部分编码区域的缺失、对调节区域的变异的导入、无义或错义变异的导入等进行。
优选地,可使用基因组编辑技术进行内源性TCR基因的修饰。基因组编辑为利用位点特异性核酸酶来修饰靶基因的技术。作为基因组编辑技术,可例举 ZFN、TALEN、CRISPR/Cas9等。分别具有实现对所期望序列的DNA序列特异性结合的结合结构域以及在所期望序列的位点切断DNA的切断结构域。
ZFN为包含锌指结构域和DNA切断结构域的人工限制酶。锌指结构域可进行修饰以识别任意的DNA碱基序列,由此锌指核酸酶可以将复杂的基因组中的单个序列作为靶。
相对于ZFN、TALEN基本用作一个蛋白,CRISPR(Clustered RegularlyInterspaced Short Palindromic Repeats)/Cas9(Crispr ASsociated protein 9)系统包含指导RNA和Cas9两个不同的分子。通过在指导RNA中包含与DNA的靶位点互补的序列,指导RNA可特异性结合于靶位点。这样,Cas9蛋白以覆盖指导RNA和DNA的方式结合,并切断DNA。由于Cas9自身可重复使用,通过靶位点仅制备指导RNA即可,因此容易实现多重化。
TALEN(转录活性化因子样效应核酸酶)为人工酶,其将限制酶FokI作为 DNA切断结构域,并与从植物病原细菌黄单胞菌属(Xanthomonas)分泌的TALE 蛋白的DNA结合结构域融合。TALE蛋白的DNA结合结构域形成大约34个氨基酸的重复结构。将该重复单元称为模块。其中,氨基酸第12位和第13位可变,在与靶序列结合的部分称为“重复可变二残基”(RVD)。TALEN使用分别与靶DNA的相反链结合的分子来作为一对L TALEN和R TALEN。为了使FokI 显示出切断活性,TALEN需要保持适当的距离以形成二聚体。对于TALEN中的错配耐受性或脱靶活性,几乎未曾报道,具有高特异性。在修饰T细胞时,若在脱靶中发生修饰,则可引起意想不到的不利影响,因此,本发明中优选使用具有高特异性的TALEN。
除了常规型的TALEN之外,制备了各种修饰TALEN。从高特异性及高修饰效率来看,优选通过这种TALEN进行内源性TCR基因的修饰。本说明书的实施例中证实了使用修饰TALENT实现了T细胞的内源性TCR的完全去除。
修饰TALEN的一些示例示于图17中。例如,超级TALEN(SuperTALEN) 为模块的第4个和第32个氨基酸被修饰,仅装配特定修饰型重复序列而使用 (PCT/JP2014/071116,其全部内容作为参考引用于本说明书中)。据报道,将通过该超级TALEN修饰的两个氨基酸修饰成E和A,为Zhang TALEN(EA 型SuperTALEN),除了图17中示出的EA型以外,还可由QA型而使活性提高。
(2.2.2修饰TALEN靶)
本发明的基因组编辑酶(也称为修饰TALEN)可将TCR基因设计为靶。因此,DNA结合结构域可特异性结合于TCRα基因或TCRβ基因。对于TCR 基因上DNA结合结构域结合的部分,例如可例举TRAC外显子1、TRBC1外显子1或TRBC2外显子1等,但不限定于此。如上所述,DNA结合结构域通过选择存在于各模块中的RVD,可设计为对所期望序列具有特异性,对于本说明书所公开的任意靶序列,本领域技术人员可设计特异性DNA结合结构域。
DNA结合结构域,例如可设计成将以下序列作为靶。
[化1]
α2L:TGTCTGCCTATTCACCGATT(序列号80)
α2R:TCCTTACTFTGTGACACATT(序列号81)
β1L:TGTTCCCACCCGAGGTCGCT(序列号82)
β1R:TGTGGGAGATCTCTGCTTCT(序列号83)
β3L:TGTGCCTGGCCACAGGCTTC(序列号84)
β3R:TCACCCACCAGCTCAGCTCC(序列号85)
在本说明书的实施例2中证实通过具有将上述位置作为靶的DNA结合结构域的基因组编辑酶能够去除内源性TCR基因。此外,各靶序列的左端的T 碱基为由TALE的N末结构域(DNA结合重复序列的外侧区域)识别的T。认为该T的碱基不是作为“DNA结合重复序列的识别序列”而包含,但认为作为“TALEN的靶序列”来包含。
例如,对于将上述序列作为靶的铂TALEN的DNA结合结构域,可以举出具有如下图案序列的结构域。在本说明书的实施例2中证实:使用具有这种DNA 结合结构域的TALEN能够成功地去除T细胞的内源性TCR基因。此外,DNA 结合模块的最终重复序列成为被称为半重复(half repeat)的截短型重复序列。
[化2]
>TALEN_α2L结合结构域(模块重复)(序列号86)
Figure BDA0002529233550000281
[化3]
>TALEN_α2R结合结构域(模块重复)(序列号87)
Figure BDA0002529233550000291
[化4]
>TALEN_β1L结合结构域(模块重复)(序列号88)
Figure BDA0002529233550000301
[化5]
>TALEN_β1R结合结构域(模块重复)(序列号89)
Figure BDA0002529233550000311
[化6]
>TALEN_β3L结合结构域(模块重复)(序列号90)
Figure BDA0002529233550000321
[化7]
>TALEN_β3R结合体结构域(模块重复)(序列号91)
Figure BDA0002529233550000331
在本发明中,用于将TCRα基因靶化的TALEN质粒作为一例,可例举 TALEN-TCR-alpha2_L19(序列号46)及TALEN-TCR-alpha2_R19(序列号47)。这些序列可使用一对。
在本发明中,作为用于将TCRβ基因靶化的TALEN质粒的例,可例举一对TALEN-TCR-beta1_L19(序列号48)及TALEN-TCR-beta1_R19(序列号49) 或一对TALEN-TCR-beta3_L19(序列号50)及TALEN-TCR-beta3_R19(序列号51)。
在本发明中,应注意,对于具体示出的序列,只要保持所期望的活性,就可使用添加修饰的序列。例如,在本发明中,可使用相对于具体示出的序列,具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%或至少约99%的同源性的序列。
修饰氨基酸序列可以为具有一个或多个(优选为一个或数个或1、2、3或4个)保存取代的氨基酸序列。在此,“保存取代”是指以实质上不改变蛋白功能的方式、将一个或多个氨基酸残基用别的化学上相似的氨基酸残基来代替。例如,可例举某疏水性残基被其它疏水性残基取代的情况、某极性残基被具有相同电荷的其它极性残基取代的情况等。可进行这种取代的功能相似的氨基酸在本领域中对于每种氨基酸是已知的。例举具体例时,作为非极性(疏水性) 氨基酸,可例举丙氨酸、缬氨酸、异亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸、蛋氨酸等。作为极性(中性)氨基酸,可例举甘氨酸、丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺、半胱氨酸等。作为具有正电荷(碱基性)的氨基酸,可例举精氨酸、组氨酸、赖氨酸等。另外,作为具有负电荷(酸性)的氨基酸,可例举天冬酰胺酸、谷氨酰胺酸等。
相同氨基酸可由多个基因密码子编码,因此存在编码相同氨基酸序列的多个核酸序列,只要以对氨基酸序列进行编码为目的,可使用不同的核酸序列。
(2.3抗原特异性调节性T细胞)
一个方面,本发明的修饰TALEN可用于生产对抗原具有特异性的调节性T 细胞的方法,该方法包括去除内源性TCR基因的步骤。例如,本发明提供一种生产对抗原具有特异性的调节性T细胞的方法,该方法包括:
在效应T细胞供体中的对该抗原具有特异性的效应T细胞群中测定TCR 库的步骤,包括无偏差地扩增TCR基因;
鉴定该效应T细胞群中的TCRα和TCRβ对的步骤;
确认该已鉴定的TCRα和TCRβ对是否具有对抗原的亲和性的步骤;
对该已鉴定的TCRα和TCRβ对中的TCRα的全部或部分核酸序列及TCRβ的全部或部分核酸序列进行克隆的步骤;
使用修饰TALEN去除调节性T细胞的内源性TCR基因的步骤;以及
向该调节性T细胞中导入该已克隆的TCRα的全部或部分核酸序列及 TCRβ的全部或部分核酸序列的步骤,该步骤以该TCRα及该TCRβ成对表达的方式导入。
一优选实施方式如图18中所示。鉴定高功能性TCR,并将该高功能性TCR 导入从供体获得的抗原非特异性多克隆调节性T细胞中。此时,可使用铂 TALEN来编辑内源性TCR基因。优选地,以使上述TCR成对表达的方式,导入上述TCR。将所获得的抗原特异性单克隆或寡克隆调节性T细胞在体外进行扩增,转移至受体。由本发明所获得的抗原特异性调节性T细胞不具有未知的抗原反应性,因此被认为是安全的,并且认为通过使用高功能性TCR,显示高抗原特异性免疫抑制能力。受体可以为与调节性T细胞的供体相同的个体,也可以为不同的个体。
在本发明中,还可提供用于在本发明的方法中使用的任意物质。例如,在本发明中可提供一种用于在本发明的方法中使用的的组合物,该组合物包含载体,所述载体以上述TCRα及上述TCRβ成对表达的方式构成。还可提供一种用于在本发明的方法中使用的、包含MHC四聚体的组合物。
进而,还提供一种用于在本发明的方法中使用的组合物,所述组合物含有包含DNA结合结构域及功能结构域的多肽或编码该多肽的核酸,该DNA结合结构域与TCR基因特异性结合。
通过本发明的方法鉴定的效应T细胞群的TCR库或其一部分、或者对其编码的核酸也属于本发明的范围内。还可提供一种用于制备TCR修饰T细胞的组合物,该组合物包含效应T细胞群的TCR库或其一部分、或者对其编码的核酸。优选地,TCR修饰T细胞包含TCR修饰调节性T细胞。
(2.4T细胞内源性TCR基因修饰)
在本发明的一个方面,本发明的修饰TALEN可用于对T细胞的内源性TCR 基因进行修饰的方法。优选地,该方法可包括以内源性TCR不表达的方式修饰T细胞的步骤。
该步骤可通过向细胞中导入本发明的组合物来进行。本发明的修饰TALEN 可将TCRα基因和/或TCRβ基因作为靶化,因此可同时或依次地将对TCRα基因及TCRβ基因分别具有特异性的修饰TALEN导入细胞中。当依次导入时,不限制其顺序。因此,修饰T细胞的步骤可包括:将包含具有DNA结合结构域(与TCRα基因特异性结合)的多肽或编码该多肽的核酸的组合物导入细胞的步骤;以及将包含具有DNA结合结构域(与TCRβ基因特异性结合)的多肽或编码该多肽的核酸的组合物导入细胞的步骤。
在本发明的另一个方面,可包括将外源性的TCR导入T细胞(例如,通过导入核酸)的步骤。作为成为本发明对象的T细胞,并无特别限定,可例举调节性T细胞、效应T细胞、辅助T细胞、自然杀伤T细胞(NKT细胞)、γδT 细胞等。调节性T细胞的TCR的修饰/导入由于与包含抗原特异性免疫耐受性的免疫调节相关,故而优选。NKT细胞或γδT细胞本身具有抗原非特异性杀伤活性,因此通过本发明的方法导入抗原特异性TCRαβ是有意义的。例如,对于γδT细胞,如J Immunol.2009Jan 1;182(1):164-70.(PMID:19109147)中记载所示,已经表明通过对γδT细胞转导TCRαβ可以生成抗原特异性效应T 细胞,将由本发明所鉴定的这样的高功能性TCR导入γδT细胞中是有效的。
T细胞或T细胞群可通过常规方法从由受试者处得到的样品等中分离。例如,可从受试者的外周血、骨髓、肿瘤组织、造血组织、脾脏、正常组织、淋巴液等进行。来自外周血的取样为非侵入性且方便,因此是有利的。对于T细胞群的分取,除了使用流式细胞术的分选之外,还可利用使用磁性的细胞分离。
在本发明中,可利用要修饰内源性TCR基因的第一T细胞及具有要导入的 TCR的第二T细胞。在此,第一T细胞和第二T细胞可从相同受试体获得,也可从不同的受试体(第一供体及第二供体)获得。并且,可以使用修饰的第一 T细胞来治疗相同受试体,或者治疗供体均不同的受试体(受体)。在一个优选实施方式中,第一T细胞为调节性T细胞,第二T细胞为效应T细胞。
在本发明的一些实施方式中,提供一种被修饰的T细胞或包含其的组合物。在一实施方式中,提供不包含内源性TCR基因的调节性T细胞。该T细胞不会引起TCR基因的错配,可安全地赋予所期望的抗原特异性。
在另一实施方式中,提供一种调节性T细胞,其包含存在于效应T细胞供体的效应T细胞群中的T细胞受体(TCR)克隆所含的TCRα基因的全部或部分核酸序列、以及TCRβ基因的全部或部分核酸序列。可以说存在于供体的T 细胞群中的T细胞受体(TCR)克隆为高功能性的,认为具有这种TCR的调节性T细胞表现出抗原特异性免疫抑制。还提供一种调节性T细胞,其不包含内源性TCR基因,而是包含存在于效应T细胞供体的效应T细胞群中的T细胞受体(TCR)克隆所含的TCRα基因的全部或部分核酸序列、以及TCRβ基因的全部或部分核酸序列。
(2.5T细胞亚群的组成分析)
当使用本发明的修饰TALEN时可进行T细胞亚群的组成的分析。
本领域技术人员可通过常规方法来测定样品或T细胞群中的所期望的T细胞亚群的组成。通常,关于规定样品或T细胞群中的作为目标的细胞亚群的标志物、或与所期望的特征相关的标志物(例如,CD3),可以使用流式细胞术等对阳性的细胞数进行测定。另外,采用流式细胞术技术可同时分选所期望的细胞亚群。作为流式细胞术的优点,例如可例举:容易掌握已导入所期望的基因的细胞所占比率;特异性及灵敏度高;再现性高;可解析多个细胞;所需时间短等。
流式细胞仪为由均匀的细胞悬浮液测定悬浮物(细胞)的光学特性的设备。细胞借助液流穿过激光的焦点,但其穿过时从每秒500~4000个细胞对于每个细胞同时测定测定前方散射光、侧方散射光及一个以上不同波长的荧光的光学特性,可快速且准确地测定这些细胞的大小、内部结构及存在于细胞膜·细胞质·核内中的各种抗原或者核酸量等生物学特性。
散射光是指激光碰到细胞并在周围散射的光。前方散射光(Forward Scatter:FSC)在相对于激光光轴的前方检测出,散射光强度与细胞的表面积成比例。即,认为相对地若FSC的值大则细胞也大、若FSC的值小则细胞也小。侧方散射光(Side Scatter:SSC)在相对于激光轴90度(直角)的位置检侧出,散射光强度与细胞的颗粒或细胞内结构的状态成比例。即,认为相对地若SSC的值大则细胞的内部结构复杂、若SSC的值小则细胞的内部结构简单。
对于流式细胞术的结果,可代表性地以点图的形式表示,其中X轴为FSC, Y轴为SSC。各细胞以图中一个点(dot)表示,它们的位置由FSC与SSC的相对值确定。尺寸较小且内部结构简单的淋巴细胞在左下方,尺寸较大且内部具有颗粒的颗粒球在右上方,另外,对于尺寸较大但内部结构简单的单核细胞,通过在淋巴细胞与颗粒球之间做成彼此相互分离的群来表示。
荧光是指标记在细胞上的荧光色素被照射的激光激发、在释放出能量时所产生的光。代表性地,流式细胞仪(例如,产品名称:Becton&Dickinson FACSCalibur)照射488nm的单波长激光和635nm的单波长激光。虽然细胞自身也具有发出微弱荧光的性质(自发荧光),但当想利用荧光实际特异性检测细胞所具有的分子时,需要预先以某种形式将荧光色素结合到细胞或者其具有的分子上。例如,异硫氰酸荧光素(FITC,Fluoresceinisothiocyanate)吸收488nm 的激发光,并主要发出530nm的荧光(绿色)。如果预先对抗体标记FITC,则根据存在于细胞表面的抗原量而结合的抗体量产生差异,其结果,FITC的荧光强度会有所不同,因此可以推断存在于其细胞表面的抗原量。例如可使用 FACSCalibur,该FACSCalibur配备有可检测不同的荧光波长区域的4个荧光检测器,当准备发出不同波长的光的多个荧光色素时,可最多同时检测4个不同的抗原。作为除了由488nm的单波长激光激发的FITC以外的荧光色素,藻红蛋白(PE,phycoerythrin)主要发出585nm的荧光,PerCP(peridinin chlorophyll protein)及PE-Cy5(carbocyanin-5)主要发出670nm的荧光。作为由635nm的单波长激光激发的荧光色素的别藻蓝蛋白(APC,allophycocyanin)主要发出670nm的荧光。这些荧光色素与各种抗体组合,用于细胞的双重染色或三重染色。对于在T淋巴细胞的表面所表达的CD3、CD4、CD8、CD25、TCR、在细胞内所表达的Foxp3分子等,可利用与它们特异性反应的单克隆抗体检测。
严格而言,流式细胞仪具有只解析细胞的设备和可用于分取(分选)所解析的细胞的设备两种,后者被称为“FACS”。在本说明书中,“FACS”为荧光激活细胞分选仪(fluorescence-activated cell sorter)的缩写,其是指可用于如下方法中所使用的装置,该方法是使用激光束来解析淋巴细胞等的游离细胞的表面抗原,或者根据表面抗原的存在与否等来分选特定的细胞。
流式细胞术的结果可用直方图、点图等来表示。在本说明书中,“直方图”是指在利用流式细胞仪的荧光测定中X轴为各参数的光信号强度、Y轴为细胞数而作的图形。通过这种方式,总共可以计数1万个以上的细胞。
在本说明书中,“点图”是指在X轴和Y轴上绘制两种荧光色素的荧光强度的图。当进行双重染色及三重染色时,在X轴或Y轴上置于各个荧光强度,使用各个细胞与二维图形上的一个一个点对应的表示方法来进行解析。
例如,采集外周血或骨髓液之后,通过溶血法或比重离心法去除红细胞,然后与荧光标记抗体(针对靶抗原的抗体及其对照组抗体)反应,充分清洗之后可用流式细胞术观察。所检测的散射光或荧光被转换为电信号,并由计算机解析。其结果,FSC的强度表示细胞的大小,SSC的强度表示细胞内结构,由此可区分淋巴细胞、单核细胞、颗粒球。然后,根据需要,对目标细胞群进行门控以检查这些细胞中的抗原表达模式。
在本发明的方法的实施中,本领域技术人员可适当辨识所示的细胞的表面标志物并对细胞进行分级或计数。国际研讨会达成协议,CD抗原主要基于其所识别的抗原的生化学的特征(尤其是分子量)来簇分(cluster)并分类 (clustering)。这称为CD分类(CDclassification),对于由此识别特定白血球分化抗原的多个种类的单克隆抗体,在CD之后附上编号、即以CD编号(CD number)的形式(例如CD1、CD2等)赋予统一名称。
CD3分子存在于细胞膜,与TCR形成复合物,因此可用于TCR的表达标志物。
已明确对作为白介素-2受体α链的CD25分子进行高度表达的CD4+T细胞具有抑制自身免疫疾病的功能,CD4及CD25用作调节性T细胞的标志物。近年来,已明确作为转录因子的Foxp3为Treg分化的主基因,正被广泛地用作鉴定CD4+CD25+Treg的分子标志物。另外已经明确:CD127可被用作除了 Foxp3以外的Treg的细胞表面标记,在CD4+CD25强阳性CD127阴性或弱阳性的T细胞级分中大量存在Treg。
(2.6.TCR库的解析)
本发明的修饰TALEN可在基于由TCR库解析获得的信息来修饰TCR时使用。
在本发明的一个实施方式中,提供一种包括测定T细胞群的TCR库的方法。已经发现,当鉴定存在于供体的对抗原具有特异性的效应T细胞群中的TCR克隆时,通过测定存在于效应T细胞群中的各TCR克隆(α链或β链)的存在频率,可鉴定高功能性的TCR克隆。本发明的修饰TALEN在将TCR克隆导入T 细胞时可防止因内源性TCR基因导致的干扰的这一点上是有用的。因此,在包括鉴定高功能性TCR克隆并导入该TCR克隆(其全部或部分核酸序列)的步骤的方法中,可使用本发明的修饰TALEN,另外提供一种用于在该方法中使用的组合物。
作为测定TCR库的方法之一具有如下方法(FACS解析),即,针对试样中的T细胞使用多少个V链,使用特定Vβ链特异性抗体通过流式细胞术解析表达各个Vβ链的T细胞的比率。
此外,设计出基于自人基因组序列获得的TCR基因的信息,利用分子生物学方法来进行TCR库解析。具有从细胞试样提取RNA、合成互补的DNA之后对TCR基因进行PCR扩增并进行定量的方法。
源自细胞试样的核酸提取可利用如RNeasy Plus Universal Mini Kit (QIAGEN)等的本技术领域公知的方法进行。可利用RNeasy Plus Universal Mini Kit(QIAGEN)从溶解于TRIzol LS试剂的细胞中进行总RNA的提取及纯化。
从所提取的RNA合成互补的DNA,可使用如Superscript IIITM(Invitrogen) 等的本技术领域公知的任意的逆转录酶来进行。
本领域技术人员可利用本技术领域公知的任意聚合酶来适当进行TCR基因的PCR扩增。然而,在如TCR基因这样的大波动的基因的扩增中,可以说,如果能够“无偏差”地扩增则对于准确测定具有有利的效果。
作为用于PCR扩增的引物,设计多个单个TCR V链特异性引物,并使用了通过实时PCR法等个别定量的方法或者同时扩增这些特异性引物的方法(多重PCR(Multiple PCR))。然而,即使对各V链使用内源性对照组进行定量的情况下,若利用的引物多,则不能进行准确的解析。并且,多重PCR法具有引物之间的扩增效率之差引起PCR扩增时的偏差的缺点。为了克服该多重PCR 法的缺点,鹤田等人报告了衔接子-连接PCR(Adaptor-ligation PCR)法,即,在TCR基因的双链互补DNA的5’末端附加衔接子之后,通过共同的衔接子引物和C区域特异性引物来扩增全部γδTCR基因(Journal of Immunological Methods,1994,169,17-23)。并且,开发出了还应用于αβTCR基因的扩增、且通过对各个V链具有特异性的Oligo探针来定量的反向斑点杂交法(Reverse dot blot)(Journal of ImmunologicalMethods,1997,201,145-15.)或微孔板杂交测定法(Microplate hybridization assay)(Human Immunology,1997,56,57-69)。
在本发明的优选实施方式中,如WO2015/075939(Repertoire Genesis Inc.,其全部内容作为参考引用于本说明书中)所记载,使用包含一种正向引物和一种反向引物的一组引物对包含全部同型基因或亚型基因的TCR基因以不改变存在频率的方式进行扩增,从而确定TCR多样性。如下的引物设计对无偏差的扩增而言是有利的。
着眼于TCR或者BCR基因的基因结构,通过在其5’末端附加衔接子序列以扩增包含所有V区域的基因,而无需在具有高度多样性的V区域中设置引物。该衔接子在碱基序列上为任意长度和序列,20个碱基对左右为最佳,但可使用从10个碱基至100个碱基的序列。在3’末端所附加的衔接子被限制酶去除,通过与20个碱基对的衔接子相同序列的衔接子引物、及对为共同序列的C区域具有特异性的反向引物进行扩增,由此扩增全部的TCR基因。
通过逆转录酶由TCR或者BCR基因信使RNA合成互补链DNA,接着合成双链互补的DNA。通过逆转录反应或双链合成反应合成含有不同长度的V 区域的双链互补的DNA,通过DNA连接酶反应,将由20个碱基对和10个碱基对组成的衔接子附加在这些基因的5’末端部。
在TCR的α链、β链、γ链、δ链的C区域中设置反向引物,可扩增它们的基因。设置于C区域的反向引物与TCR的各Cβ、Cα、Cγ、Cδ的序列一致,且在其他C区域序列中设置具有不引发的程度的错配的引物。以与衔接子引物的扩增能够进行的方式,并考虑碱基序列、碱基组成、DNA熔解温度(Tm)、自身互补序列的存在与否,可适当制备C区域的反向引物。在C区域序列中的、等位基因序列间不同的碱基序列以外的区域中设置引物,由此可以均匀地扩增全部等位基因。为了提高扩增反应的特异性,进行多个步骤的嵌套PCR(nested PCR)。
相对于所有引物均不含在等位基因序列之间不同序列的序列,候选引物序列的长度(碱基数)无特别限定,为10~100个碱基,优选为15~50个碱基,更优选为20~30个碱基。
利用这种无偏差的扩增,对于鉴定低频率(1/10000~1/100000或其以下) 的基因是有利的,因此为优选。通过对如上所述扩增的TCR基因进行测序,可由所获得的读段数据确定TCR库。
从人体试样对TCR基因进行PCR扩增,并通过使用下一代序列解析技术,可实现大规模高效率TCR库解析,即,从以往获得小规模且V链使用频率等有限信息的TCR库解析,获得并解析克隆级的更详细的基因信息。
测序的方法只要可确定核酸试样的序列,则无限定,可利用本技术领域公知的任意的方法,但优选使用下一代测序(NGS)。作为下一代测序,可例举焦磷酸测序、利用合成的测序(测序双合成)、连接测序、离子半导体测序等,但不限定于此。
通过将所得的读段数据映射到包含V、D、J基因的参照序列,导出独特读段数,可确定TCR多样性。
在一个实施方式中,按照每个V、D、J基因区域,准备所使用的参照数据库。典型地,使用由IMGT公开的每个区域、每个等位序列的核酸序列数据集,但不限于此,只要是各序列被分配到唯一的ID的数据集,则可利用。
将所得的读段数据(包括根据需要进行了修整等适当处理的数据)作为输入序列集,与每个基因区域的参照数据库进行同源性检索,并记录最接近参照等位序列及与其序列的对准。在此,对于同源性检索,使用除C以外具有高失配容忍度的算法。例如,使用一般的BLAST来作为同源性检索程序时,对每个区域进行窗口尺寸的缩短、错配罚分的减少、间隙罚分的减少的设定。在选择最接近的参照等位基因时,将同源性分数、对准长度、核心长度(连续一致的碱基序列的长度)和一致碱基数作为指标,并根据确定这些的优先顺序来应用。关于本发明中使用的V及J所确定的输入序列,将参照V上的CDR3先头及参照J上的CDR3末尾为标记,提取CDR3序列。通过将其翻译成氨基酸序列,用于D区域的分类。当准备D区域的参照数据库时,可将同源性检索结果和氨基酸序列翻译结果的组合用作分类结果。
通过上述操作,将V、D、J的各等位基因分配给输入集中的各序列。接着,通过计算在整体输入集中V、D、J的各出现频率、或其组合的出现频率,导出 TCR库。根据分类所被要求的准确性,用等位基因单元或基因名称单元计算出现频率。后者可将各等位基因翻译成基因名称。
V区域、J区域、C区域被分配于读段数据之后,统计一致的读段,可以针对独特读段(不具有其他相同序列的读段),计算出试样中所检测的读段数及在全部读段中所占的比率(频率)。可通过使用样品数量、读段种类、读段数等的数据,用ESTIMATES或者R(vegan)等的统计解析软件来计算多样性指数或者类似性指数。在优选实施方式中,使用TCR库解析软件(Repertoire Genesis Inc.)。
在本发明的优选实施方式中,使用大规模高效率TCR库解析来测定TCR 多样性。在本说明书中,“大规模高效率库解析”记载于WO2015/075939(该文献的公开内容根据需要其全部作为参考引用在本说明书中。)中,对象为TCR 时称为“大规模高效率TCR库解析”。该方法可包括:步骤(1),提供核酸试样,该核酸试样包含无偏差地扩增的T细胞受体(TCR)的核酸序列;步骤(2),确定该核酸试样中包含的该核酸序列的步骤;以及步骤(3),基于所确定的该核酸序列计算出各基因的出现频率或其组合,并导出该效应T细胞群的TCR库。
在另一个实施方式中,步骤(1)(即,提供核酸试样,该核酸试样包含无偏差地扩增的TCR的核酸序列)可包括以下步骤。
步骤(1-1):以来源于靶细胞的RNA试样作为模板合成互补的DNA。
步骤(1-2):以该互补的DNA作为模板合成双链互补的DNA。
步骤(1-3):将共通衔接子引物序列附加于该双链互补的DNA以合成衔接子附加双链互补DNA。
步骤(1-4):使用该衔接子附加双链互补DNA、由该共通衔接子引物序列组成的共通衔接子引物、和第一TCR的C区域特异性引物以进行第一PCR扩增反应,该第一TCR的C区域特异性引物以如下方式设计:对该TCR的目标 C区域具有充分的特异性,且包含对其他基因序列不具有同源性的序列,且在扩增的情况下在下游亚型之间包含不一致碱基。
步骤(1-5):使用步骤(1-4)的PCR扩增产物、该共通衔接子引物、和第二TCR的C区域特异性引物,进行第二PCR扩增反应,所述第二TCR的C 区域特异性引物以如下方式设计:在该第一TCR的C区域特异性引物的序列的下游序列中具有与该TCR的C区域完全匹配的序列,但包含与其他基因序列无同源性的序列,且在扩增的情况下在下游亚型之间包含不一致碱基。
步骤(1-6):使用步骤(1-5)的PCR扩增产物、附加共通衔接子引物(即,在该共通衔接子引物的核酸序列中包含第一追加衔接子核酸序列)、和附衔接子的第三TCR的C区域特异性引物(将第二追加衔接子核酸序列附加在第三TCR 的C区域特异性序列),进行第三PCR扩增反应,所述第三TCR的C区域特异性引物以如下方式设计:在该第二TCR的C区域特异性引物的序列的下游序列中具有与该TCR的C区域完全匹配的序列,但包含与其他基因序列无同源性的序列,且在扩增的情况下在下游亚型之间包含不一致碱基。
该方法的具体描述记载于WO2015/075939,本领域技术人员可适当参照该文献及本说明书的实施例等而进行解析。
(2.7.TCR对的鉴定)
本发明的修饰TALEN进行TCR对鉴定,还可在导入所期望的TCR时使用。
在本发明一个实施方式中,作为T细胞群中存在的TCR克隆,鉴定TCRα链与TCRβ链的对。认为TCR以α链与β链的对的形式发挥抗原特异性,通过使用所鉴定的对,可更可靠地通过导入TCR对而赋予T细胞抗原特异性。因此,在鉴定TCR克隆的步骤中,可以包含:对来源于相同细胞的TCRα基因及TCRβ基因进行扩增、鉴定T细胞群中的TCRα和TCRβ对。在另一个实施方式中,方法还可包括用于确认所鉴定的TCRα和TCRβ对是否对抗原具有亲和性的步骤。此外,在另一个实施方式中,还可包括如下步骤,即,克隆所鉴定的TCRα和TCRβ对中的TCRα全部或部分核酸序列及TCRβ全部或部分核酸序列。
本发明的修饰TALEN可防止由内源性TCR产生的错配,因此当将所鉴定的对导入T细胞中时,可适当地发挥对具有的抗原特异性,为优选。
例如,作为这种成对鉴定技术,可利用记载于Nature Medicine 19,1542~ 1546(2013)中的内容。由单个细胞扩增人TCR cDNA,并在表达载体中克隆,向TCR阴性T细胞(例如,TG40细胞株)转导。通过MHC四聚体来染色该T细胞、或通过检测CD69表达,可以评价TCR的抗原特异性。这种整体流程可在10日之内进行。
另外,例如,还如J Clin Invest.2011Jan;121(1):288-95.doi:10.1172/JCI44752. Epub 2010Dec 6.(PMID:21135507)或PloS one[23May 2012,7(5):e37338](PMID:22649519)中所记载,通过由多重PCR(multiplex PCR)同时扩增α链和β链的技术,在理论上可实现源自单个细胞的成对鉴定。
对于TCR的配对技术已经发展为商业化,并且还在Trends Biotechnol.2017 Mar;35(3):203-214.doi:10.1016/j.tibtech.2016.09.010.Epub 2016Oct 26. (PMID:28341036)等的概论中也有记载。在该文献的表2中记载有通常的单细胞测序技术,例如,记载有利用连续流微流体的技术(Fluidigm,Kolodziejczyk, A.A.et al.(2015)Thetechnology and biology of single-cell RNA sequencing.Mol.Cell 58,610-620)、基于培养板的技术(Cellular Research/BD Biosciences,65.Fan,H.C.etal.(2015)Expression profiling.Combinatorial labeling of single cells for geneexpression cytometry.Science 347,1258367)、利用基于液滴(droplet)的微流体的技术(10X Genomics,76.Murphy,K.M.et al.(2016) Janeway’s Immunobiology.(9th),Garland Science)等。除此之外,如Sci Transl Med.2015Aug 19;7(301):301ra131.doi:10.1126/scitranslmed.aac5624.(PMID: 26290413)中所记载,还可利用不需要单个细胞的分离的、TCR的高通量配对技术。本领域技术人员还可利用这种方法鉴定TCR对。
作为代表性的鉴定TCR对的技术,可例举解析源自单个细胞的TCR的技术,例如存在:通过流式细胞仪进行分选后的解析、利用液滴作成装置的单细胞RNA-seq。例如,利用SMART法的单细胞解析试剂盒作为SMARTer(注册商标)Human scTCR a/b Profiling Kit出售。通过逆转录(RT)反应、模板转换 (TS)反应以及PCR反应,可扩增5’端侧的序列未知、无共通序列的RNA。还可使用这种方法的改进方法。
在通过利用流式细胞仪进行分选后的解析中,在能够获知或预测到目标抗原肽的情况下,在100~300个左右的单细胞解析中,利用FACS对使用四聚体保有与其抗原肽反应的TCR的T细胞进行分选,确定α链和β链,可鉴定与抗原肽反应的TCR对。即使存在抗原肽不清楚的情况,可基于根据仅α链、以及仅β链的解析数据确认的高保有率的α链及高保有率的β链的信息,考虑其组合的情况下,可用该方法确定主要配对。
利用液滴作成装置的单细胞RNA-seq可进行~10000个单细胞解析,无需进行在上述抗原肽不清楚时采用利用流式细胞仪的方法进行的、经两个步骤进行的解析,可将~10000个以上的单细胞一次性解析。
这种方法可根据目的区分使用。通过可解析多个细胞的液滴基底的方法进行配对鉴定,从而能够实现本步骤的目的,但在已知抗原肽、或为所设想的抗原肽时,也可以制备四聚体并解析100~300个左右的单细胞,从而实现本步骤的目的。认为若以发现高功能性TCR为目的,则至多数百个以内的单细胞解析在相对于成本方面较优异,若以全面解析以低频率存在的TCR(原始级分的TCR、shared TCR等)为目的,则利用液滴的解析虽耗费成本但较为有利。
近年来,开发出单细胞RNA-Seq法,并已用于各种研究(Hashimshony T et al:Cell Rep,2(3):666-673,2012,Hashimshony T et al:Genome Biol,17: 77,2016)。在单细胞解析中,可使用FACS分选、微孔或微流体回路等各种分离装置。利用液滴分离装置的方法可高效且简单地制备单细胞库。
通过使用液滴制备装置的单细胞RNA-Seq,可实现单细胞等级的TCR解析。液滴法中,将对Oligo探针进行固相化的载体和细胞高速封入约100μm的油中水滴型液滴中,由此可以在约30分钟内制备10000细胞的单细胞库。在 2016年的Cell杂志中Mocosko等人报告了利用Oligo珠粒的Drop-Seq法 (Macosko EZ et al:Cell,161(5):1202-1214,2015),Klein等人报告了利用水凝胶的InDrop法(Klein AM et al:Cell,161(5):1187-1201,2015)。上述方法都是将附加了细胞条形码(CBC)和分子辨识序列(UMI)的poly(T)探针结合至载体,利用微芯片将Oligo载体及细胞封入液滴中。然后,通过进行 cDNA合成、PCR、测序,实现scRNA-Seq。
进而,改良Drop-Seq法,开发出高效地确定TCR对基因的Gene Capture Drop-SeqTM法。Gene Capture Drop-SeqTM法为如下技术,即,将条形码标记的α及β链TCR低聚物与微珠结合,并在液滴内选择性地捕获TCR mRNA,由此高效确定TCR对基因。对于利用基因特异性探针(Gene-specific probe)来同时对细胞条形码序列和CDR3序列进行测序、从而确定成对基因的方法,无需高规格的测序仪,即可有效鉴定多个成对基因。本技术为有用的单细胞解析法,还可应用于抗体基因的重链及轻链对的确定、集中于特定基因的表达的子集分析。本领域技术人员可使用如上所述的技术,鉴定TCRα链和TCRβ链的对作为存在于T细胞群中的TCR克隆。
(2.8.高功能性TCR)
本发明的修饰TALEN可用于提供高功能性TCR。
已经发现:对于在不同个体之间以高频率共有的T细胞克隆型的TCR,在所有的功能性T细胞子集(Naive、SCM、CM、EM及EFF)库中、进而在抗原特异性T细胞库中总是能够被检测到。如本说明书的实施例1中所证实,更优势的抗原特异性TCR具有更高的表位结合亲和性,并且来源于以更高度共有的克隆型(图2)。并且,在实施例1中证实:这种抗原特异性TCR即使在导入其他T细胞中时也保持抗原亲和性。
表明了优势的CMV NLV特异性克隆型的表位结合亲和性更高、并且优势的克隆型以共有的方式包含在不同个体之间以较高频率存在的TCR克隆型(例如还参照ScientificReports 7,Article number:3663(2017)。为了本说明书的所有目的,其整体被引用作为参考)。表明更优势的CMV pp65特异性克隆型具有更高的表位结合亲和性,并来源于以更高度共有的克隆型。另外,基于该观察可推断,尽管在给与的个体中存在的功能性TCR克隆型较少,但这些克隆型在不同个体之间也以高频率共有。
在本发明的一个实施方式中,提供一步骤,包括将T细胞群中存在的TCR 克隆(全部或部分核酸序列)导入T细胞中的步骤。如上所述,对于个体的抗原特异性T细胞群中以优势存在的克隆,其抗原亲和性较高,在赋予要修饰的细胞的抗原特异性时,使用这种克隆是有利的。但是,抗原特异性T细胞群中存在的克隆,由较少的克隆型构成,只要是包含在其中的克隆,即使无法说成优势也可用于抗原特异性的赋予。优选T细胞群为抗原特异性效应T细胞群。
与抗原特异性T细胞群中的各克隆的存在频率的平均值相比,导入的克隆可以为以较大频率存在的克隆。例如,对于导入的克隆,能够以与抗原特异性 T细胞群中的各克隆的存在频率的平均相比大1标准偏差以上、2标准偏差以上或3标准偏差以上的频率存在。
导入的TCR克隆在T细胞群中能够以约1、约2、约5、约8、约10%、约12%或约15%以上的频率存在。
如上所述,本发明的修饰TALEN,还在将TCR克隆导入T细胞时能够防止因内源性TCR基因导致的干扰的这一方面是有用的。在包括鉴定上述高功能性TCR克隆、并导入该TCR克隆(其全部或部分核酸序列)的步骤的方法中,可使用本发明的修饰TALEN,另外,也提供用于在该方法中使用的组合物。
(2.9.外源性TCR的导入)
在本发明一个实施方式中,本发明的修饰TALEN可用于包括将TCR导入 T细胞的步骤的方法。T细胞优选为调节性T细胞。本发明的修饰TALEN可排除内源性TCR的影响,因此优选用于该方法中。在本发明的一些实施方式中,提供一种含有修饰TALEN的组合物,用于在包括将TCR导入T细胞的步骤的方法中使用。
导入步骤可以为导入TCRα基因的全部或部分核酸序列及TCRβ基因的全部或部分核酸序列的步骤。优选地,将在本说明书中所记载的高功能性TCR导入T细胞。高功能性TCR能以TCR对的形式鉴定,优选以这种TCRα链和TCRβ链成对表达的方式导入。
针对以成对表达的方式导入,记载于Cancer Immunol Immunother.2016 Jun;65(6):631-49(PMID:27138532)等中。针对以成对表达的方式导入,作为除了通过Cys化(Cys残基的导入)形成双硫键以外的方法,存在密码子优化·向细胞内区域导入亮氨酸拉链·TCR的糖链修饰等的技术。
作为应用于TCR导入载体的避免错配的现有技术,例如,存在如下技术等:
1)Cys的导入(Blood.109:2331,2007.)
2)Leucin zipper(Proc Natl Acad Sci.91:11408,1994.)
3)使用2A序列的α·β链的均等表达(根据需要使密码子优化)(J Mol Med 88:1113,2010)
4)特定N-糖基化(N-glycosylation)位点的去除(J Exp Med.206:463, 2009.)
5)小鼠等细胞内结构域使用(Cancer Res.66:8878,2006;J Immunol.184: 6223,2010)
6)单链TCR的使用(α-β-Constant)(Blood.115:5154,2010)。
可以利用能够实现这种表达的载体来将TCR导入,例如载体包含编码Cys 的核酸序列以使所表达的TCRα及TCRβ之间形成二硫键,或者TCRα及TCRβ的编码序列被密码子优化,或者以向TCRα及TCRβ的细胞内区域导入亮氨酸拉链的方式构成,或者以TCRα及TCRβ被糖链修饰并被表达的方式构成。
在本发明中,也可导入所鉴定的TCR克隆的全部核酸,另外当保持结合亲和性时,还可仅导入一部分。在一个实施方式中,可导入包含与Vα-Jα的CDR3 区域对应的序列的、TCRα基因的一部分核酸序列。另外,可导入包含与Vβ-D-Jβ的CDR3区域对应的序列的、TCRβ基因的部分核酸序列。可导入包含Vα-Jα-Cα的cDNA序列的、TCRα基因的一部分核酸序列。可导入包含Vβ-D-Jβ-Cβ的 cDNA序列的、TCRβ基因的一部分核酸序列。
在本发明一个实施方式中,为了内源性TCR的完全取代,还能够采用两步进行内源性TCR基因的去除以及TCR的导入。例如,提供包括如下步骤的方法:去除T细胞中内源性TCRα或内源性TCRβ基因中的任意一方的步骤;将 TCRα基因的全部或部分核酸序列及TCRβ基因的全部或部分核酸序列导入该T 细胞的步骤;在该T细胞中,去除内源性TCRα或内源性TCRβ基因的任意另一方的步骤;以及将TCRα基因的全部或部分核酸序列及TCRβ基因的全部或部分核酸序列再次导入该T细胞的步骤。
在内源性TCR的完全取代中,也可以不使用病毒载体、而是将外源性TCR 敲入并导入基因组。作为敲入技术,利用同源重组(HR)的技术是已知的。另外,还可使用经由微同源介导的末端连接(MMEJ)的方法,而非同源重组(HR)。 MMEJ为真核生物具有的DNA修复机制之一,是在双链切断时所产生的切断两端之间在互补序列(5~25个碱基对)之间结合、进行修复的机制。当利用 MMEJ修复机制插入外来基因时,向供体载体中加入人工核酸酶的识别序列,使得该序列在切断双链时在染色体上靶位点与载体的切断末端之间进行互补结合。通过将该供体载体与人工核酸酶(TALEN及CRISPR/Cas等)一同导入,可在靶位点敲入基因(分别被称为TAL-PITCh法及CRIS-PITCh法)(Nature Communications volume 5,Articlenumber:5560(2014))。利用病毒载体导入外源性TCR时,尽管并非实际上成为问题的概率,但由于理论上存在致癌性,所以在能避免该风险的这一方面,不使用病毒载体是有利的。
(2.10细胞群)
在本发明的一个实施方式中,提供一种细胞群,包含目标外源性TCR细胞,包含除该目标外源性TCR以外的外源性TCR的细胞的比率降低。在本发明的细胞群中,包含除了目标外源性TCR以外的外源性TCR的细胞的比率为例如约20%、约15%、约12%、约10%、约7%、约5%、约3%、约2%或约小于1%,或者本发明的细胞群实质上不包含含有除了目标外源性TCR以外的外源性TCR的细胞。作为目标外源性TCR的非限定例,可例举对NY-ESO-1具有特异性的例子。
对于除了目标外源性TCR以外的外源性TCR,包含除了目标外源性TCR 的α链和β链对以外的TCR,例如,包含表达所导入的TCR链和内源性TCR 链的意外对合(错配)的结果的TCR。目前据报告,当制备包含外源性TCR 的细胞的细胞群时,由于产生与内源性TCR之间的错配,因此有可能丧失抗原特异性和/或出现意外抗原特异性,对减少该错配的方法进行了研究,例如据报告,通过siRNA来抑制内源性TCR的表达,即便在TCR导入载体中使用Cys 修饰,TCR错配的比率的减少也滞留在约12~22%为止(Okamoto et al., MolecularTherapy-Nucleic Acids(2012)1,e63)。
本发明的一个实施方式提供一种制备上述细胞群的方法,该方法包括:从细胞中去除内源性TCR的步骤;以及将编码外源性TCR的核酸导入已去除内源性TCR的细胞中的步骤。本方法中的去除内源性TCR的步骤及将编码外源性TCR的核酸导入已去除内源性TCR的细胞中的步骤可使用本说明书中所记载的或本领域技术人员周知的技术。例如,内源性TCR的去除可通过本说明书所记载的修饰TALEN来进行。例如,编码外源性TCR的核酸的导入可使用本说明书中所记载的具有Cys修饰的载体来进行。
(2.11其他的应用例)
除此之外,本发明的修饰TALEN对于操作T细胞的特异性是有用的。使用本发明的修饰TALEN,以不产生错配/脱靶的方式表达外源性TCR,经过该操作的T细胞可用于过继免疫疗法等。
本发明的调节性T细胞可用于自身免疫疾病、过敏性疾病或移植期间移植物抗宿主病(GVHD)、排斥反应或移植失败的处理、治疗或预防。其原因在于,认为抗原特异性调节性T细胞在抑制针对该抗原的免疫应答方面是有效的。
作为自身免疫疾病,例如可例举类风湿关节炎(RA)、干燥综合征、系统性红斑狼疮(SLE)、抗磷脂综合征、多发性肌炎·皮肌炎、全身性硬化症、混合性结缔组织病、血管炎综合征、I型糖尿病、格雷夫斯氏病、桥本氏病、特发性艾迪森氏病、自身免疫性肝炎、古德帕斯综合征、肾小球肾炎、自身免疫性溶血性贫血(AIHA)、自身免疫性血小板减少性紫癜、自身免疫性中性粒细胞减少症、重症肌无力、天疱疮、白癜风、特发性无精症等,但不限于此。作为过敏性疾病,可例举花粉症、过敏性鼻炎、支气管哮喘、特应性皮炎等,但不限于此。此外,对于与对特定抗原的异常免疫应答发病、病态进展相关的疾病,可以通过本发明的抗原特异性调节性T细胞进行治疗或预防。
(3.试剂盒)
在本发明中,还提供用于编辑TCR基因的试剂盒。试剂盒可包括含有本发明的修饰TALEN的组合物或配合物、确认内源性TCR基因变异的构件和/或确认内源性TCR基因的去除的构件。
在另一实施方式中,试剂盒可包含含有本发明的修饰TALEN的组合物或配合物、导入外源性TCR基因的构件和/或检测已导入基因的细胞的构件。并且,试剂盒可以为用于利用外源性TCR基因来取代内源性TCR基因的物质。另外,试剂盒可用于制备TCR修饰T细胞,TCR修饰T细胞为例如TCR修饰调节性T细胞。
在本说明书中,“或”是在可使用文章中所列举的事项的“至少一个以上”时使用。“或者”也相同。在本说明书中,当明确记载为“两个值的范围内”时,其范围中包括两个值本身。
对于在本说明书中所引用的科学文献、专利、专利申请等参考文献,其全部内容作为参考以与每个详细描述的内容同等程度来被引用。
以上,为了易于理解本发明,示出优选实施方式来进行说明。在下文中,基于实施例来说明本发明,但上述说明及下文中的实施例仅用于例示而提供,并不是为了限定本发明而提供。因此,本发明的范围仅由权利要求来限定,而不是由本说明书中具体描述的实施方式及实施例来限定。
实施例
以下记载实施例。在以下的实施例中所使用的对象的操作在必要情况时,遵守日本国家规定的与人体基因组基因·解析研究相关的伦理方针、将人作为对象的医学系研究相关的伦理方针以及广岛大学所规定的标准,即便在未明确的情况下,在涉及动物实验时也按照动物爱护精神及相关法规来进行。
(实施例1:高亲和性克隆的鉴定·克隆)
概要
本实施例的目的在于,证实免疫学上优势的克隆为高亲和性克隆、以及鉴定·克隆该克隆的方法。
测定对T细胞群进行抗原刺激之后的抗原特异性T细胞群中的TCR克隆的存在频率的分布,并对各TCR克隆进行了克隆。当测定各TCR克隆对抗原的结合能力时,发现T细胞群中优势的克隆具有高抗原结合能力。关于与本实施例相关的信息,也记载于ScientificReports 7,Article number:3663(2017),为了说明书的所有目的,其整体被引用至说明书中作为参考。
(材料及方法)
(供体样品)
本实施例根据《赫尔辛基宣言》的原则进行,使用人体样品的实验均根据广岛大学的伦理委员会批准的协议进行。外周血单核细胞(PBMC)从提供书面同意的5名健康供体获得。对所有供体进行CMV血清状态的筛选,接着,使用高分辨率Luminex法对HLA-A、-B、-C、-DRB1、-DQB1及-DPB1等位基因进行了基因分型。使用标准Ficoll梯度分离协议来分离PBMC,并且保管在液氮中。
[流式细胞术分析及细胞分选]
使用以下荧光标记单克隆抗体(mAb)确定了细胞表面分子的表达:别藻蓝蛋白(APC)共轭或异硫氰酸荧光素(FITC)共轭(Conjugate)抗CD8、异硫氰酸荧光素-hilite7(APC-H7)共轭抗CD3、藻红蛋白-cyanine7(PE-Cy7) 共轭抗CD45ROmAb,brilliant violet510(BV510)共轭抗CD62LmAb、brilliant violet 421(BV421)共轭抗CD197mAb、APC共轭抗CD95及APC共轭抗TCRαβ。这些抗体购自BD Bioscience公司(San Jose,CA)。使CMV pp65特异性T细胞与藻红蛋白(PE)共轭HLA-A*02-肽四聚体按照Kuzushima,K.et al. Tetramer-assisted identification and characterization of epitopes recognized by HLA A*2402-restricted Epstein-Barr virus-specific CD8+T cells.Blood 101,1460-1468(2003)中记载方式进行反应。四聚体的MHC-I上的CD8结合位点完整。本发明的发明人们选择了HLA-A*02限制性CMVpp65肽(NLV肽)的 NLVPMVATV(序列号2)序列作为模型抗原。MHC四聚体染色在室温下进行了15分钟,然后,在4℃下进行了细胞表面染色30分钟。除了系列稀释实验以外,所有实验中使用的四聚体的浓度为10μg/ml。使用阴性对照组四聚体 (HLA-A2-HIV(KLTPLCVTL(序列号3))四聚体-PE)检查了非特异性四聚体染色。
流式细胞术分析及细胞分选分别使用FACSCanto II(BD Biosciences,San Jose,CA)及FACSAria(BD Biosciences,San Jose,CA)进行。所有流式细胞术数据使用FlowJo软件(Tree Star,Ashland,OR)进行了分析。使用7-AAD 去除死细胞及受损细胞,接着,使用FSC-A/FSC-H及SSC-A/SSC-H去除了二联管(doublet)细胞。将CD3+CD8+T细胞进一步分级为如下所示的功能性子集:Naive,CD45RO-CD62L+CCR7+CD95-;SCM,CD45RO-CD62L+CCR7 +CD95+;CM,CD45RO+CD62L+CCR7+;EM,CD45RO+CD62L-CCR7-; EFF,CD45RO-CD62L-CCR7-。
[细胞培养]
PBMC及分选的CD8+T细胞在含有10%的AB血清、2mmol/l的L-谷氨酰胺及1%的青霉素/链霉素的X-VIVO20(Lonza,Walkersville,MD)中进行了培养。B淋巴母细胞细胞株(B-LCL)在含有10%的FBS、2mmol/l的L-谷氨酰胺及1%的青霉素/链霉素的RPMI1640(Sigma-Aldrich,St Louis,MO) 中进行了培养。所有细胞在含5%CO2的气氛中于37℃在潮湿培养箱中进行了培养。
通过在包含5μg/ml的PHA-L(Sigma-Aldrich,St Louis,MO)的CTL培养基中培养PBMC,生成植物血凝素(PHA)胚芽,第2天,添加了IL-2(Peprotech, Rocky Hill,NJ)至最终浓度为50U/ml。接着,将一半培养基用包含IL-2(50U/ml) 及IL-7(Peprotech,Rocky Hill,NJ)(20ng/ml)的新鲜的培养基替换,每周两次。PHA胚芽在培养开始14天后使用。
通过CRISPR-Cas9以缺失TCR表达的方式进行操作得到的Jurkat细胞如下确立。简而言之,在内源性TCRα链的CRISPR/Cas9介导敲除之后,通过流式分选富集了CD3阴性细胞。用包含TCRα链的附加型载体转导所分选的细胞,接着,通过流式分选富集了CD3阳性细胞(具有所转导的α链及内源性β链的 Jurkat细胞)。用CRISPR/Cas9敲除了所分选的细胞的内源性TCRβ,接着,富集了CD3阴性细胞(不具有内源性TCRα及TCRβ的Jurkat细胞)。接着,使用利用流式细胞术的单细胞分选法,进行了JurkaT细胞的单细胞克隆。最后,将TCRβ链转导至所克隆的Jurkat细胞,接着,内源性TCRα、内源性TCRβ及转导TCRα均选择了阴性的Jurkat克隆。克隆的TCRα阴性通过将TCRβ转导至克隆来确认,并且,克隆的TCRβ阴性通过将TCRα转导至克隆来确认。该克隆还通过pMX-CD8α表达载体转导,并通过抗CD8mAb明亮染色。
[CMVpp65特异性T细胞的体外(in vitro)刺激]
使用CD8微珠从PBMC分离了CD8+T细胞。使用CD4+T-细胞分离试剂盒(CD4+T-cellisolation kit)(Miltenyi Biotec,Auburn,CA)从残留细胞去除了CD4+T细胞。将残留的CD4/CD8双阴性细胞用作抗原呈递细胞(APC)。放射线照射(35Gy)之后,将APC在室温下暴露于NLV肽2小时,在包含IL-2 及IL-7的CTL培养基中与等量的CD8+T细胞共培养。合成NLV肽购自 GenScript(Piscataway,NJ)。将培养基的一半每周替换2次。
[使用高通量NGS的TCR库的半定量分析]
对于使用衔接子连接PCR的无偏差基因扩增法及使用NGS的全面性TC 库解析,简而言之以如下方式进行。从PBMC(5×106)或所分选的T细胞中提取总RNA,使用包含聚(T)18及NotI位点的BSL-18E引物将其转换为cDNA。然后,合成双链(ds)DNA,使用T4DNA聚合酶(Invitrogen)进行了平末端修饰。将P10EA/P20EA衔接子连接至dsDNA的5’末端,然后用Not切断。去除了衔接子及引物之后,使用TRA恒定区特异性引物或TRB恒定区特异性引物及P20EA进行了PCR。使用相同PCR条件通过恒定区特异性P20EA引物进行了第二PCR。第二PCR的产物用于使用Illumina Miseq平台的高通量测序。去除了低质量分数的序列之后,利用由Repertoire Genesis Incorporation(Ibaraki, Japan)制备的生物信息学软件进行了TCR库分析。各个步骤的更多详细信息在以下各个项目中描述。
[TCR基因的无偏差扩增]
利用RNeasy Lipid Tissue Mini Kit(Qiagen,Hilden,Germany),根据制造商说明书(Manufacturer’s instruction),从PBMC或分选的T细胞中提取了总 RNA。利用Agilent 2200TapeStation(Agilent Technologies,Palo Alto,CA)测定了RNA量及纯度。利用Superscript III逆转录酶(Superscript III reverse transcriptase)(Invitrogen,Carlsbad,CA)将1μg的总RNA转换为cDNA。cDNA 合成中使用了包含聚(T)18及NotI位点的BSL-18E引物。cDNA的合成之后,使用大肠杆菌DNA聚合酶I(Escherichia coliDNA polymerase I)(Invitrogen),大肠杆菌DNA连接酶(E.coli DNA Ligase)(Invitrogen)及RNase H(Invitrogen) 合成了双链(ds)cDNA。dscDNA的末端使用T4DNA聚合酶(T4DNA polymerase)(Invitrogen)进行了平末端修饰。在dscDNA的5’末端连接P10EA/P20EA衔接子,接着用NotI切割。利用MinElute反应纯化试剂盒 (MinEluteReaction Cleanup kit)(Qiagen)去除衔接子及引物后,利用TCRα链恒定区特异性引物(CA1)或TCRβ链恒定区特异性引物(CB1)中的任一个、与P20EA的引物进行了PCR。PCR条件为将95℃(30秒钟)、55℃(30 秒钟)及72℃(1分钟)持续20个循环。用CA2或CB2中的任一个、和P20EA 的引物,采用相同PCR条件进行了第二PCR。
使用的引物为如下表所示。
表1
用于重组T细胞受体基因片段的下一代定序的引物
Figure BDA0002529233550000571
从上依序对应于序列号4~13。V:A/C/G、N:A/C/G/T、衔接于A及B的序列分别用粗体及粗体斜体表示。关键序列(TCAG)用下划线表示。
用于样品来源鉴定的MID标签序列为如下:
MID1,
ACGAGTGCGT;MID2,ACGCTCGACA;MID3,AGACGCACTC;MID4, AGCACTGTAG;MID5,ATCAGACACG;MID6,ATATCGCGAG;MID7, CGTGTCTCTA;MID8,CTCGCGTGTC;MID10,TCTCTATGCG;MTD11, TGATACGTCT;MID15,TACGACGTA;MID16,TCACGTACTA;MID17, CGTCTAGTAC;MID18,TCTACGTAGC;MID19,TGTACTACTC;MID20, ACGACTACAG;MID21,CGTAGACTAG;MID22,TACGAGTATG;MID23, TACTCTCGTG;MID24,TAGAGACGAG
(分别按照记载的顺序对应于序列号14~33)
[使用Roche 454测序系统的扩增子测序]
对于用于NGS的扩增子,使用P20EA引物及融合标签引物(表1)由第二PCR的产物进行制备。融合标签引物包含了A衔接子序列 (CCATCTCATCCCTGCGTGTCTCCGAC(序列号34))、4碱基的关键序列 (TCAG)及分子鉴定(MID)标签序列(10核苷酸)。TCR恒定区特异性序列根据制造商说明书设计。PCR扩增之后,使用琼脂糖凝胶电泳评价了扩增子。使用AgencourtAMPure XP(Beckman Coulter,Brea,CA)根据制造商说明书去除了不完整片段或引物。使用Quant-iT PicoGreen dsDNA Assay Kit(Life Technologies,Carlsbad,CA)定量了所纯化的扩增子的量。通过不同的融合标签引物,将由10个样品获得的各扩增子以等摩尔浓度混合。使用扩增子混合物,通过GS Junior Titanium emPCR Lib-L kit(Roche 454LifeSciences,Branford, CT),根据制造商说明书进行了乳液PCR(emPCR)。
[TRV及TRJ段的分配]
所有的序列读段,根据其MID标签序列进行了分类。使用与454测序系统(454Sequencing System)一同提供的软件从序列读段的两末端去除了人工附加的序列(标签、衔接子及关键序列)及低质量分数的序列。将残留的序列用于TCRα序列的TRAV及TRAJ、以及TCRβ序列的TRBV及TRBJ的分配。由ImMunoGeneTics Information System(IMGT)数据库(http://www.imgt.org) 确定可利用的参考序列(54的TRAV、61的TRAJ、65的TRBV及14的TRBJ 基因(包括假基因及开放阅读框(ORF)参考序列)的数据集中的具有最高百分比同源性的序列,由此进行序列的分配。数据处理、分配及数据聚合使用由 Repertoire GenesisIncorporation(Osaka,Japan)独立开发的库分析软件 (Repertoire Genesis,RG)来自动进行。RG首先使用BLASTN及IMGT数据集将TRV及TRJ等位基因分配给查询。在此步骤中计算查询及参考序列之间的同源性。使灵敏度及准确性增加的参数(E值阈值、最小核长度、高分数片段对(HSP)分数)wp,已针对各库分析进行了优化。接着,RG通过研究所翻译的读取框来推定查询的CDR3结构域。接着,RG计算TRV-CDR3-TRJ图案分布,并生成图形(例如,TRV-TRJ使用直方图或CDR3长度分布图)。这些步骤在输入查询后自动进行。
[数据分析]
根据IMGT命名法,CDR3区域的所翻译的核苷酸序列遍及从保存的 Cys104至保存的Phe118或Gly119的范围。唯一序列读段(USR)被定义为相对于TRV、TRJ及其他的序列读段的CDR3结构域的推导氨基酸序列具有0%的同源性。RG软件会自动计算各样品中的相同UCR的复制数,然后按照复制数的顺序对其进行了排序。计算了TRAV、TRAJ、TRBV及TRBJ基因的序列读段的百分比频率。
[单细胞分选及RT-PCR]
为了鉴定及表征由单个细胞表达的CMV NLV特异性TCRαβ对,本发明人使用了如下修饰的hTEC10系统(Kobayashi,E.et al.A new cloning and expression system yieldsand validates TCRs from blood lymphocytes of patients with cancer within10days.Nat.Med.19,1542-1546(2013).,Hamana,H.,Shitaoka, K.,Kishi,H.,Ozawa,T.&Muraguchi,A.A novel,rapid and efficient method of cloning functionalantigenspecific T-cell receptors from single human and mouse T-cells.Biochem.Biophys.Res.Commun.474,709-714(2016))。将CD8/NLV四聚体双阳性细胞分选到96孔PCR板的各孔中。使用多重RT-PCR,合成及扩增了 cDNA。用于对编码TCRα链及TCRβ链的序列进行扩增的基因特异性引物,根据从IMGT数据库(http://www.imgt.org/)获得的前导肽序列设计。针对PCR 反应,在以下的“TCRA及TCRB对的RT-PCR分析”中详述。使用IMGT/V-Questtool(http://www.imgt.org/)进行了TCR库分析。
[TCRA及TCRB对的RT-PCR分析]
RT-PCR在包含0.1μl的40U/μl的RNase Inhibitor(NEB,Ipswich,MA)、0.1μl 的200U/μl的PrimeScript II RTase(TaKaRa,Otsu,Japan)、0.4μl的引物混合物、 0.025μl的2.5U/μl的PrimeStar HS DNA Polymerase(TaKaRa)、0.4μl的2.5mM的 dNTP及2.5μl的5×PrimeStar GC缓冲液(TaKaRa)的反应混合物中进行。加入经 DEPC处理的H2O,使得最终体积达到5μl。RT反应在45℃下进行40分钟,然后,进行了以下PCR反应:在98℃下1分钟,然后98℃下10秒钟,55℃下 5秒钟及72℃下1分钟,将此进行30个循环。PCR反应物用水稀释10倍,并作为用于后续巢状PCR的模板DNA。用于TCRA及TCRB扩增的巢状PCR在不同的96孔PCR板进行。反应混合物包含来自第一PCR反应的2μl的DNA 模板、0.4μl的10μM的各个特异性引物集(针对TCRα的A-AD及A-RV2引物、针对TCRβ的B-AD及B1-RV2引物、B2-RV2引物)、0.1μl的2.5U/μl的 PrimeSTAR HS DNA Polymerase、1.6μl的2.5mM的dNTP、10μl的5×PrimeSTARGC缓冲液、0.1μl的2.5U/μl及H2O(添加至最终体积为20μl)。PCR循环如下: 98℃下1分钟,然后,98℃下10秒钟,55℃下5秒钟及72℃下1分钟,将此进行35个循环。用Sanger测序分析了TCRA及TCRB的PCR产物。
[克隆的TCR的结合能力的确认]
1)使用逆转录病毒载体(pMXs-IRES GFP)将上述所克隆的各TCRαβ对基因(CMVpp65NLVPMVATV:NLV特异性)导入到TCRαβ缺陷Jurkat cell 中。
2)使用细胞分选仪(AriaII)从被导入各TCR基因的Jurkat cell中分离了 GFP阳性细胞。
3)用连续稀释为浓度2μg/ml、4μg/ml、6μg/ml、8μg/ml、10μg/ml的NLV 四聚体,对被导入了各TCR的Jurkat cell进行了染色。
4)使用流式细胞术测定了四聚体阳性细胞的荧光强度(MFI),分析了与各TCR的四聚体之间的结合力。
(结果)
结果示于图1及图2。针对供体V001及V004,具有图1示出的克隆型的 T细胞克隆被鉴定为抗原特异性克隆型。已经发现,非常少量的克隆组成了抗原特异性克隆群。
并且,将由上述方法测定的各TCR克隆的存在频率与对抗原的结合性的比较示于图2中。从结果可发现存在频率与结合亲和性之间直线相关,可理解的是,在抗原特异性T细胞群中优势的克隆为高亲和性克隆。
(实施例1-2)
使用不同的测序仪(Miseq,Illumina),按照以下顺序进行上述实施例1中的“使用高通量NGS的TCR库的半定量分析”的步骤。
[实验方案的变更点概要]
从RNA至双链DNA合成,以与实施例1相同的步骤进行。对于PCR,直到第一PCR、第二PCR为止以相同步骤进行,随后以Miseq用的PCR(Tag PCR 及Index PCR)的形式进行。作为试剂的变更点,使用了推荐用作下一代序列的PCR酶的KAPA HiFi HotStart ReadyMix。
3-2-9:样品操作7(第一PCR、第二PCR)
※记载用于解析人TCRαβ的2基因的流程。
<第一PCR>
表示一个样品量的试剂量。
将10μL的2×KAPA HiFi Hot Start Ready Mix分别加入α或β管。
将7.6μL的DW(DNA专用,瓶)分别加入α或β管。将0.2μL的10μM 的P20EA引物分别加入α或β管。
将0.2μL的10μM的CA1引物加入α管,将0.2μL的10μM的CB1引物加入β管。
向加入有α液或β液的管中分别加入2μL的各dsDNA样品。
通过热循环仪,选择相应的设定(程序名称:KAPA20,条件为95℃下3min, 20个循环(98℃下20sec,65℃下30sec,72℃下1min),72℃下2min,最后,在12℃下持续)。
<第二PCR>
表示一个样品量的试剂量。
将10μL的2×KAPA HiFi Hot Start Ready Mix分别加入α或β管。
将6μL的DW分别加入α或β管。
将1μL的10μM的P20EA引物分别加入α或β管。
将1μL的10μM CA2引物加入α管,将1μL的10μM的CB2引物加入β管。
将α或β的第一PCR产物分别加入α或β的PCR用第二PCR管各2μL。
通过热循环仪,选择相应的设定(程序名:KAPA20,条件为95℃下3min, 20个循环(98℃下20sec,65℃下30sec,72℃下1min),72℃下2min,最后,在12℃下持续)。
<DNA纯化1>
3-2-10:样品操作8(AMpure纯化1)
在本步骤中使用BECKMAN COULTER公司的Agencourt AMPure XP。
将AMPure XP珠粒充分地混合至均匀,并将8μL分注到管中。
将10μL的第二PCR产物加入到分注有AMPure XP珠粒的管中,设置于 MM-Separater M96(磁性平板),收集磁性珠粒。
去除上清液,利用200μL的70%乙醇进行冲洗,设置于MM-Separater M96,收集磁性珠粒。
完全去除上清液,分注30μL的DW(DNA用,瓶),进行旋涡混合。设置于MM-SeparatorM96,收集磁性珠粒。
回收25μL上清液。
<Tag PCR>
3-2-11:样品操作9(Tag PCR)
将10μL的2×KAPA HiFi Hot Start Ready Mix分别加入α或β管。
将4.2μL的DW(DNA专用,瓶)分别加入α或β管。将0.4μL的10μM 的P22EA-ST1-R引物分别加入α或β管。
将0.4μL的10μM的CA-ST1-R引物加入α管,将0.4μL的10μM的 CB-ST1-R引物加入β管。
向加入有α或β试剂混合液的管中,分别加入各第二PCR已纯化样品5μL。
通过热循环仪,选择相应的设定(程序名:KAPA20,条件为95℃下3min, 20个循环(98℃下20sec,65℃下30sec,72℃下1min),72℃下2min,最后,在12℃下持续)。
<DNA纯化2>
3-2-14:样品操作11(AMpure纯化2)※
※本项的操作与操作说明“3-2-10:样品操作8(AMpure纯化1)”相同。
<用于采用一次测序解析多个试样的索引(Index)PCR的设计>
3-2-15:样品操作12(制作索引PCR所需的片)
3-2-15-1:要点
索引PCR是为了对各样品附加索引序列及P5/P7序列(与流动池结合的部分)而进行的。
预先确定样品与引物的排列顺序(矩阵),由Illumina Experiment Manager 创建样品片。
索引引物使用Illumina的现有产品(Nextera XT Index Kit v2Set A)。
<索引PCR>
3-2-16:样品操作13(索引PCR)
本操作书示出一个样品量的试剂量。
将10μL的2×KAPA HiFi Hot Start Ready Mix加入管中。
将4μL的DW(DNA用,瓶)加入管。
向PCR8连管中分注14μL。
分注N引物各2μL。
分注S引物各2μL。
将标签(Tag)PCR已纯化的样品分别注入到规定的管中各2μL。
通过热循环仪,选择相应的设定(程序名:INDEX12,条件为95℃下3min, 12个循环(95℃下30sec,55℃下30sec,72℃下30sec),72℃下5min,最后,在4℃下持续)。
<电泳>
3-2-17:样品操作14(电泳与评价2)
※TCR基因时大约成为650bp。
制备1.5%的琼脂糖凝胶,并使用Atlas ClearSight染色。
在电泳槽中设置凝胶,将4μL的索引PCR产物与100bp DNA ladder、10x Dye一同进行电泳(100V、30分钟),使用UV透射照明器或数码相机来评价扩增结果。
※在显著较薄的情况下,需要返回操作说明“3-2-16:样品操作13(索引PCR)”,变更PCR条件(增加至15个循环)。
<浓度测定1>
3-3-3:样品操作1(利用Qubit的DNA浓度测定)
使用索引PCR产物,用DW(DNA用,瓶)稀释10倍。
将附属于Qubit dsDNAHS Assay kit的染料用附属的缓冲液稀释200倍。
向500μL的2个专用管(Standard用)中加入190μL,试样用时加入198μL 的染料稀释液。
向加入190μL染料稀释液的500μL专用管(2个)中,分别加入10μL的附属于QubitdsDNAHS Assay kit的Standard#1、Standard#2。
向加入198μL染料稀释液的500μL专用管(10个)中,加入2μL的索引 PCR产物。
启动Qubit,选择测定模式“dsDNA”,接着选择“High Sensitivity”。
移至测定画面,选择最下方的“Read standards”。
按顺序测定Standard#1、Standard#2,确认值成为“数十”、“数万”。
将试样的输入量设为2μL,进行测定。
※测定范围为0.1~50ng/μL,因此,超出范围时进行稀释,再次测定。
基于测定结果,从多个试样(在通常Miseq的序列中同时测定50~60试样) 以可混合等量的DNA量的方式分注至其他管中,制成汇集试样(pool sample)。
<DNA纯化3>
3-2-18:样品操作15(AMpure纯化3)
※本项的操作与操作说明“3-2-10:样品操作8(AMpure纯化1)”的操作相同,但基于汇集试样的液量进行调节。
<浓度测定2>
3-3-3:与样品操作1(根据Qubit的DNA浓度测定和稀释)相同操作。
Miseq中用于测序的试样浓度为4nM(650bp时为1.72ng),因此测定后稀释至指定浓度。
<使用Miseq的测序运行(sequence run)>
3-3:MiSeq序列解析
3-3-4:样品操作2(Phi-X,DNA库的改性)
将5μL的0.2N-NaOH与5μL的制成4nM的汇集试样(DNA)混合。
将5μL的0.2N-NaOH与5μL的制成4nM的PhiX(测序安定化试剂,含有随机的碱基)混合。
分别分注Hyb-缓冲液(Hyb-Buffer),以最终浓度为10pM,DNA:PhiX= 4:1(PhiX为20%)的方式混合,而最终制备。
3-3-5:样品操作3(Miseq run)
在测序解析中使用Illumina公司的Miseq,主要的测序试剂使用MiSeq ReagentKit v3(600个循环)MS-102-3003。操作方法为:在已解冻的试剂盒中,将经过最终调节的试样分注在指定的孔中,并设置在设备中。
以下记载引物序列等的信息。
表2
Figure BDA0002529233550000651
(自上起对应于序列号4、6、5、35~57、7、8、38、9、10及39)
关于索引PCR引物的进一步的信息,请参照https://support.illumina.com/content/dam/illumina-support/documents/documentatio n/chemistry_documentation/experiment-design/illumina-adapter-sequences_100000 0002694-01.pdf。
(实施例1-3)
实施例1中的“单细胞分选及RT-PCR”、“TCRA及TCRB对的RT-PCR分析”的部分也能够以如下步骤进行。本步骤改进了Drop-Seq法,并开发为高效确定TCR对基因的GeneCapture Drop-SeqTM法。记载有使用TCR特异性Oligo 珠粒的制备法和Gene Capture Drop-SeqTM法的单细胞TCR对基因确定法。本步骤的进一步详细内容记载于日本羊土公司的“实验医学·别册”单细胞分析操作说明(2017年10月10日号)中,所述文献的全部内容作为参考援用至本说明书中。
[准备]
(设备)
□Dolomite Bio公司制单细胞RNA-Seq系统(图19A)
(P泵3台,流量计3组,细胞搅拌机,数码显微镜,单细胞RNA-Seq芯片)
□MiSeq测序仪(Illumina公司)
□Qubit 3.0荧光计(Thermo Fisher Scientific公司)
单细胞分离装置(Dolomite Bio公司)由P泵3台、流量计3组、细胞搅拌机、数码显微镜、单细胞RNA-Seq芯片构成。装配显示器,实时地确认液滴的形成,成为可实现各种组件的扩展性较高的规格。
(试剂)
1.珠粒Oligo制备
□TE 10mM的Tris-HCl,pH8.0,1mM的EDTA
□TE/TW 10mM的Tris-HCl,pH8.0,1mM的EDTA,0.1%Tween20
□TE/SDS 10mM的Tris-HCl,pH8.0,1mM的EDTA,0.5%SDS
□Bst反应停止液100mM的KCl,10mM的Tris-HCl(pH8.0),50mM EDTA, 0.1%Tween20
□NaOH清洗液I 150mM的NaOH,0.5%Brij35P
□NaOH清洗液II 100mM的NaOH,0.5%Brij35P
□中和缓冲液100mM NaCl,100mM Tris-HCl(pH8.0),10mM EDTA,0.1% Tween20
□Oligo固相化珠粒(自定义合成,Chemgene公司)1(图19B)
□合成DNA
□Bst 3.0的DNA聚合酶(DNA Polymerase)(NEB)
□核酸外切酶I(Exonuclease I)(NEB)
1Oligo珠粒委托美国ChemGene公司合成。Mocosko等人的RNA-Seq用 Oligo珠粒为在SMART序列(序列号45)后包含12碱基的混合&汇集(mix &pool)碱基(细胞条形码序列,J)、8碱基的随机序列(分子辨识序列,N) 及30碱基的聚(T)序列。Gene Capture中附加退火序列以替代聚(T)序列,通过延伸反应,使单珠粒结合TCRα链C区域特异性探针和TCRβ链C区域特异性探针这两个探针。
探针Oligo通过延伸反应与珠粒结合。合成具有退火序列的基因特异性探针(GSP,Gene-specific probe),通过进行延伸反应,可制备靶基因的Oligo珠粒。成对的两个基因中附有相同细胞条形码序列,可从测序序列确定成对基因。
2.细胞分离
□血清培养基RPMI1640(日本和光纯药),10%FCS,青霉素·链霉素(日本和光纯药),50μM的2-硫基乙醇
□ACK溶解缓冲液0.15M的NH4Cl,0.01M的KHCO3,0.1mM Na2EDTA,
pH7.2~7.4
□70μm的细胞过滤器(美国康宁公司)
□MACS分离用磁性装置(Miltenyi Biotech公司)
□CD8a+T细胞生物素-抗体混合物(T Cell Biotin-Antibody Cocktail,Miltenyi Biotech公司)
□抗生物素微珠(Anti-Biotin MicroBeads,Miltenyi Biotech公司)
□MACS LS柱(Miltenyi Biotech公司)
□MACS缓冲液PBS,2mM EDTA,0.5% BSA
3.单细胞分离
□100μm的过滤器
□40μm的过滤器
□细胞溶解液200mM的Tris-HCl(pH7.5),6%聚蔗糖PM400(GE healthcare 公司),0.2%Sarcosyl(20%N-月桂酰肌氨酸钠盐(N-Lauroylsarcosine sodium salt),Sigma-Aldrich公司),20mM的EDTA,1.5M的甜菜碱,0.2×SSC,5%DMSO
□1M的DTT
□细胞用缓冲液PBS,0.01%BSA
□Droplet Generator oil for EvaGreen(Bio-Rad公司)
□全氟辛醇(PFO,Sigma-Aldrich公司)
□6×SSC
4.模板转换逆转录反应
□Superscript IV(Thermo Fisher Scientific公司)
□10mM的dNTPs(Promega公司)
□RNasin(注册商标)Plus RNase抑制剂(Promega公司)
□KAPA HiFi HotStart ReadyMix(KAPA Bioscience公司)
□TSO oligo:GTCGCACGGTCCATCGCAGCAGTCA CAGG(IG), lG:LNA oligo(序列号40)
□TSO PCR引物:GTCGCACGGTCCATCGCAGCAGTC(序列号41)
□SMART PCR引物:AAGCAGTGGTATCAACGCAGAGT(序列号42)
□TSO TAG引物:GTCTCGTGGGCTCGGAGAT
GTGTATAAGAGACAGCGTCGCACGGTCCATCGCA GCAGTC(序列号43)
□SMART TAG引物:TCGTCGGCAGCGTCAGA
TGTGTATAAGAGACAGAAGCAGTGGTATCAACGC AGAGT(序列号44)
□Nextera XT Index Kit v2 SetA(Illumina公司)
□Agencourt AMPure XP(Beckman Coulter社)
□EB缓冲液(5mM的Tris-HCl,pH8.5)
□Qubit dsDNA测定试剂盒(Thermo Fisher Scientific公司)
(细胞)
T淋巴瘤细胞株(EL-4)
小鼠脾脏细胞(C57BL/6)
[操作说明]
1.Oligo珠粒的制备
(1)将购自ChemGene公司的通用Oligo珠粒(10μmole规格)悬浮在30mL 的TE/TW中,进行1000g、1分钟的离心,进行清洗(重复两次)。对于珠粒的清洗及回收,在悬浮于缓冲液之后,通过1000g、1分钟的离心可以容易地回收。使用回转转子(swing rotor),以珠粒不被吸收的方式谨慎去除缓冲液。
(2)使用血细胞计数器计算珠粒数量(图19C)。在TE/TW溶液中悬浮以使其成为500000珠粒/mL,冷藏保管。可在TE/TW中长期冷藏保管。ChemGene 公司制珠粒使用Toyopeal HW,珠粒直径为约30μm。
(3)将珠粒悬浮液1mL(500000珠粒)分取至微量离心管,在1000g条件下离心1分钟。
(4)悬浮于500μL的1×等温(Isothermal)缓冲液(NEB公司),在1000g 条件下离心1分钟(用于进行用下述延伸反应用缓冲液进行预清洗)。
(5)准备下述Oligo延伸反应液,并添加至(4)的珠粒中。
表3
Figure BDA0002529233550000701
(6)在85℃保温2分钟后,在60℃保温20分钟。
(7)添加2μL的Bst3.0聚合酶(800U/μL),在60℃下利用加热转子反应 1小时30分钟。在酶反应中珠粒沉淀,因此为了保持均匀的反应,使用加热转子为优选。
(8)加入1mL的Bst反应停止液,孵育30分钟,在1000g条件下离心1 分钟(重复两次)。
(9)为了进行外切核酸酶I处理,加入1mL的1×外切核酸酶缓冲液进行预清洗,在1000g条件下离心1分钟(为了去除未反应的珠粒结合Oligo,对单链DNA进行分解处理)。
(10)制备下述外切核酸酶I反应液,并使珠粒悬浮。
表4
Figure BDA0002529233550000702
(11)加入2.5μL的外切核酸酶I(20U/μL)使最终浓度为1U/μL,在37℃下用加热转子反应45分钟。
(12)悬浮于1mL的TE/SDS,在1000g条件下离心1分钟(重复两次)。
(13)悬浮于1mL的NaOH清洗液I,在1000g条件下离心1分钟(通过碱清洗,使结合在珠粒上的双链DNA改性,制成单链DNA探针)。
(14)悬浮于1mL的NaOH清洗液II,在1000g条件下离心1分钟(重复两次)。
(15)悬浮于1mL的TE/TW,在1000g条件下离心1分钟(重复两次)。最终,以成为5×105珠粒/mL的方式悬浮于TE/TW,在使用之前冷藏保管。
2.细胞的制备
<小鼠T细胞株>
(1)将在血清培养基中培养的小鼠T淋巴瘤细胞株在800g条件下离心5 分钟,并回收细胞。
(2)用10mL的血清培养基清洗。
(3)悬浮于10mL的血清培养基,通过75μm细胞过滤器过滤。用血细胞计数器计算细胞。
<小鼠脾细胞>
(1)解剖小鼠(C57BL/6,6周龄),摘除脾脏。对于细胞的制备,为了减少细胞受损,尽量在单细胞即将分离前进行。
(2)在包含10mL血清培养基的培养皿上,使用载玻片的粗糙(frost)部轻柔研碎脾脏。
(3)将血清培养基移至15mL离心管,等待残渣(debris)沉淀。
(4)上清液移至另一个离心管,在800g条件下离心5分钟。
(5)去除了上清液之后,加入2mL的ACK溶解缓冲液并悬浮,室温下放置2分钟,破坏红细胞。
(6)加入10mL的血清培养基使得停止溶血,在800g条件下离心5分钟。
(7)悬浮于10mL的血清培养基,通过75μm细胞过滤器过滤。用血细胞计数器计算细胞。
<小鼠脾脏CD8阳性细胞>
(1)分取1×108细胞溶液,在800g条件下离心5分钟。
(2)悬浮于10mL的冰冷的MACS缓冲液后,在800g条件下离心5分钟。
(3)加入400μL的CD8α+T细胞生物素-抗体混合物(T Cell Biotin-AntibodyCocktail),在冰上静置5分钟。
(4)加入300μL的MACS缓冲液,接着,加入200μL的抗生物素微珠(Anti-BiotinMicrobeads),在冰上静置10分钟。
(5)其间,将LS管柱安装在磁性分离装置上,加入3mL的MACS缓冲液,使管柱再生。
(6)将1mL的细胞悬浮液装入LS管柱中,收集通过级分(flow-through)。
(7)进而,加入3mL的MACS缓冲液,回收全部的通过级分。
(8)加入6mL的血清培养基,在800g条件下离心5分钟。
(9)加入10mL的血清培养基,在800g条件下离心5分钟。
(10)加入4mL血清培养基,计算细胞。
3.单细胞的分离
3-1.Dolomite Bio公司单细胞分离装置的设置(微细纤维的混入成为管线堵塞的原因,因此保持试验台清洁以使不落灰尘等,可使用无尘室用无尘拭纸等。)
(1)启动压缩机,启动PC及控制用专用软件(Mitos Flow Control Center)。
(2)确认各个管线的接合,并安装微芯片以便用显示器确认显微镜下流路。
(3)在P泵内的瓶中设置过滤灭菌水及对照组油。进入管线的所有试剂预先用过滤器过滤。包含表面活性剂的EvaGreen Droplet Oil较贵,因此在进行试验时可使用Novec7700、FC40(3M公司)。
(4)细胞用管线及珠粒用管线的流速设为40μL/分钟,油用管线设为200μL/ 分钟,进行测试流动。通过改变流速来调节液滴尺寸。在该条件下为大致85μm,但在30μL/分钟(细胞)、30μL/分钟(珠粒)、166μL/分钟(油)下可调节为大致100μm直径。
(5)在显微镜中确认液滴顺利形成。
3-2.珠粒的准备
(6)分取1.5×105珠粒,在1000g条件下离心1分钟,珠粒下降。
(7)加入500μL溶解缓冲液,预清洗珠粒,在1000g条件下离心1分钟。
(8)加入500μL溶解缓冲液,调整为3×105珠粒/mL。
(9)用70um过滤器过滤之后,用1mL的注射器抽吸。
(10)切换阀门使得珠粒注入500μL的样品环路中,使注射器倒置混合,缓慢注入珠粒。以珠粒不沉淀的方式一边将注射器倒置混合一边进行操作。
(11)珠粒管线的流速设为40μL/分钟,阀门以关闭状态待机。
3-3.细胞的准备
(12)分取悬浮于血清培养基的1×106细胞,在800g条件下离心5分钟。
(13)悬浮于10mL的PBS/BSA,在800g条件下离心5分钟。
(14)悬浮于PBS/BSA以使成为3×105细胞/mL,用70μm过滤器过滤之后,将瓶设置于P泵内。为了使细胞不劣化而进行冰浴。
(15)一边用搅拌棒搅拌,一边以流速40μL/分钟运转。
3-4.油的准备
(16)取出放有对照油的瓶,将液滴用Droplet Generation Oil for EvaGreen 设置于P泵内。
(17)将流速设为200μL/分钟,确认油流动而形成液滴。
3-5.输出管线的准备
(18)为了回收从微芯片出来的液滴,将输出管线设置在管中。
(19)开放珠粒管线,珠粒在微芯片内流动。一边观察显示器画面,一边确认珠粒流动、形成液滴(图19D)。在该条件下形成4000/秒的液滴,珠粒被封入至20液滴中的一个。
(20)回收15分钟至20分钟的液滴。在显示器画面上确认珠粒消失。所回收的液滴溶液可确认上层液滴、下层油的2层。
4.液滴的破坏
(1)将液滴回收至管中,去除下层的油。在芯片的前端通过吸收将油去除。之后的操作尽可能快速进行。
(2)将上层(白色)的液滴全部分注在8连微管中。
(3)将液滴在75℃下2分钟、从65℃以30秒间隔降低1℃直至50℃,进行退火。结束后,在冰上保管。
(4)将全部液滴移至50mL的锥形管,并加入所冷却的10mL的6×SSC 溶液。
(5)加入500μL的全氟辛醇(PFO),剧烈地进行旋涡混合。
(6)在1000g条件下离心1分钟,谨慎去除上清液。珠粒形成白色的层。应注意,在6×SSC中珠粒浮起。珠粒不沉淀时,再次离心或用25μm过滤器回收。同时,堆积在底部的油层(透明)也去除。
(7)加入10mL的6×SSC,剧烈地进行旋涡混合后,再次在1000g条件下离心1分钟。谨慎去除上清液,并清洗珠粒(重复两次)。
(8)将白色珠粒移至微量离心管中,在1000g条件下离心1分钟,并去除上清液。
5.模板转换逆转录反应
(1)在珠粒颗粒中加入100μL的5×RT缓冲液,在1000g条件下离心1分钟并进行预清洗。
(2)制备以下逆转录反应液,并加入珠粒中。
表5
逆转录反应液
Figure BDA0002529233550000741
1为了制备定向库(Directional library)而使用与珠粒序列不同的模板转换Oligo(TSO)。也可使用附加在珠粒上的SMART Oligo。
(3)加入2μL的SuperScript IV(200U/μL),用热转子在50℃下保温1小时30分钟。
(4)加入100μL的TE/SDS溶液,在1000g条件下离心1分钟,以去除上清液。
(5)加入100μL的TE/TW溶液,在1000g条件下离心1分钟,以去除上清液(重复两次)。
(6)加入100μL的1×外切核酸酶缓冲液,在1000g条件下离心1分钟,并进行预清洗。
(7)将下述外切核酸酶反应液加入珠粒中。
表6
Figure BDA0002529233550000751
(8)添加1μL的外切核酸酶(20U/μL),在37℃下用热转子保温30分钟。
(9)加入100μL的TE/SDS溶液,在1000g条件下离心1分钟,以去除上清液(重复两次)。
(10)加入100μL的TE/TW溶液,在1000g条件下离心1分钟,以去除上清液(重复两次)。
6.PCR反应
(1)加入100μL的DW,在1000g条件下离心1分钟,以去除上清液。
(2)制备下述的预PCR反应液,并添加至珠粒中。
表7
Figure BDA0002529233550000752
预PCR循环
98℃下3分钟,(98℃下20秒钟,65℃下20秒钟,72℃下3分钟)18个循环,72℃下5分钟1在使用SMART序列作为TSO的情况时,可仅利用SMART PCR引物进行PCR。
(3)向15μL的PCR产物加入12μL的Ampure珠粒,于室温静置5分钟。
(4)在磁性平板上于室温静置2分钟,去除上清液。
(5)用200μL的70%乙醇清洗(重复两次)。
(6)完全去除70%乙醇之后,干透1分钟。
(7)添加15μL的EB缓冲液(5mM的Tris-HCl,pH8.5),旋涡混合后静置1分钟。
(8)在磁性平板上于室温静置2分钟,将上清液回收至新管中。
(9)制备下述PCR反应液,加入2μL的所纯化的预PCR反应液,以如下循环进行PCR。
表8
Figure BDA0002529233550000761
PCR循环
98℃下3分钟、(98℃下20秒钟、65℃下20秒钟、72℃下3分钟)30个循环、72℃下5分钟
(10)用2%琼脂糖凝胶电泳确认PCR产物。
(11)与(3)~(8)同样地利用Ampure珠粒进行纯化,由此回收PCR 产物。
(12)制备INDEX标签附加用PCR反应液,加入2μL的所纯化的PCR反应液,按照如下循环进行PCR。
表9
Figure BDA0002529233550000771
Tag PCR循环
98℃下3分钟、(98℃下20秒钟、65℃下20秒钟、72℃下3分钟)18个循环、72℃下5分钟
(13)与(3)~(8)同样利用Ampure珠粒进行纯化,由此回收PCR产物。
(14)制备INDEX PCR用的PCR反应液。加入2μL的所纯化的标签PCR (Tag PCR)反应液,以如下循环进行PCR。
表10
Figure BDA0002529233550000772
Tag PCR循环
95℃下3分钟、(95℃下30秒钟、55℃下20秒钟、72℃下2分钟)14个循环、72℃下5分钟
(15)与(3)~(8)同样地利用Ampure珠粒进行纯化,由此回收PCR 产物。
(16)针对所纯化的INDEX PCR产物,利用Qubit dsDNA测定试剂盒用 Qubit3.0荧光计来测定DNA量。
(17)稀释PCR产物使得成为4pM,以从30万至100万的读段为目标,用MiSeq进行测序。
7.TCR库
根据序列数据的小鼠TCR参考序列对V、D、J区域序列的分配、读段合计等的解析,是通过Repertoire Genesis公司研究开发的库解析用专用软件来进行的。作为可获得的TCR解析软件,已知MiXCR或IMGT提供的HighVQuest 等,可利用这些软件。读段序列之间的条形码匹配可利用R的Biostrings或类似的包装(package)进行。
[探讨]
对于通过实施例1-1中使用的流式细胞仪进行分选后的解析、以及实施例 1-3中描述的液滴基底的手法,可根据目的而区分使用。认为若以呈现高功能性 TCR为目的,则至多数百个以内的单细胞解析在成本效果方面也优异,若以全面性解析以低频率存在的TCR(Naive级分的TCR或shared TCR等)作为目的,则通过液滴进行的解析虽费用高但有利。
(实施例2:内源性TCR的去除)
(概要)
在本实施例中,证实了通过以TCR基因为靶的基因组编辑将内源性TCR 基因完全去除。
(材料及方法)
[铂TALEN的制备]
使用铂TALEN的制备试剂盒(Platinum Gate TALEN Kit,http: //www.addgene.org/kits/yamamoto-platinumgate/),根据制造商的操作说明(http: //www.addgene.org/kits/yamamoto-platinumgate/#protocols-and-resources),制备了以内源性TCR基因作为靶的铂TALEN。
[从铂TALEN合成mRNA]
(1)将用于切断TRA或者TRB基因的Left(L)-TALEN和Right(R) -TALEN的质粒利用SmaI在30℃下处理了2小时。
(2)用蛋白酶(Proteinase)K在50℃下处理了20分钟之后,用QIAGEN PCR纯化试剂盒(QIAGEN PCR Purification Kit)进行了纯化。
(3)用mMESSAGE MACHINE T7Kit(Life technologies)、进而用poly (A)TailingKit(Life technologies)合成mRNA,并用LiCl沉淀法进行纯化(如制造商说明书(Manufacture’s instruction)所示)。
在本实施例中,为了靶化TCRα基因,使用了TALEN-TCR-alpha2_L19及 TALEN-TCR-alpha2_R19对。这些质粒的全长序列由序列号46及序列号47表示。另外,TALEN-TCR-alpha2_L19的TALEN编码序列由序列号52表示,该 TALEN的氨基酸序列由序列号53表示。TALEN-TCR-alpha2_R19的TALEN编码序列由序列号54表示,该TALEN的氨基酸序列由序列号55表示。
在本实施例中,为了靶化TCRβ基因,使用了TALEN-TCR-beta1_L19及 TALEN-TCR-beta1_R19对、或者TALEN-TCR-beta3_L19及TALEN-TCR-beta3 _R19对。这些质粒的全长序列按照记载的顺序由序列号48、序列号49、序列号50及序列号51表示。并且,TALEN-TCR-beta1_L19的TALEN编码序列由序列号56表示,该TALEN的氨基酸序列由序列号57表示。TALEN-TCR-beta1_R19的TALEN编码序列由序列号58表示,该TALEN的氨基酸序列由序列号59表示。并且,TALEN-TCR-beta3_L19的TALEN编码序列由序列号60表示,该TALEN的氨基酸序列由序列号61表示。 TALEN-TCR-beta3_R19的TALEN编码序列由序列号62表示,该TALEN的氨基酸序列由序列号63表示。
[使用铂TALEN mRNA的TCR缺陷T细胞的制备]
(1)将Jurkat细胞用RPMI1640+10%FBS+2mmol/l的L-谷氨酰胺+1%青霉素/链霉素培养了3天。
(2)按照以下顺序,当将TCRα基因设为靶时,将TALEN-TCR-alpha2_L19 (TCRα-L-TALEN)mRNA及TALEN-TCR-alpha2_R19(TCRα-R-TALEN) mRNA各10μg分别导入培养Jurkat细胞,当将TCRβ基因设为靶时,将 TALEN-TCR-beta1_L19(TCRβ1-L-TALEN)mRNA及TALEN-TCR-beta1_R19 (TCRβ1-R-TALEN)mRNA对、或TALEN-TCR-beta3_L19(TCRβ3-L-TALEN) mRNA及TALEN-TCR-beta3_R19(TCRβ3-R-TALEN)mRNA对分别导入培养 Jurkat细胞(SE CellLine4D-NucleofectorTM X Kit S))。
(2-1)通过离心(400G,10分钟,室温),将Jurkat细胞5×105~1×106cell 制为细胞颗粒。
(2-2)每一反应,在Nucleofector SE solution 16.4μl中加入了Supplement 3.6μl,在共计20μl的Nucleofector solution中悬浮了细胞颗粒。
(2-3)将TCRα基因靶用或者TCRβ基因靶用TALEN mRNA对分别添加了各10μg。
(2-4)使用Amaxa 4D核酸检测仪(Amaxa 4D-Nucleofector)(程序: CL-120),进行了核转染(Nucleofection)。
[内源性TCR去除的确认]
确认了:在向Jurkat细胞中导入TALEN mRNA之后,由FACS确认的CD3 阴性级分出现。确认了已分选CD3阴性级分的细胞在FACS中TCR(内源性) 也呈阴性。由FACS获得的CD3的表达强度通过FACS解析软件(Flow Jo)进行了解析。
进而,针对所出现的CD3/TCR阴性级分是否为因导入TALEN而获得的,通过T7Endonuclease I(T7E1)测定来确认切断断片的存在。
[T7Endonuclease I测定]
(1)使用所提取的基因组DNA来进行了PCR。PCR在最终浓度1×缓冲液、200μM的dNTP、0.4μM的引物、2.5~5ng的DNA、Excellent Taq HS(APRO Science)的反应混合物中,在94℃下10分钟之后,将94℃下30秒钟、55℃下30秒钟、72℃下1分钟进行30个循环,进而在72℃下反应了5分钟。
(2)引物序列为如下所示。
[化8]
Figure BDA0002529233550000811
(自上起对应于序列号64~69)
(3)在1%琼脂糖(agarose)凝胶中进行电泳,使用凝胶提取试剂盒(GelExtraction kit,QIAGEN)提取了DNA。
(4)将所提取的DNA 200~250ng在95℃下加热5分钟之后,返回室温再次进行了退火。
(5)加入T7 Endonuclease I,在37℃下处理了30分钟。然后,在2%凝胶中电泳并进行了确认。
(结果)
结果示于图3中。可理解的是,通过将各个TCR基因作为靶的基因组编辑,敲除了各内源性TCR基因。并且,在图4中,示出T7E1测定的结果,从图4 理解到,TCR基因的敲除是利用基因组编辑进行的。
(实施例3:TCR的导入)
(概要)
在本实施例中证实:使用半胱氨酸变异TCR导入载体,能够使TCR基因在T细胞中表达且不产生错配。另外,证实了:将TCR基因的导入与实施例2 中已经证实的内源性TCR基因的去除一并进行,可制备仅表达导入TCR的T 细胞。
(材料及方法)
(1)用CD3/28珠粒刺激T细胞,在X-VIVO20+10%AB血清(serum) +2mmol/l L-谷氨酰胺+1%青霉素/链霉素中培养了3天。
(2)使用Amaxa 4D-Nucleofector,按照以下顺序将TCRα-L-TALEN mRNA 和TCRα-R-TALEN mRNA导入了培养T细胞(P3Primary Cell 4D-NucleofectorTM X Kit S)。
(2-1)将T细胞5×105~1×106cell通过离心(400G,10分钟,室温)制成细胞颗粒。
(2-2)每一反应,在Nucleofector P3solution 16.4μl中加入Supplement 3.6μl,在共计20μl的Nucleofector solution中悬浮了细胞颗粒。
(2-3)将TCRα-L-TALEN mRNA、TCRα-R-TALEN mRNA分别各添加了 10μg。
(2-4)进行了Nuceofection(程序:EO-115)。
(2-5)再次继续培养。
(2-6)核转染(Nucleofection)3天后,通过基于流式细胞术的CD3及TCRα或β的表达丧失,确认了TCR基因的切断效率。
(3)通过磁性分选或者FACS(AriaII)回收了CD3阴性级分。
(4)根据以下详述的顺序,用逆转录病毒载体向(3)获得的CD3阴性T 细胞中导入了目标TCR基因。
(5)第2天用FACS确认了出现TCR阳性CD3阳性的情况。
(6)通过磁性分选或者FACS(AriaII)回收了CD3阳性级分。
(7)采用与(2)相同方法在由(6)获得的CD3阳性T细胞中导入了 TCRβ3-L-TALENmRNA及TCRβ3-R-TALEN mRNA。
(8)通过磁性分选或者FACS(AriaII)回收了CD3阴性级分。
(9)再次根据相同顺序,用逆转录病毒载体向由(8)获得的CD3阴性T 细胞中导入了目标TCR基因。
(10)确认了出现CD3阳性级分,通过磁性分选或者FACS(AriaII)回收。
[向TCR缺陷T细胞导入所期望的TCR]
上述顺序中的TCR基因的导入以如下顺序进行。
第1天:
(1)将PLAT-GP散在10cm培养皿中,并进行了70%的融合。
(2)在1.4ml的OPTI-MEMI中加入10μg的载体,5μg的VSV-G,在室温下静置了5分钟。
(3)在1.4ml的OPTI-MEMI中加入50μl的Lipofectamine2000,在室温下静置了5分钟。
(4)混合上述的(2)和(3),在室温下静置了20分钟。
(5)将(4)的混合液加入PLAT-GP的培养液中,并培养了48小时。
第4天-1:
(1)从PLAT-GP回收上清液,进行了离心(1500rpm×5min,4℃)。
(2)使上清液通过0.45μM过滤器并进行了离心(6000G×16hr,4℃)。
第4天-2:
将培养中的TCR缺陷T细胞分注至24孔板中,使得5×105/well。
第5天:
(1)将第4天-1(2)的离心管的上清液除去,将颗粒悬浮于500μl的 X-VIVO20,制备成病毒液。
(2)将病毒液加入前一天已分注的TCR缺陷细胞的培养基中,进行了离心(2000rpm×30min,32℃)之后,继续进行24小时的培养。次日,根据活细胞中的GFP阳性细胞(流式细胞术)的比率,确认了感染效率。
[TCR基因克隆至pMXs-IRES-GFP载体]
(1)将pMXs-IRES-GFP载体用BamHI和NotI切断。
(2)设计引物使得在各结合部形成重叠(overlap)序列。具体如下。
[化9]
Vα:5’-TGGAGGAGAACCCTGGACCT-3’
5’-GGTGAATAGGCAGACAGACTT-3’
Cα:5’-GAGACTCTAAATCCAGTGAC-3’
5’-GGGGGCGGAATTTACGTACCGGCCGCTCAGCTGCT-3’
Vβ:5’-TGCCGGATCTAGCTAGTTAATTAAGGATCCGAATTCCTGCAGG-3’
5’-TTCACCCACCAGCTCAGCTC-3’
Cβ:5’-TTCACCCACCAGCTCAGCTC-3’
5’-AGGTCCAGGGTTCTCCTCCA-3’
(自上起依序对应于序列号70~77)
(3)使用(2)的引物利用PCR扩增了各片段。
(4)对从(1)和(3)获得的片段进行纯化。
将(1)的片段(载体)进行纯化,使得成为25ng/μl。
将(2)的片段(Vα、Cα、Vβ、Cβ)进行纯化,使得分别成为10ng/μl。
(5)进行了吉布森组装反应(Gibson assembly reaction)(NEB,Gibson AssemblyMaster Mix,如制造商说明书所示)。在5μl的Gibson Assembly Master Mix加入载体1μl、Vα 0.75μl、Vβ 0.75μl、Cα 0.75μl、Cβ 0.75μl,在50℃下反应1小时。
(6)将(5)的反应液稀释4倍,转型为感受态细胞(JM109)。
(7)利用Miniprep纯化DNA,通过测序进行了确认。
[导入载体]
作为导入载体,使用pMXs-IRES-GFP逆转录病毒载体(Retroviral Vector) (CellBiolabs,Inc.)作为骨架。载体的示意图在图5示出。将欲导入的TCRβ链的V区域、TCRβ链的恒定区(Cβ)、P2A序列、欲导入的TCRα链的V区域、TCRα链的恒定区(Cα)依序掺入pMXs-IRES-GFP Retroviral Vector的导入序列部分进行使用。对于这种载体的制备,记载于Incorporation of Transmembrane Hydrophobic Mutations in the TCR Enhance ItsSurface Expression and T Cell Functional Avidity Astar Haga-Friedman,MiryamHorovitz-Fried and Cyrille J.Cohen J Immunol 2012;188:5538-5546;Prepublishedonline 27 April 2012。
参照Enhanced antitumor activity of T cells engineered to express T-cell receptors with a second disulfide bond.Cohen CJ,Li YF,El-Gamil M,RobbinsPF, Rosenberg SA,Morgan RA.Cancer Res.2007Apr 15;67(8):3898-903.,向C区域导入附加的Cys并附加了一个S-S键。进而,参考Incorporation of TransmembraneHydrophobic Mutations in the TCR Enhance Its Surface Expression and T CellFunctional Avidity Astar Haga-Friedman,Miryam Horovitz-Fried and Cyrille J.Cohen J Immunol 2012;188:5538-5546;Prepublished online 27 April 2012,向膜贯通区域导入了对疏水性氨基酸的变异。
作为自身切断性的连接子,使用了P2A序列(J.H.Kim,S.R.Lee,L.H.Li,H.J.Park,J.H.Park,K.Y.Lee,et al.,High cleavage efficiency of a 2A peptide derivedfrom porcine teschovirus-1in human cell lines,zebrafish and mice,PLoS One.6(2011)1-8.doi:10.1371/joumal.pone.0018556.)
此外,使用的TCRα链及TCRβ链的恒定区的氨基酸序列如下所示。
[化10]
>hTCR_alpha_const
XIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDF KSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQN LSVIGFRILLLKVAGFNLLMTLRLWSS(序列号78)
>TCR_hum_Cbeta_1
EDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGV STDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQD RAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATHYEILLGKATLYAVLVSALVLMA MVKRKDF(序列号79)
[导入TCR基因]
使用hTEC10,从在健康个体外周血中所存在的CMVpp65QYD抗原特异性CD8+T细胞取得QYD特异性TCRαβ基因,并用作导入基因。
[Treg的抗原特异性]
测定已导入的T细胞针对QYD抗原的结合性,并确认了TCR的导入。通过QYD四聚体染色,确认了Treg(QYD-Treg)的抗原特异性。
(结果)
对调节性T细胞进行导入的结果示于图5及图6中。由流式细胞术分析的结果可理解,在修饰后的T细胞中仅表达已导入的TCR。
测定对QYD的结合性的结果示于图8中。与多克隆的Treg相比,在导入了QYD特异性TCR的Treg中,对QYD的结合性提高。
另外,针对细胞毒性T细胞同样地进行了TCR导入,其结果示于图9中。可理解的是,能够可在不受内源性TCR的干扰的情况下替换TCR。
通过TCR-特异性TALEN敲低内源性TCR,以及通过Cys-TCR导入基因,由此能够建立高亲和性的CMV pp65NLV特异性TCR表达T细胞。
(实施例4:所制备的抗原特异性调节性T细胞的性质)
(概要)
对根据实施例3的方法所制备的抗原特异性调节性T细胞的性质,如下进行评价。
[Treg固有特性的保持的确认]
将根据实施例3的方法所制备的抗原特异性调节性T细胞、多克隆调节性 T细胞及TCR敲除调节性T细胞以及对照(CD25为阴性的CD4阳性T细胞级分),用以下抗体染色,并用FACS测定,用FACS解析软件(flow jo)解析荧光强度,并验证了取代TCR的Treg与多克隆Treg(TCR取代前)的性质是否存在差异。
抗体:抗人CD25抗体,抗人CD127抗体,抗人FoxP3抗体,抗人CTLA-4 抗体,抗人HELIOS抗体。
将结果示于图10及图11中。在这些细胞的表面标志物表达中无显著差异,可知在本发明的TCR去除及TCR导入中调节性T细胞中保持固有特性。
[针对抗原刺激的增殖]
针对在实施例3中通过TCR取代而获得的Treg(QYD-Treg)是否识别QYD 肽抗原并增殖,进行了确认。更详细地如下所示。
(1)通过离心,在1ml的PBS中使QYD-Treg颗粒悬浮。
(2)加入1μL的Cell trace violet(Invitrogen,CellTrace Violet CellProliferation Kit,cat#C34557),在37℃下在暗处静置20分钟。
(3)用PBS清洗两次(300G,10min,室温)。
(4)在T细胞培养基(X-VIVO20+10%AB血清+2mmol/l L-谷氨酰胺+ 1%青霉素/链霉素)中,混合经肽脉冲的抗原呈递细胞和用cell trace volet标记的QYD-Treg的细胞,使得细胞数比率为1∶1,并在96孔板内培养了5天。
(5)用FACS确认了Cell trace violet的荧光强度减弱、QYD-Treg分裂。
结果示于图12及图13中。可理解的是,经5天的培养之后,Cell trace violet 的荧光强度减弱,QYD-Treg针对通过抗原呈递细胞的抗原刺激进行应答并增殖。该增殖在未进行QYD刺激的组、及多克隆调节性T细胞的组中未观察到,证实了:通过本发明的方法所制备的调节性T细胞对抗原的特异性反应性高。
[利用抗原特异性调节性T细胞的抗原特异性效应T细胞抑制]
针对通过TCR取代而获得的Treg(QYD-Treg)是否抑制QYD-Teff的抗原特异性增殖,进行了确认。更详细地如下所示。
A.抗原呈递细胞的分离(CD4阴性CD8阴性细胞的分离)
Miltenyi CD8微珠、使用人(130-045-201),Miltenyi CD4+T Cell隔离试剂盒、使用人(130-096-533):
(1)用Ficoll-Paque PREMIUM从外周血50mL分离PBMCs,通过离心 (400G,10min,室温)制备了细胞颗粒。
(2)使颗粒悬浮于80μL的MACS缓冲液中,并加入20μL的CD8微珠。
(3)在4℃下静置15分钟。
(4)用MACS缓冲液清洗(300G,10min,室温)。
(5)以共计成为500μL的方式加入MACS缓冲液,通过磁性分离(Magneticseparation)回收CD8-级分,通过离心(400G,10min,室温),制成细胞颗粒。
(6)使颗粒悬浮于40μL的MACS缓冲液,并加入10μL的T Cell生物素-抗体混合物(Cocktail)。
(7)在4℃下静置5分钟。
(8)添加了30μL的MACS缓冲液和20μL的CD4+T Cell MicroBead Cocktail。
(9)4℃下静置10分钟。
(10)以共计成为500μL的方式加入MACS缓冲液,通过磁性分离,回收CD4-级分(成为CD4-8-T细胞)。
B.对抗原呈递细胞进行肽脉冲
(1)使在A.中所回收的CD4-8-细胞悬浮于1ml的X-XIVO20。
(2)加入肽(此处为QYDPVAALF:QYD(序列号92))使其为1μM。
(3)在室温下静置2小时。
(4)照射了35Gy的γ线。
C.Treg抑制试验(Treg suppression assay)
(1)通过离心将基因导入了QYD-TCR的CD8+T cell(QYD-Teff)颗粒悬浮于1ml的PBS。
(2)加入1μL的Cell trace violet(Invitrogen,CellTrace Violet CellProliferation Kit,cat#C34557),在37℃下在暗处静置20分钟。
(3)用PBS清洗两次(300G,10min,室温)。
(4)在T细胞培养基(X-VIVO20+10%AB血清+2mmol/l L-谷氨酰胺+1%青霉素/链霉素)中,以在B.步骤中进行了肽脉冲的抗原呈递细胞与用cell trace violet标记的QYD-Teff的细胞数比率为2∶1的方式进行混合,散在96孔板上。
(5)在C.(4)的各孔中调整Treg(导入了所期望的TCR的Treg)的细胞数,以与CD8+Tcell之间的细胞数比率成为16∶1、8∶1、4∶1、2∶1、1∶ 1的方式添加。
(6)在第5天、第7天,用FACS测定在各细胞比率的条件下的cell trace violet的荧光强度,确认了QYD-Teff的增殖抑制。
将结果示于图14及图15。与多克隆调节性T细胞相比,抗原特异性调节性T细胞示出显著高的效应T细胞的增殖抑制。
(实施例5:体外(in vitro)利用抗原特异性调节性T细胞的免疫抑制)
(概要)
本实施例的目的在于,在体外证实根据本发明的方法制备的抗原特异性调节性T细胞具有应用于自身免疫疾病的可能性。
皮肤色素细胞的自身抗原即MART-1抗原,是成为寻常性白癜风(皮肤科领域的难治性自身免疫疾病)的原因的靶抗原。另外,健康个体外周血中也存在识别该抗原的T细胞。
(材料及方法)
(1)使用hTEC10,从健康个体的试样中克隆了MART-1特异性TCRαβ对基因。
(2)通过铂TALEN,编辑调节性T细胞的TCR基因组,排除内源性TCR 的表达。
(3)使基因组编辑后的调节性T细胞增殖。
(4)向所增殖的调节性T细胞导入克隆的TCRαβ对基因。
(5)针对通过与导入了TCR基因的调节性T细胞进行共培养而引起的 MART-1抗原特异性效应T细胞等对MART-1抗原的应答性变化,进行评价。
(结果)
使用hTEC10,可从两个健康个体样品克隆18种以上的MART-1特异性 TCRαβ对基因。针对这些MART-1特异性TCR对MART-1的结合性,进行评价,并选择功能性最强的TCR,同时可制备导入了该TCR的基因的MART-1 抗原特异性Treg,上述的TCR取代Treg抑制对MART-1抗原(为自身免疫疾病的模型抗原)的免疫应答。
(实施例6:Teff→Treg对自身免疫疾病小鼠模型的有效性的研究)
(概要)
本实施例的目的在于,证实在体内(in vivo)抗原特异性调节性T细胞应用于自身免疫疾病的可能性,在动物模型中呈现出由所制备的抗原特异性调节性T细胞产生的免疫抑制。本实施例的概要示于图16中。
(材料及方法)
利用以下的小鼠及自身抗原,验证应用于以下模型疾病的可能性。模型小鼠:NOD(非肥胖糖尿病(non-obese diabetic))小鼠
模型自身抗原:GAD65
模型疾病:I型糖尿病
如下进行了动物实验。
(1)对7日龄的NOD小鼠在出生后第7天、第9天、第11天经鼻给与来自GAD65的肽抗原p546(30μg)。
(2)从通过(1)的方法免疫的4周龄的雌性小鼠,使用H-2Kd/p546四聚体,以流式细胞术分离p546反应性效应CD8+T细胞(p546-Teff)。
(3)用下一代测序仪全面鉴定p546-Teff的TRAV、TRBV,确认了存在高频率克隆型之后,通过单个细胞克隆进行配对鉴定。
(4)使用逆转录病毒载体,将由上述(1)-(3)的过程所鉴定的p546抗原反应性TCR(p546-TCReff)导入至缺乏内源性TCR表达的小鼠T细胞株中,并确定它们的功能层次。
(5)通过珠柱法,从4周龄的雄性NOD小鼠的脾脏·淋巴结·外周血分离CD4+CD25+调节性T细胞,用铂TALEN敲除TCR。
(6)将由(4)的过程获得的高功能性p546-Teff-TCR的候选导入敲除了 TCR的CD4+CD25+调节性T细胞中(p546-Teff-TCR表达Treg)。
(7)导入了Mock载体的Treg及导入了p546-TCReff的Treg在存在抗 CD3/CD28抗体及IL-2的条件下扩增,并输注至引发I型糖尿病的NOD小鼠,比较是否改善了胰腺β细胞损伤及糖耐量损伤。
(结果)
在输注了已导入Mock载体的Treg的NOD小鼠中,没有发现胰腺β细胞损伤及糖耐量损伤的改善,但在输注了已导入p546-TCReff的Treg的NOD小鼠中发现了胰腺β细胞损伤及糖耐量损伤的改善。
(实施例6-2:小鼠TCR的切断)
(概要)
制备铂TALEN用于小鼠TCR切断,通过使用报告质粒的测定法(SSA测定)评价了切断活性。
(材料及方法)
制备了3种铂TALEN(TRA2-TALEN、TRB1-TALEN、TRB2-TALEN)用于切断小鼠TCR。
小鼠TRA2-TALEN、小鼠TRB1-TALEN、小鼠TRB2-TALEN分别设计成在小鼠的TRA基因Cα2区域、TRB基因Cβ1区域、TRB基因Cβ2区域内包含切断位点。各靶序列如下。
小鼠TRA2-TALEN:左侧TCTGCCTGTTCACCGACT(序列号130)及右侧AATGTGCCAAAACCATGGA(序列号131),
小鼠TRB1―TALEN:左侧TGACTCCACCCAAGGTCT(序列号132)及右侧AAAAGCAGAGAYYGCAAA(序列号133)
小鼠TRB2-TALEN:左侧TGTGCTTGGCCAGGGGCT(序列号134)及右侧GGAGCTGAGCTGGTGGGTGA(序列号135)
铂TALEN的制备顺序依据“实施例2:内源性TCR的去除”中的“铂TALEN 的制备”。
通过记载于以下URL的方法,使用人胚胎肾脏衍生细胞株HEK293T进行SSA测定(Sakuma T,et al.Genes to Cells 2013)。 http://www.mls.sci.hiroshima-u.ac.jp/smg/genome_editing/documents/6-module.pdf
(结果)
将结果示于图28中。可知,当将锌指核酸酶(Zinc finger nuclease)对照组(pSTL-ZFA36/ZFA36)的切断活性设为1时,小鼠TRA2-TALEN、小鼠 TRB1-TALEN、小鼠TRB2-TALEN的靶切断位点的活性分别为3.09倍、3.79 倍、3.41倍。pSTL为ZFA36的阴性对照组,TRA2、TRB1、TRB2分别为在 TALEN不存在下的仅报告的阴性对照,TRA2-TALEN/ZFA36、TRB1-TALEN/ZFA36、TRB2-TALEN/ZFA36分别为报告基因为ZFA36时的阴性对照。
(实施例7:产品化例)
为了用于本发明的方法,提供包含一个或多个以下成分的产品。
用于编辑TCR基因的手段:以用于编辑TCR基因的组合物等的形式提供。利用将TCR基因靶化的基因组编辑酶(TALEN,CRISPR/Cas9,ZFN)。一同提供靶化位点和功能性结构域。或者,单独提供靶化位点和功能性结构域。以核酸的形式提供基因组编辑酶。或者,以多肽的形式提供基因组编辑酶。以 mRNA的形式提供基因组编辑酶。与导入用载体一同提供基因组编辑酶。
确认内源性TCR基因变异的手段:向内源性TCR基因提供特异性PCR用引物。可确认,在进行基因组编辑之前,能够在靶化的位点不存在变异而进行特异性编辑。
确认内源性TCR基因去除的手段:提供用于测定已去除内源性TCR时的变化的抗体。提供抗CD3抗体或抗TCR抗体。提供已标记的抗体。
导入外源性TCR的手段:提供用于导入TCR的载体等。使用如Venus那样地掺入了细胞毒性小的荧光色素的慢病毒载体、或利用转座子的Sleeping Beauty等的非病毒系载体。
检测已导入基因的细胞的手段:提供用于测定导入有内源性TCR时的变化的抗体。提供抗CD3抗体或抗TCR抗体。提供已标记的抗体。
(实施例8:表达癌症抗原特异性TCR的T细胞的制备)
(概要)
在本实施例中,根据本说明书记载的方法,制备表达癌症抗原特异性TCR 的T细胞,并证实了该细胞的细胞杀伤活性。
(方法及材料)
作为靶表位,选择了HLA-A*0201-restricted NY-ESO-1157-165 (SLLMWITQC)(序列号115)。作为对该表位具有特异性的TCR,在可变区域的各片段中使用具有以下结构的1G4TCR。
表11
Figure BDA0002529233550000931
[使用pMXs载体的1G4TCR导入用载体的制备]
(1)准备了1G4TCR的Vα盒、Vβ盒(各碱基序列如下)。
[化11]
Vα盒
TGGAGGAGAACCCTGGACCTATGGAGACCCTCTTGGGCCTGCTGATCCTGTGGCTGCAGCTGCAGTGGGTGAGCAGCAAGCAGGAGGTGACCCAGATTCCTGCCGCCCTGAGCGTGCCTGAAGGCGAGAATCTGGT GCTGAACTGCAGCTTCACCGACAGCGCCATCTACAACCTGCAGTGGTTCAGACAGGACCCCGGCAAGG GCCTGACCAGCCTGCTGCTGATCCAGAGCAGCCAGAGAGAGCAGACCAGCGGCAGACTGAACGCCAGC CTGGACAAGAGCAGCGGCAGAAGCACCCTGTATATCGCCGCCAGCCAGCCAGGCGATAGCGCCACCTA CCTGTGTGCCGTGAGACCAACCAGCGGCGGCAGCTATATCCCCACCTTTGGCAGAGGCACCAGCCTGA TCGTGCACCCCTACATCCAGAACCCCGACCCCGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGAC AAGTCTGTCTGCCTATTCACC(序列号118)
Vβ盒
TGCCGGATCTAGCTAGTTAATTAAGGATCCGAATTCCTGCAGGATGAGCATCGGCCTGCTGTGTTGTGCCGCCCTGTCTCTGCTGTGGGCTGGACCAGTGAATGCCGGCGTGACACAGACCCCTAAGTTCCAGGTGCT GAAGACCGGCCAGAGCATGACCCTGCAGTGCGCCCAGGACATGAACCACGAGTACATGAGCTGGTACAG ACAGGACCCCGGCATGGGCCTGAGACTGATCCACTACAGCGTGGGCGCCGGAATCACAGACCAGGGCGA GGTGCCAAACGGCTACAACGTGAGCAGAAGCACCACCGAGGATTTCCCACTGAGACTGCTGTCTGCCGC CCCAAGCCAGACCAGCGTGTACTTTTGCGCCAGCAGCTACGTGGGCAACACCGGCGAGCTGTTCTTCGG CGAGGGCAGCAGACTGACCGTGCTGGAGGACCTGAAGAACGTGTTCCCTCCTGAGGTGGCCGTGTTTGA GCCAAGCGAGGCCGAGATCAGCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCC CGACCACGTGGAGCTGAGCTGGTGGGTGAA(序列号119)
(2)用BamHI和NotI切断pMXs-IRES-GFP载体。
(3)以在各结合部形成重叠(overlap)序列的方式设计引物。具体如下。
[化12]
Vα:5’-TGGAGGAGAACCCTGGACCT-3’
5’-GGTGAATAGGCAGACAGACTT-3’
Cα:5’-GAGACTCTAAATCCAGTGAC-3’
5’-GGGGGCGGAATTTACGTAGCGGCCGCTCAGCTGCT-3’
Vβ:5’-TGCCGGATCTAGCTAGTTAATTAAGGATCCGAATTCCTGCAGG-3’
5’-TTCACCCACCAGCTCAGCTC-3’
Cβ:5’-TTCACCCACCAGCTCAGCTC-3’
5’-AGGTCCAGGGTTCTCCTCCA-3’
(自上起对应于序列号70~77)
(4)使用(3)的引物,并用PCR扩增了各片段。
(5)纯化由(2)和(4)获得的片段。
将(2)的片段(载体)进行纯化,使得成为25ng/μl。
将(4)的片段(Vα、Cα、Vβ、Cβ)进行纯化,使其分别为10ng/μl。
(6)进行了吉布森组装反应(Gibson assembly reaction)(NEB,Gibson AssemblyMaster Mix,如制造商说明书所示)。向5μl的Gibson Assembly Master Mix中加入载体1μl、Vα 0.75μl、Vβ 0.75μl、Cα 0.75μl、Cβ 0.75μl,在50℃下1 小时。
(7)将(6)的反应液稀释4倍,转型为感受态细胞(JM109)。
(8)利用Miniprep纯化DNA,通过测序进行确认。
[向TCR-null Jurkat细胞及原代T细胞(primary T细胞)导入1G4TCR]
按照如下顺序,向细胞进行了1G4TCR的导入。基于Miyama et al.Sci Rep 2017中记载的顺序,使用CRISPR系制备了TCR-null Jurkat细胞。Primary T 细胞使用了从供体外周血分离的T细胞。此外,有关TCR-null Jurkat细胞的制备过程中的CD3表达变化示于图21。
第1天:
(1)将PLAT-GP撒在10cm培养皿中,并进行了70%的融合。
(2)在1.4ml的OPTI-MEMI中加入10μg的pMXs-IRES-1G4载体,5μg 的VSV-G,在室温下静置了5分钟。
(3)在1.4ml的OPTI-MEMI中加入50μl的Lipofectamine2000,在室温下静置了5分钟。
(4)混合上述的(2)和(3),在室温下静置了20分钟。
(5)将(4)的混合液加入PLAT-GP的培养液中,并培养了48小时。
第4天-1:
(1)从PLAT-GP回收上清液,进行了离心(1500rpm×5min,4℃)。
(2)使上清液通过0.45μM过滤器,进一步进行离心(6000G×16hr,4℃)。
第4天-2:
将培养中的TCR-null Jurkat细胞或者primary T细胞以5×105/well的方式分注到24孔板中。
第5天:
(1)将第4天-1(2)的离心管的上清液去除,使颗粒悬浮于500μl的 X-VIVO20,制备成病毒液。
(2)将病毒液加入前一天已分注的TCR-null Jurkat细胞或者primary T细胞的培养基中,进行了离心(2000rpm×30min,32℃)之后,继续进行24小时培养。次日,根据活细胞中的GFP阳性细胞(流式细胞术)的比率确认了感染效率。
[使用B-LCL(B-lymphoblastoid cell lines)的NY-ESO-1SLL特异性TCR-T 的杀灭试验(killing assay)]
根据以下示出的顺序,验证了所制备的表达癌症抗原特异性TCR的T细胞的细胞杀伤活性。
B-LCL(靶细胞)的准备:
在24孔板中准备B-LCL 2×106,加入50μl的51Cr和NY-ESO-1表位肽 (SLLMWITQC(序列号115))(最终浓度1ng/μl),培养了1小时。
通过RPMI1640清洗两次(300G,10min,4℃)。
将SLL肽添加B-LCL调整为1×104/100μl的RPMI1640。
相同地,将未添加表位肽的B-LCL 1×104/100μl的RPMI1640调整为对照组用。
NY-ESO-1SLL特异性TCR-T(效应细胞)及阳性对照组、阴性对照组的准备:
针对培养中的NY-ESO-1SLL特异性TCR-T,以最终效应(NY-ESO-1SLL 特异性TCR-T):靶(B-LCL)比成为30∶1、10∶1、3∶1、1∶1的方式,调整细胞数(3×105/100μl的RPMI1640,1×105/100μl的RPMI1640,3×104/100μl 的RPMI1640,1×104/100μl的RPMI1640),分注于96孔板中。
作为阳性对照组,将100μl的Triton X-100分注于96孔板中。
作为阴性对照组,将100μl的RPMI1640分注于96孔板中。
铬-51释放分析(Chromium-51 release assay):
在2.中所准备的96孔板的各孔中分注了100μl的在1.中所准备的B-LCL,培养了4小时。
从各孔取100μl的上清液移至微管,用伽玛计数器计算了释放在各孔的上清液中的51Cr的伽玛值。
通过计算式{(各孔的伽玛值)-(阴性对照组的伽玛值)}/(阳性对照组的伽玛值),计算各孔的杀细胞效果相对于阳性对照组的比率(%lysis)并图形化。
(结果)
对TCR-null Jurkat细胞及primary T细胞的1G4TCR的导入结果,分别示于图22及图23中。在图22的左图中,所导入的TCR的表达效率为46.2%,在图22的右图中,具有对SLL肽四聚体的结合能力的TCR导入细胞的比率为 46.8%。这两种方法中获得了同样的效率,由此表示,导入TCR-null Jurkat细胞并表达的TCR的几乎全部识别SLL肽,即,不发生错配地进行表达。这表明,相对于进行了基因组编辑的T细胞,pMX载体为适应性。对于Primary T细胞,为6.28%的导入效率(图23)。
阴性对照组中在所有的浓度比率下均未观察到细胞杀伤活性(来自细胞的51Cr的释放),但制备的癌症抗原特异性TCR表达T细胞显示出浓度依赖性的细胞杀伤活性(图26)。
(实施例9:利用TAL-PITCh法的TCR取代)
(概要)
本发明的修饰T细胞可通过TAL-PITCh法制备,不使用病毒载体。
(材料及方法)
使用TAL-PITCh法的内在性TCR缺陷NY-ESO-1特异性T细胞的制备
按照以下记载的顺序,制备了内在性TCR缺陷NY-ESO-1特异性T细胞。
1.从铂TALEN合成mRNA:
(1)将用于切断TRA或者TRB基因的Left(L)-TALEN和Right(R) -TALEN的质粒利用SmaI在30℃下处理2小时。
(2)用蛋白酶(Proteinase)K在50℃下处理了20分钟之后,用QIAGEN PCR纯化试剂盒(QIAGEN PCR Purification Kit)进行了纯化。
(3)通过mMESSAGE MACHINE T7 Kit(Life technologies),接着通过 poly(A)Tailing Kit(Life technologies)合成mRNA,并用LiCl沉淀法进行了纯化 (如制造商说明书所示)。
2.TAL-PITCh载体的设计:
TAL-PITCh载体如下设计,即,利用TRA基因切断用的Left(L)-TALEN 和Right(R)-TALEN来切断导入基因的两端,通过微同源介导的末端连接 (MMEJ)修复,使得目标基因掺入TRA基因切断位点(图24;用正方形包围的部分显示了微同源序列)。在向TRA基因切断位点掺入目标基因之后,即使在两端存在TALEN结合位点,但不存在直到切断位点的充分的空间,因此不引起DNA双链切断(DSB)(图25)。对于TAL-PITCh载体,为了用流式细胞术确认TRA基因的两等位基因被切断,准备掺入EGFP的载体和掺入mKate2 的载体(图24及图25中示出掺入EGFP的载体)。当临床应用时,作为选择标志物,制备将EGFP、mKate2分别替换为CD20、CD34的载体。
3.使用铂TALEN mRNA的TRB基因切断T细胞的制备:
(1)用CD3/28珠粒刺激外周血T细胞,在X-VIVO20+10%AB血清+ 2mmol/l L-谷氨酰胺+1%青霉素/链霉素中培养3天。
(2)使用Amaxa 4D-核酸检测仪(Amaxa 4D-Nucleofector)将 TCRβ-L-TALEN mRNA和TCRβ-R-TALEN mRNA导入培养T细胞(P3Primary Cell 4D-NucleofectorTM X Kit S)。
1)将5×105~1×106cell的T细胞通过离心(400G,10分钟,室温)制成细胞颗粒。
2)每一反应向16.4μl的Nucleofector P3solution中加入3.6μl的Supplement,使细胞颗粒悬浮于共计20μl的Nucleofector solution中。
3)分别添加TCRβ-L-TALEN mRNA、TCRβ-R-TALEN mRNA各10μg。
4)进行Nuceofection(程序:EO-115)。
5)再次继续培养。
6)核转染3天后,通过利用流式细胞术的CD3及TCRαβ的表达丧失来确认TCR基因的切断效率。
(3)通过磁性分选或者FACS(AriaII)回收CD3阴性级分。
4.使用TAL-PITCh法的向TRA基因切断位点的NY-ESO-1特异性TCR(1G4)的导入
(1)用CD3/28珠粒刺激在2.中获得的TRB基因切断T细胞,在X-VIVO20 +10%AB血清+2mmol/l L-谷氨酰胺+1%青霉素/链霉素中培养3天。
(2)使用Amaxa 4D-Nucleofector,将TCRα-L-TALEN mRNA和 TCRα-R-TALEN mRNA及两种TAL-PITCh载体(1G4-EGFP和1G4-mKate2) 导入培养T细胞(P3Primary Cell 4D-NucleofectorTM X Kit S)。
1)将5×105~1×106cell的T细胞通过离心(400G,10分钟,室温)制成细胞颗粒。
2)每一反应在16.4μl的Nucleofector P3 solution中加入3.6μl的Supplement,使细胞颗粒悬浮于共计20μl的Nucleofector solution中。
3)分别添加TCRα-L-TALEN mRNA、TCRα-R-TALEN mRNA、1G4-EGFP TAL-PITCh载体及1G4-mKate2 TAL-PITCh载体各10μg。
4)进行Nuceofection(程序:EO-115)。
5)再次继续培养。
6)核转染3天后,通过利用流式细胞术的EGFP及mKate2的表达确认 1G4-EGFP及1G4-mKate2的导入效率。
(3)将EGFP和mKate2均为阳性的级分,通过FACS(AriaII)回收。
(结果)
如图27所示,可获得表达1G4TCR的细胞群。可理解的是,通过TAL-PITCh 法,能够在不使用病毒载体的情况下制备内在性TCR缺陷NY-ESO-1特异性T 细胞。通过导入所期望的外源性TCR替换NY-ESO-1特异性TCR,可在不使用病毒载体的情况下制备表达具有所期望的抗原特异性的TCR的内在性TCR缺陷T细胞。
(实施例10:作出细胞的全基因组测序)
根据以下示出的方法,通过有限稀释法等克隆了所制备细胞之后,可进行全基因组测序以评价细胞的特性。
[利用QIAamp DNA Mini Kit的DNA提取](如制造商说明书)
1.将20μl的QIAGEN Protease移液至1.5ml的微管的底部。
2.向该微管中添加悬浮于200μl PBS的1×105个T细胞。
3.向样品中添加200μl的缓冲液AL。
4.在56℃下孵育10分钟。
5.将1.5ml微管进行数秒钟Spin-down处理,收集附于盖内侧的溶液。
6.在样品中添加乙醇200μl,旋涡混合15秒钟之后,对1.5ml微管进行数秒钟Spin-down处理,收集附于盖内侧的溶液。
7.将步骤6的混合液用于QIAamp微型自旋柱(QIAamp Mini Spin Column)。盖上盖以6000×g离心分离1分钟。将QIAamp微型自旋柱移至新的2ml收集管,丢弃盛有滤液的收集管。
8.打开QIAamp微型自旋柱,添加500μl的缓冲液AW1。关闭盖以6000 ×g离心分离1分钟。将QIAamp微型自旋柱移至新的2ml收集管,丢弃盛有滤液的收集管。
9.打开QIAamp微型自旋柱,添加500μl的缓冲液AW2。关闭盖以20000 ×g离心分离3分钟。
10.将QIAamp微型自旋柱移至新的1.5ml微管,丢弃盛有滤液的收集管。打开QIAamp微型自旋柱,添加200μl的纯化水。室温(20℃)下培养1分钟之后,以6000×g离心分离1分钟,提取DNA。
[PCR免费库的制作和全基因组测序]
1.用Bioruptor Pico(Diagenode,Belgium)将1μg的高分子量DNA片段化处理为平均约300bp,使用Agilent Bioanalyzer(Agilent Technologies,USA) 确认处理后的状态。
2.对片段化后的DNA进行末端修复、A-尾化(A-tailing)及索引衔接子连接,并使用Agentcourt AMPure XP beads(Beckman Coulter,USA)进行纯化。
3.用Agilent Bioanalyzer(Agilent Technologies,USA)和Bio-Rad real timePCR system对调整后的DNA库的大小和浓度进行质量确认。
4.根据制造商的说明书,用HiSeq Xten(Illumina,USA)进行DNA库的测序,基于在Q30%以上且覆盖率30x的条件下获得的独特读段的序列,确定全基因组序列。
[注释]
如上所述,使用本发明的优选实施方式对本发明进行了例示,但应理解的是,本发明范围应仅由权利要求的保护范围来解释。应当注意,对于在本说明书中引用的专利、专利申请以及文献,应与其内容本身在本说明书中具体描述的程度相同地,作为本说明书的参考被引用。本发明要求于2017年10月10 日向日本专利局提交的日本特愿2017-197010以及于2018年9月7日向日本专利局提交的日本特愿2018-167954的优先权,它们的整体内容作为参考引用于本说明书中。
产业上的可利用性
本发明可用于T细胞的生物工程学的操作,并且可实现高功能性TCR基因导入T细胞疗法,且不会发生错配/脱靶。
序列表自由文本
序列号1:TALE DNA结合模块的氨基酸序列的示例
序列号2:HLA-A*02限制性CMVpp65肽
序列号3:HLA-A2-HIV
序列号4:BSL-18E引物
序列号5:P20EA引物
序列号6:P10EA引物
序列号7:CA1引物
序列号8:CA2引物
序列号9:CB1引物
序列号10:CB2引物
序列号11:HuVaF引物
序列号12:HuVbF引物
序列号13:B-P20EA引物
序列号14:MID1
序列号15:MID2
序列号16:MID3
序列号17:MID4
序列号18:MID5
序列号19:MID6
序列号20:MID7
序列号21:MID8
序列号22:MID10
序列号23:MID11
序列号24:MID15
序列号25:MID16
序列号26:MID17
序列号27:MID18
序列号28:MID19
序列号29:MID20
序列号30:MID21
序列号31:MID22
序列号32:MID23
序列号33:MID24
序列号34:A衔接子序列
序列号35:P22EA-ST1-R引物
序列号36:Tag-1引物
序列号37:Tag-2引物
序列号38:CA-ST1-R
序列号39:CB-ST1-R
序列号40:TSO Oligo
序列号41:TSO PCR引物
序列号42:SMART PCR引物
序列号43:TSO_TAG引物
序列号44:SMART_TAG引物
序列号45:Oligo珠粒中的SMART序列
序列号46:TALEN-TCR-alpha2_L19质粒全长
序列号47:TALEN-TCR-alpha2_R19质粒全长
序列号48:TALEN-TCR-beta1_L19质粒全长
序列号49:TALEN-TCR-beta1_R19质粒全长
序列号50:TALEN-TCR-beta3_L19质粒全长
序列号51:TALEN-TCR-beta3_R19质粒全长
序列号52:TALEN-TCR-alpha2_L19TALEN编码序列
序列号53:TALEN-TCR-alpha2_L19TALEN氨基酸序列
序列号54:TALEN-TCR-alpha2_R19TALEN编码序列
序列号55:TALEN-TCR-alpha2_R19TALEN氨基酸序列
序列号56:TALEN-TCR-beta1_L19TALEN编码序列
序列号57:TALEN-TCR-beta1_L19TALEN氨基酸序列
序列号58:TALEN-TCR-beta1_R19TALEN编码序列
序列号59:TALEN-TCR-beta1_R19TALEN氨基酸序列
序列号60:TALEN-TCR-beta3_L19TALEN编码序列
序列号61:TALEN-TCR-beta3_L19TALEN氨基酸序列
序列号62:TALEN-TCR-beta3_R19TALEN编码序列
序列号63:TALEN-TCR-beta3_R19TALEN氨基酸序列
序列号64:TCR-alpha2-f引物
序列号65:TCR-alpha2-r引物
序列号66:TCR-beta1-c1-f引物
序列号67:TCR-beta1-c1-r引物
序列号68:TCR-beta1-c2-f引物
序列号69:TCR-beta1-c2-r引物
序列号70:Vα克隆用正向引物
序列号71:Vα克隆用反向引物
序列号72:Cα克隆用正向引物
序列号73:Cα克隆用反向引物
序列号74:Vβ克隆用正向引物
序列号75:Vβ克隆用反向引物
序列号76:Cβ克隆用正向引物
序列号77:Cβ克隆用反向引物
序列号78:导入用TCRα恒定区
序列号79:导入用TCRβ恒定区
序列号80:α2L的靶序列
序列号81:α2R的靶序列
序列号82:β1L的靶序列
序列号83:β1R的靶序列
序列号84:β3L的靶序列
序列号85:β3R的靶序列
序列号86:TALEN_α2L结合结构域
序列号87:TALEN_α2R结合结构域
序列号88:TALEN_β1L结合结构域
序列号89:TALEN_β1R结合结构域
序列号90:TALEN_β3L结合结构域
序列号91:TALEN_β3R结合结构域
序列号92:QYD肽
序列号93~110:人TRA或TRB的CDR3序列的例
序列号111~113:铂TALEN的DNA结合模块的氨基酸序列的示例
序列号114:Zhang TALEN的DNA结合模块的氨基酸序列的示例
序列号115:HLA-A*0201-限制的(restricted)NY-ESO-1157-165
序列号116:1G4TCRA CDR3
序列号117:1G4TCRB CDR3
序列号118:1G4TCR的Vα盒
序列号119:1G4TCR的Vβ盒
序列号120~129:图24及25中的碱基序列
序列号130:小鼠TRA2-TALEN左侧的靶序列
序列号131:小鼠TRA2-TALEN右侧的靶序列
序列号132:小鼠TRB1-TALEN左侧的靶序列
序列号133:小鼠TRB1-TALEN右侧的靶序列
序列号134:小鼠TRB2-TALEN左侧的靶序列
序列号135:小鼠TRB2-TALEN右侧的靶序列。
SEQUENCE LISTING
<110> 国立大学法人广岛大学
组库创世纪株式会社
<120> 使用铂TALEN的T细胞受体的完全取代技术
<130> F518PCT166
<150> JP 2018-167954
<151> 2018-09-07
<150> JP 2017-197010
<151> 2017-10-10
<160> 135
<170> PatentIn version 3.5
<210> 1
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> TALE DNA结合模块的氨基酸序列的示例
<400> 1
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 2
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HLA-A*02-限制型 CMV pp65 肽
<400> 2
Asn Leu Val Pro Met Val Ala Thr Val
1 5
<210> 3
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HLA-A2-HIV
<400> 3
Lys Leu Thr Pro Leu Cys Val Thr Leu
1 5
<210> 4
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> BSL-18E 引物
<220>
<221> misc_feature
<222> (35)..(35)
<223> n is a, c, g, t or u
<400> 4
aaagcggccg catgcttttt tttttttttt tttvn 35
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> P20EA 引物
<400> 5
taatacgact ccgaattccc 20
<210> 6
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> P10EA 引物
<400> 6
gggaattcgg 10
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CA1 引物
<400> 7
tgttgaaggc gtttgcacat gca 23
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CA2 引物
<400> 8
gtgcatagac ctcatgtcta gca 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CB1 引物
<400> 9
gaactggact tgacagcgga act 23
<210> 10
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CB2 引物
<400> 10
aggcagtatc tggagtcatt gag 23
<210> 11
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> HuVbF 引物
<220>
<221> misc_feature
<222> (31)..(40)
<223> MID标签序列
<400> 11
ccatctcatc cctgcgtgtc tccgactcag nnnnnnnnnn ataggcagac agacttgtca 60
ctg 63
<210> 12
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> HuVbF 引物
<220>
<221> misc_feature
<222> (31)..(40)
<223> MID标签序列
<400> 12
ccatctcatc cctgcgtgtc tccgactcag nnnnnnnnnn acaccagtgt ggccttttgg 60
gtg 63
<210> 13
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> B-P20EA 引物
<400> 13
cctatcccct gtgtgccttg gcagtctaat acgactccga attccc 46
<210> 14
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID1
<400> 14
acgagtgcgt 10
<210> 15
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID2
<400> 15
acgctcgaca 10
<210> 16
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID3
<400> 16
agacgcactc 10
<210> 17
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID4
<400> 17
agcactgtag 10
<210> 18
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID5
<400> 18
atcagacacg 10
<210> 19
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID6
<400> 19
atatcgcgag 10
<210> 20
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID7
<400> 20
cgtgtctcta 10
<210> 21
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID8
<400> 21
ctcgcgtgtc 10
<210> 22
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID10
<400> 22
tctctatgcg 10
<210> 23
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID11
<400> 23
tgatacgtct 10
<210> 24
<400> 24
000
<210> 25
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID16
<400> 25
tcacgtacta 10
<210> 26
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID17
<400> 26
cgtctagtac 10
<210> 27
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID18
<400> 27
tctacgtagc 10
<210> 28
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID19
<400> 28
tgtactactc 10
<210> 29
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID20
<400> 29
acgactacag 10
<210> 30
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID21
<400> 30
cgtagactag 10
<210> 31
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID22
<400> 31
tacgagtatg 10
<210> 32
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID23
<400> 32
tactctcgtg 10
<210> 33
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> MID24
<400> 33
tagagacgag 10
<210> 34
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 衔接子序列
<400> 34
ccatctcatc cctgcgtgtc tccgac 26
<210> 35
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> P22EA-ST1-R 引物
<400> 35
gtctcgtggg ctcggagatg tgtataagag acagctaata cgactccgaa ttccc 55
<210> 36
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> Tag-1 引物
<400> 36
gtctcgtggg ctcggagatg tgtataagag aca 33
<210> 37
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> Tag-2 引物
<400> 37
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 38
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> CA-ST1-R
<400> 38
tcgtcggcag cgtcagatgt gtataagaga caggagggtc agggttctgg a 51
<210> 39
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> CB-ST1-R
<400> 39
tcgtcggcag cgtcagatgt gtataagaga caggctcaaa cacagcgacc tc 52
<210> 40
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> TSO oligo
<400> 40
gtcgcacggt ccatcgcagc agtcacagg 29
<210> 41
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> TSO PCR 引物
<400> 41
gtcgcacggt ccatcgcagc agtc 24
<210> 42
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> SMART PCR 引物
<400> 42
aagcagtggt atcaacgcag agt 23
<210> 43
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> TSO_TAG 引物
<400> 43
gtctcgtggg ctcggagatg tgtataagag acagcgtcgc acggtccatc gcagcagtc 59
<210> 44
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> SMART_TAG 引物
<400> 44
tcgtcggcag cgtcagatgt gtataagaga cagaagcagt ggtatcaacg cagagt 56
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 寡珠中的SMART序列
<400> 45
aagcagtggt atcaacgcag agt 23
<210> 46
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-alpha2_L19 质粒全长
<400> 46
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccagacc aagttgtcgc gattgcaagc aacaacggag gcaaacaagc cttagaaaca 5760
gtccagagat tgttgccggt gctgtgccaa gaccacggcc tgacccccga acaggttgtc 5820
gctattgcta gtaacggcgg aggcaaacag gcgctggaaa cagttcagcg cctcttgccg 5880
gtcttgtgtc aggcccacgg cctgaccccg gaccaggtgg ttgcaatcgc gtcacacgat 5940
gggggaaagc aggccctaga aaccgttcag cgactcctgc ccgtcctgtg ccaggcccac 6000
ggcctgaccc ccgcccaggt tgtcgctatt gctagtaacg gcggaggcaa acaggcgctg 6060
gaaacagttc agcgcctctt gccggtcttg tgtcaggacc acggcctgac cccagaccaa 6120
gttgtcgcga ttgcaagcaa caacggaggc aaacaagcct tagaaacagt ccagagattg 6180
ttgccggtgc tgtgccaaga ccacggcctg accccggaac aggtggttgc aatcgcgtca 6240
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 6300
gcccacggcc tgaccccgga ccaggtggtt gcaatcgcgt cacacgatgg gggaaagcag 6360
gccctagaaa ccgttcagcg actcctgccc gtcctgtgcc aggcccacgg cctgaccccc 6420
gcccaggttg tcgctattgc tagtaacggc ggaggcaaac aggcgctgga aacagttcag 6480
cgcctcttgc cggtcttgtg tcaggaccac ggcctgaccc cagaccaggt tgtggccatc 6540
gccagcaaca taggtggcaa gcaggccctc gaaaccgtcc agagactgtt accggttctc 6600
tgccaggacc acggcctgac ccccgaacag gttgtcgcta ttgctagtaa cggcggaggc 6660
aaacaggcgc tggaaacagt tcagcgcctc ttgccggtct tgtgtcaggc ccacggcctg 6720
acccccgacc aggttgtcgc tattgctagt aacggcggag gcaaacaggc gctggaaaca 6780
gttcagcgcc tcttgccggt cttgtgtcag gcccacggcc tgaccccggc ccaggtggtt 6840
gcaatcgcgt cacacgatgg gggaaagcag gccctagaaa ccgttcagcg actcctgccc 6900
gtcctgtgcc aggaccacgg cctgacccca gaccaggttg tggccatcgc cagcaacata 6960
ggtggcaagc aggccctcga aaccgtccag agactgttac cggttctctg ccaggaccac 7020
ggcctgaccc cggaacaggt ggttgcaatc gcgtcacacg atgggggaaa gcaggcccta 7080
gaaaccgttc agcgactcct gcccgtcctg tgccaggccc acggcctgac cccggaccag 7140
gtggttgcaa tcgcgtcaca cgatggggga aagcaggccc tagaaaccgt tcagcgactc 7200
ctgcccgtcc tgtgccaggc ccacggcctg accccagccc aagttgtcgc gattgcaagc 7260
aacaacggag gcaaacaagc cttagaaaca gtccagagat tgttgccggt gctgtgccaa 7320
gaccacggcc tgaccccaga ccaggttgtg gccatcgcca gcaacatagg tggcaagcag 7380
gccctcgaaa ccgtccagag actgttaccg gttctctgcc aggaccacgg cctgaccccc 7440
gaacaggttg tcgctattgc tagtaacggc ggaggcaaac aggcgctgga aacagttcag 7500
cgcctcttgc cggtcttgtg tcaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatccaacg gagggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 47
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-alpha2_R19 质粒全长
<400> 47
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccggacc aggtggttgc aatcgcgtca cacgatgggg gaaagcaggc cctagaaacc 5760
gttcagcgac tcctgcccgt cctgtgccag gaccacggcc tgaccccgga acaggtggtt 5820
gcaatcgcgt cacacgatgg gggaaagcag gccctagaaa ccgttcagcg actcctgccc 5880
gtcctgtgcc aggcccacgg cctgaccccc gaccaggttg tcgctattgc tagtaacggc 5940
ggaggcaaac aggcgctgga aacagttcag cgcctcttgc cggtcttgtg tcaggcccac 6000
ggcctgaccc ccgcccaggt tgtcgctatt gctagtaacg gcggaggcaa acaggcgctg 6060
gaaacagttc agcgcctctt gccggtcttg tgtcaggacc acggcctgac cccagaccag 6120
gttgtggcca tcgccagcaa cataggtggc aagcaggccc tcgaaaccgt ccagagactg 6180
ttaccggttc tctgccagga ccacggcctg accccggaac aggtggttgc aatcgcgtca 6240
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 6300
gcccacggcc tgacccccga ccaggttgtc gctattgcta gtaacggcgg aggcaaacag 6360
gcgctggaaa cagttcagcg cctcttgccg gtcttgtgtc aggcccacgg cctgaccccc 6420
gcccaggttg tcgctattgc tagtaacggc ggaggcaaac aggcgctgga aacagttcag 6480
cgcctcttgc cggtcttgtg tcaggaccac ggcctgaccc ccgaccaggt tgtcgctatt 6540
gctagtaacg gcggaggcaa acaggcgctg gaaacagttc agcgcctctt gccggtcttg 6600
tgtcaggacc acggcctgac cccagaacaa gttgtcgcga ttgcaagcaa caacggaggc 6660
aaacaagcct tagaaacagt ccagagattg ttgccggtgc tgtgccaagc ccacggcctg 6720
acccccgacc aggttgtcgc tattgctagt aacggcggag gcaaacaggc gctggaaaca 6780
gttcagcgcc tcttgccggt cttgtgtcag gcccacggcc tgaccccagc ccaagttgtc 6840
gcgattgcaa gcaacaacgg aggcaaacaa gccttagaaa cagtccagag attgttgccg 6900
gtgctgtgcc aagaccacgg cctgacccca gaccaggttg tggccatcgc cagcaacata 6960
ggtggcaagc aggccctcga aaccgtccag agactgttac cggttctctg ccaggaccac 7020
ggcctgaccc cggaacaggt ggttgcaatc gcgtcacacg atgggggaaa gcaggcccta 7080
gaaaccgttc agcgactcct gcccgtcctg tgccaggccc acggcctgac cccagaccag 7140
gttgtggcca tcgccagcaa cataggtggc aagcaggccc tcgaaaccgt ccagagactg 7200
ttaccggttc tctgccaggc ccacggcctg accccggccc aggtggttgc aatcgcgtca 7260
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 7320
gaccacggcc tgaccccaga ccaggttgtg gccatcgcca gcaacatagg tggcaagcag 7380
gccctcgaaa ccgtccagag actgttaccg gttctctgcc aggaccacgg cctgaccccc 7440
gaacaggttg tcgctattgc tagtaacggc ggaggcaaac aggcgctgga aacagttcag 7500
cgcctcttgc cggtcttgtg tcaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatccaacg gagggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 48
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta1_L19 质粒全长
<400> 48
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccagacc aagttgtcgc gattgcaagc aacaacggag gcaaacaagc cttagaaaca 5760
gtccagagat tgttgccggt gctgtgccaa gaccacggcc tgacccccga acaggttgtc 5820
gctattgcta gtaacggcgg aggcaaacag gcgctggaaa cagttcagcg cctcttgccg 5880
gtcttgtgtc aggcccacgg cctgaccccc gaccaggttg tcgctattgc tagtaacggc 5940
ggaggcaaac aggcgctgga aacagttcag cgcctcttgc cggtcttgtg tcaggcccac 6000
ggcctgaccc cggcccaggt ggttgcaatc gcgtcacacg atgggggaaa gcaggcccta 6060
gaaaccgttc agcgactcct gcccgtcctg tgccaggacc acggcctgac cccggaccag 6120
gtggttgcaa tcgcgtcaca cgatggggga aagcaggccc tagaaaccgt tcagcgactc 6180
ctgcccgtcc tgtgccagga ccacggcctg accccggaac aggtggttgc aatcgcgtca 6240
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 6300
gcccacggcc tgaccccaga ccaggttgtg gccatcgcca gcaacatagg tggcaagcag 6360
gccctcgaaa ccgtccagag actgttaccg gttctctgcc aggcccacgg cctgaccccg 6420
gcccaggtgg ttgcaatcgc gtcacacgat gggggaaagc aggccctaga aaccgttcag 6480
cgactcctgc ccgtcctgtg ccaggaccac ggcctgaccc cggaccaggt ggttgcaatc 6540
gcgtcacacg atgggggaaa gcaggcccta gaaaccgttc agcgactcct gcccgtcctg 6600
tgccaggacc acggcctgac cccggaacag gtggttgcaa tcgcgtcaca cgatggggga 6660
aagcaggccc tagaaaccgt tcagcgactc ctgcccgtcc tgtgccaggc ccacggcctg 6720
accccagacc aagttgtcgc gattgcaagc aacaacggag gcaaacaagc cttagaaaca 6780
gtccagagat tgttgcctgt gctgtgccaa gcccacggcc tgaccccagc ccaggttgtg 6840
gccatcgcca gcaacatagg tggcaagcag gccctcgaaa ccgtccagag actgttaccg 6900
gttctctgcc aggaccacgg cctgacccca gaccaagttg tcgcgattgc aagcaacaac 6960
ggaggcaaac aagccttaga aacagtccag agattgttgc cggtgctgtg ccaagaccac 7020
ggcctgaccc cagaacaagt tgtcgcgatt gcaagcaaca acggaggcaa acaagcctta 7080
gaaacagtcc agagattgtt gccggtgctg tgccaagccc acggcctgac ccccgaccag 7140
gttgtcgcta ttgctagtaa cggcggaggc aaacaggcgc tggaaacagt tcagcgcctc 7200
ttgccggtct tgtgtcaggc ccacggcctg accccggccc aggtggttgc aatcgcgtca 7260
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 7320
gaccacggcc tgaccccaga ccaagttgtc gcgattgcaa gcaacaacgg aggcaaacaa 7380
gccttagaaa cagtccagag attgttgccg gtgctgtgcc aagaccacgg cctgaccccg 7440
gaacaggtgg ttgcaatcgc gtcacacgat gggggaaagc aggccctaga aaccgttcag 7500
cgactcctgc ccgtcctgtg ccaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatccaacg gagggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 49
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta1_R19 质粒全长
<400> 49
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccagacc aagttgtcgc gattgcaagc aacaacggag gcaaacaagc cttagaaaca 5760
gtccagagat tgttgccggt gctgtgccaa gaccacggcc tgacccccga acaggttgtc 5820
gctattgcta gtaacggcgg aggcaaacag gcgctggaaa cagttcagcg cctcttgccg 5880
gtcttgtgtc aggcccacgg cctgacccca gaccaagttg tcgcgattgc aagcaacaac 5940
ggaggcaaac aagccttaga aacagtccag agattgttgc ctgtgctgtg ccaagcccac 6000
ggcctgaccc cagcccaagt tgtcgcgatt gcaagcaaca acggaggcaa acaagcctta 6060
gaaacagtcc agagattgtt gccggtgctg tgccaagacc acggcctgac cccagaccaa 6120
gttgtcgcga ttgcaagcaa caacggaggc aaacaagcct tagaaacagt ccagagattg 6180
ttgccggtgc tgtgccaaga ccacggcctg accccagaac aggttgtggc catcgccagc 6240
aacataggtg gcaagcaggc cctcgaaacc gtccagagac tgttaccggt tctctgccag 6300
gcccacggcc tgaccccaga ccaagttgtc gcgattgcaa gcaacaacgg aggcaaacaa 6360
gccttagaaa cagtccagag attgttgcct gtgctgtgcc aagcccacgg cctgacccca 6420
gcccaggttg tggccatcgc cagcaacata ggtggcaagc aggccctcga aaccgtccag 6480
agactgttac cggttctctg ccaggaccac ggcctgaccc ccgaccaggt tgtcgctatt 6540
gctagtaacg gcggaggcaa acaggcgctg gaaacagttc agcgcctctt gccggtcttg 6600
tgtcaggacc acggcctgac cccggaacag gtggttgcaa tcgcgtcaca cgatggggga 6660
aagcaggccc tagaaaccgt tcagcgactc ctgcccgtcc tgtgccaggc ccacggcctg 6720
acccccgacc aggttgtcgc tattgctagt aacggcggag gcaaacaggc gctggaaaca 6780
gttcagcgcc tcttgccggt cttgtgtcag gcccacggcc tgaccccggc ccaggtggtt 6840
gcaatcgcgt cacacgatgg gggaaagcag gccctagaaa ccgttcagcg actcctgccc 6900
gtcctgtgcc aggaccacgg cctgaccccc gaccaggttg tcgctattgc tagtaacggc 6960
ggaggcaaac aggcgctgga aacagttcag cgcctcttgc cggtcttgtg tcaggaccac 7020
ggcctgaccc cagaacaagt tgtcgcgatt gcaagcaaca acggaggcaa acaagcctta 7080
gaaacagtcc agagattgtt gccggtgctg tgccaagccc acggcctgac cccggaccag 7140
gtggttgcaa tcgcgtcaca cgatggggga aagcaggccc tagaaaccgt tcagcgactc 7200
ctgcccgtcc tgtgccaggc ccacggcctg acccccgccc aggttgtcgc tattgctagt 7260
aacggcggag gcaaacaggc gctggaaaca gttcagcgcc tcttgccggt cttgtgtcag 7320
gaccacggcc tgacccccga ccaggttgtc gctattgcta gtaacggcgg aggcaaacag 7380
gcgctggaaa cagttcagcg cctcttgccg gtcttgtgtc aggaccacgg cctgaccccg 7440
gaacaggtgg ttgcaatcgc gtcacacgat gggggaaagc aggccctaga aaccgttcag 7500
cgactcctgc ccgtcctgtg ccaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatccaacg gagggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 50
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta3_L19 质粒全长
<400> 50
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccagacc aagttgtcgc gattgcaagc aacaacggag gcaaacaagc cttagaaaca 5760
gtccagagat tgttgccggt gctgtgccaa gaccacggcc tgacccccga acaggttgtc 5820
gctattgcta gtaacggcgg aggcaaacag gcgctggaaa cagttcagcg cctcttgccg 5880
gtcttgtgtc aggcccacgg cctgacccca gaccaagttg tcgcgattgc aagcaacaac 5940
ggaggcaaac aagccttaga aacagtccag agattgttgc ctgtgctgtg ccaagcccac 6000
ggcctgaccc cggcccaggt ggttgcaatc gcgtcacacg atgggggaaa gcaggcccta 6060
gaaaccgttc agcgactcct gcccgtcctg tgccaggacc acggcctgac cccggaccag 6120
gtggttgcaa tcgcgtcaca cgatggggga aagcaggccc tagaaaccgt tcagcgactc 6180
ctgcccgtcc tgtgccagga ccacggcctg acccccgaac aggttgtcgc tattgctagt 6240
aacggcggag gcaaacaggc gctggaaaca gttcagcgcc tcttgccggt cttgtgtcag 6300
gcccacggcc tgaccccaga ccaagttgtc gcgattgcaa gcaacaacgg aggcaaacaa 6360
gccttagaaa cagtccagag attgttgcct gtgctgtgcc aagcccacgg cctgacccca 6420
gcccaagttg tcgcgattgc aagcaacaac ggaggcaaac aagccttaga aacagtccag 6480
agattgttgc cggtgctgtg ccaagaccac ggcctgaccc cggaccaggt ggttgcaatc 6540
gcgtcacacg atgggggaaa gcaggcccta gaaaccgttc agcgactcct gcccgtcctg 6600
tgccaggacc acggcctgac cccggaacag gtggttgcaa tcgcgtcaca cgatggggga 6660
aagcaggccc tagaaaccgt tcagcgactc ctgcccgtcc tgtgccaggc ccacggcctg 6720
accccagacc aggttgtggc catcgccagc aacataggtg gcaagcaggc cctcgaaacc 6780
gtccagagac tgttaccggt tctctgccag gcccacggcc tgaccccggc ccaggtggtt 6840
gcaatcgcgt cacacgatgg gggaaagcag gccctagaaa ccgttcagcg actcctgccc 6900
gtcctgtgcc aggaccacgg cctgacccca gaccaggttg tggccatcgc cagcaacata 6960
ggtggcaagc aggccctcga aaccgtccag agactgttac cggttctctg ccaggaccac 7020
ggcctgaccc cagaacaagt tgtcgcgatt gcaagcaaca acggaggcaa acaagcctta 7080
gaaacagtcc agagattgtt gccggtgctg tgccaagccc acggcctgac cccagaccaa 7140
gttgtcgcga ttgcaagcaa caacggaggc aaacaagcct tagaaacagt ccagagattg 7200
ttgcctgtgc tgtgccaagc ccacggcctg accccggccc aggtggttgc aatcgcgtca 7260
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 7320
gaccacggcc tgacccccga ccaggttgtc gctattgcta gtaacggcgg aggcaaacag 7380
gcgctggaaa cagttcagcg cctcttgccg gtcttgtgtc aggaccacgg cctgaccccc 7440
gaacaggttg tcgctattgc tagtaacggc ggaggcaaac aggcgctgga aacagttcag 7500
cgcctcttgc cggtcttgtg tcaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatcccacg acgggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 51
<211> 8363
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta3_R19 质粒全长
<400> 51
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 60
ctgtcctttc ctaataaaat gaggaaattg catcacaaca ctcaacccta tctcggtcta 120
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 180
ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag 240
tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc 300
aggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat 360
tagtcagcaa ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt 420
tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc 480
gcctctgcct ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt 540
tgcaaaaagc tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgatgaaa 600
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtt 660
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 720
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 780
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 840
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 900
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 960
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 1020
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 1080
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 1140
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1200
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1260
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1320
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1380
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1440
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1500
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1560
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1620
cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 1680
gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 1740
gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 1800
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 1860
aatgtatctt atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg 1920
tcattaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1980
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2040
ccccagcgct gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat 2100
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2160
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 2220
caacgttgtt gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 2280
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 2340
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 2400
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 2460
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2520
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2580
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2640
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2700
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2760
gacacggaaa tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca 2820
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2880
ggtcagtgtt acaaccaatt aaccaattct gaacattatc gcgagcccat ttatacctga 2940
atatggctca taacacccct tgctcatgac caaaatccct taacgtgagt tacgcgcgcg 3000
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 3060
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 3120
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 3180
ataccaaata ctgttcttct agtgtagccg tagttagccc accacttcaa gaactctgta 3240
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 3300
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3360
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3420
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3480
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3540
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3600
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3660
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 3720
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 3780
accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg agagtaggga actgccaggc 3840
atcaaactaa gcagaaggcc cctgacggat ggcctttttg cgtttctaca aactctttct 3900
gtgttgtaaa acgacggcca gtcttaagct cgggccccct gggcggttct gataacgagt 3960
aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg ggttttttta tggggggagt 4020
ttagggaaag agcatttgtc agaatattta agggcgcctg tcactttgct tgatatatga 4080
gaattattta accttataaa tgagaaaaaa gcaacgcact ttaaataaga tacgttgctt 4140
tttcgattga tgaacaccta taattaaact attcatctat tatttatgat tttttgtata 4200
tacaatattt ctagtttgtt aaagagaatt aagaaaataa atctcgaaaa taataaaggg 4260
aaaatcagtt tttgatatca aaattataca tgtcaacgat aatacaaaat ataatacaaa 4320
ctataagatg ttatcagtat ttattatcat ttagaataaa ttttgtgtcg cccttaattg 4380
tgagcggata acaattacga gcttcatgca cagtggcgtt gacattgatt attgactagt 4440
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 4500
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 4560
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 4620
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 4680
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 4740
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 4800
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 4860
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 4920
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 4980
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 5040
atcgaaatta atacgactca ctatagggaa gcttcttgtt ctttttgcag aagctcagaa 5100
taaacgctca actttggcct cgaggccacc atggcttcct cccctccaaa gaaaaagaga 5160
aaggttgcgg ccgctgacta caaggatgac gacgataaaa gttggaagga cgcaagtggt 5220
tggtctagaa tgcatgcggc cccgcgacgg cgtgctgcgc aaccctccga cgcttcgccg 5280
gccgcgcagg tggatctacg cacgctcggc tacagtcagc agcagcaaga gaagatcaaa 5340
ccgaaggtgc gttcgacagt ggcgcagcac cacgaggcac tggtgggcca tgggtttaca 5400
cacgcgcaca tcgttgcgct cagccaacac ccggcagcgt tagggaccgt cgctgtcacg 5460
tatcagcaca taatcacggc gttgccagag gcgacacacg aagacatcgt tggcgtcggc 5520
aaacagtggt ccggcgcacg cgccctggag gccttgctca cggatgcggg ggagttgaga 5580
ggtccgccgt tacagttgga cacaggccaa cttgtgaaga ttgcaaaacg tggcggcgtg 5640
accgcaatgg aggcagtgca tgcatcgcgc aatgcgctca cgggagcacc cctcaacctg 5700
accccggacc aggtggttgc aatcgcgtca cacgatgggg gaaagcaggc cctagaaacc 5760
gttcagcgac tcctgcccgt cctgtgccag gaccacggcc tgaccccaga acaggttgtg 5820
gccatcgcca gcaacatagg tggcaagcag gccctcgaaa ccgtccagag actgttaccg 5880
gttctctgcc aggcccacgg cctgaccccg gaccaggtgg ttgcaatcgc gtcacacgat 5940
gggggaaagc aggccctaga aaccgttcag cgactcctgc ccgtcctgtg ccaggcccac 6000
ggcctgaccc cggcccaggt ggttgcaatc gcgtcacacg atgggggaaa gcaggcccta 6060
gaaaccgttc agcgactcct gcccgtcctg tgccaggacc acggcctgac cccggaccag 6120
gtggttgcaa tcgcgtcaca cgatggggga aagcaggccc tagaaaccgt tcagcgactc 6180
ctgcccgtcc tgtgccagga ccacggcctg accccagaac aggttgtggc catcgccagc 6240
aacataggtg gcaagcaggc cctcgaaacc gtccagagac tgttaccggt tctctgccag 6300
gcccacggcc tgaccccgga ccaggtggtt gcaatcgcgt cacacgatgg gggaaagcag 6360
gccctagaaa ccgttcagcg actcctgccc gtcctgtgcc aggcccacgg cctgaccccg 6420
gcccaggtgg ttgcaatcgc gtcacacgat gggggaaagc aggccctaga aaccgttcag 6480
cgactcctgc ccgtcctgtg ccaggaccac ggcctgaccc cagaccaggt tgtggccatc 6540
gccagcaaca taggtggcaa gcaggccctc gaaaccgtcc agagactgtt accggttctc 6600
tgccaggacc acggcctgac cccagaacaa gttgtcgcga ttgcaagcaa caacggaggc 6660
aaacaagcct tagaaacagt ccagagattg ttgccggtgc tgtgccaagc ccacggcctg 6720
accccggacc aggtggttgc aatcgcgtca cacgatgggg gaaagcaggc cctagaaacc 6780
gttcagcgac tcctgcccgt cctgtgccag gcccacggcc tgacccccgc ccaggttgtc 6840
gctattgcta gtaacggcgg aggcaaacag gcgctggaaa cagttcagcg cctcttgccg 6900
gtcttgtgtc aggaccacgg cctgaccccg gaccaggtgg ttgcaatcgc gtcacacgat 6960
gggggaaagc aggccctaga aaccgttcag cgactcctgc ccgtcctgtg ccaggaccac 7020
ggcctgaccc cagaacaggt tgtggccatc gccagcaaca taggtggcaa gcaggccctc 7080
gaaaccgtcc agagactgtt accggttctc tgccaggccc acggcctgac cccagaccaa 7140
gttgtcgcga ttgcaagcaa caacggaggc aaacaagcct tagaaacagt ccagagattg 7200
ttgcctgtgc tgtgccaagc ccacggcctg accccggccc aggtggttgc aatcgcgtca 7260
cacgatgggg gaaagcaggc cctagaaacc gttcagcgac tcctgcccgt cctgtgccag 7320
gaccacggcc tgacccccga ccaggttgtc gctattgcta gtaacggcgg aggcaaacag 7380
gcgctggaaa cagttcagcg cctcttgccg gtcttgtgtc aggaccacgg cctgaccccg 7440
gaacaggtgg ttgcaatcgc gtcacacgat gggggaaagc aggccctaga aaccgttcag 7500
cgactcctgc ccgtcctgtg ccaggcccac ggcctgacgc ctgagcaggt agtggctatt 7560
gcatcccacg acgggggcag acccgcactg gagtcaatcg tggcccagct ttcgaggccg 7620
gaccccgcgc tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga 7680
cgtcctgcca tggatgcagt gaaaaaggga ttgccgcacg cgccggaatt gatcagatcc 7740
cagctagtga aatctgaatt ggaagagaag aaatctgaac ttagacataa attgaaatat 7800
gtgccacatg aatatattga attgattgaa atcgcaagaa attcaactca ggatagaatc 7860
cttgaaatga aggtgatgga gttctttatg aaggtttatg gttatcgtgg taaacatttg 7920
ggtggatcaa ggaaaccaga cggagcaatt tatactgtcg gatctcctat tgattacggt 7980
gtgatcgttg atactaaggc atattcagga ggttataatc ttccaattgg tcaagcagat 8040
gaaatgcaaa gatatgtcga agagaatcaa acaagaaaca agcatatcaa ccctaatgaa 8100
tggtggaaag tctatccatc ttcagtaaca gaatttaagt tcttgtttgt gagtggtcat 8160
ttcaaaggaa actacaaagc tcagcttaca agattgaatc atatcactaa ttgtaatgga 8220
gctgttctta gtgtagaaga gcttttgatt ggtggagaaa tgattaaagc tggtacattg 8280
acacttgagg aagtgagaag gaaatttaat aacggtgaga taaactttta aaaaatcagc 8340
ctcgactgtg ccttctagtt gcc 8363
<210> 52
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-alpha2_L19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 52
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc cca 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta 624
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca cac gat ggg gga 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
260 265 270
aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc ccc gcc cag gtt gtc gct att gct agt aac ggc 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
290 295 300
gga ggc aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgt cag gac cac ggc ctg acc cca gac caa gtt gtc gcg att gca agc 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg ttg ccg 1056
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtg ctg tgc caa gac cac ggc ctg acc ccg gaa cag gtg gtt gca atc 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc 1152
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccg gac cag gtg gtt 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag 1248
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
cga ctc ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccc gcc cag 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca 1344
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg acc cca 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc 1440
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
500 505 510
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc ccc gac cag gtt gtc gct att gct agt aac ggc gga ggc 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgc cag gac cac ggc ctg acc cca gac cag gtt gtg gcc atc gcc agc 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg 1872
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtt ctc tgc cag gac cac ggc ctg acc ccg gaa cag gtg gtt gca atc 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc 1968
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccg gac cag gtg gtt 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag 2064
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
cga ctc ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc cca gcc caa 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca 2160
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg acc cca 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac cag gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
740 745 750
gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc aac gga ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 53
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 53
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 54
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-alpha2_R19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 54
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc ccg 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta 624
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
195 200 205
gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
225 230 235 240
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc ccc gac cag gtt gtc gct att gct agt aac ggc gga ggc 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
260 265 270
aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc ccc gcc cag gtt gtc gct att gct agt aac ggc 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
290 295 300
gga ggc aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgt cag gac cac ggc ctg acc cca gac cag gtt gtg gcc atc gcc agc 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg 1056
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtt ctc tgc cag gac cac ggc ctg acc ccg gaa cag gtg gtt gca atc 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc 1152
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccc gac cag gtt gtc 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gct att gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca gtt cag 1248
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
cgc ctc ttg ccg gtc ttg tgt cag gcc cac ggc ctg acc ccc gcc cag 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca 1344
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg acc ccc 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg 1440
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc cca gaa caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
500 505 510
gcc tta gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc ccc gac cag gtt gtc gct att gct agt aac ggc gga ggc 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc cca gcc caa gtt gtc gcg att gca agc aac aac 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn
565 570 575
gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg ttg ccg gtg ctg 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgc caa gac cac ggc ctg acc cca gac cag gtt gtg gcc atc gcc agc 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg 1872
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtt ctc tgc cag gac cac ggc ctg acc ccg gaa cag gtg gtt gca atc 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc 1968
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc cca gac cag gtt gtg 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag 2064
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
aga ctg tta ccg gtt ctc tgc cag gcc cac ggc ctg acc ccg gcc cag 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 2160
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc cca 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac cag gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
740 745 750
gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc aac gga ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 55
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 55
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 56
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta1_L19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 56
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc cca 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta 624
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc ccc gac cag gtt gtc gct att gct agt aac ggc gga ggc 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
260 265 270
aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgc cag gac cac ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc 1056
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtc ctg tgc cag gac cac ggc ctg acc ccg gaa cag gtg gtt gca atc 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc 1152
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc cca gac cag gtt gtg 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag 1248
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
aga ctg tta ccg gtt ctc tgc cag gcc cac ggc ctg acc ccg gcc cag 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 1344
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc ccg 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta 1440
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc cca gac caa gtt gtc gcg att gca agc aac aac gga ggc 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
530 535 540
aaa caa gcc tta gaa aca gtc cag aga ttg ttg cct gtg ctg tgc caa 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc cca gcc cag gtt gtg gcc atc gcc agc aac ata 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
565 570 575
ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg gtt ctc 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgc cag gac cac ggc ctg acc cca gac caa gtt gtc gcg att gca agc 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg ttg ccg 1872
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtg ctg tgc caa gac cac ggc ctg acc cca gaa caa gtt gtc gcg att 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg 1968
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
ttg ccg gtg ctg tgc caa gcc cac ggc ctg acc ccc gac cag gtt gtc 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gct att gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca gtt cag 2064
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
cgc ctc ttg ccg gtc ttg tgt cag gcc cac ggc ctg acc ccg gcc cag 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 2160
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc cca 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
740 745 750
gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc aac gga ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 57
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 57
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 58
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta1_R19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 58
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc cca 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta 624
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc cca gac caa gtt gtc gcg att gca agc aac aac gga ggc 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
260 265 270
aaa caa gcc tta gaa aca gtc cag aga ttg ttg cct gtg ctg tgc caa 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc cca gcc caa gtt gtc gcg att gca agc aac aac 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn
290 295 300
gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg ttg ccg gtg ctg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgc caa gac cac ggc ctg acc cca gac caa gtt gtc gcg att gca agc 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg ttg ccg 1056
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtg ctg tgc caa gac cac ggc ctg acc cca gaa cag gtt gtg gcc atc 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg 1152
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
tta ccg gtt ctc tgc cag gcc cac ggc ctg acc cca gac caa gtt gtc 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag 1248
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
aga ttg ttg cct gtg ctg tgc caa gcc cac ggc ctg acc cca gcc cag 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc 1344
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtc cag aga ctg tta ccg gtt ctc tgc cag gac cac ggc ctg acc ccc 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg 1440
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc ccc gac cag gtt gtc gct att gct agt aac ggc gga ggc 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgc cag gac cac ggc ctg acc ccc gac cag gtt gtc gct att gct agt 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
aac ggc gga ggc aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg 1872
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtc ttg tgt cag gac cac ggc ctg acc cca gaa caa gtt gtc gcg att 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg 1968
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
ttg ccg gtg ctg tgc caa gcc cac ggc ctg acc ccg gac cag gtg gtt 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag 2064
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
cga ctc ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccc gcc cag 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca 2160
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg acc ccc 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc aac gga ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 59
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 59
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 60
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta3_L19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 60
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc cca 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta 624
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc cca gac caa gtt gtc gcg att gca agc aac aac gga ggc 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
260 265 270
aaa caa gcc tta gaa aca gtc cag aga ttg ttg cct gtg ctg tgc caa 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgc cag gac cac ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc 1056
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtc ctg tgc cag gac cac ggc ctg acc ccc gaa cag gtt gtc gct att 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gct agt aac ggc gga ggc aaa cag gcg ctg gaa aca gtt cag cgc ctc 1152
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
ttg ccg gtc ttg tgt cag gcc cac ggc ctg acc cca gac caa gtt gtc 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag 1248
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
aga ttg ttg cct gtg ctg tgc caa gcc cac ggc ctg acc cca gcc caa 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtt gtc gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca 1344
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtc cag aga ttg ttg ccg gtg ctg tgc caa gac cac ggc ctg acc ccg 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta 1440
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc cca gac cag gtt gtg gcc atc gcc agc aac ata ggt ggc 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly
530 535 540
aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgc cag gac cac ggc ctg acc cca gac cag gtt gtg gcc atc gcc agc 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg tta ccg 1872
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtt ctc tgc cag gac cac ggc ctg acc cca gaa caa gtt gtc gcg att 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag aga ttg 1968
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
ttg ccg gtg ctg tgc caa gcc cac ggc ctg acc cca gac caa gtt gtc 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag 2064
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
aga ttg ttg cct gtg ctg tgc caa gcc cac ggc ctg acc ccg gcc cag 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 2160
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc ccc 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccc gaa cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc cac gac ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 61
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 61
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 62
<211> 3201
<212> DNA
<213> 人工序列
<220>
<223> TALEN-TCR-beta3_R19 TALEN编码序列
<220>
<221> CDS
<222> (1)..(3201)
<400> 62
atg gct tcc tcc cct cca aag aaa aag aga aag gtt gcg gcc gct gac 48
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
tac aag gat gac gac gat aaa agt tgg aag gac gca agt ggt tgg tct 96
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
aga atg cat gcg gcc ccg cga cgg cgt gct gcg caa ccc tcc gac gct 144
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
tcg ccg gcc gcg cag gtg gat cta cgc acg ctc ggc tac agt cag cag 192
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
cag caa gag aag atc aaa ccg aag gtg cgt tcg aca gtg gcg cag cac 240
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
cac gag gca ctg gtg ggc cat ggg ttt aca cac gcg cac atc gtt gcg 288
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
ctc agc caa cac ccg gca gcg tta ggg acc gtc gct gtc acg tat cag 336
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
cac ata atc acg gcg ttg cca gag gcg aca cac gaa gac atc gtt ggc 384
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
gtc ggc aaa cag tgg tcc ggc gca cgc gcc ctg gag gcc ttg ctc acg 432
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
gat gcg ggg gag ttg aga ggt ccg ccg tta cag ttg gac aca ggc caa 480
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
ctt gtg aag att gca aaa cgt ggc ggc gtg acc gca atg gag gca gtg 528
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
cat gca tcg cgc aat gcg ctc acg gga gca ccc ctc aac ctg acc ccg 576
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
gac cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta 624
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
195 200 205
gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg 672
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
acc cca gaa cag gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
225 230 235 240
gcc ctc gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag gcc cac 768
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca cac gat ggg gga 816
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
260 265 270
aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag 864
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
gcc cac ggc ctg acc ccg gcc cag gtg gtt gca atc gcg tca cac gat 912
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg 960
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
tgc cag gac cac ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca 1008
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc 1056
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
gtc ctg tgc cag gac cac ggc ctg acc cca gaa cag gtt gtg gcc atc 1104
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg 1152
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
tta ccg gtt ctc tgc cag gcc cac ggc ctg acc ccg gac cag gtg gtt 1200
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc gtt cag 1248
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
cga ctc ctg ccc gtc ctg tgc cag gcc cac ggc ctg acc ccg gcc cag 1296
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 1344
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc cca 1392
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
gac cag gtt gtg gcc atc gcc agc aac ata ggt ggc aag cag gcc ctc 1440
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
465 470 475 480
gaa acc gtc cag aga ctg tta ccg gtt ctc tgc cag gac cac ggc ctg 1488
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
acc cca gaa caa gtt gtc gcg att gca agc aac aac gga ggc aaa caa 1536
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
500 505 510
gcc tta gaa aca gtc cag aga ttg ttg ccg gtg ctg tgc caa gcc cac 1584
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca cac gat ggg gga 1632
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
530 535 540
aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag 1680
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
gcc cac ggc ctg acc ccc gcc cag gtt gtc gct att gct agt aac ggc 1728
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
565 570 575
gga ggc aaa cag gcg ctg gaa aca gtt cag cgc ctc ttg ccg gtc ttg 1776
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
tgt cag gac cac ggc ctg acc ccg gac cag gtg gtt gca atc gcg tca 1824
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
cac gat ggg gga aag cag gcc cta gaa acc gtt cag cga ctc ctg ccc 1872
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
gtc ctg tgc cag gac cac ggc ctg acc cca gaa cag gtt gtg gcc atc 1920
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
gcc agc aac ata ggt ggc aag cag gcc ctc gaa acc gtc cag aga ctg 1968
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
tta ccg gtt ctc tgc cag gcc cac ggc ctg acc cca gac caa gtt gtc 2016
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
gcg att gca agc aac aac gga ggc aaa caa gcc tta gaa aca gtc cag 2064
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
aga ttg ttg cct gtg ctg tgc caa gcc cac ggc ctg acc ccg gcc cag 2112
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
gtg gtt gca atc gcg tca cac gat ggg gga aag cag gcc cta gaa acc 2160
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
gtt cag cga ctc ctg ccc gtc ctg tgc cag gac cac ggc ctg acc ccc 2208
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
gac cag gtt gtc gct att gct agt aac ggc gga ggc aaa cag gcg ctg 2256
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
gaa aca gtt cag cgc ctc ttg ccg gtc ttg tgt cag gac cac ggc ctg 2304
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
acc ccg gaa cag gtg gtt gca atc gcg tca cac gat ggg gga aag cag 2352
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
gcc cta gaa acc gtt cag cga ctc ctg ccc gtc ctg tgc cag gcc cac 2400
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
ggc ctg acg cct gag cag gta gtg gct att gca tcc cac gac ggg ggc 2448
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
805 810 815
aga ccc gca ctg gag tca atc gtg gcc cag ctt tcg agg ccg gac ccc 2496
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
gcg ctg gcc gca ctc act aat gat cat ctt gta gcg ctg gcc tgc ctc 2544
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
ggc gga cgt cct gcc atg gat gca gtg aaa aag gga ttg ccg cac gcg 2592
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
ccg gaa ttg atc aga tcc cag cta gtg aaa tct gaa ttg gaa gag aag 2640
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
aaa tct gaa ctt aga cat aaa ttg aaa tat gtg cca cat gaa tat att 2688
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
gaa ttg att gaa atc gca aga aat tca act cag gat aga atc ctt gaa 2736
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
atg aag gtg atg gag ttc ttt atg aag gtt tat ggt tat cgt ggt aaa 2784
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
cat ttg ggt gga tca agg aaa cca gac gga gca att tat act gtc gga 2832
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
tct cct att gat tac ggt gtg atc gtt gat act aag gca tat tca gga 2880
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
ggt tat aat ctt cca att ggt caa gca gat gaa atg caa aga tat gtc 2928
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
gaa gag aat caa aca aga aac aag cat atc aac cct aat gaa tgg tgg 2976
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
aaa gtc tat cca tct tca gta aca gaa ttt aag ttc ttg ttt gtg agt 3024
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
ggt cat ttc aaa gga aac tac aaa gct cag ctt aca aga ttg aat 3069
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
cat atc act aat tgt aat gga gct gtt ctt agt gta gaa gag ctt 3114
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
ttg att ggt gga gaa atg att aaa gct ggt aca ttg aca ctt gag 3159
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
gaa gtg aga agg aaa ttt aat aac ggt gag ata aac ttt taa 3201
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 63
<211> 1066
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 63
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Ser Trp Lys Asp Ala Ser Gly Trp Ser
20 25 30
Arg Met His Ala Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala
35 40 45
Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln
50 55 60
Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His
65 70 75 80
His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile Val Ala
85 90 95
Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln
100 105 110
His Ile Ile Thr Ala Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly
115 120 125
Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr
130 135 140
Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln
145 150 155 160
Leu Val Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val
165 170 175
His Ala Ser Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro
180 185 190
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
195 200 205
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
210 215 220
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
225 230 235 240
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
245 250 255
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
260 265 270
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
275 280 285
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp
290 295 300
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
305 310 315 320
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
325 330 335
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
340 345 350
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
355 360 365
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
370 375 380
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
385 390 395 400
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
405 410 415
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
420 425 430
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
435 440 445
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
450 455 460
Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
465 470 475 480
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
485 490 495
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
500 505 510
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
515 520 525
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
530 535 540
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
545 550 555 560
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly
565 570 575
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
580 585 590
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
595 600 605
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
610 615 620
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
625 630 635 640
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
645 650 655
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
660 665 670
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
675 680 685
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln
690 695 700
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
705 710 715 720
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
725 730 735
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
740 745 750
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
755 760 765
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
770 775 780
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
785 790 795 800
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
805 810 815
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
820 825 830
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
835 840 845
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
850 855 860
Pro Glu Leu Ile Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
865 870 875 880
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
885 890 895
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
900 905 910
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
915 920 925
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
930 935 940
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
945 950 955 960
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
965 970 975
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
980 985 990
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
995 1000 1005
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
1010 1015 1020
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu
1025 1030 1035
Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1040 1045 1050
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1055 1060 1065
<210> 64
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> TCR-alpha2-f 引物
<400> 64
ctctgcatga ctcactagca ctctat 26
<210> 65
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> TCR-alpha2-r 引物
<400> 65
gactgactta gtgagctggg aaagat 26
<210> 66
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> TCR-beta1-c1-f 引物
<400> 66
ctaatatgtg tcactacccc acgag 25
<210> 67
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> TCR-beta1-c1-r 引物
<400> 67
gagagttaca caggccacat agaaag 26
<210> 68
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> TCR-beta1-c2-f 引物
<400> 68
gaggagacat cacctggaat gttag 25
<210> 69
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> TCR-beta1-c2-r 引物
<400> 69
gatatattag gctgtgctct ggctct 26
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Va克隆用正向引物
<400> 70
tggaggagaa ccctggacct 20
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Va克隆用反向引物
<400> 71
ggtgaatagg cagacagact t 21
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Ca克隆用正向引物
<400> 72
gagactctaa atccagtgac 20
<210> 73
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Ca克隆用反向引物
<400> 73
gggggcggaa tttacgtagc ggccgctcag ctgct 35
<210> 74
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> Vb克隆用正向引物g
<400> 74
tgccggatct agctagttaa ttaaggatcc gaattcctgc agg 43
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Vb克隆用反向引物
<400> 75
ttcacccacc agctcagctc 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Cb克隆用正向引物
<400> 76
ttcacccacc agctcagctc 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Cb克隆用反向引物
<400> 77
aggtccaggg ttctcctcca 20
<210> 78
<211> 141
<212> PRT
<213> 人工序列
<220>
<223> 导入用TCRalpha恒定区域
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa可以为任意天然氨基酸
<400> 78
Xaa Ile Gln Asn Pro Asp Pro Ala Val Tyr Gln Leu Arg Asp Ser Lys
1 5 10 15
Ser Ser Asp Lys Ser Val Cys Leu Phe Thr Asp Phe Asp Ser Gln Thr
20 25 30
Asn Val Ser Gln Ser Lys Asp Ser Asp Val Tyr Ile Thr Asp Lys Thr
35 40 45
Val Leu Asp Met Arg Ser Met Asp Phe Lys Ser Asn Ser Ala Val Ala
50 55 60
Trp Ser Asn Lys Ser Asp Phe Ala Cys Ala Asn Ala Phe Asn Asn Ser
65 70 75 80
Ile Ile Pro Glu Asp Thr Phe Phe Pro Ser Pro Glu Ser Ser Cys Asp
85 90 95
Val Lys Leu Val Glu Lys Ser Phe Glu Thr Asp Thr Asn Leu Asn Phe
100 105 110
Gln Asn Leu Ser Val Ile Gly Phe Arg Ile Leu Leu Leu Lys Val Ala
115 120 125
Gly Phe Asn Leu Leu Met Thr Leu Arg Leu Trp Ser Ser
130 135 140
<210> 79
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 导入用TCRbeta恒定区域
<400> 79
Glu Asp Leu Asn Lys Val Phe Pro Pro Glu Val Ala Val Phe Glu Pro
1 5 10 15
Ser Glu Ala Glu Ile Ser His Thr Gln Lys Ala Thr Leu Val Cys Leu
20 25 30
Ala Thr Gly Phe Phe Pro Asp His Val Glu Leu Ser Trp Trp Val Asn
35 40 45
Gly Lys Glu Val His Ser Gly Val Ser Thr Asp Pro Gln Pro Leu Lys
50 55 60
Glu Gln Pro Ala Leu Asn Asp Ser Arg Tyr Cys Leu Ser Ser Arg Leu
65 70 75 80
Arg Val Ser Ala Thr Phe Trp Gln Asn Pro Arg Asn His Phe Arg Cys
85 90 95
Gln Val Gln Phe Tyr Gly Leu Ser Glu Asn Asp Glu Trp Thr Gln Asp
100 105 110
Arg Ala Lys Pro Val Thr Gln Ile Val Ser Ala Glu Ala Trp Gly Arg
115 120 125
Ala Asp Cys Gly Phe Thr Ser Val Ser Tyr Gln Gln Gly Val Leu Ser
130 135 140
Ala Thr Ile Leu Tyr Glu Ile Leu Leu Gly Lys Ala Thr Leu Tyr Ala
145 150 155 160
Val Leu Val Ser Ala Leu Val Leu Met Ala Met Val Lys Arg Lys Asp
165 170 175
Phe
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> alpha 2 L 的靶序列
<400> 80
tgtctgccta ttcaccgatt 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> alpha 2 R的 靶序列
<400> 81
tccttacttt gtgacacatt 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> beta 1 L 的靶序列
<400> 82
tgttcccacc cgaggtcgct 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> beta 1 R 的靶序列
<400> 83
tgtgggagat ctctgcttct 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> beta 3 L 的靶序列
<400> 84
tgtgcctggc cacaggcttc 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> beta 3 R 的靶序列
<400> 85
tcacccacca gctcagctcc 20
<210> 86
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN alpha 2 L 结合结构域
<400> 86
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
65 70 75 80
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
610 615 620
Gly Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 87
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN alpha 2 R 结合结构域
<400> 87
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
65 70 75 80
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
610 615 620
Gly Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 88
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN beta 1 L 结合结构域
<400> 88
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
65 70 75 80
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
610 615 620
Gly Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 89
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN beta 1 R 结合结构域
<400> 89
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
65 70 75 80
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
610 615 620
Gly Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 90
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN beta 3 L 结合结构域
<400> 90
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
65 70 75 80
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
610 615 620
Asp Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 91
<211> 633
<212> PRT
<213> 人工序列
<220>
<223> TALEN beta 3 R 结合结构域
<400> 91
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
35 40 45
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
50 55 60
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
65 70 75 80
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
85 90 95
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
100 105 110
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
115 120 125
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
130 135 140
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
195 200 205
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
260 265 270
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
340 345 350
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
370 375 380
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
405 410 415
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
465 470 475 480
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
530 535 540
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
565 570 575
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
580 585 590
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
595 600 605
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
610 615 620
Asp Gly Gly Arg Pro Ala Leu Glu Ser
625 630
<210> 92
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> QYD肽
<400> 92
Gln Tyr Asp Pro Val Ala Ala Leu Phe
1 5
<210> 93
<211> 13
<212> PRT
<213> 人源
<400> 93
Cys Ala Glu Thr Pro Thr Asn Asp Tyr Lys Leu Ser Phe
1 5 10
<210> 94
<211> 8
<212> PRT
<213> 人源
<400> 94
Ser Ser Gly Asn Gln Phe Tyr Phe
1 5
<210> 95
<211> 11
<212> PRT
<213> 人源
<400> 95
Cys Ala Asp Tyr Tyr Gly Gln Asn Phe Val Phe
1 5 10
<210> 96
<211> 16
<212> PRT
<213> 人源
<400> 96
Cys Ala Ser Ser Ser Glu Thr Glu Leu Leu Tyr Tyr Gly Tyr Thr Phe
1 5 10 15
<210> 97
<211> 15
<212> PRT
<213> 人源
<400> 97
Cys Ala Ser Ser Gln Gln Thr Gly Thr Ile Gly Gly Tyr Thr Phe
1 5 10 15
<210> 98
<211> 13
<212> PRT
<213> 人源
<400> 98
Cys Ala Ser Ser Phe Gln Gly Phe Thr Glu Ala Phe Phe
1 5 10
<210> 99
<211> 11
<212> PRT
<213> 人源
<400> 99
Cys Ala Ser Pro Thr Gly Asn Gln Phe Tyr Phe
1 5 10
<210> 100
<211> 13
<212> PRT
<213> 人源
<400> 100
Cys Ala Glu Ile Pro Ser Asn Asp Tyr Lys Leu Ser Phe
1 5 10
<210> 101
<211> 11
<212> PRT
<213> 人源
<400> 101
Cys Ala Ser Gly Ser Gln Gly Asn Leu Ile Phe
1 5 10
<210> 102
<211> 14
<212> PRT
<213> 人源
<400> 102
Cys Ala Gly Leu Thr Thr Asp Ser Trp Gly Lys Phe Gln Phe
1 5 10
<210> 103
<211> 12
<212> PRT
<213> 人源
<400> 103
Cys Ala Thr Tyr Leu Thr Gly Asn Gln Phe Tyr Phe
1 5 10
<210> 104
<211> 11
<212> PRT
<213> 人源
<400> 104
Cys Ala Val Cys Asn Phe Asn Lys Phe Tyr Phe
1 5 10
<210> 105
<211> 16
<212> PRT
<213> 人源
<400> 105
Cys Ala Ser Ser Phe Thr Leu Gly Thr Gly Gly Val Glu Gln Tyr Phe
1 5 10 15
<210> 106
<211> 13
<212> PRT
<213> 人源
<400> 106
Cys Ser Ala Arg Gly Gln Asp Ile Tyr Glu Gln Tyr Phe
1 5 10
<210> 107
<211> 14
<212> PRT
<213> 人源
<400> 107
Cys Ala Ser Gly Leu Thr Gly Phe Met Asp Glu Gln Tyr Phe
1 5 10
<210> 108
<211> 16
<212> PRT
<213> 人源
<400> 108
Cys Ala Ser Ser Val Asp Val Ala Gly Gly Tyr Asn Glu Gln Phe Phe
1 5 10 15
<210> 109
<211> 13
<212> PRT
<213> 人源
<400> 109
Cys Ala Ser Ser Gln Ala Leu Pro Tyr Glu Gln Tyr Phe
1 5 10
<210> 110
<211> 16
<212> PRT
<213> 人源
<400> 110
Cys Ala Ser Ser Ile Thr Leu Gly Thr Gly Gly Val Glu Gln Tyr Phe
1 5 10 15
<210> 111
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> 铂TALEN DNA 结合模块的氨基酸序列的示例
<400> 111
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 112
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> 铂TALEN DNA 结合模块的氨基酸序列的示例
<400> 112
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 113
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> 铂TALEN DNA 结合模块的氨基酸序列的示例
<400> 113
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 114
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> Zhang TALEN DNA 结合模块的氨基酸序列的示例
<400> 114
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 115
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HLA-A*0201-限制型 NY-ESO-1157-165
<400> 115
Ser Leu Leu Met Trp Ile Thr Gln Cys
1 5
<210> 116
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 1G4 TCRA CDR3
<400> 116
Cys Ala Val Arg Pro Thr Ser Gly Gly Ser Tyr Ile Pro Thr Phe
1 5 10 15
<210> 117
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 1G4 TCRB CDR3
<400> 117
Cys Ala Ser Ser Tyr Val Gly Asn Thr Gly Glu Leu Phe Phe
1 5 10
<210> 118
<211> 497
<212> DNA
<213> 人工序列
<220>
<223> 1G4 TCR Va 盒
<400> 118
tggaggagaa ccctggacct atggagaccc tcttgggcct gctgatcctg tggctgcagc 60
tgcagtgggt gagcagcaag caggaggtga cccagattcc tgccgccctg agcgtgcctg 120
aaggcgagaa tctggtgctg aactgcagct tcaccgacag cgccatctac aacctgcagt 180
ggttcagaca ggaccccggc aagggcctga ccagcctgct gctgatccag agcagccaga 240
gagagcagac cagcggcaga ctgaacgcca gcctggacaa gagcagcggc agaagcaccc 300
tgtatatcgc cgccagccag ccaggcgata gcgccaccta cctgtgtgcc gtgagaccaa 360
ccagcggcgg cagctatatc cccacctttg gcagaggcac cagcctgatc gtgcacccct 420
acatccagaa ccccgacccc gccgtgtacc agctgagaga ctctaaatcc agtgacaagt 480
ctgtctgcct attcacc 497
<210> 119
<211> 582
<212> DNA
<213> 人工序列
<220>
<223> 1G4 TCR Vb 盒
<400> 119
tgccggatct agctagttaa ttaaggatcc gaattcctgc aggatgagca tcggcctgct 60
gtgttgtgcc gccctgtctc tgctgtgggc tggaccagtg aatgccggcg tgacacagac 120
ccctaagttc caggtgctga agaccggcca gagcatgacc ctgcagtgcg cccaggacat 180
gaaccacgag tacatgagct ggtacagaca ggaccccggc atgggcctga gactgatcca 240
ctacagcgtg ggcgccggaa tcacagacca gggcgaggtg ccaaacggct acaacgtgag 300
cagaagcacc accgaggatt tcccactgag actgctgtct gccgccccaa gccagaccag 360
cgtgtacttt tgcgccagca gctacgtggg caacaccggc gagctgttct tcggcgaggg 420
cagcagactg accgtgctgg aggacctgaa gaacgtgttc cctcctgagg tggccgtgtt 480
tgagccaagc gaggccgaga tcagccacac ccaaaaggcc acactggtgt gcctggccac 540
aggcttcttc cccgaccacg tggagctgag ctggtgggtg aa 582
<210> 120
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 120
gtctgtctgc ctattcaccg attttgattc tcaaacaaat gtgtcacaaa gtaaggattc 60
<210> 121
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 121
cagacagacg gataagtggc taaaactaag agtttgttta cacagtgttt cattcctaag 60
<210> 122
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 122
gtctgtctgc ctattcaccg attgaagatt ttgattcaat gtgtcacaaa gtaaggattc 60
<210> 123
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 123
cagacagacg gataagtggc taacttctaa aactaagtta cacagtgttt cattcctaag 60
<210> 124
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 124
gtctgtctgc ctattcaccg attcaaacaa atgtgttaat gtgtcacaaa gtaaggattc 60
<210> 125
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 125
cagacagacg gataagtggc taagtttgtt tacacaatta cacagtgttt cattcctaag 60
<210> 126
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 126
gtctgtctgc ctattcaccg attttgattc aatgtgtcac aaagtaagga ttc 53
<210> 127
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 127
cagacagacg gataagtggc taaaactaag ttacacagtg tttcattcct aag 53
<210> 128
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 128
gtctgtctgc ctattcaccg attcaaacaa atgtgtcaca aagtaaggat tc 52
<210> 129
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 图24及图25中的核苷酸序列
<400> 129
cagacagacg gataagtggc taagtttgtt tacacagtgt ttcattccta ag 52
<210> 130
<211> 18
<212> DNA
<213> 小鼠(Mus musculus)
<400> 130
tctgcctgtt caccgact 18
<210> 131
<211> 20
<212> DNA
<213> 小鼠(Mus musculus)
<400> 131
aatgtgccga aaaccatgga 20
<210> 132
<211> 20
<212> DNA
<213> 小鼠(Mus musculus)
<400> 132
tgactccacc caaggtctcc 20
<210> 133
<211> 20
<212> DNA
<213> 小鼠(Mus musculus)
<400> 133
aaaagcagag attgcaaaca 20
<210> 134
<211> 20
<212> DNA
<213> 小鼠(Mus musculus)
<400> 134
tgtgcttggc caggggcttc 20
<210> 135
<211> 20
<212> DNA
<213> 小鼠(Mus musculus)
<400> 135
ggagctgagc tggtgggtga 20

Claims (35)

1.一种用于编辑TCR基因的组合物,其特征在于,
所述组合物含有包含DNA结合结构域及功能结构域的多肽或编码所述多肽的核酸,
其中,所述DNA结合结构域和所述功能结构域通过由35~55个氨基酸组成的多肽相连接,
DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数。
2.根据权利要求1所述的组合物,其特征在于,
所述DNA结合结构域和所述功能结构域通过由40~50个氨基酸组成的多肽相连接,
所述DNA结合结构域从N末端侧起连续地包含16~20个由34个氨基酸组成的DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合及从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合互不相同,
其中,n为1~5的自然数,
所述DNA结合结构域的来源为TALE。
3.根据权利要求1或2所述的组合物,其特征在于,所述功能结构域为DNA切断结构域。
4.根据权利要求1至3中任一项所述的组合物,其特征在于,所述DNA结合结构域与TCRα基因或TCRβ基因特异性结合。
5.根据权利要求1至4中任一项所述的组合物,其特征在于,所述DNA结合结构域与TRAC外显子1、TRBC1外显子1或TRBC2外显子1特异性结合。
6.根据权利要求1至5中任一项所述的组合物,其特征在于,所述DNA结合结构域与序列号80的核酸序列、序列号81的核酸序列、序列号82的核酸序列、序列号83的核酸序列、序列号84的核酸序列或序列号85的核酸序列特异性结合。
7.根据权利要求1至6中任一项所述的组合物,其特征在于,包含表达载体,所述表达载体含有编码所述多肽的所述核酸。
8.根据权利要求1至6中任一项所述的组合物,其特征在于,以mRNA的形式包含编码所述多肽的所述核酸。
9.一种编辑TCR基因的方法,其特征在于,包括将权利要求1~8中任一项所述的组合物导入细胞的步骤。
10.根据权利要求9所述的方法,其特征在于,包括:
所述DNA结合结构域与TCRα基因特异性结合的、将权利要求1~6中任一项所述的组合物导入细胞的步骤;以及
所述DNA结合结构域与TCRβ基因特异性结合的、将权利要求1~6中任一项所述的组合物导入细胞的步骤。
11.根据权利要求9或10所述的方法,其特征在于,所述TCR基因的编辑为内源性TCR基因的去除。
12.根据权利要求11所述的方法,其特征在于,还包括将外源性TCR基因导入所述细胞的步骤。
13.根据权利要求12所述的方法,其特征在于,所述外源性TCR具有对NY-ESO-1的特异性。
14.一种TCR修饰T细胞,其特征在于,通过权利要求13所述的方法制备。
15.一种包含权利要求14所述的TCR修饰T细胞的组合物,其特征在于,用于针对对象的癌症进行治疗。
16.根据权利要求15所述的组合物,其特征在于,所述癌症为NY-ESO-1阳性的癌症。
17.一种用于编辑TCR基因的组合物,其特征在于,
所述组合物包含编码含有DNA结合结构域的多肽的核酸,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数,
所述组合物与编码含有功能结构域的多肽的核酸配合使用。
18.一种用于编辑TCR基因的组合物,其特征在于,
所述组合物包含编码含有功能结构域的多肽的核酸,
所述组合物与编码含有DNA结合结构域的多肽的核酸配合使用,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数。
19.一种用于编辑TCR基因的配合物,其特征在于,
所述配合物包含编码含有DNA结合结构域的多肽的核酸和编码含有功能结构域的多肽的核酸,
其中,所述DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数。
20.一种多肽,其特征在于,
所述多肽包含DNA结合结构域及功能结构域,
其中,所述DNA结合结构域和所述功能结构域通过由35~55个氨基酸组成的多肽连接,
DNA结合结构域从N末端侧起连续地包含多个DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合及从N末端起第4n个DNA结合模块中的第x个氨基酸和第y个氨基酸的组合,互不相同,
其中,n为1~10的自然数,x为1~40的自然数,y为1~40的自然数,x和y为不同的自然数,
所述DNA结合结构域与TCRα基因或TCRβ基因特异性结合。
21.根据权利要求20所述的多肽,其特征在于,
所述DNA结合结构域和所述功能结构域通过由40~50个氨基酸组成的多肽连接,
所述DNA结合结构域从N末端侧起连续地包含16~20个由34个氨基酸组成的DNA结合模块,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,对于任意的n相同,
从N末端起第4n-3个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-2个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合、从N末端起第4n-1个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合及从N末端起第4n个DNA结合模块中的第4个氨基酸和第32个氨基酸的组合,互不相同,
其中,n为1~5的自然数,
所述DNA结合结构域的来源为TALE。
22.根据权利要求20或21所述的多肽,其特征在于,所述功能结构域为DNA切断结构域。
23.根据权利要求20至22中任一项所述的多肽,其特征在于,所述DNA结合结构域与TRAC外显子1、TRBC1外显子1或TRBC2外显子1特异性结合。
24.根据权利要求20至23中任一项所述的多肽,其特征在于,所述DNA结合结构域与序列号80的核酸序列、序列号81的核酸序列、序列号82的核酸序列、序列号83的核酸序列、序列号84的核酸序列或序列号85的核酸序列特异性结合。
25.根据权利要求20至24中任一项所述的多肽,其特征在于,所述DNA结合结构域包含序列号86的氨基酸序列、序列号87的氨基酸序列、序列号88的氨基酸序列、序列号89的氨基酸序列、序列号90的氨基酸序列或序列号91的氨基酸序列。
26.一种核酸,其特征在于,所述核酸编码权利要求20~25中任一项所述的多肽的全部或一部分。
27.一种用于编辑TCR基因的试剂盒,其特征在于,包含:
权利要求1~13所述的组合物或权利要求14所述的配合物;以及
确认内源性TCR基因变异的构件和/或确认内源性TCR基因去除的构件。
28.一种用于编辑TCR基因的试剂盒,其特征在于,包含:
权利要求1~13所述的组合物或权利要求14所述的配合物;以及
导入外源性TCR基因的构件和/或检测已导入基因的细胞的构件。
29.根据权利要求27或28所述的试剂盒,其特征在于,用于用外源性TCR基因取代内源性TCR基因。
30.根据权利要求27至29中任一项所述的试剂盒,其特征在于,用于制备TCR修饰调节性T细胞。
31.根据权利要求27至29中任一项所述的试剂盒,其特征在于,用于制备TCR修饰T细胞,所述TCR修饰T细胞表达具有对NY-ESO-1特异性的外源性TCR。
32.一种包含目标外源性TCR的细胞的细胞群,其特征在于,包含除所述目标外源性TCR以外的外源性TCR的细胞在所述细胞群中的比率为小于10%。
33.根据权利要求32所述的细胞群,其特征在于,所述外源性TCR具有对NY-ESO-1的特异性。
34.一种制备权利要求32所述的细胞群的方法,其特征在于,包括:
从细胞中去除内源性TCR的步骤;以及
将编码所述外源性TCR的核酸导入已去除所述内源性TCR的所述细胞中的步骤。
35.根据权利要求34所述的方法,其特征在于,所述外源性TCR具有对NY-ESO-1的特异性。
CN201880079381.3A 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术 Pending CN111479830A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311565442.6A CN117820491A (zh) 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2017197010 2017-10-10
JP2017-197010 2017-10-10
JP2018-167954 2018-09-07
JP2018167954 2018-09-07
PCT/JP2018/037590 WO2019073964A1 (ja) 2017-10-10 2018-10-09 Platinum TALENを用いたT細胞受容体の完全置換技術

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311565442.6A Division CN117820491A (zh) 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术

Publications (1)

Publication Number Publication Date
CN111479830A true CN111479830A (zh) 2020-07-31

Family

ID=66100896

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311565442.6A Pending CN117820491A (zh) 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术
CN201880079381.3A Pending CN111479830A (zh) 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311565442.6A Pending CN117820491A (zh) 2017-10-10 2018-10-09 使用铂talen的t细胞受体的完全取代技术

Country Status (6)

Country Link
US (1) US11788076B2 (zh)
EP (1) EP3702453A4 (zh)
JP (1) JP7207661B2 (zh)
CN (2) CN117820491A (zh)
TW (1) TWI814746B (zh)
WO (1) WO2019073964A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202124718A (zh) * 2019-11-14 2021-07-01 國立大學法人廣島大學 使用環狀dna將抗原特異性受體基因導入t細胞基因組之方法
EP4299723A1 (en) 2021-03-31 2024-01-03 PHC Corporation Genetically modified cell and method for producing same

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208866A (zh) * 2013-03-21 2015-12-30 桑格摩生物科学股份有限公司 使用工程化锌指蛋白核酸酶靶向断裂t细胞受体基因
US20160186151A1 (en) * 2013-08-09 2016-06-30 Hiroshima University Polypeptide Containing DNA-Binding Domain
WO2017070429A1 (en) * 2015-10-22 2017-04-27 Regents Of The University Of Minnesota Methods involving editing polynucleotides that encode t cell receptor

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060127377A1 (en) 2004-08-03 2006-06-15 Stanislav Vukmanovic T cell receptors with enhanced sensitivity recognition of antigen
DK2567226T3 (en) 2010-05-06 2016-10-10 Adaptive Biotechnologies Corp Monitoring the health and disease status using klonotypeprofiler
SG11201501471VA (en) 2012-09-04 2015-03-30 Cellectis Multi-chain chimeric antigen receptor and uses thereof
ES2716867T3 (es) 2013-05-31 2019-06-17 Cellectis Sa Endonucleasa de asentamiento LAGLIDADG que escinde el gen de receptor de células T alfa y usos de la misma
JP6164759B2 (ja) 2013-11-21 2017-07-19 Repertoire Genesis株式会社 T細胞受容体およびb細胞受容体レパトアの解析システムならびにその治療および診断への利用
EP3215168B1 (en) 2014-10-31 2023-08-02 The Trustees of the University of Pennsylvania Altering gene expression in modified t cells and uses thereof
MA44907A (fr) 2015-09-11 2018-07-18 Agenus Inc Cellules hôtes génétiquement modifiées et leurs procédés d'utilisation
JP6246258B2 (ja) 2016-04-25 2017-12-13 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
JP5997408B1 (ja) 2016-04-27 2016-09-28 川崎重工業株式会社 舶用プロペラ
JP6669119B2 (ja) 2017-03-30 2020-03-18 フジテック株式会社 乗り込み案内装置、乗客コンベア

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208866A (zh) * 2013-03-21 2015-12-30 桑格摩生物科学股份有限公司 使用工程化锌指蛋白核酸酶靶向断裂t细胞受体基因
US20160186151A1 (en) * 2013-08-09 2016-06-30 Hiroshima University Polypeptide Containing DNA-Binding Domain
WO2017070429A1 (en) * 2015-10-22 2017-04-27 Regents Of The University Of Minnesota Methods involving editing polynucleotides that encode t cell receptor

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TETSUSHI SAKUMA等: "Engineering customized TALENs using the platinum gate TALEN kit", 《TALENS》 *

Also Published As

Publication number Publication date
TWI814746B (zh) 2023-09-11
US11788076B2 (en) 2023-10-17
JPWO2019073964A1 (ja) 2021-01-14
TW201923081A (zh) 2019-06-16
EP3702453A4 (en) 2021-07-21
US20200362323A1 (en) 2020-11-19
WO2019073964A1 (ja) 2019-04-18
CN117820491A (zh) 2024-04-05
JP7207661B2 (ja) 2023-01-18
EP3702453A1 (en) 2020-09-02

Similar Documents

Publication Publication Date Title
US20210363258A1 (en) Hpv-specific binding molecules
US11952408B2 (en) HPV-specific binding molecules
JP6987134B2 (ja) ペプチドエピトープを同定する方法、そのようなエピトープに結合する分子および関連用途
AU2023274129A1 (en) Composition and methods of genome editing of B-cells
JP2021534783A (ja) キメラ抗原受容体発現細胞を作製する方法
CN111448312A (zh) 使用效应T细胞(Teff)抗原受体的抗原特异性调节性T细胞(Treg)的制作技术
CN108884140A (zh) 修饰的嵌合受体及相关组合物和方法
JP2020517308A (ja) Tcr及びペプチド
KR20220078611A (ko) 일차 인간 세포에서 동족 t 세포 및 에피토프 반응성을 스크리닝하기 위한 고처리량 방법
JP2023552441A (ja) SIRP-αエンゲージャーによる自然免疫細胞のサイレンシング
KR20220103928A (ko) 시험관 내 활성화 및 연쇄 살해 t 세포 집단의 확장 및 종양 세포 사멸 세포로 암 환자의 수동 면역화를 위한 조성물 및 방법
JP2022530139A (ja) 同種異系car-t細胞、その調製及び応用
CN111479830A (zh) 使用铂talen的t细胞受体的完全取代技术
WO2023200796A1 (en) Immune cell inhibition by immune checkpoint engagers
CA3221125A1 (en) Gene editing in primary immune cells using cell penetrating crispr-cas system
WO2020148207A1 (en) Human monoclonal antibodies binding to hla-a2
Herrin et al. B cells and antibodies in jawless vertebrates
Gräßel The surface atlas of human naive and activated CD4+ T cells
Lakshmipathi Isolation and functional characterization of antigen-specific TCRs from the healthy donor repertoire.
WO2023230014A1 (en) Binding proteins and engineered cells specific for neoantigens and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination