CN1714102A

CN1714102A - T细胞受体展示

Info

Publication number: CN1714102A
Application number: CN 200380102928
Authority: CN
Inventors: B·K·雅各布森; T·B·安德森; P·E·莫洛伊; 李懿; J·M·伯尔特
Original assignee: Avidex Ltd
Current assignee: Immunocore Ltd; Adaptimmune Ltd
Priority date: 2002-11-09
Filing date: 2003-10-30
Publication date: 2005-12-28
Anticipated expiration: 2023-10-30
Also published as: ZA200503336B; CN100551931C; GB0226227D0

Abstract

一种例如噬菌体、核糖体或细胞的蛋白质性质的颗粒，在其表面展示了一种T细胞受体(TCR)。展示的TCR优选地是在恒定结构域残基之间具有非天然二硫键的异源二聚体。这样的展示颗粒可以用于建立多样性的TCR文库以鉴别高亲和性TCR。公开了几种高亲和性TCR。

Description

T细胞受体展示

本发明涉及展示T细胞受体(TCR)的蛋白质性质的颗粒，例如噬菌体或核糖体颗粒，及其不同的文库。

发明背景

天然T细胞受体(TCR)

如在例如WO99/60120中所述的，TCR介导T细胞对特异性主要组织相容性复合物(MHC)-肽复合体的识别，这是免疫系统细胞免疫发挥功能的基础。

抗体和TCR是仅有的两种以特异方式识别抗原的分子，并且TCR因而是针对MHC提呈的特定抗原肽的唯一受体，异物肽经常是细胞内异常的唯一标志。当T细胞与抗原提呈细胞(APC)之间发生直接物理接触时，发生T细胞识别，并由抗原特异性TCR与pMHC复合物连接启动。

天然TCR是一种免疫球蛋白超家族的异源二聚细胞表面蛋白，它与参与介导信号转导的CD3复合体的固定蛋白相连。TCR以αβ和γδ形式存在，两者结构上相似但具有完全不同的解剖学定位以及或许不同的功能。I类和II类MHC配体也是免疫球蛋白超家族蛋白质但具有使其能够提呈大量不同APC细胞表面短肽片段的高度多样性的肽结合位点，专门用以抗原提呈。

已知两种进一步类型的蛋白质能够如TCR配体发挥作用。(1)CD1抗原是MHC I类相关分子，其基因位于不同于经典MHC I类和II类抗原的染色体上。CD1分子能以类似于常规I类和II类MHC-肽复合物的形式向T细胞提呈肽和非肽(例如脂、糖脂)部分。参见，例如Barclay等所著《白细胞抗原概述》(The Leucocyte AntigenFactsbook)，第2版，(1997)以及Bauer(1997)Eur J Immunol 27(6)1366-1373。(2)细菌超抗原是能够结合II类MHC分子和一部分TCR的可溶性毒素(Fraser(1989)Nature 339 221-223)。许多超抗原显示出对一种或两种Vβ片段的特异性，而其他表现出更随意的结合。任何情况下，超抗原能依靠其以多克隆方式激活一部分T细胞的能力引起增强的免疫反应。

异源二聚的αβ和γδ TCR的胞外部分包括两条多肽，其中每条具有一个近膜的恒定结构域和一个远膜的可变结构域。每个恒定结构域和可变结构域包含一个链内二硫键。可变结构域包含类似于抗体互补决定区(CDR)的高多态性环。αβTCR的CDR3与MHC提呈的肽相互作用，并且αβTCR的CDR1和CDR2与肽和MHC相互作用。TCR序列的多态性通过连锁的可变结构域(V)、多样性(D)、连接区(J)和恒定基因的体细胞重排产生。

功能性α和γ链多肽由重排的V-J-C区形成，而β和δ链多肽包含V-D-J-C区。胞外恒定结构域具有近膜区和免疫球蛋白区。存在单一的α和δ链恒定结构域，分别称为TRAC和TRDC。β链恒定结构域由两种称为TRBC1和TRBC2(IMGT命名法)的不同β恒定结构域中的一种构成。在这些β恒定结构域之间存在4个氨基酸的改变，其中3个位于用于产生展示在本发明的噬菌体颗粒上的单链TCR的结构域内部。这些改变都位于TRBC1和TRBC2的外显子1内部：N₄K₅->K₄N₅和F₃₇->Y(IMTG编号，TRBC1->TRBC2差异)，最后一个两种TCRβ链之间的氨基酸改变在TRBC1和TRBC2的外显子3中：Vi->E。恒定的γ结构域由TRGC1、TRGC2(2X)或TGRC2(3X)之一构成。这两种TGRC2恒定结构域只是在所述基因外显子2所编码的氨基酸拷贝数上有所不同。

每种TCR胞外结构域的范围有些变化。然而，精通本领域的人员可以使用诸如《T细胞受体概述》(The T Cell Receptor Facts Book，Lefranc & Lefranc，Publ.Academic Press 2001)等参考方便地确定结构域边界的位置。

重组TCR

生产重组TCR是有好处的，因为它们提供了适用于以下目的的可溶性TCR类似物：

研究TCR/配体相互作用(例如pMHC与αβ TCR)

筛选TCR相关相互作用的抑制剂

为潜在的治疗方法提供基础

目前已经设计出了多种构件以生产重组TCR。这些构件分成单链TCR和二聚TCR两大类，下面总结了与这两种构件相关的文献。

单链TCR(scTCR)是由单一氨基酸链构成的人工构件，它类似于天然异源二聚TCR与MHC-肽复合物结合。不幸地，通过简单地连接α和β链从而使两者在单一的开放读框中表达而生产功能性α/β类似物scTCR的尝试还没有获得成功，大概是由于α-β可溶性结构域对的天然不稳定性。

相应地，使用α链和β链之一或两者的各种截短序列的专门技术对于生产scTCR是必需的。这些方式似乎只可用于非常有限的scTCR序列。Soo Hoo等在(1992)PNAS.89(10)：4759-63中报道了通过使用用一种25个氨基酸的连接物连接的截短的α和β链与细菌周质表达的2CT细胞克隆中单链形式的小鼠TCR的表达(也可参见Schodin等，(1996)Mol.Immunol.33(9)：819-29)。这一设计也形成了Holler等在(2000)PNAS.97(10)：5387-92中报道的源自2C scTCR的并与相同的H2-Ld-限制性异构表位(alloepitope)结合的m6单链TCR的基础。Shusta等在(2000)NatureBiotechnology 18：754-759中以及美国专利6,423,538中报道了在产生突变TCR的酵母展示实验中使用小鼠单链2C TCR构件提高热稳定性和可溶性。这一报道也说明了这些展示的2C TCR选择性结合表达其同类pMHC细胞的能力。Khandekar等在(1997)J.Biol.Chem.272(51)：32190-7中报道了针对小鼠D10 TCR的类似的设计，虽然这一scTCR与MBP融合并在细菌胞质中表达(可见Hare等，(1999)Nat.Struct.Biol.6(6)：574-81)。Hilyard等在(1994)PNAS.91(19)：9057-61中报道了通过使用Vα-连接物-Vβ设计并在细菌周质表达的一种感冒病毒基质蛋白HLA-A2特异性的人scTCR。

Chung等在(1994)PNAS.91(26)12654-8中报道了使用Vα-连接物-Vβ-Vβ设计并在哺乳动物细胞系表面表达的人scTCR的生产。该报道不涉及scTCR的任何肽-HLA特异性结合。Plaksin等在(1997)J.Immunol.158(5)：2218-27中报道了一种类似的Vα-连接物-Vβ-Vβ设计以生产针对HIV gp120-H-2D^d表位的小鼠特异性scTCR。该scTCR以细菌包含体形式表达并在体外复性。

许多文献描述了包含连接相应亚基的天然二硫键的TCR异源二聚体的生产(Garboczi等，(1996)，Nature 384(6605)：134-41；Garboczi等，(1996)，J Immunol157(12)：5403-10；Chang等，(1994)，PNAS USA 91：11408-11412；Davodeau等，(1993)，J.Biol Chem.268(21)：15455-15460；Golden等，(1997)，J.Imm.Meth.206：163-169；美国专利No.6080840)。然而，虽然这样的TCR能被TCR特异抗体识别，它们是不稳定的并且不能识别其天然配体，除非这些配体达到相对高浓度。

在WO 99/60120中描述了一种正确折叠的可溶性TCR，因此它能够识别其天然配体，在一段时加内稳定的，并能够以合理的数量生产。这种TCR包括通过一对C末端二聚化肽(诸如亮氨酸拉链)与一个相应的TCRβ或δ链胞外结构域二聚的一个TCRα或γ链胞外结构域。这一生产TCR的策略通常适用于所有TCR。

Reiter等在Immunity，1995，2：281-287中详细描述了包括由二硫键稳定的TCRα和β可变结构域，其中之一与假单胞菌(Pseudomonas)外毒素(PE38)相连的可溶性分子的构建。生产这一分子的理由之一是克服单链TCR固有的不稳定性。这种TCR可变结构域中新的二硫键的位置通过与抗体可变结构域(这些二硫键先前曾被导入过，参见例如Brinkmann等(1993)，Proc.Natl.Acad.Sci.USA 90：7538-7542，以及Reiter等(1994)Biochemistry 33：5451-5459)的同源性进行鉴别。然而，由于在抗体和TCR的恒定结构域之间没有这样的同源性，这样的技术不能用于鉴别TCR恒定结构域之间新的链间二硫键的合适位点。

如以上提到的，Shusta等在(2000)Nature Biotechnology 18：754-759中报道了在酵母展示实验中使用单链2C TCR构件。以前对于在噬菌体颗粒上展示scTCR已进行过讨论。例如，WO 99/19129详细描述了scTCR的生产，并且总结了用于展示Vα-连接物-VβCβ形式的scTCR的噬菌体颗粒的生产的潜在方法。然而，该申请没有包含说明所述展示TCR的噬菌体颗粒的生产的例证。该申请仍然参考了一份未决申请：“在所述的未决美国专利申请08/813,781中已经描述了包含与噬菌体外被蛋白(基因II或基因VIII)融合的编码scTCR分子的DNA片段的DNA载体的构建。”

而且，该申请依赖于抗TCR抗体或超抗原MHC复合物识别产生的可溶的、非噬菌体展示的scTCR的能力以证实其正确构象。因此，scTCR的真正的肽-MHC结合特异性没有以任何形式进行确定地说明。最后，进一步的研究(Onda等，(1995)MolecularImmunology 32(17-18)1387-1397)公开了在不存在其相应β链的情况下两条小鼠TCRα链的噬菌体展示。这一研究说明，展示所述TCRα链(源自A1.1小鼠杂交瘤)之一的噬菌体颗粒优先与固定在微量滴定孔中的、与由小鼠I类MHC I-A^d提呈时完整TCR会正常反应的相同的肽结合。

筛选应用

包括TCR介导的免疫突触在内的多种重要的细胞相互作用和细胞反应是由细胞表面受体和呈现在其他细胞表面的配体之间的接触控制的。这些特异的分子接触类型对于人体内正确的生化调节具有重要意义，因而是研究热点。在许多情况下，这样研究的目标是设计调节细胞反应的方法以防止或治疗疾病。

因此，用于鉴别具有一定特异性的与人类受体或配体结合的化合物的方法是重要的，因为这会引导新的疾病治疗方法的发现和发展。尤其是干扰某些受体-配体相互作用的化合物具有立即作为治疗物质或载体的能力。

组合化学的进展能较简便和有效地产生非常庞大的化合物文库，这已经提高了大规模化合物检测的范围。现在，筛选程序的限制最常见存在于能够使用的检测法的性质、适当的受体与配体分子的生产以及这些检测法适于高通量筛选方法的程度。

展示方法

经常需要在蛋白质性质的颗粒表面呈现一种给定的肽或多肽。这样的颗粒可以作为肽或多肽纯化的辅助方式(因为这些携带肽或多肽的颗粒可以通过沉淀或其他方法与不需要的杂质分离)。它们也可以用作微粒疫苗，针对表面展示的肽或多肽的免疫应答通过微粒提呈得以激活。酵母反转位子蛋白质p24和肝炎B表面外被蛋白是自装配成颗粒的蛋白质的例子。感兴趣的肽或多肽与这些颗粒形成蛋白的融合是在生成的颗粒表面提呈所述肽或多肽的一种认可的方式。

然而，颗粒展示方法主要已用于鉴别具有诸如增强的表达量、结合和/或稳定特性等所需性质的蛋白质。这些方法包括创建在蛋白质性质的颗粒表面表达蛋白或多肽的多样库或“文库”。这些颗粒具有两个关键特征，第一，每个颗粒提呈单一的蛋白质或多肽，以及第二，编码所表达的蛋白或多肽的遗传材料与所述颗粒的遗传材料相连。随后所述文库进行一轮或多轮筛选。例如，这可以包括将一种配体与一种突变受体的颗粒展示文库接触并鉴别哪种突变受体以最高亲和性结合所述配体。一旦筛选过程完成，具有所需性质的受体可以进行分离，并且其遗传材料可以扩增以对所述受体进行测序。这些展示方法分为两大类，体外展示和体内展示。

所有体内展示方法依赖于以下步骤，其中通常将由诸如质粒或噬菌体复制子的可复制颗粒的遗传核酸转化细胞以表达蛋白或多肽(Pliickthun(2001)Adv ProteinChem 55 367-403)。存在多种已证实适于蛋白或多肽体内展示的复制子/宿主系统。这些系统包括：

噬菌体/细菌细胞

质粒/CHO细胞

基于酵母2μm质粒的载体/酵母细胞

杆状病毒/昆虫细胞

质粒/细菌细胞

体内展示方法包括细胞表面展示方法，其中将编码由感兴趣的蛋白质或多肽与一种细胞表面蛋白或多肽构成的融合蛋白的质粒导入宿主细胞。这一融合蛋白的表达导致感兴趣的蛋白或多肽展示在细胞表面。展示这些感兴趣的蛋白或多肽的细胞随后可以用于如FACS等筛选过程，并且从选出的细胞中得到的质粒可以进行分离和测序。对哺乳动物细胞(Higuschi(1997)J Immunol.Methods 202 193-204)、酵母细胞(Shusta(1999)J Mol Biol 292 949-956)和细菌细胞(Sameulson(2002)J.Biotechnol 96(2)129-154)已经设计了细胞表面展示系统。

已经公开了多种体内展示技术的大量综述，例如Hudson(2002)Expert Opin BiolTher(2001)1(5)845-55以及Schmitz(2000)21(Supp A)S106-S112。

体外展示方法建立在核糖体基础上以将mRNA文库翻译成为蛋白质或多肽的多样阵列。形成的蛋白质或多肽与编码这些分子的mRNA之间的连接是通过两种方法之一维持的。常规的核糖体展示采用编码短的连接序列(通常40-100个氨基酸)和需要展示的蛋白质或多肽的mRNA序列。连接序列为展示的蛋白或多肽提供足够的空间以重折叠而不会被核糖体产生空间位阻。所述mRNA序列缺乏“终止”密码子，这确保表达的蛋白或多肽及RNA与核糖体颗粒保持连接。相关的mRNA展示方法建立在制备编码感兴趣的蛋白或多肽与携带嘌呤霉素部分的DNA连接物的mRNA基础上。一旦核糖体到达mRNA/DNA接头处，翻译就停止，并且嘌呤霉素与核糖体形成共价连接。关于这两种相关的体外展示方法的近期的综述参见Amstutz(2001)Curr OpinBiotechnol 12 400-405。

尤其优选地是基于噬菌体颗粒表达与其表面蛋白融合的异源肽或多肽能力的噬菌体展示技术(Smith(1985)Science 217 1315-1317)。对于多肽单体展示的过程是相当通用的，并且是本领域内熟知的。然而，当天然形式结合为二聚体的多肽的情况下，似乎只有抗体的噬菌体展示已经得到了彻底研究。

对于单体多肽展示而言，存在两种主要过程：

第一种(方法A)是通过将编码与编码噬菌体外被蛋白的DNA融合的异源肽或多肽的DNA插入载体(噬菌粒)。随后通过用噬菌粒转染细菌细胞、并随后用“辅助噬菌体”感染转化的细胞，进行展示异源肽或多肽的噬菌体颗粒的表达。辅助噬菌体作为所述噬菌粒未编码的、产生功能性噬菌体颗粒所需的噬菌体蛋白的来源。

第二种(方法B)，通过将编码异源肽或多肽的DNA插入与编码噬菌体外被蛋白DNA融合的完整噬菌体基因组。随后通过用噬菌体基因组感染细菌细胞进行展示异源肽或多肽的噬菌体颗粒的表达。该方法比第一种方法具有“单一步骤”过程的优势。然而，降低了能成功包装入最终噬菌体颗粒的异源DNA序列的大小。适用于这一方法的噬菌体的例子有M13、T7和λ噬菌体。

方法B的一种变形包括向噬菌体基因组中编码需展示的异源肽的DNA添加编码核苷酸结合结构域的DNA序列，以及进一步向噬菌体基因组添加相应的核苷酸结合位点。这使得所述异源肽直接与噬菌体基因组相连。这一肽/基因组复合物随后装入展示异源肽的噬菌体颗粒中。WO 99/11785中完整描述了这一方法。

随后可以重新获得噬菌体颗粒并用于研究所述异源肽或多肽的结合特征。一旦分离，噬菌粒或噬菌体DNA可以从展示肽或多肽的噬菌体颗粒中重新获得，并且该DNA可以通过PCR复制。PCR产物可以用于对由特定噬菌体颗粒展示的异源肽或多肽进行测序。

单链抗体及其片段的噬菌体展示已成为研究这些多肽结合特征的常规方法。有多种书籍对噬菌体展示技术与噬菌体生物学作了综述(例如，参见Barbas等所著的《噬菌体展示一实验室手册》(Phage Display-A Laboratory Manual，2001，Cold SpringHarbour Laboratory Press)。

第三种噬菌体展示方法(方法C)建立在在需要位置具有半胱氨酸残基的异源多肽可以以可溶形式被噬菌粒或噬菌体基因组表达，并且引起与在表面暴露位置也具有半胱氨酸残基的改进的噬菌体表面蛋白通过所述两个半胱氨酸之间形成二硫键连接这一事实。WO 01/05950详细描述了针对单链抗体衍生肽的这种另外的连接方法的使用。

发明概述

天然TCR是具有维持作为功能性二聚体的稳定性所需的长的跨膜结构域的异源二聚体。如上所述，对于研究和治疗目的而言有用的是可溶形式的TCR，因此很少采用不溶的天然形式的展示。另一方面，可溶的稳定形式的TCR已被证明难以设计，并且由于大部分展示方法似乎仅对单体肽和多肽进行了描述，适于可溶二聚体TCR的展示技术还没有进行研究。而且，由于展示的TCR的功能取决于TCR二聚体可变结构域的正确连接，功能性二聚体TCR的成功展示并非微不足道的。

WO 99/18129包含这样的陈述：“按照1997年3月7日提交的未决美国申请No.08/813.781，其公开通过参考结合在本申请书中，编码scTCR融合蛋白的DNA构件可用于制备噬菌体展示文库”，但在该申请中没有包含这样的展示的实际描述。然而，该申请的发明人发表了一篇论文(Weidanz(1998)J Immunol Methods 221 59-76)，说明了两种小鼠scTCR在噬菌体颗粒上的展示。

WO 01/62908共开了用于scTCR和scTCR/Ig融合蛋白噬菌体展示的方法。然而，没有对公开的构件的功能(特异性pMHC结合)进行评估。

最后，针对小鼠TCR示范了逆转录病毒介导的用于多样的TCR文库在不成熟T细胞表面展示的方法。展示在未成熟T细胞表面的突变的TCR文库使用pMHC四聚体通过流式细胞仪进行筛选，并且这导致鉴别对同类pMHC特异的或其变体的TCR形式(Helmut等，(2000)PNAS 97(26)14578-14583)。

本发明部分建立在单链和二聚体TCR可以以与蛋白质性质的颗粒表面融合的形式表达，并可以利用展示α/β类似物和γ/δ类似物scTCR和dTCR构件的蛋白质颗粒的发现基础上。在这之上展示TCR的蛋白质性质的颗粒包括自聚合颗粒形成蛋白、噬菌体、病毒来源蛋白、核糖体颗粒以及具有TCR共价连接的细胞表面蛋白或多肽分子的细胞。这样的蛋白质颗粒展示的TCR对于纯化和筛选目的来说是有用的，尤其是作为颗粒展示的TCR的多样性文库用于生物淘选以鉴别具有诸如针对靶MHC-肽复合物高亲和性等需要特征的TCR。就后面这一点来说，颗粒展示的scTCR可以用于所需TCR的鉴别，但所述信息可能更好应用于最终用于治疗的类似物二聚体TCR的构件。本发明也包括可通过这些方法确定的高亲和性TCR。

发明详述

在一个主要的方面，本发明提供了一种在其表面展示T细胞受体(TCR)的蛋白质颗粒，其中

(i)所述蛋白质颗粒是核糖体并且所述TCR是单链TCR(scTCR)多肽、或二聚体TCR(dTCR)多肽对，或

(ii)所述蛋白质颗粒是噬菌体颗粒，或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞，以及所述TCR是人scTCR或人dTCR多肽对，或

(iii)所述蛋白质颗粒是噬菌体颗粒，或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞，以及所述TCR是非人dTCR多肽对，或

(iv)所述蛋白质颗粒是噬菌体颗粒，或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞，且所述TCR是scTCR多肽，该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列，连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列，以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。

在一种优选的实施方案中，本发明提供了一种在表面展示一种二聚体T细胞受体(dTCR)多肽对、或一种单链T细胞受体(scTCR)多肽的蛋白质颗粒，其中所述dTCR多肽对由与存在于天然TCR链中的胞外恒定和可变结构域序列相对应的TCR氨基酸序列组成，所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相对应的氨基酸序列和连接序列组成，所述连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列；其中dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致，并且在所述scTCR多肽的情况下，天然TCR中不存在等价物的二硫键连接所述多肽的残基。在按照本发明展示αβ scTCR或dTCR的情况下，对α和β片段的可变结构域序列的相互定位与天然αβTCR中的定位基本一致的要求只是TCR功能性的另一种说法，并且这可以通过证实所述分子与相关的TCR配体(pMHC复合物、CD-1抗原复合物、超抗原或超抗原/pMHC复合物)结合进行检测—如果结合，则该要求得到满足。与pMHC复合物的相互作用可以使用Biacore 3000^TM或Biacore 2000^TM工具进行测量。WO99/6120提供了分析TCR与MHC-肽复合物结合所需的方法的详细描述。这些方法可以相同地应用于TCR/CD1和TCR/超抗原相互作用的研究。为了将这些方法应用于TCR/CD1相互作用的研究，需要可溶形式的CD1，在Bauer(1997)EurJ Immunol 27(6)1366-1373中描述了其生产过程。在本发明的γδTCR的情况下，这些分子的同类配体是未知的，因而可以使用诸如抗体识别等验证其构象的二级方法。δ链可变结构域特异的单克隆抗体MCA991T(得自Serotec)是适于该任务的抗体的例子。

本发明的scTCR或dTCR可以通过例如以下两种方式被展示在蛋白质颗粒上，例如噬菌体颗粒上，优选地是丝状噬菌体颗粒上：

(i)dTCR多肽对的一个成员的C末端，或scTCR多肽的C末端，或与任一上述C末端相连的短肽连接物的C末端可以通过肽键与蛋白质颗粒的表面暴露残基直接相连。例如，所述表面暴露残基优选地位于噬菌体基因III或基因VIII的基因产物的N末端；以及

(ii)dTCR多肽对的一个成员的C末端，或scTCR多肽的C末端，或与任一上述C末端相连的短肽连接物的C末端经导入的半胱氨酸残基通过二硫键与蛋白质颗粒表面暴露的半胱氨酸相连。例如，所述表面暴露残基也是优选地位于噬菌体基因III或基因VIII的基因产物的N末端。

优选的是以上方法(i)。在scTCR的情况下，编码TCR的核酸可以与编码如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或表面蛋白的核酸融合。另外，代表mRNA但没有终止密码子的核酸、或与嘌呤霉素RNA融合的核酸可以由核糖体翻译，从而所述TCR保持与核糖体颗粒的融合。在dTCR的情况下，编码TCR一条链的核酸可以与编码诸如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或细胞表面蛋白的核酸融合，并且TCR多肽对的第二条链可以与展示第一条链的最终表达的颗粒相连。两条链的正确功能性连接可以如以下更全面地讨论的，由两条链的恒定结构域中存在的能形成链间二硫键的半胱氨酸辅助。

展示的scTCR

展示的scTCR多肽可以是例如具有以下组分的分子：

由与对应于TCR α链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR α或δ链可变结构域序列的氨基酸序列组成的第一片段，

由与对应于TCR β链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR β或γ链可变结构域序列的氨基酸序列组成的第二片段，

连接第一片段C末端和第二片段N末端的连接序列，或反之亦然，以及

第一和第二条链之间的二硫键，所述二硫键在天然αβ或γδ T细胞受体中不存在等价物，

连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互定位与天然αβ或γδ T细胞受体中的定位基本一致。

另外，展示的scTCR可以是具有以下组分的分子：

由对应于TCR α或δ链可变结构域的氨基酸序列组成的第一片段，

由与对应于TCR β链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR β或γ链可变结构域序列的氨基酸序列组成的第二片段，以及

连接第一片段C末端和第二片段N末端的连接序列，

条件是其中所述蛋白质颗粒是噬菌体，所述scTCR对应于人TCR；或是有以下组分的分子

由对应于TCR β或γ链可变结构域的氨基酸序列组成的第一片段，

由与对应于TCR α链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR α或δ链可变结构域序列的氨基酸序列组成的第二片段，以及

连接第一片段C末端和第二片段N末端的连接序列

条件是其中所述蛋白质颗粒是噬菌体，所述scTCR对应于人TCR。

展示的dTCR

展示在蛋白质颗粒上的dTCR可以是由以下组分组成的分子：

对应于TCR α或δ链可变结构域序列的序列与对应于TCR α链恒定结构域胞外序列的序列的N末端融合的第一多肽，以及

对应于TCR β或γ链可变结构域序列的序列与对应于TCR β链恒定结构域胞外序列的序列的N末端融合的第二多肽，

第一和第二多肽通过在天然αβ或γδ T细胞受体中不存在等价物的二硫键连接。

优选地，所述dTCR展示在丝状噬菌体上并且是由以下组分组成的分子

对应于TCR α链可变结构域序列的序列与对应于TCR α链恒定结构域胞外序列的序列的N末端融合的第一多肽，以及

对应于TCR β链可变结构域序列的序列与对应于TCR β链恒定结构域胞外序列的序列的N末端融合的第二多肽，

第一和第二多肽通过取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01或其非人类等价物的外显子1的Ser57的半胱氨酸残基之间的二硫键连接，

所述dTCR多肽对一个成员的C末端通过肽键与噬菌体的外被蛋白相连。

dTCR多肽对和scTCR多肽

存在于scTCR或dTCR中的恒定结构域胞外序列优选地对应于人TCR的这些部分，对于可变结构域序列也是这样。然而，这样的序列之间的对应并不需要氨基酸水平上一一对应。相对于对应的人TCR序列的N-或C-截短、和/或氨基酸缺失和/或取代是允许的。尤其因为存在于第一和第二片段中的恒定结构域胞外序列并不直接参与与scTCR或dTCR结合的配体的接触，相对于天然TCR的胞外恒定结构域序列，它们可以更短一些，或可以包含取代或缺失。

存在于dTCR多肽对之一或scTCR多肽第一片段中的恒定结构域胞外序列可以包括对应于TCR α链的胞外恒定Ig结构域的序列，并且/或存在于dTCR多肽对另一个成员或scTCR多肽第二片段中的恒定结构域胞外序列可以包括对应于TCR β链的胞外恒定Ig结构域的序列。

在本发明的一种实施方案中，dTCR多肽对的一个成员，或scTCR多肽的第一片段，对应于与TCR α链恒定结构域的充分完整的胞外结构域的N末端融合的TCRα链充分完整的可变结构域；和/或多肽对的另一个成员或第二片段对应于与TCR β链恒定结构域的充分完整的胞外结构域的N末端融合的TCR β链充分完整的可变结构域。

在另一种实施方案中，存在于dTCR多肽对或scTCR多肽第一和第二片段中的恒定结构域胞外序列对应于C末端截短的天然TCR的α和β链的恒定结构域，从而排除了形成TCR的天然链间二硫键的半胱氨酸残基。另外，这些半胱氨酸残基可以被其他诸如丝氨酸或丙氨酸等氨基酸残基取代，从而删除了天然二硫键。此外，天然TCR β链包含一个不成对的半胱氨酸残基，在本发明scTCR的β序列中，该残基可以删除或由非半胱氨酸残基取代。

在本发明的特定实施方案中，存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域，并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列，第一和第二个TCR来自相同的物种。因而，存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链可变结构域序列可以对应于第一种人TCR可变结构域序列，并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如，A6 Tax sTCR恒定结构域胞外序列可用作骨架，在这之上可以融合异源α和β可变结构域。

在本发明的另一种实施方案中，分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR δ和γ链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域，并且分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列，第一和第二个TCR来自相同的物种。因而，存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR δ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列，并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如，A6 Tax sTCR恒定结构域胞外序列可用作骨架，在这之上可以融合异源γ和δ可变结构域。

在本发明的一种特定实施方案中，存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β、或δ和γ链可变结构域序列可以共同对应于第一种人TCR的功能性可变结构域，并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。因而，存在于dTCR或scTCR多肽的第一和第二片段中的TCR α和β、或δ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列，并且α和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。例如，小鼠TCR恒定结构域胞外序列可以用作骨架，在这之上可以融合异源人α和βTCR可变结构域。

scTCR多肽中的连接物

对于本发明的展示scTCR的蛋白质颗粒而言，连接序列连接第一和第二个TCR片段以形成单一的多肽链。所述连接序列可以，例如，具有式-P-AA-P-，其中P是脯氨酸，并且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。

对于由本发明的蛋白质颗粒展示的scTCR与配体(在αβTCR的情况下是MHC-肽复合物)结合而言，第一和第二片段配对从而其可变结构域序列的定位适于这样的结合。因此，连接序列应具有足够长度以跨越第一片段C末端与第二片段N末端之间或反之亦然的距离。另一方面，在可变结构域序列N末端的连接序列末端阻碍或减弱scTCR与靶配体结合的情况下，优选地应避免连接序列的过度长度。

例如，在其中存在于第一和第二片段中的恒定结构域胞外序列对应于C末端截短以去除形成天然链间二硫键的半胱氨酸残基的天然TCR的α和β链的恒定结构域，并且连接序列连接第一片段的C末端与第二个序列的N末端的情况下。

连接序列可以包括例如26-41个氨基酸，优选地29、30、31或32个氨基酸，或33、34、35、或36个氨基酸。特定的连接物具有式-PGGG-(SGGGG)₅-P-和-PGGG-(SGGGG)₆-P-，其中P是脯氨酸，G是甘氨酸，以及S是丝氨酸。

链间二硫键

由本发明的蛋白质颗粒所展示的优选的dTCR和scTCR的一个特征要素是dTCR多肽对之间或scTCR第一和第二片段之间的二硫键。二硫键可以对应于存在于天然二聚体αβ TCR中的天然链间二硫键，或可以在天然TCR中不存在对应物，存在于特异结合入dTCR多肽对或scTCR多肽第一个或第二片段的恒定结构域胞外序列的半胱氨酸之间。在有些情况下，天然和非天然二硫键都可能是需要的。

二硫键的位置满足dTCR多肽对或scTCR多肽第一和第二片段的可变结构域序列充分类似天然αβ或γδ T细胞受体中相互定位的要求。

二硫键可以通过第一和第二片段上非半胱氨酸残基突变为半胱氨酸，并引发突变残基之间的键形成得以形成。天然TCR中其各自β碳原子分开约为6(0.6nm)或更小，并且优选地位于3.5(0.35nm)到5.9(0.59nm)的区间内的残基是优选的，这样可以在天然残基的位置上导入的半胱氨酸残基之间形成二硫键。虽然可以位于近膜结构域的残基之间，优选地是如果二硫键位于恒定免疫球蛋白结构域中的残基之间。可以导入半胱氨酸以形成二硫键的优选位置是TCR α链的TRAC*01的和TCR β链的TRBC1*01或TRBC2*01的外显子1中的以下残基：

TCR α链	TCR β链	天然β碳原子间隔(nm)
TCR α链	TCR β链	天然β碳原子间隔(nm)	Thr 48Thr 45Tyr 10Thr 45Ser 15	Ser 57Ser 77Ser 17Asp 59Glu 15	0.4730.5330.3590.5600.59

各自相应的人TCR链中的以下基序可以用于鉴别进行突变的残基(阴影部分残基是突变成半胱氨酸的残基)。

α链Thr 48：DSDVYITDKTVLDMRSMDFK(TRAC*01基因的外显子1的39-58位氨基酸)(SEQ ID 1)

α链Thr 45：QSKDSDVYITDKTVLDMRSM(TRAC*01基因的外显子1的36-55位氨基酸)(SEQ ID 2)

α链Tyr 10：DIQNPDPAVYQLRDSKSSDK(TRAC*01基因的外显子1的1-20位氨基酸)(SEQ ID 3)

α链Ser 15：DPAVYQLRDSKSSDKSVCLF(TRAC*01基因的外显子1的6-25位氨基酸)(SEQ ID 4)

β链Ser 57：NGKEVHSGVSTDPQPLKEQP(TRBC1*01径TRBC2*01基因的外显子1的48-67位氨基酸)(SEQ ID 5)

β链Ser 77：ALNDSRYALSSRLRVSATFW(TRBC1*01 & TRBC2*01基因的外显子1的68-87位氨基酸)(SEQ ID 6)

β链Ser 17：PPEVAVFEPSEAEISH TQKA(TRBC1*01 & TRBC2*01基因的外显子1的8-27位氨基酸)(SEQ ID 7)

β链Asp 59：KEVHSGVSTDPQPLKEQPAL(TRBC1*01 & TRBC2*01基因的外显子1的50-69位氨基酸)(SEQ ID 8)

β链Glu 15：VFPPEVAVFEPSEAEISHTQ(TRBC1*01 & TRBC2*01基因的外显子1的6-25位氨基酸)(SEQ ID 9)

在其他物种中，TCR链可能不具有与以上基序100％相同的区域。然而，精通本领域的人员能够使用以上基序鉴别TCR α或β链的等价部分并由此鉴别突变成半胱氨酸的残基。在这一方面可以使用对齐排列技术。例如，欧洲生物信息学研究所网站( http：//www.ebi.ac.uk/index.html)上提供的ClustalW可以用于将特定TCR链序列与以上基序比较以对需要突变的TCR序列相关部分进行定位。

本发明在其范围内包括蛋白质颗粒展示的αβ和γδ类似物scTCR，以及其他哺乳动物的αβ和γδ类似物scTCR，这些哺乳动物包括但不限于小鼠、大鼠、猪、山羊和绵羊。如以上所提到的，精通本领域的人员应能够确定等价于上述人的能导入半胱氨酸残基以形成链间二硫键的位置的位置。例如，以下说明了小鼠Cα和Cβ可溶结构域的氨基酸序列，以及显示等价于上述人的能突变成半胱氨酸以形成TCR链间二硫键的残基的小鼠残基的基序(其中相关残基用阴影表示)：

小鼠Cα可溶结构域：

PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMK

AMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVP(SEQ ID 10)

小鼠Cβ可溶结构域：

EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREV

HSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDK

WPEGSPKPVTQNISAEAWGRAD(SEQ ID 11)

人α链Thr 48的小鼠等价物：ESGTFITDKTVLDMKAMDSK(SEQ ID 12)

人α链Thr 45的小鼠等价物：KTMESGTFITDKTVLDMKAM(SEQ ID 13)

人α链Tyr 10的小鼠等价物：YIQNPEPAVYQLKDPRSQDS(SEQ ID 14)

人α链Ser 15的小鼠等价物：AVYQLKDPRSQDSTLCLFTD(SEQ ID 15)

人β链Ser 57的小鼠等价物：NGREVHSGVSTDPQAYKESN(SEQ ID 16)

人β链Ser 77的小鼠等价物：KESNYSYCLSSRLRVSATFW(SEQ ID 17)

人β链Ser 17的小鼠等价物：PPKVSLFEPSKAEIANKQKA(SEQ ID 18)

人β链Asp 59的小鼠等价物：REVHSGVSTDPQAYKESNYS(SEQ ID 19)

人β链Glu 59的小鼠等价物：VTPPKVSLFEPSKAEIANKQ(SEQ ID 20)

如上所述，A6 Tax scTCR胞外恒定结构域可以用作骨架，在这之上可以融合异源可变结构域。优选地，异源可变结构域序列在二硫键和恒定结构域序列的N末端之间的任何位置与恒定结构域序列连接。在A6 Tax TCR和β恒定结构域序列的情况下，可以在氨基酸残基158和172处分别导入的半胱氨酸之间形成二硫键。因此，优选地是如果异源的α和β链可变结构域序列连接位置分别位于159或173位残基和α或β恒定结构域序列的N末端之间。

TCR展示

用于生物淘选以鉴别具有如针对靶肽-MHC复合物高亲和性等所需性质的优选的体内TCR展示方法是噬菌体展示。

首先，构建编码了突变的scTCR或dTCR的多样性阵列的DNA文库。该文库通过使用编码作为扩增模板的天然TCR的DNA进行构建。针对将所需突变体导入TCR DNA并从而最终表达TCR蛋白，存在多种对于精通本领域的人员而言已知的合适的方法。例如易错PCR(EP-PCR)、DNA重排技术以及如XL-1-Red等细菌增变菌株的使用是向TCR序列中导入突变的常规方法。尤其优选地是，如果这些突变体导入到TCR的明确的结构域中。例如，可变结构域中的突变，尤其互补决定区(CDR)和/或骨架区或许是导入导致生成TCR多样文库以产生具有提高的配体结合性质的TCR突变的最适当的位置。EP-PCR是通过这种方法可以将这样的“区域特异性”突变导入TCR的一个例子。使用与需要突变的区域邻接的DNA序列互补的EP-PCR引物以扩增这一包含可控水平随机突变的TCR DNA区域的多拷贝。通过连接或重叠PCR，这些编码突变区域的DNA序列插入编码TCR未突变部分的DNA序列。编码含突变区域TCR的DNA然后可以与编码异源多肽的DNA连接以产生适合展示的融合蛋白。在噬菌体展示的情况下，采用的表达载体是噬菌粒或噬菌体基因组载体，其中TCR DNA可以与编码表面蛋白的，优选地是gIII或gVIII表面蛋白的DNA连接。在scTCR的情况下，这样的连接如对于任何单体的肽或多肽的噬菌体展示那样进行。在dTCR的情况下，只有一条TCR链如前述的进行连接。另一条链编码在与噬菌粒和辅助噬菌体核酸共表达的核酸中，这样表达的第二条链与具有表面展示的第一条链的表达的噬菌体相连。如以上更详细地描述的，在这两种情况下，恒定结构域中正确定位的半胱氨酸通过由这些残基形成二硫键，在引起TCR的可变结构域采用其功能性定位中是有帮助的。

至于表达，包括(a)编码dTCR多肽对的一条链的核酸，以及(b)与编码颗粒形成蛋白、或细胞表面蛋白的核酸序列融合的TCR多肽对的另一条链；或与编码颗粒形成蛋白或细胞表面蛋白的核酸序列融合的编码scTCR多肽的核酸，dTCR对，或包括由核酸(a)构成的第一载体和由核酸(b)构成的第二载体的组合物的表达载体与能引起编码的遗传物质在适于所述细胞转化的条件下表达的宿主细胞接触。这样的表达载体、表达系统包括编码dTCR和scTCR的噬菌粒或噬菌体基因组载体，以及携带它们的宿主细胞形成本发明的附加方面。在本发明的优选的实施方案中，噬菌粒或噬菌体基因组载体源自丝状噬菌体。

转化的细胞随后进行孵育以允许TCR展示的蛋白质颗粒的表达。这些颗粒随后可以用于筛选或测试以鉴别具有特定增强特性的TCR形式。随后可以分离任何研究中具有增强特性的颗粒。编码这些TCR的DNA随后可以通过PCR扩增并且确定其序列。

已知外源多肽的高表达水平对于宿主细胞可能是有毒的。在这样的情况下，必须发现对外源多肽更耐受的宿主株，或宿主细胞中表达水平必须限制在能够耐受的水平。例如，Beekwilder等在(1999)Gene 228(1-2)23-31中报道了只有含缺失或琥珀终止密码子的突变形式的土豆蛋白酶抑制剂(PI2)能够成功地从噬菌体展示文库中得到选择。在所述情况下，这里的实施例中报道的工作过程中的观察结果说明，至少在大肠杆菌的一些菌株中，限制本发明的蛋白颗粒展示的TCR的表达水平可能是需要的。这样，在重复几轮培养后实施例4中选择的A6 TCR是源自其中的噬菌粒相对于最初导入的已经发生突变的细胞。该突变在TCR β链中已创建了一个“乳白”终止密码子。该密码子是由所采用的大肠杆菌菌株的核糖体以低频率“读通”导致在这一位点上插入色氨酸残基以及全长β链表达的明显降低的整体水平。

存在多种在可能适于限制scTCR或dTCR的一条或两条TCR链表达水平的宿主中限制特定表达系统外源多肽表达水平的策略。例如：

使用弱启动子序列—获得的诸如TCR α或β链的特定基因产物的表达水平，可以通过使用不同强度的启动子序列进行定制。λ噬菌体P_RM是弱启动子的例子。

突变的核糖体结合位点(RBS’s)-与诸如TCR α或β链等基因产物相连的RBS中的单一核酸进行突变，这可以导致降低的表达水平。例如，将野生型AGGA序列突变成AGGG。

突变的“起始密码子”—将与诸如TCR α或β链等基因产物相连的单一核酸的起始密码子进行突变也可以导致降低的表达水平。例如，将野生型AUG起始子突变为GUG。

错义抑制突变—这些突变插入TCR β链编码区内部。实例包括“乳白”终止子(UGA)，这一“不严密”的终止子导致色氨酸的低频插入以及编码序列其余部分的读通。

代谢物介导的启动子强度调节—处于某些启动子控制下的诸如TCR α或β链等基因产物的表达水平可以通过向含该启动子的细胞添加相关代谢物进行下调。例如，可以使用添加葡萄糖下调处于Lac启动子控制下的基因产物的表达。

密码子使用—细菌细胞和例如哺乳动物细胞相对其用于编码某个氨基酸的密码子具有“偏好”。例如，细菌细胞最常见使用CGU密码子编码精氨酸，而真核细胞最常见使用AGA。通过采用包含所采用的表达载体的多个较低偏好性的密码子的DNA序列可以降低诸如TCR α或β链等基因产物的表达水平.

与上述下调基因产物表达相关的详细描述可以参见Glass1982年所著的《基因功能—大肠杆菌及其遗传元素》(Gene Function-E.coli and its heritableelements，Croom Helm)以及Rezinoff 1980年所著《操纵子》第2版(The Operon 2^ndEdition，Cold Spring Harbor Laboratory)。

同样已知，为细菌培养物提供相对高浓度的糖(诸如蔗糖)可以提高可溶蛋白的周质表达水平(参见例如Sawyer等，(1994)Protein Engineering 7(11)1401-1406)。

表达以后，scTCR多肽可变结构域序列的正确配对优选地由scTCR的胞外恒定结构域中二硫键的导入进行辅助。不受理论限制，相信在折叠过程中新的二硫键为scTCR提供额外的稳定性，从而有助于第一和第二片段的正确配对。

同样如上面提到的，对于dTCR噬菌体展示而言，dTCR多肽对之一最终如单体多肽展示在噬菌体一样表达，并且dTCR多肽对的另一条链在相同的宿主细胞中共表达。随着噬菌体颗粒自聚合，所述两条多肽自我连接如二聚体展示在噬菌体上。此外，在本发明这一方面的优选实施方案中，多肽对连接过程中的正确折叠如上所述由恒定序列之间的二硫键进行辅助。具有链间二硫键的dTCR的噬菌体展示过程的进一步细节在这里的实施例部分说明。

另外，噬菌体展示的dTCR的第一条链可以首先表达，以及第二条链多肽可以在随后的步骤中与表达的噬菌体接触，从而在噬菌体表面连接为功能性dTCR。

核糖体展示是用于生物淘选以鉴别具有如针对目标肽-MHC复合物高特异性等需要性质的TCR的优选的体外TCR展示方法。首先，使用上述技术构建了编码突变的scTCR或dTCR多肽的多样性阵列的DNA文库。DNA文库随后与RNA聚合酶接触以产生互补的mRNA文库。可选择地，对于mRNA展示技术来说，mRNA序列随后可以与包括嘌呤霉素结合位点的DNA序列连接。这些遗传构件随后在允许所述scTCR多肽或dTCR对的第一多肽翻译的条件下与核糖体体外接触。在dTCR的情况下，多肽对的第二多肽独立表达并与核糖体展示的第一多肽接触，为了两条链的结合，优选地由恒定结构域之间二硫键的形成进行辅助。另外，编码TCR两条链的mRNA可以在允许TCR链翻译的条件下与核糖体体外接触，由此形成了展示dTCR的核糖体。这些展示scTCR或dTCR的核糖体随后可以用于筛选或测试以鉴别具有特异性增强特性的TCR变体。随后可以分离任何具有增强特性的颗粒。编码这些TCR的mRNA随后可以使用逆转录酶转换成互补的DNA序列。该DNA随后可以通过PCR进行扩增并确定其序列。

其它方面

本发明的展示一种scTCR或一种dTCR(优选地由对应于人的序列的恒定和可变序列组成)的蛋白质颗粒可以以充分纯净的形式或以纯化的或分离的制剂的形式提供。例如，可以以与其他蛋白质充分分离的形式提供。

本发明的展示多种scTCR或多种dTCR的噬菌体颗粒可以以多价复合物的形式提供。因而，本发明在一个方面提供了多价T细胞受体(TCR)复合物，该复合物包括如这里所述的展示多种scTCR或dTCR的噬菌体颗粒。所述多种scTCR或dTCR的每一种优选地是相同的。

本发明的进一步方面提供了检测TCR配体复合物的方法，该方法包括：

a.提供了本发明的一种展示TCR的蛋白质颗粒；

b.将展示TCR的噬菌体与假定的配体复合物接触；以及

检测展示TCR的蛋白质颗粒与假定的配体复合物的结合。

适于由以上方法鉴别的TCR配体包括但不限于肽-MHC复合物。

具有增强特性的TCR变体的分离

本发明的进一步的方面是鉴别具有特定特性的TCR的方法，所述方法包括展示在蛋白质颗粒上的TCR的多样性文库经受选出所述特性的选择过程，以及分离展示具有所述特性的TCR的蛋白质颗粒，以及可选择地进行扩增过程以增加分离的颗粒，和/或测量所述特性的筛选过程，鉴别那些展示具有所需特性的TCR的蛋白质颗粒并且分离这些蛋白质颗粒，以及可选择地进行扩增过程以增加分离的颗粒。

随后可以获得编码变体TCR的DNA序列并通过PCR进行扩增以测定序列。可以增强的特性包括但不限于配体结合亲和力和构件稳定性。

筛选用途

本发明的展示TCR的蛋白质颗粒能在为鉴别包括TCR介导的细胞免疫突触的抑制剂在内的调节剂而设计的筛选方法中采用。

如精通本领域的人员所知，存在多种为此类蛋白质之间相互作用筛选提供适当基础的测试形式。

如AlphaScreen^TM的增强型发光亲近匀相测定系统(Amplified LuminescentProximity Homogeneous Assay systems)，依赖于用一层能结合受体与配体蛋白的水凝胶包被的“供体”和“受体”小珠的使用。这些受体与配体分子之间的相互作用将这些小珠拉近。当这些小珠遭受激光时，“供体”小珠中的光敏剂将周围的氧转变成更激化的单线状态。单线态的氧分子扩散以与“受体”小珠中的化学发光剂反应，这进一步激活包含在该小珠中的荧光团。荧光团随后发射520-620nm的光，这是受体-配体已发生相互作用的信号。受体-配体相互作用的抑制剂的存在导致这一信号减弱。

表面等离子体谐振(Surface Plasmon Resonance，SPR)是一种临界面光学测定法，其中一种结合伴侣(通常是受体)固定在“芯片”(传感器表面)并检测另一种可溶的并流经芯片表面的结合伴侣(通常是配体)的结合。配体的结合导致芯片表面附近蛋白浓度的提高，这引起该区域中折射系数的改变。芯片表面的构成使折射系数的改变可以通过表面等离子体谐振检测，表面等离子体谐振是一种光学现象，由此以一定入射角照射在金属薄层上的光由于振荡的表面电荷密度(表面等离子体)波的谐振激励产生强度降低的反射光束。谐振对金属膜远侧的折射系数改变极其敏感，并且这是用于检测固定的和可溶的蛋白之间结合的信号。允许方便使用分子相互作用的SPR检测和数据分析的系统有商业现货。实例是Iasys^TM装置(Fisons)和Biacore^TM装置。

其他的临界面光学测定法包括Woodbury和Venton在J.Chromatog.B.725113-137(1999)中更详细描述的全内反射荧光(TIRF)、共振镜(RM)和光栅耦合传感器(GCS)。亲近闪烁检测(SPA)已被用于为CD28和B7之间低亲和力相互作用的抑制剂(K_d约为4μM(Van der Merwe等，J.Exp.Med.185：393-403(1997)，Jenh等，AnalBiochem 165(2)287-93(1998))而筛选化合物库。SPA是一种利用来自某些放射性同位素的β射线将能量传输给固定在指示器表面的闪烁体的放射性测定法。溶液中β粒子的短传输距离保证了只有当β粒子在极其接近的范围内发射给闪烁体才会发生闪烁。当用于蛋白质之间相互作用时，一种相互作用伴侣用放射性同位素标记，而另一种或与包含闪烁体的小珠结合，或与闪烁体共同包被在表面。如果该测定法可以最优设置，放射性同位素应与闪烁体足够接近以使只有当两种蛋白质之间发生结合时光子发射才被激活。

本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用的抑制剂的方法，该方法包括在待测化合物存在或不存在的条件下将展示TCR的蛋白质颗粒与TCR结合配体接触，以及确定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合，这样的降低认为鉴别了一种抑制剂。

本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体(例如MHC-肽复合物)之间相互作用的潜在抑制剂的方法，该方法包括将展示TCR的蛋白质颗粒或TCR结合配体伴侣与待测化合物接触，以及确定待测化合物是否结合展示TCR的蛋白质颗粒和/或TCR结合配体，这样的结合认为鉴别了一种潜在抑制剂。本发明的这一方面可以在诸如使用Biacore^TM系统进行的那些临界面光学测定法中得到特定的应用。

高亲和性TCR

本发明也提供了具有针对特定TCR配体比野生型TCR更高亲和性的突变的TCR。预计这些高亲和性TCR对于疾病的诊断和治疗具有特殊用途。

如这里所使用的术语“高亲和性TCR”是指与具体TCR配体相互作用并且如通过表面等离子体谐振测量的具有针对所述TCR配体的K_d值小于相应的天然TCR的Kd值、或如通过表面等离子体谐振测量的具有针对所述TCR配体的消耗速率(off-rate，K_off)小于相应的天然TCR的消耗速率的突变的scTCR和dTCR。

本发明的高亲和性scTCR或dTCR优选地是相对于天然TCR在至少一个互补决定区和/或骨架区发生突变。

在本发明的一个方面，一种特定高亲和性TCR对其具有特异性的TCR配体是肽-MHC复合物(pMHC)。

本发明的另一个方面，一种特定高亲和性TCR对其具有特异性的TCR配体是MHC类别。

本发明的进一步的一个方面，一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2 tax肽(LLFGYPVYV)(SEQ ID 21)复合物。

本发明的进一步的一个方面，一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2 NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物。

高亲和性scTCR或高亲和性dTCR链的一条或两条链可以用造影化合物(例如适于诊断目的的标记物)标记。这样的经标记的高亲和性TCR在用于检测选自CD-1抗原复合物、细菌超抗原以及MHC-肽/超抗原复合物的TCR配体的方法中是有用的，该方法包括将TCR配体与该配体特异的高亲和性TCR(或多体高亲和性TCR复合物)接触；以及检测与所述TCR配体的结合。在四聚高亲和性TCR复合物中(例如使用生物素化的异源二聚体形成)可以使用荧光链亲和素(商业现货)来提供可检测的标记。荧光标记的四聚体适于在FACS分析中使用，例如用以检测携带高亲和性TCR对其具有特异性的肽的抗原提呈细胞。

可以对本发明的可溶性高亲和性TCR进行检测的另一种方式是通过TCR特异性抗体，尤其是单克隆抗体的使用。存在多种商业提供的抗TCR抗体，如αF1和βF1，它们分别识别α和β链的恒定结构域。

另外或此外，本发明的高亲和性TCR(或其多价复合物)可以与一种治疗性物质(例如，用于杀伤细胞的毒性部分，或如白介素或细胞因子的免疫激活物质)相连(例如共价或其他方式连接)。本发明的多价高亲和性TCR复合物与非多体的野生型或高亲和性的TCR异源二聚体相比，可以具有增强的与TCR配体结合的能力。因而，按照本发明的多价高亲和性TCR复合物对于提呈特定抗原细胞的体内或体外跟踪或靶向特别有用，并且可用作产生进一步具有这样用途的多价高亲和性TCR复合物的中间体。因此，高亲和性TCR或多价高亲和性TCR复合物可以作为体内使用的制药上允许的配方提供。

本发明也提供了一种向靶细胞递送治疗性物质的方法，该方法包括在允许所述高亲和性TCR或多价高亲和性TCR复合物与所述靶细胞结合的条件下，将潜在的靶细胞与按照本发明的高亲和性TCR或多价高亲和性TCR复合物接触，所述高亲和性TCR或多价高亲和性TCR复合物是TCR配体特异的并且具有与其相连的治疗性物质。

尤其，可溶的高亲和性TCR或多价高亲和性TCR复合物可以用于向提呈特定抗原细胞的位置递送治疗性物质。这在多种情况下，尤其在对抗肿瘤时，可能是有用的。治疗性物质可以这样进行递送以使其局部行使其作用而不是仅作用于其结合的细胞。这样，设想了一种与肿瘤特异性高亲和性TCR或多价高亲和性TCR复合物相连的抗肿瘤分子的特殊策略。

许多治疗性物质可以用于这一用途，例如放射性化合物、酶(例如穿孔素)或化疗物质(例如顺铂)。为确保在所需位置发挥毒性作用，毒素可以位于与链亲和素相连的脂质体内部，这样该化合物被缓慢释放。这能防止体内运输过程中的破坏作用并确保在TCR与相关抗原提呈细胞结合之后毒素具有最大作用。

其他适当的治疗性物质包括：

·小分子细胞毒物质，即分子量小于700Da的具有杀伤哺乳动物细胞能力的化合物。这样的化合物也可以包括具有细胞毒作用的有毒金属。此外，需要理解，这些小分子细胞毒物质也包括前药，即在生理条件下分解或转化以释放细胞毒物质的化合物。这样的物质的例子包括顺铂、美登素衍生物、雷可霉素(rachelmycin)、刺孢霉素(calicheamicin)、多西他赛、依托泊苷、吉西他滨、异环磷酰胺、依立替康、美法仑、米托葸醌、卟非姆钠光敏素II(porfimer sodium photofrin II)、替莫唑胺(temozolmide)、托泊替康、三甲曲沙葡糖醛酸脂(trimetrexate glucuronate)、auristatin E长春新碱(auristatin E vincristine)以及阿霉素；

·细胞毒素肽，即具有杀伤哺乳动物细胞能力的蛋白质或其片段。例子包括蓖麻毒素、白喉毒素、假单胞菌细菌外毒素A、DNA酶和RNA酶；

·放射性核素，即衰变并同时发射一个或多个α或β粒子或γ射线的元素的不稳定同位素。例子包括碘131、铼186、铟111、钇90、铋210和213、锕225以及砹213；螯合剂可以用于促进这些放射性核素与高亲和性TCR或其多聚体的结合；

·前药，如抗体引导的酶前药；

·免疫刺激剂，即刺激免疫反应的部分。例子包括如IL-2、如IL-8、血小板因子4、黑素瘤生长刺激蛋白的趋化因子等等的细胞因子，抗体或其片段，补体激活因子，异种蛋白结构域，异源蛋白结构域，病毒/细菌蛋白结构域以及病毒/细菌肽。

本发明的可溶高亲和性TCR或多价高亲和性TCR复合物可以与能将前药转变为药物的酶连接。这使得该前药只在需要的位置转变为药物(即由sTCR靶向的)。

多数疾病的治疗可以通过经可溶高亲和性TCR特异性的药物局部化得到潜在地增强。例如，预计这里所公开的高亲和性HLA-A2-tax(LLFGYPVYV)(SEQ ID 21)特异的A6 TCR可以在HTLV-1的诊断和治疗方法中运用，并且这里所公开的高亲和性HLA-A2-NY-ESO(SLLMITQC)(SEQ ID 22)特异的NY-ESO TCR可以在癌症的诊断和治疗方法中运用。

存在药物的病毒性疾病(例如HIV、SIV、EBV、CMV)可能得益于在感染细胞附近释放或激活的药物。对于癌症来说，肿瘤或肿瘤转移附近的定位能增强毒素或免疫刺激剂的作用。在自身免疫病中，免疫抑制药物可以缓慢释放，这样具有在更长的时间跨度上更加局部性的作用而对主体的整体免疫能力影响最小。在防止移植排斥的情况下，免疫抑制药物的作用能以同样方式进行优化。对于疫苗递送而言，疫苗抗原可以局限在抗原提呈细胞附近，从而增强抗原的功效。该方法也可以应用于造影目的。

本发明的可溶高亲和性TCR可以通过与特异TCR配体结合并从而抑制T细胞活化用于调节T细胞活化。涉及T细胞介导的炎症和/或组织损伤的自身免疫病(例如I型糖尿病)可能可以按照这一方法处理。为了这一应用，需要由相关pMHC提呈的特异肽表位的知识。

按照本发明的治疗性或造影的高亲和性TCR通常作为通常应包括制药上允许的载体的无菌的药物组合物的一部分提供。该药物组合物可以是任何适当的形式的(取决于对患者给药所需要的方法)。它可以以单位剂量的形式(通常应在密封容器中提供)和作为试剂盒的一部分提供。这样的试剂盒通常会(虽然不是必须地)包括使用指南。它可以包括多个所述的单位剂量形式。

所述药物组合物可以适合于通过任何适宜的途径给药，例如注射、透皮或通过吸入，优选地是注射(包括皮下注射、肌肉注射或最优选地静脉内注射)途径。这样的组合物可以通过任何药剂学领域内已知的方法进行制备，例如通过在无菌条件下将活性组分与载体或赋形剂混合。

依赖于需要治疗的疾病或机能紊乱、需要治疗的个体的年龄和健康状况等等因素，本发明的物质的剂量可以在广阔的范围内变化，并且医生应该最终决定使用的适当剂量。

本发明也提供了获得高亲和性TCR链的方法，该方法包括在引起高亲和性TCR链表达的条件下孵育这样的宿主细胞并随后分离多肽。

本发明的每个方面的优选的特征正如对每个其他方面作必要改动。这里提到的在先技术文献结合在法律许可的最完整的范围内。

实施例

在以下实施例中进一步描述了本发明，这些实施例未以任何方式限制本发明的范围。

下面对附图进行了说明，其中：

图1a和1b分别表示突变以引入半胱氨酸密码子的可溶的A6 TCR α链和β链的核酸序列。阴影表示引入的半胱氨酸密码子。

图2a表示包含用于产生新的链间二硫键的T₄₈→C突变(加下划线的)的A6 TCR α链胞外氨基酸序列，图2b表示包含用于产生新的链间二硫键的S₅₇→C突变(加下划线的)的A6 TCR β链胞外氨基酸序列。

图3描述了将TCR α和β链克隆进噬菌粒载体。图表描述了噬菌体展示载体。RSB是核糖体结合位点。S1或S2是用于将蛋白质分泌到大肠杆菌周质中的信号肽。星号*表示翻译终止密码子。TCR α链或β链的任何一条链可以与噬菌体外被蛋白融合，虽然所述图表中只有TCR β链与噬菌体外被蛋白融合。

图4详述了噬菌粒pEX746：A6的DNA序列。

图5细菌外被蛋白与异源二聚A6 TCR的噬菌体颗粒融合蛋白在大肠杆菌中的表达。异源二聚A6 TCR：gIII的融合蛋白使用免疫印迹检测。噬菌体颗粒由大肠杆菌XL-1-Blue制备并用PEG/NaCl浓缩。样品加载在还原或非还原加样缓冲液中。泳道1是含正确序列克隆7的样品，泳道2是在α链编码基因中含缺失的克隆14的样品。异源二聚A6 TCR：gIII融合蛋白在125kDa处检得。

图6说明了展示在噬菌体上的异源二聚A6 TCR的pMHC肽复合物结合活性的ELISA检测。克隆7特异性结合HLA A2-Tax复合物。克隆14不能结合任何pMHC，因为没有TCR与该噬菌体颗粒结合。

图7a单链A6 TCR-C-κ DNA核糖体展示构件的示意性图解。

图7b和7c分别详述了pUC19中编码的单链A6 TCR-C-κ DNA核糖体展示构件的完整的DNA编码链和氨基酸序列。

图8详述了pUC19-T7的DNA序列。

图9详述了克隆到pUC19-T7中的单链A6 TCR-C-κ DNA核糖体展示构件的DNA序列。

图10显示通过使用Ambion兔网状细胞溶解产物的体外翻译的单链A6 TCR-C-κ检测的免疫印迹。

图11得自核糖体展示反应的小珠上的单链A6 TCR-C-κ mRNA的RT-PCR。

图12a详述了A6 TCR克隆9突变的β链的DNA序列；突变的核酸用粗体表示。

图12b详述了A6 TCR克隆9突变的β链的氨基酸序列，对应于引入的乳白终止密码子的位置用星号*表示。

图13详述了A6 TCR克隆49突变的β链的DNA序列；突变的核酸用粗体表示。由于这是一种“沉默”突变，最终的氨基酸序列中没有由这一突变引入变化。

图14a详述了A6 TCR克隆134突变的A6 TCR β链的DNA序列；突变的核酸用粗体表示。

图14b详述了通过BIAcore测定法检测的A6 TCR克隆134突变的A6 TCR β链的氨基酸序列；突变的氨基酸用粗体表示。

图14c详述了通过噬菌体ELISA测定法检测的A6 TCR克隆134突变的A6 TCR β链的氨基酸；突变的氨基酸用粗体表示。

图15A6 TCR克隆134与HLA-A2 Tax和HLA-A2 NY-ESO结合的BIAcore数据。

图16用于测定A6 TCR克隆134与HLA-A2 Tax结合的T_off的BIAcore数据。

图17a和17b分别表示NY-ESO TCR的突变的α和β链的DNA序列。

图18a和18b分别表示NY-ESO TCR的突变的α和β链的氨基酸序列。

图19a和19b分别详述了组合在pEX746：NY-ESO噬菌粒中的NY-ESO TCR β链的DNA和氨基酸序列。

图20表示在噬菌体ELISA测定法中展示NY-ESO TCR的噬菌体颗粒与HLA-A2-NY-ESO的特异结合。

图21表示并入编码与DRA0101序列3’端相连的Fos二聚化肽的密码子的DR1α链的DNA序列。阴影表示Fos密码子并且生物素化标签密码子用粗体表示。

图22表示Sf9昆虫细胞中用于II类HLA-肽复合物表达的pAcAB3双顺反子载体的DNA序列。用于插入HLA α链的Bgl II限制性位点(AGATCT)和用于插入HLA β链的BamH I限制性位点(GGATCC)用阴影表示。

图23表示并入编码与DRB0401序列3’端相连的Jun二聚化肽的密码子和编码与DRB0401序列5’端相连的HLA-荷肽密码子的DR1 β链的DNA序列。阴影表示Jun密码子，HLA-荷载的Flu HA肽密码子用下划线表示。

图24表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪：

流动池1(FC1)-空白

流动池2(FC2)-HLA-A2(LLGRNSFEV)(SEQ ID 23)

流动池3(FC3)-HLA-A2(KLVALGINAV)(SEQ ID 24)

流动池4(FC4)-HLA-A2(LLGDLFGV)(SEQ ID 25)

图25表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪：

流动池1(FC1)-空白

流动池2(FC2)-HLA-B8(FLRGRAYGL)(SEQ ID 26)

流动池3(FC3)-HLA-B27(HRCQAIRKK)(SEQ ID 27)

流动池4(FC4)-HLA-Cw6(YRSGIIAVV)(SEQ ID 28)

图26表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪：

流动池1(FC1)-空白

流动池2(FC2)-HLA-A24(VYGFVRACL)(SEQ ID 29)

流动池3(FC3)-HLA-A2(ILAKFLHWL)(SEQ ID 30)

流动池4(FC4)-HLA-A2(LTLGEFLKL)(SEQ ID 31)

图27表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪：

流动池1(FC1)-空白

流动池2(FC2)-HLA-DR1(PKYVKQNTLKLA)(SEQ ID 32)

流动池3(FC3)-HLA-A2(GILGFVFTL)(SEQ ID 33)

流动池4(FC4)-HLA-A2(SLYNTVATL)(SEQ ID 34)

图28表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪：

流动池1(FC1)-空白

流动池4(FC4)-HLA-A2(LLFGYPVYV)(SEQ ID 21)

图29a和29b表示可溶高亲和性NY-ESO TCR和HLA-A2 NY-ESO之间相互作用的Biacore图。

图30a和30b表示可溶“野生型”NY-ESO TCR和HLA-A2 NY-ESO之间相互作用的Biacore图。

图31a和31b表示突变体可溶A6 TCR(克隆1)与HLA-A2 Tax之间相互作用的Biacore图。

图32a和32b表示突变体可溶A6 TCR(克隆111)与HLA-A2 Tax之间相互作用的Biacore图。

图33a和33b表示突变体可溶A6 TCR(克隆89)与HLA-A2 Tax之间相互作用的Biacore图。

图34表示突变体可溶A6 TCR(包括克隆71和克隆134突变)与HLA-A2 Tax之间相互作用的Biacore图。

图35表示突变体可溶A6 TCR(包括克隆1和βG102→A突变)与HLA-A2 Tax之间相互作用的Biacore图。

图36a到36c表示突变体可溶A6 TCR(包括克隆89和克隆134突变)与HLA-A2 Tax之间相互作用的Biacore图。

图37a和37b表示突变体可溶A6 TCR(包括克隆71和克隆89突变)与HLA-A2 Tax之间相互作用的Biacore图。

图38详述了以下A6 TCR克隆的β链可变结构域氨基酸序列：

38a-野生型，38b-克隆134，38c-克隆89，38d-克隆1以及38e-克隆111

突变的残基用粗体表示，等同的残基是可以存在于特定位置的另外残基。

图39A和39B I

实施例1-A6 Tax TCRα和β链的引物设计和诱变以引入形成新的链间二硫键所需的半胱氨酸残基

为了将TRAC*01中外显子1的A6 Tax苏氨酸48突变成半胱氨酸，设计了以下引物(突变用小写字母表示)：

5’-C ACA GAC AAA tgT GTG CTA GAC AT(SEQ ID 35)

5’-AT GTC TAG CAC Aca TTT GTC TGT G(SEQ ID 36)

为了将TRBC1*01和TRBC2*01中外显子1的A6 Tax丝氨酸57突变成半胱氨酸，设计了以下引物(突变用小写字母表示)：

5’-C AGT GGG GTC tGC ACA GAC CC(SEQ ID 37)

5’-GG GTC TGT Gca GAC CCC ACT G(SEQ ID 38)

PCR诱变

分别使用α链引物或β链引物，如以下所述对含A6 Tax TCR α或β链基因的表达质粒进行突变。

将100纳克质粒与5微升10mM dNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H₂O将终体积调节到240微升。将48微升该混合物中添加终浓度稀释为0.2μM的引物使最终反应体积达到50微升。最初95℃ 30秒的变性步骤之后，反应混合物在Hybaid PCR express PCR仪上进行15个变性(95℃，30秒)、退火(55℃，60秒)与延伸(73℃，8分钟)循环。随后产物用10单位DpnI限制性酶(New England Biolabs)在37℃消化5小时。10微升消化的反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨，16克/升酵母提取物，5克/升NaCl，2.5克/升K₂HPO₄，100毫克/升氨苄青霉素)中生长过夜。按照生厂商的说明书在Qiagen mini-prep柱上纯化质粒DNA并在牛津大学生物化学系的测序设备上通过自动化测序检验其序列。图1a和2a分别表示α链的突变核酸和氨基酸序列，图1b和2b分别表示β链的突变核酸和氨基酸序列。

实施例2-噬菌体展示载体的构建以及将A6 TCRα和β链克隆进该噬菌粒载体

为了在丝状噬菌体颗粒上展示含非天然链间二硫键的异源二聚A6 TCR，构建了噬菌粒载体以表达由含非天然链间二硫键的异源二聚A6 TCR和噬菌体外被蛋白构成的融合蛋白。这些载体包含一个pUC19起始点、一个M13起始点、一个bla(氨苄青霉素抗性)基因、Lac启动子/操纵子和一个CAP结合位点。图3中概述了这些载体的设计，该图除了可溶的A6 TCR α链之外，描述了编码A6 TCR β链-g3或A6 TCR β链-g8融合蛋白的载体。实施例1中制备的并如图1a和1b中所示的含并入形成新的链间二硫键所需的附加半胱氨酸残基突变的A6 TCR α和β链用作产生编码该TCR的噬菌粒的A6 TCR α和β链的来源。图4中表示了所采用的噬菌粒结构(pEX746)的完整DNA序列。

J.Sambrook和D.W.Russell所著的《分子克隆：实验室手册》(Molecularcloning：A laboratory manual)中描述了构建载体的分子克隆方法。

表1中列举的引物被用于所述载体的构建。PCR程序的一个例子是94℃ 2分钟1个循环，随后94℃ 5秒、53℃ 5秒和72℃ 90秒25个循环，随后72℃ 10分钟1个循环，以及随后4℃保温。Expand High Fidelity Taq DNA聚合酶购自Roche。

表1 用于构建A6 TCR噬菌体展示载体的引物

引物名称	序列5’到3’
引物名称	序列5’到3’	YOL1	TAATAATACGTATAATAATATTCTATTTCAAGGAGACAGTC(SEQ ID 39)
ZOL2	CAATCCAGCGGCTGCCGTAGGCAATAGGTATTTCATTATGACTGTCTCCTTGAAATAG(SEQ ID 40)	YOL1	TAATAATACGTATAATAATATTCTATTTCAAGGAGACAGTC(SEQ ID 39)
ZOL2		YOL3	CtaCGGCAGCCGCTGGATTGTTATTACTCGCGGCCCAGCCGGCCATGGCccag(SEQ ID 41)
TOL4	GTTCTGCTCCACTTCCTTCTGGGCCATGGCCGGCTGGGCCG(SEQ ID 42)	YOL3

TOL5	CAGAAGGAAGTGGAGCAGAAC(SEQ ID 43)
TOL5	CAGAAGGAAGTGGAGCAGAAC(SEQ ID 43)	TOL6	CTTCTTAAAGAATTCTTAATTAACCTAGGTTATTAGGAACTTTCTGGGCTGGGGAAG(SEQ ID 44)
YOL7	GTTAATTAAGAATTCTTTAAGAAGGAGATATACATATGAAAAAATTATTATTCGCAATTC(SEQ ID 45)	TOL6
YOL7		TOL8	CGCGCTGTGAGAATAGAAAGGAACAACTAAAGGAATTGCGAATAATAATTTTTTCATATG(SEQ ID 46)
TOL9	CTTTCTATTCTCACAGCGCGCAGGCTGGTGTCACTCAGAC(SEQ ID 47)	TOL8
TOL9	CTTTCTATTCTCACAGCGCGCAGGCTGGTGTCACTCAGAC(SEQ ID 47)	YOL10	ATGATGTCTAGATGCGGCCGCGTCTGCTCTACcccaggcctc(SEQ ID 48)
YOL11	GCATCTAGACATCATCACCATCATCACTAGACTGTTGAAAGTTGTTTAGCAAAAC(SEQ ID 49)	YOL10	ATGATGTCTAGATGCGGCCGCGTCTGCTCTACcccaggcctc(SEQ ID 48)
YOL11		TOL12	CTAGAGGGTACCTTATTAAGACTCCTTATTACGCAGTATG(SEQ ID 50)

实施例3-细菌外被蛋白和异源二聚A6 TCR的融合蛋白在大肠杆菌中的表达

为了验证实施例2中产生的构件，使用先前所述用于产生展示抗体scFv的噬菌体(Li等，2000，Journal of Immunological Methods 236：133-146)及后续改进制备展示含非天然链间二硫键的A6 TCR噬菌体颗粒。含pEX746：A6噬菌粒(即编码可溶A6 TCR α链和按实施例2中所述产生的与噬菌体gIII蛋白融合的A6 TCR β链的噬菌粒)的大肠杆菌XL-1-Blue细胞用于接种5毫升Lbatg(含100微克/毫升氨苄青霉素，12.5微克/毫升四环素和2％葡萄糖的Lennox L培养基)，随后培养物37℃振荡培养过夜(16小时)。50微升过夜培养物用于接种5毫升TYPatg(TYP是16克/升蛋白胨、16克/升酵母提取物、5克/升NaCl和2.5克/升K₂HPO₄)，随后培养物37℃振荡培养直到OD_600nm＝0.8。向培养物添加辅助噬菌体M13 K07至终浓度5×10⁹cfu/ml。然后培养物37℃静置孵育30分钟并随后200rpm振荡另外30分钟。随后将上述培养物的培养基换成TYPak(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素的TYP)，随后培养物25℃ 250rpm振荡培养36到48小时。随后培养物4℃ 4000rpm离心30分钟。上清经0.45微米针筒过滤器过滤并4℃保存用于进一步的浓缩或分析。

上清液中丝状外被蛋白和含非天然链间二硫键的异源二聚A6 TCR的融合蛋白通过免疫印迹进行检测。还原和非还原加样缓冲液中约10¹¹cfu噬菌体颗粒加载于SDS-PAGE凝胶的每个泳道上。分离的蛋白用抗M13 gIII单克隆抗体进行一抗标记，随后用与辣根过氧化物酶(HRP)偶联的二抗标记。随后用Bio-Rad的Opti-4CN底物试剂盒检测HRP活性(图5)。这些数据表明二硫键连接的A6 TCR克隆1是与丝状噬菌体外被蛋白(gIII蛋白)融合的。

实施例4-丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚A6 TCR的检测

使用噬菌体ELISA方法检测展示在噬菌体颗粒上的功能性(HLA-A2-tax结合的)A6TCR的存在。

TCR-噬菌体ELISA

ELISA中展示A6 TCR的噬菌体颗粒与固定的肽-MHC的结合用初级兔抗fd抗血清(Sigma)随后用与抗兔单克隆抗体偶联的碱性磷酸酶(AP)(Sigma)检测。平板上非特异蛋白结合位点可以用2％ MPBS或3％ BSA-PBS封闭。

材料与试剂

1.包被缓冲液，PBS

2.PBS：138mM NaCl，2.7mM KCl，10mM Na₂HPO₄，2mM KH₂PO₄

3.MPBS，3％ marvel-PBS

4.PBS-Tween：PBS，0.1％ Tween-20

5.底物溶液，Sigma FAST pNPP，目录号N2770

方法

1.NeutrAvidin亲和素包被的反应池用PBS清洗两次。

2.添加25微升浓度为10微升/毫升的生物素-HLA-A2 Tax或生物素-HLA-A2NYESO，并在室温下孵育30到60分钟。

3.反应池用PBS清洗两次。

4.添加300微升3％MPBS，并室温孵育1小时。将TCR-噬菌体悬液与等体积的3％MPBS混合并室温孵育。

5.反应池用PBS清洗两次。

6.添加25微升噬菌体-A6 TCR/MPBS混合物，冰浴1小时。

7.反应池用冰冷的PBS-Tween清洗3次，并用冰冷的PBS清洗3次。

8.添加25微升冰冷的1∶1000稀释于MPBS的兔抗fd抗体，并且冰浴1小时。

9.反应池用冰冷的PBS-Tween清洗3次，并用冰冷的PBS清洗3次。

10.添加25微升冰冷的1∶50,000稀释于MPBS的抗兔单克隆抗体-碱性磷酸酶偶合物，并且冰浴1小时。

11.反应池用冰冷的PBS-Tween清洗3次，并用冰冷的PBS清洗3次。

12.向每个反应池添加150微升碱性磷酸酶黄并在405纳米处读取信号。

图6中展示的结果说明，克隆1产生了展示能特异性结合其同类pMHC(HLA-A2 Tax)的A6 TCR的噬菌体颗粒。

对该展示的A6 TCR的DNA序列分析显示在TCR β链中存在在相应的实施例2的表达载体构件序列中不存在的“乳白”终止密码子。该密码子能被所采用的大肠杆菌菌株的核糖体以低频率“读通”，导致在这一位置上插入色氨酸残基以及全长β链表达水平的显著降低。由这一现象推断，只有表达这一突变的A6 TCR序列的细胞在实施例3的培养循环中得以存活，并且因此预计由原始表达载体表达的A6 TCR的高水平对宿主细胞来说是有毒的。

实施例5-单链TCR(scTCR)核糖体展示

用以产生核糖体展示PCR模板的核糖体展示scTCR载体的构建

为产生没有错误并稳定的DNA PCR模板以由此进行随后的核糖体展示实验，将核糖体展示构件克隆到易于获得的DNA质粒pUC19中。载体构建分两步进行以避免使用大的寡核苷酸引物(及与其相关的错误问题)。图7a中显示了示意形式的最终的A6scTCR-C-κ DNA核糖体展示构件并且图7b中显示了其DNA和蛋白序列。这一构件可以作为PstI/EcoRI双酶切消化产物从pUC19上切离。

J.Sambrook和D.W.Russell所著《分子克隆：实验室手册》中描述了构建载体的分子克隆方法。

表2中列举的引物用于所述载体的构建。所采用的PCR程序如下：94℃ 2分钟1个循环，随后94℃ 30秒、55℃ 20秒以及72℃ 120秒25个循环，随后72℃ 5分钟1个循环，以及随后4℃保温。Pfu DNA聚合酶购自Strategene。表2中描述了使用的寡核苷酸引物。

构建pUC19-T7-步骤1

下面描述了pUC19-T7的构建，这导致形成含有跟随有短的间隔区域和最适的真核Kozak序列的一个T7启动子区的pUC19载体。由于这对于兔网状细胞溶解物中任何附着序列的转录启动来说是必需的，这成为核糖体展示构件的基础部分。用于核糖体展示的序列(如A6 scTCR-C-κ)可以连接在pUC19-T7载体的Nco I和EcoR I限制性位点之间。

通过将反应物加热到94℃ 10分钟并缓慢冷却到室温，对等摩尔量的反向连接(Rev-Link)和正向连接(For-Link)进行退火。这导致形成如下所示的双链DNA复合物。

5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGG

CGTCGATTATGCTGAGTGATATCCTTGTCCGGTGGTACCCTAG 3’

(SEQ ID 51)

5’区包含突出的与Hind III限制性位点互补的粘末端，而3’区包含与BamHI互补的粘末端。

退火的寡核苷酸连接到Hind III/BamHI双酶切的pUC19中，该质粒已经通过琼脂糖凝胶电泳纯化、切离以及用Qiagen胶提取试剂盒进一步纯化。连接产物转化大肠杆菌XL-1-Blue。单独的pUC19-T7克隆进行测序以证实正确序列的存在。图8中显示了该序列。

构建A6 scTCR-C-κ载体-步骤2

单链A6 scTCR-C-κDNA序列的构建要求产生必须随后组合成一个A6 scTCR-C-κ片段的3个PCR片段。这些片段包括(a.)5’区与NcoI位点邻接的A6 TCR α链可变结构域和3’区与BamHI限制性位点邻接的甘氨酸丝氨酸连接物部分。该产物用引物45和50(见表2)通过载体pEX202的常规PCR产生。片段(b.)5’区与BamHI限制性位点邻接的A6 TCR β可变结构域和恒定结构域，其后跟随着甘氨酸丝氨酸连接物部分。该产物用引物72和73(见表2)通过载体pEX207的常规PCR产生。片段(c.)用引物61-60(见表2)通过p147载体的常规PCR产生的人C-κ区的一部分。所有PCR产物在1.6％ TBE琼脂糖凝胶上分离，切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。

片段(b.)和(c.)通过其引物序列73和61(见表2)中的互补性通过常规的重叠PCR进行融合。PCR通过引物72和60(见表2)进行。PCR产物在1.6％ TBE琼脂糖凝胶上分离，切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。这一片段命名为(d.).

片段(a.)用NcoI和BamHI双酶切，而片段(d.)用BamHI和EcoRI双酶切。pUC19-T7用NcoI和EcoRI双酶切。所有酶切的DNA产物在1.2％ TBE琼脂糖凝胶上分离，切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。连接酶切的pUC19-T7、片段(a.)和(d.)并转化大肠杆菌XL-1-Blue。转化子测序以证实正确的序列。图9中显示了与PstI和EcoRI位点邻接的克隆到pUC19中的A6 scTCR-C-κ核糖体展示构件的序列。

表2 使用的寡核苷酸(购自MWG)

Rev-Link	5’GATCCCATGGTGGCCTGTTCCTATAGTGAGTCGTATTAGCTGC(SEQ ID 52)
Rev-Link	5’GATCCCATGGTGGCCTGTTCCTATAGTGAGTCGTATTAGCTGC(SEQ ID 52)	For-Link	5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGG(SEQ ID 53)
45-A6	5’CCACCATGGGCCAGAAGGAAGTGGAGCAGAACTC(SEQ ID 54)	For-Link	5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGG(SEQ ID 53)
45-A6	5’CCACCATGGGCCAGAAGGAAGTGGAGCAGAACTC(SEQ ID 54)	7 A6-Beta(RT-PCR)(a)	5’CGAGAGCCCGTAGAACTGGACTTG(SEQ ID 55)
49-A6-BamHI-F	5’GTGGATCCGGCGGTGGCGGGTCGAACGCTGGTGTCACTCAGACCCC(SEQ ID 56)	7 A6-Beta(RT-PCR)(a)	5’CGAGAGCCCGTAGAACTGGACTTG(SEQ ID 55)
49-A6-BamHI-F	5’GTGGATCCGGCGGTGGCGGGTCGAACGCTGGTGTCACTCAGACCCC(SEQ ID 56)	50-A6-BamHI-R	5’CCGGATCCACCTCCGCCTGAACCGCCTCCACCGGTGACCACAACCTGGGTCCCTG(SEQ ID 57)
60-Kappa-rev-EcoRI	5’CTGAGAATTCTTATGACTCTCCGCGGTTGAAGCTC(SEQ ID 58)	50-A6-BamHI-R
60-Kappa-rev-EcoRI	5’CTGAGAATTCTTATGACTCTCCGCGGTTGAAGCTC(SEQ ID 58)	61-Betac-Kappa-forl	5’TGACGAATTCTGACTCTCCGCGGTTGAAGCTC(SEQ ID 59)
71 T7-引物	5’AGCTGCAGCTAATACGACTCACTATAGG(SEQ ID 60)	61-Betac-Kappa-forl	5’TGACGAATTCTGACTCTCCGCGGTTGAAGCTC(SEQ ID 59)
71 T7-引物	5’AGCTGCAGCTAATACGACTCACTATAGG(SEQ ID 60)	72 A6-beta	5’GGCCACCATGGGCAACGCTGGTGTCACTCAGACCCC(SEQ ID 61)
73-A6-cons-rev	5’TGAACCGCCTCCACCGTCTGCTCTACCCCAGGCCTCGGCG(SEQ ID 62)	72 A6-beta	5’GGCCACCATGGGCAACGCTGGTGTCACTCAGACCCC(SEQ ID 61)
73-A6-cons-rev	5’TGAACCGCCTCCACCGTCTGCTCTACCCCAGGCCTCGGCG(SEQ ID 62)	75 Kappa-rev	5’TGACTCTCCGCGGTTGAAGCTC(SEQ ID 63)

通过体外转录翻译的sc A6 TCR-C-κ生产的说明

用于体外转录翻译的sc A6 TCR-C-κ PCR产物的制备

这里我们描述了在生物素化的赖氨酸存在的条件下通过体外转录翻译的sc A6TCR-C-κ的合成以及随后对其通过免疫印迹和用碱性磷酸酶标记的链亲和素检测的检测。

使用作为模板的sc A6 TCR-C-κ载体和引物71和60，在常规PCR反应中制备sc A6TCR-C-κ PCR产物。引物60包含终止密码子以使scTCR从核糖体上释放。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6％ TBE琼脂糖凝胶上分离，切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。使用目录号1280-1287的与Ambion PROTEINscript II连接的转录翻译试剂盒及300纳克上述PCR产物进行转录翻译反应。按照制造商的方案进行3个转录翻译反应。所作的改动是添加来自Transcend^TM非放射性翻译检测系统的生物素化的赖氨酸。

反应1：存在2微升生物素化的赖氨酸的情况下，300纳克sc A6 TCR-C-κ的反应

反应2：不存在2微升生物素化的赖氨酸的情况下，300纳克sc A6 TCR-C-κ的反应

反应3：存在2微升生物素化的赖氨酸的情况下，无DNA的对照反应

2微升的每种反应物在4-20％的Novex梯度SDS-PAGE凝胶(Invitrogen)上分离。此外也分离了多种稀释度的对照生物素化TCR。将凝胶转印迹并用链亲和素碱性磷酸酶检测蛋白并按照Transcend^TM非放射性翻译检测系统方案所述用针对碱性磷酸酶的Western Blue^稳定型底物随后进行比色法显色。图10中显示了免疫印迹结果。

在无DNA对照和无生物素化赖氨酸的A6 scTCR-C-κ的反应物中，如所预期的没有发现接近正确大小的条带，而在存在生物素化赖氨酸的A6 scTCR-C-κ的反应物中，可以观察到近似正确大小的条带。这说明通过体外转录翻译的sc A6 TCR-C-κ TCR的合成。

sc A6 TCR-C-κ核糖体展示PCR产物的制备

使用作为模板的A6 scTCR-C-κ载体和PCR引物71和75(见表2)在常规PCR反应中制备了sc A6 TCR-C-κ PCR产物。引物75不包含终止密码子。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6％ TBE琼脂糖凝胶上分离，切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。

核糖体展示过程

sc A6 TCR-C-κ的转录和翻译

使用与Ambion PROTEINscript II连接的转录翻译试剂盒(目录号1280-1287)进行转录/翻译反应。

转录反应物

将下列转录反应物放置在0.5毫升的Ambion非粘性试管(目录号12350)中。

内容物试管1(正常A6) 试管2(对照)

水	4.53微升	5.7微升
水	4.53微升	5.7微升	模板(PCR产物)	sc A6 TCR-C-κ PCR产物1.17微升(300纳克)	无DNA
5×转录混合物	2微升	2微升	模板(PCR产物)	sc A6 TCR-C-κ PCR产物1.17微升(300纳克)	无DNA
5×转录混合物	2微升	2微升	酶混合物	2微升	2微升
Superasin(Ambion RNA酶抑制剂)	0.3微升	0.3微升	酶混合物	2微升	2微升
Superasin(Ambion RNA酶抑制剂)	0.3微升	0.3微升	终体积	10微升	10微升

所述试管在热盖关闭的PCR模块上30℃孵育60分钟。

翻译反应物

将下列翻译反应物放置在0.5毫升的Ambion非粘性试管中。

内容物试管1(正常A6) 试管2(对照)

网状细胞溶解物	105微升	105微升
网状细胞溶解物	105微升	105微升	25mM醋酸镁	3微升	3微升
翻译混合物	7.5微升	7.5微升	25mM醋酸镁	3微升	3微升
翻译混合物	7.5微升	7.5微升	甲硫氨酸	7.5微升	7.5微升
水	18微升	18微升	甲硫氨酸	7.5微升	7.5微升
水	18微升	18微升	Superasin(Ambion RNA酶抑制剂)	3微升	3微升
转录反应物	6微升上述试管1产物	6微升上述试管2产物	Superasin(Ambion RNA酶抑制剂)	3微升	3微升

每个试管包含足够3次50微升挑选的体积。试管混合后在热盖关闭的PCR模块上30℃孵育60分钟。30分钟之后添加3单位不含RNA酶的RQ1 DNA酶(Promega)以降解试管1中最初的DNA模板，并在试管2中添加3单位不含RNA酶的RQ1 DNA酶(Promega)。60分钟之后向翻译反应物2添加18微升肝素溶液并向翻译反应物1添加18微升肝素溶液。冰浴保存样品以便于针对HLA包被的小珠进行选择。

磁珠的包被

20微升重悬的链亲和素磁珠(Roche目录号1641778)转移到无菌的不含RNA酶的1.5毫升eppendorf试管中。小珠用磁性颗粒分离器(Roche目录号1641794)固定并去除上清液。小珠随后用100微升不含RNA酶的1×PBS(10×PBS Ambion目录号9624，Ambion H₂O目录号9930)清洗。总共进行了3次PBS清洗。

小珠在20微升PBS中重悬并将其平分到两个试管(每个10微升)。一个试管将用于产生对照封闭的小珠，另一个试管用于产生HLA-A2-Tax包被的小珠。

向对照小珠试管添加80微升BSA/生物素溶液并混合。BSA/生物素溶液配制如下。向990微升含0.1％BSA(Ambion超纯，目录号2616)的PBS添加10微升0.2M Tris碱0.1M生物素溶液。还添加了20微升肝素溶液(1×PBS中含138mg/ml肝素(Sigma))并混合溶液。小珠间歇混合室温孵育1小时。随后3次用100微升PBS清洗并在10微升含0.1％BSA的PBS中重悬。

HLA-TAX包被的小珠制备如下。向10微升小珠添加40微升HLA-A2-Tax(如WO99/60120中所述制备的1.15mg/ml)并混合。小珠室温孵育15分钟并随后添加20微升BSA(50mg/ml，Ambion目录号2616)和20微升肝素溶液(见上述)并混合。小珠孵育另外45分钟，随后添加20微升BSA/生物素溶液。随后小珠3次用100微升PBS清洗并在10微升含0.1％BSA的PBS中重悬。

使用磁珠的淘选

将sc A6 TCR翻译反应物分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠：

对照(无HLA)

HLA-A2-Tax

HLA-A2-Tax加10微克可溶的scA6 TCR

对照翻译反应物也分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠：

对照(无HLA)

HLA-A2-Tax

HLA-A2-Tax加10微克可溶的scA6 TCR

这产生了总共6个试管。试管在PCR模块上伴随间歇的混合5℃孵育60分钟。

随后3次用100微升冰冷的缓冲液(PBS，5mM醋酸镁和0.2％Tween(Sigma，不含RNA酶))清洗小珠。每份试样量小珠随后在50微升含1微升(40单位)Superasin和1微升(1单位)RQ1 DNA酶的1×RQ1 DNA酶消化缓冲液中重悬。小珠在PCR模块上30℃孵育30分钟。

随后小珠用100微升冰冷的缓冲液(PBS，5mM醋酸镁和0.2％Tween)清洗3次并用冰冷的H₂O清洗1次。小珠重悬于10微升不含RNA酶的H₂O。小珠随后进行冷藏以准备进行RT-PCR。

核糖体展示反应中获得的磁珠上的scA6 TCR-C-κ mRNA的RT-PCR

如制造商方案中所述，使用Titan单试管RT-PCR试剂盒(目录号1855476)进行磁珠上的RT-PCR反应。连同引物45和7以及0.3微升Superasin RNA酶抑制剂，每个RT-PCR反应中添加2微升磁珠。

为每个RT-PCR反应设置第二个单PCR反应，该反应的差别在于除了Roche高保真聚合酶不含逆转录酶。所述第二个反应作为对DNA污染的对照。此外使用sc A6TCR-C-κ载体的Ing设置了RT-PCR的阳性对照。

反应物循环如下。通过样品50℃孵育30分钟，随后通过在PCR模块上94℃孵育3分钟以灭活逆转录酶进行RT-PCR步骤。反应物如下共进行38个PCR循环：

94℃ 30秒

55℃ 20秒

68℃ 130秒

PCR反应72℃孵育4分钟结束。

在所有的核糖体展示步骤过程中非常注意以避免RNA酶污染。RT-PCR和PCR反应物在1.6％的TBE琼脂糖凝胶上分离，这可以参见图11。对凝胶的分析显示，不存在DNA污染并且所有PCR产物源自mRNA。泳道2中正确大小的DNA条带说明，通过HLA-A2-Tax包被的小珠选出了核糖体展示的sc A6 TCR-C-κ。泳道3显示，我们可以通过添加可溶的sc A6 TCR来抑制这一核糖体展示的sc A6 TCR-C-κ的特异性选择。相对于泳道2中未抑制的样品，泳道3中条带亮度的明显降低说明了这一点。对于对照的无HLA包被的小珠，没有发现核糖体展示的sc A6 TCR-C-κ的结合。

实施例6

展示在噬菌体颗粒上的A6 TCR的序列分析和提高展示特性的方法

通过PCR和分子克隆构建了在噬菌体上展示A6 TCR的载体之后，对能产生展示A6 TCR的噬菌体的细菌克隆如实施例4所述通过噬菌体ELISA进行筛选。在ELISA结合测定法中鉴定了3个与HLA-A2-tax结合的不同的克隆。这些克隆都包含了“野生型”A6 TCR DNA的或与调节序列相联的突变，下表中描述了这些突变：

得自对噬菌体展示的TCR A6筛选的功能性克隆

名称	特征
名称	特征		克隆7	位于vβ基因之前的第3个核糖体结合位点从A AGGAGA突变为A AGGGGA
克隆9	在vβ CDR3中引入一个乳白密码子	图12a和12b中的完整DNA和氨基酸序列	克隆7	位于vβ基因之前的第3个核糖体结合位点从A AGGAGA突变为A AGGGGA
克隆9	在vβ CDR3中引入一个乳白密码子	图12a和12b中的完整DNA和氨基酸序列	克隆49	在vβ FR1中引入一个琥珀密码子。这一突变引入了一个不影响最终氨基酸序列的“沉默”突变	图13a中的完整DNA序列

这些克隆都包含了似乎引起A6 TCR β链表达水平降低的突变。我们推测，作为由TCR高表达水平引起的细胞毒性的结果，低表达克隆优于高表达克隆被选择。

实施例7-A6 TCR CDR3区域的诱变

A6 TCR的CDR3区域是引入突变以研究产生高亲和性突变体的可能性的靶标。

使用了重叠PCR对α和β CDR3的序列进行改进以用寡核苷酸YOL54，5′CAGCTGGGGGAAGCTTCAGTTTGGAGCAG3′(SEQ ID 64)和YOL55，5′CTGCTCCAAACTGAAGCTTCCCCCAGCTG3′(SEQ ID 65)对α链引入唯一的限制性位点Hind III，并用YOL56 5′GTACTTCTGTGCCTCGAGGCCGGGACTAG3′(SEQID 66)和YOL57 5′CTAGTCCCGGCCTCGAGGCACAGAAGTAC3′(SEQ ID 67)对β链引入唯一的限制性位点Xho I。

使用了PCR以引入亲和力成熟的突变。A6 TCR克隆9(在β链CDR3序列中并入一个引入的乳白密码子)用作模板DNA的一个来源，并且TCR链用突变引物(在以下的表中进行了详述)和YOL22 5’CATTTTCAGGGATAGCAAGC3’(SEQ ID 68)(β链)或YOL135’TCACACAGGAAACAGCTATG3’(SEQ ID 69)(α链)进行扩增。

用于在A6 α和β链的CDR3中引入突变的引物

引物名称	5′→3′序列
引物名称	5′→3′序列	YOL59	TGTGCCTCGAGGIMKNNKNNKNNKNNKNNKCGACCAGAGCAGTACTTCG(SEQ ID 70)
YOL60	TGTGCCTCGAGGCCGNNKNNKNNKNNKNNKNNKCCAGAGCAGTACTTCGGGC(SEQ ID 71)	YOL59
YOL60		YOL61	TGTGCCTCGAGGCCGNNKNNKNNKNWKNNKNNKCGACCAGAGCAGTACTTCG(SEQ ID 72)
YOL62	TGTGCCTCGAGGCCGNNKNNKNNKNWKNNKNNKGGAGGGCGACCAGAGCAG(SEQ ID 73)	YOL61
YOL62		YOL63	TGTGCCTCGAGGCCGGGANNKNNKNNKNNKNNKNNKGGGCGACCAGAGCAGTAC(SEQ ID 74)
YOL68	TGTGCCTCGAGGIMKNNKNNKNNKNNKNNKCCAGAGCAGTACTTCGggc(SEQ ID 75)	YOL63
YOL68		YOL69	TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKGAGCAGTACTTCGggccg(SEQ ID 76)
YOL70	TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKCAGTACTTCGggccgggc(SEQ ID 77)	YOL69	TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKGAGCAGTACTTCGggccg(SEQ ID 76)
YOL70	TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKCAGTACTTCGggccgggc(SEQ ID 77)	YOL71	TGTGCCTCGAGGccgNNKNNKNNKNNKgggCGACCAGAGCAGTACTTCG(SEQ ID 78)
YOL58	AAACTGAAGCTTMNNMNNMNNMNNMNNTGTAACGGCACAGAGGTAG(SEQ ID 79)	YOL71
YOL58	AAACTGAAGCTTMNNMNNMNNMNNMNNTGTAACGGCACAGAGGTAG(SEQ ID 79)	YOL72	AAACTGAAGCTTMNNMNNgctgtcMNNTGTAACGGCACAGAGGTAG(SEQ ID 80)
YOL73	AAACTGAAGCTTMNNMNNMNNgctgtcMNNTGTAACGGCACAGAGGTAG(SEQ ID 81)	YOL72	AAACTGAAGCTTMNNMNNgctgtcMNNTGTAACGGCACAGAGGTAG(SEQ ID 80)
YOL73		YOL74	AAACTGAAGCTTMNNMNNgc tgtcMNNAACGGCACAGAGGTAG(SEQ ID 82)

α链片段用NcoI和HindIII消化并用Qiagen试剂盒重新纯化，并且载体通过用NcoI和HindIII消化克隆9，随后用Qiagen试剂盒凝胶纯化进行制备。β链片段用XhoI和NotI消化并用Qiagen试剂盒重新纯化，并且载体通过用XhoI和NotI消化克隆9，随后用Qiagen试剂盒凝胶纯化进行制备。纯化的插入片段和载体以3∶1的摩尔比与T4连接酶缓冲液、T4连接酶和不含核酶的水混合。连接反应16℃水浴过夜。对于每个突变文库，按照制造商提供的方案，总共0.5到1微升的纯化的连接产物以每40微升电转化感受态细胞(Stratagen)0.2微克DNA的比例电转化大肠杆菌TG1。电转化后，细胞立即用960微升SOC培养基37℃重悬并平铺于含补充了100微克/毫升氨苄青霉素和2％葡萄糖的YTE(1升中含15克琼脂、18克NaCl、10克胰蛋白胨和5克酵母提取物)的244mm×244mm组织培养皿。平皿30℃孵育过夜。随后，用5毫升补充了15％甘油的DYT(1升中含16克胰蛋白胨、10克酵母提取物和5克NaCl，125℃高压灭菌15分钟)从平皿上刮取细胞。

为了制备展示A6 TCR的噬菌体颗粒，将500到1000微升的文库储存液接种于500毫升DYTag(含100微克/毫升氨苄青霉素和2％葡萄糖的DYT)。培养物生长到OD(600nm)达到0.5。100毫升培养物用辅助噬菌体(M1 3 K07(Invitrogen)或HYPERPHAGE(Progen Biotechnik，GmbH 69123 Heidelberg))感染并37℃水浴孵育30分钟。用100毫升DYTak(含100微克/毫升氨苄青霉素和25微克/卡那霉素的DYT)替换培养基。随后培养物25℃振荡(300rpm)孵育20到36小时。

实施例8

高亲和性A6 TCR突变体的分离

使用两种不同的方法进行高亲和性A6 TCR突变体的分离。

第一种方法包括使用Maxisorp免疫试管(Invitrogen)选择能与HLA-A2 Tax复合物结合的展示突变A6 TCR的噬菌体颗粒。免疫试管通过1到2毫升含10微克/毫升链亲和素的PBS室温过夜进行包被。试管用PBS清洗两次，并随后添加1毫升含5微克/毫升生物素化HLA-A2 Tax复合物的PBS并室温孵育30分钟。除了以下改动之外，高亲和性结合物选择的剩余方案如先前所述(Li等.(2000)Journal ofImmunological Methods 236：133-146)。进行3轮或4轮选择。对于第一轮选择的生物素化HLA-A2 Tax复合物的浓度是5微克/毫升，对于第二轮的浓度是0.5微克/毫升，第三轮的浓度是0.05微克/毫升，第四轮是0.005微克/毫升。对于选择而言，在第一轮和第二轮选择中使用了M13 K07辅助噬菌体，在随后的选择中使用了超噬菌体。

采用的第二种方法是在溶液中选择能与HLA-A2 Tax复合物结合的展示突变A6 TCR的噬菌体颗粒。按照制造商的方案预洗了链亲和素包被的顺磁小珠(Dynal M280)。对于第1轮、第2轮、第3轮和第4轮选择，以10¹²到10¹³cfu的浓度展示突变A6TCR的噬菌体颗粒分别与浓度为2×10^-8M，2×10^-9M，2×10^-10M和2×10^-11M的生物素化HLA-A2Tax复合物预混。展示A6 TCR的噬菌体颗粒与HLA-A2 Tax复合物的混合物轻轻旋转室温孵育1小时，用200微升(第1轮)或50微升(第2、3、4轮)链亲和素包被的M280磁珠捕获与生物素化HLA-A2 Tax复合物结合的展示A6 TCR的噬菌体颗粒。噬菌体颗粒捕获后，使用Dynal磁颗粒浓缩器频繁洗涤磁珠(3次用PBS Tween20，2次用含2％无脂奶粉的PBS Tween20，2次用PBS，2次用含2％无脂奶粉的PBS，以及2次用PBS)。最后的清洗以后，磁珠在1毫升新制备的pH 11.5的100mM乙三胺中重悬并伴随着轻轻旋转室温孵育5到10分钟。从磁珠上洗脱的噬菌体颗粒立即用300微升pH7.0的1M Tris-HCl中和。按照先前描述的方法，一半洗脱液用于感染10毫升新制备的OD(600nm)值0.5的大肠杆菌TG1以扩增选出的噬菌体颗粒(Li等，(2000)Journal of Immunological Methods 236：133-146)。

在第3轮和第4轮筛选后，从平皿上挑取95个单菌落并用于接种于96孔板上100微升DYTag中。培养物37℃振荡孵育过夜。随后用2到5微升的过夜培养物亚接种于100微升DYTag中，并37℃振荡孵育2到3小时或直至培养物变混浊。为了用辅助噬菌体感染细胞，用25微升含5×10⁹cfu辅助噬菌体的DYTag感染培养物并37℃孵育30分钟。用DYTak替换培养基。平板在300rpm振荡条件下25℃孵育20到36小时。通过4℃ 3000g离心10分钟沉淀细胞。上清液通过如下所述的竞争性噬菌体ELISA用于筛选高亲和性A6 TCR突变体。

链亲和素包被的Nunc-Immuno Maxisorp反应池用PBS清洗两次。每个反应池添加25微升5微克/毫升生物素化的HLA-A2-Tax复合物并室温孵育30到60分钟，随后用PBS清洗两次。通过添加300微升含3％无脂奶粉的PBS并随后室温孵育2小时封闭了反应池中的非特异性蛋白结合位点。为了制备展示异源二聚A6 TCR的噬菌体颗粒，噬菌体颗粒与含0、20和200nM HLA-A6-Tax的含3％无脂奶粉的PBS混合并室温孵育1小时。向HLA-A2-Tax包被的反应池添加该噬菌体并室温孵育1小时，接着用含0.1％ Tween20的PBS清洗3次并随后用PBS清洗3次。结合的展示TCR的噬菌体颗粒如实施例4所述的用抗fd抗体(Sigma)进行检测。

鉴别了多个假定的高亲和性A6 TCR突变体，并且在以下两张表中列举了其CDR3序列及相应的野生型序列。在所有β链突变体和一个α链突变体中发现了琥珀终止密码子(X)。

A6 TCR β链突变体

克隆	CDR3序列
克隆	CDR3序列	野生型	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGCAGTAG(SEQ ID 83)A S R P G L A G G R P E Q Y(SEQ ID 84)
134	GCCTCGAGGCCGGGGCTGATGAGTGCGTAGCCAGAGCAGTAC(SEQ ID 85)A S R P G L M S A X P E Q Y(SEQ ID 86)	野生型
134		86	GCCTCGAGGCCGGGGCTGAGGTCGGCGTAGCCAGAGCAGTAC(SEQ ID 87)A S R P G L R S A X P E Q Y(SEQ ID 88)
87	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGCGTAG(SEQ ID 89)A S R P G L A G G R P E A X(SEQ ID 90)	86
87		89	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGATTAG(SEQ ID 91)A S R P G L A G G R P E D X(SEQ ID 92)
85	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGATCAGTAG(SEQ ID 93)A S R P G L A G G R P D Q X(SEQ ID 94)	89
85		83	GCCTCGAGGCCGGGTCTGTAGGCTGGGCGACCAGAGCAGTAC(SEQ ID 95)A S R P G L X A G R P E Q Y(SEQ ID 96)
1	GCCTCGAGGCCGGGGCTGGTTCCGGGGCGACCAGAGCAGTAG(SEQ ID 97)A S R P G L V P G R P E Q X(SEQ ID 98)	83
1		2	GCCTCGAGGCCGGGGCTTGTGTCTGCTTAGCCAGAGCAGTAC(SEQ ID 99)A S R P G L V S A X P E Q Y(SEQ ID 100)
111	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCACATCCGTAG(SEQ ID 101)A S R P G L A G G R P H P X(SEQ ID 102)	2
111		125	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGATGCGTAG(SEQ ID 103)ASRPGLAGGRPDAX(SEQ ID 104)
133	GCCTCGAGGCCGGGTCTGATTAGTGCTTAGCCAGAGCAGTAC(SEQ ID 105)A S R P G L I S A X P E Q Y(SEQ ID 106)	125

A6 TCR α链突变体

克隆	CDR3
克隆	CDR3	野生型	GCCGTTACAACTGACAGCTGGGGGAAGCTTCAG(SEQ ID 107)A V T T D S W G K L Q(SEQ ID 108)
149	GCCGTTACAACTGACAGCTGGGGGCCGCTTCAG(SEQ ID 109)A V T T D S W G P L Q(SEQ ID 110)	野生型
149		65	GCCGTTACAACTGACAGCTGGGGGAAGATGCAG(SEQ ID 111)A V T T D S W G K M Q(SEQ ID 112)
66	GCCGTTACAACTGACAGCTGGGGGAAGTTGCAT(SEQ ID 113)A V T T D S W G K L H(SEQ ID 114)	65
66		153	GCCGTTACAACTGACAGCTGGGGGTAGCTTCAT(SEQ ID 115)A V T T D S W G X L H(SEQ ID 116)
71	GCCGTTACAACTGACAGCTGGGGGGAGCTTCAT(SEQ ID 117)A V T T D S W G E L H(SEQ ID 118)	153
71		70	GCCGTTACAACTGACAGCTGGGGGAGGCTGCAT(SEQ ID 119)A V T T D S W G R L H(SEQ ID 120)
121	GCCGTTACAACTGACAGCTGGGGGCAGCTTCAT(SEQ ID 121)A V T T D S W G Q L H(SEQ ID 122)	70
121		117	GCCGTTACAACTGACAGCTGGGGGAAGGTTCAT(SEQ ID 123)A V T T D S W G K V H(SEQ ID 124)
72	GCCGTTACAACTGACAGCTGGGGGAAGGTGAAT(SEQ ID 125)A V T T D S W G K V N(SEQ ID 126)	117
72		150	GCCGTTACAACTGACAGCTGGGGGAAGCTTCTG(SEQ ID 127)A V T T D S W G K L L(SEQ ID 128)

实施例9

含CDR3突变的具有恒定结构域之间非天然二硫键的可溶异源二聚A6 TCR的产生

使用Mini-Prep试剂盒(Quiagen，UK)从相关的大肠杆菌细胞中分离了实施例8中所鉴别的编码高亲和性A6 TCR突变体。

使用噬菌粒DNA作为模板并使用以下引物的PCR扩增用于扩增可溶TCR α和β链DNA序列。

A6 TCR α链正向引物

ggaattc atcgatg cagaaggaagtggagcag(SEQ ID 129)

(ClaI限制性位点用下划线表示)

通用TCR α链反向引物

gtaca cggccgggtcagggttctggatatac(SEQ ID 130)

(EagI限制性位点用下划线表示)

A6 β链正向引物

Tctctc attaatgaatgctggtgtcactcagacccc(SEQ ID 131)

(AseI限制性位点用下划线表示)

通用β链反向引物

Tagaa accggtggccaggcacaccagtgtggc(SEQ ID 132)

(AgeI限制性位点用下划线表示)

在TCR β链的情况下，进行了进一步的PCR拼接以用编码谷氨酸的密码子取代CDR3区中的琥珀终止密码子。当大肠杆菌中琥珀终止密码子被抑制时，谷酰胺残基被正常引入而不是翻译终止。因此，当在噬菌体表面展示含琥珀密码子的TCR时，该位置包含谷酰胺残基。然而，当该TCR β链基因转移到表达质粒时，谷氨酸残基用作谷酰胺的另一种选择。用于这一PCR拼接的引物如下。

YOL124 CTGCTCTGGTTCCGCACTC

(SEQ ID 133)

YOL125 GAGTGCGGAACCAGAGCAG

(SEQ ID 134)

通过自动测序验证了突变的可溶A6 TCR β链的DNA序列(见针对突变的A6 TCR β链DNA序列的图14a和针对突变的A6 TCR β链氨基酸序列的图14b)。图14c显示了不含谷酰胺到谷氨酸替代的突变的A6 TCR β链的氨基酸序列，即如通过噬菌体ELISA分离的克隆134中的序列。

这些A6 TCR α和β链DNA序列随后用以产生如WO 03/020763中所述的可溶A6 TCR。简而言之，这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后体外分离包含体、变性并共同复性。

实施例10

与HLA-A2 Tax结合的高亲和性A6 TCR的BIAcore表面等离子体谐振特征描述

使用了表面等离子体谐振生物感应器(BIAcore 3000^TM)来分析高亲和性克隆134A6 TCR(见分别针对突变的TCR β链的完整DNA和氨基酸序列的图15a和15b)与HLA-A2Tax配体的结合。产生的pMHC复合物(见以下描述)有助于这一过程，该复合物以半定向方式固定在包被链亲和素的结合表面上，这允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同的流动池中)的结合。手工注入HLA复合物允许对固定的I类分子的精确水平进行简单操作。

从细菌表达的含组成的亚基蛋白质及合成肽的包含体体外复性，随后进行纯化和体外酶的生物素化成生物素化的I类HLA-A2 Tax复合物(O’Callaghan等，(1999)Anal.Biochem.266：9-15)。表达含以适当结构取代蛋白跨膜和胞质结构域的C末端生物素化标签的HLA重链。获得了约75毫克/升包含体表达水平的细菌培养物。HLA轻链或β2微球蛋白也以包含体形式从适当的构件在大肠杆菌中表达，表达水平约为500毫克/升细菌培养物。

溶解大肠杆菌细胞并将包含体纯化至约80％的纯度。包含体蛋白质在6M盐酸胍、50mM Tris(pH 8.1)、100mM NaCl、10mM DTT和10mM EDTA中变性，并通过在5℃以下以单一脉冲将变性蛋白质加入重折叠缓冲液的方式，对浓度为30毫克/升重链、30毫克/升β2m在0.4M L-精氨酸-HCl、100mM Tris(pH 8.1)、3.7mM胱胺、mM巯基乙胺、4毫克/毫升肽(例如tax 11-19)中重折叠。使重折叠在4℃时至少1小时完成。

通过在10倍体积pH 8.1的Tris缓冲液中透析交换缓冲液。需要换两次缓冲液以充分降低溶液的离子强度。随后蛋白溶液通过1.5微米的醋酸纤维素滤器过滤并加载于POROS 50HQ阴离子交换柱(床体积8毫升)。用线性的0-500mM NaCl梯度洗脱蛋白质。HLA-A2-肽复合物在约250mM NaCl处洗脱，收集峰值处的组分，添加蛋白酶抑制剂混合剂(Calbiochem)并在冰上冷藏组分。

使用在相同缓冲液中平衡的Pharmacia快速脱盐柱将生物素化标记的HLA-A2复合物的缓冲液换成10mM Tris pH 8.1、5mM NaCl。洗脱后，含蛋白质的组分立即在冰上冷却并添加蛋白酶抑制剂混合剂(Calbiochem)。随后添加生物素化试剂：1mM生物素、5mMATP(pH缓冲到8)、7.5mM MgCl₂和5微克/毫升BirA酶(按照0’Callaghan等，(1999)Anal.Biochem.266：9-15所述方法纯化的)。随后使混合物室温孵育过夜。

使用凝胶过滤层析纯化生物素化的HLA-A2复合物。Pharmacia Superdex 75HR10/30层析柱用过滤的PBS预平衡并加载1毫升生物素化反应混合物并用0.5毫升/分钟流速的PBS进行层析。生物素化的HLA-A2复合物在约15毫升处以单个峰的形式被洗脱。合并含蛋白质的组分、在冰上冷却并添加蛋白酶抑制剂混合剂。使用考马斯结合测定法(PerBio)确定了蛋白质浓度并在-20℃冻存试样量的生物素化HLA-A2复合物。通过常规的胺耦合方法固定链亲和素。

含新的链间键的高亲和性A6 Tax TCR和HLA-A2 Tax或无关的HLA-A2 NY-ESO组合(其产生如上所述)之间的相互作用在BIAcore 3000^TM表面等离子体谐振(SPR)生物感应器上进行分析。SPR测量用反应单位(RU)表示的小流动池内感应器附近折射系数的变化，这是能用于检测受体配体相互作用并分析其亲和力和动力学参数的原理。通过经与β2m交联的生物素和已经与流动池活化表面化学交联的链亲和素之间的结合将单独的HLA-A2肽复合物固定在不同流动池中，制备了探针流动池。随后通过sTCR以恒定流速流经不同流动池的表面进行检测，以此测量了SPR反应。最初，相互作用的特异性通过可溶A6 TCR以5微升/分钟的恒定流速流经4个不同表面进行验证：一个用约1000RU的HLA-A2 Tax复合物包被，第2个用约1000RU的HLA-A2NY-ESO复合物包被，以及2个只用链亲和素包被的空白流动池(见图15)。

突变的A6 TCR的提高的亲和力使得对其与HLA-A2 Tax复合物相互作用的Kd值的计算变得困难。然而，计算的该相互作用的半衰期(t_1/2)与野生型相互作用的t_1/2 7.2秒相比是51.6分钟(见图16)。

实施例11

编码含新的二硫键的可溶NY-ESO TCR的载体的产生

实施例1中制备的可溶A6 TCR的β链在天然序列中包含适于用作连接位点的BglII限制性位点(AAGCTT)。

如下详述进行PCR诱变以在可溶A6 TCR的α链中新的半胱氨酸密码子的5’端引入BamHI限制性位点(GGATCC)。图2a中描述的序列用作这一诱变的模板。使用了以下引物：

|BamHI|

5’-ATATCCAGAACCCgGAtCCTGCCGTGTA-3’(SEQ ID 135)

5’-TACACGGCAGGAaTCcGGGTTCTGGATAT-3’(SEQ ID 136)

100纳克质粒与5微升10mM dNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H2O将终体积调节为240微升。在48微升的这一混合物中添加引物使其在50微升最终反应体积中的终浓度稀释为0.2μM。最初的95℃ 30秒的变性步骤之后，反应物在Hybaid PCR express PCR仪上进行了15轮的变性(95℃，30秒)、退火(55℃，60秒)和延伸(73℃，8分钟)。随后产物用10单位DpnI限制性酶(New England Biolabs)37℃消化5小时。10微升消化反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨、16克/升酵母提取物、5克/升NaCl、2.5克/升K₂HPO₄、100毫克/升氨苄青霉素)中生长过夜。按照制造商说明书在Qiagen mini-prep柱上纯化了质粒DNA并通过在牛津大学生物化学系的测序设备上的自动化测序验证了该序列。

按照已知的技术从T细胞中分离了编码NY-ESO TCR的cDNA。通过用逆转录酶处理mRNA生成了编码NY-ESO TCR的cDNA。

为了产生编码合并了新的二硫键的可溶NY-ESO TCR，将含α链BamHI和β链BglII限制性位点的A6 TCR用作模板。使用了以下引物：

|NdeI|

5’-GGAGATATACATATGCAGGAGGTGACACAG-3’(SEQ ID 137)

5’-TACACGGCAGGATCCGGGTTCTGGATATT-3’(SEQ ID 138)

|BamHI|

|NdeI|

5’-GGAGATATACATATGGGTGTCACTCAGACC-3’(SEQ ID 139)

5’-CCCAAGCTTAGTCTGCTCTACCCCAGGCCTCGGC-3’(SEQ ID 140)

|BglII|

通过如下的PCR克隆获得了NY-ESO TCR α和β链构件。使用上述引物和含天然NY-ESO TCR链的模板进行了PCR反应。PCR产物用相应的限制性酶进行了限制性消化，并克隆到pGMT7以获得表达质粒。质粒插入序列通过自动化DNA测序进行证实。图17a和17b分别显示突变的NY-ESO TCR α和β链的DNA序列，图18a和18b显示最终的氨基酸序列。

实施例12

噬菌体展示载体的构建和将编码NY-ESO TCR α和β链的DNA克隆进该噬菌粒载体

按照实施例11中所述产生的合并了新的半胱氨酸密码子以促进形成非天然链间二硫键的编码可溶NY-ESO TCR α和β链的DNA如下并入噬菌粒载体pEX746。

使用以下引物分别对编码两条NY-ESO TCR链的DNA进行了PCR以引入与pEX746噬菌粒载体(含编码A6 TCR克隆7的DNA)相容的克隆位点：

针对NY-ESO TCR α链的引物

TRAV21

GCCG GCCATGGCCAAACAGGAGGTGACGCAGATTCCT(SEQ ID 141)

YOL6

CTTCTTAAAGAATTCTTAATTA ACCTAGGTTATTAGGAACTTTCTGGGCTG

GGGAAG(SEQ ID 142)

针对NY-ESO TCR β链的引物

TRBV6-1/2/3/5/6/7/8/9

TCAC AGCGCGCAGGCTGGTGTCACTCAGACCCCAAA(SEQ ID 143)

RT1

CGAGAGCCCGTAGAACTGGACTTG(SEQ ID 144)

J.Sambrook和D.W.Russell的《分子克隆：实验室手册》中描述了用以构建载体的分子克隆方法。表1中列举的引物用于所述载体的构建。PCR程序的一个例子是94℃ 2分钟1个循环，随后94℃ 5秒、53℃ 5秒和72℃ 90秒25个循环，接着72℃ 10分钟1个循环，以及随后的4℃保温。高保真Taq DNA聚合酶购自Roche。

通过用限制性酶BssHII和BglII的消化从pEX746中去除编码克隆7 A6 TCR β链的DNA。随后通过连接将相应消化的编码NY-ESO β链的PCR DNA取代入该噬菌粒。克隆产物的序列通过自动测序进行验证。

类似地，通过用限制性酶NcoI和AvrII的消化从pEX746中去除编码克隆7 A6 TCRα链的DNA。随后通过连接将相应消化的编码NY-ESO α链的PCR DNA取代入已经包含编码NY-ESO TCR β链的DNA的噬菌粒。克隆产物的序列通过自动测序进行验证。图19a和19b分别详述了NY-ESO TCR α和β链的DNA和氨基酸序列以及并入噬菌体(pEX746：NY-ESO)的其周围相关序列。NcoI位点之前的序列与pEX746相同。

实施例13

细菌外被蛋白和异源二聚NY-ESO TCR的融合蛋白在大肠杆菌中的表达

使用对先前所述用于产生噬菌体颗粒展示的抗体scFv做以下改进的方法(Li等，2000，Journal of Immunological Methods 236：133-146)制备了展示含非天然链间二硫键的异源二聚NY-ESO TCR。将含pEX746：NY-ESO噬菌粒(即编码可溶NY-ESO TCRα链和如实施例12中所述方法产生的与噬菌体gIII蛋白融合的NT-ESO TCR β链的噬菌粒)的大肠杆菌TG1细胞接种到10毫升2xTY(含100微克/毫升氨苄青霉素和2％葡萄糖)，随后培养物37℃振荡孵育过夜(16小时)。将50微升过夜培养物接种于10毫升2xTY(含100微克/毫升氨苄青霉素和2％葡萄糖)，随后培养物37℃振荡孵育直至OD(600nm)达到0.8。在培养物中添加终浓度为5×10⁹pfu/ml的HYPERPHAGE辅助噬菌体。随后培养物37℃静置孵育30分钟并以200rpm进一步振荡孵育30分钟。随后用2xTY(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素)将上述培养物的培养基体积调整为50毫升，随后25℃ 250rpm振荡孵育36到48小时。随后培养物4℃ 4000rpm离心30分钟。上清液经0.45微米针筒过滤器过滤并4℃保存以进一步浓缩。随后上清液通过PEG沉淀和用10％原始保存体积的PBS重悬进行浓缩。

实施例14

丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚NY-ESO TCR的检测

使用实施例4中所述的噬菌体ELISA方法对实施例13中所制备的浓缩悬液中的噬菌体颗粒上展示的功能性(HLA-A2-NY-ESO结合的)NY-ESO TCR进行了检测。图20说明在噬菌体ELISA测定法中噬菌体颗粒展示的NY-ESO TCR与HLA-A2-NY-ESO的特异性结合。

实施例15

用以HLA-DRA基因细胞表达的质粒的构建

使用聚合酶链式反应(PCR)和设计成包括BglII限制性位点的合成的DNA引物对，从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。

随后使用PCR诱变在该扩增序列的3’末端添加编码Fos亮氨酸拉链的DNA。

上述的DNA操作和克隆按照Sambrook，J等所著《分子克隆—实验室手册》第2版(Molecular Cloning-A Laboratory Manual.Second Edition.Cold Spring HarborLaboratory Press，USA)中所述进行。

图21提供了适于插入双顺反子表达载体的HLA-DR β链的DNA序列。该图指出了编码Fos亮氨酸拉链肽和生物素标签的密码子的位置。

氨基酸编号建立在小鼠序列的基础上(Kabat，1991，《免疫学上感兴趣的蛋白的序列》第5版(Sequences of Proteins of Immunological Interest，5^th edition，US Dept of Health & Human Services，Public Health Service，NIH，Bethesda，MD 1-1137)。

随后将这一DNA序列连同编码相应II类HLA β链的DNA插入杆状病毒载体pAcAB3(见图22所示该载体的序列)以在Sf9昆虫细胞中表达。该载体可用于在昆虫细胞中表达任何II类HLA-肽复合物。

实施例16

用以HLA-DRB野生型和突变体基因细胞表达的质粒的构建

使用聚合酶链式反应(PCR)和设计成包括BamHI限制性位点的合成的DNA引物对，从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。

随后使用PCR诱变在该扩增序列的3’末端添加编码Jun亮氨酸拉链的DNA并在该序列的5’末端添加编码由HLA-DR1分子荷载的Flu HA肽的DNA。

上述的DNA操作和克隆按照Sambrook，J等所著《分子克隆—实验室手册》第2版(Molecular Cloning-A Laboratory Manual.Second Edition.Cold Spring HarborLaboratory Press，USA，1999)中所述进行。

图23提供了适于插入双顺反子表达载体的HLA-DR β链的DNA序列。该图指出了编码Jun亮氨酸拉链肽和Flu HA肽的密码子的位置。

实施例17

II类HLA-DR1-Flu HA复合物的表达和复性

使用如实施例15和16所述的方法产生的含II类HLA-DR1 α和β链和Flu HA肽的双顺反子表达载体实现了II类MHC表达。使用的表达和纯化方法如Gauthier(1998)PNAS USA 95 11828-11833中所述。简而言之，通过用来自转录因子Fos和Jun的亮氨酸拉链二聚化结构域替换DR α和β链的疏水性跨膜结构域和胞质片段，在杆状病毒系统中表达了可溶的HLA-DR1。在表达构件中，需要的II类MHC荷载的Flu HA肽序列与成熟DR β链的N末端共价连接并且CR α链包含生物素化标签以促进利用生物素/链亲和素多聚化方法的双功能配体的形成。用重组杆状病毒感染的Sf9细胞分泌重组蛋白，并通过亲和层析对重组蛋白进行纯化。该蛋白进一步通过阴离子交换HPLC进行纯化。

实施例18-I类可溶肽-HLA分子的构建

为了进一步研究高亲和性A6 TCR克隆134的特异性，生成了以下可溶I类肽-HLA分子：

HLA-A2-肽(LLGRNSFEV)(SEQ ID 23)

HLA-A2-肽(KLVALGINAV)(SEQ ID 24)

HLA-A2-肽(LLGDLFGV)(SEQ ID 25)

HLA-B8-肽(FLRGRAYGL)(SEQ ID 26)

HLA-B27-肽(HRCQAIRKK)(SEQ ID 27)

HLA-Cw6-肽(YRSGIIAVV)(SEQ ID 28)

HLA-A24-肽(VYGFVRACL)(SEQ ID 29)

HLA-A2-肽(ILAKFLHWL)(SEQ ID 30)

HLA-A2-肽(LTLGEFLKL)(SEQ ID 31)

HLA-A2-肽(GILGFVFTL)(SEQ ID 33)

HLA-A2-肽(SLYNTVATL)(SEQ ID 34)

这些可溶肽-HLA使用实施10中所述的方法产生。

实施例19-克隆134高亲和性A6 TCR与肽-HLA结合特异性的BIAcore表面等离子体谐振测量

使用了表面等离子体谐振生物感应器(BIAcore 3000^TM)来分析高亲和性克隆134A6 TCR(见图15a和15b分别表示的突变TCR β链的完整DNA和氨基酸序列)的结合特异性。这通过使用如实施例15-17所述产生的II类HLA-DR1-肽和使用实施例10中详述的方法产生的列举在实施18中的I类肽-HLA复合物得以实现。下表列举了采用的肽-HLA复合物：

1.HLA-A2-肽(LLGRNSFEV)(SEQ ID 23)

2.HLA-A2-肽(KLVALGINAV)(SEQ ID 24)

3.HLA-A2-肽(LLGDLFGV)(SEQ ID 25)

4.HLA-B8-肽(FLRGRAYGL)(SEQ ID 26)

5.HLA-B27-肽(HRCQAIRKK)(SEQ ID 27)

6.HLA-Cw6-肽(YRSGIIAVV)(SEQ ID 28)

7.HLA-A24-肽(VYGFVRACL)(SEQ ID 29)

8.HLA-A2-肽(ILAKFLHWL)(SEQ ID 30)

9.HLA-A2-肽(LTLGEFLKL)(SEQ ID 31)

10.HLA-DR1-肽(PKYVKQNTLKLA)(SEQ ID 32)

11.HLA-A2-肽(GILGFVFTL)(SEQ ID 33)

12.HLA-A2-肽(SLYNTVATL)(SEQ ID 34)

以上的肽-HLA以半定向方式固定在BIAcore 3000^TM流动池中的链亲和素包被的结合表面上。

BIAcore 3000^TM允许同时对可溶T细胞受体与4种以内不同的pMHC(固定在不同的流动池内)的结合进行检测。实验中在流动池2-4中固定了3种不同的HLA-肽并且流动池1留作空白对照。手工注入HLA-肽复合物允许对固定分子的精确水平进行操纵。

在对高亲和性A6 TCR克隆134与以上列表中前3种HLA-肽复合物的结合能力进行评估以后，接下来的3种复合物直接固定在这些流动池中前一批复合物之上。持续这一过程直至高亲和性A6 TCR克隆134与所有12种HLA-肽复合物的结合进行了评估。

注入的5微升高亲和性A6 TCR克隆134以介于4.1纳克/毫升到2.1毫克/毫升的浓度和5微升/分钟的流速通过每个流动池(见图24-28)。

作为最后的对照，高亲和性A6 TCR克隆134通过含固定的HLA-A2 Tax(LLFGYPVYV)(SEQ ID 21)(该TCR的同类配体)的流动池。

只发现了高亲合力A6 TCR克隆134与其同类配体(HLA-A2 Tax(LLFGYPVYV)(SEQ ID21))的特异性结合。这些数据进一步说明高亲和性A6 TCR克隆134的特异性(见图24-28)。

实施例20-NY-ESO TCR CDR3区的诱变

NY-ESO TCR的CDR3区作为引入突变以研究产生高亲和性突变体可能性的靶标。这通过组合使用NY-ESO TCR特异性PCR引物和与实施例7中详述的方法充分相同的方法得以实现。

实施例21-高亲和性A6 TCR突变体的分离

使用实施例8所述两种方法中的第一种方法实现了高亲和性NY-ESO TCR突变体的分离。

鉴别了单一的高亲和性NY-ESO TCR。

实施例22

具有恒定结构域之间非天然二硫键的含可变结构域突变的可溶高亲和性异源二聚NY-ESO TCR的产生

使用Mini-Prep试剂盒(Quiagen，UK)从相应的大肠杆菌细胞中分离了编码实施例20中所鉴别的高亲和性NY-ESO TCR突变体的噬菌体DNA。

使用将噬菌粒DNA作为模板和以下引物的PCR扩增用于扩增突变的可溶NY-ESOTCR β链可变结构域DNA序列

NY-ESO β链正向引物

Tctctc attaatgaatgctggtgtcactcagacccc(SEQ ID 145)

(AseI限制性位点用下划线表示)

通用β链反向引物

Tagaa accggtggccaggcacaccagtgtgg(SEQ ID 146)

(AgeI限制性位点用下划线表示)

随后PCR产物用AgeI/AseI消化并克隆进用NdeI/AgeI切割的pEX821(如实施例11所述产生)。

如上所述扩增的突变NY-ESO TCR β链DNA序列和如实施例11所述生成的NY-ESOTCR α链随后用于产生如WO 03/020763所述的可溶高亲和性NY-ESO TCR。简而言之，这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后对包含体进行纯化、变性和共同体外复性。

实施例23-与HLA-A2 NY-ESO结合的高亲和性NY-ESO TCR的BIAcore表面等离子体谐振特征描述

使用了表面等离子体谐振生物感应器(Biacore 3000^TM)来分析高亲和性NY-ES0TCR与HLA-A2 NY-ESO配体的结合。这由生成的以半定向方式固定在链亲和素包被的结合表面上从而允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同流动池中)结合的pMHC复合物(如实施例10所述)促进。手工注入HLA复合物使得对固定的I类分子的精确水平进行简便操纵。

也如实施例10中所述，在Biacore 3000^TM表面等离子体谐振(SPR)生物感应器上分析了含新的链间键的高亲和性NY-ESO TCR和HLA-A2 NY-ESO复合物或无关的HLA-A2Tax组合物(实施例10中描述了其产生)之间的相互作用。

可溶高亲和性NY-ESO与HLA-A2 NY-ESO的相互作用的Kd值计算为4.1μM(见图29a和29b)，这与野生型相互作用Kd值为15.7μM(见图30a和30b)形成对比。

实施例24-更多高亲和性A6 TCR的产生和检测

使用实施例9中所详述的方法，产生了含以下对应于克隆89、1、111和71(见实施例8)中所鉴别的突变的可溶TCR。随后使用实施例10中详述的Biacore测定法对这些可溶TCR与HLA-A2 Tax结合进行了评估。

A6 TCR β链突变体

克隆	CDR3序列
克隆	CDR3序列	野生型	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGCAGTAG(SEQ ID 83)A S R P G L A G G R P E Q Y(SEQ ID 84)
89	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGATTAG(SEQ ID 91)A S R P G L A G G R P E D X(SEQ ID 92)	野生型
89		1	GCCTCGAGGCCGGGGCTGGTTCCGGGGCGACCAGAGCAGTAG(SEQ ID 97)A S R P G L V P G R P E Q X(SEQ ID 98)
111	GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCACATCCGTAG(SEQ ID 101)A S R P G L A G G R P H P X(SEQ ID 102)	1

A6 TCR α链突变体

克隆	CDR3
克隆	CDR3	野生型	GCCGTTACAACTGACAGCTGGGGGAAGCTTCAG(SEQ ID 107)A V T T D S W G K L Q(SEQ ID 108)
71	GCCGTTACAACTGACAGCTGGGGGGAGCTTCAT(SEQ ID 117)A V T T D S W G E L H(SEQ ID 118)	野生型

组合的突变用作产生突变的可溶A6 TCR：

克隆89突变+克隆134突变

克隆71突变+克隆134突变

克隆71突变+克隆89突变

克隆1突变+βG102→A突变

结果：

以下的表格比较了以上可溶的突变A6 TCR与使用含非突变可变结构域获得的亲和力。注意，用相互作用的半寿期(T_1/2)表示最高亲和性突变体的亲和力。如由其相互作用更低的Kd值或更长的T_1/2所证明的，这些可溶突变A6 TCR对HLA-A2 Tax具有比非突变可溶A6 TCR更高的亲和力。

图31-37显示了用于计算这些可溶突变TCR对HLA-A2 Tax亲和力的Biacore记录。

图38a-e显示了突变A6 TCR链的氨基酸序列。

A6TCR	Kd(μM)	T_1/2(秒)
A6TCR	Kd(μM)	T_1/2(秒)	野生型	1.9	7
克隆1		810	野生型	1.9	7
克隆1		810	克隆89	0.41
克隆111	1.18		克隆89	0.41
克隆111	1.18		克隆71	1.37
克隆89+克隆134突变		114(时相1)4500(时相2)	克隆71	1.37
克隆89+克隆134突变		114(时相1)4500(时相2)	克隆71+克隆134突变		882
克隆71+克隆89突变	0.35		克隆71+克隆134突变		882
克隆71+克隆89突变	0.35		克隆1+βG102→A突变		738

实施例25-使用高亲和性A6 TCR四聚物和单体的细胞染色

T2抗原提呈细胞与β2m(3微克/毫升)37℃孵育90分钟，同时以脉冲方式输送浓度介于10^-5M-10^-9M的Tax肽。对于也使用与β2m(3微克/毫升)孵育的T2细胞的对照，以脉冲方式输送10^-5的Flu肽或不与肽共同孵育(无脉冲的)。脉冲输送后，细胞用无血清RPMI清洗并且2×10⁵细胞与用藻红蛋白(PE)(Molecular probes，TheNetherlands)(10微克/毫升)标记的链亲和素相连的高亲和性克隆134 A6 TCR四聚体或用Alexa 488(Molecular probes，The Netherlands)标记的高亲和性克隆134 A6TCR单体室温孵育10分钟。细胞清洗以后，使用FACSVantage SE(Becton Dickinson)通过流式细胞仪检验了标记的TCR四聚体和单体的结合。

结果

如图39a所示，当Tax肽浓度低于10^-9M时，可以观察到T2细胞通过高亲和性A6TCR四聚体的特异性染色。

如图39b所示，当Tax肽浓度低于10^-8M时，可以观察到T2细胞通过高亲和性A6TCR单体的特异性染色。

序列表

公司申请人

街道：密尔顿公园57C

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：martin.green@avidex.com

<110>公司名称：阿维德克斯有限公司

个人申请人

街道：密尔顿公园57C，阿维德克斯有限公司

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：bent.jakobsen@avidex.com

<110>姓：雅各布森

<110>名：本特

<110>中间名：K

<110>注释：博士

个人申请人

街道：密尔顿公园57C，阿维德克斯有限公司

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：torben.andersen@avidex.com

<110>姓：安德森

<110>名：托本

<110>中间名：B

<110>注释：博士

个人申请人

街道：密尔顿公园57C，阿维德克斯有限公司

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：peter.molloy@avidex.com

<110>姓：莫洛伊

<110>名：彼特

<110>中间名：E

<110>注释：博士

个人申请人

街道：密尔顿公园57C，阿维德克斯有限公司

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：jonathan.boulter@avidex.com

<110>姓：伯尔特

<110>名：乔纳森

<110>中间名：M

<110>注释：博士

个人申请人

街道：密尔顿公园57C，阿维德克斯有限公司

城市：阿宾顿

州：牛津郡

国家：英国

邮政编码：OX14 4RX

电话号码：+44 1235 438600

传真号码：+44 1235 438601

电子邮件地址：yi.li@avidex.com

<110>姓：李

<110>名：懿

<110>中间名：

<110>注释：博士

申请方案

<120>发明名称：物质

<130>申请文件编号：Case No 19

<140>当前申请号：GB 0226227.7

<141>当前申请日：2002-11-09

在先申请

<150>在先申请号：GB 0226227.7

<151>在先申请日：2002-11-09

在先申请

<150>在先申请号：GB 0301814.0

<151>在先申请日：2003-01-25

在先申请

<150>在先申请号：GB 0304067.2

<151>在先申请日：2003-02-22

在先申请

<150>在先申请号：GB 0311397.4

<151>在先申请日：2003-05-16

在先申请

<150>在先申请号：GB 0316356.5

<151>在先申请日：2003-07-11

在先申请

<150>在先申请号：us 60/463,323

<151>在先申请日：2003-04-16

序列

<213>生物体名称：人工序列

<400>前序列串：

DSDVYITDKT VLDMRSMDFK 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 1

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

QSKDSDVYIT DKTVLDMRSM 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 2

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

DIQNPDPAVY QLRDSKSSDK 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 3

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

DPAVYQLRDS KSSDKSVCLF 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 4

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

NGKEVHSGVS TDPQPLKEQP 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 5

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

NGKEVHSGVSTDPQPLKEQP 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 5

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ALNDSRYALSSRLRVSATFW 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 6

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

PPEVAVFEPSEAEISHTQKA 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 7

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

KEVHSGVSTDPQPLKEQPAL 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 8

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

VFPPEVAVFEPSEAEISHTQ 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 9

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKS 60

NGAIAWSNQTSFTCQDIFKETNATYPSSDVP 91

<212>类型：PRT

<211>长度：91

序列名称：SEQ ID 10

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREVHSGVSTDP 60

QAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAE 120

AWGRAD 126

<212>类型：PRT

<211>长度：126

序列名称：SEQ ID 11

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ESGTFITDKTVLDMKAMDSK 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 12

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

KTMESGTFITDKTVLDMKAM 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 13

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

YIQNPEPAVYQLKDPRSQDS 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 14

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

AVYQLKDPRSQDSTLCLFTD 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 15

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

NGREVHSGVSTDPQAYKESN 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 16

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

KESNYSYCLSSRLRVSATFW 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 17

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

PPKVSLFEPSKAEIANKQKA 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 18

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

REVHSGVSTDPQAYKESNYS 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 19

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

VTPPKVSLFEPSKAEIANKQ 20

<212>类型：PRT

<211>长度：20

序列名称：SEQ ID 20

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

LLFGYPVYV 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 21

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

SLLMITQC 8

<212>类型：PRT

<211>长度：8

序列名称：SEQ ID 22

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

LLGRNSFEV 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 23

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

KLVALGINAV 10

<212>类型：PRT

<211>长度：10

序列名称：SEQ ID 24

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

LLGDLFGV 8

<212>类型：PRT

<211>长度：8

序列名称：SEQ ID 25

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

FLRGRAYGL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 26

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

HRCQAIRKK 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 27

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

YRSGIIAVV 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 28

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

VYGFVRACL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 29

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ILAKFLHWL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 30

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

LTLGEFLKL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 31

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

PKYVKQNTLKLA 12

<212>类型：PRT

<211>长度：12

序列名称：SEQ ID 32

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

GILGFVFTL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 33

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

SLYNTVATL 9

<212>类型：PRT

<211>长度：9

序列名称：SEQ ID 34

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

cacagacaaa tgtgtgctag acat 24

<212>类型：DNA

<211>长度：24

序列名称：SEQ ID 35

序列描述：

惯用密码子

序列名称：SEQ ID 35

序列

<213>生物体名称：人工序列

<400>前序列串：

atgtctagca cacatttgtc tgtg 24

<212>类型：DNA

<211>长度：24

序列名称：SEQ ID 36

序列描述：

惯用密码子

序列名称：SEQ ID 36

序列

<213>生物体名称：人工序列

<400>前序列串：

cagtggggtc tgcacagacc c 21

<212>类型：DNA

<211>长度：21

序列名称：SEQ ID 37

序列描述：

惯用密码子

序列名称：SEQ ID 37

序列

<213>生物体名称：人工序列

<400>前序列串：

gggtctgtgc agaccccact g 21

<212>类型：DNA

<211>长度：21

序列名称：SEQ ID 38

序列描述：

惯用密码子

序列名称：SEQ ID 38

序列

<213>生物体名称：人工序列

<400>前序列串：

taataatacg tataataata ttctatttca aggagacagt c 41

<212>类型：DNA

<211>长度：41

序列名称：SEQ ID 39

序列描述：

惯用密码子

序列名称：SEQ ID 39

序列

<213>生物体名称：人工序列

<400>前序列串：

caatccagcg gctgccgtag gcaataggta tttcattatg actgtctcct tgaaatag 58

<212>类型：DNA

<211>长度：58

序列名称：SEQ ID 40

序列描述：

惯用密码子

序列名称：SEQ ID 40

序列

<213>生物体名称：人工序列

<400>前序列串：

ctacggcagc cgctggattg ttattactcg cggcccagcc ggccatggcc cag 53

<212>类型：DNA

<211>长度：53

序列名称：SEQ ID 41

序列描述：

惯用密码子

序列名称：SEQ ID 41

序列

<213>生物体名称：人工序列

<400>前序列串：

gttctgctcc acttccttct gggccatggc cggctgggcc g 41

<212>类型：DNA

<211>长度：41

序列名称：SEQ ID 42

序列描述：

惯用密码子

序列名称：SEQ ID 42

序列

<213>生物体名称：人工序列

<400>前序列串：

cagaaggaag tggagcagaa c 21

<212>类型：DNA

<211>长度：21

序列名称：SEQ ID 43

序列描述：

惯用密码子

序列名称：SEQ ID 43

序列

<213>生物体名称：人工序列

<400>前序列串：

cttcttaaag aattcttaat taacctaggt tattaggaac tttctgggct ggggaag 57

<212>类型：DNA

<211>长度：57

序列名称：SEQ ID 44

序列描述：

惯用密码子

序列名称：SEQ ID 44

序列

<213>生物体名称：人工序列

<400>前序列串：

gttaattaag aattctttaa gaaggagata tacatatgaa aaaattatta ttcgcaattC 60

<212>类型：DNA

<211>长度：60

序列名称：SEQ ID 45

序列描述：

惯用密码子

序列名称：SEQ ID 45

序列

<213>生物体名称：人工序列

<400>前序列串：

cgcgctgtga gaatagaaag gaacaactaa aggaattgcg aataataatt ttttcatatG 60

<212>类型：DNA

<211>长度：60

序列名称：SEQ ID 46

序列描述：

惯用密码子

序列名称：SEQ ID 46

序列

<213>生物体名称：人工序列

<400>前序列串：

ctttctattc tcacagcgcg caggctggtg tcactcagac 40

<212>类型：DNA

<211>长度：40

序列名称：SEQ ID 47

序列描述：

惯用密码子

序列名称：SEQ ID 47

序列

<213>生物体名称：人工序列

<400>前序列串：

atgatgtcta gatgcggccg cgtctgctct accccaggcc tc 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 48

序列描述：

惯用密码子

序列名称：SEQ ID 48

序列

<213>生物体名称：人工序列

<400>前序列串：

gcatctagac atcatcacca tcatcactag actgttgaaa gttgtttagc aaaac 55

<212>类型：DNA

<211>长度：55

序列名称：SEQ ID 49

序列描述：

惯用密码子

序列名称：SEQ ID 49

序列

<213>生物体名称：人工序列

<400>前序列串：

ctagagggta ccttattaag actccttatt acgcagtatg 40

<212>类型：DNA

<211>长度：40

序列名称：SEQ ID 50

序列描述：

惯用密码子

序列名称：SEQ ID 50

序列

<213>生物体名称：人工序列

<400>前序列串：

agctgcagct aatacgactc actataggaa caggccacca tggcgtcgat tatgctgagt 60

gatatccttg tccggtggta ccctag 86

<212>类型：DNA

<211>长度：86

序列名称：SEQ ID 51

序列描述：

惯用密码子

序列名称：SEQ ID 51

序列

<213>生物体名称：人工序列

<400>前序列串：

agctgcagct aatacgactc actataggaa caggccacca tgg 43

<212>类型：DNA

<211>长度：43

序列名称：SEQ ID 52

序列描述：

惯用密码子

序列名称：SEQ ID 52

序列

<213>生物体名称：人工序列

<400>前序列串：

gatcccatgg tggcctgttc ctatagtgag tcgtattagc tgc 43

<212>类型：DNA

<211>长度：43

序列名称：SEQ ID 53

序列描述：

惯用密码子

序列名称：SEQ ID 53

序列

<213>生物体名称：人工序列

<400>前序列串：

ccaccatggg ccagaaggaa gtggagcaga actc 34

<212>类型：DNA

<211>长度：34

序列名称：SEQ ID 54

序列描述：

惯用密码子

序列名称：SEQ ID 54

序列

<213>生物体名称：人工序列

<400>前序列串：

cgagagcccg tagaactgga cttg 24

<212>类型：DNA

<211>长度：24

序列名称：SEQ ID 55

序列描述：

惯用密码子

序列名称：SEQ ID 55

序列

<213>生物体名称：人工序列

<400>前序列串：

gtggatccgg cggtggcggg tcgaacgctg gtgtcactca gacccc 46

<212>类型：DNA

<211>长度：46

序列名称：SEQ ID 56

序列描述：

惯用密码子

序列名称：SEQ ID 56

序列

<213>生物体名称：人工序列

<400>前序列串：

ccggatccac ctccgcctga accgcctcca ccggtgacca caacctgggt ccctg 55

<212>类型：DNA

<211>长度：55

序列名称：SEQ ID 57

序列描述：

惯用密码子

序列名称：SEQ ID 57

序列

<213>生物体名称：人工序列

<400>前序列串：

ctgagaattc ttatgactct ccgcggttga agctc 35

<212>类型：DNA

<211>长度：35

序列名称：SEQ ID 58

序列描述：

惯用密码子

序列名称：SEQ ID 58

序列

<213>生物体名称：人工序列

<400>前序列串：

tgacgaattc tgactctccg cggttgaagc tc 32

<212>类型：DNA

<211>长度：32

序列名称：SEQ ID 59

序列描述：

惯用密码子

序列名称：SEQ ID 59

序列

<213>生物体名称：人工序列

<400>前序列串：

agctgcagct aatacgactc actatagg 28

<212>类型：DNA

<211>长度：28

序列名称：SEQ ID 60

序列描述：

惯用密码子

序列名称：SEQ ID 60

序列

<213>生物体名称：人工序列

<400>前序列串：

ggccaccatg ggcaacgctg gtgtcactca gacccc 36

<212>类型：DNA

<211>长度：36

序列名称：SEQ ID 61

序列描述：

惯用密码子

序列名称：SEQ ID 61

序列

<213>生物体名称：人工序列

<400>前序列串：

tgaaccgcct ccaccgtctg ctctacccca ggcctcggcg 40

<212>类型：DNA

<211>长度：40

序列名称：SEQ ID 62

序列描述：

惯用密码子

序列名称：SEQ ID 62

序列

<213>生物体名称：人工序列

<400>前序列串：

tgactctccg cggttgaagc tc 22

<212>类型：DNA

<211>长度：22

序列名称：SEQ ID 63

序列描述：

惯用密码子

序列名称：SEQ ID 63

序列

<213>生物体名称：人工序列

<400>前序列串：

cagctggggg aagcttcagt ttggagcag 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 64

序列描述：

惯用密码子

序列名称：SEQ ID 64

序列

<213>生物体名称：人工序列

<400>前序列串：

ctgctccaaa ctgaagcttc ccccagctg 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 65

序列描述：

惯用密码子

序列名称：SEQ ID 65

序列

<213>生物体名称：人工序列

<400>前序列串：

gtacttctgt gcctcgaggc cgggactag 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 66

序列描述：

惯用密码子

序列名称：SEQ ID 66

序列

<213>生物体名称：人工序列

<400>前序列串：

ctagtcccgg cctcgaggca cagaagtac 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 67

序列描述：

惯用密码子

序列名称：SEQ ID 67

序列

<213>生物体名称：人工序列

<400>前序列串：

cattttcagg gatagcaagc 20

<212>类型：DNA

<211>长度：20

序列名称：SEQ ID 68

序列描述：

惯用密码子

序列名称：SEQ ID 68

序列

<213>生物体名称：人工序列

<400>前序列串：

tcacacagga aacagctatg tcacacagga aacagctatg 40

<212>类型：DNA

<211>长度：40

序列名称：SEQ ID 69

序列描述：

惯用密码子

序列名称：SEQ ID 69

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggnnknnknn knnknnknnk cgaccagagc agtacttcg 49

<212>类型：DNA

<211>长度：49

序列名称：SEQ ID 70

序列描述：

特征

序列：SEQ ID 70

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：49

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 70

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggccgnnknn knnknnknnk nnkccagagc agtacttcgg gc 52

<212>类型：DNA

<211>长度：52

序列名称：SEQ ID 71

序列描述：

特征

序列：SEQ ID 71

<221>特征关键词：misc_feature

<222>起始位置：

<222>终止位置：

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

特征

序列：SEQ ID 71

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：52

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 71

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggccgnnknn knnknnknnk nnkcgaccag agcagtactt cg 52

<212>类型：DNA

<211>长度：52

序列名称：SEQ ID 72

序列描述：

特征

序列：SEQ ID 72

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：52

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 72

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggccgnnknn knnknnknnk nnkggagggc gaccagagca g 51

<212>类型：DNA

<211>长度：51

序列名称：SEQ ID 73

序列描述：

特征

序列：SEQ ID 73

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：51

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 73

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggccgggann knnknnknnk nnknnkgggc gaccagagca gtac 54

<212>类型：DNA

<211>长度：54

序列名称：SEQ ID 74

序列描述：

特征

序列：SEQ ID 74

<221>特征关键词：misc_feature

<222>起始位置：

<222>终止位置：

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

特征

序列：SEQ ID 74

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：54

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 74

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggnnknnknn knnknnknnk ccagagcagt acttcgggc 49

<212>类型：DNA

<211>长度：49

序列名称：SEQ ID 75

序列描述：

特征

序列：SEQ ID 75

<221>特征关键词：misc_feature

<222>起始位置：

<222>终止位置：

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

特征

序列：SEQ ID 75

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：49

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 75

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggnnknnknn knnknnknnk gagcagtact tcgggccg 48

<212>类型：DNA

<211>长度：48

序列名称：SEQ ID 76

序列描述：

特征

序列：SEQ ID 76

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：48

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 76

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggnnknnknn knnknnknnk cagtacttcg ggccgggc 48

<212>类型：DNA

<211>长度：48

序列名称：SEQ ID 76

序列描述：

特征

序列：SEQ ID 77

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：48

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 77

序列

<213>生物体名称：人工序列

<400>前序列串：

tgtgcctcga ggccgnnknn knnknnkggg cgaccagagc agtacttcg 49

<212>类型：DNA

<211>长度：49

序列名称：SEQ ID 78

序列描述：

特征

序列：SEQ ID 78

<221>特征关键词：misc_feature

<222>起始位置：

<222>终止位置：

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

特征

序列：SEQ ID 78

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：49

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 78

序列

<213>生物体名称：人工序列

<400>前序列串：

aaactgaagc ttmnnmnnmn nmnnmnntgt aacggcacag aggtag 46

<212>类型：DNA

<211>长度：46

序列名称：SEQ ID 79

序列描述：

特征

序列：SEQ ID 79

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：46

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 79

序列

<213>生物体名称：人工序列

<400>前序列串：

aaactgaagc ttmnnmnngc tgtcmnntgt aacggcacag aggtag 46

<212>类型：DNA

<211>长度：46

序列名称：SEQ ID 80

序列描述：

特征

序列：SEQ ID 80

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：46

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 80

序列

<213>生物体名称：人工序列

<400>前序列串：

aaactgaagc ttmnnmnnmn ngctgtcmnn tgtaacggca cagaggtag 49

<212>类型：DNA

<211>长度：49

序列名称：SEQ ID 81

序列描述：

特征

序列：SEQ ID 81

<221>特征关键词：misc_feature

<222>起始位置：

<222>终止位置：

其它信息：m是a或c：n是a或t或g或c；k是g或t

CDS连接：无

特征

序列：SEQ ID 81

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：49

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 8I

序列

<213>生物体名称：人工序列

<400>前序列串：

aaactgaagc ttmnnmnngc tgtcmnnaac ggcacagagg tag 43

<212>类型：DNA

<211>长度：43

序列名称：SEQ ID 82

序列描述：

特征

序列：SEQ ID 82

<221>特征关键词：misc_feature

<222>起始位置：1

<222>终止位置：43

其它信息：m是a或c；n是a或t或g或c；k是g或t

CDS连接：无

惯用密码子

序列名称：SEQ ID 82

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccagagcagt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 83

序列描述：

惯用密码子

序列名称：SEQ ID 83

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 84

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cggggctgat gagtgcgtag ccagagcagt ac 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 85

序列描述：

惯用密码子

序列名称：SEQ ID 85

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLMSAX PEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 86

序列描述：

特征

序列：SEQ ID 86

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cggggctgag gtcggcgtag ccagagcagt ac 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 87

序列描述：

惯用密码子

序列名称：SEQ ID 87

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLRSAX PEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 88

序列描述：

特征

序列：SEQ ID 88

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccagaggcgt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 89

序列描述：

惯用密码子

序列名称：SEQ ID 89

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPEAX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 90

序列描述：

特征

序列：SEQ ID 90

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 90

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccagaggatt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 91

序列描述：

惯用密码子

序列名称：SEQ ID 91

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPEDX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 92

序列描述：

特征

序列：SEQ ID 92

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccagatcagt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 93

序列描述：

惯用密码子

序列名称：SEQ ID 93

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPDQX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 94

序列描述：

特征

序列：SEQ ID 94

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 94

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggtctgta ggctgggcga ccagagcagt ac 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 95

序列描述：

惯用密码子

序列名称：SEQ ID 95

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLX AGRPEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 96

序列描述：

特征

序列：SEQ ID 96

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 96

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cggggctggt tccggggcga ccagagcagt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 97

序列描述：

惯用密码子

序列名称：SEQ ID 97

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLVPGRPEQX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 98

序列描述：

特征

序列：SEQ ID 98

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 98

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cggggcttgt gtctgcttag ccagagcagt ac 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 99

序列描述：

惯用密码子

序列名称：SEQ ID 99

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLVSAX PEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 100

序列描述：

特征

序列：SEQ ID 100

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccacatccgt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 101

序列描述：

惯用密码子

序列名称：SEQ ID 101

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPHPX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 101

序列描述：

特征

序列：SEQ ID 102

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 102

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggactagc gggagggcga ccagatgcgt ag 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 103

序列描述：

惯用密码子

序列名称：SEQ ID 103

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLAGGRPDAX 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 104

序列描述：

特征

序列：SEQ ID 104

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gcctcgaggc cgggtctgat tagtgcttag ccagagcagt ac 42

<212>类型：DNA

<211>长度：42

序列名称：SEQ ID 105

序列描述：

惯用密码子

序列名称：SEQ ID 105

序列

<213>生物体名称：人工序列

<400>前序列串：

ASRPGLISAX PEQY 14

<212>类型：PRT

<211>长度：14

序列名称：SEQ ID 106

序列描述：

特征

序列：SEQ ID 106

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：14

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaagctt cag 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 107

序列描述：

惯用密码子

序列名称：SEQ ID 107

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKLQ 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 108

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggccgctt cag 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 109

序列描述：

惯用密码子

序列名称：SEQ ID 109

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGPLQ 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 110

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaagatg cag 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 111

序列描述：

惯用密码子

序列名称：SEQ ID 111

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKMQ 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 112

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaagttg cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 113

序列描述：

惯用密码子

序列名称：SEQ ID 113

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKLH 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 114

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggtagctt cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 115

序列描述：

惯用密码子

序列名称：SEQ ID 115

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGXL H 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 116

序列描述：

特征

序列：SEQ ID 116

<221>特征关键词：MISC_FEATURE

<222>起始位置：

<222>终止位置：

其它信息：其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

特征

序列：SEQ ID 116

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：11

<223>其它信息：x代表琥珀密码子编码的氨基酸残基

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg gggggagctt cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 117

序列描述：

惯用密码子

序列名称：SEQ ID 117

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGELH 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 118

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaggctg cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 119

序列描述：

惯用密码子

序列名称：SEQ ID 119

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGRLH 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 120

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggcagctt cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 121

序列描述：

惯用密码子

序列名称：SEQ ID 121

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGQLH 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 122

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaaggtt cat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 123

序列描述：

惯用密码子

序列名称：SEQ ID 123

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKVH 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 124

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaaggtg aat 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 125

序列描述：

惯用密码子

序列名称：SEQ ID 125

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKVN 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 126

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gccgttacaa ctgacagctg ggggaagctt ctg 33

<212>类型：DNA

<211>长度：33

序列名称：SEQ ID 127

序列描述：

惯用密码子

序列名称：SEQ ID 127

序列

<213>生物体名称：人工序列

<400>前序列串：

AVTTDSWGKLL 11

<212>类型：PRT

<211>长度：11

序列名称：SEQ ID 128

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ggaattcatc gatgcagaag gaagtggagc ag 32

<212>类型：DNA

<211>长度：32

序列名称：SEQ ID 129

序列描述：

惯用密码子

序列名称：SEQ ID 129

序列

<213>生物体名称：人工序列

<400>前序列串：

gtacacggcc gggtcagggt tctggatata c 31

<212>类型：DNA

<211>长度：31

序列名称：SEQ ID 130

序列描述：

惯用密码子

序列名称：SEQ ID 130

序列

<213>生物体名称：人工序列

<400>前序列串：

tctctcatta atgaatgctg gtgtcactca gacccc 36

<212>类型：DNA

<211>长度：36

序列名称：SEQ ID 131

序列描述：

惯用密码子

序列名称：SEQ ID 131

序列

<213>生物体名称：人工序列

<400>前序列串：

tagaaaccgg tggccaggca caccagtgtg gc 32

<212>类型：DNA

<211>长度：32

序列名称：SEQ ID 132

序列描述：

惯用密码子

序列名称：SEQ ID 132

序列

<213>生物体名称：人工序列

<400>前序列串：

ctgctctggt tccgcactc 19

<212>类型：DNA

<211>长度：19

序列名称：SEQ ID 133

序列描述：

惯用密码子

序列名称：SEQ ID 133

序列

<213>生物体名称：人工序列

<400>前序列串：

gagtgcggaa ccagagcag 19

<212>类型：DNA

<211>长度：19

序列名称：SEQ ID 134

序列描述：

惯用密码子

序列名称：SEQ ID 134

序列

<213>生物体名称：人工序列

<400>前序列串：

atatccagaa cccggatcct gccgtgta 28

<212>类型：DNA

<211>长度：28

序列名称：SEQ ID 135

序列描述：

惯用密码子

序列名称：SEQ ID 135

序列

<213>生物体名称：人工序列

<400>前序列串：

tacacggcag gaatccgggt tctggatat 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 136

序列描述：

惯用密码子

序列名称：SEQ ID 136

序列

<213>生物体名称：人工序列

<400>前序列串：

ggagatatac atatgcagga ggtgacacag 30

<212>类型：DNA

<211>长度：30

序列名称：SEQ ID 137

序列描述：

惯用密码子

序列名称：SEQ ID 137

序列

<213>生物体名称：人工序列

<400>前序列串：

tacacggcag gatccgggtt ctggatatt 29

<212>类型：DNA

<211>长度：29

序列名称：SEQ ID 138

序列描述：

惯用密码子

序列名称：SEQ ID 138

序列

<213>生物体名称：人工序列

<400>前序列串：

ggagatatac atatgggtgt cactcagacc 30

<212>类型：DNA

<211>长度：30

序列名称：SEQ ID 139

序列描述：

惯用密码子

序列名称：SEQ ID 139

序列

<213>生物体名称：人工序列

<400>前序列串：

cccaagctta gtctgctcta ccccaggcct cggc 34

<212>类型：DNA

<211>长度：34

序列名称：SEQ ID 140

序列描述：

惯用密码子

序列名称：SEQ ID 140

序列

<213>生物体名称：人工序列

<400>前序列串：

gccggccatg gccaaacagg aggtgacgca gattcct 37

<212>类型：DNA

<211>长度：37

序列名称：SEQ ID 141

序列描述：

惯用密码子

序列名称：SEQ ID 141

序列

<213>生物体名称：人工序列

<400>前序列串：

cttcttaaag aattcttaat taacctaggt tattaggaac tttctgggct ggggaag 57

<212>类型：DNA

<211>长度：57

序列名称：SEQ ID 142

序列描述：

惯用密码子

序列名称：SEQ ID 142

序列

<213>生物体名称：人工序列

<400>前序列串：

tcacagcgcg caggctggtg tcactcagac cccaaa 36

<212>类型：DNA

<211>长度：36

序列名称：SEQ ID 143

序列描述：

惯用密码子

序列名称：SEQ ID 143

序列

<213>生物体名称：人工序列

<400>前序列串：

cgagagcccg tagaactgga cttg 24

<212>类型：DNA

<211>长度：24

序列名称：SEQ ID 144

序列描述：

惯用密码子

序列名称：SEQ ID 144

序列

<213>生物体名称：人工序列

<400>前序列串：

tctctcatta atgaatgctg gtgtcactca gacccc 36

<212>类型：DNA

<211>长度：36

序列名称：SEQ ID 145

序列描述：

惯用密码子

序列名称：SEQ ID 145

序列

<213>生物体名称：人工序列

<400>前序列串：

tagaaaccgg tggccaggca caccagtgtg g 31

<212>类型：DNA

<211>长度：31

序列名称：SEQ ID 146

序列描述：

惯用密码子

序列名称：SEQ ID 146

序列

<213>生物体名称：人工序列

<400>前序列串：

atgcagaagg aagtggagca gaactctgga cccctcagtg ttccagaggg agccattgcc 60

tctctcaact gcacttacag tgaccgaggt tcccagtcct tcttctggta cagacaatat 120

tctgggaaaa gccctgagtt gataatgtcc atatactcca atggtgacaa agaagatgga 180

aggtttacag cacagctcaa taaagccagc cagtatgttt ctctgctcat cagagactcc 240

cagcccagtg attcagccac ctacctctgt gccgttacaa ctgacagctg ggggaaattg 300

cagtttggag cagggaccca ggttgtggtc accccagata tccagaaccc tgaccctgcc 360

gtgtaccagc tgagagactc taaatccagt gacaagtctg tctgcctatt caccgatttt 420

gattctcaaa caaatgtgtc acaaagtaag gattctgatg tgtatatcac agacaaatgt 480

gtgctagaca tgaggtctat ggacttcaag agcaacagtg ctgtggcctg gagcaacaaa 540

tctgactttg catgtgcaaa cgccttcaac aacagcatta ttccagaaga caccttcttc 600

cccagcccag aaagttccta a 621

<212>类型：DNA

<211>长度：621

序列名称：SEQ ID 147

序列描述：

惯用密码子

序列名称：SEQ ID 147

序列

<213>生物体名称：人工序列

<400>前序列串：

atgaacgctg gtgtcactca gaccccaaaa ttccaggtcc tgaagacagg acagagcatg 60

acactgcagt gtgcccagga tatgaaccat gaatacatgt cctggtatcg acaagaccca 120

ggcatggggc tgaggctgat tcattactca gttggtgctg gtatcactga ccaaggagaa 180

gtccccaatg gctacaatgt ctccagatca accacagagg atttcccgct caggctgctg 240

tcggctgctc cctcccagac atctgtgtac ttctgtgcca gcaggccggg actagcggga 300

gggcgaccag agcagtactt cgggccgggc accaggctca cggtcacaga ggacctgaaa 360

aacgtgttcc cacccgaggt cgctgtgttt gagccatcag aagcagagat ctcccacacc 420

caaaaggcca cactggtgtg cctggccaca ggcttctacc ccgaccacgt ggagctgagc 480

tggtgggtga atgggaagga ggtgcacagt ggggtctgca cagacccgca gcccctcaag 540

gagcagcccg ccctcaatga ctccagatac gctctgagca gccgcctgag ggtctcggcc 600

accttctggc aggacccccg caaccacttc cgctgtcaag tccagttcta cgggctctcg 660

gagaatgacg agtggaccca ggatagggcc aaacccgtca cccagatcgt cagcgccgag 720

gcctggggta gagcagacta a 741

<212>类型：DNA

<211>长度：741

序列名称：SEQ ID 148

序列描述：

惯用密码子

序列名称：SEQ ID 148

序列

<213>生物体名称：人工序列

<400>前序列串：

MQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKEDG 60

RFTAQLNKASQYVSLLIRDSQPSDSATYLCAVTTDSWGKLQFGAGTQVVVTPDIQNPDPA 120

VYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNK 180

SDFACANAFNNSIIPEDTFFPSPESS 206

<212>类型：PRT

<211>长度：206

序列名称：SEQ ID 149

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVTEDLK 120

NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLK 180

EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE 240

AWGRAD 246

<212>类型：PRT

<211>长度：246

序列名称：SEQ ID 150

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60

tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120

ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180

ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240

tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300

gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360

gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420

acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480

tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540

caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600

gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660

cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720

tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780

agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840

tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900

ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960

acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020

ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080

aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140

aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440

gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500

cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560

atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620

ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680

ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740

ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800

ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860

ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920

tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980

tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040

tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100

tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160

gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220

tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280

ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340

accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400

acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta taataatatt 2460

ctatttcaag gagacagtca taatgaaata cctattgcct acggcagccg ctggattgtt 2520

attactcgcg gcccagccgg ccatggccca gaaggaagtg gagcagaact ctggacccct 2580

cagtgttcca gagggagcca ttgcctctct caactgcact tacagtgacc gaggttccca 2640

gtccttcttc tggtacagac aatattctgg gaaaagccct gagttgataa tgtccatata 2700

ctccaatggt gacaaagaag atggaaggtt tacagcacag ctcaataaag ccagccagta 2760

tgtttctctg ctcatcagag actcccagcc cagtgattca gccacctacc tctgtgccgt 2820

tacaactgac agctggggga aattgcagtt tggagcaggg acccaggttg tggtcacccc 2880

agatatccag aaccctgacc ctgccgtgta ccagctgaga gactctaaat ccagtgacaa 2940

gtctgtctgc ctattcaccg attttgattc tcaaacaaat gtgtcacaaa gtaaggattc 3000

tgatgtgtat atcacagaca aatgtgtgct agacatgagg tctatggact tcaagagcaa 3060

cagtgctgtg gcctggagca acaaatctga ctttgcatgt gcaaacgcct tcaacaacag 3120

cattattcca gaagacacct tcttccccag cccagaaagt tcctaataac ctaggttaat 3180

taagaattct ttaagaagga gatatacata tgaaaaaatt attattcgca attcctttag 3240

ttgttccttt ctattctcac agcgcgcagg ctggtgtcac tcagacccca aaattccagg 3300

tcctgaagac aggacagagc atgacactgc agtgtgccca ggatatgaac catgaataca 3360

tgtcctggta tcgacaagac ccaggcatgg ggctgaggct gattcattac tcagttggtg 3420

ctggtatcac tgaccaagga gaagtcccca atggctacaa tgtctccaga tcaaccacag 3480

aggatttccc gctcaggctg ctgtcggctg ctccctccca gacatctgtg tacttctgtg 3540

ccagcaggcc gggactagcg ggagggcgac cagagcagta cttcgggccg ggcaccaggc 3600

tcacggtcac agaggacctg aaaaacgtgt tcccacccga ggtcgctgtg tttgagccat 3660

cagaagcaga gatctcccac acccaaaagg ccacactggt gtgcctggcc acaggcttct 3720

accccgacca cgtggagctg agctggtggg tgaatgggaa ggaggtgcac agtggggtct 3780

gcacagaccc gcagcccctc aaggagcagc ccgccctcaa tgactccaga tacgctctga 3840

gcagccgcct gagggtctcg gccaccttct ggcaggaccc ccgcaaccac ttccgctgtc 3900

aagtccagtt ctacgggctc tcggagaatg acgagtggac ccaggatagg gccaaacccg 3960

tcacccagat cgtcagcgcc gaggcctggg gtagagcaga cgcggccgca tctagacatc 4020

atcaccatca tcactagact gttgaaagtt gtttagcaaa accccataca gaaaattcat 4080

ttactaacgt ctggaaagac gacaaaactt tagatcgtta cgctaactat gagggttgtc 4140

tgtggaatgc tacaggcgtt gtagtttgta ctggtgacga aactcagtgt tacggtacat 4200

gggttcctat tgggcttgct atccctgaaa atgagggtgg tggctctgag ggtggcggtt 4260

ctgagggtgg cggttctgag ggtggcggta ctaaacctcc tgagtacggt gatacaccta 4320

ttccgggcta tacttatatc aaccctctcg acggcactta tccgcctggt actgagcaaa 4380

accccgctaa tcctaatcct tctcttgagg agtctcagcc tcttaatact ttcatgtttc 4440

agaataatag gttccgaaat aggcaggggg cattaactgt ttatacgggc actgttactc 4500

aaggcactga ccccgttaaa acttattacc agtacactcc tgtatcatca aaagccatgt 4560

atgacgctta ctggaacggt aaattcagag actgcgcttt ccattctggc tttaatgagg 4620

atccattcgt ttgtgaatat caaggccaat cgtctgacct gcctcaacct cctgtcaatg 4680

ctggcggcgg ctctggtggt ggttctggtg gcggctctga gggtggtggc tctgagggtg 4740

gcggttctga gggtggcggc tctgagggag gcggttccgg tggtggctct ggttccggtg 4800

attttgatta tgaaaagatg gcaaacgcta ataagggggc tatgaccgaa aatgccgatg 4860

aaaacgcgct acagtctgac gctaaaggca aacttgattc tgtcgctact gattacggtg 4920

ctgctatcga tggtttcatt ggtgacgttt ccggccttgc taatggtaat ggtgctactg 4980

gtgattttgc tggctctaat tcccaaatgg ctcaagtcgg tgacggtgat aattcacctt 5040

taatgaataa tttccgtcaa tatttacctt ccctccctca atcggttgaa tgtcgccctt 5100

ttgtctttag cgctggtaaa ccatatgaat tttctattga ttgtgacaaa ataaacttat 5160

tccgtggtgt ctttgcgttt cttttatatg ttgccacctt tatgtatgta ttttctacgt 5220

ttgctaacat actgcgtaat aaggagtctt aataaggtac cctctagtca aggcctatag 5280

tgagtcgtat tacggactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 5340

tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 5400

ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcttcgc 5460

ttggtaataa agcccgcttc ggcgggcttt ttttt 5495

<212>类型：DNA

<211>长度：5495

序列名称：SEQ ID 151

序列描述：

惯用密码子

序列名称：SEQ ID 151

序列

<213>生物体名称：人工序列

<400>前序列串：

agctgcagct aatacgactc actataggaa caggccacca tgggccagaa ggaagtggag 60

cagaactctg gacccctcag tgttccagag ggagccattg cctctctcaa ctgcacttac 120

agtgaccgag gttcccagtc cttcttctgg tacagacaat attctgggaa aagccctgag 180

ttgataatgt ccatatactc caatggtgac aaagaagatg gaaggtttac agcacagctc 240

aataaagcca gccagtatgt ttctctgctc atcagagact cccagcccag tgattcagcc 300

acctacctct gtgccgttac aactgacagc tgggggaaat tgcagtttgg agcagggacc 360

caggttgtgg tcaccggtgg aggcggttca ggcggaggtg gatccggcgg tggcgggtcg 420

aacgctggtg tcactcagac cccaaaattc caggtcctga agacaggaca gagcatgaca 480

ctgcagtgtg cccaggatat gaaccatgaa tacatgtcct ggtatcgaca agacccaggc 540

atggggctga ggctgattca ttactcagtt ggtgctggta tcactgacca aggagaagtc 600

cccaatggct acaatgtctc cagatcaacc acagaggatt tcccgctcag gctgctgtcg 660

gctgctccct cccagacatc tgtgtacttc tgtgccagca ggccgggact agcgggaggg 720

cgaccagagc agtacttcgg gccgggcacc aggctcacgg tcacagagga cctgaaaaac 780

gtgttcccac ccgaggtcgc tgtgtttgag ccatcagaag cagagatctc ccacacccaa 840

aaggccacac tggtgtgcct ggccacaggc ttctaccccg accacgtgga gctgagctgg 900

tgggtgaatg ggaaggaggt gcacagtggg gtcagcacag acccgcagcc cctcaaggag 960

cagcccgccc tcaatgactc cagatacgct ctgagcagcc gcctgagggt ctcggccacc 1020

ttctggcagg acccccgcaa ccacttccgc tgtcaagtcc agttctacgg gctctcggag 1080

aatgacgagt ggacccagga tagggccaaa cccgtcaccc agatcgtcag cgccgaggcc 1140

tggggtagag cagacggtgg aggcggttca ctcagcagca ccctgacgct gagcaaagca 1200

gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct gagttcgccc 1260

gtcacaaaga gcttcaaccg cggagagtca taagaattct cag 1303

<212>类型：DNA

<211>长度：1303

序列名称：SEQ ID 152

序列描述：

惯用密码子

序列名称：SEQ ID 152

序列

<213>生物体名称：人工序列

<400>前序列串：

MGQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKED 60

GRFTAQLNKASQYVSLLIRDSPSDSATYLCAVTTDSWGKLQFGAGTQVVVTGGGGSGGGG 120

SGGGGSNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGI 180

TDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTV 240

TEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTD 300

PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ 360

IVSAEAWGRADGGGGSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGES 416

<212>类型：PRT

<211>长度：416

序列名称：SEQ ID 153

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ctgctttccc ggagcactat gcggataaaa atatccaatt acagtactat tattaccaaa 60

gaatctgcag tccaccgtga aaagcccctt tacacgcgcc ttggggataa acaaataaaa 120

agatttatgt aagtttatac ataggcgagt actctgttat tgggactatt tacgaagtta 180

ttataacttt ttccttctca tactcataag ttgtaaaggc acagcgggaa taagggaaaa 240

aacgccgtaa aacggaagga caaaaacgag tgggtctttg cgaccacttt cattttctac 300

gacttctagt caacccacgt gctcacccaa tgtagcttga cctagagttg tcgccattct 360

aggaactctc aaaagcgggg cttcttgcaa aaggttacta ctcgtgaaaa tttcaagacg 420

atacaccgcg ccataatagg gcataactgc ggcccgttct cgttgagcca gcggcgtatg 480

tgataagagt cttactgaac caactcatga gtggtcagtg tcttttcgta gaatgcctac 540

cgtactgtca ttctcttaat acgtcacgac ggtattggta ctcactattg tgacgccggt 600

tgaatgaaga ctgttgctag cctcctggct tcctcgattg gcgaaaaaac gtgttgtacc 660

ccctagtaca ttgagcggaa ctagcaaccc ttggcctcga cttacttcgg tatggtttgc 720

tgctcgcact gtggtgctac ggacatcgtt accgttgttg caacgcgttt gataattgac 780

cgcttgatga atgagatcga agggccgttg ttaattatct gacctacctc cgcctatttc 840

aacgtcctgg tgaagacgcg agccgggaag gccgaccgac caaataacga ctatttagac 900

ctcggccact cgcacccaga gcgccatagt aacgtcgtga ccccggtcta ccattcggga 960

gggcatagca tcaatagatg tgctgcccct cagtccgttg atacctactt gctttatctg1020

tctagcgact ctatccacgg agtgactaat tcgtaaccat tgacagtctg gttcaaatga1080

gtatatatga aatctaacta aattttgaag taaaaattaa attttcctag atccacttct1140

aggaaaaact attagagtac tggttttagg gaattgcact caaaagcaag gtgactcgca1200

gtctggggca tcttttctag tttcctagaa gaactctagg aaaaaaagac gcgcattaga1260

cgacgaacgt ttgttttttt ggtggcgatg gtcgccacca aacaaacggc ctagttctcg1320

atggttgaga aaaaggcttc cattgaccga agtcgtctcg cgtctatggt ttatgacagg1380

aagatcacat cggcatcaat ccggtggtga agttcttgag acatcgtggc ggatgtatgg1440

agcgagacga ttaggacaat ggtcaccgac gacggtcacc gctattcagc acagaatggc1500

ccaacctgag ttctgctatc aatggcctat tccgcgtcgc cagcccgact tgccccccaa1560

gcacgtgtgt cgggtcgaac ctcgcttgct ggatgtggct tgactctatg gatgtcgcac1620

tcgatactct ttcgcggtgc gaagggcttc cctctttccg cctgtccata ggccattcgc1680

cgtcccagcc ttgtcctctc gcgtgctccc tcgaaggtcc ccctttgcgg accatagaaa1740

tatcaggaca gcccaaagcg gtggagactg aactcgcagc taaaaacact acgagcagtc1800

cccccgcctc ggataccttt ttgcggtcgt tgcgccggaa aaatgccaag gaccggaaaa1860

cgaccggaaa acgagtgtac aagaaaggac gcaatagggg actaagacac ctattggcat1920

aatggcggaa actcactcga ctatggcgag cggcgtcggc ttgctggctc gcgtcgctca1980

gtcactcgct ccttcgcctt ctcgcgggtt atgcgtttgg cggagagggg cgcgcaaccg2040

gctaagtaat tacgtcgacc gtgctgtcca aagggctgac ctttcgcccg tcactcgcgt2100

tgcgttaatt acactcaatc gagtgagtaa tccgtggggt ccgaaatgtg aaatacgaag2160

gccgagcata caacacacct taacactcgc ctattgttaa agtgtgtcct ttgtcgatac2220

tggtactaat gcggttcgac gtcgattatg ctgagtgata tccttgtccg gtggtaccct2280

aggggcccat ggctcgagct taagtgaccg gcagcaaaat gttgcagcac tgaccctttt2340

gggaccgcaa tgggttgaat tagcggaacg tcgtgtaggg ggaaagcggt cgaccgcatt2400

atcgcttctc cgggcgtggc tagcgggaag ggttgtcaac gcgtcggact taccgcttac2460

cgcggactac gccataaaag aggaatgcgt agacacgcca taaagtgtgg cgtataccac2520

gtgagagtca tgttagacga gactacggcg tatcaattcg gtcggggctg tgggcggttg2580

tgggcgactg cgcgggactg cccgaacaga cgagggccgt aggcgaatgt ctgttcgaca2640

ctggcagagg ccctcgacgt acacagtctc caaaagtggc agtagtggct ttgcgcgct 2699

<212>类型：DNA

<211>长度：2699

序列名称：SEQ ID 154

序列描述：

惯用密码子

序列名称：SEQ ID 154

序列

<213>生物体名称：人工序列

<400>前序列串：

ccatgggcca gaaggaagtg gagcagaact ctggacccct cagtgttcca gagggagcca 60

ttgcctctct caactgcact tacagtgacc gaggttccca gtccttcttc tggtacagac 120

aatattctgg gaaaagccct gagttgataa tgtccatata ctccaatggt gacaaagaag 180

atggaaggtt tacagcacag ctcaataaag ccagccagta tgtttctctg ctcatcagag 240

actcccagcc cagtgattca gccacctacc tctgtgccgt tacaactgac agctggggga 300

aattgcagtt tggagcaggg acccaggttg tggtcaccgg tggaggcggt tcaggcggag 360

gtggatccgg cggtggcggg tcgaacgctg gtgtcactca gaccccaaaa ttccaggtcc 420

tgaagacagg acagagcatg acactgcagt gtgcccagga tatgaaccat gaatacatgt 480

cctggtatcg acaagaccca ggcatggggc tgaggctgat tcattactca gttggtgctg 540

gtatcactga ccaaggagaa gtccccaatg gctacaatgt ctccagatca accacagagg 600

atttcccgct caggctgctg tcggctgctc cctcccagac atctgtgtac ttctgtgcca 660

gcaggccggg actagcggga gggcgaccag agcagtactt cgggccgggc accaggctca 720

cggtcacaga ggacctgaaa aacgtgttcc cacccgaggt cgctgtgttt gagccatcag 780

aagcagagat ctcccacacc caaaaggcca cactggtgtg cctggccaca ggcttctacc 840

ccgaccacgt ggagctgagc tggtgggtga atgggaagga ggtgcacagt ggggtcagca 900

cagacccgca gcccctcaag gagcagcccg ccctcaatga ctccagatac gctctgagca 960

gccgcctgag ggtctcggcc accttctggc aggacccccg caaccacttc cgctgtcaag1020

tccagttcta cgggctctcg gagaatgacg agtggaccca ggatagggcc aaacccgtca1080

cccagatcgt cagcgccgag gcctggggta gagcagacgg tggaggcggt tcactcagca1140

gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc tgcgaagtca1200

cccatcaggg cctgagttcg cccgtcacaa agagcttcaa ccgcggagag tcataagaat1260

tc 1262

<212>类型：DNA

<211>长度：1262

序列名称：SEQ ID 155

序列描述：

惯用密码子

序列名称：SEQ ID 155

序列

<213>生物体名称：人工序列

<400>前序列串：

gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg 60

cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120

gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180

aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240

gctccctccc agacatctgt gtacttctgt gccagcaggc cgggactagc gggagggtga 300

ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360

ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420

gccacactgg tgtgcctggc cacaggcttc taccccgacc acgtggagct gagctggtgg 480

gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540

cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600

tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660

gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720

ggtagagcag ac 732

<212>类型：DNA

<211>长度：732

序列名称：SEQ ID 156

序列描述：

惯用密码子

序列名称：SEQ ID 156

序列

<213>生物体名称：人工序列

<400>前序列串：

AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP 60

NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGXPEQYFGPGTRLTVTEDLKNV 120

FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ 180

PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW 240

GRAD 244

<212>类型：PRT

<211>长度：244

序列名称：SEQ ID 157

序列描述：

特征

序列：SEQ ID 157

<221>特征关键词：MISC_EATURE

<222>起始位置：1

<222>终止位置：244

其它信息：X代表乳白密码子编码的氨基酸残基，这通常被翻译成色氨酸

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg 60

tagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120

gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180

aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240

gctccctccc agacatctgt gtacttctgt gccagcaggc cgggactagc gggagggcga 300

ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360

ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420

gccacactgg tgtgcctggc cacaggcttc taccccgacc acgtggagct gagctggtgg 480

gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540

cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600

tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660

gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720

ggtagagcag ac 732

<212>类型：DNA

<211>长度：732

序列名称：SEQ ID 158

序列描述：

惯用密码子

序列名称：SEQ ID 158

序列

<213>生物体名称：人工序列

<400>前序列串：

gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg 60

cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120

gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180

aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240

gctccctccc agacatctgt gtacttctgt gcctcgaggc cggggctgat gagtgcggaa 300

ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360

ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420

gccacactgg tgtgcctggc caccggtttc taccccgacc acgtggagct gagctggtgg 480

gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540

cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600

tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660

gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720

ggtagagcag actaagcttg aattc 745

<212>类型：DNA

<211>长度：745

序列名称：SEQ ID 159

序列描述：

惯用密码子

序列名称：SEQ ID 159

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAEPEQYFGPGTRLTVTEDLK 120

NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWWNGKEVHSGVCTDPQPLK 180

EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE 240

AWGRAD 246

<212>类型：PRT

<211>长度：246

序列名称：SEQ ID 160

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP 60

NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAQPEQYFGPGTRLTVTEDLKNV 120

FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ 180

PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW 240

GRAD 244

<212>类型：PRT

<211>长度：244

序列名称：SEQ ID 161

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

atgcaggagg tgacacagat tcctgcagct ctgagtgtcc cagaaggaga aaacttggtt 60

ctcaactgca gtttcactga tagcgctatt tacaacctcc agtggtttag gcaggaccct 120

gggaaaggtc tcacatctct gttgcttatt cagtcaagtc agagagagca aacaagtgga 180

agacttaatg cctcgctgga taaatcatca ggacgtagta ctttatacat tgcagcttct 240

cagcctggtg actcagccac ctacctctgt gctgtgaggc ccacatcagg aggaagctac 300

atacctacat ttggaagagg aaccagcctt attgttcatc cgtatatcca gaaccctgac 360

cctgccgtgt accagctgag agactctaaa tccagtgaca agtctgtctg cctattcacc 420

gattttgatt ctcaaacaaa tgtgtcacaa agtaaggatt ctgatgtgta tatcacagac 480

aaatgtgtgc tagacatgag gtctatggac ttcaagagca acagtgctgt ggcctggagc 540

aacaaatctg actttgcatg tgcaaacgcc ttcaacaaca gcattattcc agaagacacc 600

ttcttcccca gcccagaaag ttcctaa 627

<212>类型：DNA

<211>长度：627

序列名称：SEQ ID 162

序列描述：

惯用密码子

序列名称：SEQ ID 162

序列

<213>生物体名称：人工序列

<400>前序列串：

atgggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg 60

cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120

gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180

aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240

gctccctccc agacatctgt gtacttctgt gccagcagtt acgtcgggaa caccggggag 300

ctgttttttg gagaaggctc taggctgacc gtactggagg acctgaaaaa cgtgttccca 360

cccgaggtcg ctgtgtttga gccatcagaa gcagagatct cccacaccca aaaggccaca 420

ctggtgtgcc tggccacagg cttctacccc gaccacgtgg agctgagctg gtgggtgaat 480

gggaaggagg tgcacagtgg ggtctgcaca gacccgcagc ccctcaagga gcagcccgcc 540

ctcaatgact ccagatacgc tctgagcagc cgcctgaggg tctcggccac cttctggcag 600

gacccccgca accacttccg ctgtcaagtc cagttctacg ggctctcgga gaatgacgag 660

tggacccagg atagggccaa acccgtcacc cagatcgtca gcgccgaggc ctggggtaga 720

gcagactaa 729

<212>类型：DNA

<211>长度：729

序列名称：SEQ ID 163

序列描述：

惯用密码子

序列名称：SEQ ID 163

序列

<213>生物体名称：人工序列

<400>前序列串：

MQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQDPGKGLTSLLLIQSSQREQTSG 60

RLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGSYIPTFGRGTSLIVHPYIQNPD 120

PAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWS 180

NKSDFACANAFNNSIIPEDTFFPSPESS 208

<212>类型：PRT

<211>长度：208

序列名称：SEQ ID 164

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

MGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP 60

NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTVLEDLKNVFP 120

PEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQPa 180

LNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGR 240

AD 242

<212>类型：PRT

<211>长度：242

序列名称：SEQ ID 165

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca aaggaccgga 60

aaacgaccgg aaaacgagtg tacattacac tcaatcgagt ctcattaggc accccaggct 120

ttacacttta tgcttccggc tcgtatgttg gagtaatccg tggggtccga aatgtgaaat 180

acgaaggccg agcatacaac tgtggaattg tgagcggata acaatttcac acaggaaaca 240

gctatgacca acaccttaac actcgcctat tgttaaagtg tgtcctttgt cgatactggt 300

tgattacgcc aagctacgta cttaagtatt ctatttcaag gagacagtca actaatgcgg 360

ttcgatgcat gaattcataa gataaagttc ctctgtcagt taatgaaata cctattgcct 420

acggcagccg ctggattgtt attactcgcg attactttat ggataacgga tgccgtcggc 480

gacctaacaa taatgagcgc gcccagccgg ccatggccaa acaggaggtg acgcagattc 540

ctgcagctct cgggtcggcc ggtaccggtt tgtcctccac tgcgtctaag gacgtcgaga 600

gagtgtccca gaaggagaaa acttggttct caactgcagt ttcactgata ctcacagggt 660

cttcctcttt tgaaccaaga gttgacgtca aagtgactat gcgctattta caacctccag 720

tggtttaggc aggaccctgg gaaaggtctc cgcgataaat gttggaggtc accaaatccg 780

tcctgggacc ctttccagag acatctctgt tgcttattca gtcaagtcag agagagcaaa 840

caagtggaag tgtagagaca acgaataagt cagttcagtc tctctcgttt gttcaccttc 900

acttaatgcc tcgctggata aatcatcagg acgtagtact ttatacattg tgaattacgg 960

agcgacctat ttagtagtcc tgcatcatga aatatgtaac cagcttctca gcctggtgac1020

tcagccacct acctctgtgc tgtgaggccc gtcgaagagt cggaccactg agtcggtgga1080

tggagacacg acactccggg acatcaggag gaagctacat acctacattt ggaagaggaa1140

ccagccttat tgtagtcctc cttcgatgta tggatgtaaa ccttctcctt ggtcggaata1200

tgttcatccg tatatccaga acccggatcc tgccgtgtac cagctgagag acaagtaggc1260

atataggtct tgggcctagg acggcacatg gtcgactctc actctaaatc cagtgacaag1320

tctgtctgcc tattcaccga ttttgattct tgagatttag gtcactgttc agacagacgg1380

ataagtggct aaaactaaga caaacaaatg tgtcacaaag taaggattct gatgtgtata1440

tcacagacaa gtttgtttac acagtgtttc attcctaaga ctacacatat agtgtctgtt1500

atgtgtgcta gacatgaggt ctatggactt caagagcaac agtgctgtgg tacacacgat1560

ctgtactcca gatacctgaa gttctcgttg tcacgacacc cctggagcaa caaatctgac1620

tttgcatgtg caaacgcctt caacaacagc ggacctcgtt gtttagactg aaacgtacac1680

gtttgcggaa gttgttgtcg attattccag aagacacctt cttccccagc ccagaaagtt1740

cctaataacc taataaggtc ttctgtggaa gaaggggtcg ggtctttcaa ggattattgg1800

taggttaatt aagaattctt taagaagggg atatacatat gaaaaaatta atccaattaa1860

ttcttaagaa attcttcccc tatatgtata cttttttaat ttattcgcaa ttcctttagt1920

tgttcctttc tattctcaca gcgcgcaggc aataagcgtt aaggaaatca acaaggaaag1980

ataagagtgt cgcgcgtccg tggtgtcact cagaccccaa aattccaggt cctgaagaca2040

ggacagagca accacagtga gtctggggtt ttaaggtcca ggacttctgt cctgtctcgt2100

tgacactgca gtgtgcccag gatatgaacc atgaatacat gtcctggtat actgtgacgt2160

cacacgggtc ctatacttgg tacttatgta caggaccata cgacaagacc caggcatggg2220

gctgaggctg attcattact cagttggtgc gctgttctgg gtccgtaccc cgactccgac2280

taagtaatga gtcaaccacg tggtatcact gaccaaggag aagtccccaa tggctacaat2340

gtctccagat accatagtga ctggttcctc ttcaggggtt accgatgtta cagaggtcta2400

caaccacaga ggatttcccg ctcaggctgc tgtcggctgc tccctcccag gttggtgtct2460

cctaaagggc gagtccgacg acagccgacg agggagggtc acatctgtgt acttctgtgc2520

cagcagttac gtcgggaaca ccggggagct tgtagacaca tgaagacacg gtcgtcaatg2580

cagcccttgt ggcccctcga gttttttgga gaaggctcta ggctgaccgt actggaggac2640

ctgaaaaacg caaaaaacct cttccgagat ccgactggca tgacctcctg gactttttgc2700

tgttcccacc cgaggtcgct gtgtttgagc catcagaagc agagatctcc acaagggtgg2760

gctccagcga cacaaactcg gtagtcttcg tctctagagg cacacccaaa aggccacact2820

ggtgtgcctg gccacaggct tctaccccga gtgtgggttt tccggtgtga ccacacggac2880

cggtgtccga agatggggct ccacgtggag ctgagctggt gggtgaatgg gaaggaggtg2940

cacagtgggg ggtgcacctc gactcgacca cccacttacc cttcctccac gtgtcacccc3000

tctgcacaga cccgcagccc ctcaaggagc agcccgccct caatgactcc agacgtgtct3060

gggcgtcggg gagttcctcg tcgggcggga gttactgagg agatacgctc tgagcagccg3120

cctgagggtc tcggccacct tctggcagga tctatgcgag actcgtcggc ggactcccag3180

agccggtgga agaccgtcct cccccgcaac cacttccgct gtcaagtcca gttctacggg3240

ctctcggaga gggggcgttg gtgaaggcga cagttcaggt caagatgccc gagagcctct3300

atgacgagtg gacccaggat agggccaaac ccgtcaccca gatcgtcagc tactgctcac3360

ctgggtccta tcccggtttg ggcagtgggt ctagcagtcg gccgaggcct ggggtagagc3420

agacgcggcc gcacggctcc ggaccccatc tcgtctgcgc cggcgt 3466

<212>类型：DNA

<211>长度：3466

序列名称：SEQ ID 166

序列描述：

惯用密码子

序列名称：SEQ ID 166

序列

<213>生物体名称：人工序列

<400>前序列串：

KYLLPTAAAGLLLLAAQPAMAKQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQD 60

PGKGLTSLLLIQSSQREQTSGRLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGS 120

YIPTFGRGTSLIVHPYIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYIT 180

DKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSMKKLLFAIPLV 240

VPFYSHSAQAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGa 300

GITDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTV 260

LEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTD 420

PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ 480

IVSAEAWGRADAAa 494

<212>类型：PRT

<211>长度：494

序列名称：SEQ ID 167

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

ggatccatgg ccataagtgg agtccctgtg ctaggatttt tcatcatagc tgtgctgatg 60

agcgctcagg aatcatgggc tatcaaagaa gaacatgtga tcatccaggc cgagttctat 120

ctgaatcctg accaatcagg cgagtttatg tttgactttg atggtgatga gattttccat 180

gtggatatgg caaagaagga gacggtctgg cggcttgaag aatttggacg atttgccagc 240

tttgaggctc aaggtgcatt ggccaacata gctgtggaca aagccaacct ggaaatcatg 300

acaaagcgct ccaactatac tccgatcacc aatgtacctc cagaggtaac tgtgctcacg 360

aacagccctg tggaactgag agagcccaac gtcctcatct gtttcatcga caagttcacc 420

ccaccagtgg tcaatgtcac gtggcttcga aatggaaaac ctgtcaccac aggagtgtca 480

gagacagtct tcctgcccag ggaagaccac cttttccgca agttccacta tctccccttc 540

ctgccctcaa ctgaggacgt ttacgactgc agggtggagc actggggctt ggatgagcct 600

cttctcaagc actgggagtt tgatgctcca agccctctcc cagagactac agagaacgtg 660

gatgggggtc tgactgatac actccaagcg gagacagatc aacttgaaga caagaagtct 720

gcgttgcaga ccgagattgc caatctactg aaagagaagg aaaaactaga gttcatcctg 780

gcagcttacg gatctggtgg tggtctgaac gatatttttg aagctcagaa aatcgaatgg 840

catgagtagg atcc 854

<212>类型：DNA

<211>长度：854

序列名称：SEQ ID 168

序列描述：

惯用密码子

序列名称：SEQ ID 168

序列

<213>生物体名称：人工序列

<400>前序列串：

aattctactc gtaaagcgag ttgaaggatc atatttagtt gcgtttatga gataagattg 60

aaagcacgtg taaaatgttt cccgcgcgtt ggcacaacta tttacaatgc ggccaagtta 120

taaaagattc taatctgata tgttttaaaa cacctttgcg gcccgagttg tttgcgtacg 180

tgactagcga agaagatgtg tggaccgcag aacagatagt aaaacaaaac cctagtattg 240

gagcaataat cgatttaacc aacacgtcta aatattatga tggtgtgcat tttttgcggg 300

cgggcctgtt atacaaaaaa attcaagtac ctggccagac tttgccgcct gaaagcatag 360

ttcaagaatt tattgacacg gtaaaagaat ttacagaaaa gtgtcccggc atgttggtgg 420

gcgtgcactg cacacacggt attaatcgca ccggttacat ggtgtgcaga tatttaatgc 480

acaccctggg tattgcgccg caggaagcca tagatagatt cgaaaaagcc agaggtcaca 540

aaattgaaag acaaaattac gttcaagatt tattaattta attaatatta tttgcattct 600

ttaacaaata ctttatccta ttttcaaatt gttgcgcttc ttccagcgaa ccaaaactat 660

gcttcgcttg ctccgtttag cttgtagccg atcagtggcg ttgttccaat cgacggtagg 720

attaggccgg atattctcca ccacaatgtt ggcaacgttg atgttacgtt tatgcttttg 780

gttttccacg tacgtctttt ggccggtaat agccgtaaac gtagtgccgt cgcgcgtcac 840

gcacaacacc ggatgtttgc gcttgtccgc ggggtattga accgcgcgat ccgacaaatc 900

caccactttg gcaactaaat cggtgacctg cgcgtctttt ttctgcatta tttcgtcttt 960

cttttgcatg gtttcctgga agccggtgta catgcggttt agatcagtca tgacgcgcgt1020

gacctgcaaa tctttggcct cgatctgctt gtccttgatg gcaacgatgc gttcaataaa1080

ctcttgtttt ttaacaagtt cctcggtttt ttgcgccacc accgcttgca gcgcgtttgt1140

gtgctcggtg aatgtcgcaa tcagcttagt caccaactgt ttgctctcct cctcccgttg1200

tttgatcgcg ggatcgtact tgccggtgca gagcacttga ggaattactt cttctaaaag1260

ccattcttgt aattctatgg cgtaaggcaa tttggacttc ataatcagct gaatcacgcc1320

ggatttagta atgagcactg tatgcggctg caaatacagc gggtcgcccc ttttcacgac1380

gctgttagag gtagggcccc cattttggat ggtctgctca aataacgatt tgtatttatt1440

gtctacatga acacgtatag ctttatcaca aactgtatat tttaaactgt tagcgacgtc1500

cttggccacg aaccggacct gttggtcgcg ctctagcacg taccgcaggt tgaacgtatc1560

ttctccaaat ttaaattctc caattttaac gcgagccatt ttgatacacg tgtgtcgatt1620

ttgcaacaac tattgttttt taacgcaaac taaacttatt gtggtaagca ataattaaat1680

atgggggaac atgcgccgct acaacactcg tcgttatgaa cgcagacggc gccggtctcg1740

gcgcaagcgg ctaaaacgtg ttgcgcgttc aacgcggcaa acatcgcaaa agccaatagt1800

acagttttga tttgcatatt aacggcgatt ttttaaatta tcttatttaa taaatagtta1860

tgacgcctac aactccccgc ccgcgttgac tcgctgcacc tcgagcagtt cgttgacgcc1920

ttcctccgtg tggccgaaca cgtcgagcgg gtggtcgatg accagcggcg tgccgcacgc1980

gacgcacaag tatctgtaca ccgaatgatc gtcgggcgaa ggcacgtcgg cctccaagtg2040

gcaatattgg caaattcgaa aatatataca gttgggttgt ttgcgcatat ctatcgtggc2100

gttgggcatg tacgtccgaa cgttgatttg catgcaagcc gaaattaaat cattgcgatt2160

agtgcgatta aaacgttgta catcctcgct tttaatcatg ccgtcgatta aatcgcgcaa2220

tcgagtcaag tgatcaaagt gtggaataat gttttctttg tattcccgag tcaagcgcag2280

cgcgtatttt aacaaactag ccatcttgta agttagtttc atttaatgca actttatcca2340

ataatatatt atgtatcgca cgtcaagaat taacaatgcg cccgttgtcg catctcaaca2400

cgactatgat agagatcaaa taaagcgcga attaaatagc ttgcgacgca acgtgcacga2460

tctgtgcacg cgttccggca cgagctttga ttgtaataag tttttacgaa gcgatgacat2520

gacccccgta gtgacaacga tcacgcccaa aagaactgcc gactacaaaa ttaccgagta2580

tgtcggtgac gttaaaacta ttaagccatc caatcgaccg ttagtcgaat caggaccgct2640

ggtgcgagaa gccgcgaagt atggcgaatg catcgtataa cgtgtggagt ccgctcatta2700

gagcgtcatg tttagacaag aaagctacat atttaattga tcccgatgat tttattgata2760

aattgaccct aactccatac acggtattct acaatggcgg ggttttggtc aaaatttccg2820

gactgcgatt gtacatgctg ttaacggctc cgcccactat taatgaaatt aaaaattcca2880

attttaaaaa acgcagcaag agaaacattt gtatgaaaga atgcgtagaa ggaaagaaaa2940

atgtcgtcga catgctgaac aacaagatta atatgcctcc gtgtataaaa aaaatattga3000

acgatttgaa agaaaacaat gtaccgcgcg gcggtatgta caggaagagg tttatactaa3060

actgttacat tgcaaacgtg gtttcgtgtg ccaagtgtga aaaccgatgt ttaatcaagg3120

ctctgacgca tttctacaac cacgactcca agtgtgtggg tgaagtcatg catcttttaa3180

tcaaatccca agatgtgtat aaaccaccaa actgccaaaa aatgaaaact gtcgacaagc3240

tctgtccgtt tgctggcaac tgcaagggtc tcaatcctat ttgtaattat tgaataataa3300

aacaattata aatgctaaat ttgtttttta ttaacgatac aaaccaaacg caacaagaac3360

atttgtagta ttatctataa ttgaaaacgc gtagttataa tcgctgaggt aatatttaaa3420

atcattttca aatgattcac agttaatttg cgacaatata attttatttt cacataaact3480

agacgccttg tcgtcttctt cttcgtattc cttctctttt tcatttttct cctcataaaa3540

attaacatag ttattatcgt atccatatat gtatctatcg tatagagtaa attttttgtt3600

gtcataaata tatatgtctt ttttaatggg gtgtatagta ccgctgcgca tagtttttct3660

gtaatttaca acagtgctat tttctggtag ttcttcggag tgtgttgctt taattattaa3720

atttatataa tcaatgaatt tgggatcgtc ggttttgtac aatatgttgc cggcatagta3780

cgcagcttct tctagttcaa ttacaccatt ttttagcagc accggattaa cataactttc3840

caaaatgttg tacgaaccgt taaacaaaaa cagttcacct cccttttcta tactattgtc3900

tgcgagcagt tgtttgttgt taaaaataac agccattgta atgagacgca caaactaata3960

tcacaaactg gaaatgtcta tcaatatata gttgctgatg atccagcatg ataagataca4020

ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa4080

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttccgagtt4140

tgtcagaaag cagaccaaac agcggttgga ataatagcga gaacagagaa atagcggcaa4200

aaataatacc cgtatcactt ttgctgatat ggttgatgtc atgtagccaa atcgggaaaa4260

acgggaagta ggctcccatg ataaaaaagt aaaagaaaaa gaataaaccg aacatccaaa4320

agtttgtgtt ttttaaatag tacataatgg atttccttac gcgaaatacg ggcagacatg4380

gcctgcccgg ttattattat ttttgacacc agaccaactg gtaatggtag cgaccggcgc4440

tcagctggaa ttcagatctg tgattgtaaa taaaatgtaa tttacagtat agtattttaa4500

ttaatataca aatgatttga taataattct tatttaacta taatatattg tgttgggttg4560

aattaaaggt cccggcatcc tcaaatgcat aatttcatag tcccccttgt tgtaagtgat4620

gcgtatttct gaatctttgt aaaatagcac acaagactcc aacgcgtttg gcgttttatt4680

ttcttgctcg actctagttt attaggcctc tagagatccg tatttatagg tttttttatt4740

acaaaactgt tacgaaaaca gtaaaatact tatttatttg cgagatggtt atcattttaa4800

ttatctccat gatccaataa acctagaata aagggcccga cctttaattc aacccaacac4860

aatatattat agttaaataa gaattattat caaatcattt gtatattaat taaaatacta4920

tactgtaaat tacattttat ttacaatcac agatcccggg gatccggtta ttagtacatt4980

tattaagcgc tagattctgt gcgttgttga tttacagaca attgttgtac gtattttaat5040

aattcattaa atttataatc tttagggtgg tatgttagag cgaaaatcaa atgattttca5100

gcgtctttat atctgaattt aaatattaaa tcctcaatag atttgtaaaa taggtttcga5160

ttagtttcaa acaagggttg tttttccgaa ccgatggctg gactatctaa tggattttcg5220

ctcaacgcca caaaacttgc caaatcttgt agcagcaatc tagctttgtc gatattcgtt5280

tgtgttttgt tttgtaataa aggttcgacg tcgttcaaaa tattatgcgc ttttgtattt5340

ctttcatcac tgtcgttagt gtacaattga ctcgacgtaa acacgttaaa taaagcttgg5400

acatatttaa catcgggcgt gttagcttta ttaggccgat tatcgtcgtc gtcccaaccc5460

tcgtcgttag aagttgcttc cgaagacgat tttgccatag ccacacgacg cctattaatt5520

gtgtcggcta acacgtccgc gatcaaattt gtagttgagc tttttggaat tatttctgat5580

tgcgggcgtt tttgggcggg tttcaatcta actgtgcccg attttaattc agacaacacg5640

ttagaaagcg atggtgcagg cggtggtaac atttcagacg gcaaatctac taatggcggc5700

ggtggtggag ctgatgataa atctaccatc ggtggaggcg caggcggggc tggcggcgga5760

ggcggaggcg gaggtggtgg cggtgatgca gacggcggtt taggctcaaa tgtctcttta5820

ggcaacacag tcggcacctc aactattgta ctggtttcgg gcgccgtttt tggtttgacc5880

ggtctgagac gagtgcgatt tttttcgttt ctaatagctt ccaacaattg ttgtctgtcg5940

tctaaaggtg cagcgggttg aggttccgtc ggcattggtg gagcgggcgg caattcagac6000

atcgatggtg gtggtggtgg tggaggcgct ggaatgttag gcacgggaga aggtggtggc6060

ggcggtgccg ccggtataat ttgttctggt ttagtttgtt cgcgcacgat tgtgggcacc6120

ggcgcaggcg ccgctggctg cacaacggaa ggtcgtctgc ttcgaggcag cgcttggggt6180

ggtggcaatt caatattata attggaatac aaatcgtaaa aatctgctat aagcattgta6240

atttcgctat cgtttaccgt gccgatattt aacaaccgct caatgtaagc aattgtattg6300

taaagagatt gtctcaagct cggatcgatc ccgcacgccg ataacaagcc ttttcatttt6360

tactacagca ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt atgctttgtt6420

gtcaaaaacg tcgttggcaa gctttaaaat atttaaaaga acatctctgt tcagcaccac6480

tgtgttgtcg taaatgttgt ttttgataat ttgcgcttcc gcagtatcga cacgttcaaa6540

aaattgatgc gcatcaattt tgttgttcct attattgaat aaataagatt gtacagattc6600

atatctacga ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg tacaatttta6660

cgaaaactgc aaaaacgtca aaactcggta taaaataatc aacgggcgct ttggcaaaat6720

atctatttta tcgcacaagc ccactagcaa attgtatttg cagaaaacaa tttcggcgca6780

caattttaac gctgacgaaa taaaagttca ccagttaatg agcgaccacc caaattttat6840

aaaaatctat tttaatcacg gttccatcaa caaccaagtg atcgtgatgg actacattga6900

ctgtcccgat ttatttgaaa cactacaaat taaaggcgag ctttcgtacc aacttgttag6960

caatattatt agacagctgt gtgaagcgct caacgatttg cacaagcaca atttcataca7020

caacgacata aaactcgaaa atgtcttata tttcgaagca cttgatcgcg tgtatgtttg7080

cgattacgga ttgtgcaaac acgaaaactc acttagcgtg cacgacggca cgttggagta7140

ttttagtccg gaaaaaattc gacacacaac tatgcacgtt tcgtttgact ggtacgcggc7200

gtgttaacat acaagttgct aaccggcggc cgacacccat ttgaaaaaag cgaagacgaa7260

atgttggact tgaatagcat gaagcgtcgt cagcaataca atgacattgg cgttttaaaa7320

cacgttcgta acgttaacgc tcgtgacttt gtgtactgcc taacaagata caacatagat7380

tgtagactca caaattacaa acaaattata aaacatgagt ttttgtcgta aaaatgccac7440

ttgttttacg agtagaattc ccagcttggc actggccgtc gttttacaac gtcgtgactg7500

ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg7560

gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg7620

cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat7680

atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc7740

gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca7800

agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg7860

cgcggacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg7920

gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta7980

tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt8040

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc8100

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa8160

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt8220

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt8280

ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc8340

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg8400

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg8460

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac8520

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca8580

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta8640

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat8700

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa8760

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag8820

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat8880

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt8940

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 9000

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 9060

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 9120

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 9180

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 9240

gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 9300

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 9360

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 9420

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 9480

cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 9540

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 9600

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 9660

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 9720

ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 9780

cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 9840

gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 9900

tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 9960

cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 10020

cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 10080

tatgaccatg attacg 10096

<212>类型：DNA

<211>长度：10096

序列名称：SEQ ID 169

序列描述：

惯用密码子

序列名称：SEQ ID 169

序列

<213>生物体名称：人工序列

<400>前序列串：

ggtaccggat ccagcatggt gtgtctgaag ctccctggag gctcctgcat gacagcgctg 60

acagtgacac tgatggtgct gagctcccca ctggctttgt ccggagacac cggacctaag 120

tacgtcaagc agaacacact gaaactggct tccggtggcg gatctctagt tccacgcggt 180

agtggaggcg gtggttccgg agacacgcgt ccacgtttct tgtggcagct taagtttgaa 240

tgtcatttct tcaatgggac ggagcgggtg cggttgctgg aaagatgcat ctataaccaa 300

gaggagtccg tgcgcttcga cagcgacgtg ggggagtacc gggcggtgac ggagctgggg 360

cggcctgatg ccgagtactg gaacagccag aaggacctcc tggagcagag gcgggccgcg 420

gtggacacct actgcagaca caactacggg gttggtgaga gcttcacagt gcagcggcga 480

gttgagccta aggtgactgt gtatccttca aagacccagc ccctgcagca ccacaacctc 540

ctggtctgct ctgtgagtgg tttctatcca ggcagcattg aagtcaggtg gttccggaac 600

ggccaggaag agaaggctgg ggtggtgtcc acaggcctga tccagaatgg agattggacc 660

ttccagaccc tggtgatgct ggaaacagtt cctcggagtg gagaggttta cacctgccaa 720

gtggagcacc caagtgtgac gagccctctc acagtggaat ggagagcacg gtctgaatct 780

gcacagagca aggtcgacgg aggcggtggg ggtagaatcg cccggctgga ggaaaaagtg 840

aaaaccttga aagctcagaa ctcggagctg gcgtccacgg ccaacatgct cagggaacag 900

gtggcacagc ttaaacagaa agtcatgaac tactaggatc c 941

<212>类型：DNA

<211>长度：941

序列名称：SEQ ID 170

序列描述：

惯用密码子

序列名称：SEQ ID 170

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVT 116

<212>类型：PRT

<211>长度：116

序列名称：SEQ ID 171

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAXPEQYFGPGTRLTVT 116

<212>类型：PRT

<211>长度：116

序列名称：SEQ ID 172

序列描述：

特征

序列：SEQ ID 172

<221>特征关键词：MISC_FEATURE

<222>起始位置：1

<222>终止位置：116

其它信息：其中x是e，q或r

CDS连接：无

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEDQYFGPGTRLTVT 117

<212>类型：PRT

<211>长度：117

序列名称：SEQ ID 173

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEY MSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLVPGRPEQQFGPGTRLTVT 116

<212>类型：PRT

<211>长度：116

序列名称：SEQ ID 174

序列描述：

序列

<213>生物体名称：人工序列

<400>前序列串：

MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE 60

VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPHPQFGPGTRLTVT 116

<212>类型：PRT

<211>长度：116

序列名称：SEQ ID 175

序列描述：

Claims

1.一种在其表面展示一种T细胞受体(TCR)的蛋白质颗粒，其特征在于，

(i)所述蛋白质颗粒是一种核糖体并且所述TCR是一种单链TCR(scTCR)多肽或二聚TCR(dTCR)多肽对，或

(ii)所述蛋白质颗粒是一种噬菌体颗粒，或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞，并且所述TCR是一种人scTCR或人dTCR多肽对，或

(iii)所述蛋白质颗粒是一种噬菌体颗粒，或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞，并且所述TCR是一种非人dTCR多肽对，或

(iv)所述蛋白质颗粒是一种噬菌体颗粒，或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞，且所述TCR是scTCR多肽，该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列，连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列，以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。

2.一种在其表面展示一种二聚体T细胞受体(dTCR)多肽对或单链T细胞受体(scTCR)多肽的蛋白质颗粒，其特征在于

所述dTCR多肽对由对应于天然TCR链的胞外恒定和可变结构域序列的TCR氨基酸序列构成，所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列和连接序列构成，该连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列；

其中所述dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致，以及

在scTCR多肽的情况下，在天然T细胞受体中不存在等价物的二硫键连接该多肽的残基。

3.如权利要求1或2所述的蛋白质颗粒，其特征在于，所述蛋白质颗粒是丝状噬菌体颗粒。

4.如权利要求1或2所述的蛋白质颗粒，其特征在于，所述蛋白质颗粒是具有与TCR共价连接的细胞表面蛋白或多肽分子的细胞。

5.如权利要求1或2所述的蛋白质颗粒，其特征在于，所述蛋白质颗粒是核糖体。

6.如权利要求1-5中任一项所述的蛋白质颗粒，其特征在于，所述dTCR多肽对中一个成员的C末端，或所述scTCR多肽的C末端通过肽键与所述蛋白质颗粒表面暴露的残基相连。

7.如权利要求1-4中任一项所述的蛋白质颗粒，其特征在于，所述dTCR多肽对中一个成员的C末端，或所述scTCR多肽的C末端通过二硫键与所述蛋白质颗粒表面暴露的半胱氨酸残基相连。

8.如上述权利要求中任一项所述的蛋白质颗粒，其特征在于，展示的scTCR多肽包括

由对应于TCRα或δ链可变结构域的氨基酸序列构成的第一片段

由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段，以及

连接第一片段C末端与第二片段N末端的连接序列

条件是其中蛋白质颗粒是噬菌体，所述scTCR对应于人TCR。

9.如权利要求1-7中任一项所述的蛋白质颗粒，其特征在于，展示的scTCR多肽包括

由对应于TCRβ或γ链可变结构域的氨基酸序列构成的第一片段

由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列构成的第二片段，以及

连接第一片段C末端与第二片段N末端的连接序列

条件是其中蛋白质颗粒是丝状噬菌体，所述scTCR对应于人TCR。

10.如权利要求1-7中任一项所述的蛋白质颗粒，其特征在于，展示的scTCR多肽包括

由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于

TCRα或δ链可变结构域序列的氨基酸序列构成的第一片段，

由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段，

连接第一片段C末端与第二片段N末端或反之亦然的连接序列，以及

第一链和第二链之间的二硫键，所述二硫键在αβ或γδT细胞受体中不存在其等价物，

连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互

定位与天然αβ或γδT细胞受体中的定位基本一致。

11.如权利要求10所述的蛋白质颗粒，其特征在于，所述连接序列具有式-P-AA-P-，其中P是脯氨酸，且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。

12.如权利要求10或11所述的蛋白质颗粒，其特征在于，所述连接序列连接第一片段的C末端和第二片段的N末端。

13.如权利要求12所述的蛋白质颗粒，其特征在于，所述连接序列由26到41个氨基酸构成。

14.如权利要求13所述的蛋白质颗粒，其特征在于，所述连接序列由29、30、31或32个氨基酸构成。

15.如权利要求13所述的蛋白质颗粒，其特征在于，所述连接序列由33、34、35或36个氨基酸构成。

16.如权利要求13所述的蛋白质颗粒，其特征在于，所述连接序列具有式-PGGG-(SGGGG)₅-P-，其中P是脯氨酸，G是甘氨酸，S是丝氨酸。

17.如权利要求13所述的蛋白质颗粒，其特征在于，所述连接序列具有式-PGGG-(SGGGG)₆-P-，其中P是脯氨酸，G是甘氨酸，S是丝氨酸。

18.如权利要求1-7中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对由以下组分构成

其中对应于TCRα或δ链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽，以及

其中对应于TCRβ或γ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽，

第一和第二多肽通过在天然αβ或γδT细胞受体中不存在等价物的二硫键相连。

19.如上述权利要求中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对或scTCR多肽具有对应于αβ TCR胞外恒定和可变结构域序列的氨基酸序列。

20.如权利要求1-19中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对或scTCR多肽具有对应于胞外αβ TCR恒定结构域序列和γδ TCR可变结构域序列的氨基酸序列。

21.如上述权利要求中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对或scTCR多肽具有对应于非人的胞外αβ TCR恒定结构域序列和人TCR可变结构域序列的氨基酸序列。

22.如上述权利要求中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对的一个成员的氨基酸序列，或展示的scTCR的氨基酸序列对应于天然TCR胞外恒定链Ig结构域序列。

23.如权利要求1-22中任一项所述的蛋白质颗粒，其特征在于，展示的dTCR多肽对或展示的scTCR包括对应于天然TCR胞外恒定链Ig结构域序列的序列。

24.如权利要求23所述的蛋白质颗粒，其特征在于，所述恒定链Ig结构域序列的氨基酸残基由二硫键连接，该二硫键在天然TCR中不存在等价物。

25.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于对应于天然TCR中其β碳原子相距小于0.6纳米的氨基酸残基的半胱氨酸残基之间。

26.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01外显子1的Ser57或其非人等价物的半胱氨酸残基之间。

27.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Ser77或其非人等价物的半胱氨酸残基之间。

28.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于取代TRAC*01外显子1的Tyr10和TRBC1*01或TRBC2*01外显子1的Ser17或其非人等价物的半胱氨酸残基之间。

29.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Asp59或其非人等价物的半胱氨酸残基之间。

30.如权利要求24所述的蛋白质颗粒，其特征在于，所述二硫键位于取代TRAC*01外显子1的Ser15和TRBC1*01或TRBC2*01外显子1的Glu15或其非人等价物的半胱氨酸残基之间。

31.如权利要求23-30中任一项所述的蛋白质颗粒，其特征在于，相对于所述天然序列，对应于天然TCR胞外恒定链Ig结构域序列的序列是C末端截短的，这样排除了形成天然链间二硫键的半胱氨酸残基。

32.如权利要求23-30中任一项所述的蛋白质颗粒，其特征在于，在对应于天然TCR胞外恒定链Ig结构域序列的序列中的形成天然链间二硫键的半胱氨酸残基被非半胱氨酸残基所取代。

33.如权利要求32所述的蛋白质颗粒，其特征在于，形成天然链间二硫键的半胱氨酸残基被丝氨酸或丙氨酸取代。

34.如上述权利要求中任一项所述的蛋白质颗粒，其特征在于，在展示的dTCR或scTCR中不存在对应于天然TCR中不配对半胱氨酸残基的不配对半胱氨酸残基。

35.如权利要求23-34中任一项所述的蛋白质颗粒，其特征在于，相对那些与形成非天然链间二硫键的残基相对应的残基，与天然TCR胞外恒定链Ig结构域序列相对应的序列在N末端被截短。

36.如权利要求1所述的蛋白质颗粒，其特征在于，所述蛋白质颗粒是在其表面展示二聚体T细胞受体(dTCR)多肽对的丝状细菌体颗粒，所述多肽对由以下组分构成

其中对应于TCRα链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽，以及

其中对应于TCRβ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽，

第一和第二多肽由取代TRAC*01外显子1的Thr 48和TRBC1*01或TRBC2*01外显子的Ser 57或其非人等价物的半胱氨酸残基之间的二硫键连接，

dTCR多肽对的一个成员的C末端通过肽键与噬菌体的一种外被蛋白相连。

37.一种展示在蛋白质颗粒上的dTCR多肽对或scTCR多肽的多样性文库，其特征在于，所述dTCR多肽对或scTCR多肽具有权利要求8-36中任一项所定义的结构特征。

38.如权利要求37所述的多样性文库，其特征在于，所述多样性存在于dTCR或scTCR多肽的可变结构域中。

39.如权利要求37-39中任一项所述的多样性文库，其特征在于，所述蛋白质颗粒是丝状噬菌体颗粒。

40.如权利要求35所述的丝状噬菌体颗粒的多样性文库，其特征在于，所述多样性存在于dTCR或scTCR多肽可变结构域的一个或多个互补决定区中，和/或存在于所展示的dTCR或scTCR多肽互补决定区的一个或多个骨架区中。

41.一种核酸，其特征在于，所述核酸编码(a)dTCR多肽对的一条链以及(b)与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的dTCR多肽对的另一条链；或所述核酸编码与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的scTCR多肽，所述dTCR对或scTCR具有权利要求8-36中任一项所定义的结构特征。

42.一种包含如权利要求41所述的核酸的表达载体，或包含含如权利要求42所定义的核酸(a)的第一载体和含如权利要求42所定义的核酸(b)的第二载体的组合物。

43.一种表达系统，其特征在于，所述表达系统包含表达如权利要求41所述核酸的噬菌粒或噬菌体基因组载体。

44.如权利要求43所述的表达系统，其特征在于，所述噬菌粒或噬菌体基因组载体源丝状噬菌体。

45.如权利要求44所述的表达系统，其特征在于，所述噬菌粒或噬菌体基因组载体编码噬菌体gIII或gVIII外被蛋白。

46.如权利要求43-45中任一项所述的表达系统，其特征在于，所述载体包含将由该载体表达的组成型或诱导型TCR多肽数量限制在所需水平的一个或多个序列。

47.如权利要求46所述的表达系统，其特征在于，所述序列是弱启动子序列。

48.如权利要求46所述的表达系统，其特征在于，所述序列是突变的核糖体结合位点。

49.如权利要求46所述的表达系统，其特征在于，所述序列是错义抑制子终止密码子。

50.如权利要求46所述的表达系统，其特征在于，所述序列是突变的起始密码子。

51.如权利要求46所述的表达系统，其特征在于，所述序列是受代谢物介导的启动子强度调节控制的启动子序列。

52.如权利要求46所述的表达系统，其特征在于，所述序列含有多个所采用的表达系统偏爱程度更低的密码子。

53.一种包含如权利要求41所述的核酸的宿主细胞，一种如权利要求42所述的表达载体或一种如权利要求43-52中任一项所述的表达系统。

54.一种携带如权利要求43-52中任一项所述噬菌粒表达系统的宿主细胞以及辅助噬菌体。

55.一种鉴别具有特殊特征的TCR的方法，其特征在于，所述方法包括使展示在如权利要求37-40中任一项所述蛋白质颗粒上的TCR多样性文库经受

对所述特征进行挑选的选择过程，并且分离展示具有所述特征TCR的蛋白质颗粒，以及可选择地进行扩增过程以增加分离的颗粒和/或

测量所述特征的筛选过程，鉴别那些展示具有所需特征的TCR的蛋白质颗粒并将其分离，以及可选择地进行扩增过程以增加分离的颗粒。

56.如权利要求55所述的方法，其特征在于，所述特殊特征是对TCR配体增强的亲和力。

57.一种检测TCR配体复合物的方法，其特征在于，所述方法包括：

(i)提供如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒；

(ii)将所述展示TCR的蛋白质颗粒与假定的配体复合物接触；以及

(iii)检测所述展示TCR的蛋白质颗粒与假定的配体复合物的结合。

58.如权利要求57所述的方法，其特征在于，所述假定的配体复合物是肽-MHC复合物。

59.一种鉴别如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用抑制剂的方法，其特征在于，所述方法包括在待测化合物存在和不存在的条件下将展示TCR的蛋白质颗粒与一种TCR结合配体接触，并测定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合，这样的降低作为对抑制剂的鉴别。

60.一种对特定TCR配体具有特异性的TCR，其特征在于，所述TCR(i)具有权利要求8-36中任一项所定义的结构特征，(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生发生了突变，以及(iii)对所述TCR配体具有比天然TCR小的Kd值。

61.一种对特定TCR配体具有特异性的TCR，其特征在于，所述TCR(i)具有权利要求8-36中任一项所定义的结构特征，(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变，以及(iii)如通过表面等离子体谐振测得的，对所述TCR配体具有比天然TCR小的Kd值。

62.一种对特定TCR配体具有特异性的TCR，其特征在于，所述TCR(i)具有权利要求8-36中任一项所定义的结构特征，(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变，以及(iii)对所述TCR配体具有比天然TCR低的消耗速率(k_off)。

63.一种对特定TCR配体具有特异性的TCR，其特征在于，所述TCR(i)具有权利要求8-36中任一项所定义的结构特征，(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变，以及(iii)如通过表面等离子体谐振测得的，对所述TCR配体具有比天然TCR低的消耗速率(k_off)。

64.一种如权利要求60-63中任一项所述的二聚体TCR，其特征在于，所述dTCR具有权利要求18-36中任一项所定义的αβ异源二聚TCR的结构特征。

65.一种如权利要求60-64中任一项所述的TCR，其特征在于，所述TCR相对于天然TCR在至少一个互补决定区和/或其骨架区中发生突变。

66.一种如权利要求60-65中任一项所述的TCR，其特征在于，所述TCR对特定的MHC类型具有特异性。

67.一种如权利要求60-65中任一项所述的TCR，其特征在于，所述TCR对特定的pMHC具有特异性。

68.一种如权利要求60-65或67中任一项所述的TCR，其特征在于，所述TCR对HLA-A2 Tax肽(LLFGYPVYV)(SEQ ID 21)具有特异性。

69.如权利要求68所述的TCR，其特征在于，所述TCR包含SEQ ID 172、173、174或175中所示的β链可变结构域氨基酸。

70.如权利要求68所述的TCR，其特征在于，使用SEQ ID 171中所示的编号，所述TCR包含β链可变结构域氨基酸99M、99V、100S、100P、101A、102E、102Q、104H、105P、105D和106Q中的一个或多个。

71.如权利要求68所述的TCR，其特征在于，使用SEQ ID 171中所示的编号，所述TCR包含β链可变结构域氨基酸99M、100S和101A。

72.如权利要求68所述的TCR，其特征在于，使用SEQ ID 171中所示的编号，所述TCR包含β链可变结构域氨基酸105D。

73.如权利要求68所述的TCR，其特征在于，使用SEQ ID 171中所示的编号，所述TCR包含β链可变结构域氨基酸99V和100P。

74.如权利要求68所述的TCR，其特征在于，使用SEQ ID 171中所示的编号，所述TCR包含β链可变结构域氨基酸104H和105P。

75.如权利要求60-65或67中任一项所述的TCR，其特征在于，所述TCR对HLA-A2NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物具有特异性。

76.一种核酸，其特征在于，所述核酸编码如权利要求60-78中任一项所述的TCR。

77.如权利要求60-75中任一项所述的TCR，其特征在于，所述TCR与治疗化合物相连。

78.如权利要求60-75中任一项所述的TCR，其特征在于，所述TCR与造影化合物相连。

79.如权利要求60-75中任一项所述的TCR，其特征在于，所述TCR与细胞毒化合物相连。

80.如权利要求77或79所述的TCR，其特征在于，所述TCR对HLA-A2 Tax肽(LLFGYPVYV)(SEQ ID 21)复合物具有特异性。

81.如权利要求77或79所述的TCR，其特征在于，所述TCR对HLA-A2 NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物具有特异性。

82.一种治疗HTLV-1感染的方法，其特征在于，所述方法包括给予遭受这种感染的个体有效量的如权利要求68-74或79中任一项所述的TCR。

83.如权利要求68-74或79中任一项所述的TCR在制备用于治疗HTLV-1感染的组合物中的应用。

84.一种治疗癌症的方法，其特征在于，所述方法包括给予遭受癌症的个体有效量的如权利要求75或81所述的TCR。

85.如权利要求75或81所述的TCR在制备用于治疗癌症的组合物中的应用。