CN1714102A - T细胞受体展示 - Google Patents

T细胞受体展示 Download PDF

Info

Publication number
CN1714102A
CN1714102A CN 200380102928 CN200380102928A CN1714102A CN 1714102 A CN1714102 A CN 1714102A CN 200380102928 CN200380102928 CN 200380102928 CN 200380102928 A CN200380102928 A CN 200380102928A CN 1714102 A CN1714102 A CN 1714102A
Authority
CN
China
Prior art keywords
tcr
sequence
seq
polypeptide
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200380102928
Other languages
English (en)
Other versions
CN100551931C (zh
Inventor
B·K·雅各布森
T·B·安德森
P·E·莫洛伊
李懿
J·M·伯尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Immunocore Ltd
Adaptimmune Ltd
Original Assignee
Avidex Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avidex Ltd filed Critical Avidex Ltd
Publication of CN1714102A publication Critical patent/CN1714102A/zh
Application granted granted Critical
Publication of CN100551931C publication Critical patent/CN100551931C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

一种例如噬菌体、核糖体或细胞的蛋白质性质的颗粒,在其表面展示了一种T细胞受体(TCR)。展示的TCR优选地是在恒定结构域残基之间具有非天然二硫键的异源二聚体。这样的展示颗粒可以用于建立多样性的TCR文库以鉴别高亲和性TCR。公开了几种高亲和性TCR。

Description

T细胞受体展示
本发明涉及展示T细胞受体(TCR)的蛋白质性质的颗粒,例如噬菌体或核糖体颗粒,及其不同的文库。
发明背景
天然T细胞受体(TCR)
如在例如WO99/60120中所述的,TCR介导T细胞对特异性主要组织相容性复合物(MHC)-肽复合体的识别,这是免疫系统细胞免疫发挥功能的基础。
抗体和TCR是仅有的两种以特异方式识别抗原的分子,并且TCR因而是针对MHC提呈的特定抗原肽的唯一受体,异物肽经常是细胞内异常的唯一标志。当T细胞与抗原提呈细胞(APC)之间发生直接物理接触时,发生T细胞识别,并由抗原特异性TCR与pMHC复合物连接启动。
天然TCR是一种免疫球蛋白超家族的异源二聚细胞表面蛋白,它与参与介导信号转导的CD3复合体的固定蛋白相连。TCR以αβ和γδ形式存在,两者结构上相似但具有完全不同的解剖学定位以及或许不同的功能。I类和II类MHC配体也是免疫球蛋白超家族蛋白质但具有使其能够提呈大量不同APC细胞表面短肽片段的高度多样性的肽结合位点,专门用以抗原提呈。
已知两种进一步类型的蛋白质能够如TCR配体发挥作用。(1)CD1抗原是MHC I类相关分子,其基因位于不同于经典MHC I类和II类抗原的染色体上。CD1分子能以类似于常规I类和II类MHC-肽复合物的形式向T细胞提呈肽和非肽(例如脂、糖脂)部分。参见,例如Barclay等所著《白细胞抗原概述》(The Leucocyte AntigenFactsbook),第2版,(1997)以及Bauer(1997)Eur J Immunol 27(6)1366-1373。(2)细菌超抗原是能够结合II类MHC分子和一部分TCR的可溶性毒素(Fraser(1989)Nature 339 221-223)。许多超抗原显示出对一种或两种Vβ片段的特异性,而其他表现出更随意的结合。任何情况下,超抗原能依靠其以多克隆方式激活一部分T细胞的能力引起增强的免疫反应。
异源二聚的αβ和γδ TCR的胞外部分包括两条多肽,其中每条具有一个近膜的恒定结构域和一个远膜的可变结构域。每个恒定结构域和可变结构域包含一个链内二硫键。可变结构域包含类似于抗体互补决定区(CDR)的高多态性环。αβTCR的CDR3与MHC提呈的肽相互作用,并且αβTCR的CDR1和CDR2与肽和MHC相互作用。TCR序列的多态性通过连锁的可变结构域(V)、多样性(D)、连接区(J)和恒定基因的体细胞重排产生。
功能性α和γ链多肽由重排的V-J-C区形成,而β和δ链多肽包含V-D-J-C区。胞外恒定结构域具有近膜区和免疫球蛋白区。存在单一的α和δ链恒定结构域,分别称为TRAC和TRDC。β链恒定结构域由两种称为TRBC1和TRBC2(IMGT命名法)的不同β恒定结构域中的一种构成。在这些β恒定结构域之间存在4个氨基酸的改变,其中3个位于用于产生展示在本发明的噬菌体颗粒上的单链TCR的结构域内部。这些改变都位于TRBC1和TRBC2的外显子1内部:N4K5->K4N5和F37->Y(IMTG编号,TRBC1->TRBC2差异),最后一个两种TCRβ链之间的氨基酸改变在TRBC1和TRBC2的外显子3中:Vi->E。恒定的γ结构域由TRGC1、TRGC2(2X)或TGRC2(3X)之一构成。这两种TGRC2恒定结构域只是在所述基因外显子2所编码的氨基酸拷贝数上有所不同。
每种TCR胞外结构域的范围有些变化。然而,精通本领域的人员可以使用诸如《T细胞受体概述》(The T Cell Receptor Facts Book,Lefranc & Lefranc,Publ.Academic Press 2001)等参考方便地确定结构域边界的位置。
重组TCR
生产重组TCR是有好处的,因为它们提供了适用于以下目的的可溶性TCR类似物:
研究TCR/配体相互作用(例如pMHC与αβ TCR)
筛选TCR相关相互作用的抑制剂
为潜在的治疗方法提供基础
目前已经设计出了多种构件以生产重组TCR。这些构件分成单链TCR和二聚TCR两大类,下面总结了与这两种构件相关的文献。
单链TCR(scTCR)是由单一氨基酸链构成的人工构件,它类似于天然异源二聚TCR与MHC-肽复合物结合。不幸地,通过简单地连接α和β链从而使两者在单一的开放读框中表达而生产功能性α/β类似物scTCR的尝试还没有获得成功,大概是由于α-β可溶性结构域对的天然不稳定性。
相应地,使用α链和β链之一或两者的各种截短序列的专门技术对于生产scTCR是必需的。这些方式似乎只可用于非常有限的scTCR序列。Soo Hoo等在(1992)PNAS.89(10):4759-63中报道了通过使用用一种25个氨基酸的连接物连接的截短的α和β链与细菌周质表达的2CT细胞克隆中单链形式的小鼠TCR的表达(也可参见Schodin等,(1996)Mol.Immunol.33(9):819-29)。这一设计也形成了Holler等在(2000)PNAS.97(10):5387-92中报道的源自2C scTCR的并与相同的H2-Ld-限制性异构表位(alloepitope)结合的m6单链TCR的基础。Shusta等在(2000)NatureBiotechnology 18:754-759中以及美国专利6,423,538中报道了在产生突变TCR的酵母展示实验中使用小鼠单链2C TCR构件提高热稳定性和可溶性。这一报道也说明了这些展示的2C TCR选择性结合表达其同类pMHC细胞的能力。Khandekar等在(1997)J.Biol.Chem.272(51):32190-7中报道了针对小鼠D10 TCR的类似的设计,虽然这一scTCR与MBP融合并在细菌胞质中表达(可见Hare等,(1999)Nat.Struct.Biol.6(6):574-81)。Hilyard等在(1994)PNAS.91(19):9057-61中报道了通过使用Vα-连接物-Vβ设计并在细菌周质表达的一种感冒病毒基质蛋白HLA-A2特异性的人scTCR。
Chung等在(1994)PNAS.91(26)12654-8中报道了使用Vα-连接物-Vβ-Vβ设计并在哺乳动物细胞系表面表达的人scTCR的生产。该报道不涉及scTCR的任何肽-HLA特异性结合。Plaksin等在(1997)J.Immunol.158(5):2218-27中报道了一种类似的Vα-连接物-Vβ-Vβ设计以生产针对HIV gp120-H-2Dd表位的小鼠特异性scTCR。该scTCR以细菌包含体形式表达并在体外复性。
许多文献描述了包含连接相应亚基的天然二硫键的TCR异源二聚体的生产(Garboczi等,(1996),Nature 384(6605):134-41;Garboczi等,(1996),J Immunol157(12):5403-10;Chang等,(1994),PNAS USA 91:11408-11412;Davodeau等,(1993),J.Biol Chem.268(21):15455-15460;Golden等,(1997),J.Imm.Meth.206:163-169;美国专利No.6080840)。然而,虽然这样的TCR能被TCR特异抗体识别,它们是不稳定的并且不能识别其天然配体,除非这些配体达到相对高浓度。
在WO 99/60120中描述了一种正确折叠的可溶性TCR,因此它能够识别其天然配体,在一段时加内稳定的,并能够以合理的数量生产。这种TCR包括通过一对C末端二聚化肽(诸如亮氨酸拉链)与一个相应的TCRβ或δ链胞外结构域二聚的一个TCRα或γ链胞外结构域。这一生产TCR的策略通常适用于所有TCR。
Reiter等在Immunity,1995,2:281-287中详细描述了包括由二硫键稳定的TCRα和β可变结构域,其中之一与假单胞菌(Pseudomonas)外毒素(PE38)相连的可溶性分子的构建。生产这一分子的理由之一是克服单链TCR固有的不稳定性。这种TCR可变结构域中新的二硫键的位置通过与抗体可变结构域(这些二硫键先前曾被导入过,参见例如Brinkmann等(1993),Proc.Natl.Acad.Sci.USA 90:7538-7542,以及Reiter等(1994)Biochemistry 33:5451-5459)的同源性进行鉴别。然而,由于在抗体和TCR的恒定结构域之间没有这样的同源性,这样的技术不能用于鉴别TCR恒定结构域之间新的链间二硫键的合适位点。
如以上提到的,Shusta等在(2000)Nature Biotechnology 18:754-759中报道了在酵母展示实验中使用单链2C TCR构件。以前对于在噬菌体颗粒上展示scTCR已进行过讨论。例如,WO 99/19129详细描述了scTCR的生产,并且总结了用于展示Vα-连接物-VβCβ形式的scTCR的噬菌体颗粒的生产的潜在方法。然而,该申请没有包含说明所述展示TCR的噬菌体颗粒的生产的例证。该申请仍然参考了一份未决申请:“在所述的未决美国专利申请08/813,781中已经描述了包含与噬菌体外被蛋白(基因II或基因VIII)融合的编码scTCR分子的DNA片段的DNA载体的构建。”
而且,该申请依赖于抗TCR抗体或超抗原MHC复合物识别产生的可溶的、非噬菌体展示的scTCR的能力以证实其正确构象。因此,scTCR的真正的肽-MHC结合特异性没有以任何形式进行确定地说明。最后,进一步的研究(Onda等,(1995)MolecularImmunology 32(17-18)1387-1397)公开了在不存在其相应β链的情况下两条小鼠TCRα链的噬菌体展示。这一研究说明,展示所述TCRα链(源自A1.1小鼠杂交瘤)之一的噬菌体颗粒优先与固定在微量滴定孔中的、与由小鼠I类MHC I-Ad提呈时完整TCR会正常反应的相同的肽结合。
筛选应用
包括TCR介导的免疫突触在内的多种重要的细胞相互作用和细胞反应是由细胞表面受体和呈现在其他细胞表面的配体之间的接触控制的。这些特异的分子接触类型对于人体内正确的生化调节具有重要意义,因而是研究热点。在许多情况下,这样研究的目标是设计调节细胞反应的方法以防止或治疗疾病。
因此,用于鉴别具有一定特异性的与人类受体或配体结合的化合物的方法是重要的,因为这会引导新的疾病治疗方法的发现和发展。尤其是干扰某些受体-配体相互作用的化合物具有立即作为治疗物质或载体的能力。
组合化学的进展能较简便和有效地产生非常庞大的化合物文库,这已经提高了大规模化合物检测的范围。现在,筛选程序的限制最常见存在于能够使用的检测法的性质、适当的受体与配体分子的生产以及这些检测法适于高通量筛选方法的程度。
展示方法
经常需要在蛋白质性质的颗粒表面呈现一种给定的肽或多肽。这样的颗粒可以作为肽或多肽纯化的辅助方式(因为这些携带肽或多肽的颗粒可以通过沉淀或其他方法与不需要的杂质分离)。它们也可以用作微粒疫苗,针对表面展示的肽或多肽的免疫应答通过微粒提呈得以激活。酵母反转位子蛋白质p24和肝炎B表面外被蛋白是自装配成颗粒的蛋白质的例子。感兴趣的肽或多肽与这些颗粒形成蛋白的融合是在生成的颗粒表面提呈所述肽或多肽的一种认可的方式。
然而,颗粒展示方法主要已用于鉴别具有诸如增强的表达量、结合和/或稳定特性等所需性质的蛋白质。这些方法包括创建在蛋白质性质的颗粒表面表达蛋白或多肽的多样库或“文库”。这些颗粒具有两个关键特征,第一,每个颗粒提呈单一的蛋白质或多肽,以及第二,编码所表达的蛋白或多肽的遗传材料与所述颗粒的遗传材料相连。随后所述文库进行一轮或多轮筛选。例如,这可以包括将一种配体与一种突变受体的颗粒展示文库接触并鉴别哪种突变受体以最高亲和性结合所述配体。一旦筛选过程完成,具有所需性质的受体可以进行分离,并且其遗传材料可以扩增以对所述受体进行测序。这些展示方法分为两大类,体外展示和体内展示。
所有体内展示方法依赖于以下步骤,其中通常将由诸如质粒或噬菌体复制子的可复制颗粒的遗传核酸转化细胞以表达蛋白或多肽(Pliickthun(2001)Adv ProteinChem 55 367-403)。存在多种已证实适于蛋白或多肽体内展示的复制子/宿主系统。这些系统包括:
噬菌体/细菌细胞
质粒/CHO细胞
基于酵母2μm质粒的载体/酵母细胞
杆状病毒/昆虫细胞
质粒/细菌细胞
体内展示方法包括细胞表面展示方法,其中将编码由感兴趣的蛋白质或多肽与一种细胞表面蛋白或多肽构成的融合蛋白的质粒导入宿主细胞。这一融合蛋白的表达导致感兴趣的蛋白或多肽展示在细胞表面。展示这些感兴趣的蛋白或多肽的细胞随后可以用于如FACS等筛选过程,并且从选出的细胞中得到的质粒可以进行分离和测序。对哺乳动物细胞(Higuschi(1997)J Immunol.Methods 202 193-204)、酵母细胞(Shusta(1999)J Mol Biol 292 949-956)和细菌细胞(Sameulson(2002)J.Biotechnol 96(2)129-154)已经设计了细胞表面展示系统。
已经公开了多种体内展示技术的大量综述,例如Hudson(2002)Expert Opin BiolTher(2001)1(5)845-55以及Schmitz(2000)21(Supp A)S106-S112。
体外展示方法建立在核糖体基础上以将mRNA文库翻译成为蛋白质或多肽的多样阵列。形成的蛋白质或多肽与编码这些分子的mRNA之间的连接是通过两种方法之一维持的。常规的核糖体展示采用编码短的连接序列(通常40-100个氨基酸)和需要展示的蛋白质或多肽的mRNA序列。连接序列为展示的蛋白或多肽提供足够的空间以重折叠而不会被核糖体产生空间位阻。所述mRNA序列缺乏“终止”密码子,这确保表达的蛋白或多肽及RNA与核糖体颗粒保持连接。相关的mRNA展示方法建立在制备编码感兴趣的蛋白或多肽与携带嘌呤霉素部分的DNA连接物的mRNA基础上。一旦核糖体到达mRNA/DNA接头处,翻译就停止,并且嘌呤霉素与核糖体形成共价连接。关于这两种相关的体外展示方法的近期的综述参见Amstutz(2001)Curr OpinBiotechnol 12 400-405。
尤其优选地是基于噬菌体颗粒表达与其表面蛋白融合的异源肽或多肽能力的噬菌体展示技术(Smith(1985)Science 217 1315-1317)。对于多肽单体展示的过程是相当通用的,并且是本领域内熟知的。然而,当天然形式结合为二聚体的多肽的情况下,似乎只有抗体的噬菌体展示已经得到了彻底研究。
对于单体多肽展示而言,存在两种主要过程:
第一种(方法A)是通过将编码与编码噬菌体外被蛋白的DNA融合的异源肽或多肽的DNA插入载体(噬菌粒)。随后通过用噬菌粒转染细菌细胞、并随后用“辅助噬菌体”感染转化的细胞,进行展示异源肽或多肽的噬菌体颗粒的表达。辅助噬菌体作为所述噬菌粒未编码的、产生功能性噬菌体颗粒所需的噬菌体蛋白的来源。
第二种(方法B),通过将编码异源肽或多肽的DNA插入与编码噬菌体外被蛋白DNA融合的完整噬菌体基因组。随后通过用噬菌体基因组感染细菌细胞进行展示异源肽或多肽的噬菌体颗粒的表达。该方法比第一种方法具有“单一步骤”过程的优势。然而,降低了能成功包装入最终噬菌体颗粒的异源DNA序列的大小。适用于这一方法的噬菌体的例子有M13、T7和λ噬菌体。
方法B的一种变形包括向噬菌体基因组中编码需展示的异源肽的DNA添加编码核苷酸结合结构域的DNA序列,以及进一步向噬菌体基因组添加相应的核苷酸结合位点。这使得所述异源肽直接与噬菌体基因组相连。这一肽/基因组复合物随后装入展示异源肽的噬菌体颗粒中。WO 99/11785中完整描述了这一方法。
随后可以重新获得噬菌体颗粒并用于研究所述异源肽或多肽的结合特征。一旦分离,噬菌粒或噬菌体DNA可以从展示肽或多肽的噬菌体颗粒中重新获得,并且该DNA可以通过PCR复制。PCR产物可以用于对由特定噬菌体颗粒展示的异源肽或多肽进行测序。
单链抗体及其片段的噬菌体展示已成为研究这些多肽结合特征的常规方法。有多种书籍对噬菌体展示技术与噬菌体生物学作了综述(例如,参见Barbas等所著的《噬菌体展示一实验室手册》(Phage Display-A Laboratory Manual,2001,Cold SpringHarbour Laboratory Press)。
第三种噬菌体展示方法(方法C)建立在在需要位置具有半胱氨酸残基的异源多肽可以以可溶形式被噬菌粒或噬菌体基因组表达,并且引起与在表面暴露位置也具有半胱氨酸残基的改进的噬菌体表面蛋白通过所述两个半胱氨酸之间形成二硫键连接这一事实。WO 01/05950详细描述了针对单链抗体衍生肽的这种另外的连接方法的使用。
发明概述
天然TCR是具有维持作为功能性二聚体的稳定性所需的长的跨膜结构域的异源二聚体。如上所述,对于研究和治疗目的而言有用的是可溶形式的TCR,因此很少采用不溶的天然形式的展示。另一方面,可溶的稳定形式的TCR已被证明难以设计,并且由于大部分展示方法似乎仅对单体肽和多肽进行了描述,适于可溶二聚体TCR的展示技术还没有进行研究。而且,由于展示的TCR的功能取决于TCR二聚体可变结构域的正确连接,功能性二聚体TCR的成功展示并非微不足道的。
WO 99/18129包含这样的陈述:“按照1997年3月7日提交的未决美国申请No.08/813.781,其公开通过参考结合在本申请书中,编码scTCR融合蛋白的DNA构件可用于制备噬菌体展示文库”,但在该申请中没有包含这样的展示的实际描述。然而,该申请的发明人发表了一篇论文(Weidanz(1998)J Immunol Methods 221 59-76),说明了两种小鼠scTCR在噬菌体颗粒上的展示。
WO 01/62908共开了用于scTCR和scTCR/Ig融合蛋白噬菌体展示的方法。然而,没有对公开的构件的功能(特异性pMHC结合)进行评估。
最后,针对小鼠TCR示范了逆转录病毒介导的用于多样的TCR文库在不成熟T细胞表面展示的方法。展示在未成熟T细胞表面的突变的TCR文库使用pMHC四聚体通过流式细胞仪进行筛选,并且这导致鉴别对同类pMHC特异的或其变体的TCR形式(Helmut等,(2000)PNAS 97(26)14578-14583)。
本发明部分建立在单链和二聚体TCR可以以与蛋白质性质的颗粒表面融合的形式表达,并可以利用展示α/β类似物和γ/δ类似物scTCR和dTCR构件的蛋白质颗粒的发现基础上。在这之上展示TCR的蛋白质性质的颗粒包括自聚合颗粒形成蛋白、噬菌体、病毒来源蛋白、核糖体颗粒以及具有TCR共价连接的细胞表面蛋白或多肽分子的细胞。这样的蛋白质颗粒展示的TCR对于纯化和筛选目的来说是有用的,尤其是作为颗粒展示的TCR的多样性文库用于生物淘选以鉴别具有诸如针对靶MHC-肽复合物高亲和性等需要特征的TCR。就后面这一点来说,颗粒展示的scTCR可以用于所需TCR的鉴别,但所述信息可能更好应用于最终用于治疗的类似物二聚体TCR的构件。本发明也包括可通过这些方法确定的高亲和性TCR。
发明详述
在一个主要的方面,本发明提供了一种在其表面展示T细胞受体(TCR)的蛋白质颗粒,其中
(i)所述蛋白质颗粒是核糖体并且所述TCR是单链TCR(scTCR)多肽、或二聚体TCR(dTCR)多肽对,或
(ii)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,以及所述TCR是人scTCR或人dTCR多肽对,或
(iii)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,以及所述TCR是非人dTCR多肽对,或
(iv)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,且所述TCR是scTCR多肽,该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列,连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列,以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。
在一种优选的实施方案中,本发明提供了一种在表面展示一种二聚体T细胞受体(dTCR)多肽对、或一种单链T细胞受体(scTCR)多肽的蛋白质颗粒,其中所述dTCR多肽对由与存在于天然TCR链中的胞外恒定和可变结构域序列相对应的TCR氨基酸序列组成,所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相对应的氨基酸序列和连接序列组成,所述连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列;其中dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致,并且在所述scTCR多肽的情况下,天然TCR中不存在等价物的二硫键连接所述多肽的残基。在按照本发明展示αβ scTCR或dTCR的情况下,对α和β片段的可变结构域序列的相互定位与天然αβTCR中的定位基本一致的要求只是TCR功能性的另一种说法,并且这可以通过证实所述分子与相关的TCR配体(pMHC复合物、CD-1抗原复合物、超抗原或超抗原/pMHC复合物)结合进行检测—如果结合,则该要求得到满足。与pMHC复合物的相互作用可以使用Biacore 3000TM或Biacore 2000TM工具进行测量。WO99/6120提供了分析TCR与MHC-肽复合物结合所需的方法的详细描述。这些方法可以相同地应用于TCR/CD1和TCR/超抗原相互作用的研究。为了将这些方法应用于TCR/CD1相互作用的研究,需要可溶形式的CD1,在Bauer(1997)EurJ Immunol 27(6)1366-1373中描述了其生产过程。在本发明的γδTCR的情况下,这些分子的同类配体是未知的,因而可以使用诸如抗体识别等验证其构象的二级方法。δ链可变结构域特异的单克隆抗体MCA991T(得自Serotec)是适于该任务的抗体的例子。
本发明的scTCR或dTCR可以通过例如以下两种方式被展示在蛋白质颗粒上,例如噬菌体颗粒上,优选地是丝状噬菌体颗粒上:
(i)dTCR多肽对的一个成员的C末端,或scTCR多肽的C末端,或与任一上述C末端相连的短肽连接物的C末端可以通过肽键与蛋白质颗粒的表面暴露残基直接相连。例如,所述表面暴露残基优选地位于噬菌体基因III或基因VIII的基因产物的N末端;以及
(ii)dTCR多肽对的一个成员的C末端,或scTCR多肽的C末端,或与任一上述C末端相连的短肽连接物的C末端经导入的半胱氨酸残基通过二硫键与蛋白质颗粒表面暴露的半胱氨酸相连。例如,所述表面暴露残基也是优选地位于噬菌体基因III或基因VIII的基因产物的N末端。
优选的是以上方法(i)。在scTCR的情况下,编码TCR的核酸可以与编码如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或表面蛋白的核酸融合。另外,代表mRNA但没有终止密码子的核酸、或与嘌呤霉素RNA融合的核酸可以由核糖体翻译,从而所述TCR保持与核糖体颗粒的融合。在dTCR的情况下,编码TCR一条链的核酸可以与编码诸如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或细胞表面蛋白的核酸融合,并且TCR多肽对的第二条链可以与展示第一条链的最终表达的颗粒相连。两条链的正确功能性连接可以如以下更全面地讨论的,由两条链的恒定结构域中存在的能形成链间二硫键的半胱氨酸辅助。
展示的scTCR
展示的scTCR多肽可以是例如具有以下组分的分子:
由与对应于TCR α链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR α或δ链可变结构域序列的氨基酸序列组成的第一片段,
由与对应于TCR β链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR β或γ链可变结构域序列的氨基酸序列组成的第二片段,
连接第一片段C末端和第二片段N末端的连接序列,或反之亦然,以及
第一和第二条链之间的二硫键,所述二硫键在天然αβ或γδ T细胞受体中不存在等价物,
连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互定位与天然αβ或γδ T细胞受体中的定位基本一致。
另外,展示的scTCR可以是具有以下组分的分子:
由对应于TCR α或δ链可变结构域的氨基酸序列组成的第一片段,
由与对应于TCR β链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR β或γ链可变结构域序列的氨基酸序列组成的第二片段,以及
连接第一片段C末端和第二片段N末端的连接序列,
条件是其中所述蛋白质颗粒是噬菌体,所述scTCR对应于人TCR;或是有以下组分的分子
由对应于TCR β或γ链可变结构域的氨基酸序列组成的第一片段,
由与对应于TCR α链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCR α或δ链可变结构域序列的氨基酸序列组成的第二片段,以及
连接第一片段C末端和第二片段N末端的连接序列
条件是其中所述蛋白质颗粒是噬菌体,所述scTCR对应于人TCR。
展示的dTCR
展示在蛋白质颗粒上的dTCR可以是由以下组分组成的分子:
对应于TCR α或δ链可变结构域序列的序列与对应于TCR α链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及
对应于TCR β或γ链可变结构域序列的序列与对应于TCR β链恒定结构域胞外序列的序列的N末端融合的第二多肽,
第一和第二多肽通过在天然αβ或γδ T细胞受体中不存在等价物的二硫键连接。
优选地,所述dTCR展示在丝状噬菌体上并且是由以下组分组成的分子
对应于TCR α链可变结构域序列的序列与对应于TCR α链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及
对应于TCR β链可变结构域序列的序列与对应于TCR β链恒定结构域胞外序列的序列的N末端融合的第二多肽,
第一和第二多肽通过取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01或其非人类等价物的外显子1的Ser57的半胱氨酸残基之间的二硫键连接,
所述dTCR多肽对一个成员的C末端通过肽键与噬菌体的外被蛋白相连。
dTCR多肽对和scTCR多肽
存在于scTCR或dTCR中的恒定结构域胞外序列优选地对应于人TCR的这些部分,对于可变结构域序列也是这样。然而,这样的序列之间的对应并不需要氨基酸水平上一一对应。相对于对应的人TCR序列的N-或C-截短、和/或氨基酸缺失和/或取代是允许的。尤其因为存在于第一和第二片段中的恒定结构域胞外序列并不直接参与与scTCR或dTCR结合的配体的接触,相对于天然TCR的胞外恒定结构域序列,它们可以更短一些,或可以包含取代或缺失。
存在于dTCR多肽对之一或scTCR多肽第一片段中的恒定结构域胞外序列可以包括对应于TCR α链的胞外恒定Ig结构域的序列,并且/或存在于dTCR多肽对另一个成员或scTCR多肽第二片段中的恒定结构域胞外序列可以包括对应于TCR β链的胞外恒定Ig结构域的序列。
在本发明的一种实施方案中,dTCR多肽对的一个成员,或scTCR多肽的第一片段,对应于与TCR α链恒定结构域的充分完整的胞外结构域的N末端融合的TCRα链充分完整的可变结构域;和/或多肽对的另一个成员或第二片段对应于与TCR β链恒定结构域的充分完整的胞外结构域的N末端融合的TCR β链充分完整的可变结构域。
在另一种实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的恒定结构域胞外序列对应于C末端截短的天然TCR的α和β链的恒定结构域,从而排除了形成TCR的天然链间二硫键的半胱氨酸残基。另外,这些半胱氨酸残基可以被其他诸如丝氨酸或丙氨酸等氨基酸残基取代,从而删除了天然二硫键。此外,天然TCR β链包含一个不成对的半胱氨酸残基,在本发明scTCR的β序列中,该残基可以删除或由非半胱氨酸残基取代。
在本发明的特定实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域,并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列,第一和第二个TCR来自相同的物种。因而,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如,A6 Tax sTCR恒定结构域胞外序列可用作骨架,在这之上可以融合异源α和β可变结构域。
在本发明的另一种实施方案中,分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR δ和γ链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域,并且分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列,第一和第二个TCR来自相同的物种。因而,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR δ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如,A6 Tax sTCR恒定结构域胞外序列可用作骨架,在这之上可以融合异源γ和δ可变结构域。
在本发明的一种特定实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β、或δ和γ链可变结构域序列可以共同对应于第一种人TCR的功能性可变结构域,并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCR α和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。因而,存在于dTCR或scTCR多肽的第一和第二片段中的TCR α和β、或δ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。例如,小鼠TCR恒定结构域胞外序列可以用作骨架,在这之上可以融合异源人α和βTCR可变结构域。
scTCR多肽中的连接物
对于本发明的展示scTCR的蛋白质颗粒而言,连接序列连接第一和第二个TCR片段以形成单一的多肽链。所述连接序列可以,例如,具有式-P-AA-P-,其中P是脯氨酸,并且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。
对于由本发明的蛋白质颗粒展示的scTCR与配体(在αβTCR的情况下是MHC-肽复合物)结合而言,第一和第二片段配对从而其可变结构域序列的定位适于这样的结合。因此,连接序列应具有足够长度以跨越第一片段C末端与第二片段N末端之间或反之亦然的距离。另一方面,在可变结构域序列N末端的连接序列末端阻碍或减弱scTCR与靶配体结合的情况下,优选地应避免连接序列的过度长度。
例如,在其中存在于第一和第二片段中的恒定结构域胞外序列对应于C末端截短以去除形成天然链间二硫键的半胱氨酸残基的天然TCR的α和β链的恒定结构域,并且连接序列连接第一片段的C末端与第二个序列的N末端的情况下。
连接序列可以包括例如26-41个氨基酸,优选地29、30、31或32个氨基酸,或33、34、35、或36个氨基酸。特定的连接物具有式-PGGG-(SGGGG)5-P-和-PGGG-(SGGGG)6-P-,其中P是脯氨酸,G是甘氨酸,以及S是丝氨酸。
链间二硫键
由本发明的蛋白质颗粒所展示的优选的dTCR和scTCR的一个特征要素是dTCR多肽对之间或scTCR第一和第二片段之间的二硫键。二硫键可以对应于存在于天然二聚体αβ TCR中的天然链间二硫键,或可以在天然TCR中不存在对应物,存在于特异结合入dTCR多肽对或scTCR多肽第一个或第二片段的恒定结构域胞外序列的半胱氨酸之间。在有些情况下,天然和非天然二硫键都可能是需要的。
二硫键的位置满足dTCR多肽对或scTCR多肽第一和第二片段的可变结构域序列充分类似天然αβ或γδ T细胞受体中相互定位的要求。
二硫键可以通过第一和第二片段上非半胱氨酸残基突变为半胱氨酸,并引发突变残基之间的键形成得以形成。天然TCR中其各自β碳原子分开约为6(0.6nm)或更小,并且优选地位于3.5(0.35nm)到5.9(0.59nm)的区间内的残基是优选的,这样可以在天然残基的位置上导入的半胱氨酸残基之间形成二硫键。虽然可以位于近膜结构域的残基之间,优选地是如果二硫键位于恒定免疫球蛋白结构域中的残基之间。可以导入半胱氨酸以形成二硫键的优选位置是TCR α链的TRAC*01的和TCR β链的TRBC1*01或TRBC2*01的外显子1中的以下残基:
TCR α链 TCR β链 天然β碳原子间隔(nm)
Thr 48Thr 45Tyr 10Thr 45Ser 15 Ser 57Ser 77Ser 17Asp 59Glu 15 0.4730.5330.3590.5600.59
各自相应的人TCR链中的以下基序可以用于鉴别进行突变的残基(阴影部分残基是突变成半胱氨酸的残基)。
α链Thr 48:DSDVYITDKTVLDMRSMDFK(TRAC*01基因的外显子1的39-58位氨基酸)(SEQ ID 1)
α链Thr 45:QSKDSDVYITDKTVLDMRSM(TRAC*01基因的外显子1的36-55位氨基酸)(SEQ ID 2)
α链Tyr 10:DIQNPDPAVYQLRDSKSSDK(TRAC*01基因的外显子1的1-20位氨基酸)(SEQ ID 3)
α链Ser 15:DPAVYQLRDSKSSDKSVCLF(TRAC*01基因的外显子1的6-25位氨基酸)(SEQ ID 4)
β链Ser 57:NGKEVHSGVSTDPQPLKEQP(TRBC1*01径TRBC2*01基因的外显子1的48-67位氨基酸)(SEQ ID 5)
β链Ser 77:ALNDSRYALSSRLRVSATFW(TRBC1*01 & TRBC2*01基因的外显子1的68-87位氨基酸)(SEQ ID 6)
β链Ser 17:PPEVAVFEPSEAEISH TQKA(TRBC1*01 & TRBC2*01基因的外显子1的8-27位氨基酸)(SEQ ID 7)
β链Asp 59:KEVHSGVSTDPQPLKEQPAL(TRBC1*01 & TRBC2*01基因的外显子1的50-69位氨基酸)(SEQ ID 8)
β链Glu 15:VFPPEVAVFEPSEAEISHTQ(TRBC1*01 & TRBC2*01基因的外显子1的6-25位氨基酸)(SEQ ID 9)
在其他物种中,TCR链可能不具有与以上基序100%相同的区域。然而,精通本领域的人员能够使用以上基序鉴别TCR α或β链的等价部分并由此鉴别突变成半胱氨酸的残基。在这一方面可以使用对齐排列技术。例如,欧洲生物信息学研究所网站( http://www.ebi.ac.uk/index.html)上提供的ClustalW可以用于将特定TCR链序列与以上基序比较以对需要突变的TCR序列相关部分进行定位。
本发明在其范围内包括蛋白质颗粒展示的αβ和γδ类似物scTCR,以及其他哺乳动物的αβ和γδ类似物scTCR,这些哺乳动物包括但不限于小鼠、大鼠、猪、山羊和绵羊。如以上所提到的,精通本领域的人员应能够确定等价于上述人的能导入半胱氨酸残基以形成链间二硫键的位置的位置。例如,以下说明了小鼠Cα和Cβ可溶结构域的氨基酸序列,以及显示等价于上述人的能突变成半胱氨酸以形成TCR链间二硫键的残基的小鼠残基的基序(其中相关残基用阴影表示):
小鼠Cα可溶结构域:
PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMK
AMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVP(SEQ ID 10)
小鼠Cβ可溶结构域:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREV
HSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDK
WPEGSPKPVTQNISAEAWGRAD(SEQ ID 11)
人α链Thr 48的小鼠等价物:ESGTFITDKTVLDMKAMDSK(SEQ ID 12)
人α链Thr 45的小鼠等价物:KTMESGTFITDKTVLDMKAM(SEQ ID 13)
人α链Tyr 10的小鼠等价物:YIQNPEPAVYQLKDPRSQDS(SEQ ID 14)
人α链Ser 15的小鼠等价物:AVYQLKDPRSQDSTLCLFTD(SEQ ID 15)
人β链Ser 57的小鼠等价物:NGREVHSGVSTDPQAYKESN(SEQ ID 16)
人β链Ser 77的小鼠等价物:KESNYSYCLSSRLRVSATFW(SEQ ID 17)
人β链Ser 17的小鼠等价物:PPKVSLFEPSKAEIANKQKA(SEQ ID 18)
人β链Asp 59的小鼠等价物:REVHSGVSTDPQAYKESNYS(SEQ ID 19)
人β链Glu 59的小鼠等价物:VTPPKVSLFEPSKAEIANKQ(SEQ ID 20)
如上所述,A6 Tax scTCR胞外恒定结构域可以用作骨架,在这之上可以融合异源可变结构域。优选地,异源可变结构域序列在二硫键和恒定结构域序列的N末端之间的任何位置与恒定结构域序列连接。在A6 Tax TCR和β恒定结构域序列的情况下,可以在氨基酸残基158和172处分别导入的半胱氨酸之间形成二硫键。因此,优选地是如果异源的α和β链可变结构域序列连接位置分别位于159或173位残基和α或β恒定结构域序列的N末端之间。
TCR展示
用于生物淘选以鉴别具有如针对靶肽-MHC复合物高亲和性等所需性质的优选的体内TCR展示方法是噬菌体展示。
首先,构建编码了突变的scTCR或dTCR的多样性阵列的DNA文库。该文库通过使用编码作为扩增模板的天然TCR的DNA进行构建。针对将所需突变体导入TCR DNA并从而最终表达TCR蛋白,存在多种对于精通本领域的人员而言已知的合适的方法。例如易错PCR(EP-PCR)、DNA重排技术以及如XL-1-Red等细菌增变菌株的使用是向TCR序列中导入突变的常规方法。尤其优选地是,如果这些突变体导入到TCR的明确的结构域中。例如,可变结构域中的突变,尤其互补决定区(CDR)和/或骨架区或许是导入导致生成TCR多样文库以产生具有提高的配体结合性质的TCR突变的最适当的位置。EP-PCR是通过这种方法可以将这样的“区域特异性”突变导入TCR的一个例子。使用与需要突变的区域邻接的DNA序列互补的EP-PCR引物以扩增这一包含可控水平随机突变的TCR DNA区域的多拷贝。通过连接或重叠PCR,这些编码突变区域的DNA序列插入编码TCR未突变部分的DNA序列。编码含突变区域TCR的DNA然后可以与编码异源多肽的DNA连接以产生适合展示的融合蛋白。在噬菌体展示的情况下,采用的表达载体是噬菌粒或噬菌体基因组载体,其中TCR DNA可以与编码表面蛋白的,优选地是gIII或gVIII表面蛋白的DNA连接。在scTCR的情况下,这样的连接如对于任何单体的肽或多肽的噬菌体展示那样进行。在dTCR的情况下,只有一条TCR链如前述的进行连接。另一条链编码在与噬菌粒和辅助噬菌体核酸共表达的核酸中,这样表达的第二条链与具有表面展示的第一条链的表达的噬菌体相连。如以上更详细地描述的,在这两种情况下,恒定结构域中正确定位的半胱氨酸通过由这些残基形成二硫键,在引起TCR的可变结构域采用其功能性定位中是有帮助的。
至于表达,包括(a)编码dTCR多肽对的一条链的核酸,以及(b)与编码颗粒形成蛋白、或细胞表面蛋白的核酸序列融合的TCR多肽对的另一条链;或与编码颗粒形成蛋白或细胞表面蛋白的核酸序列融合的编码scTCR多肽的核酸,dTCR对,或包括由核酸(a)构成的第一载体和由核酸(b)构成的第二载体的组合物的表达载体与能引起编码的遗传物质在适于所述细胞转化的条件下表达的宿主细胞接触。这样的表达载体、表达系统包括编码dTCR和scTCR的噬菌粒或噬菌体基因组载体,以及携带它们的宿主细胞形成本发明的附加方面。在本发明的优选的实施方案中,噬菌粒或噬菌体基因组载体源自丝状噬菌体。
转化的细胞随后进行孵育以允许TCR展示的蛋白质颗粒的表达。这些颗粒随后可以用于筛选或测试以鉴别具有特定增强特性的TCR形式。随后可以分离任何研究中具有增强特性的颗粒。编码这些TCR的DNA随后可以通过PCR扩增并且确定其序列。
已知外源多肽的高表达水平对于宿主细胞可能是有毒的。在这样的情况下,必须发现对外源多肽更耐受的宿主株,或宿主细胞中表达水平必须限制在能够耐受的水平。例如,Beekwilder等在(1999)Gene 228(1-2)23-31中报道了只有含缺失或琥珀终止密码子的突变形式的土豆蛋白酶抑制剂(PI2)能够成功地从噬菌体展示文库中得到选择。在所述情况下,这里的实施例中报道的工作过程中的观察结果说明,至少在大肠杆菌的一些菌株中,限制本发明的蛋白颗粒展示的TCR的表达水平可能是需要的。这样,在重复几轮培养后实施例4中选择的A6 TCR是源自其中的噬菌粒相对于最初导入的已经发生突变的细胞。该突变在TCR β链中已创建了一个“乳白”终止密码子。该密码子是由所采用的大肠杆菌菌株的核糖体以低频率“读通”导致在这一位点上插入色氨酸残基以及全长β链表达的明显降低的整体水平。
存在多种在可能适于限制scTCR或dTCR的一条或两条TCR链表达水平的宿主中限制特定表达系统外源多肽表达水平的策略。例如:
使用弱启动子序列—获得的诸如TCR α或β链的特定基因产物的表达水平,可以通过使用不同强度的启动子序列进行定制。λ噬菌体PRM是弱启动子的例子。
突变的核糖体结合位点(RBS’s)-与诸如TCR α或β链等基因产物相连的RBS中的单一核酸进行突变,这可以导致降低的表达水平。例如,将野生型AGGA序列突变成AGGG。
突变的“起始密码子”—将与诸如TCR α或β链等基因产物相连的单一核酸的起始密码子进行突变也可以导致降低的表达水平。例如,将野生型AUG起始子突变为GUG。
错义抑制突变—这些突变插入TCR β链编码区内部。实例包括“乳白”终止子(UGA),这一“不严密”的终止子导致色氨酸的低频插入以及编码序列其余部分的读通。
代谢物介导的启动子强度调节—处于某些启动子控制下的诸如TCR α或β链等基因产物的表达水平可以通过向含该启动子的细胞添加相关代谢物进行下调。例如,可以使用添加葡萄糖下调处于Lac启动子控制下的基因产物的表达。
密码子使用—细菌细胞和例如哺乳动物细胞相对其用于编码某个氨基酸的密码子具有“偏好”。例如,细菌细胞最常见使用CGU密码子编码精氨酸,而真核细胞最常见使用AGA。通过采用包含所采用的表达载体的多个较低偏好性的密码子的DNA序列可以降低诸如TCR α或β链等基因产物的表达水平.
与上述下调基因产物表达相关的详细描述可以参见Glass1982年所著的《基因功能—大肠杆菌及其遗传元素》(Gene Function-E.coli and its heritableelements,Croom Helm)以及Rezinoff 1980年所著《操纵子》第2版(The Operon 2ndEdition,Cold Spring Harbor Laboratory)。
同样已知,为细菌培养物提供相对高浓度的糖(诸如蔗糖)可以提高可溶蛋白的周质表达水平(参见例如Sawyer等,(1994)Protein Engineering 7(11)1401-1406)。
表达以后,scTCR多肽可变结构域序列的正确配对优选地由scTCR的胞外恒定结构域中二硫键的导入进行辅助。不受理论限制,相信在折叠过程中新的二硫键为scTCR提供额外的稳定性,从而有助于第一和第二片段的正确配对。
同样如上面提到的,对于dTCR噬菌体展示而言,dTCR多肽对之一最终如单体多肽展示在噬菌体一样表达,并且dTCR多肽对的另一条链在相同的宿主细胞中共表达。随着噬菌体颗粒自聚合,所述两条多肽自我连接如二聚体展示在噬菌体上。此外,在本发明这一方面的优选实施方案中,多肽对连接过程中的正确折叠如上所述由恒定序列之间的二硫键进行辅助。具有链间二硫键的dTCR的噬菌体展示过程的进一步细节在这里的实施例部分说明。
另外,噬菌体展示的dTCR的第一条链可以首先表达,以及第二条链多肽可以在随后的步骤中与表达的噬菌体接触,从而在噬菌体表面连接为功能性dTCR。
核糖体展示是用于生物淘选以鉴别具有如针对目标肽-MHC复合物高特异性等需要性质的TCR的优选的体外TCR展示方法。首先,使用上述技术构建了编码突变的scTCR或dTCR多肽的多样性阵列的DNA文库。DNA文库随后与RNA聚合酶接触以产生互补的mRNA文库。可选择地,对于mRNA展示技术来说,mRNA序列随后可以与包括嘌呤霉素结合位点的DNA序列连接。这些遗传构件随后在允许所述scTCR多肽或dTCR对的第一多肽翻译的条件下与核糖体体外接触。在dTCR的情况下,多肽对的第二多肽独立表达并与核糖体展示的第一多肽接触,为了两条链的结合,优选地由恒定结构域之间二硫键的形成进行辅助。另外,编码TCR两条链的mRNA可以在允许TCR链翻译的条件下与核糖体体外接触,由此形成了展示dTCR的核糖体。这些展示scTCR或dTCR的核糖体随后可以用于筛选或测试以鉴别具有特异性增强特性的TCR变体。随后可以分离任何具有增强特性的颗粒。编码这些TCR的mRNA随后可以使用逆转录酶转换成互补的DNA序列。该DNA随后可以通过PCR进行扩增并确定其序列。
其它方面
本发明的展示一种scTCR或一种dTCR(优选地由对应于人的序列的恒定和可变序列组成)的蛋白质颗粒可以以充分纯净的形式或以纯化的或分离的制剂的形式提供。例如,可以以与其他蛋白质充分分离的形式提供。
本发明的展示多种scTCR或多种dTCR的噬菌体颗粒可以以多价复合物的形式提供。因而,本发明在一个方面提供了多价T细胞受体(TCR)复合物,该复合物包括如这里所述的展示多种scTCR或dTCR的噬菌体颗粒。所述多种scTCR或dTCR的每一种优选地是相同的。
本发明的进一步方面提供了检测TCR配体复合物的方法,该方法包括:
a.提供了本发明的一种展示TCR的蛋白质颗粒;
b.将展示TCR的噬菌体与假定的配体复合物接触;以及
检测展示TCR的蛋白质颗粒与假定的配体复合物的结合。
适于由以上方法鉴别的TCR配体包括但不限于肽-MHC复合物。
具有增强特性的TCR变体的分离
本发明的进一步的方面是鉴别具有特定特性的TCR的方法,所述方法包括展示在蛋白质颗粒上的TCR的多样性文库经受选出所述特性的选择过程,以及分离展示具有所述特性的TCR的蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒,和/或测量所述特性的筛选过程,鉴别那些展示具有所需特性的TCR的蛋白质颗粒并且分离这些蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒。
随后可以获得编码变体TCR的DNA序列并通过PCR进行扩增以测定序列。可以增强的特性包括但不限于配体结合亲和力和构件稳定性。
筛选用途
本发明的展示TCR的蛋白质颗粒能在为鉴别包括TCR介导的细胞免疫突触的抑制剂在内的调节剂而设计的筛选方法中采用。
如精通本领域的人员所知,存在多种为此类蛋白质之间相互作用筛选提供适当基础的测试形式。
如AlphaScreenTM的增强型发光亲近匀相测定系统(Amplified LuminescentProximity Homogeneous Assay systems),依赖于用一层能结合受体与配体蛋白的水凝胶包被的“供体”和“受体”小珠的使用。这些受体与配体分子之间的相互作用将这些小珠拉近。当这些小珠遭受激光时,“供体”小珠中的光敏剂将周围的氧转变成更激化的单线状态。单线态的氧分子扩散以与“受体”小珠中的化学发光剂反应,这进一步激活包含在该小珠中的荧光团。荧光团随后发射520-620nm的光,这是受体-配体已发生相互作用的信号。受体-配体相互作用的抑制剂的存在导致这一信号减弱。
表面等离子体谐振(Surface Plasmon Resonance,SPR)是一种临界面光学测定法,其中一种结合伴侣(通常是受体)固定在“芯片”(传感器表面)并检测另一种可溶的并流经芯片表面的结合伴侣(通常是配体)的结合。配体的结合导致芯片表面附近蛋白浓度的提高,这引起该区域中折射系数的改变。芯片表面的构成使折射系数的改变可以通过表面等离子体谐振检测,表面等离子体谐振是一种光学现象,由此以一定入射角照射在金属薄层上的光由于振荡的表面电荷密度(表面等离子体)波的谐振激励产生强度降低的反射光束。谐振对金属膜远侧的折射系数改变极其敏感,并且这是用于检测固定的和可溶的蛋白之间结合的信号。允许方便使用分子相互作用的SPR检测和数据分析的系统有商业现货。实例是IasysTM装置(Fisons)和BiacoreTM装置。
其他的临界面光学测定法包括Woodbury和Venton在J.Chromatog.B.725113-137(1999)中更详细描述的全内反射荧光(TIRF)、共振镜(RM)和光栅耦合传感器(GCS)。亲近闪烁检测(SPA)已被用于为CD28和B7之间低亲和力相互作用的抑制剂(Kd约为4μM(Van der Merwe等,J.Exp.Med.185:393-403(1997),Jenh等,AnalBiochem 165(2)287-93(1998))而筛选化合物库。SPA是一种利用来自某些放射性同位素的β射线将能量传输给固定在指示器表面的闪烁体的放射性测定法。溶液中β粒子的短传输距离保证了只有当β粒子在极其接近的范围内发射给闪烁体才会发生闪烁。当用于蛋白质之间相互作用时,一种相互作用伴侣用放射性同位素标记,而另一种或与包含闪烁体的小珠结合,或与闪烁体共同包被在表面。如果该测定法可以最优设置,放射性同位素应与闪烁体足够接近以使只有当两种蛋白质之间发生结合时光子发射才被激活。
本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用的抑制剂的方法,该方法包括在待测化合物存在或不存在的条件下将展示TCR的蛋白质颗粒与TCR结合配体接触,以及确定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合,这样的降低认为鉴别了一种抑制剂。
本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体(例如MHC-肽复合物)之间相互作用的潜在抑制剂的方法,该方法包括将展示TCR的蛋白质颗粒或TCR结合配体伴侣与待测化合物接触,以及确定待测化合物是否结合展示TCR的蛋白质颗粒和/或TCR结合配体,这样的结合认为鉴别了一种潜在抑制剂。本发明的这一方面可以在诸如使用BiacoreTM系统进行的那些临界面光学测定法中得到特定的应用。
高亲和性TCR
本发明也提供了具有针对特定TCR配体比野生型TCR更高亲和性的突变的TCR。预计这些高亲和性TCR对于疾病的诊断和治疗具有特殊用途。
如这里所使用的术语“高亲和性TCR”是指与具体TCR配体相互作用并且如通过表面等离子体谐振测量的具有针对所述TCR配体的Kd值小于相应的天然TCR的Kd值、或如通过表面等离子体谐振测量的具有针对所述TCR配体的消耗速率(off-rate,Koff)小于相应的天然TCR的消耗速率的突变的scTCR和dTCR。
本发明的高亲和性scTCR或dTCR优选地是相对于天然TCR在至少一个互补决定区和/或骨架区发生突变。
在本发明的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是肽-MHC复合物(pMHC)。
本发明的另一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是MHC类别。
本发明的进一步的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2 tax肽(LLFGYPVYV)(SEQ ID 21)复合物。
本发明的进一步的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2 NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物。
高亲和性scTCR或高亲和性dTCR链的一条或两条链可以用造影化合物(例如适于诊断目的的标记物)标记。这样的经标记的高亲和性TCR在用于检测选自CD-1抗原复合物、细菌超抗原以及MHC-肽/超抗原复合物的TCR配体的方法中是有用的,该方法包括将TCR配体与该配体特异的高亲和性TCR(或多体高亲和性TCR复合物)接触;以及检测与所述TCR配体的结合。在四聚高亲和性TCR复合物中(例如使用生物素化的异源二聚体形成)可以使用荧光链亲和素(商业现货)来提供可检测的标记。荧光标记的四聚体适于在FACS分析中使用,例如用以检测携带高亲和性TCR对其具有特异性的肽的抗原提呈细胞。
可以对本发明的可溶性高亲和性TCR进行检测的另一种方式是通过TCR特异性抗体,尤其是单克隆抗体的使用。存在多种商业提供的抗TCR抗体,如αF1和βF1,它们分别识别α和β链的恒定结构域。
另外或此外,本发明的高亲和性TCR(或其多价复合物)可以与一种治疗性物质(例如,用于杀伤细胞的毒性部分,或如白介素或细胞因子的免疫激活物质)相连(例如共价或其他方式连接)。本发明的多价高亲和性TCR复合物与非多体的野生型或高亲和性的TCR异源二聚体相比,可以具有增强的与TCR配体结合的能力。因而,按照本发明的多价高亲和性TCR复合物对于提呈特定抗原细胞的体内或体外跟踪或靶向特别有用,并且可用作产生进一步具有这样用途的多价高亲和性TCR复合物的中间体。因此,高亲和性TCR或多价高亲和性TCR复合物可以作为体内使用的制药上允许的配方提供。
本发明也提供了一种向靶细胞递送治疗性物质的方法,该方法包括在允许所述高亲和性TCR或多价高亲和性TCR复合物与所述靶细胞结合的条件下,将潜在的靶细胞与按照本发明的高亲和性TCR或多价高亲和性TCR复合物接触,所述高亲和性TCR或多价高亲和性TCR复合物是TCR配体特异的并且具有与其相连的治疗性物质。
尤其,可溶的高亲和性TCR或多价高亲和性TCR复合物可以用于向提呈特定抗原细胞的位置递送治疗性物质。这在多种情况下,尤其在对抗肿瘤时,可能是有用的。治疗性物质可以这样进行递送以使其局部行使其作用而不是仅作用于其结合的细胞。这样,设想了一种与肿瘤特异性高亲和性TCR或多价高亲和性TCR复合物相连的抗肿瘤分子的特殊策略。
许多治疗性物质可以用于这一用途,例如放射性化合物、酶(例如穿孔素)或化疗物质(例如顺铂)。为确保在所需位置发挥毒性作用,毒素可以位于与链亲和素相连的脂质体内部,这样该化合物被缓慢释放。这能防止体内运输过程中的破坏作用并确保在TCR与相关抗原提呈细胞结合之后毒素具有最大作用。
其他适当的治疗性物质包括:
·小分子细胞毒物质,即分子量小于700Da的具有杀伤哺乳动物细胞能力的化合物。这样的化合物也可以包括具有细胞毒作用的有毒金属。此外,需要理解,这些小分子细胞毒物质也包括前药,即在生理条件下分解或转化以释放细胞毒物质的化合物。这样的物质的例子包括顺铂、美登素衍生物、雷可霉素(rachelmycin)、刺孢霉素(calicheamicin)、多西他赛、依托泊苷、吉西他滨、异环磷酰胺、依立替康、美法仑、米托葸醌、卟非姆钠光敏素II(porfimer sodium photofrin II)、替莫唑胺(temozolmide)、托泊替康、三甲曲沙葡糖醛酸脂(trimetrexate glucuronate)、auristatin E长春新碱(auristatin E vincristine)以及阿霉素;
·细胞毒素肽,即具有杀伤哺乳动物细胞能力的蛋白质或其片段。例子包括蓖麻毒素、白喉毒素、假单胞菌细菌外毒素A、DNA酶和RNA酶;
·放射性核素,即衰变并同时发射一个或多个α或β粒子或γ射线的元素的不稳定同位素。例子包括碘131、铼186、铟111、钇90、铋210和213、锕225以及砹213;螯合剂可以用于促进这些放射性核素与高亲和性TCR或其多聚体的结合;
·前药,如抗体引导的酶前药;
·免疫刺激剂,即刺激免疫反应的部分。例子包括如IL-2、如IL-8、血小板因子4、黑素瘤生长刺激蛋白的趋化因子等等的细胞因子,抗体或其片段,补体激活因子,异种蛋白结构域,异源蛋白结构域,病毒/细菌蛋白结构域以及病毒/细菌肽。
本发明的可溶高亲和性TCR或多价高亲和性TCR复合物可以与能将前药转变为药物的酶连接。这使得该前药只在需要的位置转变为药物(即由sTCR靶向的)。
多数疾病的治疗可以通过经可溶高亲和性TCR特异性的药物局部化得到潜在地增强。例如,预计这里所公开的高亲和性HLA-A2-tax(LLFGYPVYV)(SEQ ID 21)特异的A6 TCR可以在HTLV-1的诊断和治疗方法中运用,并且这里所公开的高亲和性HLA-A2-NY-ESO(SLLMITQC)(SEQ ID 22)特异的NY-ESO TCR可以在癌症的诊断和治疗方法中运用。
存在药物的病毒性疾病(例如HIV、SIV、EBV、CMV)可能得益于在感染细胞附近释放或激活的药物。对于癌症来说,肿瘤或肿瘤转移附近的定位能增强毒素或免疫刺激剂的作用。在自身免疫病中,免疫抑制药物可以缓慢释放,这样具有在更长的时间跨度上更加局部性的作用而对主体的整体免疫能力影响最小。在防止移植排斥的情况下,免疫抑制药物的作用能以同样方式进行优化。对于疫苗递送而言,疫苗抗原可以局限在抗原提呈细胞附近,从而增强抗原的功效。该方法也可以应用于造影目的。
本发明的可溶高亲和性TCR可以通过与特异TCR配体结合并从而抑制T细胞活化用于调节T细胞活化。涉及T细胞介导的炎症和/或组织损伤的自身免疫病(例如I型糖尿病)可能可以按照这一方法处理。为了这一应用,需要由相关pMHC提呈的特异肽表位的知识。
按照本发明的治疗性或造影的高亲和性TCR通常作为通常应包括制药上允许的载体的无菌的药物组合物的一部分提供。该药物组合物可以是任何适当的形式的(取决于对患者给药所需要的方法)。它可以以单位剂量的形式(通常应在密封容器中提供)和作为试剂盒的一部分提供。这样的试剂盒通常会(虽然不是必须地)包括使用指南。它可以包括多个所述的单位剂量形式。
所述药物组合物可以适合于通过任何适宜的途径给药,例如注射、透皮或通过吸入,优选地是注射(包括皮下注射、肌肉注射或最优选地静脉内注射)途径。这样的组合物可以通过任何药剂学领域内已知的方法进行制备,例如通过在无菌条件下将活性组分与载体或赋形剂混合。
依赖于需要治疗的疾病或机能紊乱、需要治疗的个体的年龄和健康状况等等因素,本发明的物质的剂量可以在广阔的范围内变化,并且医生应该最终决定使用的适当剂量。
本发明也提供了获得高亲和性TCR链的方法,该方法包括在引起高亲和性TCR链表达的条件下孵育这样的宿主细胞并随后分离多肽。
本发明的每个方面的优选的特征正如对每个其他方面作必要改动。这里提到的在先技术文献结合在法律许可的最完整的范围内。
实施例
在以下实施例中进一步描述了本发明,这些实施例未以任何方式限制本发明的范围。
下面对附图进行了说明,其中:
图1a和1b分别表示突变以引入半胱氨酸密码子的可溶的A6 TCR α链和β链的核酸序列。阴影表示引入的半胱氨酸密码子。
图2a表示包含用于产生新的链间二硫键的T48→C突变(加下划线的)的A6 TCR α链胞外氨基酸序列,图2b表示包含用于产生新的链间二硫键的S57→C突变(加下划线的)的A6 TCR β链胞外氨基酸序列。
图3描述了将TCR α和β链克隆进噬菌粒载体。图表描述了噬菌体展示载体。RSB是核糖体结合位点。S1或S2是用于将蛋白质分泌到大肠杆菌周质中的信号肽。星号*表示翻译终止密码子。TCR α链或β链的任何一条链可以与噬菌体外被蛋白融合,虽然所述图表中只有TCR β链与噬菌体外被蛋白融合。
图4详述了噬菌粒pEX746:A6的DNA序列。
图5细菌外被蛋白与异源二聚A6 TCR的噬菌体颗粒融合蛋白在大肠杆菌中的表达。异源二聚A6 TCR:gIII的融合蛋白使用免疫印迹检测。噬菌体颗粒由大肠杆菌XL-1-Blue制备并用PEG/NaCl浓缩。样品加载在还原或非还原加样缓冲液中。泳道1是含正确序列克隆7的样品,泳道2是在α链编码基因中含缺失的克隆14的样品。异源二聚A6 TCR:gIII融合蛋白在125kDa处检得。
图6说明了展示在噬菌体上的异源二聚A6 TCR的pMHC肽复合物结合活性的ELISA检测。克隆7特异性结合HLA A2-Tax复合物。克隆14不能结合任何pMHC,因为没有TCR与该噬菌体颗粒结合。
图7a单链A6 TCR-C-κ DNA核糖体展示构件的示意性图解。
图7b和7c分别详述了pUC19中编码的单链A6 TCR-C-κ DNA核糖体展示构件的完整的DNA编码链和氨基酸序列。
图8详述了pUC19-T7的DNA序列。
图9详述了克隆到pUC19-T7中的单链A6 TCR-C-κ DNA核糖体展示构件的DNA序列。
图10显示通过使用Ambion兔网状细胞溶解产物的体外翻译的单链A6 TCR-C-κ检测的免疫印迹。
图11得自核糖体展示反应的小珠上的单链A6 TCR-C-κ mRNA的RT-PCR。
图12a详述了A6 TCR克隆9突变的β链的DNA序列;突变的核酸用粗体表示。
图12b详述了A6 TCR克隆9突变的β链的氨基酸序列,对应于引入的乳白终止密码子的位置用星号*表示。
图13详述了A6 TCR克隆49突变的β链的DNA序列;突变的核酸用粗体表示。由于这是一种“沉默”突变,最终的氨基酸序列中没有由这一突变引入变化。
图14a详述了A6 TCR克隆134突变的A6 TCR β链的DNA序列;突变的核酸用粗体表示。
图14b详述了通过BIAcore测定法检测的A6 TCR克隆134突变的A6 TCR β链的氨基酸序列;突变的氨基酸用粗体表示。
图14c详述了通过噬菌体ELISA测定法检测的A6 TCR克隆134突变的A6 TCR β链的氨基酸;突变的氨基酸用粗体表示。
图15A6 TCR克隆134与HLA-A2 Tax和HLA-A2 NY-ESO结合的BIAcore数据。
图16用于测定A6 TCR克隆134与HLA-A2 Tax结合的Toff的BIAcore数据。
图17a和17b分别表示NY-ESO TCR的突变的α和β链的DNA序列。
图18a和18b分别表示NY-ESO TCR的突变的α和β链的氨基酸序列。
图19a和19b分别详述了组合在pEX746:NY-ESO噬菌粒中的NY-ESO TCR β链的DNA和氨基酸序列。
图20表示在噬菌体ELISA测定法中展示NY-ESO TCR的噬菌体颗粒与HLA-A2-NY-ESO的特异结合。
图21表示并入编码与DRA0101序列3’端相连的Fos二聚化肽的密码子的DR1α链的DNA序列。阴影表示Fos密码子并且生物素化标签密码子用粗体表示。
图22表示Sf9昆虫细胞中用于II类HLA-肽复合物表达的pAcAB3双顺反子载体的DNA序列。用于插入HLA α链的Bgl II限制性位点(AGATCT)和用于插入HLA β链的BamH I限制性位点(GGATCC)用阴影表示。
图23表示并入编码与DRB0401序列3’端相连的Jun二聚化肽的密码子和编码与DRB0401序列5’端相连的HLA-荷肽密码子的DR1 β链的DNA序列。阴影表示Jun密码子,HLA-荷载的Flu HA肽密码子用下划线表示。
图24表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪:
流动池1(FC1)-空白
流动池2(FC2)-HLA-A2(LLGRNSFEV)(SEQ ID 23)
流动池3(FC3)-HLA-A2(KLVALGINAV)(SEQ ID 24)
流动池4(FC4)-HLA-A2(LLGDLFGV)(SEQ ID 25)
图25表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪:
流动池1(FC1)-空白
流动池2(FC2)-HLA-B8(FLRGRAYGL)(SEQ ID 26)
流动池3(FC3)-HLA-B27(HRCQAIRKK)(SEQ ID 27)
流动池4(FC4)-HLA-Cw6(YRSGIIAVV)(SEQ ID 28)
图26表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪:
流动池1(FC1)-空白
流动池2(FC2)-HLA-A24(VYGFVRACL)(SEQ ID 29)
流动池3(FC3)-HLA-A2(ILAKFLHWL)(SEQ ID 30)
流动池4(FC4)-HLA-A2(LTLGEFLKL)(SEQ ID 31)
图27表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪:
流动池1(FC1)-空白
流动池2(FC2)-HLA-DR1(PKYVKQNTLKLA)(SEQ ID 32)
流动池3(FC3)-HLA-A2(GILGFVFTL)(SEQ ID 33)
流动池4(FC4)-HLA-A2(SLYNTVATL)(SEQ ID 34)
图28表示高亲和性A6 TCR克隆134与如以下包被的流动池结合的BIAcore示踪:
流动池1(FC1)-空白
流动池4(FC4)-HLA-A2(LLFGYPVYV)(SEQ ID 21)
图29a和29b表示可溶高亲和性NY-ESO TCR和HLA-A2 NY-ESO之间相互作用的Biacore图。
图30a和30b表示可溶“野生型”NY-ESO TCR和HLA-A2 NY-ESO之间相互作用的Biacore图。
图31a和31b表示突变体可溶A6 TCR(克隆1)与HLA-A2 Tax之间相互作用的Biacore图。
图32a和32b表示突变体可溶A6 TCR(克隆111)与HLA-A2 Tax之间相互作用的Biacore图。
图33a和33b表示突变体可溶A6 TCR(克隆89)与HLA-A2 Tax之间相互作用的Biacore图。
图34表示突变体可溶A6 TCR(包括克隆71和克隆134突变)与HLA-A2 Tax之间相互作用的Biacore图。
图35表示突变体可溶A6 TCR(包括克隆1和βG102→A突变)与HLA-A2 Tax之间相互作用的Biacore图。
图36a到36c表示突变体可溶A6 TCR(包括克隆89和克隆134突变)与HLA-A2 Tax之间相互作用的Biacore图。
图37a和37b表示突变体可溶A6 TCR(包括克隆71和克隆89突变)与HLA-A2 Tax之间相互作用的Biacore图。
图38详述了以下A6 TCR克隆的β链可变结构域氨基酸序列:
38a-野生型,38b-克隆134,38c-克隆89,38d-克隆1以及38e-克隆111
突变的残基用粗体表示,等同的残基是可以存在于特定位置的另外残基。
图39A和39B I
实施例1-A6 Tax TCRα和β链的引物设计和诱变以引入形成新的链间二硫键所需的半胱氨酸残基
为了将TRAC*01中外显子1的A6 Tax苏氨酸48突变成半胱氨酸,设计了以下引物(突变用小写字母表示):
5’-C ACA GAC AAA tgT GTG CTA GAC AT(SEQ ID 35)
5’-AT GTC TAG CAC Aca TTT GTC TGT G(SEQ ID 36)
为了将TRBC1*01和TRBC2*01中外显子1的A6 Tax丝氨酸57突变成半胱氨酸,设计了以下引物(突变用小写字母表示):
5’-C AGT GGG GTC tGC ACA GAC CC(SEQ ID 37)
5’-GG GTC TGT Gca GAC CCC ACT G(SEQ ID 38)
PCR诱变
分别使用α链引物或β链引物,如以下所述对含A6 Tax TCR α或β链基因的表达质粒进行突变。
将100纳克质粒与5微升10mM dNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H2O将终体积调节到240微升。将48微升该混合物中添加终浓度稀释为0.2μM的引物使最终反应体积达到50微升。最初95℃ 30秒的变性步骤之后,反应混合物在Hybaid PCR express PCR仪上进行15个变性(95℃,30秒)、退火(55℃,60秒)与延伸(73℃,8分钟)循环。随后产物用10单位DpnI限制性酶(New England Biolabs)在37℃消化5小时。10微升消化的反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨,16克/升酵母提取物,5克/升NaCl,2.5克/升K2HPO4,100毫克/升氨苄青霉素)中生长过夜。按照生厂商的说明书在Qiagen mini-prep柱上纯化质粒DNA并在牛津大学生物化学系的测序设备上通过自动化测序检验其序列。图1a和2a分别表示α链的突变核酸和氨基酸序列,图1b和2b分别表示β链的突变核酸和氨基酸序列。
实施例2-噬菌体展示载体的构建以及将A6 TCRα和β链克隆进该噬菌粒载体
为了在丝状噬菌体颗粒上展示含非天然链间二硫键的异源二聚A6 TCR,构建了噬菌粒载体以表达由含非天然链间二硫键的异源二聚A6 TCR和噬菌体外被蛋白构成的融合蛋白。这些载体包含一个pUC19起始点、一个M13起始点、一个bla(氨苄青霉素抗性)基因、Lac启动子/操纵子和一个CAP结合位点。图3中概述了这些载体的设计,该图除了可溶的A6 TCR α链之外,描述了编码A6 TCR β链-g3或A6 TCR β链-g8融合蛋白的载体。实施例1中制备的并如图1a和1b中所示的含并入形成新的链间二硫键所需的附加半胱氨酸残基突变的A6 TCR α和β链用作产生编码该TCR的噬菌粒的A6 TCR α和β链的来源。图4中表示了所采用的噬菌粒结构(pEX746)的完整DNA序列。
J.Sambrook和D.W.Russell所著的《分子克隆:实验室手册》(Molecularcloning:A laboratory manual)中描述了构建载体的分子克隆方法。
表1中列举的引物被用于所述载体的构建。PCR程序的一个例子是94℃ 2分钟1个循环,随后94℃ 5秒、53℃ 5秒和72℃ 90秒25个循环,随后72℃ 10分钟1个循环,以及随后4℃保温。Expand High Fidelity Taq DNA聚合酶购自Roche。
表1 用于构建A6 TCR噬菌体展示载体的引物
引物名称 序列5’到3’
YOL1  TAATAATACGTATAATAATATTCTATTTCAAGGAGACAGTC(SEQ ID 39)
ZOL2  CAATCCAGCGGCTGCCGTAGGCAATAGGTATTTCATTATGACTGTCTCCTTGAAATAG(SEQ ID 40)
YOL3  CtaCGGCAGCCGCTGGATTGTTATTACTCGCGGCCCAGCCGGCCATGGCccag(SEQ ID 41)
TOL4  GTTCTGCTCCACTTCCTTCTGGGCCATGGCCGGCTGGGCCG(SEQ ID 42)
TOL5  CAGAAGGAAGTGGAGCAGAAC(SEQ ID 43)
TOL6  CTTCTTAAAGAATTCTTAATTAACCTAGGTTATTAGGAACTTTCTGGGCTGGGGAAG(SEQ ID 44)
YOL7  GTTAATTAAGAATTCTTTAAGAAGGAGATATACATATGAAAAAATTATTATTCGCAATTC(SEQ ID 45)
TOL8  CGCGCTGTGAGAATAGAAAGGAACAACTAAAGGAATTGCGAATAATAATTTTTTCATATG(SEQ ID 46)
TOL9  CTTTCTATTCTCACAGCGCGCAGGCTGGTGTCACTCAGAC(SEQ ID 47)
YOL10  ATGATGTCTAGATGCGGCCGCGTCTGCTCTACcccaggcctc(SEQ ID 48)
YOL11  GCATCTAGACATCATCACCATCATCACTAGACTGTTGAAAGTTGTTTAGCAAAAC(SEQ ID 49)
TOL12  CTAGAGGGTACCTTATTAAGACTCCTTATTACGCAGTATG(SEQ ID 50)
实施例3-细菌外被蛋白和异源二聚A6 TCR的融合蛋白在大肠杆菌中的表达
为了验证实施例2中产生的构件,使用先前所述用于产生展示抗体scFv的噬菌体(Li等,2000,Journal of Immunological Methods 236:133-146)及后续改进制备展示含非天然链间二硫键的A6 TCR噬菌体颗粒。含pEX746:A6噬菌粒(即编码可溶A6 TCR α链和按实施例2中所述产生的与噬菌体gIII蛋白融合的A6 TCR β链的噬菌粒)的大肠杆菌XL-1-Blue细胞用于接种5毫升Lbatg(含100微克/毫升氨苄青霉素,12.5微克/毫升四环素和2%葡萄糖的Lennox L培养基),随后培养物37℃振荡培养过夜(16小时)。50微升过夜培养物用于接种5毫升TYPatg(TYP是16克/升蛋白胨、16克/升酵母提取物、5克/升NaCl和2.5克/升K2HPO4),随后培养物37℃振荡培养直到OD600nm=0.8。向培养物添加辅助噬菌体M13 K07至终浓度5×109cfu/ml。然后培养物37℃静置孵育30分钟并随后200rpm振荡另外30分钟。随后将上述培养物的培养基换成TYPak(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素的TYP),随后培养物25℃ 250rpm振荡培养36到48小时。随后培养物4℃ 4000rpm离心30分钟。上清经0.45微米针筒过滤器过滤并4℃保存用于进一步的浓缩或分析。
上清液中丝状外被蛋白和含非天然链间二硫键的异源二聚A6 TCR的融合蛋白通过免疫印迹进行检测。还原和非还原加样缓冲液中约1011cfu噬菌体颗粒加载于SDS-PAGE凝胶的每个泳道上。分离的蛋白用抗M13 gIII单克隆抗体进行一抗标记,随后用与辣根过氧化物酶(HRP)偶联的二抗标记。随后用Bio-Rad的Opti-4CN底物试剂盒检测HRP活性(图5)。这些数据表明二硫键连接的A6 TCR克隆1是与丝状噬菌体外被蛋白(gIII蛋白)融合的。
实施例4-丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚A6 TCR的检测
使用噬菌体ELISA方法检测展示在噬菌体颗粒上的功能性(HLA-A2-tax结合的)A6TCR的存在。
TCR-噬菌体ELISA
ELISA中展示A6 TCR的噬菌体颗粒与固定的肽-MHC的结合用初级兔抗fd抗血清(Sigma)随后用与抗兔单克隆抗体偶联的碱性磷酸酶(AP)(Sigma)检测。平板上非特异蛋白结合位点可以用2% MPBS或3% BSA-PBS封闭。
材料与试剂
1.包被缓冲液,PBS
2.PBS:138mM NaCl,2.7mM KCl,10mM Na2HPO4,2mM KH2PO4
3.MPBS,3% marvel-PBS
4.PBS-Tween:PBS,0.1% Tween-20
5.底物溶液,Sigma FAST pNPP,目录号N2770
方法
1.NeutrAvidin亲和素包被的反应池用PBS清洗两次。
2.添加25微升浓度为10微升/毫升的生物素-HLA-A2 Tax或生物素-HLA-A2NYESO,并在室温下孵育30到60分钟。
3.反应池用PBS清洗两次。
4.添加300微升3%MPBS,并室温孵育1小时。将TCR-噬菌体悬液与等体积的3%MPBS混合并室温孵育。
5.反应池用PBS清洗两次。
6.添加25微升噬菌体-A6 TCR/MPBS混合物,冰浴1小时。
7.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。
8.添加25微升冰冷的1∶1000稀释于MPBS的兔抗fd抗体,并且冰浴1小时。
9.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。
10.添加25微升冰冷的1∶50,000稀释于MPBS的抗兔单克隆抗体-碱性磷酸酶偶合物,并且冰浴1小时。
11.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。
12.向每个反应池添加150微升碱性磷酸酶黄并在405纳米处读取信号。
图6中展示的结果说明,克隆1产生了展示能特异性结合其同类pMHC(HLA-A2 Tax)的A6 TCR的噬菌体颗粒。
对该展示的A6 TCR的DNA序列分析显示在TCR β链中存在在相应的实施例2的表达载体构件序列中不存在的“乳白”终止密码子。该密码子能被所采用的大肠杆菌菌株的核糖体以低频率“读通”,导致在这一位置上插入色氨酸残基以及全长β链表达水平的显著降低。由这一现象推断,只有表达这一突变的A6 TCR序列的细胞在实施例3的培养循环中得以存活,并且因此预计由原始表达载体表达的A6 TCR的高水平对宿主细胞来说是有毒的。
实施例5-单链TCR(scTCR)核糖体展示
用以产生核糖体展示PCR模板的核糖体展示scTCR载体的构建
为产生没有错误并稳定的DNA PCR模板以由此进行随后的核糖体展示实验,将核糖体展示构件克隆到易于获得的DNA质粒pUC19中。载体构建分两步进行以避免使用大的寡核苷酸引物(及与其相关的错误问题)。图7a中显示了示意形式的最终的A6scTCR-C-κ DNA核糖体展示构件并且图7b中显示了其DNA和蛋白序列。这一构件可以作为PstI/EcoRI双酶切消化产物从pUC19上切离。
J.Sambrook和D.W.Russell所著《分子克隆:实验室手册》中描述了构建载体的分子克隆方法。
表2中列举的引物用于所述载体的构建。所采用的PCR程序如下:94℃ 2分钟1个循环,随后94℃ 30秒、55℃ 20秒以及72℃ 120秒25个循环,随后72℃ 5分钟1个循环,以及随后4℃保温。Pfu DNA聚合酶购自Strategene。表2中描述了使用的寡核苷酸引物。
构建pUC19-T7-步骤1
下面描述了pUC19-T7的构建,这导致形成含有跟随有短的间隔区域和最适的真核Kozak序列的一个T7启动子区的pUC19载体。由于这对于兔网状细胞溶解物中任何附着序列的转录启动来说是必需的,这成为核糖体展示构件的基础部分。用于核糖体展示的序列(如A6 scTCR-C-κ)可以连接在pUC19-T7载体的Nco I和EcoR I限制性位点之间。
通过将反应物加热到94℃ 10分钟并缓慢冷却到室温,对等摩尔量的反向连接(Rev-Link)和正向连接(For-Link)进行退火。这导致形成如下所示的双链DNA复合物。
5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGG
CGTCGATTATGCTGAGTGATATCCTTGTCCGGTGGTACCCTAG 3’
(SEQ ID 51)
5’区包含突出的与Hind III限制性位点互补的粘末端,而3’区包含与BamHI互补的粘末端。
退火的寡核苷酸连接到Hind III/BamHI双酶切的pUC19中,该质粒已经通过琼脂糖凝胶电泳纯化、切离以及用Qiagen胶提取试剂盒进一步纯化。连接产物转化大肠杆菌XL-1-Blue。单独的pUC19-T7克隆进行测序以证实正确序列的存在。图8中显示了该序列。
构建A6 scTCR-C-κ载体-步骤2
单链A6 scTCR-C-κDNA序列的构建要求产生必须随后组合成一个A6 scTCR-C-κ片段的3个PCR片段。这些片段包括(a.)5’区与NcoI位点邻接的A6 TCR α链可变结构域和3’区与BamHI限制性位点邻接的甘氨酸丝氨酸连接物部分。该产物用引物45和50(见表2)通过载体pEX202的常规PCR产生。片段(b.)5’区与BamHI限制性位点邻接的A6 TCR β可变结构域和恒定结构域,其后跟随着甘氨酸丝氨酸连接物部分。该产物用引物72和73(见表2)通过载体pEX207的常规PCR产生。片段(c.)用引物61-60(见表2)通过p147载体的常规PCR产生的人C-κ区的一部分。所有PCR产物在1.6% TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。
片段(b.)和(c.)通过其引物序列73和61(见表2)中的互补性通过常规的重叠PCR进行融合。PCR通过引物72和60(见表2)进行。PCR产物在1.6% TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。这一片段命名为(d.).
片段(a.)用NcoI和BamHI双酶切,而片段(d.)用BamHI和EcoRI双酶切。pUC19-T7用NcoI和EcoRI双酶切。所有酶切的DNA产物在1.2% TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。连接酶切的pUC19-T7、片段(a.)和(d.)并转化大肠杆菌XL-1-Blue。转化子测序以证实正确的序列。图9中显示了与PstI和EcoRI位点邻接的克隆到pUC19中的A6 scTCR-C-κ核糖体展示构件的序列。
表2 使用的寡核苷酸(购自MWG)
Rev-Link  5’GATCCCATGGTGGCCTGTTCCTATAGTGAGTCGTATTAGCTGC(SEQ ID 52)
For-Link  5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGG(SEQ ID 53)
45-A6  5’CCACCATGGGCCAGAAGGAAGTGGAGCAGAACTC(SEQ ID 54)
7 A6-Beta(RT-PCR)(a)  5’CGAGAGCCCGTAGAACTGGACTTG(SEQ ID 55)
49-A6-BamHI-F  5’GTGGATCCGGCGGTGGCGGGTCGAACGCTGGTGTCACTCAGACCCC(SEQ ID 56)
50-A6-BamHI-R  5’CCGGATCCACCTCCGCCTGAACCGCCTCCACCGGTGACCACAACCTGGGTCCCTG(SEQ ID 57)
60-Kappa-rev-EcoRI  5’CTGAGAATTCTTATGACTCTCCGCGGTTGAAGCTC(SEQ ID 58)
61-Betac-Kappa-forl  5’TGACGAATTCTGACTCTCCGCGGTTGAAGCTC(SEQ ID 59)
71 T7-引物  5’AGCTGCAGCTAATACGACTCACTATAGG(SEQ ID 60)
72 A6-beta  5’GGCCACCATGGGCAACGCTGGTGTCACTCAGACCCC(SEQ ID 61)
73-A6-cons-rev  5’TGAACCGCCTCCACCGTCTGCTCTACCCCAGGCCTCGGCG(SEQ ID 62)
75 Kappa-rev  5’TGACTCTCCGCGGTTGAAGCTC(SEQ ID 63)
通过体外转录翻译的sc A6 TCR-C-κ生产的说明
用于体外转录翻译的sc A6 TCR-C-κ PCR产物的制备
这里我们描述了在生物素化的赖氨酸存在的条件下通过体外转录翻译的sc A6TCR-C-κ的合成以及随后对其通过免疫印迹和用碱性磷酸酶标记的链亲和素检测的检测。
使用作为模板的sc A6 TCR-C-κ载体和引物71和60,在常规PCR反应中制备sc A6TCR-C-κ PCR产物。引物60包含终止密码子以使scTCR从核糖体上释放。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6% TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。使用目录号1280-1287的与Ambion PROTEINscript II连接的转录翻译试剂盒及300纳克上述PCR产物进行转录翻译反应。按照制造商的方案进行3个转录翻译反应。所作的改动是添加来自TranscendTM非放射性翻译检测系统的生物素化的赖氨酸。
反应1:存在2微升生物素化的赖氨酸的情况下,300纳克sc A6 TCR-C-κ的反应
反应2:不存在2微升生物素化的赖氨酸的情况下,300纳克sc A6 TCR-C-κ的反应
反应3:存在2微升生物素化的赖氨酸的情况下,无DNA的对照反应
2微升的每种反应物在4-20%的Novex梯度SDS-PAGE凝胶(Invitrogen)上分离。此外也分离了多种稀释度的对照生物素化TCR。将凝胶转印迹并用链亲和素碱性磷酸酶检测蛋白并按照TranscendTM非放射性翻译检测系统方案所述用针对碱性磷酸酶的Western Blue稳定型底物随后进行比色法显色。图10中显示了免疫印迹结果。
在无DNA对照和无生物素化赖氨酸的A6 scTCR-C-κ的反应物中,如所预期的没有发现接近正确大小的条带,而在存在生物素化赖氨酸的A6 scTCR-C-κ的反应物中,可以观察到近似正确大小的条带。这说明通过体外转录翻译的sc A6 TCR-C-κ TCR的合成。
sc A6 TCR-C-κ核糖体展示PCR产物的制备
使用作为模板的A6 scTCR-C-κ载体和PCR引物71和75(见表2)在常规PCR反应中制备了sc A6 TCR-C-κ PCR产物。引物75不包含终止密码子。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6% TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。
核糖体展示过程
sc A6 TCR-C-κ的转录和翻译
使用与Ambion PROTEINscript II连接的转录翻译试剂盒(目录号1280-1287)进行转录/翻译反应。
转录反应物
将下列转录反应物放置在0.5毫升的Ambion非粘性试管(目录号12350)中。
内容物                                  试管1(正常A6)                                        试管2(对照)
4.53微升 5.7微升
模板(PCR产物) sc A6 TCR-C-κ PCR产物1.17微升(300纳克) 无DNA
5×转录混合物 2微升 2微升
酶混合物 2微升 2微升
Superasin(Ambion RNA酶抑制剂) 0.3微升 0.3微升
终体积 10微升 10微升
所述试管在热盖关闭的PCR模块上30℃孵育60分钟。
翻译反应物
将下列翻译反应物放置在0.5毫升的Ambion非粘性试管中。
内容物                                   试管1(正常A6)                               试管2(对照)
网状细胞溶解物 105微升 105微升
25mM醋酸镁 3微升 3微升
翻译混合物 7.5微升 7.5微升
甲硫氨酸 7.5微升 7.5微升
18微升 18微升
Superasin(Ambion RNA酶抑制剂) 3微升 3微升
转录反应物 6微升上述试管1产物 6微升上述试管2产物
每个试管包含足够3次50微升挑选的体积。试管混合后在热盖关闭的PCR模块上30℃孵育60分钟。30分钟之后添加3单位不含RNA酶的RQ1 DNA酶(Promega)以降解试管1中最初的DNA模板,并在试管2中添加3单位不含RNA酶的RQ1 DNA酶(Promega)。60分钟之后向翻译反应物2添加18微升肝素溶液并向翻译反应物1添加18微升肝素溶液。冰浴保存样品以便于针对HLA包被的小珠进行选择。
磁珠的包被
20微升重悬的链亲和素磁珠(Roche目录号1641778)转移到无菌的不含RNA酶的1.5毫升eppendorf试管中。小珠用磁性颗粒分离器(Roche目录号1641794)固定并去除上清液。小珠随后用100微升不含RNA酶的1×PBS(10×PBS Ambion目录号9624,Ambion H2O目录号9930)清洗。总共进行了3次PBS清洗。
小珠在20微升PBS中重悬并将其平分到两个试管(每个10微升)。一个试管将用于产生对照封闭的小珠,另一个试管用于产生HLA-A2-Tax包被的小珠。
向对照小珠试管添加80微升BSA/生物素溶液并混合。BSA/生物素溶液配制如下。向990微升含0.1%BSA(Ambion超纯,目录号2616)的PBS添加10微升0.2M Tris碱0.1M生物素溶液。还添加了20微升肝素溶液(1×PBS中含138mg/ml肝素(Sigma))并混合溶液。小珠间歇混合室温孵育1小时。随后3次用100微升PBS清洗并在10微升含0.1%BSA的PBS中重悬。
HLA-TAX包被的小珠制备如下。向10微升小珠添加40微升HLA-A2-Tax(如WO99/60120中所述制备的1.15mg/ml)并混合。小珠室温孵育15分钟并随后添加20微升BSA(50mg/ml,Ambion目录号2616)和20微升肝素溶液(见上述)并混合。小珠孵育另外45分钟,随后添加20微升BSA/生物素溶液。随后小珠3次用100微升PBS清洗并在10微升含0.1%BSA的PBS中重悬。
使用磁珠的淘选
将sc A6 TCR翻译反应物分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠:
对照(无HLA)
HLA-A2-Tax
HLA-A2-Tax加10微克可溶的scA6 TCR
对照翻译反应物也分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠:
对照(无HLA)
HLA-A2-Tax
HLA-A2-Tax加10微克可溶的scA6 TCR
这产生了总共6个试管。试管在PCR模块上伴随间歇的混合5℃孵育60分钟。
随后3次用100微升冰冷的缓冲液(PBS,5mM醋酸镁和0.2%Tween(Sigma,不含RNA酶))清洗小珠。每份试样量小珠随后在50微升含1微升(40单位)Superasin和1微升(1单位)RQ1 DNA酶的1×RQ1 DNA酶消化缓冲液中重悬。小珠在PCR模块上30℃孵育30分钟。
随后小珠用100微升冰冷的缓冲液(PBS,5mM醋酸镁和0.2%Tween)清洗3次并用冰冷的H2O清洗1次。小珠重悬于10微升不含RNA酶的H2O。小珠随后进行冷藏以准备进行RT-PCR。
核糖体展示反应中获得的磁珠上的scA6 TCR-C-κ mRNA的RT-PCR
如制造商方案中所述,使用Titan单试管RT-PCR试剂盒(目录号1855476)进行磁珠上的RT-PCR反应。连同引物45和7以及0.3微升Superasin RNA酶抑制剂,每个RT-PCR反应中添加2微升磁珠。
为每个RT-PCR反应设置第二个单PCR反应,该反应的差别在于除了Roche高保真聚合酶不含逆转录酶。所述第二个反应作为对DNA污染的对照。此外使用sc A6TCR-C-κ载体的Ing设置了RT-PCR的阳性对照。
反应物循环如下。通过样品50℃孵育30分钟,随后通过在PCR模块上94℃孵育3分钟以灭活逆转录酶进行RT-PCR步骤。反应物如下共进行38个PCR循环:
94℃ 30秒
55℃ 20秒
68℃ 130秒
PCR反应72℃孵育4分钟结束。
在所有的核糖体展示步骤过程中非常注意以避免RNA酶污染。RT-PCR和PCR反应物在1.6%的TBE琼脂糖凝胶上分离,这可以参见图11。对凝胶的分析显示,不存在DNA污染并且所有PCR产物源自mRNA。泳道2中正确大小的DNA条带说明,通过HLA-A2-Tax包被的小珠选出了核糖体展示的sc A6 TCR-C-κ。泳道3显示,我们可以通过添加可溶的sc A6 TCR来抑制这一核糖体展示的sc A6 TCR-C-κ的特异性选择。相对于泳道2中未抑制的样品,泳道3中条带亮度的明显降低说明了这一点。对于对照的无HLA包被的小珠,没有发现核糖体展示的sc A6 TCR-C-κ的结合。
实施例6
展示在噬菌体颗粒上的A6 TCR的序列分析和提高展示特性的方法
通过PCR和分子克隆构建了在噬菌体上展示A6 TCR的载体之后,对能产生展示A6 TCR的噬菌体的细菌克隆如实施例4所述通过噬菌体ELISA进行筛选。在ELISA结合测定法中鉴定了3个与HLA-A2-tax结合的不同的克隆。这些克隆都包含了“野生型”A6 TCR DNA的或与调节序列相联的突变,下表中描述了这些突变:
得自对噬菌体展示的TCR A6筛选的功能性克隆
名称 特征
克隆7 位于vβ基因之前的第3个核糖体结合位点从A AGGAGA突变为A AGGGGA
克隆9 在vβ CDR3中引入一个乳白密码子 图12a和12b中的完整DNA和氨基酸序列
克隆49 在vβ FR1中引入一个琥珀密码子。这一突变引入了一个不影响最终氨基酸序列的“沉默”突变 图13a中的完整DNA序列
这些克隆都包含了似乎引起A6 TCR β链表达水平降低的突变。我们推测,作为由TCR高表达水平引起的细胞毒性的结果,低表达克隆优于高表达克隆被选择。
实施例7-A6 TCR CDR3区域的诱变
A6 TCR的CDR3区域是引入突变以研究产生高亲和性突变体的可能性的靶标。
使用了重叠PCR对α和β CDR3的序列进行改进以用寡核苷酸YOL54,5′CAGCTGGGGGAAGCTTCAGTTTGGAGCAG3′(SEQ ID 64)和YOL55,5′CTGCTCCAAACTGAAGCTTCCCCCAGCTG3′(SEQ ID 65)对α链引入唯一的限制性位点Hind III,并用YOL56 5′GTACTTCTGTGCCTCGAGGCCGGGACTAG3′(SEQID 66)和YOL57 5′CTAGTCCCGGCCTCGAGGCACAGAAGTAC3′(SEQ ID 67)对β链引入唯一的限制性位点Xho I。
使用了PCR以引入亲和力成熟的突变。A6 TCR克隆9(在β链CDR3序列中并入一个引入的乳白密码子)用作模板DNA的一个来源,并且TCR链用突变引物(在以下的表中进行了详述)和YOL22 5’CATTTTCAGGGATAGCAAGC3’(SEQ ID 68)(β链)或YOL135’TCACACAGGAAACAGCTATG3’(SEQ ID 69)(α链)进行扩增。
用于在A6 α和β链的CDR3中引入突变的引物
引物名称  5′→3′序列
YOL59  TGTGCCTCGAGGIMKNNKNNKNNKNNKNNKCGACCAGAGCAGTACTTCG(SEQ ID 70)
YOL60  TGTGCCTCGAGGCCGNNKNNKNNKNNKNNKNNKCCAGAGCAGTACTTCGGGC(SEQ ID 71)
YOL61  TGTGCCTCGAGGCCGNNKNNKNNKNWKNNKNNKCGACCAGAGCAGTACTTCG(SEQ ID 72)
YOL62  TGTGCCTCGAGGCCGNNKNNKNNKNWKNNKNNKGGAGGGCGACCAGAGCAG(SEQ ID 73)
YOL63  TGTGCCTCGAGGCCGGGANNKNNKNNKNNKNNKNNKGGGCGACCAGAGCAGTAC(SEQ ID 74)
YOL68  TGTGCCTCGAGGIMKNNKNNKNNKNNKNNKCCAGAGCAGTACTTCGggc(SEQ ID 75)
YOL69  TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKGAGCAGTACTTCGggccg(SEQ ID 76)
YOL70  TGTGCCTCGAGGNNKNNKNNKNNKNNKNNKCAGTACTTCGggccgggc(SEQ ID 77)
YOL71  TGTGCCTCGAGGccgNNKNNKNNKNNKgggCGACCAGAGCAGTACTTCG(SEQ ID 78)
YOL58  AAACTGAAGCTTMNNMNNMNNMNNMNNTGTAACGGCACAGAGGTAG(SEQ ID 79)
YOL72  AAACTGAAGCTTMNNMNNgctgtcMNNTGTAACGGCACAGAGGTAG(SEQ ID 80)
YOL73  AAACTGAAGCTTMNNMNNMNNgctgtcMNNTGTAACGGCACAGAGGTAG(SEQ ID 81)
YOL74  AAACTGAAGCTTMNNMNNgc tgtcMNNAACGGCACAGAGGTAG(SEQ ID 82)
α链片段用NcoI和HindIII消化并用Qiagen试剂盒重新纯化,并且载体通过用NcoI和HindIII消化克隆9,随后用Qiagen试剂盒凝胶纯化进行制备。β链片段用XhoI和NotI消化并用Qiagen试剂盒重新纯化,并且载体通过用XhoI和NotI消化克隆9,随后用Qiagen试剂盒凝胶纯化进行制备。纯化的插入片段和载体以3∶1的摩尔比与T4连接酶缓冲液、T4连接酶和不含核酶的水混合。连接反应16℃水浴过夜。对于每个突变文库,按照制造商提供的方案,总共0.5到1微升的纯化的连接产物以每40微升电转化感受态细胞(Stratagen)0.2微克DNA的比例电转化大肠杆菌TG1。电转化后,细胞立即用960微升SOC培养基37℃重悬并平铺于含补充了100微克/毫升氨苄青霉素和2%葡萄糖的YTE(1升中含15克琼脂、18克NaCl、10克胰蛋白胨和5克酵母提取物)的244mm×244mm组织培养皿。平皿30℃孵育过夜。随后,用5毫升补充了15%甘油的DYT(1升中含16克胰蛋白胨、10克酵母提取物和5克NaCl,125℃高压灭菌15分钟)从平皿上刮取细胞。
为了制备展示A6 TCR的噬菌体颗粒,将500到1000微升的文库储存液接种于500毫升DYTag(含100微克/毫升氨苄青霉素和2%葡萄糖的DYT)。培养物生长到OD(600nm)达到0.5。100毫升培养物用辅助噬菌体(M1 3 K07(Invitrogen)或HYPERPHAGE(Progen Biotechnik,GmbH 69123 Heidelberg))感染并37℃水浴孵育30分钟。用100毫升DYTak(含100微克/毫升氨苄青霉素和25微克/卡那霉素的DYT)替换培养基。随后培养物25℃振荡(300rpm)孵育20到36小时。
实施例8
高亲和性A6 TCR突变体的分离
使用两种不同的方法进行高亲和性A6 TCR突变体的分离。
第一种方法包括使用Maxisorp免疫试管(Invitrogen)选择能与HLA-A2 Tax复合物结合的展示突变A6 TCR的噬菌体颗粒。免疫试管通过1到2毫升含10微克/毫升链亲和素的PBS室温过夜进行包被。试管用PBS清洗两次,并随后添加1毫升含5微克/毫升生物素化HLA-A2 Tax复合物的PBS并室温孵育30分钟。除了以下改动之外,高亲和性结合物选择的剩余方案如先前所述(Li等.(2000)Journal ofImmunological Methods 236:133-146)。进行3轮或4轮选择。对于第一轮选择的生物素化HLA-A2 Tax复合物的浓度是5微克/毫升,对于第二轮的浓度是0.5微克/毫升,第三轮的浓度是0.05微克/毫升,第四轮是0.005微克/毫升。对于选择而言,在第一轮和第二轮选择中使用了M13 K07辅助噬菌体,在随后的选择中使用了超噬菌体。
采用的第二种方法是在溶液中选择能与HLA-A2 Tax复合物结合的展示突变A6 TCR的噬菌体颗粒。按照制造商的方案预洗了链亲和素包被的顺磁小珠(Dynal M280)。对于第1轮、第2轮、第3轮和第4轮选择,以1012到1013cfu的浓度展示突变A6TCR的噬菌体颗粒分别与浓度为2×10-8M,2×10-9M,2×10-10M和2×10-11M的生物素化HLA-A2Tax复合物预混。展示A6 TCR的噬菌体颗粒与HLA-A2 Tax复合物的混合物轻轻旋转室温孵育1小时,用200微升(第1轮)或50微升(第2、3、4轮)链亲和素包被的M280磁珠捕获与生物素化HLA-A2 Tax复合物结合的展示A6 TCR的噬菌体颗粒。噬菌体颗粒捕获后,使用Dynal磁颗粒浓缩器频繁洗涤磁珠(3次用PBS Tween20,2次用含2%无脂奶粉的PBS Tween20,2次用PBS,2次用含2%无脂奶粉的PBS,以及2次用PBS)。最后的清洗以后,磁珠在1毫升新制备的pH 11.5的100mM乙三胺中重悬并伴随着轻轻旋转室温孵育5到10分钟。从磁珠上洗脱的噬菌体颗粒立即用300微升pH7.0的1M Tris-HCl中和。按照先前描述的方法,一半洗脱液用于感染10毫升新制备的OD(600nm)值0.5的大肠杆菌TG1以扩增选出的噬菌体颗粒(Li等,(2000)Journal of Immunological Methods 236:133-146)。
在第3轮和第4轮筛选后,从平皿上挑取95个单菌落并用于接种于96孔板上100微升DYTag中。培养物37℃振荡孵育过夜。随后用2到5微升的过夜培养物亚接种于100微升DYTag中,并37℃振荡孵育2到3小时或直至培养物变混浊。为了用辅助噬菌体感染细胞,用25微升含5×109cfu辅助噬菌体的DYTag感染培养物并37℃孵育30分钟。用DYTak替换培养基。平板在300rpm振荡条件下25℃孵育20到36小时。通过4℃ 3000g离心10分钟沉淀细胞。上清液通过如下所述的竞争性噬菌体ELISA用于筛选高亲和性A6 TCR突变体。
链亲和素包被的Nunc-Immuno Maxisorp反应池用PBS清洗两次。每个反应池添加25微升5微克/毫升生物素化的HLA-A2-Tax复合物并室温孵育30到60分钟,随后用PBS清洗两次。通过添加300微升含3%无脂奶粉的PBS并随后室温孵育2小时封闭了反应池中的非特异性蛋白结合位点。为了制备展示异源二聚A6 TCR的噬菌体颗粒,噬菌体颗粒与含0、20和200nM HLA-A6-Tax的含3%无脂奶粉的PBS混合并室温孵育1小时。向HLA-A2-Tax包被的反应池添加该噬菌体并室温孵育1小时,接着用含0.1% Tween20的PBS清洗3次并随后用PBS清洗3次。结合的展示TCR的噬菌体颗粒如实施例4所述的用抗fd抗体(Sigma)进行检测。
鉴别了多个假定的高亲和性A6 TCR突变体,并且在以下两张表中列举了其CDR3序列及相应的野生型序列。在所有β链突变体和一个α链突变体中发现了琥珀终止密码子(X)。
A6 TCR β链突变体
克隆 CDR3序列
野生型 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGCAGTAG(SEQ ID 83)A  S  R  P  G  L  A  G  G  R  P  E  Q  Y(SEQ ID 84)
134 GCCTCGAGGCCGGGGCTGATGAGTGCGTAGCCAGAGCAGTAC(SEQ ID 85)A  S  R  P  G  L  M  S  A  X  P  E  Q  Y(SEQ ID 86)
86 GCCTCGAGGCCGGGGCTGAGGTCGGCGTAGCCAGAGCAGTAC(SEQ ID 87)A  S  R  P  G  L  R  S  A  X  P  E  Q  Y(SEQ ID 88)
87 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGCGTAG(SEQ ID 89)A  S  R  P  G  L  A  G  G  R  P  E  A  X(SEQ ID 90)
89 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGATTAG(SEQ ID 91)A  S  R  P  G  L  A  G  G  R  P  E  D  X(SEQ ID 92)
85 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGATCAGTAG(SEQ ID 93)A  S  R  P  G  L  A  G  G  R  P  D  Q  X(SEQ ID 94)
83 GCCTCGAGGCCGGGTCTGTAGGCTGGGCGACCAGAGCAGTAC(SEQ ID 95)A  S  R  P  G  L  X  A  G  R  P  E  Q  Y(SEQ ID 96)
1 GCCTCGAGGCCGGGGCTGGTTCCGGGGCGACCAGAGCAGTAG(SEQ ID 97)A  S  R  P  G  L  V  P  G  R  P  E  Q  X(SEQ ID 98)
2 GCCTCGAGGCCGGGGCTTGTGTCTGCTTAGCCAGAGCAGTAC(SEQ ID 99)A  S  R  P  G  L  V  S  A  X  P  E  Q  Y(SEQ ID 100)
111 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCACATCCGTAG(SEQ ID 101)A  S  R  P  G  L  A  G  G  R  P  H  P  X(SEQ ID 102)
125 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGATGCGTAG(SEQ ID 103)ASRPGLAGGRPDAX(SEQ ID 104)
133 GCCTCGAGGCCGGGTCTGATTAGTGCTTAGCCAGAGCAGTAC(SEQ ID 105)A  S  R  P  G  L  I  S  A  X  P  E  Q  Y(SEQ ID 106)
A6 TCR α链突变体
克隆 CDR3
野生型 GCCGTTACAACTGACAGCTGGGGGAAGCTTCAG(SEQ ID 107)A  V  T  T  D  S  W  G  K  L  Q(SEQ ID 108)
149 GCCGTTACAACTGACAGCTGGGGGCCGCTTCAG(SEQ ID 109)A  V  T  T  D  S  W  G  P  L  Q(SEQ ID 110)
65 GCCGTTACAACTGACAGCTGGGGGAAGATGCAG(SEQ ID 111)A  V  T  T  D  S  W  G  K  M  Q(SEQ ID 112)
66 GCCGTTACAACTGACAGCTGGGGGAAGTTGCAT(SEQ ID 113)A  V  T  T  D  S  W  G  K  L  H(SEQ ID 114)
153 GCCGTTACAACTGACAGCTGGGGGTAGCTTCAT(SEQ ID 115)A  V  T  T  D  S  W  G  X  L  H(SEQ ID 116)
71 GCCGTTACAACTGACAGCTGGGGGGAGCTTCAT(SEQ ID 117)A  V  T  T  D  S  W  G  E  L  H(SEQ ID 118)
70 GCCGTTACAACTGACAGCTGGGGGAGGCTGCAT(SEQ ID 119)A  V  T  T  D  S  W  G  R  L  H(SEQ ID 120)
121 GCCGTTACAACTGACAGCTGGGGGCAGCTTCAT(SEQ ID 121)A  V  T  T  D  S  W  G  Q  L  H(SEQ ID 122)
117 GCCGTTACAACTGACAGCTGGGGGAAGGTTCAT(SEQ ID 123)A  V  T  T  D  S  W  G  K  V  H(SEQ ID 124)
72 GCCGTTACAACTGACAGCTGGGGGAAGGTGAAT(SEQ ID 125)A  V  T  T  D  S  W  G  K  V  N(SEQ ID 126)
150 GCCGTTACAACTGACAGCTGGGGGAAGCTTCTG(SEQ ID 127)A  V  T  T  D  S  W  G  K  L  L(SEQ ID 128)
实施例9
含CDR3突变的具有恒定结构域之间非天然二硫键的可溶异源二聚A6 TCR的产生
使用Mini-Prep试剂盒(Quiagen,UK)从相关的大肠杆菌细胞中分离了实施例8中所鉴别的编码高亲和性A6 TCR突变体。
使用噬菌粒DNA作为模板并使用以下引物的PCR扩增用于扩增可溶TCR α和β链DNA序列。
A6 TCR α链正向引物
ggaattc  atcgatg cagaaggaagtggagcag(SEQ ID 129)
(ClaI限制性位点用下划线表示)
通用TCR α链反向引物
gtaca cggccgggtcagggttctggatatac(SEQ ID 130)
(EagI限制性位点用下划线表示)
A6 β链正向引物
Tctctc attaatgaatgctggtgtcactcagacccc(SEQ ID 131)
(AseI限制性位点用下划线表示)
通用β链反向引物
Tagaa accggtggccaggcacaccagtgtggc(SEQ ID 132)
(AgeI限制性位点用下划线表示)
在TCR β链的情况下,进行了进一步的PCR拼接以用编码谷氨酸的密码子取代CDR3区中的琥珀终止密码子。当大肠杆菌中琥珀终止密码子被抑制时,谷酰胺残基被正常引入而不是翻译终止。因此,当在噬菌体表面展示含琥珀密码子的TCR时,该位置包含谷酰胺残基。然而,当该TCR β链基因转移到表达质粒时,谷氨酸残基用作谷酰胺的另一种选择。用于这一PCR拼接的引物如下。
YOL124    CTGCTCTGGTTCCGCACTC
(SEQ ID 133)
YOL125    GAGTGCGGAACCAGAGCAG
(SEQ ID 134)
通过自动测序验证了突变的可溶A6 TCR β链的DNA序列(见针对突变的A6 TCR β链DNA序列的图14a和针对突变的A6 TCR β链氨基酸序列的图14b)。图14c显示了不含谷酰胺到谷氨酸替代的突变的A6 TCR β链的氨基酸序列,即如通过噬菌体ELISA分离的克隆134中的序列。
这些A6 TCR α和β链DNA序列随后用以产生如WO 03/020763中所述的可溶A6 TCR。简而言之,这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后体外分离包含体、变性并共同复性。
实施例10
与HLA-A2 Tax结合的高亲和性A6 TCR的BIAcore表面等离子体谐振特征描述
使用了表面等离子体谐振生物感应器(BIAcore 3000TM)来分析高亲和性克隆134A6 TCR(见分别针对突变的TCR β链的完整DNA和氨基酸序列的图15a和15b)与HLA-A2Tax配体的结合。产生的pMHC复合物(见以下描述)有助于这一过程,该复合物以半定向方式固定在包被链亲和素的结合表面上,这允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同的流动池中)的结合。手工注入HLA复合物允许对固定的I类分子的精确水平进行简单操作。
从细菌表达的含组成的亚基蛋白质及合成肽的包含体体外复性,随后进行纯化和体外酶的生物素化成生物素化的I类HLA-A2 Tax复合物(O’Callaghan等,(1999)Anal.Biochem.266:9-15)。表达含以适当结构取代蛋白跨膜和胞质结构域的C末端生物素化标签的HLA重链。获得了约75毫克/升包含体表达水平的细菌培养物。HLA轻链或β2微球蛋白也以包含体形式从适当的构件在大肠杆菌中表达,表达水平约为500毫克/升细菌培养物。
溶解大肠杆菌细胞并将包含体纯化至约80%的纯度。包含体蛋白质在6M盐酸胍、50mM Tris(pH 8.1)、100mM NaCl、10mM DTT和10mM EDTA中变性,并通过在5℃以下以单一脉冲将变性蛋白质加入重折叠缓冲液的方式,对浓度为30毫克/升重链、30毫克/升β2m在0.4M L-精氨酸-HCl、100mM Tris(pH 8.1)、3.7mM胱胺、mM巯基乙胺、4毫克/毫升肽(例如tax 11-19)中重折叠。使重折叠在4℃时至少1小时完成。
通过在10倍体积pH 8.1的Tris缓冲液中透析交换缓冲液。需要换两次缓冲液以充分降低溶液的离子强度。随后蛋白溶液通过1.5微米的醋酸纤维素滤器过滤并加载于POROS 50HQ阴离子交换柱(床体积8毫升)。用线性的0-500mM NaCl梯度洗脱蛋白质。HLA-A2-肽复合物在约250mM NaCl处洗脱,收集峰值处的组分,添加蛋白酶抑制剂混合剂(Calbiochem)并在冰上冷藏组分。
使用在相同缓冲液中平衡的Pharmacia快速脱盐柱将生物素化标记的HLA-A2复合物的缓冲液换成10mM Tris pH 8.1、5mM NaCl。洗脱后,含蛋白质的组分立即在冰上冷却并添加蛋白酶抑制剂混合剂(Calbiochem)。随后添加生物素化试剂:1mM生物素、5mMATP(pH缓冲到8)、7.5mM MgCl2和5微克/毫升BirA酶(按照0’Callaghan等,(1999)Anal.Biochem.266:9-15所述方法纯化的)。随后使混合物室温孵育过夜。
使用凝胶过滤层析纯化生物素化的HLA-A2复合物。Pharmacia Superdex 75HR10/30层析柱用过滤的PBS预平衡并加载1毫升生物素化反应混合物并用0.5毫升/分钟流速的PBS进行层析。生物素化的HLA-A2复合物在约15毫升处以单个峰的形式被洗脱。合并含蛋白质的组分、在冰上冷却并添加蛋白酶抑制剂混合剂。使用考马斯结合测定法(PerBio)确定了蛋白质浓度并在-20℃冻存试样量的生物素化HLA-A2复合物。通过常规的胺耦合方法固定链亲和素。
含新的链间键的高亲和性A6 Tax TCR和HLA-A2 Tax或无关的HLA-A2 NY-ESO组合(其产生如上所述)之间的相互作用在BIAcore 3000TM表面等离子体谐振(SPR)生物感应器上进行分析。SPR测量用反应单位(RU)表示的小流动池内感应器附近折射系数的变化,这是能用于检测受体配体相互作用并分析其亲和力和动力学参数的原理。通过经与β2m交联的生物素和已经与流动池活化表面化学交联的链亲和素之间的结合将单独的HLA-A2肽复合物固定在不同流动池中,制备了探针流动池。随后通过sTCR以恒定流速流经不同流动池的表面进行检测,以此测量了SPR反应。最初,相互作用的特异性通过可溶A6 TCR以5微升/分钟的恒定流速流经4个不同表面进行验证:一个用约1000RU的HLA-A2 Tax复合物包被,第2个用约1000RU的HLA-A2NY-ESO复合物包被,以及2个只用链亲和素包被的空白流动池(见图15)。
突变的A6 TCR的提高的亲和力使得对其与HLA-A2 Tax复合物相互作用的Kd值的计算变得困难。然而,计算的该相互作用的半衰期(t1/2)与野生型相互作用的t1/2 7.2秒相比是51.6分钟(见图16)。
实施例11
编码含新的二硫键的可溶NY-ESO TCR的载体的产生
实施例1中制备的可溶A6 TCR的β链在天然序列中包含适于用作连接位点的BglII限制性位点(AAGCTT)。
如下详述进行PCR诱变以在可溶A6 TCR的α链中新的半胱氨酸密码子的5’端引入BamHI限制性位点(GGATCC)。图2a中描述的序列用作这一诱变的模板。使用了以下引物:
                  |BamHI|
5’-ATATCCAGAACCCgGAtCCTGCCGTGTA-3’(SEQ ID 135)
5’-TACACGGCAGGAaTCcGGGTTCTGGATAT-3’(SEQ ID 136)
100纳克质粒与5微升10mM dNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H2O将终体积调节为240微升。在48微升的这一混合物中添加引物使其在50微升最终反应体积中的终浓度稀释为0.2μM。最初的95℃ 30秒的变性步骤之后,反应物在Hybaid PCR express PCR仪上进行了15轮的变性(95℃,30秒)、退火(55℃,60秒)和延伸(73℃,8分钟)。随后产物用10单位DpnI限制性酶(New England Biolabs)37℃消化5小时。10微升消化反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨、16克/升酵母提取物、5克/升NaCl、2.5克/升K2HPO4、100毫克/升氨苄青霉素)中生长过夜。按照制造商说明书在Qiagen mini-prep柱上纯化了质粒DNA并通过在牛津大学生物化学系的测序设备上的自动化测序验证了该序列。
按照已知的技术从T细胞中分离了编码NY-ESO TCR的cDNA。通过用逆转录酶处理mRNA生成了编码NY-ESO TCR的cDNA。
为了产生编码合并了新的二硫键的可溶NY-ESO TCR,将含α链BamHI和β链BglII限制性位点的A6 TCR用作模板。使用了以下引物:
            |NdeI|
5’-GGAGATATACATATGCAGGAGGTGACACAG-3’(SEQ ID 137)
5’-TACACGGCAGGATCCGGGTTCTGGATATT-3’(SEQ ID 138)
            |BamHI|
            |NdeI|
5’-GGAGATATACATATGGGTGTCACTCAGACC-3’(SEQ ID 139)
5’-CCCAAGCTTAGTCTGCTCTACCCCAGGCCTCGGC-3’(SEQ ID 140)
            |BglII|
通过如下的PCR克隆获得了NY-ESO TCR α和β链构件。使用上述引物和含天然NY-ESO TCR链的模板进行了PCR反应。PCR产物用相应的限制性酶进行了限制性消化,并克隆到pGMT7以获得表达质粒。质粒插入序列通过自动化DNA测序进行证实。图17a和17b分别显示突变的NY-ESO TCR α和β链的DNA序列,图18a和18b显示最终的氨基酸序列。
实施例12
噬菌体展示载体的构建和将编码NY-ESO TCR α和β链的DNA克隆进该噬菌粒载体
按照实施例11中所述产生的合并了新的半胱氨酸密码子以促进形成非天然链间二硫键的编码可溶NY-ESO TCR α和β链的DNA如下并入噬菌粒载体pEX746。
使用以下引物分别对编码两条NY-ESO TCR链的DNA进行了PCR以引入与pEX746噬菌粒载体(含编码A6 TCR克隆7的DNA)相容的克隆位点:
针对NY-ESO TCR α链的引物
TRAV21
GCCG GCCATGGCCAAACAGGAGGTGACGCAGATTCCT(SEQ ID 141)
YOL6
CTTCTTAAAGAATTCTTAATTA ACCTAGGTTATTAGGAACTTTCTGGGCTG
GGGAAG(SEQ ID 142)
针对NY-ESO TCR β链的引物
TRBV6-1/2/3/5/6/7/8/9
TCAC AGCGCGCAGGCTGGTGTCACTCAGACCCCAAA(SEQ ID 143)
RT1
CGAGAGCCCGTAGAACTGGACTTG(SEQ ID 144)
J.Sambrook和D.W.Russell的《分子克隆:实验室手册》中描述了用以构建载体的分子克隆方法。表1中列举的引物用于所述载体的构建。PCR程序的一个例子是94℃ 2分钟1个循环,随后94℃ 5秒、53℃ 5秒和72℃ 90秒25个循环,接着72℃ 10分钟1个循环,以及随后的4℃保温。高保真Taq DNA聚合酶购自Roche。
通过用限制性酶BssHII和BglII的消化从pEX746中去除编码克隆7 A6 TCR β链的DNA。随后通过连接将相应消化的编码NY-ESO β链的PCR DNA取代入该噬菌粒。克隆产物的序列通过自动测序进行验证。
类似地,通过用限制性酶NcoI和AvrII的消化从pEX746中去除编码克隆7 A6 TCRα链的DNA。随后通过连接将相应消化的编码NY-ESO α链的PCR DNA取代入已经包含编码NY-ESO TCR β链的DNA的噬菌粒。克隆产物的序列通过自动测序进行验证。图19a和19b分别详述了NY-ESO TCR α和β链的DNA和氨基酸序列以及并入噬菌体(pEX746:NY-ESO)的其周围相关序列。NcoI位点之前的序列与pEX746相同。
实施例13
细菌外被蛋白和异源二聚NY-ESO TCR的融合蛋白在大肠杆菌中的表达
使用对先前所述用于产生噬菌体颗粒展示的抗体scFv做以下改进的方法(Li等,2000,Journal of Immunological Methods 236:133-146)制备了展示含非天然链间二硫键的异源二聚NY-ESO TCR。将含pEX746:NY-ESO噬菌粒(即编码可溶NY-ESO TCRα链和如实施例12中所述方法产生的与噬菌体gIII蛋白融合的NT-ESO TCR β链的噬菌粒)的大肠杆菌TG1细胞接种到10毫升2xTY(含100微克/毫升氨苄青霉素和2%葡萄糖),随后培养物37℃振荡孵育过夜(16小时)。将50微升过夜培养物接种于10毫升2xTY(含100微克/毫升氨苄青霉素和2%葡萄糖),随后培养物37℃振荡孵育直至OD(600nm)达到0.8。在培养物中添加终浓度为5×109pfu/ml的HYPERPHAGE辅助噬菌体。随后培养物37℃静置孵育30分钟并以200rpm进一步振荡孵育30分钟。随后用2xTY(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素)将上述培养物的培养基体积调整为50毫升,随后25℃ 250rpm振荡孵育36到48小时。随后培养物4℃ 4000rpm离心30分钟。上清液经0.45微米针筒过滤器过滤并4℃保存以进一步浓缩。随后上清液通过PEG沉淀和用10%原始保存体积的PBS重悬进行浓缩。
实施例14
丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚NY-ESO TCR的检测
使用实施例4中所述的噬菌体ELISA方法对实施例13中所制备的浓缩悬液中的噬菌体颗粒上展示的功能性(HLA-A2-NY-ESO结合的)NY-ESO TCR进行了检测。图20说明在噬菌体ELISA测定法中噬菌体颗粒展示的NY-ESO TCR与HLA-A2-NY-ESO的特异性结合。
实施例15
用以HLA-DRA基因细胞表达的质粒的构建
使用聚合酶链式反应(PCR)和设计成包括BglII限制性位点的合成的DNA引物对,从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。
随后使用PCR诱变在该扩增序列的3’末端添加编码Fos亮氨酸拉链的DNA。
上述的DNA操作和克隆按照Sambrook,J等所著《分子克隆—实验室手册》第2版(Molecular Cloning-A Laboratory Manual.Second Edition.Cold Spring HarborLaboratory Press,USA)中所述进行。
图21提供了适于插入双顺反子表达载体的HLA-DR β链的DNA序列。该图指出了编码Fos亮氨酸拉链肽和生物素标签的密码子的位置。
氨基酸编号建立在小鼠序列的基础上(Kabat,1991,《免疫学上感兴趣的蛋白的序列》第5版(Sequences of Proteins of Immunological Interest,5th edition,US Dept of Health & Human Services,Public Health Service,NIH,Bethesda,MD 1-1137)。
随后将这一DNA序列连同编码相应II类HLA β链的DNA插入杆状病毒载体pAcAB3(见图22所示该载体的序列)以在Sf9昆虫细胞中表达。该载体可用于在昆虫细胞中表达任何II类HLA-肽复合物。
实施例16
用以HLA-DRB野生型和突变体基因细胞表达的质粒的构建
使用聚合酶链式反应(PCR)和设计成包括BamHI限制性位点的合成的DNA引物对,从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。
随后使用PCR诱变在该扩增序列的3’末端添加编码Jun亮氨酸拉链的DNA并在该序列的5’末端添加编码由HLA-DR1分子荷载的Flu HA肽的DNA。
上述的DNA操作和克隆按照Sambrook,J等所著《分子克隆—实验室手册》第2版(Molecular Cloning-A Laboratory Manual.Second Edition.Cold Spring HarborLaboratory Press,USA,1999)中所述进行。
图23提供了适于插入双顺反子表达载体的HLA-DR β链的DNA序列。该图指出了编码Jun亮氨酸拉链肽和Flu HA肽的密码子的位置。
氨基酸编号建立在小鼠序列的基础上(Kabat,1991,《免疫学上感兴趣的蛋白的序列》第5版(Sequences of Proteins of Immunological Interest,5th edition,US Dept of Health & Human Services,Public Health Service,NIH,Bethesda,MD 1-1137)。
随后将这一DNA序列连同编码相应II类HLA β链的DNA插入杆状病毒载体pAcAB3(见图22所示该载体的序列)以在Sf9昆虫细胞中表达。该载体可用于在昆虫细胞中表达任何II类HLA-肽复合物。
实施例17
II类HLA-DR1-Flu HA复合物的表达和复性
使用如实施例15和16所述的方法产生的含II类HLA-DR1 α和β链和Flu HA肽的双顺反子表达载体实现了II类MHC表达。使用的表达和纯化方法如Gauthier(1998)PNAS USA 95 11828-11833中所述。简而言之,通过用来自转录因子Fos和Jun的亮氨酸拉链二聚化结构域替换DR α和β链的疏水性跨膜结构域和胞质片段,在杆状病毒系统中表达了可溶的HLA-DR1。在表达构件中,需要的II类MHC荷载的Flu HA肽序列与成熟DR β链的N末端共价连接并且CR α链包含生物素化标签以促进利用生物素/链亲和素多聚化方法的双功能配体的形成。用重组杆状病毒感染的Sf9细胞分泌重组蛋白,并通过亲和层析对重组蛋白进行纯化。该蛋白进一步通过阴离子交换HPLC进行纯化。
实施例18-I类可溶肽-HLA分子的构建
为了进一步研究高亲和性A6 TCR克隆134的特异性,生成了以下可溶I类肽-HLA分子:
HLA-A2-肽(LLGRNSFEV)(SEQ ID 23)
HLA-A2-肽(KLVALGINAV)(SEQ ID 24)
HLA-A2-肽(LLGDLFGV)(SEQ ID 25)
HLA-B8-肽(FLRGRAYGL)(SEQ ID 26)
HLA-B27-肽(HRCQAIRKK)(SEQ ID 27)
HLA-Cw6-肽(YRSGIIAVV)(SEQ ID 28)
HLA-A24-肽(VYGFVRACL)(SEQ ID 29)
HLA-A2-肽(ILAKFLHWL)(SEQ ID 30)
HLA-A2-肽(LTLGEFLKL)(SEQ ID 31)
HLA-A2-肽(GILGFVFTL)(SEQ ID 33)
HLA-A2-肽(SLYNTVATL)(SEQ ID 34)
这些可溶肽-HLA使用实施10中所述的方法产生。
实施例19-克隆134高亲和性A6 TCR与肽-HLA结合特异性的BIAcore表面等离子体谐振测量
使用了表面等离子体谐振生物感应器(BIAcore 3000TM)来分析高亲和性克隆134A6 TCR(见图15a和15b分别表示的突变TCR β链的完整DNA和氨基酸序列)的结合特异性。这通过使用如实施例15-17所述产生的II类HLA-DR1-肽和使用实施例10中详述的方法产生的列举在实施18中的I类肽-HLA复合物得以实现。下表列举了采用的肽-HLA复合物:
1.HLA-A2-肽(LLGRNSFEV)(SEQ ID 23)
2.HLA-A2-肽(KLVALGINAV)(SEQ ID 24)
3.HLA-A2-肽(LLGDLFGV)(SEQ ID 25)
4.HLA-B8-肽(FLRGRAYGL)(SEQ ID 26)
5.HLA-B27-肽(HRCQAIRKK)(SEQ ID 27)
6.HLA-Cw6-肽(YRSGIIAVV)(SEQ ID 28)
7.HLA-A24-肽(VYGFVRACL)(SEQ ID 29)
8.HLA-A2-肽(ILAKFLHWL)(SEQ ID 30)
9.HLA-A2-肽(LTLGEFLKL)(SEQ ID 31)
10.HLA-DR1-肽(PKYVKQNTLKLA)(SEQ ID 32)
11.HLA-A2-肽(GILGFVFTL)(SEQ ID 33)
12.HLA-A2-肽(SLYNTVATL)(SEQ ID 34)
以上的肽-HLA以半定向方式固定在BIAcore 3000TM流动池中的链亲和素包被的结合表面上。
BIAcore 3000TM允许同时对可溶T细胞受体与4种以内不同的pMHC(固定在不同的流动池内)的结合进行检测。实验中在流动池2-4中固定了3种不同的HLA-肽并且流动池1留作空白对照。手工注入HLA-肽复合物允许对固定分子的精确水平进行操纵。
在对高亲和性A6 TCR克隆134与以上列表中前3种HLA-肽复合物的结合能力进行评估以后,接下来的3种复合物直接固定在这些流动池中前一批复合物之上。持续这一过程直至高亲和性A6 TCR克隆134与所有12种HLA-肽复合物的结合进行了评估。
注入的5微升高亲和性A6 TCR克隆134以介于4.1纳克/毫升到2.1毫克/毫升的浓度和5微升/分钟的流速通过每个流动池(见图24-28)。
作为最后的对照,高亲和性A6 TCR克隆134通过含固定的HLA-A2 Tax(LLFGYPVYV)(SEQ ID 21)(该TCR的同类配体)的流动池。
只发现了高亲合力A6 TCR克隆134与其同类配体(HLA-A2 Tax(LLFGYPVYV)(SEQ ID21))的特异性结合。这些数据进一步说明高亲和性A6 TCR克隆134的特异性(见图24-28)。
实施例20-NY-ESO TCR CDR3区的诱变
NY-ESO TCR的CDR3区作为引入突变以研究产生高亲和性突变体可能性的靶标。这通过组合使用NY-ESO TCR特异性PCR引物和与实施例7中详述的方法充分相同的方法得以实现。
实施例21-高亲和性A6 TCR突变体的分离
使用实施例8所述两种方法中的第一种方法实现了高亲和性NY-ESO TCR突变体的分离。
鉴别了单一的高亲和性NY-ESO TCR。
实施例22
具有恒定结构域之间非天然二硫键的含可变结构域突变的可溶高亲和性异源二聚NY-ESO TCR的产生
使用Mini-Prep试剂盒(Quiagen,UK)从相应的大肠杆菌细胞中分离了编码实施例20中所鉴别的高亲和性NY-ESO TCR突变体的噬菌体DNA。
使用将噬菌粒DNA作为模板和以下引物的PCR扩增用于扩增突变的可溶NY-ESOTCR β链可变结构域DNA序列
NY-ESO β链正向引物
Tctctc attaatgaatgctggtgtcactcagacccc(SEQ ID 145)
(AseI限制性位点用下划线表示)
通用β链反向引物
Tagaa accggtggccaggcacaccagtgtgg(SEQ ID 146)
(AgeI限制性位点用下划线表示)
随后PCR产物用AgeI/AseI消化并克隆进用NdeI/AgeI切割的pEX821(如实施例11所述产生)。
如上所述扩增的突变NY-ESO TCR β链DNA序列和如实施例11所述生成的NY-ESOTCR α链随后用于产生如WO 03/020763所述的可溶高亲和性NY-ESO TCR。简而言之,这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后对包含体进行纯化、变性和共同体外复性。
实施例23-与HLA-A2 NY-ESO结合的高亲和性NY-ESO TCR的BIAcore表面等离子体谐振特征描述
使用了表面等离子体谐振生物感应器(Biacore 3000TM)来分析高亲和性NY-ES0TCR与HLA-A2 NY-ESO配体的结合。这由生成的以半定向方式固定在链亲和素包被的结合表面上从而允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同流动池中)结合的pMHC复合物(如实施例10所述)促进。手工注入HLA复合物使得对固定的I类分子的精确水平进行简便操纵。
也如实施例10中所述,在Biacore 3000TM表面等离子体谐振(SPR)生物感应器上分析了含新的链间键的高亲和性NY-ESO TCR和HLA-A2 NY-ESO复合物或无关的HLA-A2Tax组合物(实施例10中描述了其产生)之间的相互作用。
可溶高亲和性NY-ESO与HLA-A2 NY-ESO的相互作用的Kd值计算为4.1μM(见图29a和29b),这与野生型相互作用Kd值为15.7μM(见图30a和30b)形成对比。
实施例24-更多高亲和性A6 TCR的产生和检测
使用实施例9中所详述的方法,产生了含以下对应于克隆89、1、111和71(见实施例8)中所鉴别的突变的可溶TCR。随后使用实施例10中详述的Biacore测定法对这些可溶TCR与HLA-A2 Tax结合进行了评估。
A6 TCR β链突变体
克隆 CDR3序列
野生型 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGCAGTAG(SEQ ID 83)A  S  R  P  G  L  A  G  G  R  P  E  Q  Y(SEQ ID 84)
89 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCAGAGGATTAG(SEQ ID 91)A  S  R  P  G  L  A  G  G  R  P  E  D  X(SEQ ID 92)
1 GCCTCGAGGCCGGGGCTGGTTCCGGGGCGACCAGAGCAGTAG(SEQ ID 97)A  S  R  P  G  L  V  P  G  R  P  E  Q  X(SEQ ID 98)
111 GCCTCGAGGCCGGGACTAGCGGGAGGGCGACCACATCCGTAG(SEQ ID 101)A  S  R  P  G  L  A  G  G  R  P  H  P  X(SEQ ID 102)
A6 TCR α链突变体
克隆 CDR3
野生型 GCCGTTACAACTGACAGCTGGGGGAAGCTTCAG(SEQ ID 107)A  V  T  T  D  S  W  G  K  L  Q(SEQ ID 108)
71 GCCGTTACAACTGACAGCTGGGGGGAGCTTCAT(SEQ ID 117)A  V  T  T  D  S  W  G  E  L  H(SEQ ID 118)
组合的突变用作产生突变的可溶A6 TCR:
克隆89突变+克隆134突变
克隆71突变+克隆134突变
克隆71突变+克隆89突变
克隆1突变+βG102→A突变
结果:
以下的表格比较了以上可溶的突变A6 TCR与使用含非突变可变结构域获得的亲和力。注意,用相互作用的半寿期(T1/2)表示最高亲和性突变体的亲和力。如由其相互作用更低的Kd值或更长的T1/2所证明的,这些可溶突变A6 TCR对HLA-A2 Tax具有比非突变可溶A6 TCR更高的亲和力。
图31-37显示了用于计算这些可溶突变TCR对HLA-A2 Tax亲和力的Biacore记录。
图38a-e显示了突变A6 TCR链的氨基酸序列。
A6TCR     Kd(μM)     T1/2(秒)
野生型     1.9     7
克隆1     810
克隆89     0.41
克隆111     1.18
克隆71     1.37
克隆89+克隆134突变     114(时相1)4500(时相2)
克隆71+克隆134突变     882
克隆71+克隆89突变     0.35
克隆1+βG102→A突变     738
实施例25-使用高亲和性A6 TCR四聚物和单体的细胞染色
T2抗原提呈细胞与β2m(3微克/毫升)37℃孵育90分钟,同时以脉冲方式输送浓度介于10-5M-10-9M的Tax肽。对于也使用与β2m(3微克/毫升)孵育的T2细胞的对照,以脉冲方式输送10-5的Flu肽或不与肽共同孵育(无脉冲的)。脉冲输送后,细胞用无血清RPMI清洗并且2×105细胞与用藻红蛋白(PE)(Molecular probes,TheNetherlands)(10微克/毫升)标记的链亲和素相连的高亲和性克隆134 A6 TCR四聚体或用Alexa 488(Molecular probes,The Netherlands)标记的高亲和性克隆134 A6TCR单体室温孵育10分钟。细胞清洗以后,使用FACSVantage SE(Becton Dickinson)通过流式细胞仪检验了标记的TCR四聚体和单体的结合。
结果
如图39a所示,当Tax肽浓度低于10-9M时,可以观察到T2细胞通过高亲和性A6TCR四聚体的特异性染色。
如图39b所示,当Tax肽浓度低于10-8M时,可以观察到T2细胞通过高亲和性A6TCR单体的特异性染色。
序列表
公司申请人
街道:密尔顿公园57C
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44 1235 438600
传真号码:+44 1235 438601
电子邮件地址:martin.green@avidex.com
<110>公司名称:阿维德克斯有限公司
个人申请人
街道:密尔顿公园57C,阿维德克斯有限公司
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44  1235 438600
传真号码:+44  1235 438601
电子邮件地址:bent.jakobsen@avidex.com
<110>姓:雅各布森
<110>名:本特
<110>中间名:K
<110>注释:博士
个人申请人
街道:密尔顿公园57C,阿维德克斯有限公司
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44 1235 438600
传真号码:+44 1235 438601
电子邮件地址:torben.andersen@avidex.com
<110>姓:安德森
<110>名:托本
<110>中间名:B
<110>注释:博士
个人申请人
街道:密尔顿公园57C,阿维德克斯有限公司
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44  1235 438600
传真号码:+44  1235 438601
电子邮件地址:peter.molloy@avidex.com
<110>姓:莫洛伊
<110>名:彼特
<110>中间名:E
<110>注释:博士
个人申请人
街道:密尔顿公园57C,阿维德克斯有限公司
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44  1235 438600
传真号码:+44  1235 438601
电子邮件地址:jonathan.boulter@avidex.com
<110>姓:伯尔特
<110>名:乔纳森
<110>中间名:M
<110>注释:博士
个人申请人
街道:密尔顿公园57C,阿维德克斯有限公司
城市:阿宾顿
州:牛津郡
国家:英国
邮政编码:OX14 4RX
电话号码:+44  1235 438600
传真号码:+44  1235 438601
电子邮件地址:yi.li@avidex.com
<110>姓:李
<110>名:懿
<110>中间名:
<110>注释:博士
申请方案
<120>发明名称:物质
<130>申请文件编号:Case No 19
<140>当前申请号:GB 0226227.7
<141>当前申请日:2002-11-09
在先申请
<150>在先申请号:GB 0226227.7
<151>在先申请日:2002-11-09
在先申请
<150>在先申请号:GB 0301814.0
<151>在先申请日:2003-01-25
在先申请
<150>在先申请号:GB 0304067.2
<151>在先申请日:2003-02-22
在先申请
<150>在先申请号:GB 0311397.4
<151>在先申请日:2003-05-16
在先申请
<150>在先申请号:GB 0316356.5
<151>在先申请日:2003-07-11
在先申请
<150>在先申请号:us 60/463,323
<151>在先申请日:2003-04-16
序列
<213>生物体名称:人工序列
<400>前序列串:
DSDVYITDKT VLDMRSMDFK                                                                   20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 1
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
QSKDSDVYIT DKTVLDMRSM                                                                   20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 2
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
DIQNPDPAVY QLRDSKSSDK                                                                   20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 3
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
DPAVYQLRDS KSSDKSVCLF                                                                   20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 4
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
NGKEVHSGVS TDPQPLKEQP                                                                  20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 5
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
NGKEVHSGVSTDPQPLKEQP                           20
<212>类型:PRT
<211>长度:20
序列名称:SEQ ID 5
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ALNDSRYALSSRLRVSATFW                           20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 6
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
PPEVAVFEPSEAEISHTQKA                           20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 7
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
KEVHSGVSTDPQPLKEQPAL                           20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 8
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
VFPPEVAVFEPSEAEISHTQ                20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 9
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKS         60
NGAIAWSNQTSFTCQDIFKETNATYPSSDVP                                      91
<212>类型:PRT
<211>长度:91
     序列名称:SEQ ID 10
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREVHSGVSTDP    60
QAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAE   120
AWGRAD                                                         126
<212>类型:PRT
<211>长度:126
     序列名称:SEQ ID 11
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ESGTFITDKTVLDMKAMDSK              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 12
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
KTMESGTFITDKTVLDMKAM              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 13
序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
YIQNPEPAVYQLKDPRSQDS              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 14
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
AVYQLKDPRSQDSTLCLFTD              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 15
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
NGREVHSGVSTDPQAYKESN              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 16
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
KESNYSYCLSSRLRVSATFW              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 17
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
PPKVSLFEPSKAEIANKQKA              20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 18
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
REVHSGVSTDPQAYKESNYS               20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 19
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
VTPPKVSLFEPSKAEIANKQ               20
<212>类型:PRT
<211>长度:20
     序列名称:SEQ ID 20
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
LLFGYPVYV                           9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 21
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
SLLMITQC                            8
<212>类型:PRT
<211>长度:8
     序列名称:SEQ ID 22
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
LLGRNSFEV                           9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 23
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
KLVALGINAV                           10
<212>类型:PRT
<211>长度:10
     序列名称:SEQ ID 24
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
LLGDLFGV                              8
<212>类型:PRT
<211>长度:8
     序列名称:SEQ ID 25
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
FLRGRAYGL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 26
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
HRCQAIRKK                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 27
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
YRSGIIAVV                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 28
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
VYGFVRACL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 29
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ILAKFLHWL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 30
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
LTLGEFLKL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 31
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
PKYVKQNTLKLA                         12
<212>类型:PRT
<211>长度:12
     序列名称:SEQ ID 32
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
GILGFVFTL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 33
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
SLYNTVATL                             9
<212>类型:PRT
<211>长度:9
     序列名称:SEQ ID 34
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
cacagacaaa tgtgtgctag acat                                                24
<212>类型:DNA
<211>长度:24
     序列名称:SEQ ID 35
     序列描述:
惯用密码子
序列名称:SEQ ID 35
序列
<213>生物体名称:人工序列
<400>前序列串:
atgtctagca cacatttgtc tgtg                                                24
<212>类型:DNA
<211>长度:24
     序列名称:SEQ ID 36
     序列描述:
惯用密码子
序列名称:SEQ ID 36
序列
<213>生物体名称:人工序列
<400>前序列串:
cagtggggtc tgcacagacc c                                                   21
<212>类型:DNA
<211>长度:21
     序列名称:SEQ ID 37
     序列描述:
惯用密码子
序列名称:SEQ ID 37
序列
<213>生物体名称:人工序列
<400>前序列串:
gggtctgtgc agaccccact g                                                   21
<212>类型:DNA
<211>长度:21
     序列名称:SEQ ID 38
     序列描述:
惯用密码子
序列名称:SEQ ID 38
序列
<213>生物体名称:人工序列
<400>前序列串:
taataatacg tataataata ttctatttca aggagacagt c                      41
<212>类型:DNA
<211>长度:41
     序列名称:SEQ ID 39
     序列描述:
惯用密码子
序列名称:SEQ ID 39
序列
<213>生物体名称:人工序列
<400>前序列串:
caatccagcg gctgccgtag gcaataggta tttcattatg actgtctcct tgaaatag    58
<212>类型:DNA
<211>长度:58
     序列名称:SEQ ID 40
     序列描述:
惯用密码子
序列名称:SEQ ID 40
序列
<213>生物体名称:人工序列
<400>前序列串:
ctacggcagc cgctggattg ttattactcg cggcccagcc ggccatggcc cag         53
<212>类型:DNA
<211>长度:53
     序列名称:SEQ ID 41
     序列描述:
惯用密码子
序列名称:SEQ ID 41
序列
<213>生物体名称:人工序列
<400>前序列串:
gttctgctcc acttccttct gggccatggc cggctgggcc g                      41
<212>类型:DNA
<211>长度:41
     序列名称:SEQ ID 42
     序列描述:
惯用密码子
序列名称:SEQ ID 42
序列
<213>生物体名称:人工序列
<400>前序列串:
cagaaggaag tggagcagaa c                                            21
<212>类型:DNA
<211>长度:21
     序列名称:SEQ ID 43
     序列描述:
惯用密码子
序列名称:SEQ ID 43
序列
<213>生物体名称:人工序列
<400>前序列串:
cttcttaaag aattcttaat taacctaggt tattaggaac tttctgggct ggggaag     57
<212>类型:DNA
<211>长度:57
     序列名称:SEQ ID 44
     序列描述:
惯用密码子
序列名称:SEQ ID 44
序列
<213>生物体名称:人工序列
<400>前序列串:
gttaattaag aattctttaa gaaggagata tacatatgaa aaaattatta ttcgcaattC  60
 <212>类型:DNA
<211>长度:60
     序列名称:SEQ ID 45
     序列描述:
惯用密码子
序列名称:SEQ ID 45
序列
<213>生物体名称:人工序列
<400>前序列串:
cgcgctgtga gaatagaaag gaacaactaa aggaattgcg aataataatt ttttcatatG  60
<212>类型:DNA
<211>长度:60
     序列名称:SEQ ID 46
     序列描述:
惯用密码子
序列名称:SEQ ID 46
序列
<213>生物体名称:人工序列
<400>前序列串:
ctttctattc tcacagcgcg caggctggtg tcactcagac                         40
<212>类型:DNA
<211>长度:40
     序列名称:SEQ ID 47
     序列描述:
惯用密码子
序列名称:SEQ ID 47
序列
<213>生物体名称:人工序列
<400>前序列串:
atgatgtcta gatgcggccg cgtctgctct accccaggcc tc                      42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 48
     序列描述:
惯用密码子
序列名称:SEQ ID 48
序列
<213>生物体名称:人工序列
<400>前序列串:
gcatctagac atcatcacca tcatcactag actgttgaaa gttgtttagc aaaac        55
<212>类型:DNA
<211>长度:55
     序列名称:SEQ ID 49
     序列描述:
惯用密码子
序列名称:SEQ ID 49
序列
<213>生物体名称:人工序列
<400>前序列串:
ctagagggta ccttattaag actccttatt acgcagtatg                         40
<212>类型:DNA
<211>长度:40
     序列名称:SEQ ID 50
     序列描述:
惯用密码子
序列名称:SEQ ID 50
序列
<213>生物体名称:人工序列
<400>前序列串:
agctgcagct aatacgactc actataggaa caggccacca tggcgtcgat tatgctgagt   60
gatatccttg tccggtggta ccctag                                        86
<212>类型:DNA
<211>长度:86
     序列名称:SEQ ID 51
     序列描述:
惯用密码子
序列名称:SEQ ID 51
序列
<213>生物体名称:人工序列
<400>前序列串:
agctgcagct aatacgactc actataggaa caggccacca tgg                     43
<212>类型:DNA
<211>长度:43
     序列名称:SEQ ID 52
     序列描述:
惯用密码子
序列名称:SEQ ID 52
序列
<213>生物体名称:人工序列
<400>前序列串:
gatcccatgg tggcctgttc ctatagtgag tcgtattagc tgc                     43
<212>类型:DNA
<211>长度:43
     序列名称:SEQ ID 53
     序列描述:
惯用密码子
序列名称:SEQ ID 53
序列
<213>生物体名称:人工序列
<400>前序列串:
ccaccatggg ccagaaggaa gtggagcaga actc                               34
<212>类型:DNA
<211>长度:34
     序列名称:SEQ ID 54
     序列描述:
惯用密码子
序列名称:SEQ ID 54
序列
<213>生物体名称:人工序列
<400>前序列串:
cgagagcccg tagaactgga cttg                                          24
<212>类型:DNA
<211>长度:24
     序列名称:SEQ ID 55
     序列描述:
惯用密码子
序列名称:SEQ ID 55
序列
<213>生物体名称:人工序列
<400>前序列串:
gtggatccgg cggtggcggg tcgaacgctg gtgtcactca gacccc                  46
<212>类型:DNA
<211>长度:46
     序列名称:SEQ ID 56
     序列描述:
惯用密码子
序列名称:SEQ ID 56
序列
<213>生物体名称:人工序列
<400>前序列串:
ccggatccac ctccgcctga accgcctcca ccggtgacca caacctgggt ccctg        55
<212>类型:DNA
<211>长度:55
     序列名称:SEQ ID 57
     序列描述:
惯用密码子
序列名称:SEQ ID 57
序列
<213>生物体名称:人工序列
<400>前序列串:
ctgagaattc ttatgactct ccgcggttga agctc                              35
<212>类型:DNA
<211>长度:35
     序列名称:SEQ ID 58
     序列描述:
惯用密码子
序列名称:SEQ ID 58
序列
<213>生物体名称:人工序列
<400>前序列串:
tgacgaattc tgactctccg cggttgaagc tc                                 32
<212>类型:DNA
<211>长度:32
     序列名称:SEQ ID 59
     序列描述:
惯用密码子
序列名称:SEQ ID 59
序列
<213>生物体名称:人工序列
<400>前序列串:
agctgcagct aatacgactc actatagg                                      28
<212>类型:DNA
<211>长度:28
     序列名称:SEQ ID 60
     序列描述:
惯用密码子
序列名称:SEQ ID 60
序列
<213>生物体名称:人工序列
<400>前序列串:
ggccaccatg ggcaacgctg gtgtcactca gacccc                             36
<212>类型:DNA
<211>长度:36
     序列名称:SEQ ID 61
     序列描述:
惯用密码子
序列名称:SEQ ID 61
序列
<213>生物体名称:人工序列
<400>前序列串:
tgaaccgcct ccaccgtctg ctctacccca ggcctcggcg                         40
<212>类型:DNA
<211>长度:40
     序列名称:SEQ ID 62
     序列描述:
惯用密码子
序列名称:SEQ ID 62
序列
<213>生物体名称:人工序列
<400>前序列串:
tgactctccg cggttgaagc tc                                            22
<212>类型:DNA
<211>长度:22
     序列名称:SEQ ID 63
     序列描述:
惯用密码子
序列名称:SEQ ID 63
序列
<213>生物体名称:人工序列
<400>前序列串:
cagctggggg aagcttcagt ttggagcag                                     29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 64
     序列描述:
惯用密码子
序列名称:SEQ ID 64
序列
<213>生物体名称:人工序列
<400>前序列串:
ctgctccaaa ctgaagcttc ccccagctg                                   29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 65
     序列描述:
惯用密码子
序列名称:SEQ ID 65
序列
<213>生物体名称:人工序列
<400>前序列串:
gtacttctgt gcctcgaggc cgggactag                                   29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 66
     序列描述:
惯用密码子
序列名称:SEQ ID 66
序列
<213>生物体名称:人工序列
<400>前序列串:
ctagtcccgg cctcgaggca cagaagtac                                   29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 67
     序列描述:
惯用密码子
序列名称:SEQ ID 67
序列
<213>生物体名称:人工序列
<400>前序列串:
cattttcagg gatagcaagc                                             20
<212>类型:DNA
<211>长度:20
     序列名称:SEQ ID 68
     序列描述:
惯用密码子
序列名称:SEQ ID 68
序列
<213>生物体名称:人工序列
<400>前序列串:
tcacacagga aacagctatg tcacacagga aacagctatg                       40
<212>类型:DNA
<211>长度:40
     序列名称:SEQ ID 69
     序列描述:
惯用密码子
序列名称:SEQ ID 69
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggnnknnknn knnknnknnk cgaccagagc agtacttcg             49
<212>类型:DNA
<211>长度:49
     序列名称:SEQ ID 70
     序列描述:
特征
序列:SEQ ID 70
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:49
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 70
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggccgnnknn knnknnknnk nnkccagagc agtacttcgg gc         52
<212>类型:DNA
<211>长度:52
     序列名称:SEQ ID 71
     序列描述:
特征
序列:SEQ ID 71
<221>特征关键词:misc_feature
<222>起始位置:
<222>终止位置:
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
特征
序列:SEQ ID 71
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:52
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 71
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggccgnnknn knnknnknnk nnkcgaccag agcagtactt cg         52
<212>类型:DNA
<211>长度:52
     序列名称:SEQ ID 72
     序列描述:
特征
序列:SEQ ID 72
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:52
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 72
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggccgnnknn knnknnknnk nnkggagggc gaccagagca g          51
<212>类型:DNA
<211>长度:51
     序列名称:SEQ ID 73
     序列描述:
特征
序列:SEQ ID 73
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:51
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 73
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggccgggann knnknnknnk nnknnkgggc gaccagagca gtac       54
<212>类型:DNA
<211>长度:54
     序列名称:SEQ ID 74
     序列描述:
特征
序列:SEQ ID 74
<221>特征关键词:misc_feature
<222>起始位置:
<222>终止位置:
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
特征
序列:SEQ ID 74
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:54
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 74
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggnnknnknn knnknnknnk ccagagcagt acttcgggc             49
<212>类型:DNA
<211>长度:49
     序列名称:SEQ ID 75
     序列描述:
特征
序列:SEQ ID 75
<221>特征关键词:misc_feature
<222>起始位置:
<222>终止位置:
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
特征
序列:SEQ ID 75
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:49
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 75
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggnnknnknn knnknnknnk gagcagtact tcgggccg              48
<212>类型:DNA
<211>长度:48
     序列名称:SEQ ID 76
     序列描述:
特征
序列:SEQ ID 76
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:48
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 76
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggnnknnknn knnknnknnk cagtacttcg ggccgggc              48
<212>类型:DNA
<211>长度:48
     序列名称:SEQ ID 76
     序列描述:
特征
序列:SEQ ID 77
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:48
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 77
序列
<213>生物体名称:人工序列
<400>前序列串:
tgtgcctcga ggccgnnknn knnknnkggg cgaccagagc agtacttcg             49
<212>类型:DNA
<211>长度:49
     序列名称:SEQ ID 78
     序列描述:
特征
序列:SEQ ID 78
<221>特征关键词:misc_feature
<222>起始位置:
<222>终止位置:
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
特征
序列:SEQ ID 78
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:49
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 78
序列
<213>生物体名称:人工序列
<400>前序列串:
aaactgaagc ttmnnmnnmn nmnnmnntgt aacggcacag aggtag                46
<212>类型:DNA
<211>长度:46
序列名称:SEQ ID 79
序列描述:
特征
序列:SEQ ID 79
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:46
其它信息:m是a或c;n是a或t或g或c;k是g或t
CDS连接:无
惯用密码子
序列名称:SEQ ID 79
序列
<213>生物体名称:人工序列
<400>前序列串:
aaactgaagc ttmnnmnngc tgtcmnntgt aacggcacag aggtag                46
<212>类型:DNA
<211>长度:46
序列名称:SEQ ID 80
序列描述:
特征
序列:SEQ ID 80
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:46
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 80
序列
<213>生物体名称:人工序列
<400>前序列串:
aaactgaagc ttmnnmnnmn ngctgtcmnn tgtaacggca cagaggtag             49
<212>类型:DNA
<211>长度:49
     序列名称:SEQ ID 81
     序列描述:
特征
序列:SEQ ID 81
<221>特征关键词:misc_feature
<222>起始位置:
<222>终止位置:
     其它信息:m是a或c:n是a或t或g或c;k是g或t
     CDS连接:无
特征
序列:SEQ ID 81
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:49
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 8I
序列
<213>生物体名称:人工序列
<400>前序列串:
aaactgaagc ttmnnmnngc tgtcmnnaac ggcacagagg tag                   43
<212>类型:DNA
<211>长度:43
     序列名称:SEQ ID 82
     序列描述:
特征
序列:SEQ ID 82
<221>特征关键词:misc_feature
<222>起始位置:1
<222>终止位置:43
     其它信息:m是a或c;n是a或t或g或c;k是g或t
     CDS连接:无
惯用密码子
序列名称:SEQ ID 82
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccagagcagt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 83
     序列描述:
惯用密码子
序列名称:SEQ ID 83
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPEQY                        14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 84
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cggggctgat gagtgcgtag ccagagcagt ac                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 85
     序列描述:
惯用密码子
序列名称:SEQ ID 85
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLMSAX PEQY                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 86
     序列描述:
特征
序列:SEQ ID 86
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cggggctgag gtcggcgtag ccagagcagt ac                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 87
     序列描述:
惯用密码子
序列名称:SEQ ID 87
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLRSAX PEQY                        14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 88
     序列描述:
特征
序列:SEQ ID 88
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccagaggcgt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 89
     序列描述:
惯用密码子
序列名称:SEQ ID 89
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPEAX                         14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 90
     序列描述:
特征
序列:SEQ ID 90
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 90
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccagaggatt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 91
     序列描述:
惯用密码子
序列名称:SEQ ID 91
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPEDX                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 92
     序列描述:
特征
序列:SEQ ID 92
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccagatcagt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 93
     序列描述:
惯用密码子
序列名称:SEQ ID 93
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPDQX                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 94
     序列描述:
特征
序列:SEQ ID 94
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 94
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggtctgta ggctgggcga ccagagcagt ac                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 95
     序列描述:
惯用密码子
序列名称:SEQ ID 95
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLX AGRPEQY                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 96
     序列描述:
特征
序列:SEQ ID 96
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 96
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cggggctggt tccggggcga ccagagcagt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 97
     序列描述:
惯用密码子
序列名称:SEQ ID 97
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLVPGRPEQX                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 98
     序列描述:
特征
序列:SEQ ID 98
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 98
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cggggcttgt gtctgcttag ccagagcagt ac                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 99
     序列描述:
惯用密码子
序列名称:SEQ ID 99
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLVSAX PEQY                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 100
     序列描述:
特征
序列:SEQ ID 100
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccacatccgt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 101
     序列描述:
惯用密码子
序列名称:SEQ ID 101
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPHPX                        14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 101
     序列描述:
特征
序列:SEQ ID 102
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 102
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggactagc gggagggcga ccagatgcgt ag                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 103
     序列描述:
惯用密码子
序列名称:SEQ ID 103
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLAGGRPDAX                        14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 104
     序列描述:
特征
序列:SEQ ID 104
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gcctcgaggc cgggtctgat tagtgcttag ccagagcagt ac                    42
<212>类型:DNA
<211>长度:42
     序列名称:SEQ ID 105
     序列描述:
惯用密码子
序列名称:SEQ ID 105
序列
<213>生物体名称:人工序列
<400>前序列串:
ASRPGLISAX PEQY                       14
<212>类型:PRT
<211>长度:14
     序列名称:SEQ ID 106
     序列描述:
特征
序列:SEQ ID 106
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:14
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaagctt cag                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 107
     序列描述:
惯用密码子
序列名称:SEQ ID 107
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKLQ                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 108
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggccgctt cag                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 109
     序列描述:
惯用密码子
序列名称:SEQ ID 109
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGPLQ                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 110
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaagatg cag                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 111
     序列描述:
惯用密码子
序列名称:SEQ ID 111
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKMQ                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 112
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaagttg cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 113
     序列描述:
惯用密码子
序列名称:SEQ ID 113
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKLH                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 114
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggtagctt cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 115
     序列描述:
惯用密码子
序列名称:SEQ ID 115
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGXL H                          11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 116
     序列描述:
特征
序列:SEQ ID 116
<221>特征关键词:MISC_FEATURE
<222>起始位置:
<222>终止位置:
     其它信息:其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
特征
序列:SEQ ID 116
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:11
<223>其它信息:x代表琥珀密码子编码的氨基酸残基
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg gggggagctt cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 117
     序列描述:
惯用密码子
序列名称:SEQ ID 117
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGELH                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 118
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaggctg cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 119
     序列描述:
惯用密码子
序列名称:SEQ ID 119
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGRLH                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 120
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggcagctt cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 121
     序列描述:
惯用密码子
序列名称:SEQ ID 121
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGQLH                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 122
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaaggtt cat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 123
     序列描述:
惯用密码子
序列名称:SEQ ID 123
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKVH                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 124
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaaggtg aat                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 125
     序列描述:
惯用密码子
序列名称:SEQ ID 125
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKVN                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 126
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gccgttacaa ctgacagctg ggggaagctt ctg                              33
<212>类型:DNA
<211>长度:33
     序列名称:SEQ ID 127
     序列描述:
惯用密码子
序列名称:SEQ ID 127
序列
<213>生物体名称:人工序列
<400>前序列串:
AVTTDSWGKLL                           11
<212>类型:PRT
<211>长度:11
     序列名称:SEQ ID 128
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ggaattcatc gatgcagaag gaagtggagc ag                                32
<212>类型:DNA
<211>长度:32
     序列名称:SEQ ID 129
     序列描述:
惯用密码子
序列名称:SEQ ID 129
序列
<213>生物体名称:人工序列
<400>前序列串:
gtacacggcc gggtcagggt tctggatata c                                31
<212>类型:DNA
<211>长度:31
     序列名称:SEQ ID 130
     序列描述:
惯用密码子
序列名称:SEQ ID 130
序列
<213>生物体名称:人工序列
<400>前序列串:
tctctcatta atgaatgctg gtgtcactca gacccc                           36
<212>类型:DNA
<211>长度:36
     序列名称:SEQ ID 131
     序列描述:
惯用密码子
序列名称:SEQ ID 131
序列
 <213>生物体名称:人工序列
<400>前序列串:
tagaaaccgg tggccaggca caccagtgtg gc                               32
<212>类型:DNA
<211>长度:32
     序列名称:SEQ ID 132
     序列描述:
惯用密码子
序列名称:SEQ ID 132
序列
<213>生物体名称:人工序列
<400>前序列串:
ctgctctggt tccgcactc                                              19
<212>类型:DNA
<211>长度:19
     序列名称:SEQ ID 133
     序列描述:
惯用密码子
序列名称:SEQ ID 133
序列
<213>生物体名称:人工序列
<400>前序列串:
gagtgcggaa ccagagcag                                              19
<212>类型:DNA
<211>长度:19
     序列名称:SEQ ID 134
     序列描述:
惯用密码子
序列名称:SEQ ID 134
序列
<213>生物体名称:人工序列
<400>前序列串:
atatccagaa cccggatcct gccgtgta                                    28
<212>类型:DNA
<211>长度:28
     序列名称:SEQ ID 135
     序列描述:
惯用密码子
序列名称:SEQ ID 135
序列
<213>生物体名称:人工序列
<400>前序列串:
tacacggcag gaatccgggt tctggatat                                   29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 136
     序列描述:
惯用密码子
序列名称:SEQ ID 136
序列
<213>生物体名称:人工序列
<400>前序列串:
ggagatatac atatgcagga ggtgacacag                                  30
<212>类型:DNA
<211>长度:30
     序列名称:SEQ ID 137
     序列描述:
惯用密码子
序列名称:SEQ ID 137
序列
<213>生物体名称:人工序列
<400>前序列串:
tacacggcag gatccgggtt ctggatatt                                   29
<212>类型:DNA
<211>长度:29
     序列名称:SEQ ID 138
     序列描述:
惯用密码子
序列名称:SEQ ID 138
序列
<213>生物体名称:人工序列
<400>前序列串:
ggagatatac atatgggtgt cactcagacc                                  30
<212>类型:DNA
<211>长度:30
     序列名称:SEQ ID 139
     序列描述:
惯用密码子
序列名称:SEQ ID 139
序列
<213>生物体名称:人工序列
<400>前序列串:
cccaagctta gtctgctcta ccccaggcct cggc                             34
<212>类型:DNA
<211>长度:34
     序列名称:SEQ ID 140
     序列描述:
惯用密码子
序列名称:SEQ ID 140
序列
<213>生物体名称:人工序列
<400>前序列串:
gccggccatg gccaaacagg aggtgacgca gattcct                          37
<212>类型:DNA
<211>长度:37
     序列名称:SEQ ID 141
     序列描述:
惯用密码子
序列名称:SEQ ID 141
序列
<213>生物体名称:人工序列
<400>前序列串:
cttcttaaag aattcttaat taacctaggt tattaggaac tttctgggct ggggaag    57
<212>类型:DNA
<211>长度:57
     序列名称:SEQ ID 142
     序列描述:
惯用密码子
序列名称:SEQ ID 142
序列
<213>生物体名称:人工序列
<400>前序列串:
tcacagcgcg caggctggtg tcactcagac cccaaa                           36
<212>类型:DNA
<211>长度:36
     序列名称:SEQ ID 143
     序列描述:
惯用密码子
序列名称:SEQ ID 143
序列
<213>生物体名称:人工序列
<400>前序列串:
cgagagcccg tagaactgga cttg                                        24
<212>类型:DNA
<211>长度:24
     序列名称:SEQ ID 144
     序列描述:
惯用密码子
序列名称:SEQ ID 144
序列
<213>生物体名称:人工序列
<400>前序列串:
tctctcatta atgaatgctg gtgtcactca gacccc                           36
<212>类型:DNA
<211>长度:36
     序列名称:SEQ ID 145
     序列描述:
惯用密码子
序列名称:SEQ ID 145
序列
<213>生物体名称:人工序列
<400>前序列串:
tagaaaccgg tggccaggca caccagtgtg g                                31
<212>类型:DNA
<211>长度:31
     序列名称:SEQ ID 146
     序列描述:
惯用密码子
序列名称:SEQ ID 146
序列
<213>生物体名称:人工序列
<400>前序列串:
atgcagaagg aagtggagca gaactctgga cccctcagtg ttccagaggg agccattgcc  60
tctctcaact gcacttacag tgaccgaggt tcccagtcct tcttctggta cagacaatat 120
tctgggaaaa gccctgagtt gataatgtcc atatactcca atggtgacaa agaagatgga 180
aggtttacag cacagctcaa taaagccagc cagtatgttt ctctgctcat cagagactcc 240
cagcccagtg attcagccac ctacctctgt gccgttacaa ctgacagctg ggggaaattg 300
cagtttggag cagggaccca ggttgtggtc accccagata tccagaaccc tgaccctgcc 360
gtgtaccagc tgagagactc taaatccagt gacaagtctg tctgcctatt caccgatttt 420
gattctcaaa caaatgtgtc acaaagtaag gattctgatg tgtatatcac agacaaatgt 480
gtgctagaca tgaggtctat ggacttcaag agcaacagtg ctgtggcctg gagcaacaaa 540
tctgactttg catgtgcaaa cgccttcaac aacagcatta ttccagaaga caccttcttc 600
cccagcccag aaagttccta a                                           621
<212>类型:DNA
<211>长度:621
     序列名称:SEQ ID 147
     序列描述:
惯用密码子
序列名称:SEQ ID 147
序列
<213>生物体名称:人工序列
<400>前序列串:
atgaacgctg gtgtcactca gaccccaaaa ttccaggtcc tgaagacagg acagagcatg  60
acactgcagt gtgcccagga tatgaaccat gaatacatgt cctggtatcg acaagaccca 120
ggcatggggc tgaggctgat tcattactca gttggtgctg gtatcactga ccaaggagaa 180
gtccccaatg gctacaatgt ctccagatca accacagagg atttcccgct caggctgctg 240
tcggctgctc cctcccagac atctgtgtac ttctgtgcca gcaggccggg actagcggga 300
gggcgaccag agcagtactt cgggccgggc accaggctca cggtcacaga ggacctgaaa 360
aacgtgttcc cacccgaggt cgctgtgttt gagccatcag aagcagagat ctcccacacc 420
caaaaggcca cactggtgtg cctggccaca ggcttctacc ccgaccacgt ggagctgagc 480
tggtgggtga atgggaagga ggtgcacagt ggggtctgca cagacccgca gcccctcaag 540
gagcagcccg ccctcaatga ctccagatac gctctgagca gccgcctgag ggtctcggcc 600
accttctggc aggacccccg caaccacttc cgctgtcaag tccagttcta cgggctctcg 660
gagaatgacg agtggaccca ggatagggcc aaacccgtca cccagatcgt cagcgccgag 720
gcctggggta gagcagacta a                                           741
<212>类型:DNA
<211>长度:741
     序列名称:SEQ ID 148
     序列描述:
惯用密码子
序列名称:SEQ ID 148
序列
<213>生物体名称:人工序列
<400>前序列串:
MQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKEDG           60
RFTAQLNKASQYVSLLIRDSQPSDSATYLCAVTTDSWGKLQFGAGTQVVVTPDIQNPDPA          120
VYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNK          180
SDFACANAFNNSIIPEDTFFPSPESS                                            206
<212>类型:PRT
<211>长度:206
     序列名称:SEQ ID 149
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE           60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVTEDLK          120
NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLK          180
EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE          240
AWGRAD                                                                246
<212>类型:PRT
<211>长度:246
     序列名称:SEQ ID 150
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt  60
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300
gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360
gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020
ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080
aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320
ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440
gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500
cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280
ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340
accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400
acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta taataatatt 2460
ctatttcaag gagacagtca taatgaaata cctattgcct acggcagccg ctggattgtt 2520
attactcgcg gcccagccgg ccatggccca gaaggaagtg gagcagaact ctggacccct 2580
cagtgttcca gagggagcca ttgcctctct caactgcact tacagtgacc gaggttccca 2640
gtccttcttc tggtacagac aatattctgg gaaaagccct gagttgataa tgtccatata 2700
ctccaatggt gacaaagaag atggaaggtt tacagcacag ctcaataaag ccagccagta 2760
tgtttctctg ctcatcagag actcccagcc cagtgattca gccacctacc tctgtgccgt 2820
tacaactgac agctggggga aattgcagtt tggagcaggg acccaggttg tggtcacccc 2880
agatatccag aaccctgacc ctgccgtgta ccagctgaga gactctaaat ccagtgacaa 2940
gtctgtctgc ctattcaccg attttgattc tcaaacaaat gtgtcacaaa gtaaggattc 3000
tgatgtgtat atcacagaca aatgtgtgct agacatgagg tctatggact tcaagagcaa 3060
cagtgctgtg gcctggagca acaaatctga ctttgcatgt gcaaacgcct tcaacaacag 3120
cattattcca gaagacacct tcttccccag cccagaaagt tcctaataac ctaggttaat 3180
taagaattct ttaagaagga gatatacata tgaaaaaatt attattcgca attcctttag 3240
ttgttccttt ctattctcac agcgcgcagg ctggtgtcac tcagacccca aaattccagg 3300
tcctgaagac aggacagagc atgacactgc agtgtgccca ggatatgaac catgaataca 3360
tgtcctggta tcgacaagac ccaggcatgg ggctgaggct gattcattac tcagttggtg 3420
ctggtatcac tgaccaagga gaagtcccca atggctacaa tgtctccaga tcaaccacag 3480
aggatttccc gctcaggctg ctgtcggctg ctccctccca gacatctgtg tacttctgtg 3540
ccagcaggcc gggactagcg ggagggcgac cagagcagta cttcgggccg ggcaccaggc 3600
tcacggtcac agaggacctg aaaaacgtgt tcccacccga ggtcgctgtg tttgagccat 3660
cagaagcaga gatctcccac acccaaaagg ccacactggt gtgcctggcc acaggcttct 3720
accccgacca cgtggagctg agctggtggg tgaatgggaa ggaggtgcac agtggggtct 3780
gcacagaccc gcagcccctc aaggagcagc ccgccctcaa tgactccaga tacgctctga 3840
gcagccgcct gagggtctcg gccaccttct ggcaggaccc ccgcaaccac ttccgctgtc 3900
aagtccagtt ctacgggctc tcggagaatg acgagtggac ccaggatagg gccaaacccg 3960
tcacccagat cgtcagcgcc gaggcctggg gtagagcaga cgcggccgca tctagacatc 4020
atcaccatca tcactagact gttgaaagtt gtttagcaaa accccataca gaaaattcat 4080
ttactaacgt ctggaaagac gacaaaactt tagatcgtta cgctaactat gagggttgtc 4140
tgtggaatgc tacaggcgtt gtagtttgta ctggtgacga aactcagtgt tacggtacat 4200
gggttcctat tgggcttgct atccctgaaa atgagggtgg tggctctgag ggtggcggtt 4260
ctgagggtgg cggttctgag ggtggcggta ctaaacctcc tgagtacggt gatacaccta 4320
ttccgggcta tacttatatc aaccctctcg acggcactta tccgcctggt actgagcaaa 4380
accccgctaa tcctaatcct tctcttgagg agtctcagcc tcttaatact ttcatgtttc 4440
agaataatag gttccgaaat aggcaggggg cattaactgt ttatacgggc actgttactc 4500
aaggcactga ccccgttaaa acttattacc agtacactcc tgtatcatca aaagccatgt 4560
atgacgctta ctggaacggt aaattcagag actgcgcttt ccattctggc tttaatgagg 4620
atccattcgt ttgtgaatat caaggccaat cgtctgacct gcctcaacct cctgtcaatg 4680
ctggcggcgg ctctggtggt ggttctggtg gcggctctga gggtggtggc tctgagggtg 4740
gcggttctga gggtggcggc tctgagggag gcggttccgg tggtggctct ggttccggtg 4800
attttgatta tgaaaagatg gcaaacgcta ataagggggc tatgaccgaa aatgccgatg 4860
aaaacgcgct acagtctgac gctaaaggca aacttgattc tgtcgctact gattacggtg 4920
ctgctatcga tggtttcatt ggtgacgttt ccggccttgc taatggtaat ggtgctactg 4980
gtgattttgc tggctctaat tcccaaatgg ctcaagtcgg tgacggtgat aattcacctt 5040
taatgaataa tttccgtcaa tatttacctt ccctccctca atcggttgaa tgtcgccctt 5100
ttgtctttag cgctggtaaa ccatatgaat tttctattga ttgtgacaaa ataaacttat 5160
tccgtggtgt ctttgcgttt cttttatatg ttgccacctt tatgtatgta ttttctacgt 5220
ttgctaacat actgcgtaat aaggagtctt aataaggtac cctctagtca aggcctatag 5280
tgagtcgtat tacggactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 5340
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 5400
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcttcgc 5460
ttggtaataa agcccgcttc ggcgggcttt ttttt                            5495
<212>类型:DNA
<211>长度:5495
     序列名称:SEQ ID 151
     序列描述:
惯用密码子
序列名称:SEQ ID 151
序列
<213>生物体名称:人工序列
<400>前序列串:
agctgcagct aatacgactc actataggaa caggccacca tgggccagaa ggaagtggag  60
cagaactctg gacccctcag tgttccagag ggagccattg cctctctcaa ctgcacttac 120
agtgaccgag gttcccagtc cttcttctgg tacagacaat attctgggaa aagccctgag 180
ttgataatgt ccatatactc caatggtgac aaagaagatg gaaggtttac agcacagctc 240
aataaagcca gccagtatgt ttctctgctc atcagagact cccagcccag tgattcagcc 300
acctacctct gtgccgttac aactgacagc tgggggaaat tgcagtttgg agcagggacc 360
caggttgtgg tcaccggtgg aggcggttca ggcggaggtg gatccggcgg tggcgggtcg 420
aacgctggtg tcactcagac cccaaaattc caggtcctga agacaggaca gagcatgaca 480
ctgcagtgtg cccaggatat gaaccatgaa tacatgtcct ggtatcgaca agacccaggc 540
atggggctga ggctgattca ttactcagtt ggtgctggta tcactgacca aggagaagtc 600
cccaatggct acaatgtctc cagatcaacc acagaggatt tcccgctcag gctgctgtcg 660
gctgctccct cccagacatc tgtgtacttc tgtgccagca ggccgggact agcgggaggg 720
cgaccagagc agtacttcgg gccgggcacc aggctcacgg tcacagagga cctgaaaaac 780
gtgttcccac ccgaggtcgc tgtgtttgag ccatcagaag cagagatctc ccacacccaa 840
aaggccacac tggtgtgcct ggccacaggc ttctaccccg accacgtgga gctgagctgg 900
tgggtgaatg ggaaggaggt gcacagtggg gtcagcacag acccgcagcc cctcaaggag 960
cagcccgccc tcaatgactc cagatacgct ctgagcagcc gcctgagggt ctcggccacc 1020
ttctggcagg acccccgcaa ccacttccgc tgtcaagtcc agttctacgg gctctcggag 1080
aatgacgagt ggacccagga tagggccaaa cccgtcaccc agatcgtcag cgccgaggcc 1140
tggggtagag cagacggtgg aggcggttca ctcagcagca ccctgacgct gagcaaagca 1200
gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct gagttcgccc 1260
gtcacaaaga gcttcaaccg cggagagtca taagaattct cag                   1303
<212>类型:DNA
<211>长度:1303
     序列名称:SEQ ID 152
     序列描述:
惯用密码子
序列名称:SEQ ID 152
序列
<213>生物体名称:人工序列
<400>前序列串:
MGQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKED       60
GRFTAQLNKASQYVSLLIRDSPSDSATYLCAVTTDSWGKLQFGAGTQVVVTGGGGSGGGG      120
SGGGGSNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGI      180
TDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTV      240
TEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTD      300
PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ      360
IVSAEAWGRADGGGGSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGES          416
<212>类型:PRT
<211>长度:416
     序列名称:SEQ ID 153
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ctgctttccc ggagcactat gcggataaaa atatccaatt acagtactat tattaccaaa  60
gaatctgcag tccaccgtga aaagcccctt tacacgcgcc ttggggataa acaaataaaa 120
agatttatgt aagtttatac ataggcgagt actctgttat tgggactatt tacgaagtta 180
ttataacttt ttccttctca tactcataag ttgtaaaggc acagcgggaa taagggaaaa 240
aacgccgtaa aacggaagga caaaaacgag tgggtctttg cgaccacttt cattttctac 300
gacttctagt caacccacgt gctcacccaa tgtagcttga cctagagttg tcgccattct 360
aggaactctc aaaagcgggg cttcttgcaa aaggttacta ctcgtgaaaa tttcaagacg 420
atacaccgcg ccataatagg gcataactgc ggcccgttct cgttgagcca gcggcgtatg 480
tgataagagt cttactgaac caactcatga gtggtcagtg tcttttcgta gaatgcctac 540
cgtactgtca ttctcttaat acgtcacgac ggtattggta ctcactattg tgacgccggt 600
tgaatgaaga ctgttgctag cctcctggct tcctcgattg gcgaaaaaac gtgttgtacc 660
ccctagtaca ttgagcggaa ctagcaaccc ttggcctcga cttacttcgg tatggtttgc 720
tgctcgcact gtggtgctac ggacatcgtt accgttgttg caacgcgttt gataattgac 780
cgcttgatga atgagatcga agggccgttg ttaattatct gacctacctc cgcctatttc 840
aacgtcctgg tgaagacgcg agccgggaag gccgaccgac caaataacga ctatttagac 900
ctcggccact cgcacccaga gcgccatagt aacgtcgtga ccccggtcta ccattcggga 960
gggcatagca tcaatagatg tgctgcccct cagtccgttg atacctactt gctttatctg1020
tctagcgact ctatccacgg agtgactaat tcgtaaccat tgacagtctg gttcaaatga1080
gtatatatga aatctaacta aattttgaag taaaaattaa attttcctag atccacttct1140
aggaaaaact attagagtac tggttttagg gaattgcact caaaagcaag gtgactcgca1200
gtctggggca tcttttctag tttcctagaa gaactctagg aaaaaaagac gcgcattaga1260
cgacgaacgt ttgttttttt ggtggcgatg gtcgccacca aacaaacggc ctagttctcg1320
atggttgaga aaaaggcttc cattgaccga agtcgtctcg cgtctatggt ttatgacagg1380
aagatcacat cggcatcaat ccggtggtga agttcttgag acatcgtggc ggatgtatgg1440
agcgagacga ttaggacaat ggtcaccgac gacggtcacc gctattcagc acagaatggc1500
ccaacctgag ttctgctatc aatggcctat tccgcgtcgc cagcccgact tgccccccaa1560
gcacgtgtgt cgggtcgaac ctcgcttgct ggatgtggct tgactctatg gatgtcgcac1620
tcgatactct ttcgcggtgc gaagggcttc cctctttccg cctgtccata ggccattcgc1680
cgtcccagcc ttgtcctctc gcgtgctccc tcgaaggtcc ccctttgcgg accatagaaa1740
tatcaggaca gcccaaagcg gtggagactg aactcgcagc taaaaacact acgagcagtc1800
cccccgcctc ggataccttt ttgcggtcgt tgcgccggaa aaatgccaag gaccggaaaa1860
cgaccggaaa acgagtgtac aagaaaggac gcaatagggg actaagacac ctattggcat1920
aatggcggaa actcactcga ctatggcgag cggcgtcggc ttgctggctc gcgtcgctca1980
gtcactcgct ccttcgcctt ctcgcgggtt atgcgtttgg cggagagggg cgcgcaaccg2040
gctaagtaat tacgtcgacc gtgctgtcca aagggctgac ctttcgcccg tcactcgcgt2100
tgcgttaatt acactcaatc gagtgagtaa tccgtggggt ccgaaatgtg aaatacgaag2160
gccgagcata caacacacct taacactcgc ctattgttaa agtgtgtcct ttgtcgatac2220
tggtactaat gcggttcgac gtcgattatg ctgagtgata tccttgtccg gtggtaccct2280
aggggcccat ggctcgagct taagtgaccg gcagcaaaat gttgcagcac tgaccctttt2340
gggaccgcaa tgggttgaat tagcggaacg tcgtgtaggg ggaaagcggt cgaccgcatt2400
atcgcttctc cgggcgtggc tagcgggaag ggttgtcaac gcgtcggact taccgcttac2460
cgcggactac gccataaaag aggaatgcgt agacacgcca taaagtgtgg cgtataccac2520
gtgagagtca tgttagacga gactacggcg tatcaattcg gtcggggctg tgggcggttg2580
tgggcgactg cgcgggactg cccgaacaga cgagggccgt aggcgaatgt ctgttcgaca2640
ctggcagagg ccctcgacgt acacagtctc caaaagtggc agtagtggct ttgcgcgct 2699
<212>类型:DNA
<211>长度:2699
     序列名称:SEQ ID 154
     序列描述:
惯用密码子
序列名称:SEQ ID 154
序列
<213>生物体名称:人工序列
<400>前序列串:
ccatgggcca gaaggaagtg gagcagaact ctggacccct cagtgttcca gagggagcca  60
ttgcctctct caactgcact tacagtgacc gaggttccca gtccttcttc tggtacagac 120
aatattctgg gaaaagccct gagttgataa tgtccatata ctccaatggt gacaaagaag 180
atggaaggtt tacagcacag ctcaataaag ccagccagta tgtttctctg ctcatcagag 240
actcccagcc cagtgattca gccacctacc tctgtgccgt tacaactgac agctggggga 300
aattgcagtt tggagcaggg acccaggttg tggtcaccgg tggaggcggt tcaggcggag 360
gtggatccgg cggtggcggg tcgaacgctg gtgtcactca gaccccaaaa ttccaggtcc 420
tgaagacagg acagagcatg acactgcagt gtgcccagga tatgaaccat gaatacatgt 480
cctggtatcg acaagaccca ggcatggggc tgaggctgat tcattactca gttggtgctg 540
gtatcactga ccaaggagaa gtccccaatg gctacaatgt ctccagatca accacagagg 600
atttcccgct caggctgctg tcggctgctc cctcccagac atctgtgtac ttctgtgcca 660
gcaggccggg actagcggga gggcgaccag agcagtactt cgggccgggc accaggctca 720
cggtcacaga ggacctgaaa aacgtgttcc cacccgaggt cgctgtgttt gagccatcag 780
aagcagagat ctcccacacc caaaaggcca cactggtgtg cctggccaca ggcttctacc 840
ccgaccacgt ggagctgagc tggtgggtga atgggaagga ggtgcacagt ggggtcagca 900
cagacccgca gcccctcaag gagcagcccg ccctcaatga ctccagatac gctctgagca 960
gccgcctgag ggtctcggcc accttctggc aggacccccg caaccacttc cgctgtcaag1020
tccagttcta cgggctctcg gagaatgacg agtggaccca ggatagggcc aaacccgtca1080
cccagatcgt cagcgccgag gcctggggta gagcagacgg tggaggcggt tcactcagca1140
gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc tgcgaagtca1200
cccatcaggg cctgagttcg cccgtcacaa agagcttcaa ccgcggagag tcataagaat1260
tc                                                               1262
<212>类型:DNA
<211>长度:1262
     序列名称:SEQ ID 155
     序列描述:
惯用密码子
序列名称:SEQ ID 155
序列
<213>生物体名称:人工序列
<400>前序列串:
gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg  60
cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120
gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180
aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240
gctccctccc agacatctgt gtacttctgt gccagcaggc cgggactagc gggagggtga 300
ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360
ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420
gccacactgg tgtgcctggc cacaggcttc taccccgacc acgtggagct gagctggtgg 480
gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540
cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600
tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660
gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720
ggtagagcag ac                                                     732
<212>类型:DNA
<211>长度:732
     序列名称:SEQ ID 156
     序列描述:
惯用密码子
序列名称:SEQ ID 156
序列
<213>生物体名称:人工序列
<400>前序列串:
AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP            60
NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGXPEQYFGPGTRLTVTEDLKNV           120
FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ           180
PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW           240
GRAD                                                                   244
<212>类型:PRT
<211>长度:244
     序列名称:SEQ ID 157
     序列描述:
特征
序列:SEQ ID 157
<221>特征关键词:MISC_EATURE
<222>起始位置:1
<222>终止位置:244
     其它信息:X代表乳白密码子编码的氨基酸残基,这通常被翻译成色氨酸
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg  60
tagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120
gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180
aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240
gctccctccc agacatctgt gtacttctgt gccagcaggc cgggactagc gggagggcga 300
ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360
ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420
gccacactgg tgtgcctggc cacaggcttc taccccgacc acgtggagct gagctggtgg 480
gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540
cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600
tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660
gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720
ggtagagcag ac                                                     732
<212>类型:DNA
<211>长度:732
     序列名称:SEQ ID 158
     序列描述:
惯用密码子
序列名称:SEQ ID 158
序列
<213>生物体名称:人工序列
<400>前序列串:
gctggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg  60
cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120
gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180
aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240
gctccctccc agacatctgt gtacttctgt gcctcgaggc cggggctgat gagtgcggaa 300
ccagagcagt acttcgggcc gggcaccagg ctcacggtca cagaggacct gaaaaacgtg 360
ttcccacccg aggtcgctgt gtttgagcca tcagaagcag agatctccca cacccaaaag 420
gccacactgg tgtgcctggc caccggtttc taccccgacc acgtggagct gagctggtgg 480
gtgaatggga aggaggtgca cagtggggtc tgcacagacc cgcagcccct caaggagcag 540
cccgccctca atgactccag atacgctctg agcagccgcc tgagggtctc ggccaccttc 600
tggcaggacc cccgcaacca cttccgctgt caagtccagt tctacgggct ctcggagaat 660
gacgagtgga cccaggatag ggccaaaccc gtcacccaga tcgtcagcgc cgaggcctgg 720
ggtagagcag actaagcttg aattc                                       745
<212>类型:DNA
<211>长度:745
     序列名称:SEQ ID 159
     序列描述:
惯用密码子
序列名称:SEQ ID 159
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE         60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAEPEQYFGPGTRLTVTEDLK        120
NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWWNGKEVHSGVCTDPQPLK        180
EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE        240
AWGRAD                                                              246
<212>类型:PRT
<211>长度:246
     序列名称:SEQ ID 160
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP         60
NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAQPEQYFGPGTRLTVTEDLKNV        120
FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ        180
PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW        240
GRAD                                                                244
<212>类型:PRT
<211>长度:244
     序列名称:SEQ ID 161
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
atgcaggagg tgacacagat tcctgcagct ctgagtgtcc cagaaggaga aaacttggtt  60
ctcaactgca gtttcactga tagcgctatt tacaacctcc agtggtttag gcaggaccct 120
gggaaaggtc tcacatctct gttgcttatt cagtcaagtc agagagagca aacaagtgga 180
agacttaatg cctcgctgga taaatcatca ggacgtagta ctttatacat tgcagcttct 240
cagcctggtg actcagccac ctacctctgt gctgtgaggc ccacatcagg aggaagctac 300
atacctacat ttggaagagg aaccagcctt attgttcatc cgtatatcca gaaccctgac 360
cctgccgtgt accagctgag agactctaaa tccagtgaca agtctgtctg cctattcacc 420
gattttgatt ctcaaacaaa tgtgtcacaa agtaaggatt ctgatgtgta tatcacagac 480
aaatgtgtgc tagacatgag gtctatggac ttcaagagca acagtgctgt ggcctggagc 540
aacaaatctg actttgcatg tgcaaacgcc ttcaacaaca gcattattcc agaagacacc 600
ttcttcccca gcccagaaag ttcctaa                                     627
<212>类型:DNA
<211>长度:627
     序列名称:SEQ ID 162
     序列描述:
惯用密码子
序列名称:SEQ ID 162
序列
<213>生物体名称:人工序列
<400>前序列串:
atgggtgtca ctcagacccc aaaattccag gtcctgaaga caggacagag catgacactg  60
cagtgtgccc aggatatgaa ccatgaatac atgtcctggt atcgacaaga cccaggcatg 120
gggctgaggc tgattcatta ctcagttggt gctggtatca ctgaccaagg agaagtcccc 180
aatggctaca atgtctccag atcaaccaca gaggatttcc cgctcaggct gctgtcggct 240
gctccctccc agacatctgt gtacttctgt gccagcagtt acgtcgggaa caccggggag 300
ctgttttttg gagaaggctc taggctgacc gtactggagg acctgaaaaa cgtgttccca 360
cccgaggtcg ctgtgtttga gccatcagaa gcagagatct cccacaccca aaaggccaca 420
ctggtgtgcc tggccacagg cttctacccc gaccacgtgg agctgagctg gtgggtgaat 480
gggaaggagg tgcacagtgg ggtctgcaca gacccgcagc ccctcaagga gcagcccgcc 540
ctcaatgact ccagatacgc tctgagcagc cgcctgaggg tctcggccac cttctggcag 600
gacccccgca accacttccg ctgtcaagtc cagttctacg ggctctcgga gaatgacgag 660
tggacccagg atagggccaa acccgtcacc cagatcgtca gcgccgaggc ctggggtaga 720
gcagactaa                                                         729
<212>类型:DNA
<211>长度:729
     序列名称:SEQ ID 163
     序列描述:
惯用密码子
序列名称:SEQ ID 163
序列
<213>生物体名称:人工序列
<400>前序列串:
MQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQDPGKGLTSLLLIQSSQREQTSG         60
RLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGSYIPTFGRGTSLIVHPYIQNPD        120
PAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWS        180
NKSDFACANAFNNSIIPEDTFFPSPESS                                        208
<212>类型:PRT
<211>长度:208
     序列名称:SEQ ID 164
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
MGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP         60
NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTVLEDLKNVFP        120
PEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQPa        180
LNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGR        240
AD                                                                  242
<212>类型:PRT
<211>长度:242
     序列名称:SEQ ID 165
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca aaggaccgga  60
aaacgaccgg aaaacgagtg tacattacac tcaatcgagt ctcattaggc accccaggct 120
ttacacttta tgcttccggc tcgtatgttg gagtaatccg tggggtccga aatgtgaaat 180
acgaaggccg agcatacaac tgtggaattg tgagcggata acaatttcac acaggaaaca 240
gctatgacca acaccttaac actcgcctat tgttaaagtg tgtcctttgt cgatactggt 300
tgattacgcc aagctacgta cttaagtatt ctatttcaag gagacagtca actaatgcgg 360
ttcgatgcat gaattcataa gataaagttc ctctgtcagt taatgaaata cctattgcct 420
acggcagccg ctggattgtt attactcgcg attactttat ggataacgga tgccgtcggc 480
gacctaacaa taatgagcgc gcccagccgg ccatggccaa acaggaggtg acgcagattc 540
ctgcagctct cgggtcggcc ggtaccggtt tgtcctccac tgcgtctaag gacgtcgaga 600
gagtgtccca gaaggagaaa acttggttct caactgcagt ttcactgata ctcacagggt 660
cttcctcttt tgaaccaaga gttgacgtca aagtgactat gcgctattta caacctccag 720
tggtttaggc aggaccctgg gaaaggtctc cgcgataaat gttggaggtc accaaatccg 780
tcctgggacc ctttccagag acatctctgt tgcttattca gtcaagtcag agagagcaaa 840
caagtggaag tgtagagaca acgaataagt cagttcagtc tctctcgttt gttcaccttc 900
acttaatgcc tcgctggata aatcatcagg acgtagtact ttatacattg tgaattacgg 960
agcgacctat ttagtagtcc tgcatcatga aatatgtaac cagcttctca gcctggtgac1020
tcagccacct acctctgtgc tgtgaggccc gtcgaagagt cggaccactg agtcggtgga1080
tggagacacg acactccggg acatcaggag gaagctacat acctacattt ggaagaggaa1140
ccagccttat tgtagtcctc cttcgatgta tggatgtaaa ccttctcctt ggtcggaata1200
tgttcatccg tatatccaga acccggatcc tgccgtgtac cagctgagag acaagtaggc1260
atataggtct tgggcctagg acggcacatg gtcgactctc actctaaatc cagtgacaag1320
tctgtctgcc tattcaccga ttttgattct tgagatttag gtcactgttc agacagacgg1380
ataagtggct aaaactaaga caaacaaatg tgtcacaaag taaggattct gatgtgtata1440
tcacagacaa gtttgtttac acagtgtttc attcctaaga ctacacatat agtgtctgtt1500
atgtgtgcta gacatgaggt ctatggactt caagagcaac agtgctgtgg tacacacgat1560
ctgtactcca gatacctgaa gttctcgttg tcacgacacc cctggagcaa caaatctgac1620
tttgcatgtg caaacgcctt caacaacagc ggacctcgtt gtttagactg aaacgtacac1680
gtttgcggaa gttgttgtcg attattccag aagacacctt cttccccagc ccagaaagtt1740
cctaataacc taataaggtc ttctgtggaa gaaggggtcg ggtctttcaa ggattattgg1800
taggttaatt aagaattctt taagaagggg atatacatat gaaaaaatta atccaattaa1860
ttcttaagaa attcttcccc tatatgtata cttttttaat ttattcgcaa ttcctttagt1920
tgttcctttc tattctcaca gcgcgcaggc aataagcgtt aaggaaatca acaaggaaag1980
ataagagtgt cgcgcgtccg tggtgtcact cagaccccaa aattccaggt cctgaagaca2040
ggacagagca accacagtga gtctggggtt ttaaggtcca ggacttctgt cctgtctcgt2100
tgacactgca gtgtgcccag gatatgaacc atgaatacat gtcctggtat actgtgacgt2160
cacacgggtc ctatacttgg tacttatgta caggaccata cgacaagacc caggcatggg2220
gctgaggctg attcattact cagttggtgc gctgttctgg gtccgtaccc cgactccgac2280
taagtaatga gtcaaccacg tggtatcact gaccaaggag aagtccccaa tggctacaat2340
gtctccagat accatagtga ctggttcctc ttcaggggtt accgatgtta cagaggtcta2400
caaccacaga ggatttcccg ctcaggctgc tgtcggctgc tccctcccag gttggtgtct2460
cctaaagggc gagtccgacg acagccgacg agggagggtc acatctgtgt acttctgtgc2520
cagcagttac gtcgggaaca ccggggagct tgtagacaca tgaagacacg gtcgtcaatg2580
cagcccttgt ggcccctcga gttttttgga gaaggctcta ggctgaccgt actggaggac2640
ctgaaaaacg caaaaaacct cttccgagat ccgactggca tgacctcctg gactttttgc2700
tgttcccacc cgaggtcgct gtgtttgagc catcagaagc agagatctcc acaagggtgg2760
gctccagcga cacaaactcg gtagtcttcg tctctagagg cacacccaaa aggccacact2820
ggtgtgcctg gccacaggct tctaccccga gtgtgggttt tccggtgtga ccacacggac2880
cggtgtccga agatggggct ccacgtggag ctgagctggt gggtgaatgg gaaggaggtg2940
cacagtgggg ggtgcacctc gactcgacca cccacttacc cttcctccac gtgtcacccc3000
tctgcacaga cccgcagccc ctcaaggagc agcccgccct caatgactcc agacgtgtct3060
gggcgtcggg gagttcctcg tcgggcggga gttactgagg agatacgctc tgagcagccg3120
cctgagggtc tcggccacct tctggcagga tctatgcgag actcgtcggc ggactcccag3180
agccggtgga agaccgtcct cccccgcaac cacttccgct gtcaagtcca gttctacggg3240
ctctcggaga gggggcgttg gtgaaggcga cagttcaggt caagatgccc gagagcctct3300
atgacgagtg gacccaggat agggccaaac ccgtcaccca gatcgtcagc tactgctcac3360
ctgggtccta tcccggtttg ggcagtgggt ctagcagtcg gccgaggcct ggggtagagc3420
agacgcggcc gcacggctcc ggaccccatc tcgtctgcgc cggcgt               3466
<212>类型:DNA
<211>长度:3466
     序列名称:SEQ ID 166
     序列描述:
惯用密码子
序列名称:SEQ ID 166
序列
<213>生物体名称:人工序列
<400>前序列串:
KYLLPTAAAGLLLLAAQPAMAKQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQD           60
PGKGLTSLLLIQSSQREQTSGRLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGS          120
YIPTFGRGTSLIVHPYIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYIT          180
DKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSMKKLLFAIPLV          240
VPFYSHSAQAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGa          300
GITDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTV          260
LEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTD          420
PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ          480
IVSAEAWGRADAAa                                                        494
<212>类型:PRT
<211>长度:494
     序列名称:SEQ ID 167
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
ggatccatgg ccataagtgg agtccctgtg ctaggatttt tcatcatagc tgtgctgatg  60
agcgctcagg aatcatgggc tatcaaagaa gaacatgtga tcatccaggc cgagttctat 120
ctgaatcctg accaatcagg cgagtttatg tttgactttg atggtgatga gattttccat 180
gtggatatgg caaagaagga gacggtctgg cggcttgaag aatttggacg atttgccagc 240
tttgaggctc aaggtgcatt ggccaacata gctgtggaca aagccaacct ggaaatcatg 300
acaaagcgct ccaactatac tccgatcacc aatgtacctc cagaggtaac tgtgctcacg 360
aacagccctg tggaactgag agagcccaac gtcctcatct gtttcatcga caagttcacc 420
ccaccagtgg tcaatgtcac gtggcttcga aatggaaaac ctgtcaccac aggagtgtca 480
gagacagtct tcctgcccag ggaagaccac cttttccgca agttccacta tctccccttc 540
ctgccctcaa ctgaggacgt ttacgactgc agggtggagc actggggctt ggatgagcct 600
cttctcaagc actgggagtt tgatgctcca agccctctcc cagagactac agagaacgtg 660
gatgggggtc tgactgatac actccaagcg gagacagatc aacttgaaga caagaagtct 720
gcgttgcaga ccgagattgc caatctactg aaagagaagg aaaaactaga gttcatcctg 780
gcagcttacg gatctggtgg tggtctgaac gatatttttg aagctcagaa aatcgaatgg 840
catgagtagg atcc                                                   854
<212>类型:DNA
<211>长度:854
     序列名称:SEQ ID 168
     序列描述:
惯用密码子
序列名称:SEQ ID 168
序列
<213>生物体名称:人工序列
<400>前序列串:
aattctactc gtaaagcgag ttgaaggatc atatttagtt gcgtttatga gataagattg  60
aaagcacgtg taaaatgttt cccgcgcgtt ggcacaacta tttacaatgc ggccaagtta 120
taaaagattc taatctgata tgttttaaaa cacctttgcg gcccgagttg tttgcgtacg 180
tgactagcga agaagatgtg tggaccgcag aacagatagt aaaacaaaac cctagtattg 240
gagcaataat cgatttaacc aacacgtcta aatattatga tggtgtgcat tttttgcggg 300
cgggcctgtt atacaaaaaa attcaagtac ctggccagac tttgccgcct gaaagcatag 360
ttcaagaatt tattgacacg gtaaaagaat ttacagaaaa gtgtcccggc atgttggtgg 420
gcgtgcactg cacacacggt attaatcgca ccggttacat ggtgtgcaga tatttaatgc 480
acaccctggg tattgcgccg caggaagcca tagatagatt cgaaaaagcc agaggtcaca 540
aaattgaaag acaaaattac gttcaagatt tattaattta attaatatta tttgcattct 600
ttaacaaata ctttatccta ttttcaaatt gttgcgcttc ttccagcgaa ccaaaactat 660
gcttcgcttg ctccgtttag cttgtagccg atcagtggcg ttgttccaat cgacggtagg 720
attaggccgg atattctcca ccacaatgtt ggcaacgttg atgttacgtt tatgcttttg 780
gttttccacg tacgtctttt ggccggtaat agccgtaaac gtagtgccgt cgcgcgtcac 840
gcacaacacc ggatgtttgc gcttgtccgc ggggtattga accgcgcgat ccgacaaatc 900
caccactttg gcaactaaat cggtgacctg cgcgtctttt ttctgcatta tttcgtcttt 960
cttttgcatg gtttcctgga agccggtgta catgcggttt agatcagtca tgacgcgcgt1020
gacctgcaaa tctttggcct cgatctgctt gtccttgatg gcaacgatgc gttcaataaa1080
ctcttgtttt ttaacaagtt cctcggtttt ttgcgccacc accgcttgca gcgcgtttgt1140
gtgctcggtg aatgtcgcaa tcagcttagt caccaactgt ttgctctcct cctcccgttg1200
tttgatcgcg ggatcgtact tgccggtgca gagcacttga ggaattactt cttctaaaag1260
ccattcttgt aattctatgg cgtaaggcaa tttggacttc ataatcagct gaatcacgcc1320
ggatttagta atgagcactg tatgcggctg caaatacagc gggtcgcccc ttttcacgac1380
gctgttagag gtagggcccc cattttggat ggtctgctca aataacgatt tgtatttatt1440
gtctacatga acacgtatag ctttatcaca aactgtatat tttaaactgt tagcgacgtc1500
cttggccacg aaccggacct gttggtcgcg ctctagcacg taccgcaggt tgaacgtatc1560
ttctccaaat ttaaattctc caattttaac gcgagccatt ttgatacacg tgtgtcgatt1620
ttgcaacaac tattgttttt taacgcaaac taaacttatt gtggtaagca ataattaaat1680
atgggggaac atgcgccgct acaacactcg tcgttatgaa cgcagacggc gccggtctcg1740
gcgcaagcgg ctaaaacgtg ttgcgcgttc aacgcggcaa acatcgcaaa agccaatagt1800
acagttttga tttgcatatt aacggcgatt ttttaaatta tcttatttaa taaatagtta1860
tgacgcctac aactccccgc ccgcgttgac tcgctgcacc tcgagcagtt cgttgacgcc1920
ttcctccgtg tggccgaaca cgtcgagcgg gtggtcgatg accagcggcg tgccgcacgc1980
gacgcacaag tatctgtaca ccgaatgatc gtcgggcgaa ggcacgtcgg cctccaagtg2040
gcaatattgg caaattcgaa aatatataca gttgggttgt ttgcgcatat ctatcgtggc2100
gttgggcatg tacgtccgaa cgttgatttg catgcaagcc gaaattaaat cattgcgatt2160
agtgcgatta aaacgttgta catcctcgct tttaatcatg ccgtcgatta aatcgcgcaa2220
tcgagtcaag tgatcaaagt gtggaataat gttttctttg tattcccgag tcaagcgcag2280
cgcgtatttt aacaaactag ccatcttgta agttagtttc atttaatgca actttatcca2340
ataatatatt atgtatcgca cgtcaagaat taacaatgcg cccgttgtcg catctcaaca2400
cgactatgat agagatcaaa taaagcgcga attaaatagc ttgcgacgca acgtgcacga2460
tctgtgcacg cgttccggca cgagctttga ttgtaataag tttttacgaa gcgatgacat2520
gacccccgta gtgacaacga tcacgcccaa aagaactgcc gactacaaaa ttaccgagta2580
tgtcggtgac gttaaaacta ttaagccatc caatcgaccg ttagtcgaat caggaccgct2640
ggtgcgagaa gccgcgaagt atggcgaatg catcgtataa cgtgtggagt ccgctcatta2700
gagcgtcatg tttagacaag aaagctacat atttaattga tcccgatgat tttattgata2760
aattgaccct aactccatac acggtattct acaatggcgg ggttttggtc aaaatttccg2820
gactgcgatt gtacatgctg ttaacggctc cgcccactat taatgaaatt aaaaattcca2880
attttaaaaa acgcagcaag agaaacattt gtatgaaaga atgcgtagaa ggaaagaaaa2940
atgtcgtcga catgctgaac aacaagatta atatgcctcc gtgtataaaa aaaatattga3000
acgatttgaa agaaaacaat gtaccgcgcg gcggtatgta caggaagagg tttatactaa3060
actgttacat tgcaaacgtg gtttcgtgtg ccaagtgtga aaaccgatgt ttaatcaagg3120
ctctgacgca tttctacaac cacgactcca agtgtgtggg tgaagtcatg catcttttaa3180
tcaaatccca agatgtgtat aaaccaccaa actgccaaaa aatgaaaact gtcgacaagc3240
tctgtccgtt tgctggcaac tgcaagggtc tcaatcctat ttgtaattat tgaataataa3300
aacaattata aatgctaaat ttgtttttta ttaacgatac aaaccaaacg caacaagaac3360
atttgtagta ttatctataa ttgaaaacgc gtagttataa tcgctgaggt aatatttaaa3420
atcattttca aatgattcac agttaatttg cgacaatata attttatttt cacataaact3480
agacgccttg tcgtcttctt cttcgtattc cttctctttt tcatttttct cctcataaaa3540
attaacatag ttattatcgt atccatatat gtatctatcg tatagagtaa attttttgtt3600
gtcataaata tatatgtctt ttttaatggg gtgtatagta ccgctgcgca tagtttttct3660
gtaatttaca acagtgctat tttctggtag ttcttcggag tgtgttgctt taattattaa3720
atttatataa tcaatgaatt tgggatcgtc ggttttgtac aatatgttgc cggcatagta3780
cgcagcttct tctagttcaa ttacaccatt ttttagcagc accggattaa cataactttc3840
caaaatgttg tacgaaccgt taaacaaaaa cagttcacct cccttttcta tactattgtc3900
tgcgagcagt tgtttgttgt taaaaataac agccattgta atgagacgca caaactaata3960
tcacaaactg gaaatgtcta tcaatatata gttgctgatg atccagcatg ataagataca4020
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa4080
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttccgagtt4140
tgtcagaaag cagaccaaac agcggttgga ataatagcga gaacagagaa atagcggcaa4200
aaataatacc cgtatcactt ttgctgatat ggttgatgtc atgtagccaa atcgggaaaa4260
acgggaagta ggctcccatg ataaaaaagt aaaagaaaaa gaataaaccg aacatccaaa4320
agtttgtgtt ttttaaatag tacataatgg atttccttac gcgaaatacg ggcagacatg4380
gcctgcccgg ttattattat ttttgacacc agaccaactg gtaatggtag cgaccggcgc4440
tcagctggaa ttcagatctg tgattgtaaa taaaatgtaa tttacagtat agtattttaa4500
ttaatataca aatgatttga taataattct tatttaacta taatatattg tgttgggttg4560
aattaaaggt cccggcatcc tcaaatgcat aatttcatag tcccccttgt tgtaagtgat4620
gcgtatttct gaatctttgt aaaatagcac acaagactcc aacgcgtttg gcgttttatt4680
ttcttgctcg actctagttt attaggcctc tagagatccg tatttatagg tttttttatt4740
acaaaactgt tacgaaaaca gtaaaatact tatttatttg cgagatggtt atcattttaa4800
ttatctccat gatccaataa acctagaata aagggcccga cctttaattc aacccaacac4860
aatatattat agttaaataa gaattattat caaatcattt gtatattaat taaaatacta4920
tactgtaaat tacattttat ttacaatcac agatcccggg gatccggtta ttagtacatt4980
tattaagcgc tagattctgt gcgttgttga tttacagaca attgttgtac gtattttaat5040
aattcattaa atttataatc tttagggtgg tatgttagag cgaaaatcaa atgattttca5100
gcgtctttat atctgaattt aaatattaaa tcctcaatag atttgtaaaa taggtttcga5160
ttagtttcaa acaagggttg tttttccgaa ccgatggctg gactatctaa tggattttcg5220
ctcaacgcca caaaacttgc caaatcttgt agcagcaatc tagctttgtc gatattcgtt5280
tgtgttttgt tttgtaataa aggttcgacg tcgttcaaaa tattatgcgc ttttgtattt5340
ctttcatcac tgtcgttagt gtacaattga ctcgacgtaa acacgttaaa taaagcttgg5400
acatatttaa catcgggcgt gttagcttta ttaggccgat tatcgtcgtc gtcccaaccc5460
tcgtcgttag aagttgcttc cgaagacgat tttgccatag ccacacgacg cctattaatt5520
gtgtcggcta acacgtccgc gatcaaattt gtagttgagc tttttggaat tatttctgat5580
tgcgggcgtt tttgggcggg tttcaatcta actgtgcccg attttaattc agacaacacg5640
ttagaaagcg atggtgcagg cggtggtaac atttcagacg gcaaatctac taatggcggc5700
ggtggtggag ctgatgataa atctaccatc ggtggaggcg caggcggggc tggcggcgga5760
ggcggaggcg gaggtggtgg cggtgatgca gacggcggtt taggctcaaa tgtctcttta5820
ggcaacacag tcggcacctc aactattgta ctggtttcgg gcgccgtttt tggtttgacc5880
ggtctgagac gagtgcgatt tttttcgttt ctaatagctt ccaacaattg ttgtctgtcg5940
tctaaaggtg cagcgggttg aggttccgtc ggcattggtg gagcgggcgg caattcagac6000
atcgatggtg gtggtggtgg tggaggcgct ggaatgttag gcacgggaga aggtggtggc6060
ggcggtgccg ccggtataat ttgttctggt ttagtttgtt cgcgcacgat tgtgggcacc6120
ggcgcaggcg ccgctggctg cacaacggaa ggtcgtctgc ttcgaggcag cgcttggggt6180
ggtggcaatt caatattata attggaatac aaatcgtaaa aatctgctat aagcattgta6240
atttcgctat cgtttaccgt gccgatattt aacaaccgct caatgtaagc aattgtattg6300
taaagagatt gtctcaagct cggatcgatc ccgcacgccg ataacaagcc ttttcatttt6360
tactacagca ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt atgctttgtt6420
gtcaaaaacg tcgttggcaa gctttaaaat atttaaaaga acatctctgt tcagcaccac6480
tgtgttgtcg taaatgttgt ttttgataat ttgcgcttcc gcagtatcga cacgttcaaa6540
aaattgatgc gcatcaattt tgttgttcct attattgaat aaataagatt gtacagattc6600
atatctacga ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg tacaatttta6660
cgaaaactgc aaaaacgtca aaactcggta taaaataatc aacgggcgct ttggcaaaat6720
atctatttta tcgcacaagc ccactagcaa attgtatttg cagaaaacaa tttcggcgca6780
caattttaac gctgacgaaa taaaagttca ccagttaatg agcgaccacc caaattttat6840
aaaaatctat tttaatcacg gttccatcaa caaccaagtg atcgtgatgg actacattga6900
ctgtcccgat ttatttgaaa cactacaaat taaaggcgag ctttcgtacc aacttgttag6960
caatattatt agacagctgt gtgaagcgct caacgatttg cacaagcaca atttcataca7020
caacgacata aaactcgaaa atgtcttata tttcgaagca cttgatcgcg tgtatgtttg7080
cgattacgga ttgtgcaaac acgaaaactc acttagcgtg cacgacggca cgttggagta7140
ttttagtccg gaaaaaattc gacacacaac tatgcacgtt tcgtttgact ggtacgcggc7200
gtgttaacat acaagttgct aaccggcggc cgacacccat ttgaaaaaag cgaagacgaa7260
atgttggact tgaatagcat gaagcgtcgt cagcaataca atgacattgg cgttttaaaa7320
cacgttcgta acgttaacgc tcgtgacttt gtgtactgcc taacaagata caacatagat7380
tgtagactca caaattacaa acaaattata aaacatgagt ttttgtcgta aaaatgccac7440
ttgttttacg agtagaattc ccagcttggc actggccgtc gttttacaac gtcgtgactg7500
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg7560
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg7620
cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat7680
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc7740
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca7800
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg7860
cgcggacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg7920
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta7980
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt8040
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc8100
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa8160
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt8220
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt8280
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc8340
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg8400
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg8460
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac8520
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca8580
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta8640
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat8700
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa8760
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag8820
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat8880
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt8940
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 9000
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 9060
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 9120
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 9180
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 9240
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 9300
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 9360
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 9420
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 9480
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 9540
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 9600
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 9660
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 9720
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 9780
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 9840
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 9900
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 9960
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 10020
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 10080
tatgaccatg attacg                                                 10096
<212>类型:DNA
<211>长度:10096
     序列名称:SEQ ID 169
     序列描述:
惯用密码子
序列名称:SEQ ID 169
序列
<213>生物体名称:人工序列
<400>前序列串:
ggtaccggat ccagcatggt gtgtctgaag ctccctggag gctcctgcat gacagcgctg  60
acagtgacac tgatggtgct gagctcccca ctggctttgt ccggagacac cggacctaag 120
tacgtcaagc agaacacact gaaactggct tccggtggcg gatctctagt tccacgcggt 180
agtggaggcg gtggttccgg agacacgcgt ccacgtttct tgtggcagct taagtttgaa 240
tgtcatttct tcaatgggac ggagcgggtg cggttgctgg aaagatgcat ctataaccaa 300
gaggagtccg tgcgcttcga cagcgacgtg ggggagtacc gggcggtgac ggagctgggg 360
cggcctgatg ccgagtactg gaacagccag aaggacctcc tggagcagag gcgggccgcg 420
gtggacacct actgcagaca caactacggg gttggtgaga gcttcacagt gcagcggcga 480
gttgagccta aggtgactgt gtatccttca aagacccagc ccctgcagca ccacaacctc 540
ctggtctgct ctgtgagtgg tttctatcca ggcagcattg aagtcaggtg gttccggaac 600
ggccaggaag agaaggctgg ggtggtgtcc acaggcctga tccagaatgg agattggacc 660
ttccagaccc tggtgatgct ggaaacagtt cctcggagtg gagaggttta cacctgccaa 720
gtggagcacc caagtgtgac gagccctctc acagtggaat ggagagcacg gtctgaatct 780
gcacagagca aggtcgacgg aggcggtggg ggtagaatcg cccggctgga ggaaaaagtg 840
aaaaccttga aagctcagaa ctcggagctg gcgtccacgg ccaacatgct cagggaacag 900
gtggcacagc ttaaacagaa agtcatgaac tactaggatc c                     941
<212>类型:DNA
<211>长度:941
     序列名称:SEQ ID 170
     序列描述:
惯用密码子
序列名称:SEQ ID 170
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE        60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVT           116
<212>类型:PRT
<211>长度:116
     序列名称:SEQ ID 171
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE       60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAXPEQYFGPGTRLTVT          116
<212>类型:PRT
<211>长度:116
     序列名称:SEQ ID 172
     序列描述:
特征
序列:SEQ ID 172
<221>特征关键词:MISC_FEATURE
<222>起始位置:1
<222>终止位置:116
     其它信息:其中x是e,q或r
     CDS连接:无
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE         60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEDQYFGPGTRLTVT           117
<212>类型:PRT
<211>长度:117
     序列名称:SEQ ID 173
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEY MSWYRQDPGMGLRLIHYSVGAGITDQGE       60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLVPGRPEQQFGPGTRLTVT           116
<212>类型:PRT
<211>长度:116
     序列名称:SEQ ID 174
     序列描述:
序列
<213>生物体名称:人工序列
<400>前序列串:
MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE        60
VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPHPQFGPGTRLTVT           116
<212>类型:PRT
<211>长度:116
     序列名称:SEQ ID 175
     序列描述:

Claims (85)

1.一种在其表面展示一种T细胞受体(TCR)的蛋白质颗粒,其特征在于,
(i)所述蛋白质颗粒是一种核糖体并且所述TCR是一种单链TCR(scTCR)多肽或二聚TCR(dTCR)多肽对,或
(ii)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,并且所述TCR是一种人scTCR或人dTCR多肽对,或
(iii)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,并且所述TCR是一种非人dTCR多肽对,或
(iv)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,且所述TCR是scTCR多肽,该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列,连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列,以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。
2.一种在其表面展示一种二聚体T细胞受体(dTCR)多肽对或单链T细胞受体(scTCR)多肽的蛋白质颗粒,其特征在于
所述dTCR多肽对由对应于天然TCR链的胞外恒定和可变结构域序列的TCR氨基酸序列构成,所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列和连接序列构成,该连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列;
其中所述dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致,以及
在scTCR多肽的情况下,在天然T细胞受体中不存在等价物的二硫键连接该多肽的残基。
3.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是丝状噬菌体颗粒。
4.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是具有与TCR共价连接的细胞表面蛋白或多肽分子的细胞。
5.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是核糖体。
6.如权利要求1-5中任一项所述的蛋白质颗粒,其特征在于,所述dTCR多肽对中一个成员的C末端,或所述scTCR多肽的C末端通过肽键与所述蛋白质颗粒表面暴露的残基相连。
7.如权利要求1-4中任一项所述的蛋白质颗粒,其特征在于,所述dTCR多肽对中一个成员的C末端,或所述scTCR多肽的C末端通过二硫键与所述蛋白质颗粒表面暴露的半胱氨酸残基相连。
8.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括
由对应于TCRα或δ链可变结构域的氨基酸序列构成的第一片段
由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段,以及
连接第一片段C末端与第二片段N末端的连接序列
条件是其中蛋白质颗粒是噬菌体,所述scTCR对应于人TCR。
9.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括
由对应于TCRβ或γ链可变结构域的氨基酸序列构成的第一片段
由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列构成的第二片段,以及
连接第一片段C末端与第二片段N末端的连接序列
条件是其中蛋白质颗粒是丝状噬菌体,所述scTCR对应于人TCR。
10.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括
由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于
TCRα或δ链可变结构域序列的氨基酸序列构成的第一片段,
由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段,
连接第一片段C末端与第二片段N末端或反之亦然的连接序列,以及
第一链和第二链之间的二硫键,所述二硫键在αβ或γδT细胞受体中不存在其等价物,
连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互
定位与天然αβ或γδT细胞受体中的定位基本一致。
11.如权利要求10所述的蛋白质颗粒,其特征在于,所述连接序列具有式-P-AA-P-,其中P是脯氨酸,且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。
12.如权利要求10或11所述的蛋白质颗粒,其特征在于,所述连接序列连接第一片段的C末端和第二片段的N末端。
13.如权利要求12所述的蛋白质颗粒,其特征在于,所述连接序列由26到41个氨基酸构成。
14.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列由29、30、31或32个氨基酸构成。
15.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列由33、34、35或36个氨基酸构成。
16.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列具有式-PGGG-(SGGGG)5-P-,其中P是脯氨酸,G是甘氨酸,S是丝氨酸。
17.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列具有式-PGGG-(SGGGG)6-P-,其中P是脯氨酸,G是甘氨酸,S是丝氨酸。
18.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对由以下组分构成
其中对应于TCRα或δ链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及
其中对应于TCRβ或γ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,
第一和第二多肽通过在天然αβ或γδT细胞受体中不存在等价物的二硫键相连。
19.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于αβ TCR胞外恒定和可变结构域序列的氨基酸序列。
20.如权利要求1-19中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于胞外αβ TCR恒定结构域序列和γδ TCR可变结构域序列的氨基酸序列。
21.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于非人的胞外αβ TCR恒定结构域序列和人TCR可变结构域序列的氨基酸序列。
22.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对的一个成员的氨基酸序列,或展示的scTCR的氨基酸序列对应于天然TCR胞外恒定链Ig结构域序列。
23.如权利要求1-22中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或展示的scTCR包括对应于天然TCR胞外恒定链Ig结构域序列的序列。
24.如权利要求23所述的蛋白质颗粒,其特征在于,所述恒定链Ig结构域序列的氨基酸残基由二硫键连接,该二硫键在天然TCR中不存在等价物。
25.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于对应于天然TCR中其β碳原子相距小于0.6纳米的氨基酸残基的半胱氨酸残基之间。
26.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01外显子1的Ser57或其非人等价物的半胱氨酸残基之间。
27.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Ser77或其非人等价物的半胱氨酸残基之间。
28.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Tyr10和TRBC1*01或TRBC2*01外显子1的Ser17或其非人等价物的半胱氨酸残基之间。
29.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Asp59或其非人等价物的半胱氨酸残基之间。
30.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Ser15和TRBC1*01或TRBC2*01外显子1的Glu15或其非人等价物的半胱氨酸残基之间。
31.如权利要求23-30中任一项所述的蛋白质颗粒,其特征在于,相对于所述天然序列,对应于天然TCR胞外恒定链Ig结构域序列的序列是C末端截短的,这样排除了形成天然链间二硫键的半胱氨酸残基。
32.如权利要求23-30中任一项所述的蛋白质颗粒,其特征在于,在对应于天然TCR胞外恒定链Ig结构域序列的序列中的形成天然链间二硫键的半胱氨酸残基被非半胱氨酸残基所取代。
33.如权利要求32所述的蛋白质颗粒,其特征在于,形成天然链间二硫键的半胱氨酸残基被丝氨酸或丙氨酸取代。
34.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,在展示的dTCR或scTCR中不存在对应于天然TCR中不配对半胱氨酸残基的不配对半胱氨酸残基。
35.如权利要求23-34中任一项所述的蛋白质颗粒,其特征在于,相对那些与形成非天然链间二硫键的残基相对应的残基,与天然TCR胞外恒定链Ig结构域序列相对应的序列在N末端被截短。
36.如权利要求1所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是在其表面展示二聚体T细胞受体(dTCR)多肽对的丝状细菌体颗粒,所述多肽对由以下组分构成
其中对应于TCRα链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及
其中对应于TCRβ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,
第一和第二多肽由取代TRAC*01外显子1的Thr 48和TRBC1*01或TRBC2*01外显子的Ser 57或其非人等价物的半胱氨酸残基之间的二硫键连接,
dTCR多肽对的一个成员的C末端通过肽键与噬菌体的一种外被蛋白相连。
37.一种展示在蛋白质颗粒上的dTCR多肽对或scTCR多肽的多样性文库,其特征在于,所述dTCR多肽对或scTCR多肽具有权利要求8-36中任一项所定义的结构特征。
38.如权利要求37所述的多样性文库,其特征在于,所述多样性存在于dTCR或scTCR多肽的可变结构域中。
39.如权利要求37-39中任一项所述的多样性文库,其特征在于,所述蛋白质颗粒是丝状噬菌体颗粒。
40.如权利要求35所述的丝状噬菌体颗粒的多样性文库,其特征在于,所述多样性存在于dTCR或scTCR多肽可变结构域的一个或多个互补决定区中,和/或存在于所展示的dTCR或scTCR多肽互补决定区的一个或多个骨架区中。
41.一种核酸,其特征在于,所述核酸编码(a)dTCR多肽对的一条链以及(b)与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的dTCR多肽对的另一条链;或所述核酸编码与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的scTCR多肽,所述dTCR对或scTCR具有权利要求8-36中任一项所定义的结构特征。
42.一种包含如权利要求41所述的核酸的表达载体,或包含含如权利要求42所定义的核酸(a)的第一载体和含如权利要求42所定义的核酸(b)的第二载体的组合物。
43.一种表达系统,其特征在于,所述表达系统包含表达如权利要求41所述核酸的噬菌粒或噬菌体基因组载体。
44.如权利要求43所述的表达系统,其特征在于,所述噬菌粒或噬菌体基因组载体源丝状噬菌体。
45.如权利要求44所述的表达系统,其特征在于,所述噬菌粒或噬菌体基因组载体编码噬菌体gIII或gVIII外被蛋白。
46.如权利要求43-45中任一项所述的表达系统,其特征在于,所述载体包含将由该载体表达的组成型或诱导型TCR多肽数量限制在所需水平的一个或多个序列。
47.如权利要求46所述的表达系统,其特征在于,所述序列是弱启动子序列。
48.如权利要求46所述的表达系统,其特征在于,所述序列是突变的核糖体结合位点。
49.如权利要求46所述的表达系统,其特征在于,所述序列是错义抑制子终止密码子。
50.如权利要求46所述的表达系统,其特征在于,所述序列是突变的起始密码子。
51.如权利要求46所述的表达系统,其特征在于,所述序列是受代谢物介导的启动子强度调节控制的启动子序列。
52.如权利要求46所述的表达系统,其特征在于,所述序列含有多个所采用的表达系统偏爱程度更低的密码子。
53.一种包含如权利要求41所述的核酸的宿主细胞,一种如权利要求42所述的表达载体或一种如权利要求43-52中任一项所述的表达系统。
54.一种携带如权利要求43-52中任一项所述噬菌粒表达系统的宿主细胞以及辅助噬菌体。
55.一种鉴别具有特殊特征的TCR的方法,其特征在于,所述方法包括使展示在如权利要求37-40中任一项所述蛋白质颗粒上的TCR多样性文库经受
对所述特征进行挑选的选择过程,并且分离展示具有所述特征TCR的蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒和/或
测量所述特征的筛选过程,鉴别那些展示具有所需特征的TCR的蛋白质颗粒并将其分离,以及可选择地进行扩增过程以增加分离的颗粒。
56.如权利要求55所述的方法,其特征在于,所述特殊特征是对TCR配体增强的亲和力。
57.一种检测TCR配体复合物的方法,其特征在于,所述方法包括:
(i)提供如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒;
(ii)将所述展示TCR的蛋白质颗粒与假定的配体复合物接触;以及
(iii)检测所述展示TCR的蛋白质颗粒与假定的配体复合物的结合。
58.如权利要求57所述的方法,其特征在于,所述假定的配体复合物是肽-MHC复合物。
59.一种鉴别如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用抑制剂的方法,其特征在于,所述方法包括在待测化合物存在和不存在的条件下将展示TCR的蛋白质颗粒与一种TCR结合配体接触,并测定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合,这样的降低作为对抑制剂的鉴别。
60.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生发生了突变,以及(iii)对所述TCR配体具有比天然TCR小的Kd值。
61.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)如通过表面等离子体谐振测得的,对所述TCR配体具有比天然TCR小的Kd值。
62.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)对所述TCR配体具有比天然TCR低的消耗速率(koff)。
63.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)如通过表面等离子体谐振测得的,对所述TCR配体具有比天然TCR低的消耗速率(koff)。
64.一种如权利要求60-63中任一项所述的二聚体TCR,其特征在于,所述dTCR具有权利要求18-36中任一项所定义的αβ异源二聚TCR的结构特征。
65.一种如权利要求60-64中任一项所述的TCR,其特征在于,所述TCR相对于天然TCR在至少一个互补决定区和/或其骨架区中发生突变。
66.一种如权利要求60-65中任一项所述的TCR,其特征在于,所述TCR对特定的MHC类型具有特异性。
67.一种如权利要求60-65中任一项所述的TCR,其特征在于,所述TCR对特定的pMHC具有特异性。
68.一种如权利要求60-65或67中任一项所述的TCR,其特征在于,所述TCR对HLA-A2 Tax肽(LLFGYPVYV)(SEQ ID 21)具有特异性。
69.如权利要求68所述的TCR,其特征在于,所述TCR包含SEQ ID 172、173、174或175中所示的β链可变结构域氨基酸。
70.如权利要求68所述的TCR,其特征在于,使用SEQ ID 171中所示的编号,所述TCR包含β链可变结构域氨基酸99M、99V、100S、100P、101A、102E、102Q、104H、105P、105D和106Q中的一个或多个。
71.如权利要求68所述的TCR,其特征在于,使用SEQ ID 171中所示的编号,所述TCR包含β链可变结构域氨基酸99M、100S和101A。
72.如权利要求68所述的TCR,其特征在于,使用SEQ ID 171中所示的编号,所述TCR包含β链可变结构域氨基酸105D。
73.如权利要求68所述的TCR,其特征在于,使用SEQ ID 171中所示的编号,所述TCR包含β链可变结构域氨基酸99V和100P。
74.如权利要求68所述的TCR,其特征在于,使用SEQ ID 171中所示的编号,所述TCR包含β链可变结构域氨基酸104H和105P。
75.如权利要求60-65或67中任一项所述的TCR,其特征在于,所述TCR对HLA-A2NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物具有特异性。
76.一种核酸,其特征在于,所述核酸编码如权利要求60-78中任一项所述的TCR。
77.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与治疗化合物相连。
78.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与造影化合物相连。
79.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与细胞毒化合物相连。
80.如权利要求77或79所述的TCR,其特征在于,所述TCR对HLA-A2 Tax肽(LLFGYPVYV)(SEQ ID 21)复合物具有特异性。
81.如权利要求77或79所述的TCR,其特征在于,所述TCR对HLA-A2 NY-ESO肽(SLLMITQC)(SEQ ID 22)复合物具有特异性。
82.一种治疗HTLV-1感染的方法,其特征在于,所述方法包括给予遭受这种感染的个体有效量的如权利要求68-74或79中任一项所述的TCR。
83.如权利要求68-74或79中任一项所述的TCR在制备用于治疗HTLV-1感染的组合物中的应用。
84.一种治疗癌症的方法,其特征在于,所述方法包括给予遭受癌症的个体有效量的如权利要求75或81所述的TCR。
85.如权利要求75或81所述的TCR在制备用于治疗癌症的组合物中的应用。
CNB2003801029280A 2002-11-09 2003-10-30 T细胞受体展示 Expired - Lifetime CN100551931C (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
GB0226227A GB0226227D0 (en) 2002-11-09 2002-11-09 Receptors
GB0226227.7 2002-11-09
GB0301814.0 2003-01-25
GB0304067.2 2003-02-22
US60/463,046 2003-04-16
GB0311397.4 2003-05-16
GB0316356.5 2003-07-11

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2009101747961A Division CN101935636A (zh) 2002-11-09 2003-10-30 T细胞受体展示

Publications (2)

Publication Number Publication Date
CN1714102A true CN1714102A (zh) 2005-12-28
CN100551931C CN100551931C (zh) 2009-10-21

Family

ID=9947565

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801029280A Expired - Lifetime CN100551931C (zh) 2002-11-09 2003-10-30 T细胞受体展示

Country Status (3)

Country Link
CN (1) CN100551931C (zh)
GB (1) GB0226227D0 (zh)
ZA (1) ZA200503336B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107922950A (zh) * 2015-06-01 2018-04-17 基因医疗免疫疗法有限责任公司 T细胞受体文库
CN108602874A (zh) * 2015-09-15 2018-09-28 艾达普特免疫有限公司 Tcr文库
CN109251243A (zh) * 2017-07-13 2019-01-22 中国科学院广州生物医药与健康研究院 一种识别sage1抗原的t细胞受体及编码该受体的核酸
CN109476723A (zh) * 2015-12-22 2019-03-15 英美偌科有限公司 Ny-eso-1肿瘤抗原hla-a*02复合物的特异性t细胞受体
WO2019057122A1 (en) * 2017-09-22 2019-03-28 Wuxi Biologics (Shanghai) Co., Ltd. NEW BISPECIFIC POLYPEPTIDE COMPLEXES
WO2021190580A1 (en) * 2020-03-26 2021-09-30 Wuxi Biologics (Shanghai) Co., Ltd. Bispecific polypeptide complexes, compositions, and methods of preparation and use
WO2022089569A1 (en) * 2020-10-29 2022-05-05 Wuxi Biologics (Shanghai) Co., Ltd. Modified soluble t cell receptor
US11365254B2 (en) 2017-09-22 2022-06-21 WuXi Biologics Ireland Limited Bispecific CD3/CD19 polypeptide complexes

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11851469B2 (en) 2014-11-07 2023-12-26 Xlifesc, Ltd. Soluble heterodimeric T cell receptor, and preparation method and use thereof

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107922950A (zh) * 2015-06-01 2018-04-17 基因医疗免疫疗法有限责任公司 T细胞受体文库
CN107922950B (zh) * 2015-06-01 2021-12-31 基因医疗免疫疗法有限责任公司 T细胞受体文库
CN108602874A (zh) * 2015-09-15 2018-09-28 艾达普特免疫有限公司 Tcr文库
CN108602874B (zh) * 2015-09-15 2022-08-19 英美偌科有限公司 Tcr文库
CN109476723A (zh) * 2015-12-22 2019-03-15 英美偌科有限公司 Ny-eso-1肿瘤抗原hla-a*02复合物的特异性t细胞受体
CN109476723B (zh) * 2015-12-22 2022-01-28 英美偌科有限公司 Ny-eso-1肿瘤抗原hla-a*02复合物的特异性t细胞受体
CN109251243B (zh) * 2017-07-13 2021-10-19 中国科学院广州生物医药与健康研究院 一种识别sage1抗原的t细胞受体及编码该受体的核酸
CN109251243A (zh) * 2017-07-13 2019-01-22 中国科学院广州生物医药与健康研究院 一种识别sage1抗原的t细胞受体及编码该受体的核酸
WO2019057122A1 (en) * 2017-09-22 2019-03-28 Wuxi Biologics (Shanghai) Co., Ltd. NEW BISPECIFIC POLYPEPTIDE COMPLEXES
US11365254B2 (en) 2017-09-22 2022-06-21 WuXi Biologics Ireland Limited Bispecific CD3/CD19 polypeptide complexes
US11845796B2 (en) 2017-09-22 2023-12-19 WuXi Biologics Ireland Limited Bispecific polypeptide complexes
WO2021190580A1 (en) * 2020-03-26 2021-09-30 Wuxi Biologics (Shanghai) Co., Ltd. Bispecific polypeptide complexes, compositions, and methods of preparation and use
WO2022089569A1 (en) * 2020-10-29 2022-05-05 Wuxi Biologics (Shanghai) Co., Ltd. Modified soluble t cell receptor

Also Published As

Publication number Publication date
CN100551931C (zh) 2009-10-21
GB0226227D0 (en) 2002-12-18
ZA200503336B (en) 2006-10-25

Similar Documents

Publication Publication Date Title
CA2505558C (en) T cell receptor display
CN1249229C (zh) 可溶性t细胞受体
CN100351375C (zh) 体外肽表达文库
CN1561343A (zh) 可溶性t细胞受体
CN1871256A (zh) 泪脂质运载蛋白的突变蛋白
CN1561394A (zh) 人嗜中性粒细胞明胶酶相关脂卡林及有关蛋白的突变蛋白
JP5513398B2 (ja) 非天然アミノ酸を含有する蛋白質を使用する指向的進化
CN1231583C (zh) 产生能够表达活性蛋白产物的断裂、不可传递的基因的方法
CN1764719A (zh) Melan-a肽类似物-病毒样颗粒偶联物
CN1956996A (zh) 基于泛素蛋白的人工结合蛋白的生产
Stone et al. T cell receptor engineering
CN1816620A (zh) 用于产生腺病毒载体的方法和组合物
AU2019248644A1 (en) Peptide-MHC compacts
EP1781702A2 (en) Nucleoproteins displaying native t cell receptor libraries
CN1714102A (zh) T细胞受体展示
JP6063399B2 (ja) ヌクレアーゼにより遺伝子変形された細胞を濃縮させる方法
Zhang et al. Bioengineered iPSC-derived megakaryocytes for the detection of platelet-specific patient alloantibodies
US20040214281A1 (en) Methods and compositions for high level expression of a heterologous protein with poor codon usage
CN1309716A (zh) 包含具重组转录因子结合位点的嵌合启动子的表达系统
Gottfried-Lee et al. Structures of methanomethylophilus alvus pyrrolysine tRNA-synthetases support the need for De novo selections when altering the substrate specificity
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
Li et al. Monoclonal antibody discovery based on precise selection of single transgenic hybridomas with an on-cell-surface and antigen-specific anchor
CN101935636A (zh) T细胞受体展示
WO2002046400A2 (en) Mutated class ii major histocompatibility proteins
CN1274821C (zh) 分子物质模块转运系统及其产生方法和用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: AMERICAN RUO BRANCH CO., LTD.

Free format text: FORMER OWNER: MEDIGENE LTD.

Effective date: 20100730

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee

Owner name: MEDIGENE LTD.

Free format text: FORMER NAME: AVIDEKS CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Oxfordshire

Patentee after: MEDIGENE Ltd.

Address before: Oxfordshire

Patentee before: Avidex Ltd.

TR01 Transfer of patent right

Effective date of registration: 20100730

Address after: Oxfordshire

Patentee after: IMMUNOCORE LTD.

Address before: Oxfordshire

Patentee before: Medigene Ltd.

ASS Succession or assignment of patent right

Owner name: ADAPTIMMUNE LTD.

Effective date: 20140813

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140813

Address after: Oxfordshire

Patentee after: IMMUNOCORE LTD.

Patentee after: ADAPTIMMUNE Ltd.

Address before: Oxfordshire

Patentee before: IMMUNOCORE LTD.

CX01 Expiry of patent term

Granted publication date: 20091021

CX01 Expiry of patent term