CN115175691A - 结合血清白蛋白的纤连蛋白iii型结构域及其应用 - Google Patents

结合血清白蛋白的纤连蛋白iii型结构域及其应用 Download PDF

Info

Publication number
CN115175691A
CN115175691A CN202080089020.4A CN202080089020A CN115175691A CN 115175691 A CN115175691 A CN 115175691A CN 202080089020 A CN202080089020 A CN 202080089020A CN 115175691 A CN115175691 A CN 115175691A
Authority
CN
China
Prior art keywords
ala
seq
protein
leu
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080089020.4A
Other languages
English (en)
Inventor
K·奥尼尔
忻尧
R·C·阿迪斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aro Biotherapeutics Co
Original Assignee
Aro Biotherapeutics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aro Biotherapeutics Co filed Critical Aro Biotherapeutics Co
Publication of CN115175691A publication Critical patent/CN115175691A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • C07K14/765Serum albumin, e.g. HSA
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/49Blood
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/55Fusion polypeptide containing a fusion with a toxin, e.g. diphteria toxin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction

Abstract

与血清白蛋白结合的纤连蛋白III型结构域(FN3)、能够编码结合血清白蛋白的FN3结构域的相关多核苷酸、表达所述FN3结构域的细胞,以及相关载体、可检测标记的FN3结构域和融合到异源部分的FN3结构域,可用于延长分子在诊断和治疗应用中的半衰期。

Description

结合血清白蛋白的纤连蛋白III型结构域及其应用
技术领域
本实施方式涉及结合血清白蛋白的纤连蛋白III型(FN3)结构域。这样的FN3结构域可用于例如延长药物或与其缀合的蛋白的体内血清半衰期。还提供了制造此类分子和包含它们的药物组合物的方法。
背景技术
从血流中快速清除药物或生物治疗分子可能造成这些分子的临床有效性受限或导致对患者更频繁地给药。一种常见的清除方法是肾小球过滤引起的肾脏清除。这种清除途径与较小的生物治疗剂最相关,因为对于分子量大于50,000道尔顿的分子,肾脏过滤的速率会大大降低(Kontermann,Curr Opin Biotechnol 2011)。几种已获批准的生物治疗药物含有活性部分,它们本身低于过滤极限,并因此被迅速清除。为了克服这一限制,已经引入了许多技术来有效地增加治疗分子的大小以减少肾脏过滤。仍然需要增加药物或治疗剂半衰期的化合物或方法。本实施方式满足这些需求以及其他需求。
发明内容
本实施方式提供了结合血清白蛋白的纤连蛋白III型(FN3)结构域。还描述了能够编码所提供的FN3结构域的相关多核苷酸、表达所提供的FN3结构域的细胞以及相关的载体。另外,描述了使用所提供的FN3结构域的方法。例如,鉴于白蛋白的血清半衰期延长,白蛋白结合肽可用作融合伴侣,以产生具有较长或延长血清半衰期的治疗性蛋白质或药物。
除了结合白蛋白的FN3结构域之外,还提供了能够编码所述蛋白质的多核苷酸序列。还提供了包含所述多核苷酸的载体,如本文中表达结合白蛋白的FN3结构域的细胞。还描述了能够表达所公开的载体的细胞。这些细胞可以是哺乳动物细胞(诸如293F细胞、CHO细胞)、昆虫细胞(诸如Sf7细胞)、酵母细胞、植物细胞或细菌细胞(诸如大肠杆菌(E.coli))。还提供了产生所述FN3结构域(蛋白质)的过程。
本实施方式还提供了将所提供的结合白蛋白的FN3结构域融合或以其他方式关联至各种分子以延长这些分子的半衰期的方法。因此,结合白蛋白的FN3结构域能够用于例如延长治疗药物的半衰期。
在一些实施方式中,给药包含结合白蛋白的FN3结构域的药物组合物以改善治疗伴侣的体内半衰期。这种半衰期延长可以通过本领域已知的多种方法来测定,包括例如通过监测结合白蛋白的FN3结构域的药代动力学。在本文提供的实施例中提供了这些方法的此类测定的非限制性实例。
还提供了包括所提供的结合白蛋白的FN3结构域的试剂盒。该试剂盒可以用于执行使用本文提供的结合白蛋白的FN3结构域的方法,或本领域技术人员已知的其他方法。在一些实施方式中,所述试剂盒可以包括本文所述的FN3结构域和用于检测生物样品中人血清白蛋白存在的试剂。所述试剂盒可以包括本文所述的一种或多种FN3结构域和用于在不使用时容纳FN3结构域的容器、固定至固体支持物的FN3结构域的使用说明和/或FN3结构域的可检测标记形式,如本文所述的。
附图说明
图1显示了使用结合白蛋白FN3结构域的来自食蟹猴和人血清的内源白蛋白的间接下拉(pull-down)。与白蛋白的结构域1结合的FN3结构域用虚线框起来;与白蛋白的结构域3结合的FN3结构域用实线框起来。所有构建体均制备为具有一个无效FN3结构域(TC25)和一个结合白蛋白的FN3结构域的双特异性基因融合体。*ABD是指白蛋白结合结构域(参考J.T.Andersen,R.Pehrson,V.Tolmachev,M.B.Daba,L.Abrahmsen,C.Ekblad,J.Biol.Chem.286:5234-5241 2011)。
图2显示了5mg/kg(H9)或5mg/kg(ALB40(B7)的单一IV剂量后食蟹猴中结合白蛋白的FN3结构域的药代动力学特性。
具体实施方式
定义
在整个说明书和权利要求中使用了与描述的方面相关的各种术语。除非另有说明,否则这些术语将被赋予其在本领域中的普通含义。其他具体定义的术语将以与本文提供的定义一致的方式进行解释。
如在本说明书和所附权利要求中使用的,单数形式“一个(a)”、“一种(an)”和“所述(the)”包括复数指示物,除非内容另有明确指示。因此,例如,提及“细胞(a cell)”包括两个或更多个细胞的组合等。
如本文所用的术语“约”在提及诸如量、持续时间等的可测量值时,意在涵盖从指定值至多达±10%的变化,因为这样的变化适合执行所公开的方法。除非另有说明,否则在说明书和权利要求中使用的所有表示成分的量、特性诸如分子量、反应条件等的数字应理解为在所有情况下均由术语“约”修饰。因此,除非有相反的指示,否则以下说明书和所附权利要求中阐述的数值参数是近似值,其可以根据本发明寻求获得的所需特性而变化。至少,且不是试图限制将等同原则应用于权利要求的范围,每个数值参数至少应根据报告的有效数字的数量并通过应用普通的舍入技术来解释。
尽管阐述本发明宽泛范围的数值范围和参数是近似值,但在具体实例中阐述的数值尽可能精确地报告。然而,任何数值都固有地包含某些误差,这些误差必然是由于在它们各自的测试测量中发现的标准偏差而产生的。
“分离的”意指生物组分(诸如核酸、肽或蛋白质)已从该组分天然存在的生物体的其他生物组分,即其他染色体和染色体外DNA和RNA,以及蛋白质基本分离、另外产生或纯化。因此,已“分离”的核酸、肽和蛋白质包括通过标准纯化方法纯化的核酸和蛋白质。“分离的”核酸、肽和蛋白质可以是组合物的一部分,并且如果这种组合物不是核酸、肽或蛋白质的天然环境的一部分,则仍然是分离的。该术语还涵盖通过在宿主细胞中重组表达而制备的核酸、肽和蛋白质以及化学合成的核酸。如本文所用,“分离的”FN3结构域旨在指基本上不含具有不同抗原特异性的其他FN3结构域的FN3结构域(例如,特异性结合人血清白蛋白的分离的FN3结构域基本上不含特异性结合除人血清白蛋白以外的抗原的FN3结构域)。然而,与人血清白蛋白的表位、异形体或变体特异性结合的分离的FN3结构域可能与其他相关抗原,例如来自其他物种的抗原(诸如血清白蛋白物种同源物)具有交叉反应性。
如本文所用,术语“纤连蛋白III型(FN3)结构域”(FN3结构域)是指在包括纤连蛋白、生腱蛋白、细胞内细胞骨架蛋白、细胞因子受体和原核酶在内的蛋白质中频繁出现的结构域(Bork和Doolittle,Proc Nat Acad Sci USA 89:8990-8994,1992;Meinke et al.,JBacteriol 175:1910-1918,1993;Watanabe et al.,J Biol Chem 265:15659-15665,1990)。示例性的FN3结构域是存在于人生腱蛋白C中的15个不同FN3结构域、存在于人纤连蛋白(FN)中的15个不同FN3结构域和非天然合成的FN3结构域,如例如美国专利第8,278,419号中所述的。单个FN3结构域通过结构域编号和蛋白质名称表示,例如,生腱蛋白的第3个FN3结构域(TN3),或纤连蛋白的第10个FN3结构域(FN10)。
如本文所用,术语“特异性结合”或“特异性结合”是指本发明的FN3结构域以约1x10-6 M或更小,例如约1x10-7 M或更小、约1x10-8 M或更小、约1x10-9 M或更小、约1x10-10 M或更小、约1x10-11 M或更小、约1x10-12 M或更小,或约1x10-13 M或更小的解离常数(KD)结合预定抗原的能力。通常,所描述的FN3结构域与预定抗原(即人血清白蛋白)结合,其KD比其对非特异性抗原(例如酪蛋白)的KD低至少10倍,如使用例如Proteon Instrument(BioRad)通过表面等离激元共振测量的。然而,与人血清白蛋白特异性结合的所描述的FN3结构域可能与其他相关抗原具有交叉反应性,例如与来自其他物种的相同预定抗原(同源物),诸如食蟹猕猴(Macaca Fascicularis)(食蟹猴、cyno)或黑猩猩(Pan troglodytes)(黑猩猩)。
如本文所用,“血清半衰期”通常可以定义为氨基酸序列、化合物或多肽的血清浓度在体内降低50%所用的时间,例如由于通过自然机制降解序列或化合物和/或清除或隔离序列或化合物。本发明的氨基酸序列、化合物或多肽的体内半衰期可以以任何本身已知的方式来确定,诸如通过药代动力学分析。合适的技术对本领域技术人员来说是清楚的,并且可以例如通常涉及向温血动物(即人或另一合适的哺乳动物,诸如小鼠、兔、大鼠、猪、狗或灵长类动物,例如来自猕猴属(Macaca)的猴(诸如,且特别是食蟹猴(Macacafascicularis)和/或恒河猴(Macaca mulatta))和狒狒(Papio ursinus))合适地给予合适剂量的本公开的氨基酸序列、化合物或多肽;从所述动物采集血液样本或其他样本;测定所述血样中本发明的氨基酸序列、化合物或多肽的水平或浓度;并且从如此获得的数据(图)计算直到与给药后的初始水平相比,本发明的氨基酸序列、化合物或多肽的水平或浓度减少50%的时间。例如参考下面的实验部分,以及标准手册,诸如Kenneth,A et al:ChemicalStability of Pharmaceuticals:A Handbook for Pharmacists and Peters et al,Pharmacokinete analysis:A Practical Approach(1996)。还参考了Marcel Dekker出版的“Pharmacokinetics”,M Gibaldi&D Perron,2nd Rev.edition(1982)。
本领域技术人员也将清楚(参见例如WO 04/003019的第6和7页以及在其中引用的其他参考文献),半衰期可以使用诸如t1/2-α、t1/2-β和曲线下面积(AUC)等参数来表示。在本说明书中,“半衰期”是指这些参数中的任何一个,诸如这些参数中的任何两个,或这些参数中的基本上所有三个的降低。
术语“药代动力学(pharmacokinetics)”或“药代动力学(pharmacokinetics)”根据其领域认可的含义使用,并且指研究药物在体内的作用,例如药物作用的效果和持续时间、它们被身体吸收、分布、代谢和清除的速率等。
如本文所用,术语“取代(substituting)”或“取代的(substituted)”或“突变(mutating)”或“突变的(mutated)”是指在多肽或多核苷酸序列中改变、缺失或插入的一个或多个氨基酸或核苷酸以产生该序列的变体。
如本文所用,术语“随机化(randomizing)”或“随机化的(randomized)”或“多样化的(diversified)”或“多样化(diversifying)”是指在多核苷酸或多肽序列中进行至少一个置换、插入或缺失。
如本文所用的“变体”是指通过一种或多种修饰,例如置换、插入或缺失而不同于参考多肽或参考多核苷酸的多肽或多核苷酸。
术语“文库”是指变体的集合。该文库可以由多肽或多核苷酸变体组成。
如本文所用,“Tencon”是指合成的纤连蛋白III型(FN3)结构域,其具有SEQ IDNO:1中所示的序列,并在美国公开No.US2010/0216708中进行了描述。
“多核苷酸”同义地称为“核酸分子”、“核苷酸”或“核酸”,是指任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA。“多核苷酸”包括但不限于单链和双链DNA、单链和双链区域的混合物的DNA、单链和双链RNA,以及单链和双链区域的混合物的RNA、包括DNA和RNA的杂合分子,杂合分子可以是单链的或更典型地是双链的或单链和双链区域的混合物。另外,“多核苷酸”是指包含RNA或DNA或RNA和DNA两者的三链区域。术语多核苷酸还包括含有一个或多个修饰碱基的DNA或RNA,以及具有出于稳定性或其他原因而修饰的主链的DNA或RNA。“修饰的”碱基包括例如三苯甲基化碱基和不常见的碱基诸如肌苷。可以对DNA和RNA进行多种修饰;因此,“多核苷酸”包括通常在自然界中发现的化学、酶促或代谢修饰形式的多核苷酸,以及病毒和细胞特征的DNA和RNA的化学形式。“多核苷酸”还包括相对较短的核酸链,通常称为寡核苷酸。
“载体”是复制子,诸如质粒、噬菌体、黏粒或病毒,其中可以可操作地插入另一核酸片段以引起片段的复制或表达。
如本文所用,术语“宿主细胞”可以是任何类型的细胞,例如原代细胞、培养中的细胞或来自细胞系的细胞。在具体实施方式中,术语“宿主细胞”是指用核酸分子转染的细胞和这种细胞的后代或潜在后代。这种细胞的后代可能与用核酸分子转染的亲代细胞不同,例如,由于在后续世代中可能发生的突变或环境影响或核酸分子整合到宿主细胞基因组中。术语“表达”和“产生”在本文中同义使用,并且指基因产物的生物合成。这些术语包括将基因转录成RNA。这些术语还涵盖将RNA翻译成一种或多种多肽,并进一步涵盖所有天然存在的转录后和翻译后修饰。抗体或其抗原结合片段的表达或产生可以在细胞的细胞质内,或在细胞外环境诸如细胞培养的生长培养基中。“基本相同”的含义可能因使用该术语的上下文而异。由于在重链和轻链以及编码它们的基因之间可能存在天然序列变异,人们预期会在本文所述的氨基酸序列或编码抗体或抗原结合片段的基因中发现某种程度的变异,这些变异很少或没有对其独特的结合特性(例如特异性和亲和力)造成影响。这种预期部分归因于遗传密码的简并性,以及不会明显改变编码蛋白质的性质的保守氨基酸序列变异的进化成功。
公开的FN3域的概述
Tencon(SEQ ID NO:1)是一种非天然存在的纤连蛋白III型(FN3)结构域,其设计自来自人生腱蛋白-C的第15个FN3结构域的共有序列(Jacobs et al.,ProteinEngineering,Design,and Selection,25:107-117,2012;美国公开No.2010/0216708)。Tencon的晶体结构显示了六个表面暴露的环,这些环连接了表征FN3结构域的七个β链,所述β链称为A、B、C、D、E、F和G,并且所述环称为AB、BC、CD、DE、EF和FG环(Bork和Doolittle,Proc Natl Acad Sci USA 89:8990-8992,1992;美国专利第6,673,901号)。这些环或每个环内的选定残基可以被随机化,以构建纤连蛋白III型(FN3)结构域的文库,该文库可用于选择结合血清白蛋白的新分子。表1显示了在Tencon中每个环和β链的位置和序列(SEQ IDNO:1)。
表1.
Figure BDA0003704078430000071
Figure BDA0003704078430000081
因此,基于Tencon序列设计的文库可能具有随机化的FG环,或随机化的BC和FG环,诸如如下文所述的文库TCL1或TCL2。Tencon BC环长度为7个氨基酸,因此可以在BC环处多样化并基于Tencon序列设计的文库中随机化1、2、3、4、5、6或7个氨基酸。Tencon FG环长度为7个氨基酸,因此可以在FG环处多样化并基于Tencon序列设计的文库中随机化1、2、3、4、5、6或7个氨基酸。可以通过环处残基的插入和/或缺失来实现Tencon文库中的环处的其他多样性。例如,FG和/或BC环可以延长1-22个氨基酸,或减少1-3个氨基酸。Tencon中的FG环长度为7个氨基酸,而抗体重链中相应的环范围为4-28个残基。为了提供最大的多样性,FG环可以在序列以及长度上多样化,以对应于4-28个残基的抗体CDR3长度范围。例如,通过将环延长额外的1、2、3、4或5个氨基酸,FG环的长度可以被进一步多样化。
基于Tencon序列设计的文库还可以具有随机的替代表面,这些表面在FN3结构域的一侧形成并包含两条或更多条β链和至少一个环。一种这样的替代表面由C和Fβ-链以及CD和FG环中的氨基酸形成(C-CD-F-FG表面)。一种基于Tencon替代C-CD-F-FG表面的文库设计在美国专利第US2013/0226834号中进行了描述。基于Tencon序列设计的文库还包括基于Tencon变体设计的文库,诸如在残基位置11、14、17、37、46、73或86(残基编号对应于SEQ IDNO:1)处具有置换的Tencon变体,以及显示热稳定性提高的变体。示例性的Tencon变体描述于美国公开No.2011/0274623中,并且包括与SEQ ID NO:1的Tencon相比具有置换E11R、L17A、N46V和E86I的Tencon27(SEQ ID NO:4)。
基于Tencon和其他FN3序列的文库可以使用随机或限定的氨基酸组在选定的残基位置处随机化。例如,文库中具有随机置换的变体可以使用NNK密码子生成,该密码子编码所有20种天然存在的氨基酸。在其他多样化方案中,DVK密码子可以用于编码氨基酸Ala、Trp、Tyr、Lys、Thr、Asn、Lys、Ser、Arg、Asp、Glu、Gly和Cys。可选地,NNS密码子可用于产生所有20种氨基酸残基,并同时降低终止密码子的频率。可以例如使用
Figure BDA0003704078430000091
technology(http:_//www_sloning_com)合成在要多样化的位置处具有偏向氨基酸分布的FN3结构域的文库。该技术使用预制双链三联体的文库,其作为足以满足数千个基因合成过程的通用构件块。三联体文库代表了构建任何所需DNA分子所必需的所有可能的序列组合。密码子名称是根据众所周知的IUB代码。
本文所述的结合或特异性结合人血清白蛋白的FN3结构域可以通过产生FN3文库诸如Tencon文库来分离,其使用顺式展示将编码支架蛋白的DNA片段连接到编码RepA的DNA片段以产生在体外翻译后形成的蛋白质-DNA复合物的池,其中每种蛋白质都与编码它的DNA稳定结合(美国专利第7,842,476号;Odegrip et al.,Proc Natl Acad Sci U S A101,2806-2810,2004),并通过本领域已知的和实施例中描述的任何方法测定文库与人血清白蛋白的特异性结合。可以使用的示例性众所周知的方法是ELISA、夹心免疫测定以及竞争性和非竞争性测定(参见,例如,Ausubel et al.,eds,1994,Current Protocols inMolecular Biology,Vol.1,John Wiley&Sons,Inc.,New York)。根据所需特征进一步表征鉴定的特异性结合人血清白蛋白的FN3结构域。
本文所述的特异性结合人血清白蛋白的FN3结构域可以使用任何FN3结构域作为模板来产生,以生成文库并使用其中提供的方法筛选文库中特异性结合人血清白蛋白的分子。可以使用的示例性FN3结构域是生腱蛋白C(TN3)(SEQ ID NO:81)、Fibcon(SEQ ID NO:82)的第3个FN3结构域和纤连蛋白(FN10)(SEQ ID NO:83)的第10个FN3结构域。标准克隆和表达技术用于将文库克隆到载体中或合成文库的双链cDNA盒,以在体外表达或翻译文库。例如,可以使用核糖体展示(Hanes和Pluckthun,Proc Natl Acad Sci USA,94,4937-4942,1997),mRNA展示(Roberts和Szostak,Proc Natl Acad Sci USA,94,12297-12302,1997),或其他无细胞系统(美国专利第5,643,768号)。FN3结构域变体的文库可以表达为展示在例如任何合适的噬菌体表面上的融合蛋白。用于在噬菌体表面上展示融合多肽的方法是众所周知的(美国公开NO.2011/0118144;国际公开No.WO2009/085462;美国专利第6,969,108号;美国专利第6,172,197号;美国专利第5,223,409号;美国专利第6,582,915号;美国专利第6,472,147号)。
在本文所述的一些实施方式中,特异性结合人血清白蛋白的FN3结构域基于SEQID NO:1的Tencon序列或SEQ ID NO:4的Tencon27序列,所述SEQ ID NO:1或SEQ ID NO:4任选地在残基位置11、14、17、37、46、73和/或86处具有置换。
可以修饰本公开的特异性结合人血清白蛋白的FN3结构域以改善它们的性质,诸如改善热稳定性以及热折叠和解折叠的可逆性。已经应用了几种方法来增加蛋白质和酶的表观热稳定性,包括基于与高度相似的热稳定序列比较的合理设计、稳定二硫键的设计、增加α-螺旋倾向的突变、盐桥的改造、改变蛋白质的表面电荷、定向进化和共有序列的组成(Lehmann和Wyss,Curr Opin Biotechnol,12,371-375,2001)。高热稳定性可以提高表达蛋白的产量,提高溶解度或活性,降低免疫原性,并最大限度地减少制造过程中对冷链的需求。可被取代以提高Tencon(SEQ ID NO:1)的热稳定性的残基是残基位置11、14、17、37、46、73或86,并且描述于美国公开NO.2011/0274623中。对应于这些残基的置换可以掺入到本发明的含有FN3结构域的分子中。
蛋白质稳定性和蛋白质不稳定性的测量可以被视为蛋白质完整性的相同或不同方面。蛋白质对以下敏感或“不稳定”:由热、紫外线或电离辐射引起的变性、在液体溶液中时环境渗透压和pH值的变化、小孔径过滤施加的机械剪切力、紫外线辐射、电离辐射诸如γ辐射、化学或热脱水,或任何其他可能导致蛋白质结构破坏的作用或力。可以使用标准方法确定分子的稳定性。例如,分子的稳定性可以通过使用标准方法测量热熔化(“Tm”)温度,即一半分子解折叠的以摄氏度(℃)为单位的温度来确定。通常,Tm越高,分子越稳定。除了热量,化学环境也会改变蛋白质维持特定三维结构的能力。
在一个实施方式中,本公开的特异性结合人血清白蛋白的FN3结构域可以表现出与通过Tm增加测量的改造之前的相同结构域相比,稳定性增加至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更多。
化学变性同样可以通过多种方法测量。化学变性剂包括盐酸胍、硫氰酸胍、脲、丙酮、有机溶剂(DMF、苯、乙腈)、盐(硫酸铵、溴化锂、氯化锂、溴化钠、氯化钙、氯化钠);还原剂(例如二硫苏糖醇、β-巯基乙醇、二硝基苯和氢化物,诸如硼氢化钠)、非离子和离子去污剂、酸(例如盐酸(HCl)、乙酸(CH3COOH)、卤代乙酸)、疏水分子(例如磷脂)和靶向变性剂。变性程度的定量可以依赖于功能特性的丧失,诸如结合靶分子的能力,或依赖于通过物理化学特性,诸如聚集倾向、原来溶剂无法接触的残基的暴露,或二硫键的破坏或形成。
本公开的FN3结构域可以作为单体、二聚体或多聚体产生,例如,作为增加靶分子结合的效价并因此增加亲和力,或产生同时结合两种或更多种不同靶分子的双特异性或多特异性支架的方式。二聚体和多聚体可以通过连接单特异性、双特异性或多特异性蛋白质支架来产生,例如通过包含氨基酸接头,例如含有聚甘氨酸、甘氨酸和丝氨酸或丙氨酸和脯氨酸的接头。示例性接头包括(GS)2(SEQ ID NO:71)、(GGGS)2(SEQ ID NO:72)、(GGGGS)5(SEQ ID NO:73)、(AP)2(SEQ ID NO:74)、(AP)5(SEQ ID NO:75)、(AP)10(SEQ ID NO:76)、(AP)20(SEQ ID NO:77)和A(EAAAK)5AAA(SEQ ID NO:78)。二聚体和多聚体可以在N方向至C方向上彼此连接。使用天然存在的以及人工肽接头将多肽连接到新的连接融合多肽中在文献中是众所周知的(Hallewell et al.,J Biol Chem 264,5260-5268,1989;Alfthan etal.,Protein Eng.8,725-731,1995;Robinson&Sauer,Biochemistry 35,109-116,1996;美国专利第5,856,456号)。
人血清白蛋白粘结剂
FN3结构域由于其~10kDa的较小尺寸而经由肾脏过滤和降解从循环中迅速清除。在某些方面,本公开提供了特异性结合血清白蛋白,例如人血清白蛋白(HSA)的FN3结构域,以延长FN3结构域或与结合白蛋白的FN3结构域相关或连接的另一种治疗剂的半衰期。
在一些实施方式中,结合人血清白蛋白的FN3结构域包含与分子的N端连接的起始甲硫氨酸(Met)。
在一些实施方式中,人血清结合的白蛋白FN3结构域包含与FN3结构域的C端或N端连接的半胱氨酸(Cys)。
N端Met和/或C端Cys的添加可以促进表达和/或缀合到另一分子,该分子可是另一半衰期延长分子,诸如PEG、Fc区、另一FN3结构域等。
在一些实施方式中,FN3结构域包含SEQ ID No:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的氨基酸序列。在一些实施方式中,FN3结构域(蛋白质)是分离的。在一些实施方式中,FN3蛋白包含与SEQ ID NO:51相比具有至少一个置换的SEQID NO:51。在一些实施方式中,置换位于对应于SEQ ID NO:51的位置10的残基处。在一些实施方式中,置换(突变)是Al0V。在一些实施方式中,置换是A10至G、L、I、T或S。在一些实施方式中,位置10处的置换是任何天然存在的氨基酸。
在一些实施方式中,FN3结构域包含的氨基酸序列与SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的氨基酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方式中,FN3结构域包含的氨基酸序列与SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的氨基酸序列至少具有或具有85%、86%、87%、88%、89%、90%、901%、92%、93%、94%、95%、96%、97%、98%或99%的同一性,条件是该蛋白质具有对应于SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的位置10的置换。在一些实施方式中,置换是Al0V。在一些实施方式中,置换是A10G、A10L、A10I、A10T或A10S。在一些实施方式中,位置10处的置换是任何天然存在的氨基酸。
在一些实施方式中,当与SEQ ID No:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的氨基酸序列相比时,分离的FN3结构域包含的氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13或14个置换。在一些实施方式中,置换位于对应于SEQ IDNo:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69的位置10的位置处。
在一些实施方式中,所提供的FN3结构域在对应于SEQ ID NO 1的残基位置6、11、22、25、26、52、53、61、88或位置6、8、10、11、14、15、16、20、30、34、38、40、41、45、47、48、53、54、59、60、62、64、70、88、89、90、91或93的至少一个残基位置中或在C端处包含半胱氨酸残基。尽管位置是按系列列出的,但也可以单独选择每个位置。在一些实施方式中,半胱氨酸位于对应于位置6、53或88的位置处。
在某些实施方式中,如本文所描述的分离的FN3结构域可包含如SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69所示的序列,其中C链、CD环、F链和FG环分别用来自任何所描述的结合白蛋白的FN3结构域序列(即SEQ ID No:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69),或与四个核心FN3结构域序列的C链、CD环、F链和FG环序列具有至少85%、90%、95%、97%、98%或99%同一性的序列的指定的组的C链、CD环、F链和FG环替代。
在一些实施方式中,分离的结合白蛋白的FN3结构域包含如SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69中所示的序列。
在一些实施方式中,FN3结构域包含SEQ ID NO:51,其具有以下置换:A10V、N33A、A35S、W37A、P39A、G40A、I41A、G42A、W47A、R49A、K69A、W71A、H73A、A79S、S80A、P82A、I85A或R87A。在一些实施方式中,FN3结构域包含在位置10、33、25、37、39、40、41、42、47、49、69、71、73、79、80、82、85或87处具有置换的SEQ ID NO:51。在一些实施方式中,FN3结构域包含在位置10处具有置换的SEQ ID NO:51。在一些实施方式中,FN3结构域包含在位置10处具有置换和另外的置换A10V、A10G、A10L、A10I、A10T或A10S的SEQ ID NO:51。
在一些实施方式中,FN3结构域包含与SEQ ID NO:51的氨基酸序列具有90%同一性,或当与SEQ ID NO:51的氨基酸序列相比时,具有1、2、3、4、5、6、7、8、9、10、11、12、13或14个置换的氨基酸序列。
在一些实施方式中,置换是丙氨酸置换。在一些实施方式中,置换是G、L、I、T或S。在一些实施方式中,置换或改变是对任何其他天然存在的氨基酸残基的置换或改变。“天然存在的氨基酸残基”是指20种氨基酸残基,诸如丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸。在一些实施方式中,W37或W47被不同的疏水残基取代,诸如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸或甲硫氨酸。在一些实施方式中,W37或W47被苯丙氨酸或酪氨酸取代。
结合人血清白蛋白的FN3结构域的融合物
在一些实施方式中,本公开提供了包含结合血清白蛋白的FN3结构域和至少一个另外的部分的缀合物。另外的部分可用于任何诊断、成像或治疗目的。在一些实施方式中,另外的部分是反义寡核苷酸、siRNA、miRNA、抗体、另一FN3结构域等。其他FN3结构域的实例包括但不限于美国专利第8278419号、第9200059号、第10040842号、第8569227号、第9234029号、第9982253号、第9200273号、第9897612号、第10196446号、第8415291号、第8617894号、第9695228号、第9725497号、第9156887号或第10280200号中提供的那些,这些专利中的每项均通过引用整体并入本文中,包括其中提供的特定FN3结构域。或者在美国专利申请No.:15/629090、16/218990、15/637276、15/148312、15/611296、15/839915、15/840281、15/840303、62/914643、62/914654或62/914725中提供的那些,这些专利中的每项均通过引用整体并入本文中,包括其中提供的特定FN3结构域。
在某些实施方式中,与所述FN3结构域融合的部分的血清半衰期相对于未与FN3结构域缀合的部分的血清半衰期增加。在某些实施方式中,相对于当未融合至所述FN3结构域时的部分的血清半衰期,FN3结构域融合物的血清半衰期长至少20%、40%、60%、80%、100%、120%、150%、180%、200%、400%、600%、800%、1000%、1200%、1500%、1800%、1900%、2000%、2500%或3000%。在其他实施方式中,相比当未融合至所述FN3结构域时的部分的血清半衰期,FN3结构域融合物的血清半衰期大至少1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、10倍、12倍、13倍、15倍、17倍、20倍、22倍、25倍、27倍、30倍、35倍、40倍或50倍。在一些实施方式中,食蟹猴中FN3结构域融合物的血清半衰期为至少2小时、2.5小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、15小时、20小时、25小时、30小时、35小时或40小时。
因此,本文所述的所述FN3结构域融合分子可用于通过在治疗部分和所述FN3结构域之间产生融合来增加治疗部分的半衰期。此类融合分子可用于治疗对融合物中所含治疗部分的生物活性有反应的病症。本公开考虑了所描述FN3结构域融合分子在由以下任何蛋白质或分子的失调引起的疾病中的用途。
异源性部分
在一些实施方式中,所描述的FN3结构域与第二部分融合,该第二部分是有机小分子、核酸分子或蛋白质。在一些实施方式中,所述FN3结构域与靶向受体、受体配体、病毒外壳蛋白、免疫系统蛋白、激素、酶、抗原或细胞信号传导蛋白的治疗部分融合。可以通过将第二部分附接到所述FN3结构域的任一端形成融合,即FN3结构域-治疗分子或治疗分子-FN3结构域排列。
在其他示例性实施方式中,所述FN3结构域融合到一个或多个另外的FN3结构域。例如,所述FN3结构域可以融合到一个、两个、三个、四个或更多个另外的FN3结构域。另外的FN3结构域可以与血清白蛋白以外的相同或不同靶标结合。FN3结构域的实例在本文中提供并且通过引用并入本文中。
在一些实施方式中,所述FN3结构域与另一分子连接。在一些实施方式中,另一分子是药物或治疗剂、蛋白质、抗体、聚合物、毒素。在一些实施方式中,另一分子是与人白蛋白以外的分子结合的FN3结构域。在一些实施方式中,其他FN3结构域结合CD71。在一些实施方式中,所述FN3结构域直接连接到另一分子。在一些实施方式中,所述FN3结构域通过接头连接至另一分子。在一些实施方式中,接头是肽接头。在一些实施方式中,肽接头包括序列(GS)2(SEQ ID NO:71)、(GGGS)2(SEQ ID NO:72)、(GGGGS)5(SEQ ID NO:73)、(AP)2(SEQ IDNO:74)、(AP)5(SEQ ID NO:75)、(AP)10(SEQ ID NO:76)、(AP)20(SEQ ID NO:77)和A(EAAAK)5AAA(SEQ ID NO:78)。
在某些实施方式中,本申请提供了可以由下式表示的FN3-Y融合物:FN3-X-Y或Y-XFN3,其中FN3是如本文所述的FN3结构域(包括任何N端和/或C端延伸),X是多肽接头(合适的接头包括,例如,SEQ ID NOs:71-78中的任一个),并且Y是如本文所述的治疗部分。
在某些实施方式中,本申请提供了可以由下式表示的FN3-Y融合物:FN3-Xi-Cys-X2-Y或Y-Xi-Cys-X2-FN3,其中FN3是如本文所描述的FN3结构域(包括任何N端和/或C端延伸),Xi是任选的多肽接头(合适的接头包括,例如,SEQ ID NOs:71-78中的任何一个),Cys是半胱氨酸残基,X2是化学衍生的间隔物,并且Y是如本文所描述的治疗部分。在示例性实施方式中,化学衍生的间隔子包含马来酰亚胺部分,其可用于通过如本文进一步描述的Michael加成,将治疗部分缀合到所述FN3结构域的C端Cys,或将所述FN3结构域缀合到治疗部分的C端Cys。在其他方面,所描述的FN3结构域可以与两个或更多个治疗部分结合。例如,两个部分可以以各种排列结合到所述FN3结构域,诸如例如融合序列的N端到C端,如下所示:X-Y-FN3、X-FN3-Y或FN3-X-Y,其中X和Y代表两个不同的治疗部分。两个不同的治疗部分可以选自本文公开的任何部分。
在某些实施方式中,双特异性FN3分子包含第一FN3结构域和第二FN3结构域,其中所述第一FN3结构域包含本文所描述的血清白蛋白结合FN3结构域,并且所述第二FN3结构域结合人血清白蛋白以外的靶蛋白。
结合多肽的去免疫化
可以改变血清白蛋白粘结剂及其融合物的氨基酸序列,以消除一个或多个B或T细胞表位。可以使包括本文所描述的所述FN3结构域融合物的蛋白质去免疫化,以使其对给定物质无免疫原性或免疫原性较低。去免疫化可以通过改变蛋白质的结构来实现。可以采用本领域技术人员已知的任何去免疫技术,参见例如WO00/34317,其公开内容通过引用整体并入本文中。
在一实施方式中,可以分析血清白蛋白粘结剂和它们的融合物的序列中MHC II类结合基序的存在。例如,可以与结合MHC的基序的数据库进行比较,诸如例如通过在万维网sitewehil.wehi.edu.au上搜索“motifs”数据库。可选地,可以使用计算线程方法来鉴定MHC II类结合肽,诸如由Altuvia et al.(J.Mol.Biol.249 244-250(1995))设计的那些,由此测试来自多肽的连续重叠肽与MHC II类蛋白的结合能。计算结合预测算法包括iTopeTM、Tepitope、SYFPEITHI、EpiMatrix(EpiVax)和MHCpred。为了帮助鉴定MHC II类结合肽,可以搜索与成功呈递的肽相关的序列特征,诸如两亲性和Rothbard基序,以及组织蛋白酶B和其他加工酶的切割位点。
在确定了潜在的(例如人)T细胞表位后,这些表位随后根据消除T细胞表位的需要通过改变一个或多个氨基酸来消除。通常,这将涉及T细胞表位本身内一个或多个氨基酸的改变。这可能涉及在蛋白质的一级结构方面改变与表位相邻的氨基酸,或在一级结构中不相邻但在分子的二级结构中相邻的氨基酸。考虑的通常改变将是氨基酸置换,但在某些情况下氨基酸添加或缺失可能是合适的。所有改变都可以通过重组DNA技术完成,因此最终分子可以通过从重组宿主表达来制备,例如通过成熟的方法,但也可以使用蛋白质化学或任何其他分子改变方式。
一旦鉴定的T细胞表位被去除,可以再次分析去免疫的序列,以确保没有产生新的T细胞表位,并且如果它们产生,可以删除表位。
并非所有计算鉴定的T细胞表位都需要被移除。本领域技术人员将理解特定表位的“强度”或更确切地说潜在免疫原性的重要性。各种计算方法生成潜在表位的评分。本领域技术人员将认识到可能仅需要去除高评分表位。技术人员还将认识到在去除潜在表位和保持蛋白质的结合亲和力或其他生物活性之间存在平衡。因此,一种策略是依次将置换引入所描述FN3结构域或FN3结构域融合蛋白中,然后测试靶标结合或其他生物活性和免疫原性。
另外的修饰
在某些实施方式中,血清白蛋白粘结剂及其融合物可进一步包含翻译后修饰。示例性的翻译后蛋白质修饰包括磷酸化、乙酰化、甲基化、ADP核糖基化、泛素化、糖基化、羰基化、类泛素化(sumoylation)、生物素化或多肽侧链或疏水基团的添加。因此,经修饰的血清白蛋白粘结剂及其融合物可能含有非氨基酸元素,诸如脂质、多糖或单糖以及磷酸盐。糖基化的优选形式是唾液酸化,其将一个或多个唾液酸部分与多肽缀合。唾液酸部分提高了溶解度和血清半衰期,同时还降低了蛋白质可能的免疫原性。参见,例如Raju etal.Biochemistry.2001Jul 31;40(30):8868-76。可以测试这些非氨基酸元素对血清白蛋白粘结剂或其融合物的功能的影响,以了解它们结合特定血清白蛋白(例如HSA或RhSA)的能力和/或在融合物背景下由特定的非FN3部分赋予的功能作用(例如,FGF21对葡萄糖摄取的影响)。
载体&多核苷酸实施方式
本公开内容中还包括编码本文所描述的任何蛋白质的核酸序列。如本领域技术人员所理解的,由于第三碱基简并性,几乎每个氨基酸都可以由编码核苷酸序列中的多于一个三联体密码子表示。另外,微小的碱基对变化可能会导致在编码的氨基酸序列中发生保守置换,但预计不会显著改变基因产物的生物活性。因此,编码本文所描述蛋白质的核酸序列可以在序列上稍加修饰,但仍编码其各自的基因产物。
可以化学合成编码本文公开的各种蛋白质或多肽中的任一种的核酸。可选择密码子使用以改善在细胞中的表达。这种密码子使用将取决于所选的细胞类型。已经为大肠杆菌和其他细菌以及哺乳动物细胞、植物细胞、酵母细胞和昆虫细胞开发了专门的密码子使用模式。参见,例如:Mayfield et al,Proc Natl Acad Sci U S A.2003 100(2):438-42;Sinclair et al.Protein Expr Purif.2002(1):96-105;Connell ND.Curr OpinBiotechnol.2001(5):446-9;Makrides et al.Microbiol Rev.1996 60(3):512-38;和Sharp et al.Yeast.1991 7(7):657-78。
用于核酸操作的一般技术在本领域技术人员的范围内,并且还描述于例如Sambrook et al.,Molecular Cloning:A Laboratory Manual,Vols.1-3,Cold SpringHarbor Laboratory Press,2ed.1989,或F.Ausubel et al,Current Protocols inMolecular Biology(Green Publishing and Wiley-Interscience:New York,1987)及定期更新中,其通过引用并入本文中。编码蛋白质的DNA可操作地连接到源自哺乳动物、病毒或昆虫基因的合适的转录或翻译调控元件。此类调节元件包括转录启动子、控制转录的任选操纵子序列、编码合适的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列。另外并入了在宿主中复制的能力,通常由复制起点赋予,以及促进识别转化体的选择基因。合适的调节元件在本领域中是众所周知的。
本文所描述的蛋白质和融合蛋白可以作为与异源多肽的融合蛋白产生,所述异源多肽优选是信号序列或在成熟蛋白质或多肽的N端具有特定切割位点的其他多肽。所选择的异源信号序列优选地是被宿主细胞识别和加工(即,被信号肽酶切割)的那些。对于不识别和处理天然信号序列的原核宿主细胞,信号序列被原核信号序列取代,所述原核信号序列选自例如碱性磷酸酶、青霉素酶、lpp或热稳定肠毒素II前导序列的组。对于酵母分泌,天然信号序列可以被例如酵母转化酶前导序列、因子前导序列(包括酵母属和克鲁维酵母属α-因子前导序列)或酸性磷酸酶前导序列、白色念珠菌葡糖淀粉酶前导序列或PCT公开No.WO 90/13646中描述的信号所取代。在哺乳动物细胞表达中,可以使用哺乳动物信号序列以及病毒分泌前导序列,例如单纯疱疹gD信号。这种前体区域的DNA可以在阅读框内连接到编码蛋白质的DNA。
在真核宿主细胞(例如酵母、真菌、昆虫、植物、动物、人或来自其他多细胞生物的有核细胞)中使用的表达载体也将包含终止转录和稳定mRNA所必需的序列。此类序列通常可从真核或病毒DNA或cDNA的5'端和偶尔3'非翻译区获得。这些区域包含在编码多价抗体的mRNA的非翻译部分中转录为多聚腺苷酸化片段的核苷酸片段。一种有用的转录终止组分是牛生长激素多聚腺苷酸化区。参见PCT公开No.WO 94/11026和其中公开的表达载体。
重组DNA还可以包括可以用于纯化蛋白质的任何类型的蛋白质标签序列。蛋白质标签的实例包括但不限于组氨酸标签、FLAG标签、myc标签、HA标签或GST标签。可在CloningVectors:A Laboratory Manual,(Elsevier,New York,1985)中找到适用于细菌、真菌、酵母和哺乳动物细胞宿主的克隆和表达载体,其相关公开内容通过引用并入本文中。
使用适合于宿主细胞的方法将表达构建体引入宿主细胞中,这对于本领域技术人员来说是显而易见的。本领域已知多种将核酸引入宿主细胞中的方法,包括但不限于电穿孔;采用氯化钙、氯化铷、磷酸钙、DEAE-葡聚糖或其他物质进行转染;微粒轰击;脂转染;和感染(其中载体是感染原)。
合适的宿主细胞包括原核生物、酵母、哺乳动物细胞或细菌细胞。合适的细菌包括革兰氏阴性或革兰氏阳性生物,例如大肠杆菌或芽孢杆菌属(Bacillus spp.)酵母,优选来自酵母属物种,诸如酿酒酵母(S.cerevisiae),也可以用于产生多肽。各种哺乳动物或昆虫细胞培养系统也能够用于表达重组蛋白。Luckow和Summers(Bio/Technology,6:47,1988)综述了用于在昆虫细胞中产生异源蛋白质的杆状病毒系统。在一些情况下,需要在脊椎动物细胞中产生蛋白质,诸如用于糖基化,并且脊椎动物细胞在培养(组织培养)中的增殖已成为常规程序。合适的哺乳动物宿主细胞系的实例包括内皮细胞、COS-7猴肾细胞、CV-1、L细胞、C127、3T3、中国仓鼠卵巢(CHO)、人胚胎肾细胞、HeLa、293、293T和BHK细胞系。对于许多应用,本文所描述的蛋白质多聚体的较小尺寸将使大肠杆菌成为优选的表达方法。
蛋白质产生
将宿主细胞用本文所描述的用于蛋白质产生的表达或克隆载体转化,并在常规营养培养基中培养,该培养基经适当修饰以诱导启动子、选择转化体或扩增编码所需序列的基因。
用于产生本发明蛋白质的宿主细胞可以在多种培养基中进行培养。可商购获得的培养基诸如Ham's F10(Sigma)、最低必须培养基((MEM),Sigma)、RPMI-1640(Sigma)和Dulbecco改良Eagle培养基((DMEM),Sigma)适用于培养宿主细胞。另外,在Ham et al,Meth.Enz.58:44(1979)、Barnes et al,Anal.Biochem.102:255(1980)、美国专利第4,767,704号;第4,657,866号;第4,927,762号;第4,560,655号;或第5,122,469号;WO 90/03430;WO 87/00195;或美国专利No.Re.30,985中描述的任何培养基都可以用作宿主细胞的培养基。这些培养基中的任何一种都可以根据需要补充激素和/或其他生长因子(诸如胰岛素、转铁蛋白或表皮生长因子)、盐(诸如氯化钠、钙、镁和磷酸盐)、缓冲液(诸如HEPES)、核苷酸(诸如腺苷和胸苷)、抗生素(诸如GENTAMYCINTM药物)、微量元素(定义为通常以微摩尔范围的最终浓度存在的无机化合物)和葡萄糖或等效能量源。也可以以本领域技术人员已知的适当浓度包括任何其他必要的补充物。培养条件,诸如温度、pH等,是先前与选择用于表达的宿主细胞一起使用的那些,并且对于普通技术人员将是显而易见的。
也可以使用细胞翻译系统产生本文公开的蛋白质。为此目的,必须修饰编码蛋白质的核酸,以允许体外转录来产生mRNA,并允许mRNA在所使用的特定无细胞系统中进行无细胞翻译。示例性的真核无细胞翻译系统包括例如无哺乳动物或酵母细胞的翻译系统,并且示例性的原核无细胞的翻译系统包括例如细菌无细胞翻译系统。
也可以通过化学合成(例如,通过Solid Phase Peptide Synthesis,2nded.1984,The Pierce Chemical Co.,Rockford,IL中描述的方法)产生本文公开的蛋白质。也可以通过化学合成产生对蛋白质的修饰。
可以通过蛋白质化学领域中通常已知的蛋白质的分离/纯化方法来纯化本文公开的蛋白质。非限制性实例包括萃取、重结晶、盐析(例如,用硫酸铵或硫酸钠)、离心、透析、超滤、吸附色谱、离子交换色谱、疏水色谱、正相色谱、反相色谱、凝胶过滤、凝胶渗透色谱、亲和色谱、电泳、逆流分布或这些的任何组合。纯化后,可通过本领域已知的多种方法中的任一种将蛋白质交换到不同的缓冲液中和/或浓缩,包括但不限于过滤和透析。
纯化的蛋白质优选为至少85%纯,更优选至少95%纯,且最优选至少98%纯。无论纯度的确切数值如何,蛋白质都足够纯,以用作药物产品。
成像、诊断和其他引用
基于与所述FN3结构域融合的异源分子的特性,本文提供的FN3结构域融合物可以用于治疗多种疾病和疾患。FN3结构域融合物的应用可由技术人员基于本领域知识和本文提供的信息确定。本文详细描述了各种FN3结构域融合蛋白的用途。FN3结构域融合物可被给药与任何哺乳动物受试者或患者,包括人和非人生物体。
本文所描述的血清白蛋白粘结剂和融合分子能够被可检测地标记,并用于接触表达例如由用于成像或诊断应用的融合分子结合的蛋白质的细胞。可以采用本领域已知的用于将蛋白质与可检测部分缀合的任何方法,包括由Hunter,et al,Nature 144:945(1962);David,et al,Biochemistry 13:1014(1974);Pain,et al,J.Immunol.Meth.40:219(1981);和Nygren,J.Histochem.and Cytochem.30:407(1982)描述的那些方法。
在某些实施方式中,本文所述的血清白蛋白粘结剂和融合分子进一步附接到能够被检测的标记物(例如,标记物可以是放射性同位素、荧光化合物、酶或酶辅因子)。标记可以是放射性试剂,诸如:放射性重金属如铁螯合物、钆或锰的放射性螯合物、氧、氮、铁、碳或镓的正电子发射体、43K、52Fe、57Co、67Cu、67Ga、68Ga、123I、125I、13T、132I或99Tc。附着于这种部分的血清白蛋白粘结剂或融合分子可用作成像剂,并以对哺乳动物诸如人中的诊断用途有效的量给药,然后检测成像剂的定位和积累。成像剂的定位和积累可以通过放射闪烁照相术、核磁共振成像、计算机断层扫描或正电子发射断层扫描来检测。如对熟练技术人员显而易见的,待给药的放射性同位素的量取决于放射性同位素。本领域普通技术人员可以根据用作活性部分的给定放射性核素的比活度和能量容易地制定待给药的成像剂的量。
血清白蛋白粘结剂和融合分子也可用作亲和纯化剂。在该过程中,使用本领域熟知的方法将蛋白质固定在合适的支持物上,如Sephadex树脂或滤纸。蛋白质可用于任何已知的测定方法,诸如竞争性结合测定、直接和间接夹心测定和免疫沉淀测定(Zola,Monoclonal Antibodies:A Manual of Techniques,147-158页(CRC Press,Inc.,1987))。示例性的治疗制剂和给药方式
本发明提供了用于给药与所描述的FN3结构域融合的治疗部分的方法,其中所述治疗部分的半衰期在与所描述的FN3结构域融合时延长。用于给药融合构建体的技术和剂量将根据与所描述的FN3结构域融合的治疗部分的类型和所治疗的具体病症而变化,但能够由技术人员容易地确定。通常,监管机构要求将用作治疗剂的蛋白质试剂配制为具有可接受的低水平的热原。因此,治疗制剂与其他制剂的区别通常在于它们基本上不含热原,或含有至少不超过适当监管机构(例如,FDA)确定的可接受水平的热原。在某些实施方式中,所描述的FN3结构域及其融合分子的药物制剂包含例如pH为4.0-7.0的1-20mM琥珀酸、2-10%山梨糖醇和1-10%的甘氨酸。在示例性实施方式中,所述FN3结构域及其融合分子的药物制剂包含例如pH为6.0的10mM琥珀酸、8%山梨糖醇和5%甘氨酸。
在一些实施方式中,所描述的FN3结构域及其融合物是对于哺乳动物,特别是人在药学上可接受的。“药学上可接受的”多肽是指给药动物而没有显著不良医学后果的多肽。本文公开的药学上可接受的FN3结构域及其融合物的实例包括缺乏结合整合素的结构域(RGD)的FN3结构域和基本上不含内毒素或具有非常低的内毒素水平的组合物。
治疗组合物可以与药学上可接受的稀释剂、载体或赋形剂一起以单位剂型给药。作为非限制性实例,给药可以是肠胃外的(例如,静脉内的、皮下的)、经口的或局部的。组合物可以是丸剂、片剂、胶囊、液体剂或用于经口给药的持续释放片剂的形式;用于静脉内、皮下或肠胃外给药的液体;或凝胶、洗剂、软膏、乳膏或聚合物或其他用于局部给药的持续释放负载体。
本领域熟知的用于制备制剂的方法例如在“Remington:The Science andPractice of Pharmacy”(20th ed.,ed.A.R.Gennaro AR.,2000,Lippincott Williams&Wilkins,Philadelphia,PA)中找到。用于肠胃外给药的制剂可以例如包含赋形剂、无菌水、盐水、聚亚烷基二醇诸如聚乙二醇、植物来源的油或氢化萘。可使用生物相容的、可生物降解的丙交酯聚合物、丙交酯/乙交酯共聚物或聚氧乙烯-聚氧丙烯共聚物来控制化合物的释放。纳米颗粒制剂(例如,可生物降解的纳米颗粒、固体脂质纳米颗粒、脂质体)可用于控制化合物的生物分布。其他潜在有用的肠胃外递送系统包括乙烯-乙酸乙烯酯共聚物颗粒、渗透泵、可植入输注系统和脂质体。制剂中化合物的浓度根据许多因素而发生变化,包括要给药的药物剂量和给药途径。
多肽可以任选地作为药学上可接受的盐给药,诸如制药工业中常用的无毒酸加成盐或金属络合物。酸加成盐的实例包括有机酸,诸如乙酸、乳酸、双羟萘酸、马来酸、柠檬酸、苹果酸、抗坏血酸、琥珀酸、苯甲酸、棕榈酸、辛二酸、水杨酸、酒石酸、甲磺酸、甲苯磺酸或三氟乙酸等;聚合酸诸如单宁酸、羧甲基纤维素等;以及无机酸诸如盐酸、氢溴酸、硫酸磷酸等。金属络合物包括锌、铁等。在一实例中,在乙酸钠存在下配制多肽以增加热稳定性。
用于经口使用的制剂包括在与无毒的药学上可接受的赋形剂的混合物中含有活性成分的片剂。这些赋形剂可以是例如惰性稀释剂或填充剂(例如蔗糖和山梨糖醇)、润滑剂、助流剂和抗黏合剂(例如硬脂酸镁、硬脂酸锌、硬脂酸、二氧化硅、氢化植物油或滑石)。
用于经口使用的制剂也可以作为咀嚼片剂,或作为其中活性成分与惰性固体稀释剂混合的硬明胶胶囊,或作为其中活性成分与水或油介质混合的软明胶胶囊提供。
治疗有效剂量是指产生给药的治疗效果的剂量。确切的剂量将取决于待治疗的疾患,并且可由本领域技术人员使用已知技术确定。通常,FN3结构域融合物以每天约0.01μg/kg至约50mg/kg,优选每天0.01mg/kg至约30mg/kg,最优选每天0.1mg/kg至约20mg/kg给药。可以每天(例如,每天一次、两次、三次或四次)或更不频繁地(例如,每隔一天一次、每周一次或两次,或每月)给予所述多肽。另外,如本领域所知,可能需要调整年龄以及体重、一般健康状况、性别、饮食、给药时间、药物相互作用和疾病的严重程度,并且可以由本领域技术人员利用常规实验来确定。
用于检测人血清白蛋白的试剂盒
本文提供了用于检测生物样品中的人血清白蛋白的试剂盒。这些试剂盒包括本文所描述的一种或多种结合血清白蛋白的FN3结构域和试剂盒使用说明。
提供的结合血清白蛋白的FN3结构域可以在溶液中;被冻干;固定在基底、载体或板上;或被可检测地标记。
所描述的试剂盒还可以包括用于执行本文所述方法的附加组分。举例来说,试剂盒可以包含用于从受试者获得样品、获得对照或参考样品例如,来自患有缓慢进展癌症的受试者和/或未患有癌症的受试者的样品的方式、一个或多个样品隔室,和/或描述本发明方法的性能和组织特异性对照或标准的指导材料。
用于确定血清白蛋白水平的方式可以进一步包括,例如,用于确定血清白蛋白水平的测定中的缓冲液或其他试剂。说明可以是例如用于进行测定的印刷说明和/或用于评估血清白蛋白水平的说明。
所描述的试剂盒还可以包括用于从受试者分离样品的方式。这些方式可以包括能够用于从受试者获得流体或组织的一项或多项设备或试剂。用于从受试者获得样品的方式还可以包括用于从血液样品中分离血液组分诸如血清的方式。优选地,试剂盒设计用于人类受试者。
本文描述的实施方式涉及检测生物样品中人血清白蛋白的存在的方法,包括使生物样品与本文描述的结合血清白蛋白的FN3结构域接触,并评估生物样品与蛋白质的结合。
本文所述的实施方式涉及延长人类受试者中靶分子的半衰期的方法,该方法包括将本文所描述的结合血清白蛋白的FN3结构域与靶分子缀合,从而延长人类受试者中靶分子的半衰期。在一些实施方式中,方法还包括将缀合的分子给药与人。在一些实施方式中,靶分子是药物、抗体、与人白蛋白以外的分子结合的FN3结构域、或毒素。在一些实施方式中,缀合物是肽接头。在一些实施方式中,肽接头包括序列(GS)2(SEQ ID NO:71)、(GGGS)2(SEQ ID NO:72)、(GGGGS)5(SEQ ID NO:73)、(AP)2(SEQ ID NO:74)、(AP)5(SEQ ID NO:75)、(AP)10(SEQ ID NO:76)、(AP)20(SEQ ID NO:77)和A(EAAAK)5AAA(SEQ ID NO:78)。
实施例
提供以下实例以补充现有公开,并提供对本文所述主题的更好理解。这些实例不应被视为限制所描述的主题。应当理解,本文描述的实例和实施方式仅用于说明性目的,并且根据其的各种修改或改变对于本领域技术人员来说将是显而易见的,并且将被包括在其中,并且可以在不背离本发明的真实范围的情况下进行。
实施例1利用随机环构建TENCON文库
Tencon(SEQ ID NO:1)是一种免疫球蛋白样支架、纤连蛋白III型(FN3)结构域,从来自人生腱蛋白-C的15个FN3结构域的共有序列设计而来(Jacobs et al.,ProteinEngineering,Design,and Selection,25:107-117,2012;美国专利第8,278,419号)。Tencon的晶体结构显示了连接七个β链的六个表面暴露环。这些环或每个环内的选定残基可以被随机化,以构建纤连蛋白III型(FN3)结构域的文库,该文库可以用于选择结合特定靶标的新的分子。
Tencon:
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT(SEQ ID NO 1):
使用tencon支架和各种设计策略生成了各种文库。通常,文库TCL1和TCL2产生了良好的结合剂。TCL1和TCL2文库的生成在国际公开No.WO 2014081944A2中有详细描述。
TCL1文库的构建
构建了设计用于仅随机化Tencon的FG环(SEQ ID NO:1)的文库TCL1,用于顺式展示系统(Jacobs et al.,Protein Engineering,Design,and Selection,25:107-117,2012)。在该系统中,产生了包含Tac启动子的序列、Tencon文库编码序列、RepA编码序列、顺式元件和ori元件的双链DNA。在体外转录/翻译系统中表达后,产生了Tencon-RepA融合蛋白与编码它的DNA顺式结合的复合物。然后通过聚合酶链式反应(PCR)分离和扩增与靶分子结合的复合物,如下所描述。
用于顺式展示的TCL1文库的构建是通过连续几轮PCR来实现的,以产生两半的最终线性双链DNA分子;5'片段包含启动子和Tencon序列,而3'片段包含repA基因和顺式和ori元件。这两半通过限制性消化结合起来,以产生整个构建体。TCL1文库被设计为仅在Tencon的FG环中掺入随机氨基酸KGGHRSN(SEQ ID NO:32)。NNS密码子用于构建该文库,从而可能将所有20种氨基酸和一个终止密码子掺入FG环中。TCL1文库包含六个单独的子文库,每个子文库具有不同的随机FG环长度,从7到12个残基,以进一步增加多样性。
TCL1文库(SEQ ID NO:2)
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGVX7-12PLSAEFTT;
其中
X1、X2、X3、X4、X5、X6、X7是任意氨基酸;并且
X8、X9、X10、X11和X12是任意氨基酸或缺失
TCL2文库的构建
构建TCL2文库,其中Tencon的BC和FG环均被随机化,并严格控制每个位置处的氨基酸分布。表2显示了TCL2文库中所需环位置处的氨基酸分布。设计的氨基酸分布有两个目的。首先,基于对Tencon晶体结构的分析和/或经同源性建模,该文库偏向于预测在结构上对Tencon折叠和稳定性重要的残基。例如,位置29被固定为仅疏水氨基酸的子集,因为该残基被埋在Tencon折叠的疏水核心中。第二层的设计包括将氨基酸分布偏向优先在抗体重链HCDR3中发现的残基,以有效地产生高亲和力粘结剂(Birtalan et al.,J Mol Biol 377:1518-28,2008;Olson et al.,Protein Sci 16:476-84,2007)。为实现这一目标,表2中的“设计分布”指的是如下分布:6%丙氨酸、6%精氨酸、3.9%天冬酰胺、7.5%天冬氨酸、2.5%谷氨酸、1.5%谷氨酰胺、15%甘氨酸、2.3%组氨酸、2.5%异亮氨酸、5%亮氨酸、1.5%赖氨酸、2.5%苯丙氨酸、4%脯氨酸、10%丝氨酸、4.5%苏氨酸、4%色氨酸、17.3%酪氨酸和4%缬氨酸。这种分布没有甲硫氨酸、半胱氨酸和终止密码子。
TCL2文库(SEQ ID NO:3)
LPAPKNLVVSEVTEDSLRLSWX1X2X3X4X5X6X7X8SFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGVX9X10X11X12X13SX14X15LSAEFTT;其中
X1是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X2是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X3Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X4是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X5是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X6是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X7是Phe、Ile、Leu、Val或Tyr;
X8是Asp、Glu或Thr;
X9是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X10是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X11是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X12是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X13是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X14是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;并且
X15是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
表2.
Figure BDA0003704078430000291
Figure BDA0003704078430000301
*残基编号基于SEQ ID NO:1的Tencon序列
随后,通过各种方式改进这些文库,包括在稳定的Tencon框架(美国专利第8,569,227号)上构建文库,当与野生型Tencon相比时,其掺入了置换E11R/L17A/N46V/E86I(Tencon27;SEQ ID NO:4),以及BC和FG环中随机化位置的改变。Tencon27在国际专利申请No.WO 2013049275中进行了描述。由此,生成了设计为仅随机化Tencon的FG环(文库TCL9)或BC和FG环的组合(文库TCL7)的新的文库。这些文库被构建用于顺式展示系统(Odegripet al.,Proc Natl Acad Sci U S A 101:2806-2810,2004)。此设计的详细信息如下所示:
稳定的Tencon(Tencon27)(SEQ ID NO:4)
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAIFTT
TCL7(随机化的FG和BC环)(SEQ ID NO:5)
LPAPKNLVVSRVTEDSARLSWX1X2X3X4X5X6X7X8X9FDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGVX10X11X12X13X14X15X16X17X18X19SNPLSAIFTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12、X13、X14、X15和X16是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y;并且
X7、X8、X9、X17、X18和X19是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失。
TCL9(随机化的FG环)(SEQ ID NO:6)
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGV X1X2X3X4X5X6X7X8X9X10X11X12SNPLSAIFTT;
X1、X2、X3、X4、X5、X6和X7是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y;并且
X8、X9、X10、X11和X12是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失。
对于文库构建,使用Slonomics技术(Sloning Biotechnology GmbH)合成编码随机BC环(长度6-9个位置)或FG环(长度7-12个位置)的DNA片段,以控制文库的氨基酸分布并消除终止密码子。独立合成BC环或FG环随机化的两组不同的DNA分子,然后使用PCR组合以产生完整的文库产物。
FG环文库(TCL9)的构建
产生了一组合成DNA分子,该分子由5'Tac启动子及后面的Tencon的完整基因序列组成,除了FG环中的随机密码子外(SEQ ID NOs:26-31)。对于FG环随机化,除半胱氨酸和甲硫氨酸外的所有氨基酸均以相等百分比编码。多样化部分的长度使得它们在FG环中编码7、8、9、10、11或12个氨基酸。以2ug的规模单独合成每个长度变化的子文库,然后使用寡核苷酸Sloning-FOR(SEQ ID NO:9)和Sloning-Rev(SEQ ID NO:10)通过PCR进行扩增。
文库的3'片段是恒定的DNA序列,其包含用于展示的元件,包括PspOMI限制性位点、repA基因的编码区和顺式和ori元件。使用质粒(pCR4Blunt)(Invitrogen)作为模板,利用M13正向和M13反向引物进行PCR反应以扩增该片段。将得到的PCR产物用PspOMI消化过夜并进行凝胶纯化。为了将文库DNA的5'部分连接到含有repA基因的3'DNA,在存在NotI和PspOMI酶和T4连接酶的情况下,于37℃下将2pmol(~540ng至560ng)的5'DNA与等摩尔(~1.25μg)的3'repA DNA连接过夜。通过使用12个循环的PCR,利用寡核苷酸POP2250(SEQ IDNO:11)和DigLigRev(SEQ ID NO:12)扩增连接的文库产物。对于每个子文库,将来自12个PCR反应的所得DNA合并,并通过Qiagen离心柱纯化。TCL9的每个子文库的产量范围为32-34μg。
FG/BC环文库(TCL7)的构建
TCL7文库提供了具有随机化的Tencon BC和FG环的文库。在该文库中,将长度为6-9个氨基酸的BC环与长度为7-12个氨基酸的随机化FG环组合混合。合成的Tencon片段BC6、BC7、BC8和BC9(SEQ ID NO:13-16)被产生为包括Tencon基因,该基因编码蛋白质的N端部分,直至并包括残基VX,从而用6、7、8或9个随机化的氨基酸替换BC环。这些片段是在发现L17A、N46V和E83I突变(CEN5243)之前合成的,但这些突变是在下面描述的分子生物学步骤中引入的。为了将该片段与编码随机化的FG环的片段组合,采取了以下步骤。
首先,使用寡核苷酸POP2222ext(SEQ ID NO:18)和LS1114(SEQ ID NO:19),通过PCR产生编码Tac启动子和Tencon的5'序列直至编码氨基酸A17(130mer-L17A,SEQ ID NO:17)的核苷酸的DNA片段。这样做是为了在文库(CEN5243)中包含L17A突变。接下来,使用BC6、BC7、BC8或BC9作为模板和寡核苷酸LS1115(SEQ ID NO:20)和LS1117(SEQ ID NO:21),通过PCR扩增编码Tencon残基R18-V75的DNA片段,包括随机化的BC环。该PCR步骤在3'端处引入了BsaI位点。随后使用寡核苷酸POP2222ext和LS1117作为引物,通过重叠PCR将这些DNA片段连接起来。将得到的240bp的PCR产物合并,并通过Qiagen PCR纯化试剂盒进行纯化。将纯化的DNA用BsaI-HF消化并进行凝胶纯化。
使用FG7(SEQ ID NO:31)、FG8(SEQ ID NO:30)、FG9(SEQ ID NO:29)、FG10(SEQ IDNO:28)、FG11(SEQ ID NO:27)和FG12(SEQ ID NO:26)作为模板,利用寡核苷酸SDG10(SEQID NO:22)和SDG24(SEQ ID NO:23),通过PCR扩增编码FG环的片段,以掺入BsaI限制性位点和N46V和E86I变体(CEN5243)。
将消化的BC片段和FG片段使用3路连接在一个步骤中连接在一起。在16种可能的组合中设置了四个连接反应,每种连接反应组合了两种BC环长度和2种FG环长度。每种连接含有~300ng的总BC片段和300ng的FG片段。然后使用寡核苷酸POP2222(SEQ ID NO:24)和SDG28(SEQ ID NO:25)通过PCR扩增这4个连接池。然后用Not1消化7.5μg的每种反应产物,并用Qiagen PCR纯化柱进行净化。将5.2μg该DNA连接到等摩尔量的RepA DNA片段(~14μg)上,用PspOMI消化,并使用寡核苷酸POP2222通过PCR扩增产物。
实施例2具有替代结合表面的TENCON文库的生成
在特定文库设计中待随机化的残基的选择决定了所创建的相互作用表面的整体形状。对从文库(其中BC、DE和FG环被随机化)选择的FN3结构域(其包含结合麦芽糖结合蛋白(MBP)的支架蛋白)进行X射线晶体学分析,显示其具有适合MBP的活性位点的大部分弯曲界面(Koide et al.,Proc Natl Acad Sci U S A 104:6632-6637,2007)。相反,发现选择与MBP结合的锚蛋白重复支架蛋白具有更平坦的相互作用表面,并结合远离活性的MBP的外表面(Binz et al.,Nat Biotechnol 22:575-582,2004)。这些结果表明,支架分子结合表面的形状(弯曲与平坦)可能决定了哪些靶蛋白或那些靶蛋白上的特定表位能够被支架有效结合。围绕包含FN3结构域以用于蛋白质结合的改造的蛋白质支架已发表的努力依赖于改造相邻环以用于靶标结合,从而产生弯曲的结合表面。这种方法可能会限制此类支架可访问的靶标和表位的数量。
Tencon和其他FN3结构域包含两组位于分子相对面上的CDR样环,第一组由BC、DE和FG环形成,且第二组由AB、CD和EF环形成。两组环由形成FN3结构中心的β链分开。如果将Tencon的图像旋转90度,则可以看到一个替代表面。该略微凹入的表面由CD和FG环以及两条反平行的β链、C和Fβ链形成,并且在本文中称为C-CD-F-FG表面。C-CD-F-FG表面可用作模板,以通过随机化形成表面的残基子集来设计蛋白质支架相互作用表面的文库。β-链具有重复结构,每个其他残基的侧链都暴露于蛋白质表面。因此,可以通过随机化β链中的一些或所有表面暴露残基来构建文库。通过在β链中选择合适的残基,Tencon支架的固有稳定性应受到最小程度的损害,同时为与其他蛋白质的相互作用提供独特的支架表面。
文库TCL14(SEQ ID NO:7)被设计到Tencon27支架(SEQ ID NO:4)中。
用于构建该文库的方法的完整描述在美国公开No.US2013/0226834中有描述。
TCL14文库(SEQ ID NO:7):
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFX1IX2YX3EX4X5X6X7GEAIVLTVPGSERSYDLTGLKPGTEYX8VX9IX10GVKGGX11X12SX13PLSAIFTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12和X13是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M。
在Tencon27中形成C-CD-F-FG表面的两条β链共有9个可被随机化的表面暴露残基;C链:S30、L32、Q34、Q36;F链:E66、T68、S70、Y72和V74,而CD环有6个潜在残基:S38、E39、K40、V41、G42和E43,并且FG环有7个潜在残基:K75、G76、G77、H78、R79、S80和N81。如果所有22个残基都被随机化,则选择所选的残基包含在TCL14设计中,这是因为文库的理论大小更大。
选择Tencon中的13个位置用于随机化:C链中的L32、Q34和Q36,CD环中的S38、E39、K40和V41,F链中的T68、S70和Y72,FG环中的H78、R79和N81。在C和F链中,S30和E66未被随机化,因为它们刚好位于CD和FG环之外,并且看起来不像是C-CD-F-FG表面的一部分。对于CD环,G42和E43未被随机化为甘氨酸,提供了灵活性,在环区域可能很有价值,并且E43位于表面的连接处。FG环排除了K75、G76、G77和S80。由于上述原因,甘氨酸被排除在外,而对晶体结构的仔细检查揭示S80与核心进行关键接触以帮助形成稳定的FG环。K75远离面对C-CD-F-FG表面的表面,并且对于随机化来说是不太吸引人的候选物。尽管上述残基在最初的TCL14设计中未被随机化,但它们可以包含在后续文库设计中,以为从头选择或例如选择TCL14靶标特异性命中物的亲和力成熟文库提供额外的多样性。
在产生TCL14之后,产生了3个额外的类似设计的Tencon文库。这两个文库TCL19、TCL21和TCL23在与TCL14相同的位置处被随机化(见上文),但是在这些位置处发生的氨基酸分布发生了变化(表3)。TCL19和TCL21设计为在每个位置处均等分布18种天然氨基酸(每个位置的5.55%),仅排除半胱氨酸和甲硫氨酸。TCL23的设计使得每个随机化位置接近于在功能性抗体的HCDR3环中发现的氨基酸分布(Birtalan et al.,J Mol Biol 377:1518-1528,2008),如表2中所述。与TCL21文库一样,半胱氨酸和甲硫氨酸被排除在外。
构建了第三个另外的文库以扩展其他文库文库的潜在靶结合表面。在该文库TCL24中,与文库TCL14、TCL19、TCL21和TCL23相比,4个额外的Tencon位置被随机化。这些位置包括来自D链的N46和T48,以及来自G链的S84和I86。特别选择位置46、48、84和86,因为这些残基的侧链从β链D和G表面暴露,并且在结构上与C和F链的随机化部分相邻,因此增加了可用于与靶蛋白结合的表面积。TCL24在每个位置处使用的氨基酸分布与表3中对于TCL19和TCL21的描述相同。
TCL24文库(SEQ ID NO:8)
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFX1IX2YX3EX4X5X6X7GEAIX8LX9VPGSERSYDLTGLKPGTEYX10VX11IX12GVKGGX13X14SX15PLX16AX17FTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12和X13是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W。
表3.在TCL21、TCL23和TCL24的每个随机化位置处的氨基酸频率(%)。
Figure BDA0003704078430000351
Figure BDA0003704078430000361
TCL21、TCL23和TCL24文库的产生
TCL21文库是使用Colibra文库技术(Isogenica)生成的,以控制氨基酸分布。使用Slonomics技术(Morphosys)生成TCL19、TCL23和TCL24基因片段,以控制氨基酸分布。使用PCR在初始合成后扩增每个文库,然后连接到RepA的基因,以便用于使用CIS展示系统(Odegrip et al.,Proc Natl Acad Sci U S A 101:2806-2810,2004)进行选择,如上文针对环文库所描述的。
实施例3:选择结合人血清白蛋白的纤连蛋白III型(FN3)结构域
文库筛选
顺式展示用于从TCL14、TCL19、TCL21、TCL23和TCL24文库中选择结合人血清白蛋白的结构域。使用标准方法将重组人和猕猴血清白蛋白和人白蛋白结构域II(AlbuminBiosciences)生物素化并用于淘选。对于体外转录和翻译(ITT),将3μg文库DNA与0.1mM完整氨基酸、1X S30预混组分和15μL的S30提取物(Promega)一起孵育,总体积为50μL,并在30℃下孵育。1小时后,加入375μL封闭溶液((0.1%酪蛋白(Thermo Fisher,Rockford,IL)、100mg/ml Herring Sperm DNA(Promega,Madison,WI)、1mg/mL肝素(Sigma-Aldrich,St.Louis,MO)),并将反应在冰上孵育15分钟。为了选择,添加浓度为400nM(第1轮)、200nM(第2和第3轮)和100nM(第4和第5轮)的生物素化抗原。使用中性抗生物素蛋白磁珠(ThermoFisher,Rockford,IL)(第1、3和5轮)或链霉亲和素磁珠(Promega,Madison,WI)(第2和4轮)回收结合的文库成员,并通过用500μL PBST洗涤珠子5-14次,然后用500μL PBS洗涤2次来移除未结合的文库成员。进行了另外的选择轮次,以鉴定具有提高的亲和力的FN3结构域分子。简言之,将来自第5轮的输出按上述方法进行准备,并进行另外的迭代轮次选择,其中有以下变化:与生物素化抗原的孵育时间从1小时减少到15分钟,且珠粒捕获时间从20分钟减少到15分钟,bt-HSA降至25nM(第6轮和第7轮)或2.5nM(第8轮和第9轮),并且在存在过量非生物素化靶蛋白的情况下再进行另外的1小时洗涤。这些变化的目标是同时选择具有可能更快的结合速率和更慢的解离速率的粘结剂,从而产生显著更低的KD
淘选后,使用寡核苷酸Tcon6(SEQID NO:33)和Tcon5shortE86I(SEQID NO:34)通过PCR扩增选定的FN3结构域,通过退火亚克隆到pET15-LIC中,并使用标准分子生物学技术转化到BL21-GOLD(DE3)细胞中,以用于在大肠杆菌中进行可溶性表达。在37℃下在96孔深孔板中,挑取单个克隆并在具有氨苄青霉素的1mL LB中培养至饱和。第二天,将25uL转移到96孔深孔板中的新鲜的1mL LB-Amp培养基中,并在37℃下培养2小时。以1mM终浓度添加IPTG,并在30℃下诱导蛋白质表达16小时。通过离心收获细胞,并随后用补充有0.2mg/mL最终鸡蛋清溶菌酶(Sigma-Aldrich,St.Louis,MO)的Bugbuster HT(EMD Chemicals,Gibbstown,NJ)裂解。通过离心澄清细菌裂解物,并将上清液转移到新的96孔深孔板中,并通过ELISA测试与靶蛋白的结合。
结合人血清白蛋白的FN3结构域的选择
对来自选定淘选输出的单个克隆进行酶联免疫吸附测定(ELISA),以鉴定人血清白蛋白粘结剂。将Maxisorp板(Nunc,Rochester,NY)用5ug HSA、食蟹猴SA或5ug/ml Fc包被过夜(Sigma-Aldrich,St.Louis,MO),用Tris缓冲盐水,pH 7.4和0.05%Tween-20(TBST)洗涤,并使用Starting Block T20(Thermo Fisher,Rockford,IL)封闭。将澄清的细菌裂解物(如上所述)应用到包被的HSA、cSA和Fc板的孔上。将板孵育1小时,用TBST洗涤,并使用Molecular Devices M5读板器用抗V5标签抗体和POD化学发光底物(Roche,Indianapolis,IN)检测结合的Centyrin。命中物定义为人和食蟹猴血清白蛋白的结合信号高于Fc>10的结合信号。
如下表4中所示,一个FN3结构域B7显示出与人和食蟹猴白蛋白以及人白蛋白的结构域II的显著结合。通过制备变体进一步表征对结合人SA重要的残基,其中推定的结合位点中的每个残基分别突变为丙氨酸。表5显示结合结构域II的FN3结构域和丙氨酸变体的完整氨基序列。将SEQ ID NO:51与H9的序列(SEQ ID NO:70)进行比较,且发现其在食蟹猴中的半衰期显著增加。这是出乎意料的。
表4:
Figure BDA0003704078430000381
表5.所选FN3结构域的氨基酸序列
Figure BDA0003704078430000382
Figure BDA0003704078430000391
Figure BDA0003704078430000401
小规模表达和纯化鉴定的结合人血清白蛋白的FN3结构域
选择FN3结构域克隆,并在37℃下在96孔深孔板中于补充了100ug/mL氨苄青霉素的1mL Luria Broth(LB)(LB-Amp培养基)中培养至饱和。第二天,将25uL转移到24孔深孔板中的新鲜的5mL LB-Amp培养基中,并在37℃下培养2小时。以1mM终浓度添加IPTG,并在30℃下诱导蛋白质表达16小时。通过离心收获细胞,并用补充有0.2mg/mL最终鸡蛋清溶菌酶(Sigma-Aldrich,St.Louis,MO)的Bugbuster HT(EMD Chemicals,Gibbstown,NJ)裂解。通过离心澄清细菌裂解物,并将上清液转移到新的96孔深孔板中。按照制造商的建议(GELifesciences,Piscataway,NJ),使用96孔Ni-NTA Multitrap Plate纯化带His标签的FN3结构域。
尺寸排阻色谱分析
将尺寸排阻色谱法用于确定结合人血清白蛋白的FN3结构域的聚集状态。在PBSpH 7.4的流动相中,以0.3mL/min的流速将每个纯化的FN3结构域的等分样品(10μL)注射到Superdex 75 5/150柱(GE Healthcare)上。通过在280nm处的吸光度监测柱的洗脱。由SEC表现出高水平聚集的FN3结构域被排除在进一步分析之外。
实施例4:结合人血清白蛋白的FN3结构域的表征
人血清白蛋白-FN3结构域复合物的免疫沉淀
为了评估粘结剂的功能,测试了选定的FN3结构域与正常血清中的内源性白蛋白复合的能力。确定这一点的方法在美国申请No.15/611296中提供,该申请在此通过引用并入本文中。大多数序列,即使是那些有置换的序列,也被发现结合并下拉(pulldown)白蛋白。某些位置可能不耐受丙氨酸置换,但可以在这些位置进行其他置换而不消除白蛋白相互作用。结果如表6中所示。
表6.
Figure BDA0003704078430000411
Figure BDA0003704078430000421
FN3蛋白也在ELISA测定中进行了测试,以确定它们与固定的人或食蟹猴白蛋白结合的能力。667nM B7和B7变体与人或食蟹猴白蛋白的结合如表7中所示。阴性对照是wtTencon。
表7.
Figure BDA0003704078430000422
Figure BDA0003704078430000431
食蟹猴中结合白蛋白的FN3结构域的药代动力学:
用B7和H9进行体内研究。通过以5mg/kg的剂量经静脉内(IV)弹丸注射B7或H9对食蟹猴进行给药。根据美国专利申请No.15/611296中描述的方法确定给药方法和确定蛋白质浓度的方法,该专利申请通过引用并入本文中。图1和图2示出了药代动力学,包括称为B7或ALB40的白蛋白FN3结构域的半衰期的增加。
序列信息
SEQ ID NO:1=原始Tencon序列
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT
SEQ ID NO:2=TCL1文库
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGV(X)7-12PLSAEFTT;
其中
X1、X2、X3、X4、X5、X6、X7是任意氨基酸;并且
X8、X9、X10、X11和X12是任意氨基酸或缺失
SEQ ID NO:3=TCL2文库
LPAPKNLVVSEVTEDSLRLSWX1X2X3X4X5X6X7X8SFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPGTEYTVSIYGVX9X10X11X12X13SX14X15LSAEFTT;
其中
X1是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X2是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X3Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X4是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X5是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X6是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X7是Phe、Ile、Leu、Val或Tyr;
X8是Asp、Glu或Thr;
X9是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X10是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X11是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X12是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X13是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
X14是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;并且
X15是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val;
SEQ ID NO:4=稳定的Tencon(Tencon 27)
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAIFTT
SEQ ID NO:5=TCL7(FG和BC环)
LPAPKNLVVSRVTEDSARLSWX1X2X3X4X5X6X7X8X9FDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGVX10X11X12X13X14X15X16X17X18X19SNPLSAIFTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12、X13、X14、X15和X16是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y;并且
X7、X8、X9、X17、X18和X19是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失。
SEQ ID NO:6=TCL9(FG环)
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFLIQYQESEKVGEAIVLTVPGSERSYDLTGLKPGTEYTVSIYGV X1X2X3X4X5X6X7X8X9X10X11X12SNPLSAIFTT;
其中
X1、X2、X3、X4、X5、X6和X7是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y;并且
X8、X9、X10、X11和X12是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失。
SEQ ID NO:7=TCL14文库
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFX1IX2YX3EX4X5X6X7GEAIVLTVPGSERSYDLTGLKPGTEYX8VX9IX10GVKGGX11X12SX13PLSAIFTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12和X13是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M。
SEQ ID NO:8=TCL24文库
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFX1IX2YX3EX4X5X6X7GEAIX8LX9VPGSERSYDLTGLKPGTEYX10VX11IX12GVKGGX13X14SX15PLX16AX17FTT;
其中
X1、X2、X3、X4、X5、X6、X10、X11、X12和X13是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W。
SEQ ID NO:9=Sloning-FOR
GTGACACGGCGGTTAGAAC
SEQ ID NO:10=Sloning-REV
GCCTTTGGGAAGCTTCTAAG
SEQ ID NO:11=POP2250
CGGCGGTTAGAACGCGGCTACAATTAATAC
SEQ ID NO:12=DigLigRev
CATGATTACGCCAAGCTCAGAA
SEQ ID NO:13=BC9
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTGAAGTTACCGAAGACTCTCTGCGTCTGTCTTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNTTYGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCAACCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTCTTAGAAGCTTCCCAAAGGC
SEQ ID NO:14=BC8
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTGAAGTTACCGAAGACTCTCTGCGTCTGTCTTGGNNNNNNNNNNNNNNNNNNNNNNNNTTYGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCAACCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTCTTAGAAGCTTCCCAAAGGC
SEQ ID NO:15=BC7
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTGAAGTTACCGAAGACTCTCTGCGTCTGTCTTGGNNNNNNNNNNNNNNNNNNNNNTTYGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCAACCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTCTTAGAAGCTTCCCAAAGGC
SEQ ID NO:16=BC6
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTGAAGTTACCGAAGACTCTCTGCGTCTGTCTTGGNNNNNNNNNNNNNNNNNNTTYGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCAACCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTCTTAGAAGCTTCCCAAAGGC
SEQ ID NO:17=130mer-L17A
CGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTG
SEQ ID NO:18=POP222ext
CGG CGG TTA GAA CGC GGC TAC AAT TAA TAC
SEQ ID NO:19=LS1114
CCA AGA CAG ACG GGC AGA GTC TTC GGT AAC GCG AGA AAC AAC CAG GTT TTTCGG CGC CGG CAG CAT GGT AGA TCC TGT TTC
SEQ ID NO:20=LS1115
CCG AAG ACT CTG CCC GTC TGT CTT GG
SEQ ID NO:21=LS1117
CAG TGG TCT CAC GGA TTC CTG GTA CTG GAT CAG GAA AGA GTC GAA
SEQ ID NO:22=SDG10
CATGCGGTCTCTTCCGAAAAAGTTGGTGAAGCGATCGTCCTGACCGTTCCGGGT
SEQ ID NO:23=SDG24
GGTGGTGAAGATCGCAGACAGCGGGTTAG
SEQ ID NO:24=POP2222
CGGCGGTTAGAACGCGGCTAC
SEQ ID NO:25=SDG28
AAGATCAGTTGCGGCCGCTAGACTAGAACCGCTGCCACCGCCGGTGGTGAAGATCGCAGAC
SEQ ID NO:26=FG12
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGC
SEQ ID NO:27=FG11
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGC
SEQ ID NO:28=FG10
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGC
SEQ ID NO:29=FG9
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGC
SEQ ID NO:30=FG8
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGCSEQ ID NO:31=FG7
GTGACACGGCGGTTAGAACGCGGCTACAATTAATACATAACCCCATCCCCCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGGATCTACCATGCTGCCGGCGCCGAAAAACCTGGTTGTTTCTCGCGTTACCGAAGACTCTGCGCGTCTGTCTTGGACCGCGCCGGACGCGGCGTTCGACTCTTTCCTGATCCAGTACCAGGAATCTGAAAAAGTTGGTGAAGCGATCGTGCTGACCGTTCCGGGTTCTGAACGTTCTTACGACCTGACCGGTCTGAAACCGGGTACCGAATACACCGTTTCTATCTACGGTGTTNNNNNNNNNNNNNNNNNNNNNTCTAACCCGCTGTCTGCGATCTTCACCACCGGCGGTCACCATCACCATCACCATGGCAGCGGTTCTAGTCTAGCGGCCGCAACTGATCTTGGC
SEQ ID NO:32Tencon的FG环
KGGHRSN
SEQ ID NO:33=Tcon 6
AAGAAGGAGAACCGGTATGCTGCCGGCGCCGAAAAAC
SEQ ID NO:34=Tcon5E86I短
GAG CCG CCG CCA CCG GTT TAA TGG TGA TGG TGA TGG TGA CCA CCG GTG GTGAAG ATC GCA GAC AG
SEQ ID NO:35原始tencon C-链
sfliqyqe
SEQ ID NO:36ALB-E05 C-链
sfQiEyWe
SEQ ID NO:37ALB-E07 C-链
sfKiLyEe
SEQ ID NO:38ALB-H9 C-链
sfHiEyWe
SEQ ID NO:39原始tencon CD-环
sekvge
SEQ ID NO:40ALB-E05 CD-环
DDVGge
SEQ ID NO:41ALB-E07 CD-环
YLVFge
SEQ ID NO:42ALB-H9 CD-环
QSIVge
SEQ ID NO:43原始tencon F-链
eytvsiygvk
SEQ ID NO:44ALB-E05 F-链
eyDvYiLgvk
SEQ ID NO:45ALB-E07 F-链
eyWvAiWgvk
SEQ ID NO:46ALB-H9 F-链
eyRvWiYgvk
SEQ ID NO:47原始tencon FG-环
gghrsnp
SEQ ID NO:48ALB-E05 FG-环
ggWEsGP
SEQ ID NO:49ALB-E07 FG-环
ggQVsGT
SEQ ID NO:50ALB-H9 FG-环
ggNDsWP
B7-SEQ ID NO:51
MLPAPKNLVASRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V SEQ ID NO:52
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,N33A SEQ ID NO:53
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFAIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,A35S SEQ ID NO:54
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNISYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,W37A SEQ ID NO:55
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYAEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,P39A SEQ ID NO:56
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEAGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,G40A SEQ ID NO:57
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPAIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,I41A SEQ ID NO:58
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGAGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,G42A SEQ ID NO:59
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIAGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,W47A SEQ ID NO:60
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIALRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,R49A SEQ ID NO:61
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLAVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIARFTT
A10V,K69A SEQ ID NO:62
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYAVWIHGVKGGASSPPLIARFTT
A10V,W71A SEQ ID NO:63
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVAIHGVKGGASSPPLIARFTT
A10V,H73A SEQ ID NO:64
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIAGVKGGASSPPLIARFTT
A10V,A79S SEQ ID NO:65
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGSSSPPLIARFTT
A10V,S80A SEQ ID NO:66
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGAASPPLIARFTT
A10V,P82A SEQ ID NO:67
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSAPLIARFTT
A10V,I85A SEQ ID NO:68
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLAARFTT
A10V,R87A SEQ ID NO:69
MLPAPKNLVVSRVTEDSARLSWTAPDAAFDSFNIAYWEPGIGGEAIWLRVPGSERSYDLTGLKPGTEYKVWIHGVKGGASSPPLIAAFTT
SEQ ID NO:70 ALB-H9
LPAPKNLVVSRVTEDSARLSWTAPDAAFDSFHIEYWEQSIVGEAIVLTVPGSERSYDLTGLKPGTEYRVWIYGVKGGNDSWPLSAIFTT
SEQ ID NO:71(GS)2
GSGS
SEQ ID NO:72(GGGS)2
GGGSGGGS
SEQ ID NO:73(GGGGS)2
GGGGSGGGGSGGGGSGGGGSGGGGS
SEQ ID NO:74(AP)2
APAP
SEQ ID NO:75(AP)5
APAPAPAPAP
SEQ ID NO:76(AP)10
APAPAPAPAPAPAPAPAPAP
SEQ ID NO:77(AP)20
APAPAPAPAPAPAPAPAPAPAPAPAPAPAPAPAPAPAPAP
SEQ ID NO:78A(EAAAK)5AAA
AEAAAKEAAAKEAAAKEAAAKEAAAKAAA
SEQ ID NO:79人血清白蛋白
KWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLVAASQAALGL
SEQ ID NO:80食蟹猴血清白蛋白
KWVTFISLLFLFSSAYSRGVFRRDTHKSEVAHRFKDLGEEHFKGLVLVAFSQYLQQCPFEEHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPPLVRPEVDVMCTAFHDNEATFLKKYLYEVARRHPYFYAPELLFFAARYKAAFAECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGDRAFKAWAVARLSQKFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYMCENQDSISSKLKECCDKPLLEKSHCLAEVENDEMPADLPSLAADYVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVMLLLRLAKAYEATLEKCCAAADPHECYAKVFDEFQPLVEEPQNLVKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGAKCCKLPEAKRMPCAEDYLSVVLNRLCVLHEKTPVSEKVTKCCTESLVNRRPCFSALELDEAYVPKAFNAETFTFHADMCTLSEKEKQVKKQTALVELVKHKPKATKEQLKGVMDNFAAFVEKCCKADDKEACFAEEGPKFVAASQAALA
SEQ ID NO:81生腱蛋白C(TN3)
DAPSQIEVKDVTDTTALITWFKPLAEIDGIELTYGIKDVPGDRTTIDLTEDENQYSIGNLKPDTEYEVSLISRRGDMSSNPAKETFTT
SEQ ID NO:82Fibcon
LDAPTDLQVTNVTDTSITVSWTPPSATITGYRITYTPSNGPGEPKELTVPPSSTSVTITGLTPGVEYVVSLYALKDNQESPPLVGTQTT
SEQ ID NO:83FN10
VSDVPRDLEVVAATPTSLLISWDAPAVTVRYYRITYGETGGNSPVQEFTVPGSKSTATISGLKPGVDYTITVYAVTGRGDSPASSKPISINYRT。
序列表
<110> ARO生物疗法公司(ARO BIOTHERAPEUTICS COMPANY)
<120> 结合血清白蛋白的纤连蛋白III型结构域及其应用
<130> 145965.02402
<160> 83
<170> PatentIn version 3.5
<210> 1
<211> 89
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Glu Val Thr Glu Asp Ser
1 5 10 15
Leu Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu
20 25 30
Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile Asn Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Lys Gly Gly His Arg Ser
65 70 75 80
Asn Pro Leu Ser Ala Glu Phe Thr Thr
85
<210> 2
<211> 94
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (75)..(81)
<223> 每个X是任意氨基酸
<220>
<221> MISC_FEATURE
<222> (82)..(86)
<223> 每个X是任意氨基酸或缺失
<400> 2
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Glu Val Thr Glu Asp Ser
1 5 10 15
Leu Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu
20 25 30
Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile Asn Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Pro Leu Ser Ala Glu Phe Thr Thr
85 90
<210> 3
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (22)..(27)
<223> 每个X是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> X是Phe、Ile、Leu、Val或Tyr
<220>
<221> MISC_FEATURE
<222> (29)..(29)
<223> X是Asp、Glu或Thr
<220>
<221> MISC_FEATURE
<222> (75)..(79)
<223> 每个X是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val
<220>
<221> MISC_FEATURE
<222> (81)..(82)
<223> 每个X是Ala、Arg、Asn、Asp、Glu、Gln、Gly、His、Ile、Leu、Lys、Phe、Pro、Ser、Thr、Trp、Tyr或Val
<400> 3
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Glu Val Thr Glu Asp Ser
1 5 10 15
Leu Arg Leu Ser Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Phe Leu
20 25 30
Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile Asn Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Xaa Xaa Xaa Xaa Xaa Ser
65 70 75 80
Xaa Xaa Leu Ser Ala Glu Phe Thr Thr
85
<210> 4
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 4
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu
20 25 30
Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile Val Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Lys Gly Gly His Arg Ser
65 70 75 80
Asn Pro Leu Ser Ala Ile Phe Thr Thr
85
<210> 5
<211> 97
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (22)..(27)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y
<220>
<221> MISC_FEATURE
<222> (28)..(30)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失
<220>
<221> MISC_FEATURE
<222> (78)..(84)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y
<220>
<221> MISC_FEATURE
<222> (85)..(87)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失
<400> 5
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Asp
20 25 30
Ser Phe Leu Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile
35 40 45
Val Leu Thr Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu
50 55 60
Lys Pro Gly Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Asn Pro Leu Ser Ala Ile Phe Thr
85 90 95
Thr
<210> 6
<211> 96
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (75)..(81)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W或Y
<220>
<221> MISC_FEATURE
<222> (82)..(86)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或缺失
<400> 6
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu
20 25 30
Ile Gln Tyr Gln Glu Ser Glu Lys Val Gly Glu Ala Ile Val Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Ser Asn Pro Leu Ser Ala Ile Phe Thr Thr
85 90 95
<210> 7
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (32)..(32)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (34)..(34)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (36)..(36)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (38)..(41)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (68)..(68)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (70)..(70)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (72)..(72)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (78)..(79)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<220>
<221> MISC_FEATURE
<222> (81)..(81)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V、W、Y或M
<400> 7
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Xaa
20 25 30
Ile Xaa Tyr Xaa Glu Xaa Xaa Xaa Xaa Gly Glu Ala Ile Val Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Xaa Val Xaa Ile Xaa Gly Val Lys Gly Gly Xaa Xaa Ser
65 70 75 80
Xaa Pro Leu Ser Ala Ile Phe Thr Thr
85
<210> 8
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> MISC_FEATURE
<222> (32)..(32)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (34)..(34)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (36)..(36)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (38)..(41)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (46)..(46)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (68)..(68)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (70)..(70)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (72)..(72)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (78)..(79)
<223> 每个X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (81)..(81)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (84)..(84)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<220>
<221> MISC_FEATURE
<222> (86)..(86)
<223> X是A、D、E、F、G、H、I、K、L、N、P、Q、R、S、T、V或W
<400> 8
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Xaa
20 25 30
Ile Xaa Tyr Xaa Glu Xaa Xaa Xaa Xaa Gly Glu Ala Ile Xaa Leu Xaa
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Xaa Val Xaa Ile Xaa Gly Val Lys Gly Gly Xaa Xaa Ser
65 70 75 80
Xaa Pro Leu Xaa Ala Xaa Phe Thr Thr
85
<210> 9
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 9
gtgacacggc ggttagaac 19
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 10
gcctttggga agcttctaag 20
<210> 11
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 11
cggcggttag aacgcggcta caattaatac 30
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 12
catgattacg ccaagctcag aa 22
<210> 13
<211> 385
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (198)..(224)
<223> N是任何碱基
<400> 13
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctgaagtt accgaagact 180
ctctgcgtct gtcttggnnn nnnnnnnnnn nnnnnnnnnn nnnnttygac tctttcctga 240
tccagtacca ggaatctgaa aaagttggtg aagcgatcaa cctgaccgtt ccgggttctg 300
aacgttctta cgacctgacc ggtctgaaac cgggtaccga atacaccgtt tctatctacg 360
gtgttcttag aagcttccca aaggc 385
<210> 14
<211> 382
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (198)..(221)
<223> N是任何碱基
<400> 14
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctgaagtt accgaagact 180
ctctgcgtct gtcttggnnn nnnnnnnnnn nnnnnnnnnn nttygactct ttcctgatcc 240
agtaccagga atctgaaaaa gttggtgaag cgatcaacct gaccgttccg ggttctgaac 300
gttcttacga cctgaccggt ctgaaaccgg gtaccgaata caccgtttct atctacggtg 360
ttcttagaag cttcccaaag gc 382
<210> 15
<211> 379
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (198)..(218)
<223> N是任何碱基
<400> 15
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctgaagtt accgaagact 180
ctctgcgtct gtcttggnnn nnnnnnnnnn nnnnnnnntt ygactctttc ctgatccagt 240
accaggaatc tgaaaaagtt ggtgaagcga tcaacctgac cgttccgggt tctgaacgtt 300
cttacgacct gaccggtctg aaaccgggta ccgaatacac cgtttctatc tacggtgttc 360
ttagaagctt cccaaaggc 379
<210> 16
<211> 376
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (198)..(215)
<223> N是任何碱基
<400> 16
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctgaagtt accgaagact 180
ctctgcgtct gtcttggnnn nnnnnnnnnn nnnnnttyga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatca acctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttctta 360
gaagcttccc aaaggc 376
<210> 17
<211> 131
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 17
cggcggttag aacgcggcta caattaatac ataaccccat ccccctgttg acaattaatc 60
atcggctcgt ataatgtgtg gaattgtgag cggataacaa tttcacacag gaaacaggat 120
ctaccatgct g 131
<210> 18
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 18
cggcggttag aacgcggcta caattaatac 30
<210> 19
<211> 81
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 19
ccaagacaga cgggcagagt cttcggtaac gcgagaaaca accaggtttt tcggcgccgg 60
cagcatggta gatcctgttt c 81
<210> 20
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 20
ccgaagactc tgcccgtctg tcttgg 26
<210> 21
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 21
cagtggtctc acggattcct ggtactggat caggaaagag tcgaa 45
<210> 22
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 22
catgcggtct cttccgaaaa agttggtgaa gcgatcgtcc tgaccgttcc gggt 54
<210> 23
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 23
ggtggtgaag atcgcagaca gcgggttag 29
<210> 24
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 24
cggcggttag aacgcggcta c 21
<210> 25
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 25
aagatcagtt gcggccgcta gactagaacc gctgccaccg ccggtggtga agatcgcaga 60
c 61
<210> 26
<211> 485
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(392)
<223> N是任何碱基
<400> 26
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nntctaaccc gctgtctgcg atcttcacca 420
ccggcggtca ccatcaccat caccatggca gcggttctag tctagcggcc gcaactgatc 480
ttggc 485
<210> 27
<211> 482
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(389)
<223> N是任何碱基
<400> 27
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnt ctaacccgct gtctgcgatc ttcaccaccg 420
gcggtcacca tcaccatcac catggcagcg gttctagtct agcggccgca actgatcttg 480
gc 482
<210> 28
<211> 479
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(386)
<223> N是任何碱基
<400> 28
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnntcta acccgctgtc tgcgatcttc accaccggcg 420
gtcaccatca ccatcaccat ggcagcggtt ctagtctagc ggccgcaact gatcttggc 479
<210> 29
<211> 476
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(383)
<223> N是任何碱基
<400> 29
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnnnnn nnntctaacc cgctgtctgc gatcttcacc accggcggtc 420
accatcacca tcaccatggc agcggttcta gtctagcggc cgcaactgat cttggc 476
<210> 30
<211> 473
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(380)
<223> N是任何碱基
<400> 30
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnnnnn tctaacccgc tgtctgcgat cttcaccacc ggcggtcacc 420
atcaccatca ccatggcagc ggttctagtc tagcggccgc aactgatctt ggc 473
<210> 31
<211> 470
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (357)..(377)
<223> N是任何碱基
<400> 31
gtgacacggc ggttagaacg cggctacaat taatacataa ccccatcccc ctgttgacaa 60
ttaatcatcg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 120
caggatctac catgctgccg gcgccgaaaa acctggttgt ttctcgcgtt accgaagact 180
ctgcgcgtct gtcttggacc gcgccggacg cggcgttcga ctctttcctg atccagtacc 240
aggaatctga aaaagttggt gaagcgatcg tgctgaccgt tccgggttct gaacgttctt 300
acgacctgac cggtctgaaa ccgggtaccg aatacaccgt ttctatctac ggtgttnnnn 360
nnnnnnnnnn nnnnnnntct aacccgctgt ctgcgatctt caccaccggc ggtcaccatc 420
accatcacca tggcagcggt tctagtctag cggccgcaac tgatcttggc 470
<210> 32
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 32
Lys Gly Gly His Arg Ser Asn
1 5
<210> 33
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 33
aagaaggaga accggtatgc tgccggcgcc gaaaaac 37
<210> 34
<211> 65
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 34
gagccgccgc caccggttta atggtgatgg tgatggtgac caccggtggt gaagatcgca 60
gacag 65
<210> 35
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 35
Ser Phe Leu Ile Gln Tyr Gln Glu
1 5
<210> 36
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 36
Ser Phe Gln Ile Glu Tyr Trp Glu
1 5
<210> 37
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 37
Ser Phe Lys Ile Leu Tyr Glu Glu
1 5
<210> 38
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 38
Ser Phe His Ile Glu Tyr Trp Glu
1 5
<210> 39
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 39
Ser Glu Lys Val Gly Glu
1 5
<210> 40
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 40
Asp Asp Val Gly Gly Glu
1 5
<210> 41
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 41
Tyr Leu Val Phe Gly Glu
1 5
<210> 42
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 42
Gln Ser Ile Val Gly Glu
1 5
<210> 43
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 43
Glu Tyr Thr Val Ser Ile Tyr Gly Val Lys
1 5 10
<210> 44
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 44
Glu Tyr Asp Val Tyr Ile Leu Gly Val Lys
1 5 10
<210> 45
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 45
Glu Tyr Trp Val Ala Ile Trp Gly Val Lys
1 5 10
<210> 46
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 46
Glu Tyr Arg Val Trp Ile Tyr Gly Val Lys
1 5 10
<210> 47
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 47
Gly Gly His Arg Ser Asn Pro
1 5
<210> 48
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 48
Gly Gly Trp Glu Ser Gly Pro
1 5
<210> 49
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 49
Gly Gly Gln Val Ser Gly Thr
1 5
<210> 50
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 50
Gly Gly Asn Asp Ser Trp Pro
1 5
<210> 51
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 51
Met Leu Pro Ala Pro Lys Asn Leu Val Ala Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 52
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 52
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 53
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 53
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Ala Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 54
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 54
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ser Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 55
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 55
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Ala Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 56
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 56
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Ala Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 57
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 57
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Ala Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 58
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 58
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ala Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 59
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 59
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Ala Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 60
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 60
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Ala Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 61
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 61
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Ala Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 62
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 62
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Ala Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 63
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 63
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Ala Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 64
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 64
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile Ala Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 65
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 65
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ser Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 66
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 66
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ala
65 70 75 80
Ser Pro Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 67
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 67
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Ala Pro Leu Ile Ala Arg Phe Thr Thr
85 90
<210> 68
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 68
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ala Ala Arg Phe Thr Thr
85 90
<210> 69
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 69
Met Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp
1 5 10 15
Ser Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe
20 25 30
Asn Ile Ala Tyr Trp Glu Pro Gly Ile Gly Gly Glu Ala Ile Trp Leu
35 40 45
Arg Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro
50 55 60
Gly Thr Glu Tyr Lys Val Trp Ile His Gly Val Lys Gly Gly Ala Ser
65 70 75 80
Ser Pro Pro Leu Ile Ala Ala Phe Thr Thr
85 90
<210> 70
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 70
Leu Pro Ala Pro Lys Asn Leu Val Val Ser Arg Val Thr Glu Asp Ser
1 5 10 15
Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe His
20 25 30
Ile Glu Tyr Trp Glu Gln Ser Ile Val Gly Glu Ala Ile Val Leu Thr
35 40 45
Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly
50 55 60
Thr Glu Tyr Arg Val Trp Ile Tyr Gly Val Lys Gly Gly Asn Asp Ser
65 70 75 80
Trp Pro Leu Ser Ala Ile Phe Thr Thr
85
<210> 71
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 71
Gly Ser Gly Ser
1
<210> 72
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 72
Gly Gly Gly Ser Gly Gly Gly Ser
1 5
<210> 73
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 73
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 74
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 74
Ala Pro Ala Pro
1
<210> 75
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 75
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10
<210> 76
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 76
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
Ala Pro Ala Pro
20
<210> 77
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 77
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
20 25 30
Ala Pro Ala Pro Ala Pro Ala Pro
35 40
<210> 78
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 78
Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala Ala
20 25
<210> 79
<211> 608
<212> PRT
<213> 智人(Homo sapiens)
<400> 79
Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Tyr
1 5 10 15
Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala His
20 25 30
Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile
35 40 45
Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys
50 55 60
Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu
65 70 75 80
Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys
85 90 95
Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp
100 105 110
Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His
115 120 125
Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp
130 135 140
Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys
145 150 155 160
Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu
165 170 175
Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys
180 185 190
Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu
195 200 205
Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala
210 215 220
Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala
225 230 235 240
Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys
245 250 255
Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp
260 265 270
Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys
275 280 285
Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys
290 295 300
Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu
305 310 315 320
Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys
325 330 335
Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met
340 345 350
Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu
355 360 365
Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys
370 375 380
Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe
385 390 395 400
Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu
405 410 415
Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val
420 425 430
Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu
435 440 445
Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro
450 455 460
Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu
465 470 475 480
Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val
485 490 495
Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser
500 505 510
Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu
515 520 525
Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg
530 535 540
Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro
545 550 555 560
Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala
565 570 575
Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala
580 585 590
Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu
595 600 605
<210> 80
<211> 607
<212> PRT
<213> 食蟹猴(Macaca fascicularis)
<400> 80
Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Tyr
1 5 10 15
Ser Arg Gly Val Phe Arg Arg Asp Thr His Lys Ser Glu Val Ala His
20 25 30
Arg Phe Lys Asp Leu Gly Glu Glu His Phe Lys Gly Leu Val Leu Val
35 40 45
Ala Phe Ser Gln Tyr Leu Gln Gln Cys Pro Phe Glu Glu His Val Lys
50 55 60
Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu
65 70 75 80
Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys
85 90 95
Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp
100 105 110
Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His
115 120 125
Lys Asp Asp Asn Pro Asn Leu Pro Pro Leu Val Arg Pro Glu Val Asp
130 135 140
Val Met Cys Thr Ala Phe His Asp Asn Glu Ala Thr Phe Leu Lys Lys
145 150 155 160
Tyr Leu Tyr Glu Val Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu
165 170 175
Leu Leu Phe Phe Ala Ala Arg Tyr Lys Ala Ala Phe Ala Glu Cys Cys
180 185 190
Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu
195 200 205
Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala
210 215 220
Ser Leu Gln Lys Phe Gly Asp Arg Ala Phe Lys Ala Trp Ala Val Ala
225 230 235 240
Arg Leu Ser Gln Lys Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys
245 250 255
Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp
260 265 270
Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Met Cys
275 280 285
Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Asp Lys
290 295 300
Pro Leu Leu Glu Lys Ser His Cys Leu Ala Glu Val Glu Asn Asp Glu
305 310 315 320
Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Tyr Val Glu Ser Lys
325 330 335
Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met
340 345 350
Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Met Leu
355 360 365
Leu Leu Arg Leu Ala Lys Ala Tyr Glu Ala Thr Leu Glu Lys Cys Cys
370 375 380
Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe
385 390 395 400
Gln Pro Leu Val Glu Glu Pro Gln Asn Leu Val Lys Gln Asn Cys Glu
405 410 415
Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val
420 425 430
Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu
435 440 445
Val Ser Arg Asn Leu Gly Lys Val Gly Ala Lys Cys Cys Lys Leu Pro
450 455 460
Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu
465 470 475 480
Asn Arg Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Glu Lys Val
485 490 495
Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser
500 505 510
Ala Leu Glu Leu Asp Glu Ala Tyr Val Pro Lys Ala Phe Asn Ala Glu
515 520 525
Thr Phe Thr Phe His Ala Asp Met Cys Thr Leu Ser Glu Lys Glu Lys
530 535 540
Gln Val Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro
545 550 555 560
Lys Ala Thr Lys Glu Gln Leu Lys Gly Val Met Asp Asn Phe Ala Ala
565 570 575
Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Ala Cys Phe Ala
580 585 590
Glu Glu Gly Pro Lys Phe Val Ala Ala Ser Gln Ala Ala Leu Ala
595 600 605
<210> 81
<211> 88
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 81
Asp Ala Pro Ser Gln Ile Glu Val Lys Asp Val Thr Asp Thr Thr Ala
1 5 10 15
Leu Ile Thr Trp Phe Lys Pro Leu Ala Glu Ile Asp Gly Ile Glu Leu
20 25 30
Thr Tyr Gly Ile Lys Asp Val Pro Gly Asp Arg Thr Thr Ile Asp Leu
35 40 45
Thr Glu Asp Glu Asn Gln Tyr Ser Ile Gly Asn Leu Lys Pro Asp Thr
50 55 60
Glu Tyr Glu Val Ser Leu Ile Ser Arg Arg Gly Asp Met Ser Ser Asn
65 70 75 80
Pro Ala Lys Glu Thr Phe Thr Thr
85
<210> 82
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 82
Leu Asp Ala Pro Thr Asp Leu Gln Val Thr Asn Val Thr Asp Thr Ser
1 5 10 15
Ile Thr Val Ser Trp Thr Pro Pro Ser Ala Thr Ile Thr Gly Tyr Arg
20 25 30
Ile Thr Tyr Thr Pro Ser Asn Gly Pro Gly Glu Pro Lys Glu Leu Thr
35 40 45
Val Pro Pro Ser Ser Thr Ser Val Thr Ile Thr Gly Leu Thr Pro Gly
50 55 60
Val Glu Tyr Val Val Ser Leu Tyr Ala Leu Lys Asp Asn Gln Glu Ser
65 70 75 80
Pro Pro Leu Val Gly Thr Gln Thr Thr
85
<210> 83
<211> 94
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 83
Val Ser Asp Val Pro Arg Asp Leu Glu Val Val Ala Ala Thr Pro Thr
1 5 10 15
Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr Tyr
20 25 30
Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe
35 40 45
Thr Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro
50 55 60
Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly Asp
65 70 75 80
Ser Pro Ala Ser Ser Lys Pro Ile Ser Ile Asn Tyr Arg Thr
85 90

Claims (32)

1.一种包含SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68和69的氨基酸序列的蛋白质或包含与SEQ ID NO:51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68和69的氨基酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列的蛋白质。
2.如权利要求1所述的蛋白质,其中所述蛋白质包含对应于SEQ ID NO 1的残基位置6、11、22、25、26、52、53、61或88的至少一个残基位置中的半胱氨酸残基。
3.如权利要求1所述的蛋白质,其中所述蛋白质还包含所述蛋白质的N端和/或C端处的半胱氨酸。
4.如权利要求1所述的蛋白质,其中所述蛋白质包含对应于SEQ ID NO:51的位置10的位置处的置换。
5.如权利要求1所述的蛋白质,其中所述包含以下置换:A10V、N33A、A35S、W37A、P39A、G40A、I41A、G42A、W47A、R49A、K69A、W71A、H73A、A79S、S80A、P82A、I85A或R87A,其中所述位置对应于在SEQ ID NO:51中的位置。
6.如权利要求1所述的蛋白质,其中所述蛋白质包含对应于SEQ ID NO:51的10、33、25、37、39、40、41、42、47、49、69、71、73、79、80、82、85或87的位置的位置处的置换。
7.如权利要求4所述的蛋白质,其中所述置换是A10V、A10G、A10L、A10I、A10T或A10S。
8.如权利要求1所述的分离的FN3结构域,其中所述FN3结构域包含与SEQ ID NO:51的氨基酸序列具有90%同一性的氨基酸序列,或当与SEQ ID NO:51的氨基酸序列相比时具有1、2、3、4、5、6、7、8、9、10、11、12、13或14个置换的氨基酸序列。
9.如权利要求1-8中任一项所述的蛋白质,其中所述蛋白质与其他分子连接。
10.如权利要求9所述的蛋白质,其中所述其他分子是药物或治疗剂、蛋白质、抗体、聚合物、毒素。
11.如权利要求9所述的蛋白质,其中所述其他分子是与人白蛋白以外的分子结合的FN3结构域。
12.如权利要求11所述的蛋白质,其中所述FN3结构域与CD71结合。
13.如权利要求9-12中任一项所述的蛋白质,其中所述蛋白质与所述其他分子直接连接。
14.如权利要求9-12中任一项所述的蛋白质,其中所述蛋白质通过接头与所述其他分子连接。
15.如权利要求14所述的蛋白质,其中所述接头是肽接头。
16.如权利要求15所述的蛋白质,其中所述肽接头包含(GS)2(SEQ ID NO:71)、(GGGS)2(SEQ ID NO:72)、(GGGGS)5(SEQ ID NO:73)、(AP)2(SEQ ID NO:74)、(AP)5(SEQ ID NO:75)、(AP)10(SEQ ID NO:76)、(AP)20(SEQ ID NO:77)和A(EAAAK)5AAA(SEQ ID NO:78)的序列。
17.一种包含权利要求1-16中任一项所述的蛋白质的多肽。
18.一种编码权利要求1-17中任一项所述的蛋白质的分离的多核苷酸。
19.一种包含权利要求18所述的多核苷酸的载体。
20.一种包含权利要求19所述的载体的分离的宿主细胞。
21.一种产生所述蛋白质的方法,所述方法包括在使得表达所述蛋白质的条件下培养权利要求5所述的分离的宿主细胞。
22.如权利要求21所述的方法,还包括纯化所述蛋白质。
23.一种包含权利要求1-17中任一项所述的蛋白质和和药学上可接受的载体的药物组合物。
24.一种检测生物样品中是否存在人血清白蛋白的方法,包括使所述生物样品与权利要求1-17中任一项的蛋白质接触并评估所述生物样品与所述蛋白质的结合。
25.一种包含权利要求1-17中任一项所述的蛋白质的试剂盒。
26.一种双特异性FN3分子,其包含第一FN3结构域和第二FN3结构域,其中所述第一FN3结构域包含权利要求1-17中任一项所述的蛋白质,并且所述第二FN3结构域结合人血清白蛋白以外的靶蛋白。
27.一种药物组合物,其包含权利要求26所述的双特异性分子。
28.一种延长靶分子在人受试者中的半衰期的方法,所述方法包括将权利要求1-17中任一项所述的蛋白质与所述靶分子缀合,从而延长所述靶分子在人受试者中的半衰期。
29.如权利要求28所述的方法,还包括将所述缀合的分子给药与人。
30.如权利要求28或29所述的方法,其中所述靶分子是药物、抗体、与人血清白蛋白以外的分子结合的FN3结构域,或毒素。
31.如权利要求28-31中任一项所述的方法,其中所述缀合物是肽接头。
32.如权利要求31所述的方法,其中所述肽接头包含(GS)2(SEQ ID NO:71)、(GGGS)2(SEQ ID NO:72)、(GGGGS)5(SEQ ID NO:73)、(AP)2(SEQ ID NO:74)、(AP)5(SEQ ID NO:75)、(AP)10(SEQ ID NO:76)、(AP)20(SEQ ID NO:77)和A(EAAAK)5AAA(SEQ ID NO:78)的序列。
CN202080089020.4A 2019-12-18 2020-12-18 结合血清白蛋白的纤连蛋白iii型结构域及其应用 Pending CN115175691A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962949856P 2019-12-18 2019-12-18
US62/949,856 2019-12-18
PCT/US2020/065878 WO2021127353A1 (en) 2019-12-18 2020-12-18 Serum albumin-binding fibronectin type iii domains and uses thereof

Publications (1)

Publication Number Publication Date
CN115175691A true CN115175691A (zh) 2022-10-11

Family

ID=76478334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080089020.4A Pending CN115175691A (zh) 2019-12-18 2020-12-18 结合血清白蛋白的纤连蛋白iii型结构域及其应用

Country Status (7)

Country Link
US (1) US20230039851A1 (zh)
EP (1) EP4076505A4 (zh)
JP (1) JP2023508885A (zh)
CN (1) CN115175691A (zh)
AU (1) AU2020405107A1 (zh)
CA (1) CA3161723A1 (zh)
WO (1) WO2021127353A1 (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2670442T3 (es) * 2012-05-25 2018-05-30 Janssen Biotech, Inc. Dominios de unión a albúmina de consenso no naturales
CA2926262A1 (en) * 2013-10-14 2015-04-23 Janssen Biotech, Inc. Cysteine engineered fibronectin type iii domain binding molecules
EP3080161B1 (en) * 2013-12-09 2021-03-24 New York University Compositions and methods for phagocyte delivery of anti-staphylococcal agents
ES2736127T3 (es) * 2014-03-20 2019-12-26 Bristol Myers Squibb Co Dominios de tipo III de fibronectina de unión a seroalbúmina
CA2945325A1 (en) * 2014-04-08 2015-10-15 University Of Southern California Polypeptide compositions with type vii collagen fibronectin type iii- like repeats and treatment methods for wound closure and healing
JP2018517708A (ja) * 2015-06-05 2018-07-05 ニューヨーク・ユニバーシティ 抗ブドウ球菌生物学的薬剤のための組成物及び方法
MA45412A (fr) * 2016-06-21 2021-05-26 Janssen Biotech Inc Molécules de liaison au domaine de fibronectine de type iii modifiées par la cystéine
CN109715199A (zh) * 2016-09-14 2019-05-03 詹森生物科技公司 包含bcma特异性iii型纤连蛋白结构域的嵌合抗原受体及其用途

Also Published As

Publication number Publication date
WO2021127353A1 (en) 2021-06-24
EP4076505A4 (en) 2024-01-24
AU2020405107A1 (en) 2022-07-14
US20230039851A1 (en) 2023-02-09
JP2023508885A (ja) 2023-03-06
CA3161723A1 (en) 2021-06-24
EP4076505A1 (en) 2022-10-26

Similar Documents

Publication Publication Date Title
US11833190B2 (en) Serum albumin-binding fibronectin type III domains
KR101782790B1 (ko) 혈청 알부민에 결합하는 설계된 반복 단백질
JP6041799B2 (ja) Trailr2特異的多量体足場
US20160152686A1 (en) Fibronectin based scaffold domains linked to serum albumin or moiety binding thereto
TW201130501A (en) Fibronectin based scaffold domain proteins that bind IL-23
CA2837804C (en) Dimeric binding proteins based on modified ubiquitins
KR20160138133A (ko) 안정화된 피브로넥틴 기반 스캐폴드 분자
US20230039851A1 (en) Serum albumin-binding fibronectin type iii domains and uses thereof
EA041577B1 (ru) Связывающиеся с сывороточным альбумином домены фибронектина типа iii
KR20110116930A (ko) 이온채널에 특이적으로 결합하는 이온채널―bpb

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40081011

Country of ref document: HK