CN114269398A

CN114269398A - 通过高剪切溶解来分离蜘蛛丝蛋白的方法

Info

Publication number: CN114269398A
Application number: CN202080057878.2A
Authority: CN
Inventors: R·W·惠特利
Original assignee: Bolt Threads Inc
Current assignee: Bolt Threads Inc
Priority date: 2019-09-16
Filing date: 2020-09-16
Publication date: 2022-04-01
Anticipated expiration: 2040-09-16
Also published as: EP4218843A2; JP2022548481A; WO2021055440A1; EP4031202A1; KR20220083662A; CA3147370A1; CN114269398B; MX2022001740A; AU2020349480A1; EP4218843A3; US20220372086A1

Abstract

本公开涉及通过应用溶剂和高剪切微流体化方法来分离和纯化合成嵌段共聚物蛋白的方法。

Description

通过高剪切溶解来分离蜘蛛丝蛋白的方法

相关申请的交叉引用

本申请要求2019年9月16日提交的美国临时申请号62/901,053的权益，所述临时申请特此以引用的方式整体并入。

序列表

本申请含有序列表，其已通过EFS-Web提交并特此以引用的方式整体并入。所述ASCII副本创建于2020年9月16日，命名为BTT-033WO_SL.txt，并且大小是50,960字节。

背景技术

蜘蛛的丝多肽是大(>150kDa，>1000个氨基酸)多肽，其可以分解成三个结构域：N末端非重复结构域(NTD)、重复结构域(REP)和C末端非重复结构域(CTD)。NTD和CTD相对较小(分别为约150、约100个氨基酸)，得到了充分研究，并且被认为赋予多肽水稳定性、pH敏感性和聚集时的分子排列。NTD还具有强预测性分泌标签，其在异源表达期间经常被除去。重复区占天然多肽的约90％，并折叠成结晶区和非结晶区，它们分别赋予丝纤维强度和柔韧性。

丝多肽有多种来源，包括蜂、蛾、蜘蛛、螨和其他节肢动物。一些生物体制造出具有独特序列、结构元件和力学特性的多种丝纤维。例如，圆网蜘蛛(orb weaving spider)有六种独特类型的腺体，其产生不同的丝多肽序列，这些丝多肽序列聚合成适于配合环境或生命周期生态位(niche)的纤维。纤维以其来源的腺体命名，并且多肽以腺体缩写(例如，“Ma”)和蛛丝蛋白(蜘蛛丝心蛋白的简称)的“Sp”标记。在圆网蛛中，这些类型包括大壶状腺(MaSp，也称为拖丝)、小壶状腺(MiSp)、鞭状腺(Flag)、葡萄状腺(AcSp)、管状腺(TuSp)和梨状腺(PySp)。跨纤维类型、结构域和在不同属和物种的生物体间变异的多肽序列的这种组合导致了大量潜在特性，其可以通过商业生产重组纤维来加以利用。迄今为止，绝大多数以重组丝的工作都集中在大壶状腺蛛丝蛋白(MaSp)上。

目前，重组丝纤维不可商购获得，并且除了少数例外，在大肠杆菌(Escherichiacoli)和其他革兰氏阴性原核生物以外的微生物中都不产生。迄今所产生的重组丝主要由聚合的短丝序列基序或者原始(native)重复结构域(有时与NTD和/或CTD组合)的片段组成。

但是，在一些情况下，重组蜘蛛丝多肽在生产和纯化期间形成不期望的不溶性聚集体。由于它们聚集和形成β-折叠结构的能力，基于丝序列的蛋白质难以溶解。这些蛋白质的溶解常常需要苛刻的针对生物分子的化学条件，诸如高摩尔浓度离散剂溶液。在纯化期间重新溶解肽的方法常常使蛋白质降解，导致产率不佳并且纤维的韧性低且手感差。因此，需要增加丝蛋白的溶解度和回收率的纯化这些多肽的改善方法。

本文提供了在化学溶剂化(包括各种离散剂溶液)不足的条件下，通过施加高物理能(诸如由高能流体处理器产生的剪切、冲击和空化)来溶解丝蛋白的方法。

发明内容

在一个方面中，本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：提供包含重组蜘蛛丝蛋白的不溶性团块；将不溶性团块添加到包含溶剂的水性溶液中；向包含不溶性团块的水性溶液施加剪切力，从而使重组蜘蛛丝蛋白溶解在水性溶液中。

在一些实施方案中，剪切力是通过微流体化(microfluidization)施加的。

在一些实施方案中，微流体化产生约6×10⁶s^-1至10×10⁶s^-1的剪切速率。在一些实施方案中，微流体化产生至少约6×10⁶s^-1的剪切速率。在一些实施方案中，微流体化产生至少约10×10⁶s^-1的剪切速率。

在一些实施方案中，微流体化在20,000psi至30,000psi下进行。在一些实施方案中，微流体化在30,000psi下进行。在一些实施方案中，微流体化在23,000psi下进行。

在一些实施方案中，微流体化器(microfluidizer)是M-110P或LM10微流体化器。

在一些实施方案中，微流体化器包括G10Z相互作用室。在一些实施方案中，微流体化器包括F12Y相互作用室。

在一些实施方案中，剪切力施加至少两次。在一些实施方案中，剪切力施加三次。在一些实施方案中，剪切力在至少两次施加中是相同的。在一些实施方案中，剪切力在至少两次施加中是不同的。

在一些实施方案中，不溶性团块来源于包含宿主细胞的细胞培养物，其中宿主细胞表达重组蜘蛛丝蛋白。

在一些实施方案中，所述方法还包括收集来源于细胞培养物的不溶性团块，其中不溶性团块包含重组蜘蛛丝蛋白。

在一些实施方案中，溶剂是离散剂。在一些实施方案中，离散剂是尿素、硫氰酸胍(GdnSCN)或氯化胍(GdnHCL)。

在一些实施方案中，不溶性团块以约5％、10％、15％、20％、25％或30％不溶性团块/溶剂体积添加到水性溶液中。

在一些实施方案中，离散剂以0.1-10M的浓度存在于水性溶液中。在一些实施方案中，水性溶液包含约10M尿素、约4M-8MGdnHCl或约3M-6M GdnSCN。在一些实施方案中，水性溶液包括不多于(no more than)包含10M尿素的水性溶液、包含8M GdnHCl的水性溶液或包含6M GdnSCN的水性溶液的离液活性(chaotropic activity)。

在一些实施方案中，离液活性使用琼脂-胶凝测定进行量化。

在一些实施方案中，水性溶液包括约15％不溶性部分团块与85％体积的3MGdnSCN。在一些实施方案中，水性溶液包括约15％不溶性部分团块与85％体积的4MGdnHCl。在一些实施方案中，水性溶液包括约15％不溶性部分团块与85％体积的10M尿素。

在一些实施方案中，不溶性团块在20℃与30℃之间温育。在一些实施方案中，不溶性团块在室温下温育。在一些实施方案中，不溶性团块在不高于30℃下温育。在一些实施方案中，不溶性部分在包含溶剂的水性溶液中温育60至120分钟。

在一些实施方案中，不溶性团块包含细胞沉淀。

在一些实施方案中，收集来源于细胞沉淀的不溶性团块包括裂解宿主细胞。

在一些实施方案中，裂解包括热处理、化学处理、剪切破坏、物理匀化(homogenization)、声处理或化学匀化。

在一些实施方案中，收集细胞培养物的不溶性团块还包括离心裂解的细胞以获得第一细胞沉淀。

在一些实施方案中，收集不溶性团块还包括：以10:1尿素体积与沉淀质量的比率将所述细胞沉淀与包含4M尿素的溶液一起温育；以及离心包含4M尿素的溶液以获得第二细胞沉淀，之后在包含溶剂的水性溶液中温育第二细胞沉淀。

在一些实施方案中，所述方法还包括从水性溶液分离重组蜘蛛丝蛋白，从而产生分离的重组蜘蛛丝蛋白。

在一些实施方案中，重组蜘蛛丝蛋白是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。

在一些实施方案中，重组蜘蛛丝蛋白包括如SEQ ID NO:23中所示的差异妩蛛(Uloborus diversus)MiSP蛋白。

在一些实施方案中，重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于90％、80％、70％、60％或50％。

在一些实施方案中，细胞培养物包含真菌、细菌或酵母细胞。在一些实施方案中，细菌细胞是大肠杆菌。

在一些实施方案中，使用ELISA测量分离的重组蜘蛛丝蛋白的量。在一些实施方案中，使用尺寸排阻色谱法测量分离的重组蜘蛛丝蛋白的量。

在一些实施方案中，分离的重组蜘蛛丝蛋白是全长重组蜘蛛丝蛋白。

在一些实施方案中，分离的重组蜘蛛丝蛋白包含至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％全长重组蜘蛛丝蛋白。

在一些实施方案中，使用ELISA测量全长重组蜘蛛丝蛋白的量。在一些实施方案中，使用尺寸排阻色谱法测量全长重组蜘蛛丝蛋白的量。

在一些实施方案中，分离的重组蜘蛛丝蛋白的纯度是5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-100％。

在另一方面中，本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：提供包含重组蜘蛛丝蛋白的不溶性团块；将不溶性团块添加到包含溶剂的水性溶液中，其中水性溶液以最终10M尿素浓度包含15％(重量/体积)不溶性部分；通过微流体化，向包含不溶性团块的水性溶液中施加剪切力，从而使重组蜘蛛丝蛋白溶解在水性溶液中；以及从水性溶液分离重组蜘蛛丝蛋白，从而产生分离的重组蜘蛛丝蛋白。

在另一方面中，本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：提供包含重组蜘蛛丝蛋白的不溶性团块；将不溶性团块添加到水性溶液中，其中水性溶液以最终10M尿素浓度包含约15％(重量/体积)不溶性部分；通过微流体化向水性溶液中施加剪切力，从而使重组蜘蛛丝蛋白溶解在水性溶液中，其中剪切力是约10×10⁶s^-1；以及从水性溶液分离重组蜘蛛丝蛋白，从而产生分离的重组蜘蛛丝蛋白。

在另一方面中，本文提供了组合物，其包含通过本文所公开的方法产生的重组蜘蛛丝蛋白。

在一些实施方案中，重组蜘蛛丝包含至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或100％全长重组蜘蛛丝。

在另一方面中，本文提供了丝纤维，其包含通过本文所公开的方法产生的重组蜘蛛丝蛋白。

附图说明

本文所述的本发明方法和组合物的这些和其他特征、方面和优点将关于以下描述和附图得到更好的理解，在附图中：

图1A显示了在各种相互作用室类型中作为压力的函数的计算的剪切速率。图1B显示了在各种单槽相互作用室类型中作为压力的函数的计算的流率。

图2显示了10M尿素提取和微流体化处理后，差异妩蛛丝蛋白MiSp(SEQ ID NO:23)的SEC曲线图。箭头指在MiSp蛋白峰。

具体实施方式

定义

除非另外指明，否则权利要求和说明书中使用的术语如下文所示进行定义。

除非本文中另外定义，否则与本文所述的本发明方法和组合物结合使用的科学和技术术语应具有本领域中的普通技术人员通常所理解的含义。另外，除非上下文另外要求，否则单数术语应包括复数，且复数术语应包括单数。通常，与以下结合使用的命名法和以下技术为本领域中众所周知且常用的那些：本文所述的生物化学、酶学、分子与细胞生物学、微生物学、遗传学和多肽与核酸化学以及杂交。

除非另外指明，否则本文所述的方法和技术通常是根据本领域中众所周知的常规方法并且如在本说明书中通篇引用和讨论的各种一般和更具体的参考文献中所述来执行的。参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)；Ausubel等人,Current Protocols in Molecular Biology,Greene Publishing Associates(1992，以及至2002年的增刊)；Harlow和Lane,Antibodies:A Laboratory Manual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.(1990)；Taylor和Drickamer,Introduction to Glycobiology,Oxford Univ.Press(2003)；Worthington EnzymeManual,Worthington Biochemical Corp.,Freehold,N.J.；Handbook of Biochemistry:Section A Proteins,第I卷,CRC Press(1976)；Handbook of Biochemistry:Section AProteins,第II卷,CRC Press(1976)；Essentials of Glycobiology,Cold Spring HarborLaboratory Press(1999)。

本文提及的所有出版物、专利和其他参考文献均以特此引用的方式整体并入本文。

除非另外指示，否则以下术语应理解成具有以下含义：

术语“体外”是指在与活生物体分开生长，例如在组织培养物中生长的活细胞中发生的过程。

术语“体内”是指在活生物体内发生的过程。

如本文所用的术语“澄清”是指除去宿主细胞生物质诸如全细胞、裂解的细胞、细胞膜、脂质、细胞器、细胞核、非蜘蛛丝蛋白或任何其他不期望的细胞部分或产物或者细胞培养物的任何其他不期望的部分的方法。澄清还可以指从部分纯化或分离蜘蛛丝组合物中除去杂质。杂质可包括但不限于非蜘蛛丝蛋白、降解的蜘蛛丝蛋白、大型蛋白质聚集体、纯化和分离过程期间使用的化学品或任何其他不期望的物质。

如本文所用的术语“纯度”是指基本上全长的分离的重组蜘蛛丝蛋白作为所有分离的组分的一部分的量，所述分离的组分具有例如部分的或降解的分离的重组蜘蛛丝蛋白、脂质、蛋白质、膜或样品诸如提取样品中的其他分子。全长重组蛋白是已知全长蛋白的长度的至少90-100％。在一些实施方案中，全长重组蜘蛛丝蛋白是已知全长蛋白的长度的至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。

本文所用的术语“产率”是指与蜘蛛丝的起始量相比，回收的总蜘蛛丝的量，包括蜘蛛丝蛋白片段和基本上全长的蜘蛛丝。

术语“剪切力”是指在平行或切向于主体或团块的表面或平面截面的方向上作用的力。关于流体的术语“剪切速率”是指一层流体越过相邻层时的速度变化率。例如，当两个平行的流体平面以不同的速度移动时，出现剪切速率。

术语“可溶性丝蛋白”是指在严格离心后保留在上清液中的蛋白。严格离心的实例是将在50mL锥形离心管中的50mL丝蛋白等分试样样品在室温下以15,000x g离心20min。

术语“多核苷酸”或“核酸分子”是指长度为至少10个碱基的核苷酸的聚合形式。所述术语包括DNA分子(例如，cDNA或基因组DNA、或合成DNA)和RNA分子(例如，mRNA或合成RNA)，以及含有非天然核苷酸类似物、非天然核苷间键或两者的DNA或RNA的类似物。核酸可以呈任何拓扑构象。例如，核酸可为单链、双链、三链、四链、部分双链、具支链、发夹型、环状或呈挂锁(padlocked)构象。

除非另外指示，且作为本文中以通用格式“SEQ ID NO:”描述的所有序列的实例，“包含SEQ ID NO:1的核酸”是指如下核酸，其至少一部分具有以下序列：(i)序列SEQ IDNO:1，或(ii)与SEQ ID NO:1互补的序列。两者之间的选择由上下文决定。例如，如果将核酸用作探针，那么两者之间的选择由探针与所需靶标互补的要求决定。

“分离的”RNA、DNA或混合聚合物为如下RNA、DNA或混合聚合物，其与在其天然宿主细胞中自然伴随天然多核苷酸的其他细胞组分，例如与其天然缔合的核糖体、聚合酶和基因组序列基本上分离。

术语“重组体”是指如下生物分子(例如基因或多肽)，其：(1)已从其天然存在的环境中移出，(2)与在自然界中发现所述基因的多核苷酸的全部或部分不缔合，(3)与在自然界中未与其连接的多核苷酸可操作地连接，或者(4)在自然界中不存在。术语“重组体”可关于克隆的DNA分离物、化学合成的多核苷酸类似物或由异源系统生物合成的多核苷酸类似物以及由此类核酸编码的多肽和/或mRNA使用。

如本文所用，在本文中，如果异源序列与内源核酸序列相邻放置，使得所述内源核酸序列的表达发生改变，那么将生物体基因组中所述内源核酸序列(或所述序列的编码多肽产物)视为“重组体”。在此背景下，异源序列为与内源核酸序列天然不相邻的序列，无论所述异源序列本身为内源的(源自同一宿主细胞或其后代)亦或外源的(源自不同宿主细胞或其后代)。例如，启动子序列可取代(例如，通过同源重组)宿主细胞基因组中的基因的天然启动子，使得所述基因具有经改变的表达模式。所述基因现将变成“重组体”，因为其与自然侧接它的序列中的至少一些序列分离。在一个实施方案中，异源核酸分子不是生物体内源的。在另一实施方案中，异源核酸分子是通过同源或随机整合来整合到宿主染色体中的质粒或分子。

如果核酸含有基因组中的对应核酸中不自然存在的任何修饰，那么所述核酸同样被视为“重组体”。例如，如果内源编码序列含有人工引入(例如通过人为干预引入)的插入、缺失或点突变，那么所述内源编码序列被视为“重组体”。“重组核酸”还包括在异源位点处整合到宿主细胞染色体中的核酸和作为附加体存在的核酸构建体。

在核酸序列的语境中，术语“百分比序列同一性”是指在比对最大对应性时，两个序列中残基的比对的定量值。序列同一性比较的长度可以超过至少约9个核苷酸，通常至少约20个核苷酸，更通常至少约24个核苷酸，通常至少约28个核苷酸，更通常至少约32个核苷酸并且优选地至少约36个或更多个核苷酸的区段。本领域中已知有许多不同的算法可用于测量核苷酸序列同一性。例如，可以使用FASTA、Gap或Bestfit对多肽序列进行比较，它们是Wisconsin Package 10.0版,Genetics Computer Group(GCG),Madison,Wis中的程序。FASTA提供在查询序列与搜索序列之间最佳重叠区域的比对和序列同一性百分比。Pearson,Methods Enzymol.183:63-98(1990)(特此以引用的方式整体并入本文)。例如，核酸序列之间的百分比序列同一性可以如GCG 6.1版(以引入的方式并入本文)中所提供使用FASTA以其默认参数(字长6和用于计分矩阵的NOPAM系数)或使用Gap以其默认参数来确定。替代地，可以使用计算机程序BLAST(Altschul等人,J.Mol.Biol.215:403-410(1990)；Gish和States,Nature Genet.3:266-272(1993)；Madden等人,Meth.Enzymol.266:131-141(1996)；Altschul等人,Nucleic Acids Res.25:3389-3402(1997)；Zhang和Madden,GenomeRes.7:649-656(1997))，尤其是blastp或tblastn(Altschul等人,Nucleic Acids Res.25:3389-3402(1997))比较序列。

在提及核酸或其片段时，术语“基本上的同源性”或“基本上的类似性”指示在与另一核酸(或其互补链)以适当核苷酸插入或缺失进行最佳比对时，如通过如上文所讨论的任何众所周知的序列同一性算法(诸如FASTA、BLAST或Gap)所测量，在至少约76％、80％、85％，优选地至少约90％且更优选地至少约95％、96％、97％、98％或99％的核苷酸碱基中有核苷酸序列同一性。

核酸(也被称为多核苷酸)可以包括RNA、cDNA、基因组DNA以及上述的合成形式和混合聚合物的有义和反义链。它们可以通过化学或生物化学方式进行修饰，或可以含有非天然或衍生的核苷酸碱基，如本领域的技术人员很容易理解的那样。此类修饰包括例如标签、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰诸如不带电荷的键联(例如，膦酸甲酯、膦酸三酯、磷酰胺酯、氨基甲酸酯等)、带电荷的键联(例如，硫代磷酸酯、二硫代磷酸酯等)、垂悬(pendent)部分(例如，多肽)、嵌入剂(例如，吖啶、补骨脂素等)、螯合剂、烷化剂和修饰的键联(例如，α异头核酸等)。还包括能够经由氢键合和其他化学相互作用来结合指定序列的合成分子。此类分子在本领域中是已知的，并且包括例如肽键联取代分子主链中的磷酸酯键联的那些分子。其他修饰可以包括例如核糖环含有桥联部分或其他结构的类似物，诸如在“锁”核酸中存在的修饰。

当应用于核酸序列时，术语“突变的”意指核酸序列中的核苷酸与参考核酸序列相比可以是插入、缺失或改变的。可以在一个位点进行单一改变(点突变)，或者可以在单一位点插入、缺失或改变多个核苷酸。此外，可以在核酸序列内任何数目的位点进行一个或多个改变。可以通过本领域中已知的任何方法使核酸序列突变，包括但不限于诱变技术，诸如“易错PCR”(用于在DNA聚合酶的复制保真度低的条件下进行PCR的过程，使得沿着PCR产物的整个长度获得高点突变率；参见例如Leung等人,Technique,1:11-15(1989)以及Caldwell和Joyce,PCR Methods Applic.2:28-33(1992))；以及“寡核苷酸定点诱变”(在任何感兴趣的克隆DNA区段中实现产生位点特异性突变的过程；参见例如Reidhaar-Olson和Sauer,Science 241:53-57(1988))。

如本文所用的术语“载体”旨在指代一核酸分子，其能够运输与其连接的另一核酸。载体的一种类型是“质粒”，其通常指可将其他DNA区段连接到其中的环状双链DNA环，但还包括线性双链分子，诸如从通过聚合酶链反应(PCR)进行扩增或用限制性酶处理环状质粒而得到的那些。其他载体包括粘粒、细菌人工染色体(BAC)和酵母人工染色体(YAC)。另一类型的载体是病毒载体，其中其他DNA区段可以连接到病毒基因组中(下文将更详细地讨论)。某些载体能够在它们所引入的宿主细胞中进行自主复制(例如，在宿主细胞中发挥作用的具有复制起点的载体)。其他载体可以在进入到宿主细胞后整合到宿主细胞的基因组中，并从而与宿主基因组一起复制。此外，某些优选的载体能够指导它们可操作性地连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称“表达载体”)。

本文所用的术语“表达系统”包括在宿主细胞中表达基因的媒介物或载体，以及使基因稳定整合到宿主染色体中的载体或媒介物。

“可操作性地连接的”或“可操作地连接的”表达控制序列是指表达控制序列与感兴趣的基因接续以控制感兴趣的基因的键联，以及以反式或在远处作用以控制感兴趣的基因的表达控制序列。

本文所用的术语“表达控制序列”是指多核苷酸序列，它们对于影响与其可操作性地连接的编码序列的表达是必要的。表达控制序列是控制核酸序列的转录、转录后事件和翻译的序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列；有效的RNA处理信号，诸如剪接和聚腺苷酸化信号；稳定细胞质mRNA的序列；增强翻译效率的序列(例如，核糖体结合位点)；增强多肽稳定性的序列；以及当需要时，增强多肽分泌的序列。此类控制序列的性质因宿主生物而不同；在原核生物中，此类控制序列通常包括启动子、核糖体结合位点和转录终止序列。术语“控制序列”旨在至少包括其存在对表达至关重要的所有组分，并且可以包括其存在是有利的其他组分，例如，前导序列和融合配偶体序列。

本文所用的术语“启动子”是指RNA聚合酶与其结合以起始基因转录的DNA区，以及在mRNA转录起始位点的5'方向处的位置。

如本文所用的术语“重组宿主细胞”(或简称“宿主细胞”)旨在指代其中引入了重组载体的细胞。应当理解，此类术语旨在不仅指代特定受试者细胞，还指代这种细胞的子代。因为在后代中，由于突变或环境影响，可能发生某些修饰，此类子代能实际上不与母体细胞相同，但仍包括在如本文所用的术语“宿主细胞”的范围内。重组宿主细胞可以是在培养物中生长的分离的细胞或细胞系，或者可以是驻留在活组织或生物体中的细胞。

术语“多肽”涵盖天然存在和非天然存在的蛋白及其片段、突变体、衍生物和类似物。多肽可为单体或聚合的。另外，多肽可包含多个不同结构域，每个结构域均具有一种或多种不同活性。

如本文所用，术语“分子”意指任何化合物，包括但不限于小分子、肽、多肽、糖、核苷酸、核酸、多核苷酸、脂质等，并且这种化合物可以是天然或合成的。

如本文所用的术语“嵌段”或“重复单元”是指天然丝多肽的大于约12个氨基酸的亚序列，其在天然丝多肽序列中重复出现，可能有适度变异，并且充当丝多肽序列中的基本重复单元。嵌段可以但不一定包括非常短的“基序”。如本文所用的“基序”是指在多个嵌段中出现的约2-10个氨基酸的序列。例如，基序可以由氨基酸序列GGA、GPG或AAAAA(SEQ IDNO:38)组成。多个嵌段的序列是“嵌段共聚物”。

如本文所用，术语“重复结构域”是指选自丝多肽中连续的(未被实质性的非重复结构域打断的，不包括已知的丝间隔元件)重复区段的集合的序列。原始丝序列通常含有一个重复结构域。在一些实施方案中，每个丝分子有一个重复结构域。如本文所用的“宏观重复体”(macro-repeat)是包括多于一个嵌段的天然存在的重复氨基酸序列。在一个实施方案中，宏观重复体在重复结构域中重复至少两次。在另一实施方案中，这两次重复是不完美的。本文所用的“准重复体”(quasi-repeat)是包含多于一个嵌段的氨基酸序列，使得在氨基酸序列中嵌段是类似的但不是完全相同的。

如本文所用的“重复序列”或“R”是指重复的氨基酸序列。在一个实施方案中，重复序列包括宏观重复体或宏观重复体的片段。在另一实施方案中，重复序列包括嵌段。在另一实施方案中，跨两个重复序列划分单一嵌段。

术语“约”指示并涵盖指示的值以及高于和低于所述值的范围。在某些实施方案中，术语“约”指示指定的值±10％、±5％或±1％。在某些实施方案中，在适用时，术语“约”指示指定的值±所述值的一个标准偏差。

必须注意，除非上下文另外明确规定，否则如说明书和所附权利要求书中所用的，单数形式“一个”、“一种”和“所述”包括多个指代物。

本文中提到的范围应理解为范围内所有数值的简略表达，包括所提到的端点。例如，1至50的范围应理解为包括由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49和50组成的组的任何数字、数字组合或子范围。此外，2-5％的范围包括2％和5％，以及两者之间的任何数字或分数，例如：2.25％、2.5％、2.75％、3％、3.25％、3.5％、3.75％、4％、4.25％、4.5％和4.75％。

用于溶解和纯化重组蛋白的方法

在细胞培养物中表达的重组蜘蛛丝蛋白必须从细胞组分中纯化出来。在一些情况下，丝蛋白陷在不溶性细胞碎片中，或者形成不溶性丝蛋白聚集体。不溶性丝蛋白难以纯化并且导致重组丝蛋白回收率下降。此外，一些分离的蜘蛛丝蛋白固体物还可以是不溶性的。例如，MBI 18B丝粉的溶解度很低，并且已知一些模型蜘蛛丝诸如差异妩蛛MiSp是高度不溶性的。在此类情况下，可以将各种方法应用于不溶性团块、聚集体或丝固体物，以释放丝蛋白并使其溶解以供纯化，从而使重组丝蛋白的回收率增加。此外，即使在丝可溶(即，丝蛋白溶解是热力学上有利的)的条件下，溶解速度也可能很慢。这种缓慢的速率可能是由于溶解反应所需的活化能较高，或者丝从细胞碎片颗粒的大量运输是速率限制的。在两种情况下，当丝聚集体不溶解时，或者当丝是可溶的但溶解缓慢时，通过匀化或微流体化施加高物理能过程(诸如高剪切力)可以促进丝蛋白的溶解。高剪切力为溶液增添能量以增加反应速度，从而克服高活化能，或通过打碎细胞颗粒和丝蛋白聚集体，减少了大量运输效果。因此，以剪切力的形式施加物理能可以增加重组蜘蛛丝蛋白的溶解度，并且因此增加其回收率。

本文描述了通过施加高物理能过程诸如剪切力、剪切速率、冲击和空化来溶解、分离和纯化重组蜘蛛丝蛋白的方法。在一些实施方案中，高物理能过程是通过匀化或微流体化施加的。向重组蛋白施加高物理能过程使蛋白质在水性溶液中的溶解增加，从而使重组蛋白的纯化和回收率增加。

在一些实施方案中，不溶性团块是细胞沉淀。在一些实施方案中，不溶性团块是细胞裂解物。在一些实施方案中，不溶性团块是分离的蜘蛛丝固体物、团块粉末或挤出物。丝固体物或重组丝固体物是分离的重组蜘蛛丝组分，诸如纤维、挤出物、粉末或沉淀。挤出物是通过喷丝头挤出的挤出重组蜘蛛丝组合物。

物理能和剪切力

可以向不溶性重组蜘蛛丝蛋白施加物理能，以增加蛋白质的溶解度。物理能是通过施加机械力诸如压缩或收缩、压力、流体流动、冲击、空化、剪切力、剪切速率、剪切应力、拉伸或其任何组合或者本领域中已知的任何其他适当的机械力来转移到不溶性重组蜘蛛丝的动能或机械能。机械能的这种施加增加了重组蛋白在溶液中的溶解度。一般来讲，施加诱导对重组蛋白的受控损伤的动能或机械能的任何方法都可以用于溶解重组蛋白。不溶性重组蛋白的溶解度增加可以通过例如由机械应变或剪切力引起的压力、使重组蛋白或细胞裂解物经受变形、收缩、快速拉伸、快速压缩或高剪切速率的脉冲导致。

在一些实施方案中，剪切力包括但不限于剪切速率和其他物理能过程，诸如由高能流体处理器产生的冲击、空化和湍流混合。

在一些实施方案中，所施加的物理能是剪切速率、剪切力、空化、冲击、压力、声处理、乳化或本领域中已知的任何其他适当的施加方法。在一些方面中，物理能是通过匀化、微流体化微乳化或弗式压碎来施加。在一些实施方案中，物理能是剪切力。在一些实施方案中，剪切力产生剪切速率。在一些实施方案中，物理能是压力。在一些实施方案中，物理能是通过匀化或微流体化施加的。在一些实施方案中，声处理是超声处理。

许多不同的可以施加物理能的仪器可供使用，包括高能流体处理器、微流体化器、弗式压碎器(French Press)、高压匀化器、珠磨机、旋转共混机和转子/定子装置。在本文所述的一些实施方案中，重组蛋白可使用微流体化器进行溶解。微流体化器可以从商业来源购买，诸如Microfluidics Corp(Westwood,MA)生产的M110EH、M815、M700、LV1、LM10、LM20、M110Y或M110P微流体化器。

微流体化器由在其中流由泵驱动的可互换定几何(fixed-geometr y)相互作用室(诸如G10Z、H10Z、H30Z、H210Z、L30Z、F20Y或F12Y相互作用室)组成。在Y型几何相互作用室中，进入的流被分成两个或更多束流并且在高速下重新组合，以产生急剧升降的速度和压力梯度、剪切、空化和加热。相互作用室内的流体经历高流速和均匀施加的剪切力，导致流体上产生剪切速率。匀化的强度可以通过改变相互作用室的几何形状、改变温度、改变压力或通过仪器多次处理同一材料来改变。与进入的材料的浓度、缓冲液组成以及溶液、乳液或悬浮液的理化性质也存在复杂的相互作用。若干参数可能影响重组蛋白的溶解度，包括压力、毛细管直径、温度、匀化次数和缓冲条件。此外，相互作用室可以具有单一通道(单槽相互作用室)或多于两个通道(多槽互相互作用室)。多槽相互作用室可用于增加通过相互作用室的体积流率，实现更大的样品处理体积。通过小至50μm的通道，微流体化器室内的流体流率可以达到500m/s。流体移动穿过相互作用室时，压力的变化导致剪切速率的变化。

可以使用本领域中已知的任何适当的匀化器或微流体化器。微流体化器和高压匀化器可从多个供应商商购获得，包括Microfluidics(Westwood MA)、Thomas Scientific(Swedesboro,NJ)、CAT Scientific(Paso Robles,CA)和Thermo Fisher Scientific。在一些实施方案中，微流体化器包括Z型相互作用室。在一些实施方案中，微流体化器包括Y型相互作用室。在一些实施方案中，微流体化器是M-110P或LM10微流体化器。

微流体化器相互作用室的特定组合所产生的剪切速率以及样品处理的压力可以通过室制造商所提供的信息来确定。在各种单槽微流体化器品牌相互作用室类型中随压力变化的计算剪切速率的实例显示于图1A。在各种单槽微流体化器品牌相互作用室类型中随压力变化的流率显示于图1B。图1A和1B改编自Microfluidics^TM制作的2014年微流体处理器用户指南(2014Microfluidics Processor User Guide)。如图1A所示，两个不同室中相同量的流体压力(例如，F12Y室和L30Z室，在30,000psi下)导致室产生的剪切速率分别相差几乎一个数量级，10×10⁶s^-1相比于2×10⁶s^-1。因此，改变流体流动通过不同相互作用室的压力导致不同量的剪切力和剪切速率。并且，剪切速率的量可以通过改变选定相互作用室中的流体压力来改变和优化。

向流体或溶液施加剪切力产生流体剪切速率。在一些实施方案中，剪切力通过微流体化器施加。在一些实施方案中，微流体化器产生剪切速率。在一些实施方案中，剪切速率可以是1×10³s^-1至1×10⁹s^-1。剪切速率可以是约1×10³s^-1、1.5×10³s^-1、2×10³s^-1、2.5×10³s-¹、3×10³s^-1、3.5×10³s^-1、4×10³s^-1、4.5×10³s^-1、5×10³s^-1、5.5×10³s^-1、6×10³s^-1、6.5×10³s^-1、7×10³s^-1、7.5×10³s^-1、8×10³s^-1、8.5×10³s^-1、9×10³s^-1、9.5×10³s^-1、1×10⁴s^-1、1.5×10⁴s^-1、2×10⁴s^-1、2.5×10⁴s^-1、3×10⁴s^-1、3.5×10⁴s^-1、4×10⁴s^-1、4.5×10⁴s^-1、5×10⁴s^-1、5.5×10⁴s^-1、6×10⁴s^-1、6.5×10⁴s^-1、7×10⁴s^-1、7.5×10⁴s^-1、8×10⁴s^-1、8.5×10⁴s^-1、9×10⁴s^-1、9.5×10⁴s^-1、1×10⁵s^-1、1.5×10⁵s^-1、2×10⁵s^-1、2.5×10⁵s^-1、3×10⁵s^-1、3.5×10⁵s^-1、4×10⁵s^-1、4.5×10⁵s^-1、5×10⁵s^-1、5.5×10⁵s^-1、6×10⁵s^-1、6.5×10⁵s^-1、7×10⁵s^-1、7.5×10⁵s^-1、8×10⁵s^-1、8.5×10⁵s^-1、9×10⁵s^-1、9.5×10⁵s^-1、1×10⁶s^-1、1.5×10⁶s^-1、2×10⁶s^-1、2.5×10⁶s^-1、3×10⁶s^-1、3.5×10⁶s^-1、4×10⁶s^-1、4.5×10⁶s^-1、5×10⁶s^-1、5.5×10⁶s^-1、6×10⁶s^-1、6.5×10⁶s^-1、7×10⁶s^-1、7.5×10⁶s^-1、8×10⁶s^-1、8.5×10⁶s^-1、9×10⁶s^-1、9.5×10⁶s^-1、1×10⁷s^-1、1.5×10⁷s^-1、2×10⁷s^-1、2.5×10⁷s^-1、3×10⁷s^-1、3.5×10⁷s^-1、4×10⁷s^-1、4.5×10⁷s^-1、5×10⁷s^-1、5.5×10⁷s^-1、6×10⁷s^-1、6.5×10⁷s^-1、7×10⁷s^-1、7.5×10⁷s^-1、8×10⁷s^-1、8.5×10⁷s^-1、9×10⁷s^-1、9.5×10⁷s^-1、1×10⁸s^-1、1.5×10⁸s^-1、2×10⁸s^-1、2.5×10⁸s^-1、3×10⁸s^-1、3.5×10⁸s^-1、4×10⁸s^-1、4.5×10⁸s^-1、5×10⁸s^-1、5.5×10⁸s^-1、6×10⁸s^-1、6.5×10⁸s^-1、7×10⁸s^-1、7.5×10⁸s^-1、8×10⁸s^-1、8.5×10⁸s^-1、9×10⁸s^-1、9.5×10⁸s^-1、1×10⁹s^-1。在一些实施方案中，剪切速率是约6.5×10⁶s^-1。在一些实施方案中，剪切速率是约9.5×10⁶s^-1。

压力可以是约500至50,000psi。压力可以是至少约500psi、750psi、1,000psi、2,000psi、3,000psi、4,000psi、5,000psi、10,000psi、15,000psi、20,000psi、25,000psi、20,000psi、25,000psi、40,000psi、45,000psi或50,000psi。压力可以是约500至50,000psi、500至1,000psi、1,000至5,000psi、5,000至10,000psi、7,500至12,000psi、10,000至15,000psi、15,000至20,000psi、15,000-22,000、psi、18,000-25,000psi、18,000-22,000psi、20,000至25,000psi、25,000至30,000psi、27,500至30,000psi、27,500至32,000psi、30,000至32,000psi、30,000至35,000psi、35,000至40,000psi、40,000至45,000psi或45,000至50,000psi。在一些实施方案中，压力是约10,000psi、20,000psi、23,000psi或30,000psi。在一些实施方案中，压力是约23,000psi。在一些实施方案中，压力是约30,000psi。在一些实施方案中，压力在10,000与30,000psi之间。

可以通过物理能将蜘蛛丝蛋白处理至少一次，即向蜘蛛丝蛋白施加来自微流体化器或匀化器的压力、剪切力和/或剪切速率一次。在一些实施方案中，压力、剪切力和/或剪切速率施加一次。还可以通过物理能将蜘蛛丝蛋白处理多于一次，即向蜘蛛丝蛋白施加压力、剪切力和/或剪切速率两次、三次、四次或更多次。在一些实施方案中，压力、剪切力和/或剪切速率施加三次。在一些实施方案中，压力、剪切力和/或剪切速率施加两次。

所施加的物理能即压力、剪切力和/或剪切速率在每次重复通过或运行时可以是相同的。例如，样品可以在第一次通过、第二次通过和第三次通过时以30,000psi进行处理。在其他实施方案中，每次通过或运行时的压力可以是不同的。例如，样品可以在第一次通过时以30,000psi进行处理，在第二次通过时以23,000psi进行处理并且在第三次通过时以10,000psi进行处理。在另一实例中，样品可以在第一次通过时以剪切速率6.5×10⁶s^-1进行处理，在第二次通过时以剪切速率9.5×10⁶s^-1进行处理并且在第三次通过时以剪切速率5.5×10⁶s^-1进行处理。在一些实施方案中，压力是每平方英寸的绝对压力(psia)。在一些实施方案中，压力是每平方英寸的表压(psig)。

在一些方面中，物理能是通过声处理施加的声能。在此类情况下，向溶液施加声波造成溶液的空化，导致溶液中气泡的成核、生长和破裂，从而导致了溶液中重组蛋白的机械和物理变形，并且因此溶解度增加。

溶剂和缓冲条件

也可以改变重组蛋白和不溶性细胞部分、沉淀或裂解物的溶液的缓冲条件，以优化重组蛋白的匀化或微流体化和溶解。重组丝多肽在生产和纯化期间由于其聚集并形成β-折叠结构的能力而形成不期望的不溶性聚集体。溶解这些生物分子需要苛刻的化学条件，诸如高摩尔浓度离散剂溶液。此外，在纯化期间重新溶解肽所需的条件常常使蛋白质降解，导致产率不佳并且纤维的韧性低且手感差。然而，较低离散剂浓度与施加高物理能(诸如微流体化或匀化)组合可以使重组蛋白的溶解度增加并且降解减少。

在一些实施方案中，可以将溶剂添加到不溶性细胞部分、沉淀或裂解物中，以溶解重组蜘蛛丝蛋白。可以使用本领域中已知的任何适当的溶剂，包括但不限于离散剂和有机溶剂。在一些实施方案中，溶剂是离散剂。可以使用本领域中已知的任何适当的离散剂，包括但不限于氯化胍(GdnHCl)、硫氰酸胍(GdnSCN)、异硫氰酸胍、正丁醇、乙醇、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲和尿素。在一些实施方案中，溶剂是氯化胍(GdnHCl)。在一些实施方案中，溶剂是硫氰酸胍(GdnSCN)。在一些实施方案中，溶剂是尿素。

在一些实施方案中，溶剂被配制在水缓冲液中。在一些实施方案中，溶剂被配制在50mM Tris pH 7.5缓冲液中。可以使用本领域中已知的任何适当的缓冲溶液来配制溶剂，包括但不限于磷酸盐缓冲盐水(PBS)或古德氏缓冲液(Good's buffer)，诸如Tris、Tricine、MES、PIPES、ACES、MOPS、MOPSO、TES、HEPES、TAPS、Bicine、TES、bis-tris丙烷、bis-tris甲烷、ADA、HEPBS、CHES、AMP、CAPS、CAPSO、甘氨酰胺、双甘氨肽或任何其他适当的缓冲液。

溶剂(例如，离散剂)可以直接添加到不溶性细胞部分、沉淀或裂解物中，或作为水性缓冲液的组分进行添加。水性缓冲液中溶剂的浓度可以如本领域的技术人员所确定来改变。在一些实施方案中，水性缓冲液中溶剂的浓度可以在0.01-10M、0.01-0.1M、0.1-0.5M、0.5-1M、1-2M、2-3M、3-4M、4-5M、5-6M、6-7M、7-8M、8-9M、9-10M之间或大于10M。在一些实施方案中，水性缓冲液中溶剂的浓度可以是至少约0.1M、0.15M、0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M、1M、1.5M、2M、2.5M、3M、3.5M、4M、4.5M、5M、5.5M、6M、6.5M、7M、7.5M、8M、8.5M、9M、9.5M或10M或更大。

在一些实施方案中，以特定的团块与体积的比率将溶剂添加到不溶性细胞部分、沉淀或裂解物中。在这样的实施方案中，确定总不溶性部分、沉淀或裂解物质量，并添加特定体积的具有一定浓度溶剂或离散剂的溶液。例如，测量细胞沉淀重量，并重新悬浮在包含离散剂的溶液中，使得细胞团块的最终体积为样品总体积的15％(例如，细胞沉淀为0.75mg，并重新悬浮在4.25ml含有0.01-10M离散剂溶液的缓冲溶液中)。在另一实例中，测量细胞沉淀重量，并重新悬浮在等体积的包含溶剂的溶液中，得到50％细胞团块与溶剂体积的比率。

在一些实施方案中，细胞团块与溶剂体积的比率可以在1-100％、1-5％、5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-100％细胞团块之间。在一些实施方案中，细胞团块与溶剂体积的比率可以是至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％细胞团块。

在一些实施方案中，细胞团块与溶剂体积的比率可以在1-100％、1-5％、5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-100％溶剂体积之间。在一些实施方案中，细胞团块与溶剂体积的比率可以是至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％溶剂体积。

在一些实施方案中，包含水性缓冲液和不溶性细胞部分、沉淀或裂解物的溶液中溶剂的最终浓度可以在0.01-10M、0.01-0.1M、0.1-0.5M、0.5-1M、1-2M、2-3M、3-4M、4-5M、5-6M、6-7M、7-8M、8-9M或9-10M之间。在一些实施方案中，包含水性缓冲液和细胞裂解物或沉淀的溶液中溶剂的最终浓度可以是至少约0.1M、0.15M、0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M、1M、1.5M、2M、2.5M、3M、3.5M、4M、4.5M、5M、5.5M、6M、6.5M、7M、7.5M、8M、8.5M、9M、9.5M或10M。

还可以使用其他缓冲液修饰，诸如剪切保护剂、粘度调节剂和/或影响囊泡结构特性的溶质。还可以添加赋形剂以改善匀化或微流体化的效率，诸如膜软化材料和分子拥挤剂(molecular crowding agent)。对缓冲液的其他修饰可以包括特定pH范围和/或盐、有机溶剂、小分子、去污剂、两性离子、氨基酸、聚合物和/或上述的任何组合的浓度，包括多种浓度。

在一些实施方案中，不溶性细胞部分、沉淀或裂解物与包含溶剂的水性溶液一起温育。细胞沉淀或裂解物与溶液一起温育的时间的量可以改变。温育时间可以在1min至超过3小时(180min)、1min至60min、3min至90min、60min至120min、90min至150min或120min至180min之间。温育时间可以是至少1min、5min、10min、15min、20min、30min、45min、60min、75min、90min、105min、120min、135min、150min、165min、180min或更长时间。在一些实施方案中，温育时间是60min。在一些实施方案中，温育时间是75min。在一些实施方案中，温育时间是90min。在一些实施方案中，温育时间是105min。在一些实施方案中，温育时间是120min。

不溶性细胞部分、沉淀或裂解物可以与水性溶液一起在5-70℃下温育。在一些实施方案中，不溶性细胞部分、沉淀或裂解物与水性溶液一起在5-10℃、10-20℃、10-15℃、15-20℃、20-30℃、20-22℃、20-25℃、22-27℃、25-27℃、25-20℃、27-30℃、30-40℃、40-50℃、40-45℃、45-50℃、50-60℃、50-55℃、55-60℃、60-70℃、60-65℃或65-70℃下温育。在一些实施方案中，不溶性细胞部分、沉淀或裂解物与水性溶液一起在20-30℃下温育。在一些实施方案中，不溶性细胞部分、沉淀或裂解物与水性溶液一起在25℃下温育。在一些实施方案中，不溶性细胞部分、沉淀或裂解物与水性溶液一起在室温下温育。在一些实施方案中，不溶性细胞部分、沉淀或裂解物与水性溶液一起在不高于30℃下温育。

在一些实施方案中，重组蜘蛛丝蛋白在宿主细胞的细胞质中表达。蛋白质的分离需要裂解宿主细胞以释放重组蜘蛛丝蛋白。可以使用任何适当的方法来裂解宿主细胞，包括但不限于热处理、化学处理、剪切破坏、物理匀化、声处理或化学匀化。化学处理包括用已知破坏原核细胞和真核细胞的质膜的化学品或酶温育细胞，诸如去污剂，诸如Triton X-100、Nonidet P-40、CHAPS、十二烷基硫酸钠(SDS)或其他适当的去污剂。

裂解细胞后，包含重组蜘蛛丝蛋白的不溶性部分可以通过离心细胞裂解物来收集，得到不溶性物质的细胞沉淀，其包含重组蜘蛛丝蛋白。使不溶性重组蛋白沉淀的离心速度可由本领域的技术人员确定。在一些实施方案中，离心机速度是100-10,000x g。在一些实施方案中，离心机速度是100x g、200x g、300x g、400x g、500x g、600x g、700x g、800xg、900x g、1000x g、2000x g、3000x g、4000x g、5000x g、6000x g、7000x g、8000x g、9000x g或10,000x g。

在一些情况下，不溶性细胞部分或沉淀可以用离散剂重新悬浮或洗涤，诸如尿素溶液，然后再次离心以产生第二细胞沉淀。然后此第二细胞沉淀与水性溶剂溶液一起温育，并施加物理力以使重组蜘蛛丝蛋白溶解。洗涤溶液中离散剂摩尔浓度可以是0.1-10M。在一些实施方案中，离散剂是尿素。在一些实施方案中，离散剂是4M尿素。

在一些实施方案中，可以从细胞裂解物或细胞沉淀中除去非蜘蛛丝蛋白的生物或化学杂质。从细胞裂解物或细胞沉淀中除去杂质可以通过过滤、吸收(例如，木炭或固态吸收)、渗析和通过凝聚或使用各种化学品诱导的相分离来完成。在其他实施方案中，相分离可以通过添加cosmotrope和/或用于从溶液中沉淀出蛋白质的化合物来化学诱导。

在一些实施方案中，杂质使用过滤、微滤、渗滤和/或超滤(例如，以去离子水)来除去。适用于微滤的膜可以包括0.1uM至1uM。适用于超滤的膜的非限制性实例包括疏水性膜(例如，PES、PS、乙酸纤维素)，其分子量截留在50kDa与800kDa、100kDa与800kDa、200kDa与800kDa、300kDa与800kDa、400kDa与800kDa、500kDa与800kDa、600kDa与800kDa、700kDa与800kDa、100kDa与700kDa、200kDa与700kDa、300kDa与700kDa、400kDa与700kDa、500kDa与700kDa、600kDa与700kDa或500kDa与600kDa之间。在一些实施方案中，超滤得到呈渗余物的在水中的重组蛋白浆料和包含杂质的渗透物。超滤的合适条件(例如，膜、温度、体积置换)可以用本领域已知的方法来确定，以实现渗透密度最大化。在一些实施方案中，超滤提供了密度在1g/mL与30g/mL之间的渗余物。在一些实施方案中，超滤包括浓缩步骤，其得到浓渗余物，然后是渗滤步骤，其除去杂质并且得到在水中的悬浮蛋白浆料。在一些此类实施方案中，浓渗余物的浓缩系数为与起始体积相比的2倍至12倍体积减小。在一些实施方案中，渗滤提供了3倍至10倍的恒定体积替换。

根据实施方案和待除去的杂质类型，除去杂质的方法可能有所不同。从分离的重组蛋白中除去脂质杂质可以通过本领域中已知的方法完成。此类方法的非限制性实例包括吸收到木炭或专门结合脂质的其他吸收介质。从分离的重组蛋白中除去多糖杂质可以通过本领域中已知的方法完成。此类方法的非限制性实例包括用水解多糖的酶进行处理，然后通过超滤来除去产生的小型糖。此类酶的非限制性实例包括葡聚糖酶、裂解酶、甘露聚糖酶和壳多糖酶。

量化

可以对分离的重组蜘蛛丝蛋白进行测量或量化，以评估分离的蛋白的回收率(产率)和纯度。可以使用任何适当的方法来测量或量化分离的全长重组蛋白和重组蛋白片段的量，包括但不限于尺寸排阻色谱法(SEC)、酶联免疫吸附测定(ELISA)、SDS-ELISA、蛋白质印迹(免疫印迹)、高效液相色谱法(HPLC)、SEC-HPLC、液相色谱-质谱法(LC-MS)或快速蛋白液相色谱法(FPLC)、或本领域已知的任何其他适当的方法、或其任何组合。在一个实施方案中，使用蛋白质印迹测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。在另一实施方案中，使用酶联免疫吸附测定(ELISA)测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。在另一实施方案中，使用尺寸排阻色谱法(SEC)测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。

在一些实施方案中，分离的重组蜘蛛丝蛋白是至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.9％或至少100％全长重组蜘蛛丝蛋白，如通过适当的方法所测量。

在一些实施方案中，分离的重组蜘蛛丝蛋白的纯度是5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-100％。在一些实施方案中，分离的重组蜘蛛丝蛋白的纯度是至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.9％或少100％。

在一些实施方案中，与起始不溶性材料相比，分离的重组蜘蛛丝蛋白的纯度增加。例如，在起始不溶性材料是不溶性或溶解性差的分离的重组蜘蛛丝蛋白或丝粉末的情况下，分离的重组蜘蛛丝蛋白的纯度可以通过本文所述的溶解和分离方法来增加。在一些实施方案中，与起始材料的纯度相比，分离的重组蜘蛛丝蛋白的纯度增加1-5％、5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-100％。在一些实施方案中，与起始材料的纯度相比，分离的重组蜘蛛丝蛋白的纯度增加至少1％、至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少100％。在一些实施方案中，不溶性材料的纯度是0-99％、1-5％、5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、90-95％或95-99.9％。在一些实施方案中，不溶性材料的纯度是至少1％、至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％、至少99.5％或至少99.9％。

重组蜘蛛丝组合物

以引用的方式并入本文的美国专利9,963,554“Methods and Compositions forSynthesizing Improved Silk Fibers”公开了合成嵌段共聚物的组合物、用于其生产的重组微生物以及包含这些蛋白质的合成纤维。以引用的方式并入本文的2019年4月4日公布的美国专利公布2019/0100740“Modified Strains for the Production of RecombinantSilk”公开了工程化巴斯德毕赤酵母(Pichia pastoris)细胞，其被选择或遗传工程化成减少酵母细胞所表达的重组蛋白的降解，以及培养酵母细胞以用于生产可用的化合物的方法。本领域的技术人员还可以在大肠杆菌中产生合成嵌段共聚物和包含这些蛋白质的合成纤维。

已鉴定若干种类型的天然蜘蛛丝。据信，每种天然纺丝类型的力学性质与所述丝的分子组成紧密相关。参见例如，Garb,J.E.等人,Untangling spider silk evolutionwith spidroin terminal domains,BMC Evol.Biol.,10:243(2010)；Bittencourt,D.等人,Protein families,natural history and biotechnological aspects of spidersilk,Genet.Mol.Res.,11:3(2012)；Rising,A.等人,Spider silk proteins:recentadvances in recombinant production,structure-function relationships andbiomedical applications,Cell.Mol.Life Sci.,68:2,第169-184页(2011)；以及Humenik,M.等人,Spider silk:understanding the structure-function relationshipof a natural fiber,Prog.Mol.Biol.Transl.Sci.,103,第131-85页(2011)。例如：

葡萄状腺(AcSp)丝倾向于具有高韧性，这是适当高强度与适当高延展性结合的结果。AcSp丝的特征在于大嵌段(“整体重复”)尺寸，其常常掺有聚丝氨酸和GPX的基序。管状腺(TuSp或圆柱形)丝倾向于具有大直径，具有适度强度和高延展性。TuSp丝之特征在于其聚丝氨酸和聚苏氨酸含量，以及聚丙氨酸短束。大壶状腺(MaSp)丝倾向于具有高强度和适度延展性。MaSp丝可为两个亚型之一：MaSp1和MaSp2。MaSp1丝的延展性通常小于MaSp2丝，且特征在于聚丙氨酸、GX和GGX基序。MaSp2丝的特征在于聚丙氨酸、GGX和GPX基序。小壶状腺(MiSp)丝倾向于具有适度强度和适度延展性。MiSp丝的特征在于GGX、GA和poly A基序，且常常含有约100个氨基酸的间隔元件。鞭毛腺(Flag)丝倾向于具有极高延展性和适度强度。Flag丝的特征通常在于GPG、GGX和短间隔基序。

每种丝类型的性质可因物种不同而不同，且具有不同生活方式(例如，定居纺足目(sedentary web spinner)对比漫游猎蛛(vagabond hunter))或进化上更古老的蜘蛛可产生性质与前文描述不同的丝(关于蜘蛛多样性和分类的描述，参见Hormiga,G.和Griswold,C.E.,Systematics,phylogeny,and evolution of orb-weaving spiders,Annu.Rev.Entomol.59,第487-512页(2014)；以及Blackedge,T.A.等人,Reconstructingweb evolution and spider diversification in the molecular era,Proc.Natl.Acad.Sci.U.S.A.,106:13,第5229-5234页(2009))。然而，与天然丝蛋白的重复结构域具有序列相似性和/或氨基酸组成相似性的合成嵌段共聚物多肽，可以用于按商业规模制造重现对应天然丝纤维的特性的一致性丝状纤维。

在一些实施方案中，重组蜘蛛丝是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。在一些实施方案中，重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于95％、90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、10％或5％。在一些实施方案中，溶解度阈值是离心后可溶于非离液溶剂的蛋白质的量。

丝核苷酸和肽序列

可以通过在GenBank中搜索相关术语，例如“蛛丝蛋白(spidroi n)”、“丝心蛋白(fibroin)”、“MaSp”来汇编假定丝序列的列表，且可以将那些序列与通过独立测序工作获得的额外序列汇集在一起。然后将序列翻译成氨基酸，过滤重复条目，且手动拆分成各结构域(NTD、REP、CTD)。在一些实施方案中，候选氨基酸序列被反向翻译成被优化以用于在巴斯德毕赤(Komagataella)酵母中表达的DNA序列。将DNA序列各自克隆到表达载体中，且将其转化到巴斯德毕赤酵母中。在一些实施方案中，随后以组合方式组装显示出成功表达和分泌的各种丝结构域，以构筑能够形成纤维的丝分子。

丝多肽特征性地由侧接于非重复区域(例如，C末端结构域和N末端结构域)的重复结构域(REP)组成。重复结构域表现出层次架构。重复结构域包含一系列嵌段(也称为重复单元)。嵌段在整个丝重复结构域中为重复的，有时完美重复，有时不完美重复(构成一个准重复结构域)。嵌段的长度和组成在不同丝类型之间以及在不同物种中有所不同。表1列出了来自所选物种和丝类型的嵌段序列的实例，以下文献中给出其他实例：Rising,A.等人,Spider silk proteins:recent advances in recombinant production,structure-function relationships and biomedical applications,Cell Mol.Life Sci.,68:2,第169-184页(2011)，以及Gatesy,J.等人,Extreme diversity,conservation,and convergence of spider silk fibroin sequences,Science,291:5513,第2603-2605页(2001)。在一些情况下，嵌段可以按规则模式排列，形成在丝序列的重复结构域中出现多次(通常2至8次)的较大宏观重复体(macro-repeat)。重复结构域或宏观重复体内的重复嵌段，以及重复结构域内的重复宏观重复体，可以由间隔元件分开。嵌段序列可以包含富含甘氨酸的区域，随后为polyA区域。短(约1至10个)氨基酸基序可以在嵌段内多次出现。通常观察到的基序的子集描绘于图1。可以在不参考环状排列的情况下选择来自不同天然丝多肽的嵌段(即，丝多肽之间在其他方面相似的鉴定嵌段可能因环状排列而不能对齐)。因此，例如，出于本文所述的方法和组合物的目的，“嵌段”SGAGG(SEQ ID NO:39)与GSGAG(SEQ IDNO:40)相同，且与GGSGA(SEQ ID NO:41)相同；其全部彼此都为环状排列。针对给定丝序列选择的特定排列可能尤其由方便性(通常以G开始)决定。从NCBI数据库获得的丝序列可以划分为嵌段和非重复区域。

表1：嵌段序列的样品

根据某些实施方案，来自嵌段和/或宏观重复结构域的纤维形成嵌段共聚物多肽描述于国际公开号WO/2015/042164(以引用的方式并入)中。按照结构域(N末端结构域、重复结构域和C末端结构域)对自蛋白质数据库(例如GenBank)或透过从头测序获得的天然丝序列进行分解。出于合成和组装成纤维的目的而选择的N末端结构域和C末端结构域序列包括天然氨基酸序列信息和本文所述的其他修饰。重复结构域被分解成重复序列，所述重复序列含有代表性嵌段，所述嵌段根据丝的类型，通常为1至8个，所述嵌段捕获关键性氨基酸信息，同时将编码氨基酸的DNA的尺寸减小成容易合成的片段。在一些实施方案中，适当形成的嵌段共聚物多肽包含至少一个含有至少1个重复序列的重复结构域，且视情况侧接N末端结构域和/或C末端结构域。

在一些实施方案中，重复结构域包含至少一个重复序列。在一些实施方案中，重复序列为150至300个氨基酸残基。在一些实施方案中，重复序列包含多个嵌段。在一些实施方案中，重复序列包含多个宏观重复体。在一些实施方案中，嵌段或宏观重复体被分割成多个重复序列。

在一些实施方案中，重复序列以甘氨酸开始，且不能以苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、半胱氨酸(C)、组氨酸(H)、天冬酰胺(N)、甲硫氨酸(M)或天冬氨酸(D)结束，以满足DNA组装要求。在一些实施方案中，一些重复序列与天然序列相比可以改变。在一些实施方案中，可例如通过向多肽的C末端添加丝氨酸(以避免终止于F、Y、W、C、H、N、M或D)来改变重复序列。在一些实施方案中，可通过在不完全嵌段中填充自另一个嵌段的同源序列来修饰重复序列。在一些实施方案中，可通过重排嵌段或宏观重复体的顺序来修饰重复序列。

在一些实施方案中，可以选择非重复性N末端结构域和C末端结构域用于合成。在一些实施方案中，N末端结构域可以通过去除，例如，如通过SignalP(Peterson,T.N.等人,SignalP 4.0:discriminating signal peptides from transmembrane regions,Nat.Methods,8:10,第785-786页(2011)所鉴定的前导信号序列来获得。

在一些实施方案中，N末端结构域、重复序列或C末端结构域序列可以来自漏斗网蜘蛛(Agelenopsis aperta)、Aliatypus gulosus、哥斯大黎加斑马脚(Aphonopelmaseemanni)、短牙蛛种AS217、短牙蛛种AS220、十字园蛛(Araneus diadematus)、猫脸蜘蛛、大腹圆蛛(Araneus ventricosus)、悦目金蛛(Argiope amoena)、银色金蛛(Argiopeargentata)、横纹金蛛(Argiope bruennichi)、三带金蛛、Atypoides riversi、巴西黄斑粉趾(Avicularia juruensis)、加州陷门蛛(Bothriocyrtum californicum)、食人魔脸蜘蛛、灰色迪格蛛(Diguetia canities)、黑捕鱼蛛、Euagrus chisoseus、苗圃网络蜘蛛、乳突棘旗蛛(Gasteracantha mammosa)、Hypochilus thorelli、Kukulcania hibernalis、黑寡妇蜘蛛、Megahexura fulva、Metepeira grandiosa、金圆网蛛(Nephila antipodiana)、棒络新妇蛛、络新妇蛛、马达加斯加新妇(Nephila madagascariensis)、斑络新妇(Nephilapilipes)、Nephilengys cruentata、帕拉威夏双条纹蛛(Parawixia bistriata)、绿色猞猁蜘蛛(Peucetia viridans)、原始肉食蛛、印度华丽雨林蛛(Poecilotheria regalis)、长爪绿色突光蝴蛛或差异妩蛛。

在一些实施方案中，丝多肽核苷酸编码序列可以与α交配因子核苷酸编码序列操作性地连接。在一些实施方案中，丝多肽核苷酸编码序列可以与另一种内源或异源分泌信号编码序列操作性地连接。在一些实施方案中，丝多肽核苷酸编码序列可以与3X FLAG核苷酸编码序列操作性地连接。在一些实施方案中，丝多肽核苷酸编码序列与其他亲和标记诸如6至8个His残基(SEQ ID NO:42)核苷酸编码序列操作性地连接。

分泌信号

从细胞分泌的蛋白的量在不同蛋白之间有显著不同，并且部分取决于与蛋白在新生状态下可操作地连接的分泌信号。本领域中已知有许多分泌信号，并且一些常用于生产分泌重组蛋白。其中突出的是酿酒酵母(Saccharomyces cerevisiae)的α-交配因子(αMF)的分泌信号，它由N端19个氨基酸的信号肽(在本文还称为pre-αMF(sc))和70个氨基酸的前导肽(在本文还称为pro-αMF(sc))组成。已证明，将pro-αMF(sc)纳入到酿酒酵母的αMF的分泌信号中(在本文中还称为pre-αMF(sc)/pro-αMF(sc))对于实现蛋白的高分泌产率至关重要。将pro-αMF(sc)或其功能变体添加到除pre-αMF(sc)以外的信号肽中也用作实现重组蛋白分泌的手段，但显示出不同程度的有效性，增加了某些重组宿主细胞中某些重组蛋白的分泌，但对于其他重组蛋白没有影响或减少了分泌。

如美国申请15/724,196中所述，使用多种不同的分泌信号可以改善重组蛋白的分泌产率。与包括多个编码可操作地连接至仅一个分泌信号(例如，pre-αMF(sc)/pro-αMF(sc))的重组蛋白的多核苷酸序列的重组宿主细胞相比，包括相同数目的编码可操作地连接至至少2种不同的分泌信号的重组蛋白的多核苷酸序列的重组宿主细胞产生较高分泌产率的重组蛋白。不受理论的束缚，使用至少2种不同的分泌信号可以使重组宿主细胞参与不同的细胞分泌途径，以实现重组蛋白的有效分泌，并因此防止任何一个分泌途径的过度饱和。

不同的分泌信号中的至少一者包括可选自表2或表3的信号肽或者是与选自表2或表3的信号肽具有至少80％氨基酸序列同一性的功能变体。在一些实施方案中，功能变体是选自表2或表3的包括一个或两个取代氨基酸的信号肽。在一些此类实施方案中，功能变体与选自表2或表3的信号肽具有至少85％、至少90％、至少95％或至少99％氨基酸序列同一性。在一些实施方案中，信号肽介导新生重组蛋白在翻译后易位至ER中(即，蛋白合成先于异位，使得新生重组蛋白在易位至ER中之前就存在于胞质溶胶中)。在其他实施方案中，信号肽介导新生重组蛋白以共同翻译的方式易位至ER中(即，蛋白合成和易位至ER中同时发生)。使用介导共翻译易位至ER中的信号肽的优势在于，可以防止容易快速折叠的重组蛋白呈现阻碍易位至ER中并因此阻碍分泌的构象。

表2-分泌信号

表3-重组分泌信号

表达载体

鉴于本领域已知的技术，本文所述的表达载体可以按照本说明书的教导来生产。序列，例如载体序列或编码转基因的序列，可商购自诸如Integrated DNA Technologies,Coralville,IA或DNA 2.0,Menlo Park,CA的公司。本文所举例说明的是指导嵌合丝多肽高水平表达的表达载体。

本文所述的多核苷酸的另一标准来源是从生物体(例如，细菌)、细胞或选定组织中分离出来的多核苷酸。来自选定来源的核酸可以通过标准程序进行分离，其通常包括连续苯酚和苯酚/氯仿提取，然后进行乙醇沉淀。沉淀后，多核苷酸可以用将核酸分子切割成片段的限制性核酸内切酶处理。选定大小的片段可以通过许多技术进行分离，包括琼脂糖或聚丙烯酰胺凝胶电泳或脉冲场凝胶电泳(Care等人(1984)Nuc.Acid Res.12:5647-5664；Chu等人(1986)Science 234:1582；Smith等人(1987)Methods in Enzymology 151:461)，以为克隆提供适当大小的起始材料。

获得表达载体或构建体的核苷酸组分的另一方法是PCR。PCR的一般程序教导于MacPherson等人,PCR:A PRACTICAL APPROACH,(IRL Press,Oxford University Press,(1991))。每个应用反应的PCR条件可以凭经验确定。许多参数影响反应的成功。在这些参数中有退火温度和时间、延伸时间、Mg2+和ATP浓度、pH值以及引物、模板和脱氧核糖核苷酸的相对浓度。示例性引物描述于以下实施例中。扩增后，所得片段可通过琼脂糖凝胶电泳检测，然后用溴化乙锭染色和紫外线照射进行可视化。

用于获得多核苷酸的另一方法是通过酶消化。例如，核苷酸序列可以通过用合适的识别限制性酶消化适当的载体来产生。限制性裂解的片段可以通过使用标准技术，在四种脱氧核苷酸三磷酸(dNTP)的存在下，用大肠杆菌DNA聚合酶I(Klenow)的大片段进行处理来钝末端化。

使用本领域众所周知的方法，将多核苷酸插入到合适的主链中，例如质粒。例如，在合适的条件下，插入序列和载体DNA可以与限制性酶接触，以在每个分子上产生互补或平末端，这些末端可以彼此配对并与连接酶连接。替代地，可以将合成核酸接头连接到多核苷酸的末端。这些合成接头可以包含与载体DNA中特定限制性位点对应的核酸序列。其他手段在本领域中是已知的且可用的。组分多核苷酸可以使用多种来源。

在一些实施方案中，将含有R、N或C序列的表达载体转化到宿主生物体中以进行表达和/或分泌。在一些实施方案中，表达载体包括分泌信号。在一些实施方案中，表达载体包括终止信号。在一些实施方案中，表达载体被设计成整合到宿主细胞基因组中，并包括：与靶基因组同源的区域、启动子、分泌信号、标签(例如，Flag标签)、终止/polyA信号、毕赤酵母的可选择标记、大肠杆菌的可选择标记、大肠杆菌的复制起点以及释放感兴趣的片段的限制位点。

本发明的载体可还包括靶向序列，其引导蜘蛛丝蛋白编码序列整合至宿主细胞基因组的特定位置。此类靶向序列的非限制性实例包括与宿主细胞基因组中存在的核苷酸序列相同的核苷酸序列。在一些实施方案中，靶向序列与宿主细胞基因组中的重复元件相同。在一些实施方案中，靶向序列与宿主细胞基因组中的转座元件相同。

在一些实施方案中，本文提供了重组宿主细胞，其包含本文所述的载体。在一些实施方案中，载体被稳定整合在重组宿主细胞基因组(例如，染色体)内，例如通过同源重组或靶向整合进行。基因组整合的合适位点的非限制性实例包括酿酒酵母基因组中的Ty1基因座、巴斯德毕赤酵母基因组中的rDNA和HSP82基因座以及拷贝散布在整个重组宿主细胞基因组中的转座元件。在其他实施方案中，载体不是稳定整合在重组宿主细胞基因组内，而是在染色体外。

宿主细胞转化体

提供了用表达蜘蛛丝多肽的核酸分子或载体转化的宿主细胞，以及其后代。这些细胞也可以携带在载体上的核酸序列，这些载体可以但不一定是游离复制载体。在其他实施方案中，核酸已被整合到宿主细胞的基因组中。

在一些实施方案中，实现大规模生产嵌段共聚物多肽的微生物或宿主细胞包括以下的组合：1)生产大(>50kDa)多肽的能力，2)对大规模污染物(诸如病毒和细菌污染)的抗性，以及3)现有的用于生长和处理生物的技术秘诀是大规模(1-2000m³)生物反应器。

在一些实施方案中，宿主细胞在细胞内表达重组蜘蛛丝蛋白，并且所述蛋白质留在宿主细胞中。在一些实施方案中，宿主细胞在细胞内表达重组蜘蛛丝蛋白，并且所述蛋白被分泌。

多种宿主生物可以被工程化/转化成包含嵌段共聚物多肽表达系统。表达重组丝多肽的生物体包括植物、藻类、酵母、真菌、革兰氏阳性和革兰氏阴性细菌。在一些实施方案中，宿主生物是解腺嘌呤阿氏酵母(Arxula adeninivorans)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillus awamori)、无花果曲霉(Aspergillus ficuum)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、酱油曲霉(Aspergillus sojae)、塔宾曲霉(Aspergillus tubigensis)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、炭疽杆菌(Bacillus anthracis)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacilluscirculans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacillus licheniformis)、甲醇芽孢杆菌(Bacillus methanolicus)、嗜热芽胞杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)、博伊丁假丝酵母(Candida boidinii)、拉克淖金孢子菌(Chrysosporiumlucknowense)、大肠杆菌、禾谷镰孢菌(Fusarium graminearum)、金黃色镰孢菌(Fusarium venenatum)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、嗜热毁丝霉(Myceliopthora thermophila)、粗壮脉纹孢菌(Neurospora crassa)、Ogataeapolymorpha、卡门培尔青霉(Penicillium camemberti)、变灰青霉(Penicilliumcanescens)、产黄青霉(Penicillium chrysogenum)、埃默森青霉(Penicilliumemersonii)、绳状青霉(Penicillium funiculosum)、灰玫瑰青霉(Penicilliumgriseoroseum)、产紫青霉(Penicillium purpurogenum)、娄地青霉(Penicilliumroqueforti)、黄孢原毛平革菌(Phanerochaete chrysosporium)、安格斯毕赤酵母(Pichiaangusta)、甲醇毕赤酵母(Pichia methanolica)、巴斯德毕赤酵母(Pichia(Komagataella)pastoris)、多形毕赤酵母(Pichia polymorpha)、树干毕赤酵母(Pichia stipitis)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus)、少根根霉(Rhizopusarrhizus)、变铅青链霉菌(Streptomyces lividans)、酿酒酵母、许旺酵母(Schwanniomyces occidentalis)、哈茨木霉(Trichoderma harzianum)、里氏木霉(Trichoderma reesei)或解脂耶氏酵母(Yarrowia lipolytica)。

可用作重组宿主细胞的其他菌株是本领域中已知的。应当理解，术语“重组宿主细胞”旨在不仅指代特定受试者细胞，还指代这种细胞的子代。因为在后代中，由于突变或环境影响，可能发生某些修饰，此类子代能实际上不与母体细胞相同，但仍包括在如本文所用的术语“重组宿主细胞”的范围内。

工程化宿主细胞系

用于重组蛋白生产的广泛使用的微生物是大肠杆菌。然而，在大肠杆菌菌株的培养期间，重组表达的蛋白可能是不溶性的，导致分离不佳和重组蛋白的产率下降。另一广泛使用的微生物是甲基营养型酵母巴斯德毕赤酵母。巴斯德毕赤酵母生长至高细胞密度，提供严格控制的甲醇诱导型反式基因表达并且在限定的培养基中有效地分泌异源蛋白。然而，在巴斯德毕赤酵母菌株的培养期间，重组表达的蛋白可能在可以收集之前被降解，得到包括重组表达的蛋白的片段的蛋白混合物并且导致全长重组蛋白的产率下降。

在一些实施方案中，本文所述的蛋白酶活性降低的修饰菌株重组表达丝状多肽序列。在一些实施方案中，丝状多肽序列为1)通过混合和匹配来源于丝多肽序列的重复结构域所得到的嵌段共聚物多肽组合物，和/或2)大小足够大(约40kDa)以通过从工业可放大微生物分泌来形成有用的纤维的嵌段共聚物多肽的重组表达。由丝重复结构域片段工程化的大(约40kDa至约100kDa)嵌段共聚物多肽(包括来自蜘蛛丝多肽的几乎所有公开的氨基酸序列的序列)可在本文所述的修饰微生物中表达。在一些实施方案中，丝多肽序列被匹配且设计来生产能够形成纤维的高度表达且分泌的多肽。在一些实施方案中，敲除蛋白酶基因或降低宿主修饰菌株中的蛋白酶活性减少丝状多肽的降解。

在一些实施方案中，为了减弱巴斯德毕赤酵母中的蛋白酶活性，使编码这些酶的基因失活或突变以减少或消除活性。这可以通过突变或插入基因本身或通过修饰基因调控元件来进行。这可以通过标准酵母遗传学技术来实现。此类技术的实例包括通过双重同源重组进行基因置换，在基因置换中，将待失活的基因侧翼的同源区域克隆在可选择标记基因(诸如抗生素抗性基因或补充酵母菌株的营养缺陷的基因)侧翼的载体中。

替代地，同源区域可通过重叠PCR进行PCR扩增并连接至可选择标记基因。随后，通过本领域已知的方法，例如电穿孔，将此类DNA片段转化到巴斯德毕赤酵母中。然后转化体在选择性条件下生长，通过标准技术，例如基因组DNA的PCR或Southern印迹，分析其基因破坏事件。在替代实验中，基因失活可以通过单一同源重组来实现，在这种情况下，例如，将基因ORF的5'端克隆在同样含有可选择标记基因的无启动子载体上。通过用仅切割靶基因同源片段中的载体的限制性酶进行消化来将这种载体线性化之后，将这种载体转化到巴斯德毕赤酵母中。通过基因组DNA的PCR或Southern印迹确认靶基因位点处的整合。以这种方式，在基因组中实现了克隆在载体上的基因片段的复制，得到靶基因基因座的两种拷贝：第一拷贝，在其中ORF是不完整的，因此得到缩短、失活的蛋白的表达(如果有的话)；以及第二拷贝，其没有驱动转录的启动子。

替代地，使用转座子诱变来使靶基因失活。可以通过PCR筛选此类突变体文库的在靶基因中的插入事件。

工程化/敲除菌株的功能表型(即，缺陷)可以使用本领域已知的技术来评估。例如，工程化菌株在蛋白酶活性方面的缺陷可以使用本领域已知的各种方法中的任一种来确定，诸如显色蛋白酶底物的水解活性的测定、所选蛋白酶的底物蛋白的带移等。

本文所述的蛋白酶活性的减弱可以通过除敲除突变以外的机制来实现。例如，可以经由通过改变核酸序列、将基因置于活性较低的启动子的控制下、下调、表达干扰RNA、核糖酶或靶向感兴趣的基因的反义序列或者通过本领域已知的任何其他技术改变氨基酸序列来减弱期望的蛋白酶。在优选的菌株中，通过上文所述的任何方法减弱在PAS_chr4_0584(YPS1-1)和PAS_chr3_1157(YPS1-2)处编码的蛋白酶的蛋白酶活性。在一些方面中，描述了甲基营养型酵母菌株，特别是巴斯德毕赤酵母菌株，其中YPS1-1和YPS1-2基因已经失活。在一些实施方案中，还可以根据本文所提供的方法将其他蛋白酶编码基因敲除，以进一步降低菌株所表达的期望的蛋白产物的蛋白酶活性。

在一些实施方案中，本文所公开的巴斯德毕赤酵母菌株被修饰成表达丝状多肽。制造丝状多肽的优选实施方案的方法提供在WO2015/042164中，特别是第114-134段，其以引用的方式并入本文。其中公开了基于源自诸如来自物种横纹金蛛的MaSp2的重组蛛丝蛋白片段序列的合成蛋白质性共聚物。描述了丝状多肽，其包括二至二十个重复单元，其中每个重复单元的分子量大于约20kDa。在共聚物的每个重复单元内有超过约60个被组织成许多“准重复单元”的氨基酸残基。在一些实施方案中，本公开中描述的多肽的重复单元与MaSp2拖丝蛋白序列具有至少95％序列同一性。

实施例

以下是实行本文所述的本发明方法的具体实施方案的实施例。实施例仅出于说明性目的而提供，并且不旨在以任何方式限制本公开的范围。已努力确保所使用的数字(例如，量、温度等)的准确性，但当然应允许一些实验误差和偏差。

除非另外指明，否则本文所述的方法的实践将采用本领域技术内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。此类技术在文献中进行了充分的解释。参见例如T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freemanand Company,1993)；A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,现行版)；Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,1989)；Methods InEnzymology(S.Colowick和N.Kaplan编,Academic Press,Inc.)；Remington'sPharmaceutical Sciences,第18版(Easton,Pennsylvania:Mack Publishing Company,1990)；Carey和Sundberg Advanced Organic Chemistry第3版(Plenum Press)A卷和B卷(1992)。

实施例1：微流体化增加重组丝蛋白的溶解度

使用高物理能来在各种水性溶剂条件下使来自不溶性细胞材料的团聚(agglomeration)的模型丝蛋白溶解。

模型丝UD MiSp 64kDa是重组表达的64kD蛋白质，其来源于连结至N末端组氨酸六聚物(SEQ ID NO:43)的差异妩蛛次壶状腺蛛丝蛋白基因序列(GenBank:DQ399332.1，SEQID NO:23)。使用以编码MiSp蛋白的T7表达载体转化的大肠杆菌C41(DE3)(Lucigen)表达所述蛋白。使细胞在基本培养基中生长，用异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)诱导MiSp基因表达，并通过匀化进行裂解。通过离心使不溶性细胞裂解物材料沉淀。将(质量)比率10:1的4M尿素溶液与不溶性团块混合1h，并且通过离心回收不溶性级分。所使用的匀化设备产生约0.7×10⁶s^-1的剪切速率。然而，已知这种UD MiSp 64kD模型丝是高度不溶的，并且匀化器产生的剪切速率不足以使UD MiSp 64kDa丝溶解。

将含有不溶性丝蛋白的细胞生物质和沉淀以比率15％重量/体积(细胞沉淀质量比溶液体积)重新悬浮在水性缓冲液(50mM Tris，pH 7.5)和选定的含有离散剂的溶液中。假设沉淀密度为1g/l，离散剂的最终浓度为10M尿素、4M GdnHCl、8M GdnHCl、3M GdnSCN或6M GdnSCN。通过在室温下搅拌至少1h以破坏材料的大块团簇来将溶液混合。100mL等分试样以3次通过在30,000psi(表压)下操作的F12Y相互作用室(M-110P，Microfluidics Inc.)进行处理。在处理步骤期间使用水浴来限制样品加热。作为对照，将单独的一组100mL等分试样在室温下搅拌3h，而不用微流体化器处理。

通过在室温下以15,000x g将50mL等分试样离心20min来测定丝蛋白的溶解度，并且分离上清液和细胞沉淀。可溶性丝蛋白被确定为离心后留在上清液中的丝蛋白。通过用50mL在水中的5MGdnSCN提取沉淀来测定细胞沉淀中剩余的不溶性丝。通过ELISA用抗His6抗体(“His6”公开为SEQ ID NO:43)评估两种级分中丝的浓度，并且结果显示在表1中。

表1：在水性缓冲液和选定的离散剂溶液中高能处理后模型丝溶解度的增加。通过ELISA确定两种级分中丝的浓度。

对于所评估的所有条件，微流体化均使可溶性级分中丝的量增加。值得注意的实施例是10M尿素和4M GdnHCl条件，在这两个条件下，对照中可溶的丝(在4M GdnHCl中为6％，或在10M尿素中为0％)是可忽略不计的，但在微流体化处理后，大于75％是可溶的。此外，3M和6M GdnSCN缓冲液在微流体化后均产生100％溶解的丝蛋白，而以相同离液浓度的对照处理没有使丝完全溶解。因此，使用微流体化时丝蛋白溶解所需的离散剂浓度降低。

还通过尺寸排阻色谱法(SEC)证实了可溶性级分中丝蛋白的存在。使用SEC HPLC比较用10M尿素和微流体化(高能线)提取的蛋白质样品与单独10M尿素(对照线)相比的可溶性级分(图2)。模型丝蛋白的洗脱时间(MiSp峰)用纯化的蛋白标准品确定(数据未显示)。用变性流动相(5M GdnSCN)运行柱，并且用折射率检测器检测洗脱液。与单独尿素相比，施加微流体化剪切力导致丝蛋白的溶解和回收率显著增加。通过计算一些样品的SEC峰％折射率曲线(RU)面积来评估溶解丝蛋白的纯度。所选样品的纯度显示在表2中。

实施例2：剪切速率压力优化

接下来，改变微流体化的相互作用室大小和压力以评估丝溶解。

如实施例1所述制备含有丝蛋白的不溶性细胞生物质，并将其悬浮在尿素中至最终浓度为10M尿素。将样品在两个不同的剪切速率下处理，通过如制造商(MicrofluidicsProcessor User Guide,Microfluidics,Inc)所述的相互作用室类型和操作压力进行控制。具体地，目标为预测剪切速率6.5×10⁶s^-1(G10Z相互作用室，23,000psi，icrofluidicsInc.LM10)或9.5×10⁶s^-1(F12Y相互作用室，30,000psi，Microfluidics Inc.M-110P)。通过实施例1中所述的离心方案测定丝蛋白的溶解。如前所述，通过SEC HPLC评估可溶性或不溶性级分中丝的浓度：通过SEC折射率峰的面积对丝蛋白进行测量，使用牛血清白蛋白标准品以便计算丝浓度。

表3显示两次处理后丝的溶解。与以较低速率6.5×10⁶s^-1处理的样品相比，剪切速率增加至9.5×10⁶s^-1使溶解的丝蛋白的产率增加了40％(使用23,000psi的产率为47％，相比之下使用30,000psi的产率为66％)。因此，较高的剪切速率导致丝蛋白溶解和回收率增加。

表3：用10M尿素溶解丝蛋白时改变剪切速率的效果。从SEC HPLC峰面积估计丝浓度。产率是回收的丝蛋白量，归一化为起始材料中丝蛋白的总量。通过与5M GdnSCN一起温育来提取起始材料中丝蛋白的总量。

虽然已经参考优选实施方案和各种替代实施方案具体地显示和描述了本发明，但是相关领域的技术人员应理解，在不脱离本发明的精神和范围的情况下，可以在形式和细节上在其中进行各种改变。

出于所有目的，在本说明书的正文中引用的所有参考文献、授权专利和专利申请均以引用的方式整体并入本文。

序列表

<110> 保尔特纺织品公司(BOLT THREADS, INC.)

<120> 通过高剪切溶解来分离蜘蛛丝蛋白的方法

<130> BTT-033WO

<140>

<141>

<150> 62/901,053

<151> 2019-09-16

<160> 43

<170> PatentIn version 3.5

<210> 1

<211> 181

<212> PRT

<213> Aliatypus gulosus

<400> 1

Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser

1 5 10 15

Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala

20 25 30

Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe

35 40 45

Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser

50 55 60

Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg

65 70 75 80

Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala

85 90 95

Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala

100 105 110

Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu

115 120 125

Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala

130 135 140

Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser

145 150 155 160

Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly

165 170 175

Ala Gly Ser Ala Ser

180

<210> 2

<211> 126

<212> PRT

<213> 原始肉食蛛(Plectreurys tristis)

<400> 2

Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala

1 5 10 15

Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser

20 25 30

Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala

35 40 45

Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly

50 55 60

Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala

65 70 75 80

Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala

85 90 95

Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala

100 105 110

Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala

115 120 125

<210> 3

<211> 239

<212> PRT

<213> 原始肉食蛛(Plectreurys tristis)

<400> 3

Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala

1 5 10 15

Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys

20 25 30

Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln

35 40 45

Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln

50 55 60

Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe

65 70 75 80

Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser

85 90 95

Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro

100 105 110

Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala

115 120 125

Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala

130 135 140

Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser

145 150 155 160

Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser

165 170 175

Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro

180 185 190

Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala

195 200 205

Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln

210 215 220

Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser

225 230 235

<210> 4

<211> 182

<212> PRT

<213> 猫脸蜘蛛(Araneus gemmoides)

<400> 4

Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly

1 5 10 15

Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser

20 25 30

Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser

35 40 45

Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala

50 55 60

Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser

65 70 75 80

Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser

85 90 95

Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser

100 105 110

Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr

115 120 125

Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser

130 135 140

Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser

145 150 155 160

Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala

165 170 175

Thr Ser Ile Ser Ala Val

180

<210> 5

<211> 180

<212> PRT

<213> 花园蜘蛛(Argiope aurantia)

<400> 5

Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala

1 5 10 15

Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala

20 25 30

Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser

35 40 45

Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser

50 55 60

Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser

65 70 75 80

Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala

85 90 95

Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser

100 105 110

Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn

115 120 125

Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala

130 135 140

Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala

145 150 155 160

Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn

165 170 175

Ala Ala Asn Ala

180

<210> 6

<211> 199

<212> PRT

<213> 巨眼蛛(Deinopis spinosa)

<400> 6

Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly

1 5 10 15

Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser

20 25 30

Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala

35 40 45

Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln

50 55 60

Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala

65 70 75 80

Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly

85 90 95

Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val

100 105 110

Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser

115 120 125

Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu

130 135 140

Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala

145 150 155 160

Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr

165 170 175

Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln

180 185 190

Ala Val Thr Gly Val Gly Leu

195

<210> 7

<211> 171

<212> PRT

<213> 络新妇蛛(Nephila clavipes)

<400> 7

Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala

1 5 10 15

Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala

20 25 30

Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln

35 40 45

Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln

50 55 60

Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr

65 70 75 80

Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala

85 90 95

Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala

100 105 110

Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser

115 120 125

Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu

130 135 140

Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly

145 150 155 160

Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln

165 170

<210> 8

<211> 268

<212> PRT

<213> 三带金蛛(Argiope trifasciata)

<400> 8

Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala

1 5 10 15

Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala

20 25 30

Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly

35 40 45

Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly

50 55 60

Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly

65 70 75 80

Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly

85 90 95

Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val

100 105 110

Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala

115 120 125

Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly

130 135 140

Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly

145 150 155 160

Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly

165 170 175

Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly

180 185 190

Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly

195 200 205

Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly

210 215 220

Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly

225 230 235 240

Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly

245 250 255

Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val

260 265

<210> 9

<211> 420

<212> PRT

<213> 络新妇蛛(Nephila clavipes)

<400> 9

Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly

1 5 10 15

Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro

20 25 30

Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr

35 40 45

Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly

50 55 60

Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro

65 70 75 80

Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly

85 90 95

Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly

100 105 110

Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr

115 120 125

Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly

130 135 140

Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro

145 150 155 160

Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly

165 170 175

Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly

180 185 190

Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala

195 200 205

Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly

210 215 220

Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly

225 230 235 240

Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr

245 250 255

Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro

260 265 270

Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly

275 280 285

Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro

290 295 300

Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly

305 310 315 320

Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr

325 330 335

Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro

340 345 350

Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly

355 360 365

Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro

370 375 380

Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr

385 390 395 400

Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly

405 410 415

Pro Tyr Gly Pro

420

<210> 10

<211> 376

<212> PRT

<213> 黑寡妇蜘蛛(Latrodectus hesperus)

<400> 10

Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu

1 5 10 15

Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu

20 25 30

Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly

35 40 45

Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala

50 55 60

Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val

65 70 75 80

Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln

85 90 95

Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp

100 105 110

Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys

115 120 125

Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser

130 135 140

Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn

145 150 155 160

Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val

165 170 175

Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val

180 185 190

Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln

195 200 205

Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly

210 215 220

Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala

225 230 235 240

Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln

245 250 255

Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr

260 265 270

Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala

275 280 285

Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser

290 295 300

Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp

305 310 315 320

Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln

325 330 335

Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile

340 345 350

Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala

355 360 365

Pro Arg Leu Gly Ile Asp Leu Ser

370 375

<210> 11

<211> 200

<212> PRT

<213> 三带金蛛(Argiope trifasciata)

<400> 11

Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly

1 5 10 15

Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe

20 25 30

Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala

35 40 45

Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser

50 55 60

Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser

65 70 75 80

Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val

85 90 95

Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu

100 105 110

Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala

115 120 125

Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly

130 135 140

Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln

145 150 155 160

Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser

165 170 175

Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser

180 185 190

Gln Ala Ser Ala Ser Ser Thr Ser

195 200

<210> 12

<211> 357

<212> PRT

<213> 全异妩蛛(Uloborus diversus)

<400> 12

Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala

1 5 10 15

Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln

20 25 30

Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr

35 40 45

Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe

50 55 60

Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val

65 70 75 80

Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser

85 90 95

Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr

100 105 110

Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile

115 120 125

Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu

130 135 140

Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu

145 150 155 160

Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile

165 170 175

Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala

180 185 190

Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln

195 200 205

Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser

210 215 220

Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile

225 230 235 240

Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly

245 250 255

Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser

260 265 270

Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe

275 280 285

Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr

290 295 300

Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser

305 310 315 320

Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile

325 330 335

Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu

340 345 350

Leu Ser Val Ser Ala

355

<210> 13

<211> 32

<212> PRT

<213> 苗圃网络蜘蛛(Euprosthenops australis)

<400> 13

Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly

1 5 10 15

Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala

20 25 30

<210> 14

<211> 42

<212> PRT

<213> 长爪绿色突光蝴蛛(Tetragnatha kauaiensis)

<400> 14

Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly

1 5 10 15

Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly

20 25 30

Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala

35 40

<210> 15

<211> 42

<212> PRT

<213> 花园蜘蛛(Argiope aurantia)

<400> 15

Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly

1 5 10 15

Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly

20 25 30

Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala

35 40

<210> 16

<211> 46

<212> PRT

<213> 巨眼蛛(Deinopis spinosa)

<400> 16

Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly

1 5 10 15

Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln

20 25 30

Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala

35 40 45

<210> 17

<211> 42

<212> PRT

<213> 棒络新妇蛛(Nephila clavata)

<400> 17

Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly

1 5 10 15

Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly

20 25 30

Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala

35 40

<210> 18

<211> 174

<212> PRT

<213> 巨眼蛛(Deinopis spinosa)

<400> 18

Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala

1 5 10 15

Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala

20 25 30

Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly

35 40 45

Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly

50 55 60

Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala

65 70 75 80

Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala

85 90 95

Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala

100 105 110

Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala

115 120 125

Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala

130 135 140

Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala

145 150 155 160

Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly

165 170

<210> 19

<211> 149

<212> PRT

<213> 黑寡妇蜘蛛(Latrodectus hesperus)

<400> 19

Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala

1 5 10 15

Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly

20 25 30

Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala

35 40 45

Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly

50 55 60

Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala

65 70 75 80

Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala

85 90 95

Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala

100 105 110

Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala

115 120 125

Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly

130 135 140

Gln Gly Gln Gly Ala

145

<210> 20

<211> 161

<212> PRT

<213> 络新妇蛛(Nephila clavipes)

<400> 20

Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly

1 5 10 15

Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly

20 25 30

Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala

35 40 45

Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala

50 55 60

Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly

65 70 75 80

Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly

85 90 95

Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala

100 105 110

Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala

115 120 125

Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly

130 135 140

Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala

145 150 155 160

Ala

<210> 21

<211> 186

<212> PRT

<213> Nephilengys cruentata

<400> 21

Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala

1 5 10 15

Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala

20 25 30

Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr

35 40 45

Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala

50 55 60

Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala

65 70 75 80

Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala

85 90 95

Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala

100 105 110

Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala

115 120 125

Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala

130 135 140

Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala

145 150 155 160

Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala

165 170 175

Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala

180 185

<210> 22

<211> 132

<212> PRT

<213> 全异妩蛛(Uloborus diversus)

<400> 22

Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala

1 5 10 15

Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser

20 25 30

Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln

35 40 45

Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr

50 55 60

Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly

65 70 75 80

Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala

85 90 95

Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser

100 105 110

Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala

115 120 125

Gly Ala Ala Ala

130

<210> 23

<211> 198

<212> PRT

<213> 全异妩蛛(Uloborus diversus)

<400> 23

Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala

1 5 10 15

Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly

20 25 30

Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala

35 40 45

Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly

50 55 60

Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg

65 70 75 80

Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala

85 90 95

Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly

100 105 110

Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr

115 120 125

Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala

130 135 140

Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly

145 150 155 160

Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly

165 170 175

Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser

180 185 190

Ala Ala Ala Ser Ser Ala

195

<210> 24

<211> 190

<212> PRT

<213> 大腹园蛛(Araneus ventricosus)

<400> 24

Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly

1 5 10 15

Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala

20 25 30

Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala

35 40 45

Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly

50 55 60

Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala

65 70 75 80

Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala

85 90 95

Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala

100 105 110

Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu

115 120 125

Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly

130 135 140

Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly

145 150 155 160

Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly

165 170 175

Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala

180 185 190

<210> 25

<211> 166

<212> PRT

<213> 黑捕鱼蛛(Dolomedes tenebrosus)

<400> 25

Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr

1 5 10 15

Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly

20 25 30

Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly

35 40 45

Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala

50 55 60

Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly

65 70 75 80

Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala

85 90 95

Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly

100 105 110

Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala

115 120 125

Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly

130 135 140

Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala

145 150 155 160

Ala Ser Ala Ala Ala Ala

165

<210> 26

<211> 177

<212> PRT

<213> Nephilengys cruentata

<400> 26

Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala

1 5 10 15

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly

20 25 30

Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala

35 40 45

Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala

50 55 60

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu

65 70 75 80

Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala

85 90 95

Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala

100 105 110

Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln

115 120 125

Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala

130 135 140

Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln

145 150 155 160

Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala

165 170 175

Ala

<210> 27

<211> 174

<212> PRT

<213> Nephilengys cruentata

<400> 27

Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala

1 5 10 15

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly

20 25 30

Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala

35 40 45

Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala

50 55 60

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu

65 70 75 80

Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala

85 90 95

Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly

100 105 110

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly

115 120 125

Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala

130 135 140

Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly

145 150 155 160

Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala

165 170

<210> 28

<211> 22

<212> PRT

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 28

Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser

1 5 10 15

Ala Asn Gln Val Ala Ala

20

<210> 29

<211> 23

<212> PRT

<213> 巴斯德毕赤酵母(Pichia pastoris)

<400> 29

Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu

1 5 10 15

Leu Thr Asn Ile Val Ser Gly

20

<210> 30

<211> 20

<212> PRT

<213> 巴斯德毕赤酵母(Pichia pastoris)

<400> 30

Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala

1 5 10 15

Val Val Ser Ala

20

<210> 31

<211> 18

<212> PRT

<213> 红原鸡(Gallus gallus)

<400> 31

Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala

1 5 10 15

Leu Gly

<210> 32

<211> 89

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 32

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Asp Lys Arg Glu Ala Glu Ala

85

<210> 33

<211> 89

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 33

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Glu Ala Glu Ala

85

<210> 34

<211> 92

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 34

Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser

1 5 10 15

Ala Asn Gln Val Ala Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu

20 25 30

Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu

35 40 45

Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn

50 55 60

Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu

65 70 75 80

Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala

85 90

<210> 35

<211> 93

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 35

Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu

1 5 10 15

Leu Thr Asn Ile Val Ser Gly Ala Pro Val Asn Thr Thr Thr Glu Asp

20 25 30

Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu

35 40 45

Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn

50 55 60

Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys

65 70 75 80

Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala

85 90

<210> 36

<211> 90

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 36

Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala

1 5 10 15

Val Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala

20 25 30

Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp

35 40 45

Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu

50 55 60

Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly

65 70 75 80

Val Ser Leu Glu Lys Arg Glu Ala Glu Ala

85 90

<210> 37

<211> 88

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成多肽

<400> 37

Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala

1 5 10 15

Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile

20 25 30

Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp

35 40 45

Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe

50 55 60

Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser

65 70 75 80

Leu Glu Lys Arg Glu Ala Glu Ala

85

<210> 38

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 38

Ala Ala Ala Ala Ala

1 5

<210> 39

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 39

Ser Gly Ala Gly Gly

1 5

<210> 40

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 40

Gly Ser Gly Ala Gly

1 5

<210> 41

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成肽

<400> 41

Gly Gly Ser Gly Ala

1 5

<210> 42

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成His标签

<220>

<221> MISC_FEATURE

<222> (1)..(8)

<223> 此序列可涵盖6-8个残基

<400> 42

His His His His His His His His

1 5

<210> 43

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述：合成6xHis标签

<400> 43

His His His His His His

1 5

Claims

1.一种从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：

a.提供包含重组蜘蛛丝蛋白的不溶性团块；

b.将所述不溶性团块添加到包含溶剂的水性溶液中；

c.向包含所述不溶性团块的所述水性溶液施加剪切力，从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中。

2.如权利要求1所述的方法，其中所述剪切力是通过微流体化施加的。

3.如权利要求2所述的方法，其中所述微流体化产生约6×10⁶s^-1至10×10⁶s^-1的剪切速率。

4.如权利要求2所述的方法，其中所述微流体化产生至少约6×10⁶s^-1的剪切速率。

5.如权利要求2所述的方法，其中所述微流体化产生至少约10×10⁶s^-1的剪切速率。

6.如权利要求2-5所述的方法，其中所述微流体化在20,000psi至30,000psi下进行。

7.如权利要求6所述的方法，其中所述微流体化在30,000psi下进行。

8.如权利要求6所述的方法，其中所述微流体化在23,000psi下进行。

9.如前述权利要求中任一项所述的方法，其中微流体化器是M-110P或LM10微流体化器。

10.如权利要求9所述的方法，其中所述微流体化器包括G10Z相互作用室。

11.如权利要求9所述的方法，其中所述微流体化器包括F12Y相互作用室。

12.如前述权利要求中任一项所述的方法，其中所述剪切力施加至少两次。

13.如权利要求12所述的方法，其中所述剪切力施加至少三次。

14.如权利要求12所述的方法，其中所述剪切力在至少两次施加中是相同的。

15.如权利要求12所述的方法，其中所述剪切力在至少两次施加中是不同的。

16.如前述权利要求中任一项所述的方法，其中所述不溶性团块来源于包含宿主细胞的细胞培养物，其中所述宿主细胞表达所述重组蜘蛛丝蛋白。

17.如权利要求16所述的方法，其还包括收集来源于所述细胞培养物的所述不溶性团块，其中所述不溶性团块包含所述重组蜘蛛丝蛋白。

18.如权利要求1-17中任一项所述的方法，其中所述溶剂是离散剂。

19.如权利要求18所述的方法，其中所述离散剂是尿素、硫氰酸胍(GdnSCN)或氯化胍(GdnHCL)。

20.如权利要求1-19中任一项所述的方法，其中所述不溶性团块以约5％、10％、15％、20％、25％或30％不溶性团块/溶剂体积添加到所述水性溶液中。

21.如权利要求19或20所述的方法，其中所述离散剂以0.1-10M的浓度存在于所述水性溶液中。

22.如权利要求19或20所述的方法，其中所述水性溶液包含约10M尿素、约4M-8MGdnHCl或约3M-6M GdnSCN。

23.如权利要求19或20所述的方法，其中所述水性溶液包括不多于包含10M尿素的水性溶液、包含8M GdnHCl的水性溶液或包含6M GdnSCN的水性溶液的离液活性。

24.如权利要求23所述的方法，其中所述离液活性使用琼脂-胶凝测定进行量化。

25.如权利要求20所述的方法，其中所述水性溶液包括约15％不溶性部分团块与85％体积的3M GdnSCN。

26.如权利要求20所述的方法，其中所述水性溶液包括约15％不溶性部分团块与85％体积的4M GdnHCl。

27.如权利要求20所述的方法，其中所述水性溶液包括约15％不溶性部分团块与85％体积的10M尿素。

28.如权利要求1-27中任一项所述的方法，其中所述不溶性团块在20℃与30℃之间温育。

29.如权利要求28所述的方法，其中所述不溶性团块在室温下温育。

30.如权利要求28所述的方法，其中所述不溶性团块在不高于30℃下温育。

31.如权利要求1-30中任一项所述的方法，其中所述不溶性部分在包含所述溶剂的所述水性溶液中温育60至120分钟。

32.如权利要求1-31中任一项所述的方法，其中所述不溶性团块包含细胞沉淀。

33.如权利要求1-32中任一项所述的方法，其中收集来源于所述细胞沉淀的所述不溶性团块包括裂解所述宿主细胞。

34.如权利要求33所述的方法，其中裂解包括热处理、化学处理、剪切破坏、物理匀化、声处理或化学匀化。

35.如权利要求33至34所述的方法，其中收集所述细胞培养物的所述不溶性团块还包括离心所述裂解细胞以获得第一细胞沉淀。

36.如权利要求1-35中任一项所述的方法，其中收集所述不溶性团块还包括：

a.以10:1尿素体积与沉淀质量的比率将所述细胞沉淀与包含4M尿素的溶液一起温育；以及

b.离心所述包含4M尿素的溶液以获得第二细胞沉淀，之后在包含溶剂的所述水性溶液中温育所述第二细胞沉淀。

37.如权利要求1-36中任一项所述的方法，其还包括从所述水性溶液分离所述重组蜘蛛丝蛋白，从而产生分离的重组蜘蛛丝蛋白。

38.如权利要求1-37中任一项所述的方法，其中所述重组蜘蛛丝蛋白是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。

39.如权利要求38所述的方法，其中所述重组蜘蛛丝蛋白包括如SEQ ID NO:23中所示的差异妩蛛MiSP蛋白。

40.如权利要求38所述的方法，其中所述重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于90％、80％、70％、60％或50％。

41.如权利要求1-40中任一项所述的方法，其中所述细胞培养物包含真菌、细菌或酵母细胞。

42.如权利要求1-41中任一项所述的方法，其中所述细菌细胞是大肠杆菌。

43.如前述权利要求中任一项所述的方法，其中使用ELISA测量分离的重组蜘蛛丝蛋白的量。

44.如权利要求1-43中任一项所述的方法，其中使用尺寸排阻色谱法测量分离的重组蜘蛛丝蛋白的量。

45.如权利要求1-44中任一项所述的方法，其中所述分离的重组蜘蛛丝蛋白是全长重组蜘蛛丝蛋白。

46.如权利要求45所述的方法，其中所述分离的重组蜘蛛丝蛋白包含至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％全长重组蜘蛛丝蛋白。

47.如权利要求45所述的方法，其中使用ELISA测量全长重组蜘蛛丝蛋白的量。

48.如权利要求45所述的方法，其中使用尺寸排阻色谱法测量全长重组蜘蛛丝蛋白的量。

49.如权利要求1-48中任一项所述的方法，其中所述分离的重组蜘蛛丝蛋白的纯度是5-10％、10-15％、15-20％、20-25％、25-30％、30-35％、35-40％、45-50％、50-55％、55-60％、60-65％、65-70％、70-75％、75-80％、80-85％、85-90％、09-95％或95-100％。

50.一种从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：

a.提供包含重组蜘蛛丝蛋白的不溶性团块；

b.将所述不溶性团块添加到包含溶剂的水性溶液中，其中所述水性溶液以最终10M尿素浓度包含15％(重量/体积)不溶性部分；

c.通过微流体化向包含所述不溶性团块的所述水性溶液施加剪切力，从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中；以及

d.从所述水性溶液分离所述重组蜘蛛丝蛋白，从而产生分离的重组蜘蛛丝蛋白。

51.一种从宿主细胞分离重组蜘蛛丝蛋白的方法，其包括：

a.提供包含重组蜘蛛丝蛋白的不溶性团块；

b.将所述不溶性团块添加到水性溶液中，其中所述水性溶液以最终10M尿素浓度包含约15％(重量/体积)不溶性部分；

c.通过微流体化向所述水性溶液施加剪切力，从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中，其中所述剪切力是约10×10⁶s^-1；以及

52.一种组合物，其包含通过如权利要求1-51中任一项所述的方法产生的重组蜘蛛丝蛋白。

53.如权利要求52所述的组合物，其中所述重组蜘蛛丝包含至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或100％全长重组蜘蛛丝。

54.一种丝纤维，其包含通过权利要求1-53中任一项所述的方法产生的重组蜘蛛丝蛋白。