CN110719732B

CN110719732B - 表达蜘蛛丝的转基因蚕

Info

Publication number: CN110719732B
Application number: CN201880037718.4A
Authority: CN
Inventors: 伦道夫·V·路易斯; 夏礼尽; 张晓丽; 贾斯汀·A·琼斯
Original assignee: Utah State University USU
Current assignee: Utah State University USU
Priority date: 2017-03-30
Filing date: 2018-03-30
Publication date: 2022-11-18
Anticipated expiration: 2038-03-30
Also published as: CN110719732A; US11089767B2; WO2018183946A1; US20180288988A1

Abstract

公开了稳定表达合成蜘蛛丝基因或复合蚕/蜘蛛丝基因的转基因蚕。外源蜘蛛丝基因被稳定地整合到蚕的丝心蛋白重链内含子或丝心蛋白轻链内含子的限定位点。提供了合成蜘蛛丝蛋白和复合蜘蛛丝‑蚕丝基因和蛋白。外源蜘蛛丝基因的表达由内源丝心蛋白重链启动子驱动，改善了转基因蚕的遗传稳定性。与普通蚕丝纤维和其他转基因蚕纤维相比，复合蚕/蜘蛛丝纤维呈现出优异的机械性能。

Description

表达蜘蛛丝的转基因蚕

背景

1.发明领域

本公开内容涉及转基因蚕。更具体地，本公开内容涉及表达合成蜘蛛丝蛋白和复合蜘蛛丝-蚕丝蛋白的转基因蚕。还公开了合成蜘蛛丝蛋白、复合蜘蛛丝-蚕丝蛋白以及用于表达它们的核酸序列。还公开了用于产生这样的蚕的方法，包括利用优化的CRISPR/Cas9系统的方法。

2.相关技术的描述

蜘蛛丝具有强度和延展性的独特组合，这使得它们成为已知的最坚韧的材料之一。不幸的是，蜘蛛因其占领行为和同类相残行为而不能大规模养殖以满足商业应用的需求。

对几种蜘蛛丝蛋白的cDNA和基因序列的克隆已经促进了合成蜘蛛丝基因的设计。牵丝由两种蛋白质组成，大壶状丝蛋白1和大壶状丝蛋白2(MaSp1和MaSp2)。蜘蛛丝蛋白的一级结构包括重复模块单元的大中心核心——占丝蛋白的约90％，其侧翼为非重复N末端结构域和C末端结构域。重复模块单元具有序列基序聚丙氨酸(AAAA)_n和甘氨酸-甘氨酸-X的子单元，其中X表示大壶状蜘蛛丝蛋白MaSp1和小壶状蜘蛛丝蛋白MiSp1中的可变氨基酸(Eisolt等人.2010)。不同蜘蛛丝蛋白中基序的顺序和数目是不同的。这些特征为蜘蛛丝的二级结构和机械性质负责。

合成蜘蛛丝基因已经被引入到各种生物体中以产生重组蜘蛛丝蛋白(rSSp)。已经研究了多种多样的异源宿主系统作为用于产生rSSp的平台，包括细菌、酵母、哺乳动物细胞系、转基因植物、哺乳动物和昆虫(Lazaris等人.2002；Menassa等人.2004；Xu等人.2007；Miao等人.2006)。尽管在这些宿主系统中产生的rSSp已经被人工地纺成纤维，但由于蛋白质尺寸和纺丝技术的限制，该纤维不如天然蜘蛛丝那样强韧(Teulé等人.2009)。

迄今为止，在一系列宿主中产生的大多数rSSp为约30kDa-110kDa，比蜘蛛丝纤维的最常见地表征的拖丝蛋白(250kDa-350kDa)小得多(Eisoldt等人.2011)。已在大肠杆菌(Escherichia coli)中表达出接近天然大小的rSSp，但是表达水平的限制使得不可能满足大规模的需求(Xia等人.2010)。此外，对于rSSp的人工纺丝的技术与蜘蛛的天然纺丝过程显著不同。实验室中用于使蜘蛛丝纤维纺丝的最常见方法之一采用有毒且昂贵的1,1,1,3,3,3-六氟-2-丙醇(HFIP)。纤维通过将原液挤出到凝结剂中并且然后在各种醇中拉伸来产生。另一方面，蜘蛛和蚕使丝蛋白在水中形成溶剂化物，并且然后从吐丝器中拉出纤维，而不需要凝结剂，纤维在纳秒内形成。

近年来，家蚕(Bombyx mori)被用作用于产生重组蜘蛛丝和复合蚕/蜘蛛丝纤维的平台(Wen 2010)。家蚕(B.mori)具有与蜘蛛的纤维纺丝过程相似的天然纤维纺丝过程，是多产的丝生产者，并且可以商业化养殖。

在丝腺中，由于丝蛋白在非常高浓度下聚集而形成胶束状结构，并且然后由于蛋白液沿导管流动时施加的剪切力而形成β-片层晶体。纤维中的蛋白质结构在纤维从蜘蛛的纺管或蚕的口中拉出时(进一步增加了剪切应力)形成。此外，富含聚GX且构成蚕纤维的70％的蚕丝心蛋白重链具有与蜘蛛牵丝相似的β-片层结构。这些生物相似性使蚕成为产生“合成”蜘蛛丝状纤维的潜在宿主。

工程化转基因蚕最常见的方式使用基于转座子的piggyBac系统，其中感兴趣的外来基因在外源启动子下表达。先前的研究已经示出，基于piggyBac载体的转基因蚕可以通过在丝胶蛋白启动子(Ser1)或丝心蛋白重链(FibH)启动子的控制下编码蜘蛛络新妇蛛(Nephila clavipes)牵丝蛋白MaSp1来产生重组蜘蛛丝蛋白(Teulé等人.2009；Wen 2010)。然而，Ser1启动子仅可以驱动重组蜘蛛丝蛋白在丝胶蛋白层中表达。在养蚕业中，丝胶蛋白层是可溶的并且通常被脱胶；因此，蜘蛛丝蛋白在丝胶蛋白层中的掺入不可能改善转基因纤维的机械性质。

也已经使用基于转座子的piggyBac系统将外源FibH增强子和启动子掺入基因表达盒中，该外源FibH增强子和启动子驱动蜘蛛丝纤维的丝心蛋白部分的rSSp表达，但是对于稳定表达piggyBac系统仍具有几个缺点(Teulé等人.2009)。例如，在基于转座子的piggyBac系统中，转座子通常在TTAA染色体位点处通过剪切粘贴机制从一个基因组位置转移到另一个基因组位置。具有低转座率的元件可能经常通过遗传漂变而丢失，而具有高转座率的元件可能不受控制地扩增，导致宿主不育或其他并发症(Xu等人.2015)。此外，由基于转座子的异质性引起的复合蚕/蜘蛛丝蛋白比率和/或这些蛋白沿纤维的定位的差异可能导致复合丝纤维的机械性质的广泛变化(Wen等人.2010)。丝的机械性质的同质性充当评估丝纤维的重要指数。此外，基于转座子的基因载体由于与随机整合相关的问题已经不能在宿主中产生高水平的合成蜘蛛丝蛋白(Teulé等人.2009)。

因此，尚难以获得稳定表达具有与天然蜘蛛丝相当或比它更好的机械性质的转基因蜘蛛丝的转基因蚕。

概述

在一个方面中，公开了转基因蚕。在一些实施方案中，转基因蚕稳定地表达合成蜘蛛丝基因。在一些实施方案中，转基因蚕稳定地表达复合蜘蛛丝-蚕丝基因。

在一个方面中，公开了合成蜘蛛丝蛋白和复合蜘蛛丝-蚕丝蛋白。

在一个方面中，公开了用于表达合成蜘蛛丝蛋白和复合蜘蛛丝-蚕丝蛋白的核酸序列。

在实施方案中，转基因蜘蛛丝基因是络新妇蛛(N.Clavipes)的大壶状蜘蛛丝基因MaSp1或小壶状蜘蛛丝基因MiSp1。在实施方案中，合成蜘蛛丝蛋白、复合蜘蛛丝-蚕丝蛋白、合成蜘蛛丝和/或复合蜘蛛丝-蚕丝具有与天然蜘蛛丝蛋白和/或天然蜘蛛丝相当或优于天然蜘蛛丝蛋白和/或天然蜘蛛丝的机械性质。

在一个方面中，公开了产生转基因蚕的方法。在一些实施方案中，该方法利用优化的CRISPR/Cas9系统。在某些实施方案中，CRISPR/Cas9系统采用非同源重组。

在一些实施方案中，外源蜘蛛丝遗传物质被引入到蚕丝心蛋白重链的内含子或丝心蛋白轻链基因的内含子中。在一些实施方案中，外源蜘蛛丝基因或复合基因可操作地连接至内源蚕启动子。

前面广泛地概述了本公开内容的特征和技术优点，以便可以更好地理解下面的详细描述。下文将描述形成本申请的权利要求的主题的本公开内容的另外的特征和优点。本领域技术人员将理解，本文公开的概念和具体方面可以容易地用作用于修改或设计用于实现本公开内容的相同目的的其他方面的基础，这些其他方面在本公开内容和所附权利要求中提供的精神和范围内。

附图的几个视图的概述

下文具体参考附图提供对本发明的详细描述，在附图中：

图1图示出了BmN细胞中CRISPR/Cas9系统HC3介导的靶向整合，其中wt.：野生型基因序列[SEQ ID NO:1]；Ref：参考序列，与wt.相同；测试样品：XZ2-M13F-T2[SEQ ID NO:2]、XZ3-M13F-T3[SEQ ID NO:3]、XZ6-M13-T6[SEQ ID NO:4]、XZ15-M13F-T3[SEQ ID NO:5]、XZ16-M13F-T4[SEQ ID NO:6]、XZ22-M13-T10[SEQ ID NO:7]、XZ25-M13-T13[SEQ ID NO:8]、XZ29-M13F-T17[SEQ ID NO:9]和XZ35-M13F-T23[SEQ ID NO:10]；基因替代以红色示出并且虚线指示缺失。呈粗体的核苷酸指示基因序列的N末端和C末端。

图2是HC-NHEJ策略的示意图。红色-绿色点：指示蚕gRNA识别位点(HC-1、HC-2、HC-3)，对应序列显示在方案(AF226688.1:63183-63215)中。以红色和绿色加下划线的序列示出了gRNA HC-1和HC-3的靶位点[SEQ ID NO:11，红色/左侧；SEQ ID NO:12绿色/右侧]。所列的完整序列是SEQ ID NO:13。

图3A-1、图3A-2、图3A-3、图3A-4、图3B-1、图3B-2、图3B-3和

图3B-4图示出了复合蚕/蜘蛛/EGFP蛋白在G₀ HCA组的转基因茧中的表达。

图4A、图4B、图4C和图4D示出了转基因蚕腺体蛋白的SDS-PAGE考马斯亮蓝染色和蛋白印迹。

图5A、图5B、图5C和图5D示出了脱胶的天然丝纤维和转基因丝纤维的机械性质(应力、应变、弹性模量、断裂能)。

图6示出了来自对照(非转基因)组(n＝57)和三个转基因组：G₀ HCA-2(n＝35)、G₀HCA-3(n＝35)和G₁ HCI(n＝17)的脱胶的丝纤维的机械性质(应力对应变)。

图7A、图7B、图7C和图7D示出了在不同腺体中测量的蛋白质物质的FTIR光谱。

图8是显示G₀ HCA组和G₁ HCI组中复合蚕/蜘蛛丝纤维的二级结构的示意模型。左上方：合成蜘蛛丝蛋白MaSp1的氨基酸序列[SEQ ID NO:48]。左中图中呈浅蓝色、红色和黑色的残基指示α-螺旋、β-片层和间隔区。中上方：家蚕重链的氨基酸序列[SEQ ID NO:49]。中间中图中呈绿色和黑色的残基指示β-片层和间隔区。右上方：合成蜘蛛丝蛋白MiSp1的氨基酸序列[SEQ ID NO:50]。右中图中呈深蓝色、红色和黑色的残基指示α-螺旋、β-片层和间隔区。D：MaSp1的二级结构，包括3₁₀-螺旋和β-片层。E：家蚕重链的二级结构，包括β-片层；F：MiSp1的二级结构，包括3₁₀-螺旋和β-片层。左下方和右下方：G₀ HCA组中复合蚕/蜘蛛丝纤维的二级结构和G₁HCI组中复合蚕/蜘蛛丝纤维的二级结构。蜘蛛/蚕融合纤维的复合二级结构分别转化为具有MaSp1和MiSp1。

图9是具有合成蜘蛛丝基因MaSp1的工程化丝心蛋白轻链的示意图。

图10示出了LC-NHEJ策略的示意图。所列的完整序列是SEQ ID NO:60。

图11A-1、图11A-2、图11A-3、图11A-4、图11B-1、图11B-2、图11B-3和图11B-4图示出了转基因蚕/蜘蛛纤维在共聚焦显微术期间在激发后发射的绿色荧光。

图12是琼脂糖凝胶，示出了转基因蛾的基因组中的eGFP。

图13是琼脂糖凝胶，图示出了对转基因蛾中的左侧基因组：接合的检测。

图14是琼脂糖凝胶，图示出了对转基因蛾中的右侧基因组：接合的检测。

图15A是考马斯亮蓝染色的凝胶，并且图15B是用于检测LCA6的转基因丝腺中的eGFP蛋白的蛋白印迹。

图16A、图16B、图16C和图16D图示出了LCA6组的第二代中转基因蚕/蜘蛛丝纤维的机械性质。

图17图示出了LCA6组和对照组中脱胶的转基因蚕/蜘蛛丝纤维的机械性质的应力对应变。1：对照(非转基因)纤维，489MPa；2：G₁ LCA6组中转基因蜘蛛/蚕纤维的中值，776MPa；3和4：G₁ LCA6组中最佳的转基因蜘蛛/蚕纤维，1204MPa和1475MPa；5：天然蜘蛛牵丝(络新妇蛛)，1375MPa。在同等条件下测试了来自对照组和转基因组的丝纤维。

图18是显示G₁ LCA组中复合蚕/蜘蛛丝纤维的形成的示意模型。

详细描述

下文参考附图描述各个方面。通过参考以下详细描述，可以更好地理解各方面的各种要素的关系和功能。然而，各方面不限于附图中图示的或下文明确描述的那些方面。应当理解，附图不一定按比例绘制，并且在某些情况下，可能已经省略了对于理解本文公开的方面不是必需的细节(诸如常规制造和组装)。标题是为了方便读者和帮助组织本公开内容而提供，并且不应被解释为限制或以其他方式定义本发明的范围。

在一个方面中，本公开内容提供了稳定表达合成蜘蛛丝基因或复合蜘蛛丝-蚕丝基因的转基因蚕。

如本文使用的，术语“合成”被理解为包括基因序列或所得到的基因表达产物(例如，蛋白质)，它们涵盖天然基因序列或基因表达产物的一部分或全部，但是从其天然宿主中移除或以其他方式分离。因此，“合成蜘蛛丝基因”被理解为包括这样的DNA序列，其与天然蜘蛛丝基因跨越基因的至少20个碱基对(bp)连续区段具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，或者产生与天然蜘蛛丝蛋白质跨越蛋白质的至少20个氨基酸连续区段具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％蛋白质序列同一性的基因表达产物。术语“合成”可以在本文中与术语“外源”或“转基因”可互换地使用，特别是当描述源自与其当前宿主不同的生物体的合成基因序列时。

类似地，术语“合成蜘蛛丝基因”被理解为包括可能小于天然蜘蛛丝基因的全长的DNA序列。

在一些实施方案中，转基因产生的蜘蛛丝或复合蜘蛛丝-蚕丝反映了蚕的总丝产量的约10％-15％。在其他实施方案中，转基因产生的蜘蛛丝或复合蜘蛛丝-蚕丝反映了蚕的总丝产量的超过15％、超过20％、超过25％、超过30％、超过35％、超过40％、超过45％、超过50％、超过55％、超过60％、超过65％、超过70％、超过75％、超过80％、超过85％、超过90％、超过95％、超过99％或约100％。

在此方面，工程化蜘蛛丝可以基本上替代一种或更多种蚕自身的丝相关蛋白诸如蚕丝心蛋白蛋白质的内源性产生。

应理解，蛋白质丝心蛋白，包含丝心蛋白重链和丝心蛋白轻链，是蜘蛛和蚕的丝的核心蛋白组分。因此，术语“丝心蛋白”、“丝蛋白”或“蜘蛛丝蛋白”在一些情况下可以在本文中酌情参照“丝”或“蜘蛛丝”而可互换使用。

现有技术的局限性使得难以产生将长度大于约3kb的转基因稳定整合在蚕中的转基因蚕。在具体实施方案中，公开了一种转基因蚕，该转基因蚕具有稳定整合的长度大于约3千碱基(3kb)的合成蜘蛛丝基因。在某些实施方案中，稳定整合的合成蜘蛛丝基因的长度大于约4kb；长度大于约5kb；长度大于约6kb；长度大于约7kb；长度大于约8kb；长度大于约9kb；或长度大于约10kb。在一些实施方案中，合成丝基因的长度为约10kb。

如本文使用的，术语“稳定整合”意指引入的转基因物质能够成功地通过细胞分裂传递给子细胞和/或后代，例如，传递给第二代、第三代等，而没有序列的实质性变化或转基因物质丢失。因此，在一些实施方案中，稳定整合的转基因存在于转基因蚕的第一代、第二代、第三代等(即后代)中。在某些实施方案中，稳定整合的转基因在转基因蚕的第一代、第二代、第三代等(即后代)中表达。

还应理解，外源核苷酸序列稳定整合到宿主基因中(诸如通过CRISPR/Cas9介导的敲入系统)可以产生包括外源和内源核酸材料二者的复合(即杂合)基因。因此，在一些实施方案中，公开了一种转基因蚕，该转基因蚕具有复合蜘蛛丝-蚕丝基因。

还应理解，这样的复合基因序列的表达可以产生一种或更多种复合(即杂合或融合)蛋白。因此，在一些实施方案中，公开了稳定表达合成蜘蛛丝基因或复合/杂合蜘蛛丝-蚕丝基因的转基因蚕。

在实施方案中，整合的基因在蚕中的内源启动子的控制(即，可操作地连接)下表达。在一些实施方案中，蜘蛛丝基因可操作地连接至内源启动子。例如，外源蜘蛛丝遗传物质可以被引入到蚕丝心蛋白重链基因FibH的单个内含子中，整合的转基因的稳定表达由内源启动子驱动。在另一个实例中，外源蜘蛛丝遗传物质可以被引入到蚕丝心蛋白轻链基因FibL的六个内含子中的任一个中，整合的转基因的稳定表达由内源启动子驱动。蚕中由内源丝心蛋白启动子驱动的MaSp1或MiSp1的表达表现为改善了转基因蚕中的遗传稳定性。在具体实施方案中，内源蚕启动子是蚕特异性U6启动子。因此，所公开的策略克服了使用同源重组的CRISPR/Cas9、基于转座子的piggyBac系统所呈现的随机整合以及其他系统的局限性。

在一些实施方案中，外源蜘蛛丝基因可以包含大壶状蜘蛛丝基因MaSp1基因、大壶状蜘蛛丝基因MaSp2、腺泡状基因Ac1、鞭毛状基因Flag、梨状基因Piri或小壶状基因MiSp1或其合成变体。参见Teule 2007。

因此，在具体实施方案中，公开了一种转基因蚕，该转基因蚕具有可操作地连接至内源蚕启动子的稳定整合的合成蜘蛛丝基因，其中外源蜘蛛丝基因的长度大于约3千碱基(3kb)。

在一个方面中，公开了转基因蜘蛛丝蛋白、复合蜘蛛丝-蚕丝蛋白、转基因蜘蛛丝、复合蜘蛛丝-蚕丝以及用于表达它们的核酸序列。

不同蜘蛛丝蛋白中的序列顺序和蛋白质基序的数目是不同的。这些特征负责蜘蛛丝的二级结构和机械性质。因此，在各种实施方案中，不同的合成蜘蛛丝基因被设计成整合这些具有各种机械性质的基序。

在一些实施方案中，引入的蜘蛛丝基因是络新妇蛛的大壶状蜘蛛丝基因MaSp1(～10kb)或小壶状蜘蛛丝基因MiSp1(～10kb)。在实施方案中，转基因蚕表达复合蚕/蜘蛛丝蛋白。

所公开的杂合蛋白可能比先前的转基因丝蛋白更大且更稳定。在实施方案中，转基因蜘蛛丝蛋白、复合蜘蛛丝-蚕丝蛋白和/或复合蜘蛛丝-蚕丝具有与天然蜘蛛丝蛋白和/或天然蜘蛛丝以及文献中描述的其他转基因蚕纤维相当或优于它们的机械性质。

在某些实施方案中，这些改善的性质存在于转基因蚕的G₀代和G₁代中。在某些实施方案中，这些改善的性质存在于转基因蚕的连续后代中。

在一个方面中，公开了用于产生转基因蚕的方法。

目前的基因组编辑技术有利于在细胞和生物体的基因组中引入位点特异性修饰，并且提供在蚕的精确靶位点处递送外源基因的手段。最新的基因组编辑技术(诸如锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)和成簇的规律间隔的短回文重复(CRISPR)系统)在蚕中的初步应用主要集中在蚕表型基因(BmBLOS2)或非表型基因(Bmku70)(Wang等人.2013)。例如，研究人员使用定制的ZFN破坏了蚕腺体的丝心蛋白重链(FibH)基因(Ma等人.2014)。然而，这些基因组编辑技术在蚕中的应用通常限于敲除阶段(Wei 2014)。

因此，在一些实施方案中，合成蜘蛛丝基因和/或复合蜘蛛丝-蚕丝基因在蚕的丝腺中表达。在其他实施方案中，合成蜘蛛丝基因和/或复合蜘蛛丝-蚕丝基因在蚕的其他组织或器官中表达。

研究人员使用同源重组成功地在蚕的限定基因座敲入了红色荧光基因(Takasu等人.2016)。使用这些技术在限定的蚕位点稳定敲入大的(例如，大于3kb)转基因并在内源启动子下表达转基因尚未得到证实。

CRISPR/Cas9系统已经被用于不同的研究模型，包括昆虫细胞、植物和人类细胞(Mao等人.2016；Cho等人.2013)。该系统的优点是构建体的生产和设计相对容易、转基因生物体的产生省时、以及与基因组DNA的结合稳定性。

CRISPR具有两个组成部分：一个“指导”RNA(gRNA)和一个非特异性CRISPR相关内切核酸酶(Cas9)。CRISPR在染色体的限定位置处产生DNA双链断裂(DSB)。Cas9介导的DSB可以经由同源定向修复(HDR)或非同源末端连接(NHEJ)的独立途径自发修复。

同源重组介导的敲入系统已经是将外来基因引入到期望的宿主的优选的技术。例如，使用CRISPR/Cas9系统，通过精确且受控的同源重组(HR)修复系统已将外源DNA片段添加到秀丽隐杆线虫(Caenorhabditis elegans)中(Dickinson等人.2013)。该方法的一个局限性是难以将大的DNA片段掺入到靶生物体中。

不依赖HR途径作用的非同源末端连接(NHEJ)是高效的。例如，已经使用NHEJ将15kb诱导型基因表达盒引入在人类细胞系的限定基因座处(Yang等人.2013)。但是NHEJ与DSB区域中可能的破坏性核苷酸插入和缺失(得失位)和/或取代有关，这可能降低转基因稳定性和表达。

因此，在一些实施方案中，CRISPR/Cas9系统采用非同源重组(末端连接)来促进大的外源核材料的引入，同时靶向不受相邻突变影响的整合位点。

在一些实施方案中，利用优化的CRISPR/Cas9系统将相对大的蜘蛛丝基因引入到蚕中。该策略克服了基于转座子的piggyBac系统和本领域已知的其他系统(包括CRISPR本身的其他应用)的随机整合的限制。所公开的方法促进将大的外源DNA片段插入蚕基因组内的限定位点。在一些实施方案中，所公开的合成蜘蛛丝基因的片段被引入到蚕中。

在具体实施方案中，公开了一种用于产生转基因蚕的方法，该方法包括：引入可操作地连接至内源蚕启动子的外源合成蜘蛛丝基因，其中外源蜘蛛丝基因的长度大于约3千碱基(3kb)。

在具体实施方案中，公开了一种用于产生转基因蚕的方法，该方法包括：使用CRISPR/Cas9系统将具有SEQ ID NO.25或SEQ ID NO:26或其任一个的片段的分离的核酸引入到蚕基因组的限定位点，使得分离的核酸可操作地连接至内源蚕启动子，其中外源核酸被稳定地整合到蚕基因组中。

在某些实施方案中，所公开的方法不需要在HC-NHEJ供体中使用外源启动子。

例如，使用本文公开的方法，使用优化的CRISPR/Cas9引发的非同源末端连接，两个大的蜘蛛丝基因可以成功地整合在丝心蛋白重链基因的限定基因座处。掺入的蜘蛛丝基因可以在蚕的内源FibH启动子下完全表达。

如本文使用的优化的CRISPR/Cas9系统可以被专门设计为用于在蚕中高效且稳定的整合和表达转基因序列。在一些实施方案中，CRISPR/Cas9系统使用蚕特异性U6启动子针对蚕进行优化。CRISPR/Cas9系统可以通过靶向未被外源核酸材料的引入破坏的蚕基因组序列(例如内含子)来进一步优化。

在某些实施方案中，相对大的合成蜘蛛丝蛋白基因(例如，MaSp1和MiSp1)因此被成功地整合到FibH基因的内含子和/或FibL基因的内含子中。这些基因各自为约9kb-10kb，比先前关于蚕报道的任何相当的成功的基因敲入都大。

所公开的方法提供了用于产生用合成蜘蛛基因转化的转基因蚕的有效方法，该方法优于基于转座子的piggyBac系统。所公开的方法使得可以例如通过非同源末端连接(NHEJ)由内源FibH启动子驱动大的外源合成蜘蛛基因(～10kb)的表达。与非转基因纤维相比，这些转基因蚕的复合蚕/蜘蛛纤维的机械性质也显著改善。这些转基因的遗传稳定性和表达产物的优异的机械特性在转基因后代中持续存在。本研究中开发的策略可以扩展到其他外源合成丝蛋白，用于通过使用蚕作为表达系统商业化生产生物分子。

提供以下实施例来说明本公开内容的某些特征和/或方面。这些实施例不应被解释为将本公开内容局限于其中描述的特定特征或方面。

实施例

实施例1.FibH内含子中的蜘蛛丝转基因

使用蚕特异性CRIPSR/Cas9系统，将两个相对大的合成蜘蛛丝基因，络新妇蛛的大壶状蜘蛛丝基因(MaSp1，～10kb)和小壶状蜘蛛丝基因(MiSp1，～10kb)，分别引入到蚕FibH基因的唯一内含子中。优化的蚕特异性CRISPR/Cas9系统与NHEJ一起使用。表达由转基因蚕腺体中的内源FibH启动子驱动，以改善收率并确保遗传稳定性。

用于蚕的Cas9和sU6 gRNA表达载体的构建。

为了确保CRISPR/Cas9系统在BmN细胞和/或蚕中良好表达，将cas9的编码区域构建到pIE-1载体的hr5增强子和IE1启动子下。

为了在蚕中构建Cas9的表达载体，将Cas9的编码区域用AgeI和NotI(NEB，R3552S和R3189S)从Px330-U6-嵌合BB-CBh-hSpCas9(Addgene质粒#42230)切下，经凝胶纯化(Qiagen，编号28704)，回收并亚克隆到pIEx^TM-1(Novagen，编号71241-3)的hr5增强子和IE1启动子下游的相应位点以形成pIEx^TM-1-Cas9。为了便于追踪Cas9的细胞内表达和存在，将eGFP添加在Cas9的C末端以形成质粒pIEx^TM-1-eGFP-Cas9。为了构建蚕的sgRNA表达载体，通过Integrated DNA Technologies(Coralville，IA)合成包含蚕特异性U6启动子和终止子以及必需的sgRNA框架的部分的467bpgBlock DNA片段[SEQ ID NO:22]。将该gBlock DNA片段经PCR扩增(引物1：AGGTTATGTAGTACACATTG[SEQ ID NO:14]和引物2：TTAATGCCAACTTTGTACA[SEQ ID NO:15])，并然后亚克隆到

简易载体系统(Promega，A3600)中以形成

(蚕U6)。制备具有20个核苷酸的寡核苷酸gRNA(gRNA_sU6_FibH_1,gRNA_sU6_FibH_2,gRNA_sU6_FibH_3)，靶位点序列始于sgRNA-1中G并结束于sgRNA2中的C。参见下表1，该表示出了CRISPR/Cas9系统的gRNA设计。表1中列出的序列是SEQ ID NO:16-21，列在该表的第一行到最后一行。

表1.

包含sgRNA靶向位点和sgRNA框架的部分的寡核苷酸也从Integrated DNATechnologies订购，并且将其退火和延伸以形成双链DNA。将这些双链DNA经凝胶纯化(Qiagen，编号28704)并且使用Gibson

主混合物(NEB，E2611S)亚克隆到MfeI消化的

中，以形成最终的sgRNA表达载体

使用密码子优化的U6启动子(sU6)(SEQ ID NO:71)构建蚕特异性gRNA(sgRNA)表达载体。

如所提及的，NHEJ修复系统与随机核苷酸插入和/或缺失相关，插入和/或缺失如果出现在基因的外显子中导致蛋白质功能可能丧失。设计三个不同的sgRNA以靶向蚕丝心蛋白重链(FibH)的唯一内含子，以消除经NHEJ修复的易错剪接和/或修饰引起的不利影响。测试了特异性靶向重链内含子AF226688.1:63138-63159；63196-63215；63318-63337的三个gRNA(gRNA_sU6_FibH_1,gRNA_sU6_FibH_2,gRNA_sU6_FibH_3)。参见表1。

在BmN细胞中评估CRISPR/Cas9。

将完整构建的质粒pIEx^TM-1-eGFP-Cas9和

使用X-tremeGENE^TM HP DNA转染试剂(Roche，编号06 366 244 001)转染至BmN细胞，比例为每个孔1μg总质粒和2μl转染试剂。将对照组用相同体积的所述质粒悬浮于其中的ddH₂O(但没有这些DNA质粒)转染。在72h-96h转染后，将细胞用1x PBS缓冲液(pH 7.4)洗涤，转染的BmN细胞的基因组DNA通过使用QuickExtract^TM DNA提取溶液(Epicentre，QE09050)收集，并且然后使用以下引物通过Taq PCR主混合物试剂盒(Qiagen，编号201443)进行PCR扩增：HC-lacZdisr-正向：ATATCTAGATTCTCAGTGGGTCGCGTTAC[SEQ ID NO:23]和HC-lacZdisr-反向：ATAGGTACCTCGATAACTGCCCCAGATGC[SEQ ID NO:24]。将PCR产物(～250bp)克隆到

简易载体系统(Promega，A3600)中。在转化进入高效的5-α感受态大肠杆菌(NEB，C2987P)后，对菌落测序。确定含有突变的菌落通过比较PCR产物的序列与丝心蛋白重链基因的参考序列(AF226688.1:63001-63601)来确定。CRISPR/Cas9效率基于突变序列与未突变序列的比率来评估。

FibH内含子中插入缺失的引入不影响FibH基因的随后转录和蛋白质表达。因此转基因蚕通过优化的蚕特异性CRISPR/Cas9系统触发的NHEJ来产生。预期该策略也不会对随后的选择性剪接和/或核苷酸修饰产生影响，甚至允许NHEJ修复突变(30)。CRISPR/Cas9系统的具有三个不同的靶位点(HC-1、HC-2、HC-3)的三个不同的gRNA分别被转化到BmN细胞中以评估它们的中靶效率。

提取基因组DNA，并且PCR扩增NHEJ修复区域。将HC-3gRNA引入到蚕卵中以产生转化的胚胎，因为它在FibH基因组中的限定位点处具有最高的修复率(通过测序确定为30％)。

图1示出了BmN细胞中CRISPR/Cas9系统HC3介导的靶向整合，其中wt.：来自丝心蛋白重链基因FibH的内含子的野生型基因序列[SEQ ID NO:1]；Ref：参考序列，与wt.相同；测试样品:XZ2-M13F-T2[SEQ ID NO:2]、XZ3-M13F-T3[SEQ ID NO:3]、XZ6-M13-T6[SEQ IDNO:4]、XZ15-M13F-T3[SEQ ID NO:5]、XZ16-M13F-T4[SEQ ID NO:6]、XZ22-M13-T10[SEQ IDNO:7]、XZ25-M13-T13[SEQ ID NO:8]、XZ29-M13F-T17[SEQ ID NO:9]和XZ35-M13F-T23[SEQID NO:10]。基因替代以红色示出，虚线指示缺失。

HC-NHEJ供体设计。

在先前的研究中，使用基于转座子的piggyBac系统整合丝心蛋白重链(FibH)启动子，以驱动外来蜘蛛丝蛋白基因在转基因蚕的后丝腺中的瞬时表达。此处，供体载体pBluescript II SK(+)被用作构建具有合成蜘蛛丝表达基序的MaSp1-8重复(～10kb)或MiSp1-8重复(～10kb)的HC-NHEJ载体的骨架，其中蛋白质分子量分别为214kDa和229kDa。

大壶状蜘蛛丝蛋白MaSp1基因富含[GGX]_n和聚(A)基序。小壶状蜘蛛丝蛋白MiSp1基因富含GGXGGY(X＝Q或A)基序与(GA)y(A)z基序(y＝3-6且z＝2-5)的交替。相应地，合成蜘蛛丝蛋白[MaSp1]8和[MiSp1]8的DNA由Life Technologies合成并使用酶AgeI和BspEI(NEB，R3552S和R0540S)连接8个重复。下表2示出了MaSp1[SEQ ID NO:25，上部]和MiSp1[SEQ ID NO.26，下部]合成蜘蛛丝基因的DNA序列。

表2.

将整个编码片段用HindIII和BamHI(NEB，R3104S和R3136S)克隆到pBluescriptIISK(+)载体中，以产生pSK-MaSp1/MiSp(8)。用SacII和SacI(NEB，R0157S和R3156S)将蚕重链基因组的3’编码序列和聚(A)信号(CTD)插入到pSK-MaSp1/MiSp(8)中，以产生pSK-MaSp1/MiSp1(8)-CTD。用基因特异性引物通过PCR从piggyBac1379扩增DsRed基因片段，并且然后将其亚克隆到pSK-MaSp1/MiSp1(8)-CTD中以产生pSK-MaSp1/MiSp1(8)-DsRed-CTD。5’关键调节元件和蛋白质序列包括N末端结构域(内含子1/外显子2)和eGFP。这用piggyBac1379质粒DNA通过PCR产生，并且将其克隆到pSK-MaSp1/MiSp1(8)-DsRed-CTD中以产生完整的pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体。用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物在下表3中示出(SEQ ID NO:27-32，按顺序列在该表的第一行到最后一行)。

表3.

因为在HC-NHEJ载体构建中未使用外源启动子和增强子(参见上表3)，合成蜘蛛丝蛋白MaSp1或MiSp1的表达仅依赖于后丝腺细胞中的内源FibH启动子，这意味着fhc蛋白的表达应该直接被合成蜘蛛丝蛋白的表达替代。参见图2，该图图示了HC-NHEJ策略。HC-NHEJ供体的插入导致大小从约15.7kb(野生型FibH基因)到约16kb(HC-NHEJ供体的连接产物)的转换。13kb的基因盒，包含具有eGFP的NTD、MaSp1-8重复或MiSp1-8重复、DsRed和CTD，可以在内源FibH启动子下表达。

基因盒的CTD包含来自原始FibH基因组的终止码(stop code)。如通过巢式PCR和测序所揭示的，G₀ HCA转基因蚕的基因组插入了HC-NHEJ供体。水平箭头指示用于基因组：接合测试的引物。如所示的，左侧基因组：接合测试序列为SEQ ID NO:33；右侧基因组：接合测试序列为SEQ ID NO:34。下表4示出了用于转基因蚕蛾的基因组：接合测试的另外的引物。表4中列出的序列是SEQ ID NO:35-42，按顺序列在该表的第一行到最后一行。

表4.

5’基因组：接合被精确鉴定(左侧基因组：接合测试)，而在3’接合：基因组进行的非精确的末端修复，导致一些序列异质性，这是无足轻重的，因为它将被切除(右侧基因组：接合)。这些结果指示，HC-NHEJ供体被成功地整合到转基因蚕中FibH的限定基因座处。因此，相对大的合成蜘蛛丝蛋白基因(MaSp1或MiSp1，～10kb)被整合到蚕FibH的基因组的特定位点，这在基于转座子的piggyBac系统的随机整合情况下是不可能的。

pBluescript II SK(+)载体的原始启动子仅能用于在大肠杆菌中运行质粒扩增，而不能用于转基因蚕中的基因表达。MaSp1或MiSp1基因的侧翼为5’和3’调节元件和蛋白质序列(在下文为5’末端和3’末端)。5’末端区域包含FibH基因的内含子1/外显子2的一部分和用于检测的增强型绿色荧光蛋白eGFP基因。3’末端区域包含FibH基因的外显子2的3’末端的一部分和终止密码子。在MaSp1和MiSp1基因之后立即添加红色荧光DsRed基因，以追踪全长合成蜘蛛丝基因的表达。只要优化的CRISPR/Cas9在FibH的内含子和HC-NHEJ载体两者中产生DSB，线性载体就可以通过NHEJ连接到FibH的同一DSB位点，导致完整HC-NHEJ载体的插入。NHEJ的易错机制修复了优化的蚕特异性CRISPR/Cas9系统的DSB，因此，gRNA不能识别它们在转基因蚕的FibH基因组中的靶位点。用含有MaSp1基因的供体载体转化的转基因蚕被指定为HCA组，而用含有MiSp1基因的供体载体转化的转基因蚕被指定为HCI组。

与其中仅靶外源基因可以通过同源臂结合至特定位点的同源重组机制不同，包含pBluescript II SK(+)的骨架的HC-NHEJ供体的完整质粒可以通过NHEJ插入到丝心蛋白重链中。由于在构建HC-NHEJ供体时掺入了3’终止密码子，插入的骨架不能被表达。包含FibHN末端的一部分、eGFP、蜘蛛丝基因、DsRed和FibH的C末端的基因盒在内源FibH启动子下完整表达。

转基因蚕的分离。

使用纯种蚕品系(滞育品系，Haoyue)用于转化，因为它具有白色茧和高丝产量，这有利于检测转基因茧中加eGFP标签的和加DsRed标签的蜘蛛丝蛋白。显微注射传统上被用作用于转化家蚕胚胎的标准方法。此方法具有难以克服的缺陷，诸如高成本、低存活率、费时且耗力以及技术要求苛刻的操作。此外，显微注射仅可以应用于非滞育蚕卵。作为替代，电穿孔由于其方便和高效而被用来减少所需的时间和劳动。电穿孔具有一些缺点，诸如低转化率和需要针对不同物种建立合适的电脉冲参数(电压、时间、频率、时间间隔和介质组成)。然而，一旦这些参数被优化和建立，可将外源DNA容易地递送到家蚕胚胎中。

电穿孔设备、CUY21EDIT体内方波电穿孔仪和CUY495P10室购自

Limited。在纯种蛾(Haoyue)产卵后1h-2h内收集新鲜卵。电穿孔程序如下。a)通过将ddH₂O(385μl)、2％PVP(聚乙烯吡咯烷酮)溶液(250μl)、10％吐温20(15μl)、0.1M亚精胺溶液(50μl)、DNA质粒溶液(100μl，1.0μg/μl)添加到1.5ml Eppendorf管中并充分混合在一起；然后添加100ul 2.5M CaCl₂，再次充分混合来制备电穿孔缓冲液(EP缓冲液)；b)在2h-3h内收集并短暂洗涤孵出的蚕卵；c)将卵(500个-1000个卵)放置在9cm培养皿中的EP缓冲液中；d)通过将具有卵的培养皿放置在冰上于真空室中持续10min-20min在减压下处理蚕卵；e)通过以下对冰上的卵运行电穿孔：将卵放置在电穿孔室中，将1ml EP缓冲液添加到电穿孔室中(在电穿孔之前，通过将卵放置在该室内，于冰上2分钟来冷却卵)，并且在15V、50ms(脉冲)、75ms(间隔)下运行电穿孔，10-20次重复，然后将卵留在室内于冰上10min-20min以使卵冷却；f)将卵放置在冰上并将其留置至少1h；g)然后将卵放置在具有7cm直径的纸的9cm培养皿中；以及h)将它们留置在暗室中于25℃进行孵化。

在与非转基因组相同的条件下培育电穿孔的家蚕胚胎，直到结茧。转基因蚕茧的复合蚕/蜘蛛纤维由于eGFP和DsRed蛋白的存在发射绿色和红色荧光，指示整个基因构建体被插入。

图3图示出了茧中复合蚕/蜘蛛/EGFP蛋白的表达。A：对照组(非转基因)的蚕茧纤维；B：G₀ HCA组的蚕茧纤维。A-1和B-1：绿色荧光；A-2和B-2：红色荧光；A-3和B-3：可见光；A-4和B-4：可见光、绿色荧光和红色荧光的合并图像。通过转基因蚕茧中的绿色荧光确定的转基因比例从10％-30％变化。

反向PCR和接合序列。

当蚕到达蛾阶段时，在产卵后提取G₀转基因蛾的基因组。

基因组DNA使用E.Z.N.A^TM昆虫DNA分离试剂盒(Omega Bio-Tek，C0926-01)从G₀/G₁转基因蛾提取。DNA用Sau3AI(NEB，R0169S)消化，并且通过在16℃连接30min使DNA环化。使用表4中报告的所设计的引物扩增3’末端基因组和5’末端基因组：转基因接合序列。第一轮PCR扩增用

高保真2X PCR主混合物(NEB，M0541S)进行，而第二轮PCR使用TaqPCR主混合物试剂盒(Qiagen，编号201443)对从第一轮扩增通过凝胶提取纯化的PCR产物进行。扩增的片段经凝胶纯化(Qiagen，编号28704)并且将其克隆到

简易载体系统(Promega，A3600)中用于测序。测序数据使用美国国家生物技术信息中心(NationalCenter for Biotechnology Information,NCBI)的Blast进行分析。

测序数据示出，5’接合处的NHEJ等位基因被精确地修复。参见图1。在另一方面，非精确末端修复在3’接合处是明显的。同上。幸运的是，这不影响构建体的表达。根据这些结果，确定了加eGFP标签的和加DsRed标签的复合蚕/蜘蛛丝蛋白基因存在于转基因蚕腺体中，并且HC-NHEJ供体片段已经插入到FibH基因的内含子中的期望位置。同上。

对复合丝蛋白的分析。

在5个幼虫阶段的第3个阶段解剖G₀和G₁成年蚕。移除腺体，将其用1×PBS处理，并且然后进行-80℃储存。将中间腺体蛋白在2×SDS裂解缓冲液(3％SDS、6M尿素、40mM二硫苏糖醇、10％w/v甘油、0.01％溴酚蓝和62.5mM Tris-HCl pH 6.8)中均质化，在100℃煮沸15min-20min，装载到4％-20％梯度凝胶(Thermo，Scientific)上，并且在100V运行1.5h。在凝胶分离(Bio-Rad)后，通过使用Tris-甘氨酸甲醇缓冲液(对于1L缓冲液，3.0g Tris、14.4g甘氨酸和200ml甲醇)，将蛋白质转移到

转移膜(Emd Millipore，IPVH00010)，45V，过夜。一级抗体是商业eGFP特异性抗体(Thermo scientific，MA1-952)和dsRed2抗体(Santa

Biotechnology，sc-101529)。二级抗体是抗小鼠IgG(H+L)HRP缀合物(Promega，W4021)。将所有抗体在封闭缓冲液(具有5％脱脂奶粉的1×TBST)中稀释。抗体-抗原反应使用一步超TMB印迹溶液(Pierce，Thermo scientific)进行。G₁ HCI组的转基因确认以与HCA组相同的方式使用PCR和蛋白印迹分析进行。

从非转基因组或两个转基因组(G₀ HCA和G₁ HCI)的中间丝腺提取的蛋白质进行免疫印迹以使用抗eGFP或抗DsRed抗体检测eGFP和DsRed蛋白，以确定蜘蛛丝蛋白MaSp1和MiSp1的存在。图4图示出了转基因蚕腺体蛋白的SDS-PAGE考马斯染色和蛋白印迹。[A和B：考马斯亮蓝染色；C：用抗eGFP作为一级抗体的蛋白印迹；D：用抗DsRed作为一级抗体的蛋白印迹；M：蛋白梯度；泳道C：对照，非转基因蚕腺体；泳道1和1’：G₀ HCA组的右中侧腺体；泳道2和2’：G₁ HCI组的左中侧腺体]。

SDS-PAGE凝胶的考马斯亮蓝染色证明，在G₁ HCI组的转基因丝腺中存在MiSp1(～350kDa)。MaSp1或MiSp1用eGFP和DsRed两者加标签。阳性条带指示这两种蛋白都存在于G₀HCA组和G₁ HCI组中。参见图4C(泳道1和泳道2)。红色荧光蛋白DsRed基因位于外源合成蜘蛛基因MaSp1或MiSp1的下游，以指示构建体的完全表达。参见图4D(泳道1’和泳道2’)。

这些结果示出，G₁ HCI组中HC-NHEJ供体被插入在与G₀ HCA组的HC-NHEJ供体相同的靶位点。参见图4A(泳道2)和图4B(泳道2’)。MaSp1更难溶剂化，并且因此在G₀ HCA组的丝腺中未被考马斯染色检测到，因为该技术不如蛋白印迹染色灵敏。参见图4A(泳道1)和图4B(泳道1’)。

对转基因蚕mRNA的cDNA中的DsRed检测。

在第3个幼虫阶段解剖转基因蚕。移除腺体并且用1×PBS(pH 7.4)洗涤。在使用滤纸吸收过量的水分后，将腺体储存在-80℃。转基因腺体的mRNA按照制造商对RNA/DNA/蛋白质分离试剂(TRI试剂，编号TR 118/50)的说明提取，并且然后将其通过使用转录高保真cDNA合成试剂盒(Roche，编号05081955001)逆转录成其互补DNA(cDNA)。通过使用cDNA作为模板，使用2×PCR主混合物(Qiagen，编号201443)用设计的引物(表5)进行第一次和第二次PCR。在凝胶纯化(Qiagen，编号28704)后，将PCR产物克隆到

简易载体(Promega，A3600)中用于测序。使用NCBI Blast分析测序数据。所有实验在具有蚕腺体的对照(非转基因)样品的情况下进行。

逆转录PCR(RT-PCR)结果还示出，DsRed基因存在于转基因蚕腺体的互补DNA(cDNA)中。参见表5，图示出了用于在转基因蛾的基因组中检测DsRed的引物。表5中列出的序列是SEQ ID NO:43-48，按顺序列在该表的第一行到最后一行。

表5.

这些结果示出，合成蜘蛛丝蛋白MaSp1和MiSp1在内源FibH启动子下完全表达。此外，该数据指示这些基因被下一代转基因蚕遗传。

复合丝纤维的机械性质。

为了进一步研究复合蚕/蜘蛛纤维的机械性质，将转基因蛾的G₁ HCI子代在与其母本相同的环境和饮食条件下培育以产生丝。测试了非转基因纤维和复合蚕/蜘蛛纤维在相同的环境条件(22℃-25℃和40％相对湿度)下的机械性质。

将转基因茧纤维和对照(非转基因)茧纤维在85℃脱胶(0.05％碳酸氢钠、0.05％SDS和0.01％碳酸钠溶液)30min-45min(重量/体积＝1:50)，直到丝变得透明。然后将脱胶的纤维使用相同材料:溶剂比用温水(50℃-60°℃)冲洗两次。将脱胶的纤维在室温干燥过夜。将各纤维轻轻分开，以避免拉伸和变形，并且然后附接到“C”形卡上。标距长度为19.1mm，并且每根纤维的直径通过用Motic Optical 5A310光学显微镜和Motic ImagesPlus 2.0软件测量9次的平均值来确定。然后将每个具有附接的纤维的“C”卡装载到配备有50N测力传感器和定制的10g测力传感器(Transducer Techniques)两者的MTS Synergie100(MTS Systems)上，用于机械测试。使用

4软件，通过以5mm/min的速度拉动纤维，以120Hz的数据采集速率，对附接的纤维进行单轴测试，直到纤维断裂。所有测试在环境条件(20℃-22℃和20％-26％湿度)进行。然后输出数据，并且使用Microsoft Excel进一步分析该数据。

图5图示出了脱胶的天然丝纤维和转基因丝纤维的机械性质[对照：非转基因组(n＝57)；G₀ HCA组：HCA组的第一代(用MaSp1转化的蚕)，包括HCA-2(n＝35)和HCA-3(n＝35)；G₁ HCI组：HCI组的第二代(用MiSp1转化的蚕)(n＝17)]。SD＝标准偏差。在同等条件下测试了来自天然蚕和转基因蚕的丝纤维。

表6图示出了与G₀对照组相比，G₀ HCA组和G₁ HCI组的转基因纤维的机械性质。

表6.

表7是使用标准双尾T检验比较转基因纤维的机械性质的表。

表7.

*P＜0.05被认为显著，**P＜0.01

这些结果证明，G₀ HCA组(G₀ HCA2和G₀ HCA3系)的复合蚕/蜘蛛丝纤维比非转基因纤维更坚韧。参见图5以及上表6和表7。

G₀ HCA2和G₀ HCA3的平均最大应力值为650MPa和628MPa(分别增加27.3％和22.9％)，高于511MPa的非转基因组值。参见图5A和表6。G₁ HCI组中复合蚕/蜘蛛纤维的平均最大应力为667MPa，示出比对照增加30.6％。同上。G₀ HCA2组和G₀ HCA3组的平均最大应变相比于对照组的20.5％存在增加，其平均最大应变分别为25.7％和23.6％。相比之下，G₁HCI组具有仅13.5％的平均最大应变。转基因纤维和非转基因纤维之间在最大应力和最大应变方面的比较是统计学显著的(P<0.001)，G₀ HCA3的最大应变除外。参见图5和表7。当G₀HCA组的最大应变增加时，弹性模量从非转基因组的8.73GPa略微下降到G₀ HCA2的7.92GPa和G₀ HCA3的7.6GPa。图5C。在另一方面，G₁ HCI组具有降低的最大应变，并且弹性模量统计学显著地增加到15.24GPa。

G₀ HCA2(107.93MJ/m³)和G₀ HCA3(102.92MJ/m³)的复合蚕/蜘蛛纤维的韧度(断裂能)高于非转基因组(77.29MJ/m³)，而G₁ HCI组(59.77MJ/m³)的韧度下降。参见图5D和表6。当进行拉伸测试时，G₀ HCA组和G₁ HCI组的复合蚕/蜘蛛纤维的机械性质均强于非转基因纤维的中值。图6示出了来自对照(非转基因)组(n＝57)和三个转基因组：G₀ HCA-2(n＝35)、G₀HCA-3(n＝35)和G₁ HCI(n＝17)的脱胶的丝纤维的机械性质(应力对应变)。该图示出了各组的丝纤维的基于最大应力的机械性质。1：绿色，G₀非转基因纤维(对照)，492.4MPa；2和5：蓝色，G₀ HCA组(HCA-3)的复合蚕/蜘蛛丝纤维的中值和最佳值，分别为661.5Mpa和916.93Mpa；3和6：红色，G₀ HCA组(HCA-2)的复合蚕/蜘蛛丝纤维的中值和最佳值，分别为628.8Mpa和913.03Mpa；4和7：紫色，G₁ HCI组的复合蚕/蜘蛛丝纤维的中值和最佳值，610.9MPa和921.08MPa。

G₀ HCA组和G₁ HCI组都具有最大应力值超过900MPa的复合蚕/蜘蛛纤维(图6)，其几乎与天然蜘蛛丝的应力匹配。

腺体内容物的FTIR-ATR光谱表征。

对腺体中丝的二级蛋白质结构进行傅里叶变换红外光谱分析。对于所有测量使用Varian 660-IR仪器，该仪器带有包含ZnSe晶体的水平单反射Pike Technologies MIRacle衰减全反射(ATR)模块。在产生任何光谱之前，获得合适的背景光谱。对照组和转基因组两者的新鲜中间腺体在被从蚕体切下后立即进行分析。从中间腺体的后端(后段(MP))开始将每个腺体切割成切片，持续到中间腺体的前端(前段(MA))。然后在垂直于腺体内腔的位置对这些切片进行FTIR-ATR测量。在进行任何读数之前，轻轻夹下每个样品，并且在进行下一切片之前，将残留的水分完全擦去并清洁。对于所有测量使用被开发为具有ResolutionPro Version 5.1.0.822的方法，该方法对在1000cm^-1至2000cm^-1的范围内20次扫描取平均值，分辨率为1cm^-1且孔径设置为4cm^-1至4000cm^-1。

对来自非转基因组和G₀ HCA转基因组两者的蚕的中间腺体的光谱分析揭示了相似的和对比鲜明的趋势，如图7所示，该图示出了在不同腺体中测量的蛋白质物质的FTIR光谱[(A)对来自非转基因腺体(下曲线(plot)，绿色)和形态正常的转基因腺体(上曲线，红色)的前部区段的比较。(B)来自非转基因腺体(下曲线，绿色)和转基因腺体(13HCA转基因，中曲线，红色；8HCA转基因，上曲线，红色)的中间区段的比较。(C)在非转基因腺体中，沿腺体从后部(下曲线)区段到中间(中曲线)区段到前部(上曲线)区段的二级结构的形成。(D)在转基因腺体中，沿腺体从后部(下曲线)到中间(中曲线)到前部(上曲线)的二级结构的形成]。

当将转基因腺体材料的二级结构布置与非转基因蚕的二级结构布置进行比较时，这些布置高度相似。两者都包含无定形和螺旋结构以及β-片层，这是所有丝蛋白的明确标志。虽然存在的二级结构相当相似，但非转基因组和G₀ HCA组之间存在微小差异。与非转基因组相比，最显著的差异是转基因腺体在Amide II区域周围具有增加的信号水平，并且具有增加的向富含β-片层的结构或构象的转移，如图7A和图7B所示。这些趋势可以通过蜘蛛丝蛋白的存在来解释，蜘蛛丝蛋白由于其通常有助于这样的二级结构的一级序列和基序而导致所观察到的现象。

最后，丝蛋白的组织和更有序的结构从非转基因样本到转基因样本也被保存。从两组的后腺体提取的蛋白质样品的FTIR-ATR光谱表现得相当相似，并且缺乏任何主导性的顺序或结构。在沿导管内腔更远的点，可以在蛋白质结构中看到更有序的结构并且β结构的形成增加，如图7C和图7D所示。这对于示出显著增加的转基因样品尤其如此。当到达导管的前端并且纤维形成开始时，明显地存在二级结构的增加。当与其他可能的结构相比时，丝的特征性β-片层变得更明显。两组蚕都展示了此行为，但在转基因样品中更明显(图7D)，这可能是由于在形成期间蜘蛛丝蛋白的存在。总之，两组都存在这些性质和结构，但是转基因样品的结构由于包含蜘蛛丝蛋白呈现出轻微改变，富含β-片层的构象更多。

图8图示出了显示G₀ HCA组和G₁ HCI组两者中的复合蚕/蜘蛛丝纤维的二级结构的示意模型。[A：合成蜘蛛丝蛋白MaSp1的氨基酸序列[SEQ ID NO:49]；B：家蚕重链的氨基酸序列[SEQ ID NO:50]；C：合成蜘蛛丝蛋白MiSp1的氨基酸序列[SEQ ID NO:51]；D：MaSp1的二级结构，包含3₁₀-螺旋和β-片层；E：家蚕重链的二级结构，包含β-片层；F：MiSp1的二级结构，包含3₁₀-螺旋和β-片层；G：G₀ HCA组的复合蚕/蜘蛛丝纤维的二级结构；H：G₁ HCI组的复合蚕/蜘蛛丝纤维的二级结构]。

所公开的方法相对于现有技术具有几个优点。首先，所公开的方法首次成功使用内源FibH启动子驱动大的(例如，大于3kb、大于5kb等)外源合成蜘蛛丝基因的表达，这与基于构建具有外源启动子的表达盒的其他设计方法显著不同。

其次，所公开的方法首次证明了与已表征的天然拖丝蛋白基因(>9kb)相似的大的合成蜘蛛丝基因(～10kb)被掺入到蚕的FibH基因组中。包含合成蜘蛛丝蛋白基因(蛋白大小～300kDa)的相对大的基因盒已经在转基因蚕的丝腺中成功地完整表达。先前的工作人员已经成功地在基于piggyBac的转基因蚕中表达了较小的约120kDa的合成蜘蛛丝蛋白。

第三，转基因蚕的G₀代和G₁代两者的复合蚕/蜘蛛丝纤维发射绿色荧光和红色荧光，指示转基因蚕的遗传是稳定且可靠的。基因组接合测试结果示出，通过优化的蚕特异性CRISPR/Cas9系统触发的NHEJ，合成蜘蛛丝基因已经被整合到转基因蚕的G₀代和G₁代两者的基因组中FibH的预期位点。

第四，与对照蚕丝纤维相比，G₀ HCA组和G₁ HCI组的复合蚕/蜘蛛丝纤维都显示出改善的机械性质。富含β-片层((GA)_n,A_n)和3₁₀-螺旋(GGX)的合成蜘蛛丝蛋白MaSp1和MiSp1掺入在复合蚕/蜘蛛丝纤维中(图8)。天然蚕丝纤维中不存在形成螺旋结构的重复氨基酸区域。β-片层和3₁₀-螺旋的组合增加了G₀ HCA组的复合蚕/蜘蛛丝纤维的最大应力和应变两者(图5)。MaSp1和MiSp1之间的氨基酸的组成差异使得每个转基因组(G₀ HCA组和G₁ HCI组)的复合蚕/蜘蛛丝纤维具有不同的机械性能(图5)。

实施例2.FibL内含子中的蜘蛛丝转基因。

为了改善转基因蚕/蜘蛛纤维的机械性质，通过CRIPSR/Cas9引发的非同源末端连接(NHEJ)，将合成蜘蛛丝MaSp1(172kDa)基因整合在蚕的丝心蛋白轻链(FibL)的遗传基因座。使用优化的CRISPR/Cas9系统在丝心蛋白轻链基因的第六内含子处产生双链断裂(DSB)。外源蜘蛛丝蛋白MaSp1在内源FibL增强子和启动子的控制下完全表达。所得到的转基因蚕/蜘蛛纤维在第一代和第二代(G₁)都显示出优异的机械性质，指示转基因蚕的遗传稳定性。

CRISPR/Cas9系统的设计。

两个gRNA(g5和g6)被设计成靶向蚕腺体的丝心蛋白轻链(FibL)的第6内含子(表8)，示出了LC-NHEJ项目中的gRNA靶位点。在蚕特异性U6(sU6)启动子的控制下，经由GibsonAssembly将gRNA亚克隆到

简易载体中。产生CRISPR/Cas9系统的表达载体(

和pIEx^TM-1-eGFP-cas9)。g5(SEQ ID NO:52)和g6(SEQ ID NO:53)的合成序列在表8中示出。

表8.

轻链非同源末端连接供体(LC-NHEJ供体)。

图9是具有合成蜘蛛丝基因MaSp1的工程化丝心蛋白轻链的示意图。LC：丝心蛋白轻链；LC-NTD：丝心蛋白轻链的N末端(M76430.1:13461-14090)；LC-CTD：丝心蛋白轻链的C末端(M76430.1:14091-14600)；HC-N：丝心蛋白重链的N末端；HC-M：丝心蛋白重链的重复区域；HC-C：丝心蛋白重链的C末端。MaSp1：合成蜘蛛丝基因(MaSp1-6次)。

图9示出了被靶向用于LC-NHEJ供体构建的FibL的N末端区域和C末端区域。在构建LC-NHEJ供体时，FibL的N末端区域(LC-NTD)包含侧翼为第五外显子和第七外显子的一部分的整个第六内含子。FibL的C末端区域(LC-CTD)包含完整的第7外显子和FibL的终止密码子。

下表9示出了用于构建LC-NHEJ供体的引物。表9中的引物具有SEQ ID NO:54-59，从上至下列在该表中。

表9.

图10示出了本文使用的LC-NHEJ策略的示意图。两个gRNA靶向丝心蛋白轻链的第6内含子。NTD和CTD最初从丝心蛋白轻链基因扩增，然后克隆到pBlueScriptII中。eGFP和合成蜘蛛丝基因(MaSp1-6次)也相继克隆到pBlueScriptII中。在FibL基因组的第6内含子中产生DSB后，将LC-NHEJ供体的整个区段连接到丝心蛋白轻链中。表8中标识的g5序列在左侧用红色加下划线示出(SEQ ID NO:52)，并且g6序列在右侧用棕色加下划线示出(SEQ IDNO:53)。图10中列出的完整序列是SEQ ID NO:60。

将MaSp1-6(具有六个重复)的基因片段用HindIII和BamHI(NEB)克隆到pBluescript SK(+)中，以产生pSK-MASP1(6)。将蚕FibL的来自FibL第6内含子/第7外显子的一部分的N末端区域(NTD)亚克隆到pSK-MASP1(6)中(使用KpnI和SalI位点)，以形成pSK-NTD-MASP1(6)载体。使用SalI和HindIII位点将增强型绿色荧光蛋白基因(eGFP)克隆在NTD附近，以产生pSK-NTD-eGFP-MASP1(6)。蚕FibL的C末端区域(CTD)包含第7外显子的一部分和几乎所有的C末端非编码区域。将其亚克隆到CTD的BamHI和SacI位点，以产生最终的LC-NHEJ供体，pSK-NTD-eGFP-MASP1(6)-CTD。

cas9的编码区域由pIE-1载体中的hr5增强子和IE1启动子驱动，以确保cas9在BmN细胞和蚕中良好表达。对蚕特异性的U6启动子(sU6)用于驱动FibL gRNA(g5和g6)的表达。为了排除NHEJ易错修复的影响，选择FibL的第六内含子作为gRNA特异性靶位点(图9)。因此，LC-NHEJ供体构建体的基因转录和蛋白质表达不受FibL的第六内含子的诱变的影响，因为该内含子将被剪接掉。

线性穿梭载体，LC-NHEJ构建体，可以通过NHEJ插入到FibL的DSB处(图10)。用MaSp1-6重复转化的转基因蚕被命名为LCA6。增强型绿色荧光eGFP基因被用作追踪LC-NHEJ构建体的表达的指示物。参见图10。没有外源FibL增强子或启动子被添加到LC-NHEJ供体的构建体中，因此转基因盒仅能由内源FibL增强子和启动子表达。选择pBlueScriptII载体以使构建体穿梭，因为其原始增强子或启动子在BmN细胞和蚕的基因组中没有功能。值得注意的是，gRNA靶位点，第六内含子，被构建到LC-NHEJ供体中。因此，优化的蚕特异性CRISPR/Cas9系统可以在FibL基因组和LC-NHEJ构建体两者中的限定基因座处产生DSB。

转基因蚕的鉴定。

将成熟蚕特异性CRISPR/Cas9系统和LC-NHEJ供体通过电穿孔递送到新鲜蚕卵(产卵后1h-2h)中，如本文在实施例1描述的。(蚕品系：Haoyue)。优化的CRISPR/Cas9系统和LC-NHEJ供体的载体通过midi/maxi-preps(QIAGEN)制备。

G₀(第一代)转基因蠕虫用煮熟的桑食物喂养，直到第5幼虫阶段的最后一天。内有蛹的转基因G₀茧在UV光的激发下发射绿色荧光。培育来自转基因茧的这些G₀转基因蛾，以便产下G₁(第二代)转基因卵。将孵化的G₁转基因蠕虫在与母本相同的条件下在特定的光照(12小时光照对12小时黑暗)和湿度(60％-80％)条件的室中培育以纺制G₁转基因蚕茧。图11图示出了转基因蚕/蜘蛛纤维在共聚焦显微术期间在激发后发射绿色荧光[A：对照，非转基因蚕纤维；B：LCA6转基因蚕/蜘蛛纤维；A-1和B-1：绿色荧光；A-2和B-2：自然光；A-3和B-3：绿色荧光和自然光的组合；A-4和B-4：空白]。图12是示出转基因蛾的基因组中eGFP表达的蛋白印迹[1、2、3和5：LCA6的转基因蛾的基因组样品；M：基因标尺1kb加DNA梯度]。在产卵后的G₁转基因蛾的基因组中检测到绿色荧光蛋白eGFP基因(图12)。

转基因蚕蛾中的基因组：接合测试。

下表10示出了用于基因组：接合测试的引物。表10中的引物具有SEQ ID NO:61-68，按顺序从上至下列于该表中。

表10.

基因组DNA使用E.Z.N.A^TM Insect DNA分离试剂盒(Omega Bio-Tek，C0926-01)从G₁(第二代)转基因蛾提取。使用设计的引物扩增3’-和5’-末端基因组：转基因接合序列。第一PCR用

高保真2X PCR主混合物(NEB)进行，并且在通过凝胶提取(Qiagen)纯化第一次PCR产物之后，第二PCR使用Taq PCR主混合物试剂盒(Qiagen)进行。扩增的片段经凝胶纯化(Qiagen)并克隆到

简易载体系统用于测序(Promega)。使用NCBIBlast程序分析测序数据。

图13图示出了对转基因蛾中的左侧基因组：接合的检测[1：LCA6的左侧接合PCR产物；M：基因标尺1kb加DNA梯度]。图14图示出了对转基因蛾中的右侧基因组：接合的检测[1、2、3和5：LCA6的转基因蛾的基因组样品；M：基因标尺1kb加DNA梯度]。

对左侧和右侧基因组：接合的PCR研究示出，LC-NHEJ构建体已经成功地插入转基因蛾的基因组中的预期的FibL基因座。(图13和图14)。这些结果指示，加eGFP标签的合成蜘蛛丝蛋白MaSp1基因已经成功地掺入FibL靶位点，并且在内源FibL增强子和启动子的控制下从G₀稳定地遗传到G₁。

对转基因蚕/蜘蛛蛋白的定性检测.

在第五幼虫阶段的第三天解剖成年蚕以移除它们的丝腺。腺体用1×PBS处理，并且然后储存在-80℃。将中间腺体蛋白用2×SDS裂解缓冲液(3％SDS、6M尿素、40mM二硫苏糖醇、10％w/v甘油、0.01％溴酚蓝、62.5mM Tris-HCl pH 6.8)均质化，在95℃煮沸15min-20min，并装载到4％-20％梯度凝胶(Thermo)上，100V，1.5h。在凝胶分离(Bio-Rad)后，将蛋白转移到PVDF膜。一级抗体是商业eGFP特异性抗体(Thermo Scientific，目录#:MA1-952)和dsRed2抗体(Santa

Biotechnology，sc-101529)。二级抗体是抗小鼠IgG(H+L)HRP缀合物(Promega，W4021)。根据制造商的说明，将所有抗体在封闭缓冲液(具有5％脱脂奶粉的1×TBST)中稀释。抗体-抗原反应用一步超TMB印迹溶液(Pierce，Thermo Scientifi)进行。

图15示出了考马斯亮蓝染色的凝胶和蛋白印迹结果[A：考马斯亮蓝染色的凝胶；B：蛋白印迹。M：蛋白标志物；1和1’：阴性对照；2、2’和3、3’：LCA6的转基因丝腺；4和4’：非转基因丝腺。箭头示出了抗eGFP阳性条带，指示LCA6中存在合成蜘蛛丝蛋白MaSp1]。

用eGFP加标签的合成蜘蛛丝蛋白MaSp1在考马斯亮蓝染色的SDS-PAGE中示出不明显的条带(图15，泳道1和2)；然而，在蛋白印迹中，使用抗eGFP一级抗体鉴定到蛋白质(图15，泳道1’和2’)。这证明合成蜘蛛蛋白MaSp1成功地插入丝心蛋白轻链中，以形成分子量为约130kDa的嵌合蚕/蜘蛛蛋白(图15)。60kDa的较强条带是由于溶解过程期间出现的翻译停顿或蜘蛛丝蛋白MaSp1裂解。

对丝纤维的机械测试和分析。

转基因蚕/蜘蛛丝纤维的机械性质以与本文的实施例1相似的方式测试。

将转基因蚕/蜘蛛丝纤维(G₁ LCA6组中)在脱胶后在与对照非转基因组相同的测试条件(22℃-25℃和40％湿度)下通过机械测试来分析。图16图示出了LCA6组的第二代的转基因蚕/蜘蛛丝纤维的机械性质[对照：非转基因组n＝57；LCA6：具有MaSp1-6的转基因蚕/蜘蛛丝纤维的第二代(n＝26)，**P<0.001]。

下表11报告了示出LCA6组的转基因蚕/蜘蛛纤维的机械性能的数据。

表11.

应力与应变的结果示出，转基因蚕/蜘蛛丝纤维具有比对照组的纤维更好的机械性质(图16A、图16B、图16C和图16D和表11)。转基因蚕/蜘蛛丝纤维的平均最大应力为781.45MPa，比对照纤维的510.99MPa高50％以上(图16A和表11)。转基因蚕/蜘蛛丝纤维的平均弹性模量为15.95GPa，比对照纤维的8.73GPa高约83％(图16C和表11)。转基因蚕/蜘蛛丝纤维的平均断裂能为105.97Mj/m³，比对照纤维的77.29MJ/m³高约37％。这证明G₁ LCA6组的转基因蚕/蜘蛛丝纤维比对照纤维强韧得多。

图17图示出了LCA6组和对照组的脱胶的转基因蚕/蜘蛛丝纤维的机械性质的应力对应变[1：对照(非转基因)纤维，489MPa；2：来自LCA6组第二代的转基因蚕/蜘蛛丝的中值，776MPa；3和4：来自LCA6组第二代的转基因蚕/蜘蛛丝的伸长强度和抗拉强度的最佳值，分别为1204MPa和1475MPa；5：天然蜘蛛牵丝(络新妇蛛)，1375MPa，n＝26]。

转基因蚕/蜘蛛丝纤维的最大应力值为1204MPa和1475MPa。这些机械性质接近或优于天然蜘蛛牵丝(络新妇蛛)最大应力为1375MPa的值(在与转基因蚕/蜘蛛丝纤维相同的测试条件下收集的数据)(图17)。

图18是显示G₁ LCA组的复合蚕/蜘蛛丝纤维的形成的示意模型。家蚕轻链为SEQID NO:69，并且络新妇蛛MaSp1蛋白序列为SEQ ID NO:70。如本公开内容中提供的，通过CRISPR/Cas9引发的非同源末端连接，将合成蜘蛛壶状丝基因MaSp1掺入蚕的丝心蛋白轻链中。供体质粒(LC-NHEJ载体)具有MaSp1和eGFP，它们的侧翼是丝心蛋白轻链的一部分作为N末端/C末端。转基因蚕表达蜘蛛壶状牵丝蛋白，并且作为丝心蛋白轻链蛋白的一部分。

转基因蚕/蜘蛛纤维在应力应变测试中示出优异的机械性能。由于蜘蛛丝蛋白MaSp1在转基因蚕/蜘蛛纤维的FibL中的整合，LCA6组的平均最大应力比对照组高约50％。最佳的转基因蚕/蜘蛛纤维具有与天然蜘蛛牵丝纤维相似的机械性质。蜘蛛丝蛋白MaSp1富含β-片层，这导致转基因蚕/蜘蛛纤维的最大应力和弹性模量增加。MaSp1还具有二级结构Gly-II-螺旋，其可以改善应变。因此，令人惊讶的是，转基因蚕/蜘蛛纤维的平均最大应变与对照组的平均最大应变相似。不希望受任何特定理论的束缚，原因可能是因为蚕丝纤维的应变主要取决于占优势的蛋白质丝心蛋白重链的构象。这得到重链非同源末端连接(HC-NHEJ)的转基因蚕/蜘蛛纤维的机械性质支持(实施例1)，其示出了相似的模式。在转基因蚕/蜘蛛纤维中，原始重链的一部分被合成蜘蛛丝蛋白MaSp1或MiSp1替代。由于MaSp1或MiSp1中二级结构β-片层和3₁₀-螺旋的组合，HC-NHEJ(实施例1)中转基因蚕/蜘蛛纤维的最大应力和应变均增加。

与MiSp1相比，MaSp1组合了更长的3₁₀-螺旋，这使HCA组中的最大应变与HCI组中的最大应变相比增加。蜘蛛丝蛋白MaSp1和MiSp1中的氨基酸的排列与蚕丝的天然丝心蛋白重链的排列相似，这允许它们被整合到丝纤维中而没有大的断裂。

在轻链非同源末端连接(LC-NHEJ)实验(实施例2)中，蜘蛛丝蛋白MaSp1的更多β-片层被整合到丝心蛋白轻链中，而转基因蚕中的丝心蛋白重链没有变化。此外，将MaSp1的3₁₀-螺旋掺入LCA6组的转基因蚕/蜘蛛纤维中，其中在原始蚕丝中不存在3₁₀-螺旋。在HC-NHEJ实验(实施例1)中，原始重链的β-片层被具有蜘蛛丝蛋白MaSp1和MiSp1的二级结构β-片层和3₁₀-螺旋的蜘蛛丝蛋白替代。总之，LCA6组的转基因蚕/蜘蛛纤维的机械性质优于HCA组或HCI组中的。G1 LCA6组的平均最大应力为约800MPa，比G₀ HCA组和G₁ HCI组(分别为650MPa和667MPa)提高了20％。这表明转基因蚕/蜘蛛蛋白纤维的机械性质可以通过蜘蛛丝蛋白提供的增加的β-片层和3₁₀-螺旋来改善。

FibL基因中的选择性剪接也可以导致整合的蜘蛛丝基因MaSp1的表达模式不同。它还可以改变转基因蚕/蜘蛛纤维的蛋白质构象，蛋白质构象影响它们的机械性质。如上文提及的，丝心蛋白轻链具有七个外显子，而丝心蛋白重链在蚕基因组中仅具有两个外显子。在LC-NHEJ项目中，蜘蛛丝基因MaSp1被整合在FibL基因的第七外显子处，这使得MaSp1融合在FibL基因的C末端。无论转基因蚕基因组的FibL基因中发生哪种选择性剪接，都应始终表达与MaSp1融合的C末端外显子。然而，在HC-NHEJ项目中，具有MaSp1或MiSp1的基因盒的非同源插入产生了新的FibH C末端，而没有破坏转基因蚕基因组中的原始FibH C末端。在选择性剪接期间，无论是新的还是原始的FibH C末端都具有表达的机会，而仅具有蜘蛛丝蛋白的FibH C末端的表达才能改善转基因蚕/蜘蛛纤维的机械性质。这可以解释LC-NHEJ纤维的机械性质的增加。

陈述

1.一种转基因蚕，包含稳定整合的外源合成蜘蛛丝基因，所述外源合成蜘蛛丝基因可操作地连接至内源蚕启动子，其中所述外源蜘蛛丝基因的长度大于约3千碱基(3kb)。

2.如陈述1所述的转基因蚕，其中所述外源合成蜘蛛丝基因可操作地连接至蚕腺体中的内源蚕启动子。

3.如陈述1或2所述的转基因蚕，其中所述外源蜘蛛丝基因的长度大于约4千碱基(4kb)。

4.如陈述1或2所述的转基因蚕，其中所述外源蜘蛛丝基因的长度大于约5千碱基(5kb)。

5.如陈述1或2所述的转基因蚕，其中所述外源蜘蛛丝基因的长度为约1万碱基(10kb)。

6.如陈述1-5中任一项所述的转基因蚕，其中所述外源蜘蛛丝基因包含SEQ IDNO.25或SEQ ID NO:26或其任一个的片段。

7.如陈述1-6中任一项所述的转基因蚕，其中所述转基因蚕稳定地表达所述蜘蛛丝基因。

8.如陈述1-7中任一项所述的转基因蚕，其中所述外源合成蜘蛛丝基因被稳定地整合在丝心蛋白重链基因FibH的内含子中。

9.如陈述1-7中任一项所述的转基因蚕，其中所述外源合成蜘蛛丝基因被稳定地整合在丝心蛋白轻链基因FibL的内含子中。

10.如陈述9所述的转基因蚕，其中所述外源合成蜘蛛丝基因被稳定地整合在所述丝心蛋白轻链基因FibL的第六内含子中。

11.如陈述1-10中任一项所述的转基因蚕，其中所述内源蚕启动子是蚕特异性U6启动子。

12.如陈述1-5中任一项所述的转基因蚕，其中所述外源蜘蛛丝基因包括络新妇蛛的MaSp1基因、MaSp2基因、Ac1基因、Flag基因、Piri基因或MiSp1基因。

13.如陈述1-12中任一项所述的转基因蚕，其中所述蚕是蚕属物种(Bombyx sp.)。

14.如陈述13所述的转基因蚕，其中所述蚕是家蚕。

15.如陈述1-14中任一项所述的转基因蚕的后代蚕，其中所述外源合成蜘蛛丝基因被稳定地整合。

16.一种转基因蚕属蚕，所述蚕包含：在丝心蛋白重链基因FibH的内含子中且可操作地连接至蚕特异性U6启动子的稳定整合的络新妇蛛合成蜘蛛丝基因的MaSp1基因或MiSp1基因，其中所述外源蜘蛛丝基因的长度大于约3千碱基(3kb)，其中所述转基因蚕稳定地表达所述蜘蛛丝基因。

17.如陈述16所述的转基因蚕，其中所述外源蜘蛛丝基因包含SEQ ID NO.25或SEQID NO:26或其任一个的片段。

18.一种分离的核酸，所述分离的核酸包含合成蜘蛛丝基因，所述分离的核酸具有可操作地连接至内源蚕启动子的SEQ ID NO:25或SEQ ID NO:26或其任一个的片段。

19.如陈述18所述的分离的核酸，所述分离的核酸还包含蚕丝蛋白基因或其片段，所述蚕丝蛋白基因与所述合成蜘蛛丝基因邻接。

20.如陈述18或19所述的分离的核酸，其中所述内源蚕启动子是U6启动子。

21.一种蛋白质，所述蛋白质由陈述18-20中任一项所述的分离的核酸编码。

22.一种载体，所述载体包含陈述18-21中任一项所述的分离的核酸。

23.一种蚕宿主细胞，所述蚕宿主细胞包含陈述18-21中任一项所述的分离的核酸。

24.一种丝组合物，所述丝组合物包含陈述21所述的蛋白质。

25.一种用于产生转基因蚕的方法，所述方法包括：使用CRISPR/Cas9系统将具有SEQ ID NO.25或SEQ ID NO:26或其任一个的片段的分离的核酸引入到蚕基因组的限定位点，使得所述分离的核酸可操作地连接至内源蚕启动子，其中所述外源核酸被稳定地整合到所述蚕基因组中。

26.根据陈述25所述的方法，其中所述限定位点是蚕丝心蛋白重链基因FibH的内含子。

27.根据陈述25所述的方法，其中所述限定位点是蚕丝心蛋白轻链基因FibL的第六内含子。

28.根据陈述25-27中任一项所述的方法，其中所述内源启动子是U6启动子。

29.根据陈述25-28中任一项所述的方法，其中引入所述外源核酸利用非同源重组。

30.根据陈述25-29中任一项所述的方法，其中所述分离的核酸可操作地连接至所述蚕腺体中的内源蚕启动子。

31.根据陈述25-30中任一项所述的方法，其中所述外源核酸是可稳定遗传的。

32.根据陈述25-31中任一项所述的方法，其中所述外源核酸在所述转基因蚕中稳定地表达。

33.一种用于产生合成蜘蛛丝蛋白的方法，所述方法包括：将具有SEQID NO.25或SEQ ID NO:26或其任一个的片段的分离的核酸引入到蚕基因组中的限定位点，其中所述分离的核酸被稳定地整合到蚕基因组中；在内源启动子的控制下表达所述外源核酸；以及从所述蚕分离合成蜘蛛丝蛋白。

34.一种复合蛋白，所述复合蛋白包含：第一序列和第二序列，所述第一序列包含SEQ ID NO:70、包含SEQ ID NO:70的至少10个连续氨基酸的片段、或与SEQ ID NO:70具有至少90％同一性的氨基酸序列，所述第二序列包含SEQ ID NO:69、包含SEQ ID NO:69的至少10个连续氨基酸的片段、或与SEQ ID NO:69具有至少90％同一性的氨基酸序列。

35.如陈述34所述的复合蛋白，其中所述第一序列和所述第二序列是连续的。

36.如陈述34所述的复合蛋白，所述复合蛋白包含彼此邻接的SEQ ID NO:70和SEQID NO:69。

序列表

<110> 犹他州立大学

<120> 表达蜘蛛丝的转基因蚕

<130> 15084-18

<150> 62/479,156

<151> 2017-03-30

<160> 71

<170> PatentIn version 3.5

<210> 1

<211> 124

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> BmN细胞中CRISPR/Cas9系统HC3-介导的靶向整合，其中wt.：野生型基因序列

<400> 1

taaggcagta tgtcctaact cgttccagat cagcgctaac ttcgattgaa tgtgcgaaat 60

tttaaggcag tatgtcctaa ctcgttccag atcagcgcta acttcgattg aatgtgcgaa 120

attt 124

<210> 2

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ2-M13F-T2

<400> 2

taaggcatta ccagttagag ctccataact tcgattgaat gtgcgaaatt t 51

<210> 3

<211> 61

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ3-M13F-T3

<400> 3

taaggcagta tgtcctaact gttccagatc agcgctaact tcgattgaat gtgcgaaatt 60

t 61

<210> 4

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ6-M13-T6

<400> 4

taaggcagta tgtcctaact tatttctagc tctaaaacaa ctcgttccag atcagcgcac 60

ttg 63

<210> 5

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ15-M13F-T3

<400> 5

taaggcagta tgtcctaact ttccagatca gcgctaactt cgattgaatg tgcgaaattt 60

<210> 6

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ16-M13F-T4

<400> 6

taaggcagta tgtcctaacg ttccagatca gcgctaactt cgattgaatg tgcgaaattt 60

<210> 7

<211> 47

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ22-M13-T10

<400> 7

taaggcagta tgtcctagcg ctaacttcaa ttgaatgtgc gaaattt 47

<210> 8

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ25-M13-T13

<400> 8

taaggcagta tgtcctaact gtccagatca gcgctaactt cgattgaatg tgcgaaattt 60

<210> 9

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ29-M13F-T17

<400> 9

taaggcagta tgtcctaaca gatcagcgct aacttcgatt gaatgtgcga aattt 55

<210> 10

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> XZ35-M13F-T23

<400> 10

taaggcagta tgtcctaact 20

<210> 11

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> gRNA HC-1的靶位点

<400> 11

cactagtgct gcagtcgttc tagacgtgag caagggc 37

<210> 12

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> gRNA HC-3的靶位点

<400> 12

cagctagaac attcaatctg aattcgtcga caag 34

<210> 13

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> gRNA HC-1和HC-3的靶位点

<400> 13

ccagctaata ggtagggaaa acaaagctca taatgtagac cataaaatct cgtgg 55

<210> 14

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于gBlock DNA扩增的引物1

<400> 14

aggttatgta gtacacattg 20

<210> 15

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于gBlock DNA扩增的引物2

<400> 15

ttaatgccaa ctttgtaca 19

<210> 16

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> CRISPR/Cas9系统的gRNA设计

<400> 16

tttttttagg tatatataca aaatatcgtg ctctacaagt ggttttccct acctattagc 60

<210> 17

<211> 140

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于克隆和在CRISPR/Cas9系统中使用的gRNA构建体

<400> 17

tattaatgcc aactttgtac aagaaagctg ggtctagaaa aaaagcaccg actcggtgcc 60

actttttcaa gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac 120

gctaataggt agggaaaacc 140

<210> 18

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于克隆和在CRISPR/Cas9系统中使用的gRNA构建体

<400> 18

tttttttagg tatatataca aaatatcgtg ctctacaagt gatgtgacca taaaatctcg 60

<210> 19

<211> 140

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于克隆和在CRISPR/Cas9系统中使用的gRNA构建体

<400> 19

tattaatgcc aactttgtac aagaaagctg ggtctagaaa aaaagcaccg actcggtgcc 60

actttttcaa gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac 120

cgagatttta tggtcacatc 140

<210> 20

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于克隆和在CRISPR/Cas9系统中使用的gRNA构建体

<400> 20

tttttttagg tatatataca aaatatcgtg ctctacaagt gcgctgatct ggaacgagtt 60

<210> 21

<211> 140

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于克隆和在CRISPR/Cas9系统中使用的gRNA构建体

<400> 21

tattaatgcc aactttgtac aagaaagctg ggtctagaaa aaaagcaccg actcggtgcc 60

actttttcaa gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac 120

aactcgttcc agatcagcgc 140

<210> 22

<211> 467

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于蚕-特异性U6启动子的gBlock DNA

<400> 22

aggttatgta gtacacattg ttgtaaatca ctgaattgtt ttagatgatt ttaacaatta 60

gtacttatta atattaaata agtacatacc ttgagaattt aaaaatcgtc aactataagc 120

catacgaatt taagcttggt acttggctta tagataagga cagaataaga attgttaacg 180

tgtaagacaa ggtcagatag tcatagtgat tttgtcaaag taataacaga tggcgctgta 240

caaaccataa ctgttttcat ttgtttttat ggattttatt acaaattcta aaggttttat 300

tgttattatt taatttcgtt ttaattatat tatatatctt taatagaata tgttaagagt 360

ttttgctctt tttgaataat ctttgtaaag tcgagtgttg ttgtaaatca cgctttcaat 420

agtttagttt ttttaggtat atatacaatt gtacaaagtt ggcatta 467

<210> 23

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> HC-lacZdisr-正向

<400> 23

atatctagat tctcagtggg tcgcgttac 29

<210> 24

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> HC-lacZdisr-反向

<400> 24

ataggtacct cgataactgc cccagatgc 29

<210> 25

<211> 1023

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> MaSp1的DNA序列

<400> 25

ggtggtgcag gtcagggtgg ttatggtggt ctgggtagcc agggtgccgg tcgtggtgga 60

ctgggtggtc aaggtgctgg tgcagcagca gctgccgcag cagcaggcgg tgcaggccaa 120

ggcggatatg gcggactggg ttcacagggt gcaggccgtg gcggtttagg tggtcaaggc 180

gcaggcgctg ctgcagccgc agcggcagca gctggccaag gtggctatgg tggcttaggc 240

tcacagggtg gcggtgctgg acagggtgga tacggtggcc ttggcagtca aggtgcgggt 300

cgcggtggtt taggcggtca gggtgcgggt gcggctgctg cagctgcggc agcgggtggt 360

gctgggcaag gcggttacgg tggattaggt agccaaggtg caggacgcgg aggtcttggt 420

ggacagggtg ctggcgctgc tgcggcagca gcagccgctg ggggtgctgg tcaagggggt 480

tatggcggtt taggatctca gggtgcggga cggggtggtc tgggagggca aggggcaggc 540

gcagcagcag cggcagctgc agccggtggt gccggacaag ggggatatgg gggtcttggc 600

tcccaaggcg ctggtcgtgg cggtcttgga ggccaaggtg ccggtgccgc tgcagcggct 660

gctgctgcag cgggtcaagg gggatacggt ggtctgggat cacaaggtgg tggcgcaggg 720

caaggtgggt atgggggttt aggttcgcaa ggtgctggcc gtgggggact gggaggacag 780

ggtgccggtg cggcagccgc tgcagctgct gcgggtggcg ctggtcaggg tggctatggc 840

ggattgggct ctcaaggggc aggtcggggt ggcttgggag gacaaggtgc gggtgcagcc 900

gctgcggcag ctgccgctgg cggagcaggc cagggtggct acggtggact gggttcccaa 960

ggtgcgggaa gaggtggctt gggtggccag ggtgcagggg cagcggctgc agcggcagca 1020

gcc 1023

<210> 26

<211> 1176

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> MiSp1的DNA序列

<400> 26

ggtggtgccg gtggttatgg tcgtggtgct ggtgcgggtg ccggtgcagc agctggtgcc 60

ggtgctggcg caggcggtta tggtggtcag ggtggctacg gtgccggtgc cggtgctggt 120

gccgcagccg cagcgggtgc gggtgcaggc ggtgctggcg gttatggcag aggtgctggg 180

gctggtgcag gcgctgcagc cggtgcgggt gctggtgcgg gtggatatgg tggccagggt 240

ggttatggcg ctggcgcagg ggcaggcgca gcagcagcag ctggggcagg cgcaggcggt 300

gccggtggct atggacgcgg agccggtgcc ggtgcagggg cagcagcggg tgctggtgcc 360

ggtgcagggg gttatggtgg ccaaggcgga tatggtgcgg gtgcaggcgc tggtgcagca 420

gcagccgctg gtgccggtgc cggtggtgcg ggtggctacg gaagaggtgc gggtgccggt 480

gccggtgctg cagcgggtgc gggtgcgggt gccggtggtt atggcggtca gggtgggtat 540

ggtgcgggtg ctggtgcagg cgcagctgca gccgctggtg ctggtgcagg cggagccggt 600

ggatatggcc gaggtgctgg cgcaggcgct ggcgctgctg ctggtgccgg tgcgggtgct 660

gggggatacg gtggtcaagg gggttatggt gcgggtgccg gtgcgggtgc agccgcagca 720

gctggtgcgg gtgcgggtgg tgcaggggga tatggccgtg gtgccggtgc tggtgcgggt 780

gctgcagccg gtgctggggc aggggctggc ggttatgggg gtcaaggcgg ttatggcgct 840

ggtgctggtg ctggggctgc cgcagcagcc ggtgctggtg ctggcggtgc gggtggttac 900

ggtcggggag ctggcgctgg tgctggcgca gcagcgggtg ccggtgctgg tgccggtggc 960

tacggtggac aaggtggcta tggtgccggt gcaggcgcag gggctgcagc cgcagccggt 1020

gccggtgccg gtggcgctgg gggttatggt cgcggagcgg gtgcaggcgc aggcgcagcc 1080

gctggcgctg gtgcgggtgc tggcggttat ggtggacaag ggggttatgg ggctggtgct 1140

ggcgcagggg cagctgctgc agcgggtgct ggcgct 1176

<210> 27

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 27

ataggtacca gccctaacaa gagctcacgt gatagattct atgaagcact tcggtaacgc 60

gacccagtgt tagcaaattc tttcaggttg 90

<210> 28

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 28

taactcgaga gcttgtacag ctcgtccatg ccgagag 37

<210> 29

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 29

ataggatccc gcctcctccg agaacgtcat 30

<210> 30

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 30

taatctagac aggaacaggt ggtggcgg 28

<210> 31

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 31

caaccgcgga agcgtcagtt acggagctgg cag 33

<210> 32

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建pSK-NTD-MaSp1/MiSp1(8)-DsRed-CTD载体的PCR引物

<400> 32

taagagctct atagtattct tagttgagaa ggcatac 37

<210> 33

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 左侧基因组：接合测试序列

<400> 33

cactagtgct gcagtcgttc tagacgtgag caagggc 37

<210> 34

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 右侧基因组：接合测试序列

<400> 34

cagctagaac attcaatctg aattcgtcga caag 34

<210> 35

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> FibH62454-F引物

<400> 35

ttgtgatctt gtgctgcgct 20

<210> 36

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> H1-R引物

<400> 36

cagggtcagc ttgccgtag 19

<210> 37

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> FibH62737-F引物

<400> 37

caccggtaaa tcagcattgc 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> FibH-供体-R引物

<400> 38

cgactgcagc actagtgctg 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> PSK-F引物

<400> 39

gggcgatcgg tgcgggcctc 20

<210> 40

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> FibH63746-R引物

<400> 40

tgagcaacag taccatcgga 20

<210> 41

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> PSK-F2引物

<400> 41

tacgactcac tatagggcga 20

<210> 42

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> FibH63575-R引物

<400> 42

tcgataactg ccccagatgc 20

<210> 43

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 43

ataggatccc gcctcctccg agaacgtcat 30

<210> 44

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 44

taatctagac aggaacaggt ggtggcgg 28

<210> 45

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 45

cacgagttcg agatcgaggg 20

<210> 46

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 46

gcgtccacgt agtagtagcc 20

<210> 47

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 47

ccgacatccc cgactacaag 20

<210> 48

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于在转基因蛾的基因组中进行DsRed检测的引物

<400> 48

acgccgatga acttcacctt 20

<210> 49

<211> 131

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 家蚕(B. mori)重链的氨基酸序列

<400> 49

Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly

1 5 10 15

Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala

20 25 30

Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln

35 40 45

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala

50 55 60

Ala Ala Ala Ala Ala Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser

65 70 75 80

Gln Gly Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln

85 90 95

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala

100 105 110

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu

115 120 125

Gly Ser Gln

130

<210> 50

<211> 138

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成蜘蛛丝蛋白MiSp1的氨基酸序列

<400> 50

Ser Ser Asp Phe Gly Thr Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala

1 5 10 15

Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser

20 25 30

Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Val

35 40 45

Gly Val Gly Tyr Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Tyr

50 55 60

Gly Ala Gly Ala Gly Ser Gly Ala Ala Ser Gly Ala Gly Ala Gly Ser

65 70 75 80

Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala

85 90 95

Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala

100 105 110

Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser

115 120 125

Gly Ala Gly Ala Gly Ser Gly Ala Gly Val

130 135

<210> 51

<211> 123

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成蜘蛛丝蛋白MiSp1的氨基酸序列

<400> 51

Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala

1 5 10 15

Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly

20 25 30

Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly

35 40 45

Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly

50 55 60

Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala

65 70 75 80

Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr

85 90 95

Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala

100 105 110

Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr

115 120

<210> 52

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> g5 gRNA的合成序列

<400> 52

agaactttaa attatatct 19

<210> 53

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> g6 gRNA的合成序列

<400> 53

tcactatgag acttaagct 19

<210> 54

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 54

ataggtaccc cggttgctca agtgttccac c 31

<210> 55

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 55

attgtcgacg tcattaccgt tgccaacgcc tc 32

<210> 56

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 56

atagtcgacg tgagcaaggg cgaggagctg ttcacc 36

<210> 57

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 57

gcaagcttct tgtacagctc gtccatgccg agag 34

<210> 58

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 58

ataggatcct gcgaccggct tagttgctaa tgctc 35

<210> 59

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于构建LC-NHEJ供体的引物

<400> 59

atagagctcg tacccactgt ccaatccacc gtc 33

<210> 60

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LC-NHEJ片段

<400> 60

ccaagaactt taaattatat ctacgcgacc atcactatga gacttaagct 50

<210> 61

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 61

aagatggatc aaactgcaca cggtgtgc 28

<210> 62

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 62

aagagattgt acaactctcg caacagcc 28

<210> 63

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 63

gtaaacggcc acaagttcag c 21

<210> 64

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 64

tacggcaagc tgaccctgaa 20

<210> 65

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 65

gggcgatcgg tgcgggcctc 20

<210> 66

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 66

tacgactcac tatagggcga 20

<210> 67

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 67

ccaatccacc gtctttgggt 20

<210> 68

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 用于基因组：接合测试的引物

<400> 68

gacggtggat tggacagtgg gtac 24

<210> 69

<211> 261

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> G1 LCA组中的复合蚕/蜘蛛丝纤维，家蚕(B. mori)轻链

<400> 69

Met Lys Pro Ile Phe Leu Val Leu Leu Val Ala Thr Ser Ala Tyr Ala

1 5 10 15

Ala Pro Ser Val Thr Ile Asn Gln Tyr Ser Asp Asn Glu Ile Pro Arg

20 25 30

Asp Ile Asp Asp Gly Lys Ala Ser Ser Val Ile Ser Arg Arg Trp Asp

35 40 45

Tyr Val Asp Asp Thr Asp Lys Ser Ile Ala Ile Leu Asn Val Gln Glu

50 55 60

Ile Leu Lys Asp Met Ala Ser Gln Gly Asp Tyr Ala Ser Gln Ala Ser

65 70 75 80

Ala Val Ala Gln Thr Ala Gly Ile Ile Ala His Leu Ser Ala Gly Ile

85 90 95

Pro Gly Asp Ala Cys Ala Ala Ala Asn Val Ile Asn Ser Tyr Thr Asp

100 105 110

Gly Val Arg Ser Gly Asn Phe Ala Gly Phe Arg Gln Ser Leu Gly Pro

115 120 125

Phe Phe Gly His Val Gly Gln Asn Leu Asn Leu Ile Asn Gln Leu Val

130 135 140

Ile Asn Pro Gly Gln Leu Arg Tyr Ser Val Gly Pro Ala Leu Gly Cys

145 150 155 160

Ala Gly Gly Gly Arg Ile Tyr Asp Phe Glu Ala Ala Trp Asp Ala Ile

165 170 175

Leu Ala Ser Ser Asp Ser Ser Phe Leu Asn Glu Glu Tyr Cys Ile Val

180 185 190

Lys Arg Leu Tyr Asn Ser Arg Asn Ser Gln Ser Asn Asn Ile Ala Ala

195 200 205

Tyr Ile Thr Ala His Leu Leu Pro Pro Val Ala Gln Val Phe His Gln

210 215 220

Ser Ala Gly Ser Ile Thr Asp Leu Leu Arg Gly Val Gly Asn Gly Asn

225 230 235 240

Asp Ala Thr Gly Leu Ala Asn Ala Gln Arg Tyr Ile Ala Gln Ala Ala

245 250 255

Ser Gln Val His Val

260

<210> 70

<211> 234

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 络新妇蛛(N. clavipes) MaSp1蛋白序列

<400> 70

Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly

1 5 10 15

Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala

20 25 30

Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln

35 40 45

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala

50 55 60

Ala Ala Ala Ala Ala Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser

65 70 75 80

Gln Gly Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln

85 90 95

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala

100 105 110

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu

115 120 125

Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly

130 135 140

Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr

145 150 155 160

Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln

165 170 175

Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln

180 185 190

Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu

195 200 205

Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly

210 215 220

Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln

225 230

<210> 71

<211> 604

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 密码子优化的U6启动子(sU6)

<220>

<221> misc_feature

<222> (468)..(487)

<223> n为a、c、g、t或u

<400> 71

aggttatgta gtacacattg ttgtaaatca ctgaattgtt ttagatgatt ttaacaatta 60

gtacttatta atattaaata agtacatacc ttgagaattt aaaaatcgtc aactataagc 120

catacgaatt taagcttggt acttggctta tagataagga cagaataaga attgttaacg 180

tgtaagacaa ggtcagatag tcatagtgat tttgtcaaag taataacaga tggcgctgta 240

caaaccataa ctgttttcat ttgtttttat ggattttatt acaaattcta aaggttttat 300

tgttattatt taatttcgtt ttaattatat tatatatctt taatagaata tgttaagagt 360

ttttgctctt tttgaataat ctttgtaaag tcgagtgttg ttgtaaatca cgctttcaat 420

agtttagttt ttttaggtat atatacaaaa tatcgtgctc tacaagtnnn nnnnnnnnnn 480

nnnnnnngtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 540

aaaaagtggc accgagtcgg tgcttttttt ctagacccag ctttcttgta caaagttggc 600

atta 604

Claims

1.一种用于产生转基因蚕的方法，所述方法包括将外源合成蜘蛛丝基因引入蚕中，其中所述外源合成蜘蛛丝基因被稳定地整合到蚕基因组的丝心蛋白轻链基因FibL的第六内含子中并可操作地连接至内源蚕启动子，其中所述外源合成蜘蛛丝基因的长度大于3千碱基(3kb)，其中所述内源蚕启动子是蚕特异性U6启动子并且所述转基因蚕稳定地表达所述外源合成蜘蛛丝基因。

2.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因可操作地连接至蚕腺体中的内源蚕启动子。

3.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因的长度大于4千碱基(4kb)。

4.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因的长度大于5千碱基(5kb)。

5.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因的长度为约1万碱基(10kb)。

6.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因包含SEQ ID NO.25或SEQ ID NO:26或其任一个的片段。

7.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因包括络新妇蛛(Nephila clavipes)的MaSp1基因、MaSp2基因、Ac1基因、Flag基因、Piri基因或MiSp1基因。

8.根据权利要求1所述的用于产生转基因蚕的方法，其中所述蚕是蚕属物种(Bombyxsp.)。

9.根据权利要求8所述的用于产生转基因蚕的方法，其中所述蚕是家蚕(Bombyxmori)。

10.根据权利要求1所述的用于产生转基因蚕的方法，其中所述外源合成蜘蛛丝基因被稳定地整合在所述转基因蚕的后代蚕中。

11.一种用于产生转基因蚕属蚕的方法，所述方法包括：

将络新妇蛛合成蜘蛛丝基因的MaSp1基因或MiSp1基因引入蚕中的丝心蛋白重链基因FibH的内含子中，其中所述MaSp1基因或MiSp1基因被稳定地整合且可操作地连接至蚕特异性U6启动子，

其中所述合成蜘蛛丝基因的长度大于3千碱基(3kb)，

其中所述转基因蚕属蚕稳定表达所述合成蜘蛛丝基因。

12.根据权利要求11所述的用于产生转基因蚕属蚕的方法，其中所述合成蜘蛛丝基因包含SEQ ID NO.25或SEQ ID NO:26或其任一个的片段。

13.一种分离的核酸，所述分离的核酸包含合成蜘蛛丝基因，所述分离的核酸具有可操作地连接至内源蚕启动子的SEQ ID NO:25或SEQ ID NO:26或其任一个的片段，其中SEQ IDNO:25或SEQ ID NO:26或其任一个的片段被稳定整合到蚕基因组的丝心蛋白重链基因FibH的内含子或丝心蛋白轻链基因FibL的内含子中，其中所述合成蜘蛛丝基因的长度大于3千碱基(3kb)，其中所述分离的核酸能够在蚕中稳定地表达并且其中所述内源蚕启动子是U6启动子。

14.根据权利要求13所述的分离的核酸，还包含蚕丝蛋白基因或其片段，所述蚕丝蛋白基因与所述合成蜘蛛丝基因邻接。

15.一种蛋白质，所述蛋白质由权利要求13所述的分离的核酸编码。

16.一种载体，所述载体包含权利要求13所述的分离的核酸。

17.一种蚕宿主细胞，所述蚕宿主细胞包含权利要求13所述的分离的核酸。

18.一种丝组合物，所述丝组合物包含权利要求15所述的蛋白质。

19.一种用于产生转基因蚕的方法，所述方法包括：

使用CRISPR/Cas9系统将分离的核酸引入到蚕基因组的限定位点，使得所述分离的核酸可操作地连接至内源蚕启动子，所述分离的核酸包含合成蜘蛛丝基因，其中所述分离的核酸具有SEQ ID NO.25或SEQ ID NO:26或其任一个的片段，

其中所述分离的核酸被稳定地整合到所述蚕基因组的丝心蛋白重链基因FibH的内含子或丝心蛋白轻链基因FibL的内含子中，其中所述合成蜘蛛丝基因的长度大于3千碱基(3kb)，其中所述内源蚕启动子是U6启动子，并且其中所述分离的核酸在所述转基因蚕中稳定地表达。

20.根据权利要求19所述的方法，其中所述限定位点是蚕丝心蛋白轻链基因FibL的第六内含子。

21.根据权利要求19所述的方法，其中引入所述分离的核酸利用非同源重组。

22.根据权利要求19所述的方法，其中所述分离的核酸可操作地连接至蚕腺体中的所述内源蚕启动子。

23.根据权利要求19所述的方法，其中所述分离的核酸是可稳定遗传的。

24.一种用于产生合成蜘蛛丝蛋白的方法，所述方法包括：

将分离的核酸引入到蚕基因组的限定位点，所述分离的核酸包含合成蜘蛛丝基因，其中所述分离的核酸具有SEQ ID NO.25或SEQ ID NO:26或其任一个的片段，其中所述分离的核酸被稳定地整合到所述蚕基因组的丝心蛋白重链基因FibH的内含子或丝心蛋白轻链基因FibL的内含子中，其中所述合成蜘蛛丝基因的长度大于3千碱基(3kb)并且其中所述分离的核酸在所述蚕中稳定地表达；

在内源启动子的控制下表达所述分离的核酸；和

从所述蚕分离合成蜘蛛丝蛋白，其中所述内源启动子是U6启动子。

25.一种复合蛋白，包含：

第一序列，所述第一序列包含SEQ ID NO:70、包含SEQ ID NO:70的至少10个连续氨基酸的片段、或与SEQ ID NO:70具有至少90％同一性的氨基酸序列，以及

第二序列，所述第二序列包含SEQ ID NO:69、包含SEQ ID NO:69的至少10个连续氨基酸的片段、或与SEQ ID NO:69具有至少90％同一性的氨基酸序列。

26.根据权利要求25所述的复合蛋白，其中所述第一序列和所述第二序列是连续的。

27.根据权利要求25所述的复合蛋白，所述复合蛋白包含彼此邻接的SEQ ID NO:70和SEQ ID NO:69。

28.一种用于产生转基因蚕的方法，所述方法包括将外源合成蜘蛛丝基因引入蚕中，其中所述外源合成蜘蛛丝基因被稳定地整合到蚕基因组的丝心蛋白重链基因FibH的内含子中并可操作地连接至内源蚕启动子，其中所述外源合成蜘蛛丝基因的长度大于3千碱基(3kb)，其中所述内源蚕启动子是蚕特异性U6启动子并且所述转基因蚕稳定地表达所述外源合成蜘蛛丝基因。