CN117025672A

CN117025672A - 一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法

Info

Publication number: CN117025672A
Application number: CN202310944134.8A
Authority: CN
Inventors: 贡成良; 王崇龙; 胡小龙; 朱敏; 周文林; 李继杰; 童新宇; 邱群婻; 冯永杰
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2023-07-28
Filing date: 2023-07-28
Publication date: 2023-11-10

Abstract

本发明公开了一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法，具体为基于基因打靶家蚕制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维的方法。将pUC‑target‑Heavy‑g和表达Cas12a核酸酶的质粒piggyCPF1注射至家蚕初产卵中，通过荧光初筛、分子生物学鉴定和继代筛选，获得蜘蛛大壶状腺丝蛋白基因序列表达盒替代家蚕丝素重链基因表达盒的基因打靶家蚕。该基因打靶家蚕常规饲养，将熟蚕移至簇具，营茧，采茧，经过缫丝获含金丝织网蜘蛛大壶状腺丝蛋白的复合蚕丝。利用本发明可获取含有金丝织网蜘蛛大壶状腺丝蛋白的蚕丝，用于制作各种纺织丝绸制品，满足制备各种生物材料对丝蛋白的多样性的需求，也可以用获得的基因打靶家蚕通过常规杂交育种的手段，选育新家蚕品种。

Description

一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法

技术领域

本发明涉及基因组编辑领域，具体涉及一种基于基因打靶家蚕制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维的方法。

背景技术

近年来，人们利用基因工程技术已在细菌、酵母、哺乳类动物培养细胞、昆虫细胞中成功表达蛛丝蛋白重复序列，甚至通过转基因动物和植物表达蛛丝蛋白重复序列。但这些表达的蛛丝蛋白序列不是完整的蛛丝蛋白序列，表达的重组蛛丝蛋白序列也不能自主装配成丝纤维，须通过人工纺丝的技术进一步加工成丝纤维，但目前通过这种技术还难以大量获取机械性能优异的蛛丝纤维，因此，这类重组蛛丝蛋白大多数用于生物材料的实验室研究。另外，蜘蛛的不同腺体能合成分泌形成不同的蛛丝，由于主壶腹腺丝蛋白的分子量巨大，且核心序列为简单高度重复序列，因此，表达的重组蛛丝蛋白分子量往往低于理论分子量，且表达水平非常低。利用再生丝蛋白或重组丝蛋白人工纺丝所获得的丝的机械性能与多种因素有关，其中改善表达水平，提高表达蛛丝蛋白的分子量，一直为专业领域所追求的目标。

几千年来，饲养家蚕获取蚕茧是丝绸工业的基础，家蚕是唯一能室内规模饲养大量提供丝纤维的昆虫。蚕丝蛋白主要由丝胶蛋白和丝素蛋白组成，而丝纤维主要由不溶于水的丝素蛋白重链（350kDa）、丝素蛋白轻链（25.8kDa）以及P25蛋白(25.7kDa)按6:6:1的摩尔比装配而成，蚕丝蛋白的机械性能主要由丝素蛋白重链的高分子量和氨基酸序列的高度重复决定。很长时间以来，人们一直希望利用家蚕高效合成丝蛋白以及天然的纺丝能力生产蛛丝。目前，将络新妇蛛（Nephila clavipes）、大腹园蛛(Araneus ventricosus)主壶腹腺丝蛋白基因的重复模序经过多次串联重复后，通过piggyBac介导的转基因已实现了非完整蛛丝蛋白基因在家蚕中的表达，并通过家蚕天然的纺丝能力获得含有蛛丝蛋白成份的嵌合蚕丝，在一定程度上改善了丝纤维的机械性能，但该丝纤维中蛛丝蛋白的含量非常有限。

现有技术公开了一种蜘蛛葡萄状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法，蜘蛛葡萄状腺丝蛋白基因为黑寡妇蜘蛛葡萄状腺丝或者园蛛葡萄状腺丝的重复单元以1-8倍连续重复构成的基因序列；先构建在家蚕丝腺中能分泌表达葡萄状腺丝蛋白的质粒pBac-ACSP，将质粒与表达转座酶的辅助质粒一起导入到家蚕受精卵内，通过转座子介导，使荧光蛋白基因和葡萄状腺丝蛋白基因导入到家蚕基因组内，并稳定遗传和表达，育成分泌蜘蛛葡萄状腺丝蛋白的转基因家蚕，其发现了一种蜘蛛葡萄状腺丝蛋白基因的用途，并开发了一种新型家蚕蜘蛛仿生丝的改良家蚕丝性能的生产方法。但是该技术是通过基于piggyBac转座子技术将蛛丝蛋白基因表达盒导入家蚕基因组，蛛丝蛋白基因表达盒整合在家蚕基因组的位点倾向于基因组中的TTAA位点，有较大的随机性，家蚕自身的丝蛋白基因没有被蛛丝蛋白基因替代，表达水平低；另外，该技术方案中表达的蛛丝蛋白序列为非完整的蛛丝蛋白基因序列。总体上，该技术方案已是一个被淘汰的方案。

随着基因编辑技术的发展和完善，通过TALEN介导的同源末端重组已实现了用蜘蛛主壶腹腺丝蛋白基因替代家蚕丝蛋白重链基因，但其断裂应力（breaking stress）为371.3Mpa，比野生蚕的449.5Mpa低17.4%，出现明显强度下降。通过CRISPR/Cas9介导将与天然蜘蛛丝蛋白基因大小相仿的人工合成的蜘蛛基因重复区域整合进家蚕的重链基因的内含子区域的方法并没有能实现用蛛丝基因替代家蚕重链基因。

发明内容

本发明的目的是提供了一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法，具体为一种基于基因打靶家蚕制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维的方法。

为达到上述目的，本发明采用的技术方案是：

一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法，包括下列步骤：

(1)构建基因打靶载体pUC-target-Heavy-g；

(2)将基因打靶载体pUC-target-Heavy-g与表达Cas12a核酸酶的质粒混合，然后引入家蚕初产卵内，再孵化；优选的，表达Cas12a核酸酶的质粒为表达Cas12a核酸酶的质粒piggyCPF1；

(3)家蚕初产卵孵化后，饲养至化蛾，雌雄交配，获蛾圈蚕卵；

(4)利用特异性引物扩增蛾圈蚕卵的亲本蛾DNA，筛选基因打靶蚕蛾产的卵；

(5)将亲本为基因打靶蚕蛾交配所产的卵催青后，正常饲养至化蛾，同蛾区交配产卵；然后利用特异性引物扩增蛾的DNA，然后对扩增产物测序验证，选择䧳雄亲本均为纯系的基因打靶蚕蛾交配所产的卵继代；

(6)步骤(5)获得的卵孵化后，常规饲养至上蔟，进而获得蜘蛛家蚕复合丝纤维。

本发明制备得到蜘蛛家蚕复合丝纤维，优选为蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维。

本发明中，构建的基因打靶载体pUC-target-Heavy-g具有以下特征：以丝素重链基因旁侧序列为同源臂，将丝素重链基因启动子控制的编码金丝织网蜘蛛大壶状腺丝蛋白（MaSp-g）基因序列表达盒以及3×P3启动子控制荧光蛋白基因（优选红色荧光蛋白（DsRed）基因）克隆进左右同源臂之间，并将家蚕U6启动子控制的靶向丝素重链基因的gRNA表达盒克隆在右同源臂的下游。优选的，构建的基因打靶载体pUC-target-Heavy-g的DNA序列为SEQ ID NO: 1。

在SEQ ID NO: 1中，1-431nt为pUC载体骨架序列；432-2221nt为同源左臂序列，含有丝素重链基因启动子；2222-2284nt为丝素重链基因的信号肽序列，该序列优选根据家蚕密码子优化后的序列；2285-9604nt为金丝织网蜘蛛大壶状腺丝蛋白（MaSP-g）基因序列，该序列优选根据家蚕密码子优化后的序列，其中9311-9604nt区域为MaSP-g C端非重复区；9605-9941nt为丝胶基因加尾信号；9942-10192nt为3×P3启动子序列；10228-10908nt为dsRed基因编码序列；10917-11149nt为SV40加尾信号；11150-13009nt为同源右臂序列；13010-13492nt为U6启动子序列；13493-13799nt为编码成gRNA的序列，其中，CGATATCTGTGCGTTTTGGCG和CGACGAGAATAGTCGTAACTG为靶向fib-H基因的模板链，CATAATTAGAATGTTGTTCAA，CGGAGCTGGCAGGGGATACGG和AATTCAGAGCACTGCCTTGTG为靶向fib-H正义链序列；13800-16078nt为pUC载体骨架序列。SEQ ID NO: 1序列可以全人工化学合成，也可以用人工化学合成与PCR扩增相集合的方法，具体为常规技术。优选地，同源左臂、同源右臂的长度大于1kb，同源左臂、同源右臂可以是SEQ ID NO: 1指出的长度。3×P3启动子序列也可以用家蚕的其他启动子替代，例：肌动蛋白A3启动子。红色荧光蛋白（DsRed）基因也可以用绿色荧光蛋白（GFP）基因替代。所述的加尾信号也可以是其他基因的加尾信号。作为载体pUC-target-Heavy-g的骨架序列，也可以选用pUC以外的载体，例：pBlueScript SK载体。

本发明中，将基因打靶载体pUC-target-Heavy-g与表达Cas12a核酸酶的质粒piggyCPF1混合，注射至家蚕初产卵。质粒piggyCPF1的DNA序列为SEQ IDNO: 2。优选地，在piggyCPF1中，表达Cas12a核酸酶的开放读码框序列根据家蚕密码子优化，Cas12a读码框上游ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC序列为核定位信号编码序列，Cas12a读码框下游AAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG序列为核定位信号编码序列。控制Cas12a表达的启动子优选家蚕肌动蛋白A3启动子。构建piggyCPF1可以全工人工化学合成，也可以人工化学合成和PCR法相结合。在上述方案中，表达Cas12a核酸酶的质粒piggyCPF1可以直接用商业化的重组Cas12a蛋白代替，也可用Cas12a的mRNA代替。

本发明中，家蚕初产卵可选用多化性非滞育家蚕的初产卵，初产卵为刚产下常温保护2～8小时内的蚕卵；也可以是滞育家蚕品种的初产卵经人工干预解除滞育后的卵。

本发明中，步骤（4）中，特异性引物为扩增网蜘蛛大壶状腺丝蛋白基因的引物对、扩增荧光蛋白基因的引物对、检测外源DNA的左侧插入位点的引物对、检测外源DNA的右侧插入位点的引物对。优选的，特异性引物为扩增网蜘蛛大壶状腺丝蛋白基因部分序列的引物对Heavy-g-F和Heavy-g-R，其序列对应于SEQ ID NO: 3和SEQ ID NO: 4；扩增荧光蛋白基因部分序列引物对为dsRed-F1和dsRed-R1，其序列对应于SEQ ID NO: 15、SEQ ID NO:16，或引物对DsRed-F和DsRed-R，其序列对应于SEQ ID NO: 8、SEQ ID NO: 9；检测外源DNA的左侧插入位点的引物对为Left-F1和Left-R2以及引物对Left-F2和Left-R2，其序列分别对应于SEQ ID NO: 5和SEQ ID NO: 7以及SEQ ID NO: 6和SEQ ID NO: 7；检测外源DNA的右侧插入位点的引物对Right-F1和Right-R2以及Right-F2、Righ-R2，其序列对应于SEQ ID NO: 10和SEQ ID NO: 11以及SEQ ID NO: 12和SEQ ID NO: 11。比如DsRed-F1和DsRed-R1引物对的PCR产物为173bp，DsRed-F和DsRed-R引物对可特异性扩增出823bp的序列，说明蛾圈蚕卵的亲本DNA中检测到了代表DsRed片段的特异性条带；用Heavy-g-F和Heavy-g-R引物对可扩增出523bp的序列，代表蚕蛾的基因组中有蜘蛛丝基因。当用Left-F1和left-R2引物对的PCR产物为模板（2033 bp），再用Left-F2和Left-R2引物对PCR时，可扩增出480bp的特异性片段，说明蛛丝蛋白基因的表达盒的左侧已按设计要求整合进家蚕基因组；同样，当用Right-F1和Right-R2引物对的PCR产物为模板（3210 bp），再用Right-F2和Right-R2引物对PCR时，可扩增出995bp的特异性片段，说明DsRed表达盒的右侧已按设计要求整合进家蚕基因组。PCR扩增结果符合上特征的亲本蚕蛾的后代为本发明需要的蛾圈蚕卵。为了进一步确定PCR产物的正确性，将PCR产物克隆到载体中进行Sanger测序验证。除上述鉴定方法外，也可以根据理论上的打靶区域，整合进家蚕基因组的外源DNA片段的理论序列，设计其他特异性引物，通过PCR扩增及其产物Sanger测序进行。如果pUC-target-Heavy-g中的DsRed基因用GFP基因替代，则筛出代表GFP基因片段的特异性条带，如果pUC-target-Heavy-g中的3×P3启动子用肌动蛋白A3启动子替代，则筛出红色荧光片段的特异性条带。

本发明中，步骤（5）中，特异性引物对为检测所获得的蚕是否为纯系打靶蚕的引物对，具体为利用特异性引物PCR检测蚕蛾DNA，并对PCR产物进行Sanger测序验证。保留亲本为基因打靶蚕蛾交配所产的卵，催青后，正常饲养，化蛾后，同蛾区交配；然后PCR检测，PCR产物Sanger测序鉴定相应的蚕蛾，选择䧳雄亲本均为纯系的基因打靶蚕蛾交配所产的卵继代。设计特异性引物FibH-F和FibH-R，其序列分别为SEQ ID NO: 13、SEQ ID NO: 14，对同蛾区交配后代进行PCR检测和Sanger测序，如果能扩增出187bp的特异性条带，则检测对象为非纯系打靶家蚕；如果扩增不出187bp的特异性条带，则检测对象为纯系打靶家蚕。因纯系基因打靶蚕已没有fib-H基因，因此也可以根据fib-H基因序列设计其他引物进行PCR、RT-qPCR验证；也可以通过检测是否表达Fib-H蛋白进行验证。

在本发明中，步骤(6)中，步骤(5)获得的蚕卵孵化后，常规饲养至熟蚕，将熟蚕移至簇具，营茧，采茧，经过缫丝获含金丝织网蜘蛛大壶状腺丝蛋白的复合蚕丝。经测定，获得复合蚕丝的断裂强度提高30%，弹性提高28%。

本发明所述的制备一种基于基因打靶家蚕制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维，也可以通过以下方案实现：（1）先制备表达Cas12a核酸酶的转基因家蚕BmCas12a，即将piggyCPF1质粒与表达piggyBac转座酶的Helper载体注射至家蚕初产卵混合，通过绿色荧光筛选和Cas12a基因的PCR鉴定获得转基因家蚕BmCas12a；（2）将pUC-target-Heavy-g注射转基因家蚕BmCas12a的初产卵，然后通过上述步骤（3）-（6）获取基于基因打靶家蚕制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维。

纯系打靶家蚕可以作为育种素材，与现行品种杂交，通过常规育种，可进一步提高产丝量和/或抗病性。

通过上述技术方案可获得MaSp-g基因替代fib-H基因的打靶家蚕，及基于基因打靶家蚕制备的蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维，由于上述技术方案运用，本发明与现有技术相比具有下列优点：

(1)定向、大幅度提高蚕丝的机械性能：传统的家蚕育种技术难以明显提高蚕丝纤维的机械性能，本发明利用新型基因组编辑技术和同源修复技术，用具有优良机械性能的蜘蛛丝蛋白基因替换家蚕丝素重链基因，实现定向、大幅度提高蚕丝的机械性能。

(2)丝纤维中蜘蛛丝蛋白的含量明显高于piggyBac转座子介导获得的转蜘蛛丝蛋白基因家蚕丝纤维：常规提高蚕丝机械性的方法是通过基于piggyBac转座子介导的家蚕转蜘蛛丝蛋白基因，通过该技术生产的丝蛋白中，蜘蛛丝蛋白的含量低（2-5%），丝纤维机械性能提高的幅度有限。本发明技术所生产的丝纤维中，蜘蛛丝蛋白的含量可达到30%以上，丝纤维机械性能提高幅度明显。

(3)采用新型的CRISPR/Cas12a技术有效提高基因组编辑效率：已有的通过基因组编辑改善丝纤维机械性能的研究仅有2篇报道，分别是通过TALEN介导的同源定向修复和基于CRISPR/Cas9基因组编辑的定向插入。前者为早期的基因组编辑技术，技术繁琐，已被淘汰；后者由于脱靶频率高，获得目标基因组编辑家蚕的效率较低。本发明采用新型的CRISPR/Cas12a技术，设计的U6-gDNA array元件表达gRNA array 能同时靶向某一基因组的不同区域，有效减少脱靶频率，提高了编辑效率。

(4)选择的蜘蛛丝蛋白基因为全长的MaSp-g基因：由于MaSp基因较大（编码蛋白的分子量超过200kDa），且MaSp蛋白为特定氨基酸的高度重复，表达水平极低，因此以往的研究中所选择的蜘蛛丝蛋白的DNA序列多为MaSp重复单元的多次重复串联体，缺少天然蜘蛛丝蛋白的N、C端结构域，重组丝蛋白的分子量也大多低于100kDa，但蜘蛛丝机械性能与重组蛋白的分子量呈正相关。本发明选择的蜘蛛丝蛋白基因为完整的全长MaSp-g基因，蛋白的分子量高达230kDa。

附图说明

图1为实施例一中pUC-target-Heavy-g的结构与打靶策略示意图；以家蚕fib-H基因的旁侧序列为同源臂，中间插入Fib-H 启动子控制的密码子优化的全长金丝织网蜘蛛大壶状腺丝蛋白MaSp-g基因和3×P3启动子控制的DsRed基因表达盒，在同源右臂下游设计了U6启动子控制的gDNA array，其转录产物gRNA能靶向Fib-H基因的不同区域。该质粒导入蚕卵后，通过CRISPR-Cas12a基因组编辑系统，在Cas12a的作用下对Fib-H基因座进行切割，进一步通过同源重组实现MaSp-g表达盒、DsRed基因表达盒替代fib-H基因座。

图2 为实施例一中G0代家蚕的PCR检测DsRed电泳图，引物对为DsRed-F1和DsRed-R1。泳道M，标准分子量DNA；泳道Pos，阳性对照（pUC-target-Heavy-g质粒）；泳道Neg，正常家蚕，泳道1-29，G0代蚕蛾。

图3为实施例一中，G1-G4代转基因家蚕的筛选与鉴定结果图；随机选取G1-G4代蚕蛾，抽提基因组DNA，用Heavy-g-F、Heavy-g-R引物对进行PCR扩增，PCR产物回收后，克隆进pMD-19-T载体，进行Sanger测序。上列：PCR产物的电泳检测，泳道M，标准分子量DNA；PC：阳性对照（pUC-target-Heavy-g质粒），其它泳道为G1-G4代蚕蛾DNA；下列：为代表性PCR产物的Sanger测序图。

图4为实施例一中基因打靶家蚕的PCR鉴定电泳图；M，DNA Marker；NC，普通家蚕；PC1，pUC-target-Heavy-g DNA用Heavy-g-F和Heavy-g-R引物对进行PCR；MaSp-g，基因打靶家蚕DNA用Heavy-g-F和Heavy-g-R进行PCR；PC2，pUC-target-Heavy-g DNA用dsRed-F和dsRed-R引物对进行PCR；DsRed，基因打靶家蚕DNA 用dsRed-F和dsRed-R引物对进行PCR；PC3，pUC-target-Heavy-g用Left-F2和Left-R2进行PCR；Left, 基因打靶家蚕DNA 用Left-F1和Left-R2引物对扩增，扩增产物再用Left-F2/Left-R2扩增；PC4, pUC-target-Heavy-g用Right-F2/Right-R2扩增；Right，基因打靶家蚕DNA用Right-F1和Right-R2引物对扩增，扩增产物再用Right- F2和Right-R2引物对扩增；Fib-H，基因打靶家蚕DNA用FibH-F/FibH-R引物扩增。

图5为实施例一中PCR产物的测序结果图；C1: 图4中Left泳道PCR产物的 Sanger测序，红色框内为Left-F2和Left-R2引物。C2: 图4中MaSp-g泳道PCR产物的Sanger测序，红色框内为引物Heavy-g-F和Heavy-g-R。C3: 图4中dsRed泳道PCR产物的Sanger测序，红色框内为dsRed-F和dsRed-R引物。C4:图4中Right泳道PCR产物的 Sanger测序，红色框内为Right–F2和Right–R2引物。

图6为实施例一中基因打靶家蚕后部丝腺MaSp-g基因表达检测结果图；A: qRT-PCR检测。提取五龄第4日后部丝腺RNA, qRT-PCR检测转基因家蚕MaSp-g基因的表达，引物为MaSp-g-F和MaSp-g-R，其序列对应于SEQ ID NO: 17和SEQ ID NO: 18。内参为TIF4A，扩增引物对为TIF-4A-F和TIF-4A-R，其序列对应于SEQ ID NO: 19和SEQ ID NO: 20。同设正常Nistari蚕对照组。CON，正常Nistari蚕；H-1和H-2, 基因打靶家蚕。B, Westernblotting检测。五龄第4日后部丝腺总蛋白，经10%SDS-PAGE分离后（60 μg蛋白/泳道），进行Western blotting检测。一抗为MaSp-g抗体（兔抗1：1000），二抗为HRP标记的山羊抗鼠IgG（1:5000），内参为α-tubulin（鼠抗，1:5000）。同时设置正常Nistari对照组。NC，Nistari对照；Silk gland，基因打靶家蚕。

图7为实施例一中蚕丝蛋白中的MaSp-g检测结果图；A，Western blotting检测。丝素蛋白质溶液经过10% SDS-PAGE 分离后（80 μg 蛋白/泳道），进行Western blotting 检测。一抗为MaSp-g 抗体（兔抗1：1000），二抗为HRP 标记的山羊抗鼠IgG（1:5000）。同时设置正常原种Nistari家蚕茧蛋白样品为对照组。M，蛋白Marker；NC，正常丝素蛋白质；Silkprotein，打靶家蚕丝素蛋白。B，丝蛋白的质谱鉴定图。表明检测到代表蛛丝蛋白的肽段。

图8为实施例一中的蚕-蜘蛛嵌合丝纤维的应力-应变图；Normal silk，正常蚕丝；Chimeric silk，基因打靶家蚕蚕丝。

图9为实施例二中NQS F1代蚕的检测结果图；A，RT-PCR 检测NQS 中MaSp-g 基因的表达，所用引物对为MaSp-g-750-F和MaSp-g-750-R，其序列分别对应于SEQ ID NO: 21和SEQ ID NO: 22。泳道M：DNA Marker；泳道NC:菁松品种蚕；泳道CON：灭菌双蒸水；NQS丝腺组织：NQS F1代丝腺。提取五龄第4日后部丝腺总RNA，RT-PCR 检测。B， PCR 检测NQS F1代中的DsRed-SV40片段，所用的引物对为SV40-F和SV40-R，其序列分别对应于SEQ ID NO: 23和SEQ ID NO: 24。泳道M：DNA Marker；泳道PC：pUC-target-Heavy-g，其他泳道：NQS F1蚕蛾基因组。C，DsRed-SV40 片段的Sanger测序结果，方框示为SV40-F 和 SV40-R 引物序列；D，Western blotting 检测丝腺MaSp-g 表达。五龄第4 日后部丝腺总蛋白，经过10% SDS-PAGE 分离后，进行Western blotting 检测。一抗为MaSp-g 抗体（兔抗1：1000），二抗为HRP标记的山羊抗鼠IgG（1:5000），内参为α-tubulin（鼠抗，1:5000）。泳道M，蛋白Marker；泳道CON，菁松对照；泳道NQS，NQS F1代丝腺。

具体实施方式

本发明涉及的具体操作方法为常规方法，比如克隆、酶切、蚕卵注射与孵育至化蛾的整个过程的具体操作；涉及的测试方法也为常规技术；除了特别指出设计的序列、载体外，涉及的原料试剂都为常规产品。下面结合附图及实施例对本发明作进一步描述：

实施例一制备MaSp-g基因替代家蚕fib-H基因的基因打靶家蚕以及制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维

（1）pUC-target-Heavy-g质粒的构建：按SEQ ID NO: 1序列委托商业公司从头合成，为常规技术，其结构和打靶原理如图1所示。即以家蚕fib-H基因的旁侧序列为同源臂，中间插入Fib-H 启动子控制的密码子优化的全长金丝织网蜘蛛大壶状腺丝蛋白MaSp-g基因表达盒、3×P3启动子控制的DsRed基因表达盒，在同源右臂下游插入了U6启动子控制的gDNA array，其转录产物gRNA能靶向Fib-H基因的不同区域。该质粒导入蚕卵后，通过CRISPR-Cas12a基因组编辑系统，在Cas12a的作用下对Fib-H基因座进行切割，进一步通过同源重组实现MaSp-g表达盒、DsRed基因表达盒替代fib-H基因座。

（2）表达Cas12a核酸酶的质粒piggyCPF1的构建：按SEQ IDNO: 2委托商业公司从头合成，为常规技术。

（3）蚕卵显微注射：家蚕（品种Nistari）产下3小时蚕卵显微注射pUC-target-Heavy-g（4500ng/μL）和piggyCPF1(15000 ng/μL)混合物(V∶V=5∶1)，每粒卵注射10nL，共注射1140粒蚕卵。

（4）饲养、制种：蚕卵25℃催青，孵化率24.9%，蚁蚕常规饲养至上簇、结茧、成蛹和化蛾，共获得68 个蛾；雌雄交配，获29 个蛾圈蚕卵。

（5）蚕蛾基因组DNA抽提：用苯酚、氯仿抽提29个蛾圈的亲本DNA，并调节DNA浓度至1μg/μL。

（6）DsRed的PCR检测：以步骤（5）的DNA为模板，用DsRed-F1和DsRed-R1引物对进行PCR扩增，扩增的条件为95℃预变性5分钟后，按95℃变性50秒，55℃退火50秒，72℃延伸20秒，扩增35个循环，尔后，72℃保温10分钟。PCR产物用1%的琼脂糖凝胶电泳，结果如图2所示，在14 个蚕蛾的DNA中检测到了代表DsRed 片段的特异性条带（173 bp）。

（7）G1代制备与PCR检测：PCR检测亲本DsRed呈现阳性的蛾圈，催青孵化后，正常饲养至结茧、化蛹和化蛾，同蛾区雌雄蛾间交配、产卵，获G1蚕卵，并保存其亲本雌雄蛾，即G1代蚕蛾。提取G1代蚕蛾的DNA，用Heavy-g-F和Heavy-g-R引物对进行PCR扩增，扩增的条件为95℃预变性5分钟后，按95℃变性50秒，55℃退火50秒，72℃延伸35秒，扩增35个循环，尔后，72℃保温10分钟，PCR产物用1%的琼脂糖凝胶电泳，结果如图3所示。PCR产物（523bp）回收后，克隆进pMD-19-T载体，进行Sanger测序，结果显示，其序列为MaSp-g的序列。

（8）G2-G4代制备与PCR检测：G1代蚕蛾所对应的G1代蚕卵催青孵化后，正常饲养至结茧、化蛹和化蛾，同蛾区雌雄蛾间交配、产卵，获G2蚕卵，并保存其亲本雌雄蛾，即G2代蚕蛾。同理，依次获G3、G4代蚕卵以及相应的G3、G4代蚕蛾。按上进行PCR检测和Sanger测序，结果如图3所示。对G1-G4代的不同蚕蛾DNA，用Heavy-g-F 和Heavy-g-R引物对进行PCR扩增，可扩增出523bp的特异性条带；Sanger测序证实扩增产物为MaSp-g的序列。

G4代蚕卵催青孵化后，正常饲养至结茧、化蛹和化蛾，同蛾区雌雄蛾间交配、产卵，获G5代蚕卵。

（9）基因打靶纯系的鉴定：为了排除MaSp-g基因随机整合进家蚕基因组的可能性，随机取G5代蚕蛾，提取基因组DNA，用不同的引物对进行PCR鉴定，PCR产物用1%的琼脂糖凝胶电泳。结果如图4所示，用Heavy-g-F、Heavy-g-R引物对可扩增出与理论值（523 bp）一致的MaSp-g 片段；DsRed-F、DsRed-R引物对可扩增出与理论值（838 bp）一致的DsRed片段；用靶向fib-H基因组的上游序列引物Left-F1和靶向pUC-target-Heavy-g中的同源左臂的引物Left-R2进行PCR，扩增出与理论值（2033 bp）相符的产物，回收产物，利用靶向同源左臂的引物Left-F2和Left-R2进一步PCR扩增，可扩增出与理论值（480 bp）一致的PCR 产物；用靶向pUC-target-Heavy-g中的同源右臂的引物Right-F1和靶向fib-H基因组的下游序列的引物Right-R2进行PCR，可扩增出与理论值（3210 bp）相符的PCR产物，回收产物，进一步用靶向pUC-target-Heavy-g中的同源右臂Right-F2和Right-R2进行PCR 扩增，可扩增出与理论值（995 bp）一致的特异性条带。测序结果如图5所示，这些PCR产物的序列与基因打靶设计的结果完全一致，且用FibH-F、FibH-R引物对不能从蚕蛾基因组中扩增到Fib-H的基因片段，所检测的蚕蛾基因组中已无fib-H基因。这些结果证明，MaSp-g已按设计要求替代了fib-H基因，正确整合进家蚕基因组，并获得纯系基因打靶家蚕。

引物对Heavy-g-F和Heavy-g-R的序列对应于SEQ ID NO: 3和SEQ ID NO: 4；Left-F1、Left-F2、Left-R2的序列对应于SEQ ID NO: 5、SEQ ID NO: 6和SEQ ID NO: 7；DsRed-F和DsRed-R的序列对应于SEQ ID NO: 8、SEQ ID NO: 9；Right-F1和Right-R2、Right-F2的序列对应于SEQ ID NO: 10和SEQ ID NO: 11、SEQ ID NO: 12；FibH-F和FibH-R的序列分别为SEQ ID NO: 13、SEQ ID NO: 14；dsRed-F1和dsRed-R1的序列对应于SEQ IDNO: 15、SEQ ID NO: 16。

本发明首先鉴定是否是转基因蚕，再鉴定转基因蚕是否是基因打靶蚕，即蛛丝基因是否替代了家蚕丝素重链基因；最后，鉴定所获得的蚕是否纯系打靶蚕：即二条同源染色体上的家蚕丝素重链基因均被蛛丝基因替代。

（10）后部丝腺表达MaSp-g检测：提取G5代5龄第4天家蚕后部丝腺总RNA，用MaSp-g-F、MaSp-g-R引物对通过qRT-PCR检测MaSp-g基因的相对表达水平；选择的内参基因为真核生物起始因子4A（TIF4A）基因，定量引物为TIF-4A-F和TIF-4A-R，结果如图6所示，在非转基因对照组家蚕（品种Nistari）中检测不到MaSp-g的表达，而在打靶家蚕可明显检测到MaSp-g 的表达（图6中A）。同时，对G5代5龄家蚕第4天后部丝腺，用MaSp-g抗体进行Westernblotting 检测，以α-tubulin为内参蛋白。结果显示（图6中B），在基因打靶蚕的后部丝腺样本中可观察到特异性的信号条带（225.35 kDa），而在非转基因对照组家蚕中检测不到，表明成功表达了MaSp-g。

（11）基因打靶家蚕茧中MaSp-g检测：基因打靶家蚕茧脱胶后，提取丝素蛋白质溶液（常规方法），经SDS-PAGE分离后，用MaSp-g抗体进行Western blotting检测，可以检测与MaSp-g理论分子量（225.35 kDa）相符的特异性信号条带，而非基因打靶对照蚕（品种Nistari）中检测不到MaSp-g的特异性信号，证明表达的MaSp-g进入到蚕茧（图7中A）。进一步，回收PAGE 胶上的特异条带，进行质谱鉴定，结果显示，可检测到来自MaSp-g的特异性肽段（图7中B），证明打靶家蚕中表达的MaSp-g分泌到蚕茧中。

（12）蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维的制备：G5代蚕正常饲养至熟蚕，将熟蚕移至簇具，在25℃环境下营茧，7天后采茧；蚕茧烘干后贮藏；缫丝前，贮藏干茧脱胶后，经过缫丝获得蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维。实际生产上，可将G5代后的蚕正常饲养获得蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维。

蜘蛛丝蛋白与家蚕丝蛋白复合丝纤维的机械性能：随机选G5代蚕茧8粒，脱胶后，取2个不同区域的丝进行单纤维机械力学性能测试。结果显示，蚕-蜘蛛嵌合丝纤维的平均最大应力为449.33 MPa，与非转基因对照组相比提高了30.03%，平均最大弹性应变为13.88%，与对照组相比提高了28.60%（图8）。

实施例二基因打靶纯系与现行品种菁松蚕杂交后代制备蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维

（1）基因打靶纯系的获取：同实施例一步骤(1)-(9)。

（2）制备NQS F1代蚕卵：饲养步骤（1）的基因打靶纯系家蚕并使其发育至蚕蛾，与家蚕品种菁松蚕蛾交配，雌蛾产下的卵为NQS F1代蚕卵。

（3）NQS F1代蚕的检测：NQS F1代蚕卵催青，孵化后正常饲养，至5龄第4天，取丝腺组织，提取RNA，反转录成cDNA后，用引物MaSp-g-750-F（SEQ ID NO: 21）和MaSp-g-750-R（SEQ ID NO: 22）进行PCR检测，从检测NQS F1丝腺cDNA中均可扩增出与理论值一致的750bp 特异性条带（图9中A）。提取NQS F1代蚕蛾基因组，用SV40-F(SEQ ID NO: 23)、SV40-R(SEQ ID NO: 24)引物进行PCR 鉴定，可检测到与理论分子量（426bp）相符目的片段（图9中B），测序结果显示，该PCR产物的序列为带有SV40加尾信号的DsRed的部分序列，来源于pUC-target-Heavy-g质粒（图9中C）。对NQS F1代家蚕丝腺总蛋白用MaSp-g抗体进行Westernblotting检测，可观察到代表MaSp-g的特异性条带（图9中D），说明MaSp-g在NQS F1系统中表达，MaSp-g基因能通过杂交传代。

（4）蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维的制备：NQS F1代蚕正常饲养至熟蚕，将熟蚕移至簇具，在25℃环境下营茧，7天后采茧。蚕茧烘干后贮藏。缫丝前，贮藏干茧脱胶后，经过缫丝获得蜘蛛丝蛋白-家蚕丝蛋白复合丝纤维。

本发明涉及的具体序列如下。

SEQ ID NO:1

TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGGAGATCGGTACTTCGCGAATGCGTCGAGATATTCTCGTCGAAGTTTGTTTTTGAAACTATATCAATAACTTTTCATTATCCGTTCTTCGTCTTTTGTCTTTTTTTCGCAAACAAAACGAACAAAACGTTCTAATTCGAAAGATGTTTTGTACGGAAAGTTTGAATAAGTGCTTAATTGCAAGTAACGTAACAATGTTTTAGGGTTCGGTCCTCAATAAATTCGACCAATAAACCATACAAATTCTTTAACATTTTTTTAATCTTATACTAGCTGACCCGGCAGACTTCGTGGTGCCTCAATCGATAAATAAAATACCTATGCTTCTGTATAAAATAAACATAAAACAAACAAAAGGAATCCGTCCGACGGGAGACACATCAAAGGAAAAACATCTTTTTTATTTTTTTACCTTTTAAACCTTCTCTGGACTTCCACAAATAATTTAAGACCAAAATTAGCCAAATCGGTCTAGCATTTTCGAGTTTTAGCGAGACTAACGAACAGCAATTCATTTTTATATACACAGATTTATGTTACCGGGGTCTAGTGACCTAAACGACTTCAGCTCTAACACTAGGCTAACTCAGGCTTAGTAGCCTGGTCCTAGTGTTAGATTTGAAGTCGTCTAATGCAAAGATTATTGGATCTGATGGATCCGTAAGGACGTGTCTAGAGCGTCGACGGTGACTAGCTCCTGCGTGATCAGGAAAAATGTGGAAAGCTTAACGATTTTGTCACATTTTACTTATCACAACTTGTTTTTATAATAATTCGCTTAAATGAGCAGCTATTACTTAATCTCGTAGTGGTTTTTGACAAAATCAGCTTCTTTAGAACTAAAATATCATTTTTTTCGTAATTTTTTTAATGAAAAATGCTCTAGTGTTATACCTTTCCAAAATCACCATTAATTAGGTAGTGTTTAAGCTTGTTGTACAAAACTGCCACACGCATTTTTTTCTCCACTGTAGGTTGTAGTTACGCGAAAACAAAATCGTTCTGTGAAAATTCAAACAAAAATATTTTTTCGTAAAAACACTTATCAATGAGTAAAGTAACAATTCATGAATAATTTCATGTAAAAAAAAAATACTAGAAAAGGAATTTTTCATTACGAGATGCTTAAAAATCTGTTTCAAGGTAGAGATTTTTCGATATTTCGGAAAATTTTGTAAAACTGTAAATCCGTAAAATTTTGCTAAACATATATTGTGTTGTTTTGGTAAGTATTGACCCAAGCTATCACCTCATGCAGTATGTCGTGCTAATTACTGGACACATTGTATAACAGTTCCACTGTATTGACAATAATAAAACCTCTTCATTGACTTGAGAATGTCTGGACAGATTTGGCTTTGTATTTTTGATTTACAAATGTTTTTTTGGTGATTTACCCATCCAAGGCATTCTCCAGGATGGTTGTGGCATCACGCCGATTGGCAAACAAAAACTAAAATGAAACTAAAAAGAAACAGTTTCCGCTGTCCCGTTCCTCTAGTGGGAGAAAGCATGAAGTAAGTTCTTTAAATATTACAAAAAAATTGAACGATATTATAAAATTCTTTAAAATATTAAAAGTAAGAACAATAAGATCAATTAAATCATAATTAATCACATTGTTCATGATCACAATTTAATTTACTTCATACGTTGTATTGTTATGTTAAATAAAAAGATTAATTTCTATGTAATTGTATCTGTACAATACAATGTGTAGATGTTTATTCTATCGAAAGTAAATACGTCAAAACTCGAAAATTTTCAGTATAAAAAGGTTCAACTTTTTCAAATCAGCATCAGTTCGGTTCCAACTCTCAAGATGAGAGTCAAAACCTTCGTGATCTTGTGCTGTGCTCTCCAATACGTGGCCTACACAAACGCTCCATGGAGCGACACCGCTACAGCCGATGCTTTCATTCAAAATTTCCTCGGTGCCGTCTCCGGATCTGGTGCTTTCACCCCTGACCAGCTGGACGATATGGCTACTGTGGGAGACACCATTATGTCCGCCATCGATAAGATGGCTAGAAACAATAAGTCATCTAAGAGTAAGCTCCAGTCACTGAAAATGGCCTTCGCTTCATCAATCGCTGGTATTGCTGCCGTTGAACAAGGTGGACAGTCGATGGACATCAAGACCAACGCCATTGCTAATGCCTTGGATTCGGCTTTCTACATGACAACTGGAAGTACAAACCAACAGTTCGTCAATGAAATGAGAAGTCTCATATCAATGATCTCTGCTGCCAGCGCCAACGAAGCTAGCTACGGCGGTGGAGCTTCCGCTGCCGCTGCCACAGCTGGCGGTTACGGTCAAGGAGCTTCCGGTTACGATCCTGGACTGTCCCCAGCTTCGGCTGCCGCTCCTAGTGGCTACGGTCCATCAAAGAGAGAACCTTCAGGTATTGGTGCCGCTGCCGCTGCCCCATCTGAATACGGTTCGAGTCAACAGGGCCCGAGTGGTACAAAAGCTGCCACTATCGCTGCCGCTAAGAGAGGCCCCACTAGCTACGGTCCTAGACAACAACGCCCTGGTGGTTCTGGAGCTCCTGCCGCTACCGCTGGTAGAGGACCGGGTGGATACGGACCCGAACAACAAGGACCTAGAGGCTCAGGAGCCGCTGCCGACGAAGCTGGACCAGGACAACAGGAACCGGGTGCTGATGCTGCCGCTGCCTTCGGTAGTGGATCAGGCGAACAGGGTCCAGGAAGATTCGACGCTGCCGCTGCCACTGCTAAATCGAGAGGCAATGGTCCTGGACAACAGGGCTCTGGTGTCGCTTCAGCTGCTGCTGCTGGTAGTGAACCCAGAGGATACGGCCCTGGTCAACAAGCTCACAGAGGACACGGCGCTGCCGCTGCCGCTACTGGAAGCGGCGGTTACGAACCAGGACAACAAGGACCTGGTGGTCCTTCCGCCGCTGCCGCTGGTTTGGGACCAGGTGGATACGGTCCGAGAAAACAAGGACAAAGAAGACCCGCCGCTACCGCCGCTGCCGCTGAAACAGGCGGTTACGGTCCTAGAATACAGGGAACAGGAGCCGCTGCCGCTGCCGCTACCGGAAGAGGACCCGGAGGCTACGGTCCTGGACAACAGGTTCCAGGTGGATCTGGAGCTGTCAAGGCCGCTGATGGACCTGAAAGTTTCGGACCTGGTCAGCCTGGCGGTCCTGGAGCCGCTGCCACAGCTGGCGCCAGAAGAGGACCGGGAGGCTACGGACCTGGACAACAAGAACCTGGAAGACCATCTGTGGCTGCCGCTAGTGCTGGCTCAGGTGGATACGGTCCTAGACAACAGGGACCAGGCGGTTACGCTCCGGGACAACAGGGTCCTGGAGTTCCTGGTGCTACTGGAGCCGCTGCCGCTGGCAGAGGTTCAGGATACGCTAATGGCAAAAAGGTCCCGGGAGGCCCTGGCGCCGCTGCCGCTGCCGCTACTGGGTCTACACCTGGAGCTTACGGCCCTGGTCAACAGGGACCAGGTGGAGACGATCCGAAACAACAGGCTCCCGCCTCATCTAGCGCTACAGAAGCCGCTGCCGGACCTAGAGGATACGGCCCAGGTAAACAAGGTCCTGGTGCTGCCGTCGCTGTTGCTGCCGGTTCTGGACCCGGCGGTTACGGCCCTCGTCAGCAGGGTCCTGGAGGCCCAGCTATAGGCCCAGGTGTTTACGGACCGGGCCAACAGGGTAAAAGAGTCTACGGTCCCGGTCAGCAAGGACCTGGTGGATTCGGTGCTGCCGCTGCCACTGCTGCCGGCCCTGGTGACTACGGTCCTGATAAGAGAGGACCGGGCGGTCCTGGAGTTGCTGCCGCTGGAAGAGGCAGCGGTAGACCAGGATCCGCCGCTGACGCTACAGCCGGATCTGGTCCCGGAGGCTACGGTCCAGGACAACAAGGACCAGGAGCCGCTGCCACTGCTGCCTCTGGATCTGGACCGGGTGTTTACAGACCCAGACAATCTGGTGGACCAGGTGCTGCCGTCGGAGCTGCTACTAGAAGAGGATACGGCTACGGACCAGGACAACAGGGTCCTGAGGGACCAGGAGCTGTTGCTGCCGCTGCCGCTGGATCTGAACCTGGCGGTTACGGACCAGGCCAACAGGGCAAGGAAGGTTACGTCAGTGGTGAACAGGAGCCAGGAGATTCTGGATCGGCCGCTGCCGCTTTCGGTCCTGGAGTGTCTGGACCCAAACAACAGGGCCCTGGTGAAAAGGCCGCTGCCGCTAGTGGATCAGGCACAAGAGGTTATGGTCCAGGCCAACAAGGTCCGGGAGGCCCTGGTGCCGCTGCCGCTACTGAAGCTGGTAGAGGATCAGGTGGATACGGCCCAGGTCAACAGGGTCCGGAAGGATCTGGCGTTGCCGCTGCCGCTGCCGCTCGTCCCGGCGGTTACGGTCTCGGACAAGAAGGCCCAGGTTCGGCCGCTGCCACAGCTGCCGGAAGAGGAATAGAAGGTCACGGACCTGGCCAACAAGGACCTGGAGGCCCAGGTGCTGCCGCTGCCGCTGCCACCGGTAGAGGACAAGGTGGATACAAACCCGGTCAGAAGGGACCTGGCGGTTACGGAACAAGACAACAAGGACCTGAAGAACCTGGTTCTGATGCTGCCGCTACTAATGGCACCGGTCTCGGACAGGAAGGACCTGGAGGCCCTGTTACTGCCGCTGTCGCCGCTGGCTCTGGTCAACAGAAGTTGAGTGCCGCTGCCGCTGCCACCGCTGGAAGAGGATTGGGTGGATATGGACCAGGACAACAAGGTCCGGCTGCCACTGCTACCACAGCTGGCCGCGGTCTGGGCGGTACTGGAGCTGCCGCTGAAGCCGCTGCCGGACGTGGTCCCGGAGGCTATGGACCTGGACAACAGGAAGCTGGCGTGTCGGGTGAAGCTGCCGAAGCTGCCGGCCCTGGTCCTCCACCGCAAGGACCTGGCACTGCTGCCATCGCTGCCGCTGGTAGTGTGCCAGGTGGATACGTTCCTGGACAGAGAGGTACCGGCGGTCCAGCCGCTGCCGCTGCCACTGGTCTCGGAGGCTACAAACCCGGTCAACAGGGACCTGGTGGATACGCTCCAGGCCAAAAGGGTCTGGAAGCTACCGCTGCCGGTAGAGGAAGCGGCTACGGTCCCGCTAAACAGGTGCCGGGCGGTCCTGGAGCTGCCGCTGCCGCTGCCGAACCTGGACCCCCTGGCGAATACGGTACAGAAAAAAGAGGACCGAAAGGAGACGGACCAAAACAGCAAGCTGCCGCTGGATCCTCGGCCGCTGCCGCTGCCGGCAGTTCAGCTGCCGCTGCCGCTACAGGTCCTCAAGGTTATGGTCCTGGACAACAAGGTCCTGGAGCTACTGCCTCGGCCGCTGCCGGAAGTAGACCCGTCAGATACGGACCTGGTCAAAAGGGACCTGGTGCAGGACCCGGAGGCTACGAACCTGGTCAGCAAGGTCCTGGTGGACCTGGAAGCGCTGCCGCTGGCCCAGGCGGTTACGGTCCGGCTCAACAAGGACCTGGTGTGCCATCCGCCGCTGCCGGCAGAAGAGGTTTGGGATACGGCCCCGGTAAACATGGACCTAGCGCTGCCGCTGCCGCTGCCGCTGGAAGCGGCCCTGGTGGTTACGGTCCGGGACAACAGGGTAAAGGTGGATATGGTCCCGGTAAACAAGAACCTGGTAACTTCGGGGCCGCTGCCGCTGCCTCGGGACCAGGCGGTTACGGACCGGGCAAAGAAGGTCCCGGAAGTGCTGATGCTGCCGCTGCCAGAAGAGGACCTGGAGGCTACGGCCCAAAACAAAAAGGTGCTGCCGCTATGGCCGCTGCCGCTGCCGGTTCAATCCCTGAAGGCTACGGTCCCGTCCAACAAGGACCTGGCGTGTCAGGAGCTGCCGCTGCCACTACCTCTGAACCGGTGGGTTACGGAGCTGGCCAAGAAGGTCACGGAGCAGTCGCTGCCGCTACAGCTGGCAGAGGTCCAGGTGGATACAGACCGGGCCTGTACGGTCCCGGCGGTTCTGGTAGCGCCGCTGAAGCCGCTGGACCTGGAGGCTATGGTTCAAAACAACAGGGTACAATTTCTACTGCCGCTGCCGCTGCCGGATCAGAACCTGGTGGATACGGACCTGGTCAGCAAGGACCGGGCGGTTCTGGAGTTGCTGCCGCTACCGAAGAAAGAAGAGAACCCGGAGGCTACAAGCCTGGTCAGCAAGGCCCTGGTGGACCATCTGTGGCCGCTGCCTCTGCTGGCCTCGGCGGTTACGGTCCAGGACAGCAAGGTCCGGGAGGCCCAAATGGACCTGGTCAACAGGGTCCTGGTGGATCAGGTGTTGCTGCCGCTACTGAAGAAAGAAGAGAACCAGGCGGTTACAAGCCGGGTCAACAAGGTCCTGGTGGTCCTTCTGTGGCCGCTGCCTCCGCTGGACTGGGTGGATACGGCCCTGGACAACAAGGACCCGGCGGTCCTTCTGTTGCTGCCGCTAGTGCTGAATTGGGAGGCTACGGCCCCAGACAGCAAGGCCCTGGTGGATACGCTCCTGGTCAGCAGGGTCCGGGCGGTTACGCTCCAGGTAGACAAGGTCCAGGAGTTCCTTGTGCTGCTACAGCCGCTGGCGCTGGTTCTGGTTATGGTCCTGGCCAACAGGTCCCCGGAGGCCCAGGAACAACTGCCGCTGCCGCTGCCGGAAGCACTTCTGTCGAATACGGACCTGGCCAACAGGGTAGAAAAGGTGACGGACCTAAGCAACAGGCTCCAGCCGGATCTAGCGATGCTGCCGCTGCCGCTGGCCCGAGAGGCTATGGCCCTGGACAACAGGGACCTGTTGCCGCTGCCTTGGCTGCCGCTGGCTCTGGTCCAGTGGGTTATGGACCTGGTCAAAGAGGACCTGGTGCCGCTGTGGCTGCTTCTGCTGGTAGCGGACCTCTCGGCTACGGTCCAAGACAACAGGGTCAAGTGGGACACGGCAGAGCCGCTACTGCTGAAGCCGGTAGAGGACCGGGCGTTTACGAGCCTGGAGAACAAGGTCCAGGTGGACCTGGTTCAGCCGCTGCCGCTGCCGGTCCTAGAGGATACAGACCACGTCAGCAAGGTCCTGGAGTTCACGGAGCTGCTACCGCTAGAAGAGGCTCTGGATACGGACCAGGCCAACAAGGACCTGAAGCTCCAGGTGCTGCCGCTGCCACAGCTGCCGGTTCTGGTCCCGGCGGTTACGGACCTGGTAAACAGGGTAAAGGTGGTTACGTCCCAGGACAACAGGAGCCTGGCGACTTTGGAGCTGCCGCTGCCGCTAGTGGTTCAGGTGGATACGGACCTGGAAGCGCCGCTGCCGCTGCCGCTGGTAGAGGACCCGGCGGTTACGGTCCTAAACAACAGGGCGCTGGTGCTATGGCTTCAACCGCCGCTGGATCTATCCCTGGTGGTTACGGACCTGGACAGCAAGGTCCTGGTCAGCAAGGACCAGGTGACTTCGGTGCCGCTGCCGCTGAAGCTGCTTCCGGACCAGGTGGATATGGTCCTGGACAGGAAGTTCCTGTTCCTGTGGCTGTTGCCGCTGCCGGTAGAGGACCAGGCGGTTACAGATCAGGACAACAAGGACCGGGAGGCTTCGGATCTACTGCTGCCGCTGCCGGTCCCGGTGGATATGGTCCTGGTCAACAAGGTCCCGGAACAGTTGCTGTGGCTGCCGCTGAATCTGGTCCTGGCGGTTACGGTACTGGTCAACAAGGCCCTGGTGGTCCTAGCGCCGCTGCCGCTTCCGCTGGTCCGGGTGGATATGGCCCTGGTCAGCAAGGACCTGGAGTGCCTGGAGCTGTTGCTACCGCCGCTGCCGTGAGAGGTTCTGGATACGGCGCTGGTCAACAAGTTCCAGGCGGTCCTGGTGCTGCCGCTGCCACCGTCACCGGTAGAAGACCTGGAGGCTATGGCCCAGGCCAACAAGGTCCTGGAAGATTGGATGCTGCCAGCGCTGCCGCTGGCCCTGGTTCCTACGGTCCTGAACAACAGGGACCAGTTGCTAGTGCCGCTGGAAGAGGCCCCGGTAGATACGGTACTGAACAACAGGGACCTGGCAGATACGGTACCGGTCAACAGGGCCCCGGTAGACCTGTCACAGCCGCTGTGGATTCTGGCAGCGAACAACAGGGTCTGTCGGCCGCTGCCGCTGCCGCTGCCGGACGTGGCAACGGTGGATACTTGCCTGGTCAACAAGGACCCGCTGTGGCTGCCGCTGCCGCTGGTCGTGGACTGGGCGGTTACGGCCCGGGTCAACAGGAACCTGGTGGTCCGGGAGCCGCTTTGGCCAATGCTGGCCCTGAAGGTTATGGTCCTGGTCAACAGGGTACTGACGCCGCTGCCGCTACCGCTATTGTTTCAGGACCAGGCGCCGCTACATCCACTGGAAGATCGCCGGAATGCTACGGATCTGAGCAGCAAGGACCCGCTGGTCCTGGAGCTGCCACTGCCGCTGCCGCTGGCAGGGGTCCTGGTGGATACAGATCAGGTGAGCAAGGTCCAGAGGGACCTGGTGCCGCTGCCGCTACTGTGGCTGGTATTGGACCTGGCGGTTACGGTAGCAGACAGGAAGGACCCGGAGGCCCTGTTGCCGCTGCCGATGCTTCCGGCCCAGGTGGATATAGACCAGGACAGCCGGGCGGTCCTGTGGCTACCGCTGCCACAGCTGGCCAGGGTCCGAGAGGTTACGTGCCCGGACAACAGGGCCCTGTGGGAGCTGCCGCTGCCACTTCCAGATCGGGACCTGGTGGTTATGGTCCGGGCAAACAAGGACCTGGAGCTGCCTCCGCTGCCTCGGGACCTGGTGGATACGGTCCAGAACAACAAGGACCTGGTGCTGCCCTCGCTGCCGCTGCCGGATCAGGTCCTGGCGGTTATGGTCCAGGACCTCAGGCTAGTGCTGCCAGATCTAGACTGGCTTTCCCAGACAGTAGATCAAGAGTCTCCTCGGCTGCCTCGAACTTGGTGGCTAGTGGTCCGACAAATTCTGCTGCCCTCAGCAACGCTATTTCCAATACTGTGTCGGAAATAGGAGCTTCATACCCAGGACTGTCTGGCTGTGATGTTCTGGTCCAAGCTTTGATGGAAATTGTTAGCGCCCTCGTCGCTATACTGAGTTCATCTAGCATCGGACAGGTTAACTACGTGGCCGTTTCTCAAAGCGCTCAGGTGGTTTCCCAATCGCTGTTGCAGGCTTTGTACTAAAACGGCCAACGATTTATATGTTTCATGTTAATAGCGATAAAGGTAATATTATTTGGGCACCGTTCCGCACCTCGTTTAATTACCATAGCGGGCACGATGCGATGGTTTCTGTAACGATTCGTCAATTATTTCGTTAATAGAACTACATATAAGACTTCCTTTATCGATATTAATGTGAGCTGAAAACGCAAAACACAATATACGATAGCTTTTATTACATTTAGAACGCAAAATTCATATTGGAAGAACATTAACATGTTTACTGTAAAACTATTTAACTTTTGGATATAACATAAATAAATTACGAACATTAATCGCTGTTTCTAATTTACATCCCCCACAATGGTTAATTCGAGCTCGCCCGGGGATCTAATTCAATTAGAGACTAATTCAATTAGAGCTAATTCAATTAGGATCCAAGCTTATCGATTTCGAACCCTCGACCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCAAACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAACAAGCTAAACAATCGGGGTACCGCTAGAGTCGACGGTACCGCGGGCCCGGGATCCACCGGTCGCCAACATGGTGCGCTCCTCCAAGAACGTCATCAAGGAGTTCATGCGCTTCAAGGTGCGCATGGAGGGCACCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCCACAACACCGTGAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCCAGTACGGCTCCAAGGTGTACGTGAAGCACCCCGCCGACATCCCCGACTACAAGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAAGACGGCTGCTTCATCTACAAGGTGAAGTTCATCGGCGTGAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACGATGGGCTGGGAGGCCTCCACCGAGCGCCTGTACCCCCGCGACGGCGTGCTGAAGGGCGAGATCCACAAGGCCCTGAAGCTGAAGGACGGCGGCCACTACCTGGTGGAGTTCAAGTCCATCTACATGGCCAAGAAGCCCGTGCAGCTGCCCGGCTACTACTACGTGGACTCCAAGCTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAGCAGTACGAGCGCACCGAGGGCCGCCACCACCTGTTCCTGTAGCGGCCGCGACTCTAGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTGTTTAAACCGTAAAAAAAGTCATATTTCTGTATATCAAAACACATCTAATATTAAAAAAACAGTCAGCAAGCACTTACAAGTGTGGGCTCGGACAGCAATTACCTGGTCTCAGGAGACACTTGAAGAACGAGAAGCACGTCTCTCTGTCGATTGCGAGGCTCATGCACTATCGCTTGAGTCTGAGACCTTTACTGATAGGGAAATCCGTTTGAGCTCTCAGAGGGTTCGGACAGCAAAAGCTTGCCCGGTCTCAGGAGACATTAGAAGAACGGGAAGCATAACTCAATACCGATCGCGTTTCCATTGAGCCTATGCTTCGTGATAATAATAAATAAAGCCCAAGGTCAGACGCTAAAAGTTGTGGGTGTAGATATAAGTGTTAACTGCTTTTCACACAGTCAACTCGGTCACGCGGTTATGTAGCTCTGTCACATGCTGGCAATCCTAGCAACCTGTATGCTTTGATCCCCGATGGCTATACGTCTACGTCGTGTATAGAGAAGCTTTACTTTAAATTACATTTTTCTAAATACCTAAATGACGGTGCTTATAAACCAAAAGATATGTCCTAAAACTGCTGCCCAAAGTCGCTATTCCACGCGGACGGAGTCGCGGGCACAGCTAGTAATACATAAAATACCTTGGAACTCGAAACGGTCTTTGAGATATGGGTCGTTCTTTGAGGTATGAGGGTACAAAGAATACAATATGGTAAAGAAAGGACACGAGTATTACGAATCGGGGTAGTCAAGAATTCGAAGAAGGAGAGACTGTGCAAGCGCAGCTTTAGTGGCGGCTGGAAGAAAATTTCGTAACCGTCTTAAAGATTCAGCTGATGGAAACACCTTCCGACTAACCCCTTTTATCTGTGCGTTCCACAATAAGTTTTTATGAATTGAGATTCCCAAATTTTTCACAGTATCACTGATAGGAATTTGTACGCCGTCAAATAAAATAACCGGAAGCTGCGACTATTTAATTTTCGAACACATTCTTGAATTACTGACAACAATGTCCTGTGTTTTCGACGGGTTCAACTTTTTGAAGTCGTCATGGGCTAACAGATAAAACGTCCGGTGCATTCGTGTTGAGCGATGCAACGGTGCTCGAATCTCAGGCGGGTACCAATTTTTGTAATGAAATACGTACTCAACAAATGTTCACGATTGACTTCCACGGTGAAGGAATAACATCGTGTAATAAAAATGAAACTCACAAATATATAATTTGCGTAATTACTAGTGGTAGGACCTCTTGTGAGTCTGCGCGGGTGGGTACCACCACTCTGCCTATTTCTGCCGTGAAGCAGTAATGCGTATCGGTTTGAAGGGTAGGGCAGCCGTTGTAACTATACTTGAGACCTTAGAACTTATATCTCAAGGTGGGTGGCGCATTTACGTTGTGGATGTCTATGGGCTCCAGTAATCACTTAACACCAGGTGGGTTGTGAGCTCGTCCACCCATCTAAGCAATAAAAAATAAAAACCTAAATTCATGCGAATTACTCCAACGGGACAATATCGATAAATCATTATTCAGCGTCTTTACCGCGATGGTAAATTCTGGCAAAGAAGTTTGCGTATCGATCTGTAGATCAACTGCGTACAGATGGAAGAAGTAAGTTGTATACAAGTAGAATTTATAAAAATTGAAAAGAGTAAAGGAGATAAAACACCAACTTGCGATACACTTACGCGCACGTCACAACATGAATAATAAGCATTCTCACAGTGAATACGCTTGCGGCGACCAGACAGGTAACTTCGAAACCAATCAACCGTGGTCGAAGATATACTAATGGAGCTAAGGTGGCTAGAAGTATGCAGAAATCAACAGTGCCAAATACATTACTGCAATCCAGGTTATGTAGTACACATTGTTGTAAATCACTGAATTGTTTTAGATGATTTTAACAATTAGTACTTATTAATATTAAATAAGTACATACCTTGAGAATTTAAAAATCGTCAACTATAAGCCATACGAATTTAAGCTTGGTACTTGGCTTATAGATAAGGACAGAATAAGAATTGTTAACGTGTAAGACAAGGTCAGATAGTCATAGTGATTTTGTCAAAGTAATAACAGATGGCGCTGTACAAACCATAACTGTTTTCATTTGTTTTTATGGATTTTATTACAAATTCTAAAGGTTTTATTGTTATTATTTAATTTCGTTTTAATTATATTATATATCTTTAATAGAATATGTTAAGAGTTTTTGCTCTTTTTGAATAATCTTTGTAAAGTCGAGTGTTGTTGTAAATCACGCTTTCAATAGTTTAGTTTTTTTAGGTATATATACAAAATATCGTGCTCTACGCTGATTTAGGCAAAAACGGGTCTAAGAACTTTAAATAATTTCTACTGTTGTAGATCGATATCTGTGCGTTTTGGCGGTCTAAGAACTTTAAATAATTTCTACTGTTGTAGATCATAATTAGAATGTTGTTCAAGTCTAAGAACTTTAAATAATTTCTACTGTTGTAGATCGGAGCTGGCAGGGGATACGGGTCTAAGAACTTTAAATAATTTCTACTGTTGTAGATAATTCAGAGCACTGCCTTGTGGTCTAAGAACTTTAAATAATTTCTACTGTTGTAGATCGACGAGAATAGTCGTAACTGGTCTAAGAACTTTAAATAATTTATCGGATGCCGGGACCGACGAGTGCAGAGGCGTGCAAGCGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC

SEQ ID NO: 2

GCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACTGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAATTATGCGGCATCAGAGCAGATGGTAGACAGAGTGCACCAGATGCGGTGAGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAGCTGTTGGGAAGGGCGGTCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGCGGATGTGCTGCCAGGCGATTCAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGCAGAACGACGGCCAGAGAGTTAGAGGACGGAACCTCGCGAATACAACGACCCTAGAAAGATAATCATATTGTGACGTACGTTAAAGATAATCATGCGTAAAATTGACGCATGTGTTTTATCGGTCTGTATATCGAGGTTTATTTATTAATTTGAATAGATATTAAGTTTTATTATATTTACACTTACATACTAATAATAAATTCAACAAACAATTTATTTATGTTTATTTATTTATTAAAAAAAAACAAAAACTCAAAATTTCTTCTAAAGTAACAAAACTTTAGATGTCGCCTTAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCTAGTGTCGCTTTAGTCCTGCTCCTCGGCCACGAAGTGCACGCAGTTGCCGGCCGGGTCGCGCAGGGCGAACTCCCGCCCCCACGGCTGCTCGCCGATCTCGGTCATGGCCGGCCCGGAGGCGTCCCGGAAGTTCGTGGACACGACCTCCGACCACTCGGCGTACAGCTCGTCCAGGCCGCGCACCCACACCCAGGCCAGGGTGTTGTCCGGCACCACCTGGTCCTGGACCGCGCTGATGAACAGGGTCACGTCGTCCCGGACCACACCGGCGAAGTCGTCCTCCACGAAGTCCCGGGAGAACCCGAGCCGGTCGGTCCAGAACTCGACCGCTCCGGCGACGTCGCGCGCGGTGAGCACCGGAACGGCACTGGTCAACTTGGCATCCATGCCATGTGTAATCCCAGCAGCAGTTACAAACTCAAGAAGGACCATGTGGTCACGCTTTTCGTTGGGATCTTTCGAAAGGGCAGATTGTGTAGACAGGTAATGGTTGTCTGGTAAAAGGACAGGGCCATCGCCAATTGGAGTATTTTGTTGATAATGGTCTGCTAGTTGAACGCTGCCATCTTCAATGTTGTGACGAATTTTGAAGTTAGCTTTGATTCCATTCTTTTGTTTGTCTGCCGTGATGTATACATTGTGTGAGTTATAGTTGTACTCCAGTTTGTGTCCGAGAATGTTTCCATCTTCTTTAAAATCAATACCTTTTAACTCGATACGATTAACAAGGGTATCACCTTCAAACTTGACTTCAGCACGCGTCTTGTAGTTCCCGTCATCTTTGAAAGATATAGTGCGTTCCTGTACATAACCTTCGGGCATGGCACTCTTGAAAAAGTCATGCCGTTTCATATGATCCGGATAACGGGAAAAGCATTGAACACCATAAGAGAAAGTAGTGACAAGTGTTGGCCATGGAACAGGTAGTTTTCCAGTAGTGCAAATAAATTTAAGGGTAAGTTTTCCGTATGTAGCATCACCTTCACCCTCTCCACTGACAGAAAATTTGTGCCCATTAACATCACCATCTAATTCAACAAGAATTGGGACAACTCCAGTGAAAAGTTCTTCTCCTTTGCTGGCCATGGTGGCGACCGGTGGAACCCCGTACGAGTCCTTCTGTCCCATGCCGACCATCACGCCCTGATGGCGGGGCCTTCCGACGATCGAGGGGAACACGGCGCGAGGAGCATCATCTCCTGCGAAACCGGCCTTGCACATACCGGAGCCATTGTCTACTACCAACGCGGCAACTTCTTCGTCGCACATCTTGAATTAGTCTGCAAGAAAAGAAAAAAAACAATTCAAACTACATTCTCATTCCATACATTATACTAAGTAAACGACAAATTTATTTGCGTCCATCTATTTAGTGACGTTAAAGAAAACTGTATAAGATTCATAATTCACTGTTCCCAATTTCTGTTTCCGAATTGATCGATGCGAGTGGACACTTTGAAATGTGCGTCCAATAAACTTATTTCTTATTTAGTAGTGTTTATTAACATCTGCAGTACACTAAATTCCGAAAAATGTTTTTTTTTATAAAAAATTTCACTTCACTAGTTATGCAACAATTATGTAACGTAACACGTTATCATTAGCGTATTATTAAAAAAAAAAAACACTCAAACATATGTAATACTTAAAGGTAAAGGGACGGAGAACCTTCGAAATTCAAATTTTACAAATAAATAAATATGTTTTTTTTTCTTTCGCAATTTTAAAATTAAAACTTACATAGTATTATTAAATAAGTGACAAGTACGTAGATGCGAATGCGCACTGTTCGAGCACACCTTAGTAAATGAGAACCGACTCGTGAGGATAAACTATATAAAAGAGCCGTTATCACAATTTACACAGTATCGGCTCCAGTTTGTTTTTCCACCAATCGCGGGCTGACTCAGTTTTTGTCACCATATATGGTAACGCGTCATGATGATAAACAATGTATGGTGCTAATGTTGCTTCAACAACAATTCTGTTGAACTGTGTTTTCATGTTTGCCAACAAGCACCTTTATACTCGGTGGCCTCCCCACCACCAACTTTTTTGCACTGCAAAAAAACACGCTTTTGCACGCGGGCCCATACATAGTACAAACTCTACGTTTCGTAGACTATTTTACATAAATAGTCTACACCGTTGTATACGCTCCAAATACACTACCACACATTGAACCTTTTTGCAGTGCAAAAAAGTACGTGTCGGCAGTCACGTAGGCCGGCCTTATCGGGTCGCGTCCTGTCACGTACGAATCACATTATCGGACCGGACGAGTGTTGTCTTATCGTGACAGGACGCCAGCTTCCTGTGTTGCTAACCGCAGCCGGACGCAACTCCTTATCGGAACAGGACGCGCCTCCATATCAGCCGCGCGTTATCTCATGCGCGTGACCGGACACGAGGCGCCCGTCCCGCTTATCGCGCCTATAAATACAGCCCGCAACGATCTGGTAAACACAGTTGAACAGCATCTGTTCGAATTTAAAGCTTGGTACCGCCACCATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCATGAGCATTTACCAAGAGTTCGTGAATAAATACTCACTCTCTAAGACCCTGAGATTCGAATTGATACCGCAGGGCAAGACACTCGAAAACATCAAAGCTAGAGGTTTGATTCTCGACGATGAAAAAAGAGCTAAGGACTACAAAAAGGCCAAACAAATCATTGATAAGTACCACCAGTTCTTCATCGAAGAAATTTTGTCATCTGTCTGCATCAGTGAAGACCTGTTGCAAAATTACTCAGACGTGTACTTCAAACTCAAAAAGAGTGACGATGACAACCTGCAAAAAGATTTCAAGTCAGCTAAGGACACAATTAAAAAGCAGATATCCGAATACATTAAAGACTCGGAAAAATTCAAGAACCTCTTCAACCAAAATCTGATTGATGCCAAAAAGGGCCAGGAATCTGACCTGATATTGTGGCTCAAGCAGAGCAAAGACAATGGTATCGAATTGTTCAAAGCTAACAGTGATATAACTGATATCGACGAAGCCCTCGAAATAATCAAGTCATTCAAAGGCTGGACAACTTACTTCAAGGGTTTCCACGAAAACAGAAAAAATGTGTACAGCTCCAACGACATTCCGACCTCCATTATCTACAGAATCGTTGATGACAACCTCCCCAAATTCCTGGAAAACAAGGCTAAGTACGAATCGCTGAAAGACAAGGCTCCTGAAGCCATCAACTACGAACAAATCAAAAAGGATTTGGCCGAAGAACTCACTTTCGATATCGACTACAAAACCTCTGAAGTGAACCAAAGAGTTTTCAGCCTCGACGAAGTCTTCGAAATAGCTAACTTCAACAACTACCTGAACCAGAGTGGTATAACCAAGTTCAATACAATCATTGGTGGAAAATTCGTGAACGGAGAAAACACTAAGAGAAAGGGCATCAACGAATACATCAATCTCTACAGCCAACAGATTAACGACAAGACTCTGAAAAAGTACAAAATGTCCGTCTTGTTCAAGCAAATTCTCTCGGATACCGAAAGCAAATCCTTCGTGATAGATAAGCTGGAAGATGACAGTGACGTGGTTACCACAATGCAATCATTCTACGAACAGATCGCTGCCTTCAAGACTGTTGAAGAAAAGAGTATTAAGGAAACCTTGTCACTCCTGTTCGATGACCTCAAGGCTCAGAAACTGGACTTGAGTAAAATTTACTTCAAGAACGATAAGTCTTTGACCGACCTCAGCCAACAGGTCTTCGATGACTACTCAGTGATAGGTACAGCTGTTTTGGAATACATCACTCAACAGATTGCCCCGAAAAACTTGGATAATCCCAGTAAAAAGGAGCAAGAACTCATCGCTAAAAAGACAGAAAAAGCCAAGTACCTCTCACTGGAAACTATTAAATTGGCTCTCGAAGAGTTCAATAAACACAGAGATATAGACAAGCAGTGCAGATTCGAAGAAATCCTGGCCAACTTCGCTGCCATTCCTATGATATTCGATGAAATCGCTCAAAACAAGGACAATTTGGCCCAGATATCTATCAAATACCAAAACCAGGGAAAAAAGGACTTGCTCCAAGCTAGCGCCGAAGATGACGTTAAGGCTATTAAAGACCTGTTGGACCAAACCAACAATCTCCTGCACAAACTGAAAATCTTCCACATTTCGCAGAGTGAAGATAAGGCTAACATCTTGGATAAGGACGAACACTTCTACCTCGTTTTCGAAGAATGTTACTTCGAATTGGCCAACATCGTCCCTCTCTACAACAAGATTAGAAACTACATCACACAGAAGCCATACTCTGACGAAAAATTCAAGCTGAACTTCGAAAATAGCACCTTGGCTAACGGTTGGGATAAAAATAAGGAACCAGACAACACAGCCATACTGTTCATCAAGGATGACAAATACTACTTGGGAGTGATGAACAAAAAGAACAACAAGATATTCGATGACAAGGCTATCAAAGAAAACAAGGGAGAAGGCTACAAAAAGATCGTTTACAAATTGCTCCCGGGCGCTAATAAAATGCTCCCCAAGGTGTTCTTCTCAGCCAAAAGCATTAAGTTCTACAACCCGTCCGAAGACATTCTGAGAATAAGAAATCACTCTACTCACACCAAGAACGGAAGCCCCCAAAAAGGCTACGAAAAGTTCGAGTTCAACATAGAAGATTGCAGAAAGTTCATAGACTTCTACAAGCAGTCAATCTCTAAGCACCCGGAATGGAAAGATTTCGGCTTCAGATTCTCCGACACACAAAGATACAACTCGATCGACGAGTTCTACAGAGAAGTCGAAAATCAGGGTTACAAGCTGACTTTCGAAAACATTAGCGAATCCTACATAGACTCGGTCGTGAATCAAGGAAAACTGTACTTGTTCCAGATTTACAACAAGGATTTCTCCGCTTACTCGAAAGGCAGACCCAACCTGCACACATTGTACTGGAAAGCCCTGTTCGATGAAAGAAATTTGCAAGACGTTGTCTACAAGCTCAACGGAGAAGCTGAACTGTTCTACAGAAAGCAGTCTATTCCTAAAAAGATAACTCACCCAGCCAAAGAAGCTATCGCCAACAAGAACAAGGACAACCCTAAAAAGGAAAGCGTGTTCGAATACGATCTGATAAAGGACAAGAGATTCACTGAGGATAAGTTCTTCTTCCACTGTCCAATTACCATAAACTTCAAATCGAGTGGCGCTAACAAGTTCAATGACGAAATCAATCTGTTGCTCAAAGAAAAGGCCAACGATGTTCACATCCTGTCAATTGACAGAGGAGAAAGACACCTGGCTTACTACACATTGGTCGATGGAAAGGGAAACATCATCAAGCAAGATACATTCAACATAATCGGCAACGACAGAATGAAAACTAACTACCACGATAAGTTGGCTGCCATTGAAAAAGATAGAGACTCTGCCAGAAAAGACTGGAAAAAGATAAACAACATCAAGGAAATGAAGGAAGGATACCTGAGCCAGGTGGTTCACGAAATCGCTAAGTTGGTGATTGAATACAATGCCATAGTCGTGTTCGAAGACCTGAACTTCGGTTTCAAAAGAGGAAGATTCAAAGTCGAAAAGCAAGTGTACCAGAAACTGGAAAAGATGTTGATCGAAAAACTCAATTACCTGGTGTTCAAGGATAACGAGTTCGACAAAACCGGCGGTGTTCTCAGAGCTTACCAACTGACTGCCCCGTTCGAAACCTTCAAAAAGATGGGCAAGCAGACAGGTATCATTTACTACGTGCCTGCTGGATTCACCTCCAAAATATGCCCAGTTACAGGCTTCGTCAACCAACTGTACCCCAAGTACGAATCTGTTAGTAAATCACAGGAGTTCTTCTCAAAGTTCGATAAGATTTGTTACAACTTGGACAAGGGTTACTTCGAGTTCTCGTTCGATTACAAGAACTTCGGTGACAAAGCTGCCAAGGGAAAGTGGACTATCGCTAGTTTCGGATCAAGATTGATCAACTTCAGAAATTCCGATAAGAACCACAATTGGGACACCAGAGAAGTGTACCCTACAAAAGAACTCGAAAAACTGTTGAAGGACTACTCGATCGAATACGGCCACGGTGAATGCATCAAGGCTGCCATTTGTGGCGAATCCGATAAAAAGTTCTTCGCTAAACTCACATCGGTTCTGAATACTATATTGCAGATGAGAAACTCCAAGACAGGTACTGAATTGGACTACCTCATCTCGCCAGTTGCTGATGTCAACGGAAATTTCTTCGACTCTAGACAAGCCCCTAAAAATATGCCACAGGATGCTGACGCCAACGGTGCCTACCACATAGGACTGAAGGGCTTGATGCTCCTGGGTAGAATCAAGAACAACCAAGAAGGAAAAAAGCTCAACCTGGTCATCAAAAACGAAGAATACTTCGAGTTCGTGCAGAACAGAAACAATAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAACTCGAGTCTAGAGGGCCCGCGGTTCGAAGGTAAGCCTATCCCTAACCCTCTCCTCGGTCTCGATTCTACGCGTACCGGTCATCATCACCATCACCATTGAGTTTATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAATACAATATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACAACATTGTCCATTTACACACTCCTTTCAAGCGCGTGGAGCAGAGAGGATATGCTCATCGTCTAAAGAACTACCCATTTTATTATATATTAGTCACGATATCTATAACAAGAAAATATATATATAATAAGTTATCACGTAAGTAGAACATGAAATAACAATATAATTATCGTATGAGTTAAATCTTAAAAGTCACGTAAAAGATAATCATGCGTCATTTTGACTCACGCGGTCGTTATAGTTCAAAATCAGTGACACTTACCGCATTGACAAGCACGCCTCACGGGAGCTCCAAGCGGCGACTGAGATGTCCTAAATGCACAGCGACGGATTCGCGCTATTTAGAAAGAGAGAGCAATATTTCAAGAATGCATGCGTCAATTTTACGCAGACTATCTTTCTAGGGCACGACGAGAACACAGGCCTGCGTGCAGAGATGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTT

SEQ ID NO: 3

GTTCATCTAGCATCGGACAGG

SEQ ID NO: 4

CGAAATCGATAAGCTTGGATCC

SEQ ID NO: 5

GCCATATGCTCGTCTGCCTA

SEQ ID NO: 6

CCCGTTCCTCTAGTGGGAGA

SEQ ID NO: 7

TCAGGGGTGAAAGCACCAGA

SEQ ID NO: 8

TCGATTTCGAACCCTCGACC

SEQ ID NO: 9

GCTCCACGATGGTGTAGTCC

SEQ ID NO: 10

CTACATGGCCAAGAAGCCCGTG

SEQ ID NO: 11

TACGTGGGAATGAGGCGTTC

SEQ ID NO: 12

GCGAATTACTCCAACGGGAC

SEQ ID NO: 13

CGGAGCAGGATATGGAGCA

SEQ ID NO: 14

AAAGTCAGACGACCAAGCGT

SEQ ID NO: 15

CCAAGGTGTACGTGAAGCAC

SEQ ID NO: 16

GCCGATGAACTTCACCTTGT

SEQ ID NO: 17

TCTTGTGCTGTGCTCTCCAA

SEQ ID NO: 18

TCAGGGGTGAAAGCACCAGA

SEQ ID NO: 19

GAATGGACCCTGGGACACTT

SEQ ID NO: 20

CTGACTGGGCTTGAGCGATA

SEQ ID NO: 21

AACGGTGGATACTTGCCTGG

SEQ ID NO: 22

CCAGTCTTGATCTGGCAGCA

SEQ ID NO: 23

GGCTCCAAGGTGTACGTGAA

SEQ ID NO: 24

GGTGTAGTCCTCGTTGTGGG。

Claims

1.一种基于基因打靶家蚕制备蜘蛛家蚕复合丝纤维的方法，其特征在于，包括以下步骤：

(1)构建基因打靶载体pUC-target-Heavy-g；

(2)将基因打靶载体pUC-target-Heavy-g与表达Cas12a核酸酶的质粒混合，然后引入家蚕初产卵内，再孵化；或者制备表达Cas12a核酸酶的转基因家蚕BmCas12a，将pUC-target-Heavy-g引入转基因家蚕BmCas12a的初产卵，再孵化；

(6)步骤(5)获得的卵孵化后，饲养至上蔟，进而获得蜘蛛家蚕复合丝纤维。

2.一种蜘蛛家蚕复合丝纤维的基因打靶家蚕的构建方法，其特征在于，包括下列步骤：

(1)构建基因打靶载体pUC-target-Heavy-g；

(6)步骤(5)获得的卵孵化后，得到蜘蛛家蚕复合丝纤维的基因打靶家蚕。

3.一种蜘蛛家蚕复合丝纤维的基因打靶家蚕卵的构建方法，其特征在于，包括下列步骤：

(1)构建基因打靶载体pUC-target-Heavy-g；

(5)将亲本为基因打靶蚕蛾交配所产的卵催青后，正常饲养至化蛾，同蛾区交配产卵；然后利用特异性引物扩增蛾的DNA，然后对扩增产物测序验证，选择䧳雄亲本均为纯系的基因打靶蚕蛾交配所产的卵为蜘蛛家蚕复合丝纤维的基因打靶家蚕卵。

4.根据权利要求1、权利要求2或者权利要求3所述的方法，其特征在于，pUC-target-Heavy-g以丝素重链基因旁侧序列为同源臂，将丝素重链基因启动子控制的编码金丝织网蜘蛛大壶状腺丝蛋白基因序列表达盒以及3×P3启动子控制荧光蛋白基因克隆进左右同源臂之间，并将家蚕U6启动子控制的靶向丝素重链基因的gRNA表达盒克隆在右同源臂的下游；表达Cas12a核酸酶的质粒为表达Cas12a核酸酶的质粒piggyCPF1。

5. 根据权利要求4所述的方法，其特征在于，pUC-target-Heavy-g的DNA序列为SEQIDNO: 1；表达Cas12a核酸酶的质粒piggyCPF1的DNA序列为SEQ IDNO: 2。

6.根据权利要求1、权利要求2或者权利要求3所述的方法，其特征在于，步骤（4）中，特异性引物为扩增网蜘蛛大壶状腺丝蛋白基因的引物对、扩增荧光蛋白基因的引物对、检测外源DNA的左侧插入位点的引物对、检测外源DNA的右侧插入位点的引物对；步骤（5）中，特异性引物对为检测所获得的蚕是否为纯系打靶蚕的引物对。

7.根据权利要求1、权利要求2或者权利要求3所述的方法得到的蜘蛛家蚕复合丝纤维、蜘蛛家蚕复合丝纤维的基因打靶家蚕、蜘蛛家蚕复合丝纤维的基因打靶家蚕卵。

8.权利要求7所述蜘蛛家蚕复合丝纤维的基因打靶家蚕或蜘蛛家蚕复合丝纤维的基因打靶家蚕卵作为育种素材的应用。

9. 如SEQ ID NO: 1所述的DNA片段和/或SEQ ID NO: 2所述的DNA片段在制备蜘蛛大壶状腺丝蛋白与家蚕丝蛋白复合丝纤维的应用。

10.权利要求7所述蜘蛛家蚕复合丝纤维的基因打靶家蚕或蜘蛛家蚕复合丝纤维的基因打靶家蚕卵在制备权利要求7所述蜘蛛家蚕复合丝纤维中的应用。