适用于地衣芽胞杆菌的启动子及其在高效表达目的产物中的
应用
技术领域
本发明涉及基因工程和微生物代谢工程领域,具体涉及适用于地衣芽胞杆菌的启动子及其在高效表达目的产物中的应用。
背景技术
启动子是位于基因转录单元上游的一段特殊DNA序列,具有启动基因转录的功能,并在调控基因转录水平中发挥着重要的作用。随着合成生物学和代谢途径工程的发展,人们逐渐发现,为了实现目标产物的高产,强化目的蛋白的表达水平和目的代谢物的代谢通量是至关重要的。由于启动子是基因转录的开关,并被认定为是建立基因高效表达工具的主要表达元件,从而启动子改造是开发能优化蛋白表达水平和代谢物代谢途径技术的首选策略。目前,启动子改造策略主要围绕着σ因子识别和结合的启动子核心区(-35区、核心间隔区、-10区)做改良工作。如周等人在枯草芽胞杆菌中,通过随机突变策略改造启动子PsrfA的核心间隔区,获得的最佳突变启动子PBH4较原始启动子PsrfA,使GFP的表达水平提高了2倍(DOI:10.1186/s12934-019-1148-3),又如严等人在枯草芽胞杆菌中,通过对启动子PylB的-35区和-10区进行突变,获得的最佳突变启动子PNBP3510较原始启动子PylB,使β-半乳糖苷酶(BgaB)活性提高近25倍(DOI:10.1186/s12934-019-1159-0),以及王等人对T7启动子核心区(-35区和-10区)进行组合,得到的最佳启动子P21285提高了L-天冬酰胺酶和酸性脲酶在大肠杆菌中的产量(DOI:10.1002/biot.201800298)。
地衣芽胞杆菌是一个重要的工业生产模式菌株,具有分泌蛋白能力强特征,且被美国FDA认定为生物安全性菌株,从而其可作为蛋白和目标代谢物生产的优良宿主。目前,其已经实现多种蛋白和代谢物高效生产,如α-淀粉酶、碱性蛋白酶,杆菌肽等。然而,地衣芽胞杆菌在表达多数外源蛋白时,存在表达难或表达效率低的问题,而启动子被认定为是建立基因高效表达工具的主要表达元件,且启动子改造是开发能优化蛋白表达水平和代谢物代谢途径技术的首选策略。在地衣芽胞杆菌中,启动子主要包括σA型和σB型启动子,其中σA型启动子主要介导与细胞生长和代谢相关基因的表达,而σB型启动子主要介导细胞响应内外各种压力(温度、渗透压、pH等)相关基因的表达。
发明内容
本发明的目的是提供了适用于地衣芽胞杆菌的启动子,所述的启动子序列为SEQID NO.2-SEQ ID NO.5中的任意一个。
适用于地衣芽胞杆菌的启动子在高效表达目的蛋白中的应用,将本发明的启动子导入地衣芽胞杆菌中,可提高地衣芽胞杆菌生产目的蛋白的能力。
为了达到上述目的,本发明采取以下技术措施:
适用于地衣芽胞杆菌的启动子,所述的启动子的核苷酸序列为SEQ ID NO.2所示;或SEQ ID NO.3所示;或SEQ ID NO.4所示;或SEQ ID NO.5所示。
适用于地衣芽胞杆菌的启动子在提高地衣芽胞杆菌目的蛋白表达量中的应用,将本发明提供的启动子,导入地衣芽胞杆菌中,可提高蛋白表达和代谢产物的产量;将所述的启动子启动外源蛋白的表达可提高蛋白表达量,将所述的启动子启动增强代谢产物产量的基因表达,可提高代谢产物的产量。
以上所述的应用中,优选的,所述外源蛋白为绿色荧光蛋白和角蛋白酶;
以上所述的应用中,优选的,所述代谢产物为γ-PGA和杆菌肽;
以上所述的应用中,优选的,所述的地衣芽胞杆菌为地衣芽胞杆菌DW2和地衣芽胞杆菌WX-02。
与现有技术相比,本发明具有以下优点:
1.本发明人首次尝试通过核心区四组合镶嵌模式改造启动子的常规核心区(-35区(6bp)、-10区(6bp)、核心间隔区(16-18bp)),使其核心区完全由σ因子识别的四个位点组成(A-35-B-35-C-35-D-35-A-10-B-10-C-10-D-10,A、B、C和D序列长度为5-6bp),进而,在不同σ因子识别作用下,改善该启动子在发酵对数期和稳定期的活性,从而使其介导表达的基因在整个发酵周期都能有效表达。
2.本发明人首次表明启动子核心区四组合镶嵌模式“σB-σB-σA-σB”可作为启动子优化的有效策略,且该核心区四组合镶嵌模式的序列长度为43-46bp,导致其构建非常方便,以非常低廉的费用直接通过引物设计导入表达载体中。
3.本发明人先获得一组基于启动子核心区四组合的启动子(R1-R4)。接着,与启动子P43相比,研究发现启动子R2效果最佳,显著提高了GFP、KER的产量。最后,将启动子R2应用于代谢工程中,与对照菌相比,通过将其应用于代谢途径强化使聚γ-谷氨酸,杆菌肽的产率分别提高了52.09%,20.39%,从而说明改造得到的启动子R2不仅性能良好,而且具有一定的普适性。
附图说明
图1为R1-R4启动子对GFP表达的影响示意图。
图2为R2启动子对角蛋白酶表达的影响示意图。
图3为R2启动子对WX-02产γ-PGA的影响示意图。
图4为R2启动子对DW2产杆菌肽的影响示意图。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
本发明以2种外源蛋白(绿色荧光蛋白GFP、角蛋白酶)和两种代谢产物(γ-PGA、杆菌肽)为例,说明本发明技术方案的优越性。
实施例1:
适用于地衣芽胞杆菌的启动子的获得:
本发明的启动子,是通过在σA和σB型因子识别的五个结合位点中,在保证启动子核心区完全由σA和σB型因子识别位点组成的前提下,有选择的选取四个位点嵌合而成,所述的五个结合位点的核苷酸序列分别为:
TTGACA…TATAAT;
GCCTTGA…CCCCAT;
TTCTCA…TAAAAT;
AAGCCA…TATATT;
GTAAAA…TATTAT;
根据上述5个结合位点,选取了四种嵌合方式后,人工设计并合成了四个优化启动子,命名为R1-R4,其对应的核苷酸序列分别为SEQ ID NO.2-SEQ ID NO.5所示。
实施例2:
优化启动子R1-R4在提高地衣芽胞杆菌外源蛋白表达量中的应用:
在本实施例中,通过引物直接引入了R1-R4启动子,替换了表达载体中的P43启动子核心区,具体步骤如下:
1、以本实验早期构建的质粒pHY-P43-GFP(DOI:10.1016/j.jbiotec.2020.02.015)作为模板,通过表1的引物,PCR扩增出包含优化启动子的载体骨架,并进行DNA回收;
表1:含有不同优化启动子的表达载体引物设计
注:划线为同源臂区,18-19bp。
2、利用DpnI酶对残留的pHY-P43-GFP模板进行消化;
3、采用Vazyme的同源重组酶(Exnase II)对载体骨架进行处理,并在37℃条件下反应30min,使载体骨架自连;随后进行钙转,将其转入大肠杆菌中;最后通过测序验证后,提取质粒,即得到含有优化启动子的重组质粒,分别为pHY-R1-GFP、pHY-R2-GFP、pHY-R3-GFP和pHY-R4-GFP;
4、将步骤3得到的重组质粒分别转入地衣芽胞杆菌DW2中,以四环抗生素作为筛选标记,随后,通过菌落PCR筛选得到阳性转化子,从而获得四种的工程菌DW2/R1-GFP、DW2/R2-GFP、DW2/R3-GFP、DW2/R4-GFP。
对照菌株DW2/P43-GFP的制备:直接将pHY-P43-GFP转入地衣芽胞杆菌DW2中获得。
5、工程菌种子活化:从甘油管以体积百分比1%将步骤4得到的工程菌分别接种于装有5mL LB培养基中,230r/min、温度37℃,培养12小时,然后将菌种活化后的菌液以体积百分比按1%接种量接种于种子发酵培养基于230r/min、37℃中培养10小时,得到种子培养的菌液;
所述的发酵培养基即为LB培养基。
6、工程菌发酵:向500mL三角瓶中装入50mL LB液体发酵培养基,然后将种子培养的菌液以接种量为2%(体积百分比),转速230r/min,温度37℃,发酵培养48小时,得到生产发酵的菌液。
7、GFP表达水平检测:取0.2mL发酵液于2mL EP管,加入1.8mL PBS缓冲液,用可见光分光光度计测其生物量(OD600)。然后用PBS缓冲液将发酵液相应稀释到终浓度(OD600)为1,终体积2mL,随后7000rpm,2min,接着用2mL PBS缓冲液重悬,重复一次,最后用酶标仪检测其荧光强度,该结果见图1。由图1可知:对照菌株DW2/P43-GFP表达的GFP荧光强度为1.79×105,而含有R1、R2、R3和R4介导表达的GFP荧光强度依次为104.74×105,115.55×105,92.27×105,52.13×105,其中,R2效果最佳,使GFP产量提高63.5倍。由于R2的提升效果最好,因此本发明以下实施例以R2为例,对其在提升地衣芽胞杆菌外源蛋白或代谢产物表达量的效果进行说明,其余优化启动子也有相同提升功能。
实施例3:
R2启动子提高地衣芽胞杆菌对角蛋白酶的表达亮:
1、以pHY-R2-GFP和地衣芽胞杆菌WX-02基因组DNA为模板,通过设计引物T5-F、T5-R,KER-F、KER-R来分别扩增载体骨架pHY-R2和角蛋白酶基因ker片段(SEQ ID NO.6所示),并进行DNA回收;
2、利用DpnI酶对载体骨架pHY-R2中残留的pHY-R2-GFP模板进行消化;
3、采用Vazyme的同源重组酶(Exnase II)对纯化的载体骨架pHY-R2和ker基因片段进行处理,并在37℃条件下反应30min,使载体骨架和片段相连;随后进行钙转,将其转入大肠杆菌中;最后通过测序验证后,即得到重组质粒(pHY-R2-KER);
4、将重组质粒(pHY-R2-KER)转入地衣芽胞杆菌DW2中,以四环抗生素作为筛选标记,随后,通过菌落PCR筛选得到阳性转化子,从而获得R2介导的KER工程菌DW2/R2-KER;同理,先构建质粒pHY-P43-KER(即将pHY-P43-GFP中的gfp基因替换为ker基因),再将其电转入地衣芽胞杆菌DW2中,以获得对照菌株DW2/P43-KER。
5、工程菌DW2/P43-KER和DW2/R2-KER的种子活化和发酵阶段的相关操作除了发酵培养基外,与实施例2中的步骤5和6相同;
角蛋白酶发酵培养基:20g/L葡萄糖、10g/L大豆蛋白胨、10g/L玉米浆,5g/L酵母粉,10g/L氯化钠,1g/L K2HPO4和1g/L(NH4)2SO4。
6、角蛋白酶酶活测定参照中华人民共和国国家标准中所描述的福林法进行,该角蛋白酶发酵检测结果见图2。由图2可知:对照菌株DW2/P43-KER表达的KER酶活为293.12U/mL,而R2介导表达的KER酶活为2576.89U/mL,使KER酶活提高7.8倍。同时表明本发明涉及的人工启动子R2在地衣芽胞杆菌的蛋白表达中具有一定的普适性。
一个单位酶活(U)定义为:一定温度、一定pH条件下,蛋白酶液在1min内水解酪蛋白产生1μg酪氨酸所需要的酶量。
注:划线为同源臂区,18-19bp。
实施例4:
启动子R2在提高地衣芽胞杆菌的代谢产物产量中应用:
谷氨酸脱氢酶RocG启动子强化工程菌株WX-02::R2(RocG)的制备:
1、申请早期研究发现:强化谷氨酸脱氢酶RocG的表达水平,可以提高WX-02产γ-PGA的能力(DOI:10.1016/j.jbiotec.2020.02.015)。根据地衣芽胞杆菌WX-02基因组DNA序列中的rocG基因启动子ProcG的序列,设计ProcG的上游同源臂引物(rocG-F1、rocG-R1)、下游同源臂引物(rocG-F3、rocG-R3)和启动子R2引物(rocG-F2、rocG-R2);然后以地衣芽胞杆菌WX-02的基因组DNA和质粒pHY-R2-GFP为模板,分别PCR扩增扩增以得到ProcG DNA序列的上游同源臂片段、下游同源臂片段和启动子R2片段(ProcG的上游同源臂片段为523bp;ProcG的下游同源臂片段为531bp;启动子R2片段为307bp);
其中,rocG-F1、rocG-R1、rocG-F2、rocG-R2、rocG-F3、rocG-R3的序列为:
rocG-F1:GCTCTAGAGCCAGGCGCTTCAGCAGG、
rocG-R1:CGAAAACATACCACCTATCAATGAGCATCTTATCCCGT、
rocG-F2:TGATAGGTGGTATGTTTTCG、
rocG-R2:CTCGCCGTCTGGAAATTTGTGATCCTTCCTCCTTTAG、
rocG-F3:CAAATTTCCAGACGGCGAG、
rocG-R3:CCGAGCTCCCCTTGCTCCGACACCAAT;
2、以ProcG序列的上游同源臂、下游同源臂和R2启动子片段为模板,上游同源臂引物rocG-F1、下游同源臂引物rocG-R3为引物,通过重叠延伸PCR将ProcG序列的上游同源臂、R2启动子片段和下游同源臂连接到一起,得到目的片段,SEQ ID NO.7所示;
3、采用XbaI和SacI限制性内切酶对步骤2中的目的基因片段进行双酶切得到双酶切基因片段;
4、并采用XbaI和SacI限制性内切酶对质粒T2(2)-ori进行双酶切得到线性质粒片段;
5、将步骤3的酶切基因片段和步骤4的线性质粒片段经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1661bp处出现电泳条带,说明启动子替换载体构建成功,上述转化子为阳性转化子(命名为:启动子替换载体T2(2)-R2(rocG));
6、将启动子替换载体T2(2)-R2(rocG)转入地衣芽胞杆菌WX-02中,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1661bp处出现电泳条带,证明:启动子替换载体T2(2)-R2(rocG)成功转入地衣芽胞杆菌WX-02中,此时,该转化子为阳性转化子(即转入了启动子替换载体T2(2)-R2(rocG)的地衣芽胞杆菌WX-02);
其中,T2-F和T2-R的序列为:
T2-F:ATGTGATAACTCGGCGTA、
T2-R:GCAAGCAGCAGATTACGC;
7、将步骤6得到的阳性转化子在45℃条件下、含有卡那青霉素抗性的培养基上转接培养3次,每次培养12h,并以T2-F和rocG-KR为引物进行菌落PCR检测单交换菌株,扩增出1811长度的条带,即证明为单交换菌株;
其中,rocG-KF和rocG-KR的序列为:
rocG-KF:GGATCCAGACAAACCAGG、
rocG-KR:AATCTTTTTATACTGTCC;
8、将步骤7得到的单交换成功的菌株接种培养,开始双交换传代。在37℃、不含有卡那青霉素的培养基中经过数次转接培养,挑转化子进行菌落PCR验证(引物为rocG-KF和rocG-KR)。若转化子的PCR验证结果为:在1685bp处出现电泳条带时,说明WX-02的基因组上的rocG基因的启动子ProcG成功被替换成R2,该转化子为阳性转化子。随后针对阳性转化子进行DNA测序进一步验证,得到双交换成功的rocG基因启动子强化菌株(即地衣芽胞杆菌WX-02::R2(rocG))。
9、构建对照菌株,即地衣芽胞杆菌WX-02::P43(rocG),同理,采取相似的操作构建,用p43替代了该菌株中的ProcG,即获得地衣芽胞杆菌WX-02::P43(rocG),作为对照组。
谷氨酸脱氢酶RocG启动子强化对WX-02产γ-PGA的影响:
1、γ-PGA生产菌株WX-02、DW2::P43(rocG)和WX-02::R2(rocG)的种子活化和发酵阶段除发酵培养基外,与实施例2中的步骤5和6相同,γ-PGA发酵检测的方法参考申请人已发表的文献(DOI:10.1016/j.jbiotec.2020.02.015)。
γ-PGA液体发酵培养基:葡萄糖80g/L,柠檬酸钠10g/L,硝酸钠10g/L,氯化铵8g/L,K2HPO4·3H2O 1g/L,ZnSO4·7H2O 1g/L,MnSO4·H2O 0.15g/L,CaCl2 1g/L,pH 7.2。
其γ-PGA发酵检测结果见图3。由图3可知:菌株WX-02、WX-02::P43(rocG)和WX-02::R2(rocG)生产的γ-PGA产量依次为10.08g/L、12.79g/L、15.29g/L。与野生型菌株相比WX-02,启动子R2效果优化P43,其使γ-PGA产量提高52.09%。从而,启动子R2可用于代谢工程以强化γ-PGA的代谢通量。
实施例5:
杆菌肽合成基因簇bacABC启动子强化工程菌DW2-R2(bacABC)制备:
1、根据地衣芽胞杆菌DW2基因组DNA序列中的bacABC基因簇启动子PbacA的序列,设计PbacA的上游同源臂引物(BacA-F1、BacA-R1)、下游同源臂引物(BacA-F3、BacA-R3)和启动子R2引物(BacA-F2、BacA-R2);然后以地衣芽胞杆菌DW2的基因组DNA和质粒pHY-R2-GFP为模板,分别PCR扩增扩增以得到PbacA DNA序列的上游同源臂片段、下游同源臂片段和启动子R2片段(PbacA的上游同源臂片段为520bp;PbacA的下游同源臂片段为528bp;启动子R2片段为307bp);
其中,BacA-F1、BacA-R1、BacA-F2、BacA-R2、BacA-F3、BacA-R3的序列为:
BacA-F1:GCTCTAGACGAAAAGGTGACGACTACGC,
BacA-R1:CGAAAACATACCACCTATCATTAAAACGTCCGGCTGGCTG,
BacA-F2:TGATAGGTGGTATGTTTTCG,
BacA-R2:CTAATGAATGTTTAGCAACCATTGATCCTTCCTCCTTTAG,
BacA-F3:ATGGTTGCTAAACATTCATTAG,
BacA-R3:CCGAGCTCGTCTGAAGCCTCTCTGTC;
2、以PbacA序列的上游同源臂、下游同源臂和R2启动子片段为模板,上游同源臂引物BacA-F1、下游同源臂引物BacA-R3为引物,通过重叠延伸PCR将PbacA序列的上游同源臂、R2启动子片段和下游同源臂连接到一起,得到目的片段,SEQ ID NO.8所示;
3、采用XbaI和SacI限制性内切酶对步骤2中的目的基因片段进行双酶切得到双酶切基因片段;
4、并采用XbaI和SacI限制性内切酶对质粒T2(2)-ori进行双酶切得到线性质粒片段;
5、将步骤3的酶切基因片段和步骤4的线性质粒片段经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1655bp处出现电泳条带,说明启动子替换载体构建成功,上述转化子为阳性转化子(命名为:启动子替换载体T2(2)-R2(bacABC));
6、将启动子替换载体T2(2)-R2(bacABC)转入地衣芽胞杆菌DW2中,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1655bp处出现电泳条带,证明:启动子替换载体T2(2)-R2(bacABC)成功转入地衣芽胞杆菌DW2中,此时,该转化子为阳性转化子(即转入了启动子替换载体T2(2)-R2(bacABC)的地衣芽胞杆菌DW2);
其中,T2-F和T2-R的序列为:
T2-F:ATGTGATAACTCGGCGTA、
T2-R:GCAAGCAGCAGATTACGC;
7、将步骤6得到的阳性转化子在45℃条件下、含有卡那青霉素抗性的培养基上转接培养3次,每次培养12h,并以T2-F和BacA-KR为引物进行菌落PCR检测单交换菌株,扩增出1625bp长度的条带,即证明为单交换菌株;
其中,BacA-KF和BacA-KR的序列为:
BacA-KF:CATATGCAGCCCGACATTGAG,
BacA-KR:GACAGAACTGAGCGGTTC;
8、将步骤7得到的单交换成功的菌株接种培养,开始双交换传代。在37℃、不含有卡那青霉素的培养基中经过数次转接培养,挑转化子进行菌落PCR验证(引物为BacA-KF和BacA-KR)。若转化子的PCR验证结果为:在1575bp处出现电泳条带时,说明DW2的基因组上的bacABC基因簇的启动子PbacA成功被替换成R2,该转化子为阳性转化子。随后针对阳性转化子进行DNA测序进一步验证,得到双交换成功的bacABC基因簇启动子强化菌株(即地衣芽胞杆菌DW2::R2(bacABC))。
9、同理,采取相似的操作构建,用p43替代了该菌株中的启动子PbacA,即获得地衣芽胞杆菌DW2::P43(bacABC)。
杆菌肽合成基因簇bacABC启动子强化对DW2产杆菌肽的影响:
1、杆菌肽生产菌株DW2、DW2::P43(bacABC)和DW2::R2(bacABC)的种子活化和发酵阶段的相关操作除发酵培养基外,与实施例2中的步骤5和6相同,杆菌肽发酵检测结果见图4。
杆菌肽发酵培养基:100g/L豆粕,45g/L玉米淀粉,6g/L轻钙,1%硫酸铵,pH 7.0。
由图4可知:菌株DW2、DW2::P43(bacABC)和DW2::R2(bacABC)生产的杆菌肽效价依次为817.54U/mL、536.72U/mL、989.22U/mL。与野生型菌株相比DW2,核心区四组合启动子R2效果明显优化P43,其使杆菌肽效价提高20.39%。从而,表明核心区四组合启动子R2可用于代谢工程以强化代谢产物的代谢通量。
序列表
<110> 湖北大学
<120> 适用于地衣芽胞杆菌的启动子及其在高效表达目的产物中的应用
<160> 45
<170> SIPOSequenceListing 1.0
<210> 1
<211> 290
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tgataggtgg tatgttttcg cttgaacttt taaatacagc cattgaacat acggttgatt 60
taataactga caaacatcac cctcttgcta aagcggccaa ggacgctgcc gccggggctg 120
tttgcgtttt tgccgtgatt tcgtgtatca ttggtttact tatttttttg ccaaagctgt 180
aatggctgaa aattcttaca tttattttac atttttagaa atgggcgtga aaaaaagcgc 240
gcgattatgt aaaatataaa gtgatagcag atctaaagga ggaaggatca 290
<210> 2
<211> 304
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgataggtgg tatgttttcg cttgaacttt taaatacagc cattgaacat acggttgatt 60
taataactga caaacatcac cctcttgcta aagcggccaa ggacgctgcc gccggggctg 120
tttgcgtttt tgccgtgatt tcgtgtatca ttggtttact tatttttttg ccaaagctgt 180
aatggctgaa aattcttaca tttattttac atttttagaa atgggcgtaa aagccattga 240
cattctcata ttatatatta taataaaata taaagtgata gcagatctaa aggaggaagg 300
atca 304
<210> 3
<211> 307
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tgataggtgg tatgttttcg cttgaacttt taaatacagc cattgaacat acggttgatt 60
taataactga caaacatcac cctcttgcta aagcggccaa ggacgctgcc gccggggctg 120
tttgcgtttt tgccgtgatt tcgtgtatca ttggtttact tatttttttg ccaaagctgt 180
aatggctgaa aattcttaca tttattttac atttttagaa atgggcgtaa aaagccattg 240
acattctcat attatatatt tataattaaa atataaagtg atagcagatc taaaggagga 300
aggatca 307
<210> 4
<211> 308
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tgataggtgg tatgttttcg cttgaacttt taaatacagc cattgaacat acggttgatt 60
taataactga caaacatcac cctcttgcta aagcggccaa ggacgctgcc gccggggctg 120
tttgcgtttt tgccgtgatt tcgtgtatca ttggtttact tatttttttg ccaaagctgt 180
aatggctgaa aattcttaca tttattttac atttttagaa atgggcgcct tgaagccatt 240
gacattctca ccccatatat ttataattaa aatataaagt gatagcagat ctaaaggagg 300
aaggatca 308
<210> 5
<211> 306
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tgataggtgg tatgttttcg cttgaacttt taaatacagc cattgaacat acggttgatt 60
taataactga caaacatcac cctcttgcta aagcggccaa ggacgctgcc gccggggctg 120
tttgcgtttt tgccgtgatt tcgtgtatca ttggtttact tatttttttg ccaaagctgt 180
aatggctgaa aattcttaca tttattttac atttttagaa atgggcgcct tgaagccatt 240
gacattctca ccccatatat tataataaaa tataaagtga tagcagatct aaaggaggaa 300
ggatca 306
<210> 6
<211> 1149
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atgagaggca aaaaggtatg gatcagtttg ctgtttgctt tagcgttaat ctttacgatg 60
gcgttcggca gcacgacttc tgcccaggct gcagggaaat caaacgggga aaagaaatat 120
attgtcggat ttaagcagac aatgagcacg atgagcgccg ccaagaaaaa agatgtcatt 180
tctgaaaaag gcgggaaagt ggaaaagcaa ttcaaatatg tagacgcagc ttcagctaca 240
ttaaatgaaa aagctgtaaa agagctgaaa aaagacccta gcgtcgctta cgttgaagaa 300
gatcacattg cacaggcgta cgcgcagtcc gtgccttacg gcgtatcaca gattaaagcc 360
cctgctctgc actctcaagg cttcaccgga tcaaatgtta aagtagcggt tatcgacagc 420
ggtatcgatt cttctcatcc tgatttaaag gtagcaggcg gagccagcat ggttccttct 480
gaaacaaatc ctttccaaga taacaactct cacggaactc acgttgccgg tacagttgcg 540
gctcttaata actcagtcgg tgtattaggc gttgcgccaa gcgcatctct ttacgctgta 600
aaagttctcg gcgctgacgg ttccggccag tacagctgga tcattaacgg aattgagtgg 660
gcgatcgcaa acaatatgga cgttattaac atgagcctcg gcggaccttc tggttctgca 720
gcgttaaaag cggcagttga caaagccgtt gcttccggcg tcgtagtggt tgcggcagcc 780
ggtaacgaag gcacttccgg cggctcaagc acagtgggct accctggtaa atacccttct 840
gtcattgcgg taggcgctgt taacagcagc aaccaaagag catctttctc aagcgtaggt 900
tctgagcttg atgtcatggc accaggcgtc tctatccaaa gcacgcttcc tggaaacaaa 960
tacggcgcgt acaatggtac gtcaatggca tctccgcacg ttgccggagc ggctgctttg 1020
attctttcta agcacccgaa ctggacaaac actcaagtcc gcagcagttt agaaaacacc 1080
actacaaaac ttggtgatgc tttctactat ggaaaagggc tgatcaacgt acaggcggca 1140
gctcagtaa 1149
<210> 7
<211> 2245
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggatccagac aaaccaggcc atgaaccaaa tgagccaggc gcttcagcag gcgcagcagt 60
catttaacca gcaagggcaa caaggacaac agggtcagca aaatcaacaa aaccagcagc 120
aaaatcaaaa ttttcaacag cctctacaat aaaaagctgt aaagagccgt ttagcacggc 180
tcttttttat atcggtcatt cctcgttttg atcctcttcg tcatgggttg gatgcgctcc 240
gggatattga cgcggcgttc cttgatgaag attgcggaat tcgtatgcga aattgctgta 300
gtattgctgg ccttccttcc atggcgtgct tttgttctca acgggctcgt ctttgccctg 360
tgcagctcca tacgcacctt caggaaattc ttcagctgtt aaaaagtttc tttgcgtttc 420
aacgttcgac atttcttttt tgtcgtccat cagatcaccc ctgttttagt tttattgttg 480
ccatgaaaaa ggggagctat gtgttttcgt tttgtatgca gtaggtttca ttttaaaaac 540
gggataagat gctcattctc tgccgggagt acaagggggg aaatgcgccg atcacaaaga 600
aaatagacat tttgtacaga aagaacctgt cagataaagt ggtattttat ggtttattgg 660
tccttttctc ctcagctttt aagagctgtc cttctatctt atgacccgtc tattctcgct 720
ttttgttata catctcaatt cagcaatggt tttatctgtt ttccagattg atgtaaatgg 780
ggcattggtt gtaaaattta ccatgagaga aaatcttaca atgttcgttc tgcttttatt 840
ttagaaaggg agctgaaaaa aggtgcatac gctagaaaaa atggagcaaa caaatttcca 900
gacggcgaga gattatgtga cacaagcata cgagacagta cagaagcgaa atttttacga 960
aagcgaattt cttcaagctg taaaggaaat atttgattcc cttgtccctg tattggcaag 1020
gcatccaaag tatatcgaac accgcattct tgagaggatc gcagagccgg aacggatgat 1080
caccttcagg gtgccgtggg tcgatgatga aggcaatatc cgggttaacc gagggttccg 1140
ggttcaattt aacagtgcaa tcggtccgta taaaggcggc atccgctttc acccttctgt 1200
gaacgcgagc attattaaat ttttgggttt tgagcagatt tttaaaaatt ctttgaccgg 1260
actgccgatc ggaggcggaa aaggcggggc tgattttgat ccgaagggca aatcggacag 1320
ggagattatg agttttacgc agagcttcat gaatgaactg tacagacata tcggaccgga 1380
cacggatatc cctgccggcg atattggtgt cggagcaagg gaagtcgggt ttatgttcgg 1440
acagtataaa aagattcggg gccgctatga tgcaggcgtg ttaacaggca aaggccttga 1500
atacgggggc agtttaacga ggaaagaagc gacagggtac ggtctggttt atttcgtgga 1560
agaaatgctg aaggatcagg ggatgcgctt tgaaaacagc accgttgtcg tctccggttc 1620
agggaatgtg gcgctgtacg cgatggaaaa agccgctcaa ttcggtgcga aggtggtggc 1680
ctgcagcgat tctgacggct atgtctatga cgaaaaaggc atctgtcttg agacggtgaa 1740
gcggctcaaa gaagacggga acggaaggat tcgcgagtat gtcagcgagc atccggaagc 1800
acactatttc gagggatgta ccggcatttg gtctattcca tgcgatatcg cgcttccgtg 1860
cgcgacccag aacgaaattg acgaagaggc ggccgaagtg ctcatttcaa atggggtcaa 1920
agctgtcgga gaaggagcaa atatgccgtc tgaagagggc gccgtcaaac gctttttgga 1980
tgcgggagtt ctattcggac cggctaaggc tgcaaatgcc ggcggtgtag ccgtttcagc 2040
gctcgaaatg gcgcagaaca gcgcacggct tcactggacg gcggaagaaa cggatgcgaa 2100
gctcagggcg atcatggctg atattcacaa gagaagcgtt gaagcggctt cagaatacgg 2160
acggcccgga aatctgctcg acggctgcaa tatagccgga tttatcaaag tggcggatgc 2220
gatgatcgct cagggagtcg tttaa 2245
<210> 8
<211> 1580
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
catatgcagc ccgacattga gatttgtccg attcagctga agggaagggg ccggcgtttc 60
aacgagcctt gttacgaaag ccttgaagaa gcagttcaag acatttttga gcaggttcaa 120
gctgaacgaa aaggtgacga ctacgctctt ttcgggcaca gcatgggaag ccttttggca 180
tatgaacttt actatcaaat gagcggggcg ggagctgaaa aaccggttca catttttttc 240
tcgggctata aagcgccaaa caggatcaga aagacagaaa aactgcatac cttgcccaat 300
cctattttta agaaaaaaat tgtcgagctc gggggaacgc ctgaggagct catcaatcat 360
gaagagctat ttgaattgtt tatccccatt ctcaaaagcg actttaaaat ggtagaaaac 420
tatatctatc aagaaagaaa cagcaaaata gattgcgaca ttaccgttct caacggaaaa 480
gaagacgcca tgagcaagga agatgtatcc gattggaaac atcatacttc aggacacttt 540
acagcctatt actttgaggg gaatcatttc tttttgcacc atcacgttga aaagatcacc 600
gaaatcatca atcattcact gacagccagc cggacgtttt aacctgcgat ttcggcgaga 660
ttcaagcccg ggtctaatct atttttcctt cttcggacgc ttcaaaaatt acttttatta 720
taatcggaac agtgtttttt agatcttttg atctatttgg tgtttatctt gtctcataaa 780
tacatgttta aacaatgtaa aatataaaat atccaattca taaaaaatta accattatta 840
aacaatattc ctatggaaaa taatgattat ttttgataat ctgttttcac aagacggagg 900
ttcaataaaa aatcggtaaa agagcaacta cagaccaata ttatggtgaa tattttatca 960
aaaaggagaa tttttatatg gttgctaaac attcattaga aaatggggta tttcacaaaa 1020
tgacagagaa tgaaaaagaa ctgatcctac attttaacaa cacaaaaacc gattatccaa 1080
aaaacaagac gcttcatgag ctttttgaag aacaggccat gaagacgcct gaccatacgg 1140
ctcttgtgtt cggtgctcag cgcatgacct acagagagct gaatgagaag gcaaaccaaa 1200
ccgcgagact cctcagagaa aaagggatcg gcagaggctc gattgccgcg atcatcgcgg 1260
accgctcctt tgaaatgatc atcggcatca tcggtatttt aaaagcggga ggtgcgtatc 1320
tgccgatcga ccctgaaacg ccgaaagaca gaattgcctt catgctcagc gacacgaaag 1380
ccgcggtgct gcttacgcaa ggaaaagcgg cggacggaat cgattgtgag gctgacatcg 1440
ttcagttgga cagagaggct tcagacggat tcagtaaaga accgctcagt tctgtcaatg 1500
attccggcga taccgcctat attatctaca catcaggttc cacgggaacg ccaaaaggcg 1560
tcatcacccc gcactacagt 1580
<210> 9
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ttgacatata at 12
<210> 10
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gccttgaccc cat 13
<210> 11
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ttctcataaa at 12
<210> 12
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aagccatata tt 12
<210> 13
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aagccatata tt 12
<210> 14
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tatataatat gagaatgtca atggctttta cgcccatttc taaaaatgta a 51
<210> 15
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gacattctca tattatatat tataataaaa tataaagtga tagcagatct aaag 54
<210> 16
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tatataatat gagaatgtca atggcttttt acgcccattt ctaaaaatgt aa 52
<210> 17
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
acattctcat attatatatt tataattaaa atataaagtg atagcagatc taaag 55
<210> 18
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tatatggggt gagaatgtca atggcttcaa ggcgcccatt tctaaaaatg taa 53
<210> 19
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gacattctca ccccatatat ttataattaa aatataaagt gatagcagat ctaaag 56
<210> 20
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
atatggggtg agaatgtcaa tggcttcaag gcgcccattt ctaaaaatgt aa 52
<210> 21
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tgacattctc accccatata ttataataaa atataaagtg atagcagatc taaag 55
<210> 22
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gtttattatc cataccctta c 21
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cagatttcgt gatgcttgtc 20
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tgatccttcc tcctttagat ctg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aagagcagag aggacggatt tcc 23
<210> 26
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ctaaaggagg aaggatcaat gagaggcaaa aaggtatg 38
<210> 27
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tccgtcctct ctgctctttt actgagctgc cgcctgtac 39
<210> 28
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gctctagagc caggcgcttc agcagg 26
<210> 29
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cgaaaacata ccacctatca atgagcatct tatcccgt 38
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tgataggtgg tatgttttcg 20
<210> 31
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctcgccgtct ggaaatttgt gatccttcct cctttag 37
<210> 32
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
caaatttcca gacggcgag 19
<210> 33
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ccgagctccc cttgctccga caccaat 27
<210> 34
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
atgtgataac tcggcgta 18
<210> 35
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gcaagcagca gattacgc 18
<210> 36
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ggatccagac aaaccagg 18
<210> 37
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
aatcttttta tactgtcc 18
<210> 38
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gctctagacg aaaaggtgac gactacgc 28
<210> 39
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cgaaaacata ccacctatca ttaaaacgtc cggctggctg 40
<210> 40
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
tgataggtgg tatgttttcg 20
<210> 41
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
ctaatgaatg tttagcaacc attgatcctt cctcctttag 40
<210> 42
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
atggttgcta aacattcatt ag 22
<210> 43
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ccgagctcgt ctgaagcctc tctgtc 26
<210> 44
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
catatgcagc ccgacattga g 21
<210> 45
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gacagaactg agcggttc 18