缺失亮氨酸脱氢酶基因的地衣芽胞杆菌在异源蛋白生产中的
应用
技术领域
本发明涉及地衣芽胞杆菌基因工程改造和蛋白高效表达领域,尤其是缺失亮氨酸脱氢酶基因的地衣芽胞杆菌在异源蛋白生产中的应用,所述的异源蛋白的包括碱性蛋白酶、角蛋白酶、中性蛋白酶。
背景技术
芽胞杆菌是异源蛋白高效表达的良好宿主,地衣芽胞杆菌是目前异源蛋白尤其是蛋白酶高效工业化生产的常用宿主菌株。蛋白酶是目前应用最为广泛的酶制剂产品,广泛应用于食品、医药、化学工业、废物处理等领域。异源蛋白表达是提高目的蛋白表达水平的有效策略。近年来,越来越多的策略被开发用于提高目的蛋白的合成水平。然而,地衣芽胞杆菌中存在着众多与外源蛋白表达的合成与分泌息息相关的基因,蛋白产量与哪些基因相关仍然是个未知数,通过对相关基因改造的方式得到高产蛋白工程菌也有待进一步研究。
地衣芽胞杆菌中亮氨酸脱氢酶(Bcd)是一类NAD(H)依赖型氧化还原酶,可催化亮氨酸与其相应的支链α-酮酸之间的可逆的还原胺化反应。然而,该基因的表达水平与异源蛋白表达是否有联系并未研究,不可预知。本发明通过在地衣芽胞杆菌中敲除bcd,达到了异源蛋白产量提高的技术效果,说明敲除bcd是提高异源蛋白生产水平的有效策略。
发明内容
本发明的目的之一在于提供缺失亮氨酸脱氢酶基因的地衣芽胞杆菌在异源蛋白生产中的应用,所述的亮氨酸脱氢酶基因序列为SEQ ID NO.1所示。
为了达到上述目的,本发明采取以下技术措施:
缺失亮氨酸脱氢酶(bcd)基因的地衣芽胞杆菌在异源蛋白生产中的应用,包括利用本发明的常规方法,将地衣芽胞杆菌中的亮氨酸脱氢酶基因敲除,然后转入异源蛋白表达载体进行蛋白表达,所述的亮氨酸脱氢酶基因为SEQ ID NO.1所示。
以上所述的应用中,优选的,所述异源蛋白为碱性蛋白酶、角蛋白酶或中性蛋白酶;
以上所述的应用中,优选的,所述的地衣芽胞杆菌为地衣芽胞杆菌WX-02;
以上所述的应用中,优选的,所述的地衣芽胞杆菌中的bcd基因敲除方法,包括下述步骤:
(1)以地衣芽胞杆菌的基因组DNA为模板,PCR扩增出bcd基因的上游同源臂和bcd基因的下游同源臂;
(2)通过重叠延伸PCR将bcd基因的上游同源臂和bcd基因的下游同源臂连接到一起,构成目的基因片段;
(3)采用XbaI和BamHI限制性内切酶对目的基因片段进行双酶切得到酶切基因片段;
(4)准备质粒T2(2)-ori,并采用XbaI和BamHI限制性内切酶对质粒T2(2)-ori进行双酶切得到线性质粒片段;
(5)将步骤(3)得到的酶切基因片段和步骤(4)得到的线性质粒片段经DNA连接酶进行连接,得到敲除质粒T2(2)-Δbcd;
(6)将敲除质粒T2(2)-Δbcd转入地衣芽胞杆菌中,以卡那青霉素作为筛选标记,筛选得到阳性转化子;
(7)将阳性转化子转接培养数次后,进行菌落PCR检测,得到bcd基因的上游同源臂或bcd基因的下游同源臂与地衣芽胞杆菌WX-02基因组DNA产生单交换的阳性单交换结合子菌株;
(8)挑选bcd基因的上游同源臂与地衣芽胞杆菌WX-02基因组DNA产生单交换的阳性单交换结合子菌株与bcd基因的下游同源臂与地衣芽胞杆菌WX-02基因组DNA产生单交换的阳性单交换结合子菌株混合接种于不含有卡那青霉素的培养基中经过数次转接培养,PCR法筛选得到敲除了bcd基因的地衣芽胞杆菌。
以上所述的应用中,优选的,当采用缺失bcd基因的地衣芽胞杆菌在碱性蛋白酶、或角蛋白酶或中性蛋白酶的异源蛋白生产时,所使用的发酵培养基的配方包括:10-20g/L葡萄糖、5-13g/L大豆蛋白胨、8-12g/L玉米浆,7-11g/L酵母粉,8-12g/L氯化钠,2-5g/LK2HPO4和4-8g/L(NH4)2SO4;或5-10g/L骨蛋白胨、5-10g/L大豆蛋白胨、8-12g/L玉米浆、7-11g/L酵母粉、8-12g/L氯化钠、2-5g/L K2HPO4和4-8g/L(NH4)2SO4。
与现有技术相比,本发明具有以下优点:
本发明人首次尝试构建敲除bcd基因的地衣芽胞杆菌,成功得到了缺失bcd基因的地衣芽胞杆菌异源蛋白表达宿主菌株,经过转入碱性蛋白酶、角蛋白酶和中性蛋白酶游离表达载体,发酵结果表明,bcd缺失显著提高了蛋白表达水平,与相应对照菌株相比,通过本发明构建得到的地衣芽胞杆菌的异源蛋白产量均提高了23%以上。本发明为地衣芽胞杆菌蛋白高效表达提供了一种新策略。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
本发明以三种蛋白(碱性蛋白酶、角蛋白酶、中性蛋白酶)为例,说明本发明技术方案的优越性;但在实际操作过程中,并不局限于这三种蛋白。
实施例1:
亮氨酸脱氢酶(bcd)基因缺失的地衣芽胞杆菌WX-02Δbcd的获得:
1、根据地衣芽胞杆菌WX-02基因组DNA序列中bcd基因序列,设计bcd基因的上游同源臂引物(bcd-F1、bcd-R1)和下游同源臂引物(bcd-F2、bcd-R2);并以地衣芽胞杆菌WX-02的基因组DNA为模板,分别以bcd基因的上游同源臂引物、下游同源臂引物进行PCR扩增得到bcd基因的上游同源臂片段和bcd基因的下游同源臂片段(bcd基因的上游同源臂片段为567bp;bcd基因的下游同源臂片段为591bp);
其中,bcd-F1、bcd-R1、bcd-F2、bcd-R2的序列为:
bcd-F1:GATCTTTTCTACGAGCTCCACGTGCTGTCACATGTAGCA、
bcd-R1:TAGAGAATAGGGGTTATGATTTTACATTTTTTATTCCTCCTCATG、
bcd-F2:CATGAGGAGGAATAAAAAATGTAAAATCATAACCCCTATTCTCTA、
bcd-R2:GTGGCGGCCGCTCTAGATGATCATTTTCATATCTTCATAA;
2、以bcd基因的上游同源臂和bcd基因的下游同源臂片段为模板,上游同源臂引物bcd-F1、下游同源臂引物bcd-R2为引物,通过重叠延伸PCR将bcd基因的上游同源臂和bcd基因的下游同源臂连接到一起,得到目的基因片段;
3、采用XbaI和BamHI限制性内切酶对步骤(2)中的目的基因片段进行双酶切,得到酶切基因片段;
4、并采用XbaI和BamHI限制性内切酶对质粒T2(2)-ori进行双酶切,得到线性质粒片段;
5、将步骤3的酶切基因片段和步骤4的线性质粒片段经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1408bp处出现电泳条带,说明敲除载体构建成功,上述转化子为阳性转化子(命名为:敲除载体T2(2)-Δbcd);
6、将敲除载体T2(2)-Δbcd转入地衣芽胞杆菌WX-02中,在37℃的条件下经含有卡那青霉素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:T2-F和T2-R)。若转化子的PCR验证结果为:在1408bp处出现电泳条带,证明:敲除载体T2(2)-Δbcd成功转入地衣芽胞杆菌WX-02中,此时,该转化子为阳性转化子(即转入了敲除载体T2(2)-Δbcd的地衣芽胞杆菌WX-02);
其中,T2-F和T2-R的序列为:
T2-F:ATGTGATAACTCGGCGTA、
T2-R:GCAAGCAGCAGATTACGC;
7、将步骤6得到的阳性转化子在45℃条件下、含有卡那青霉素抗性的培养基上转接培养3次,每次培养12h,并以T2-F和Δbcd-KYR为引物(或以T2-R与Δbcd-KYF为引物)进行菌落PCR检测单交换菌株,扩增出1433bp或2522bp长度的条带,即证明为单交换菌株;
其中,Δbcd-KYF和Δbcd-KYR的序列为:
Δbcd-KYF:GTGGATATCATTCATTCGGAAT、
Δbcd-KYR:GCCGGAAAAGCACATATCGATC;
8、将步骤7得到的PCR检测出现1433bp条带的单交换菌株和步骤7得到的PCR检测出现2522bp条带的单交换菌株混合接种培养,在37℃、不含有卡那青霉素的培养基中经过数次转接培养,挑转化子进行菌落PCR验证(引物为Δbcd-KYF和Δbcd-KYR)。若转化子的PCR验证结果为:在2547bp处出现电泳条带时,说明基因回复突变,该转化子为地衣芽胞杆菌WX-02;在1458bp处出现电泳条带时,说明WX-02的基因组上的bcd基因成功敲除,该转化子为阳性转化子。随后针对阳性转化子进行DNA测序进一步验证,得到双交换成功的bcd敲除菌株(即地衣芽胞杆菌WX-02Δbcd)。
实施例2:
三种外源蛋白表达载体的构建:
碱性蛋白酶游离表达质粒pHY-AprE的制备:
1.以地衣芽胞杆菌WX-02基因组DNA为模板,设计引物AprE-F/AprE-R扩增碱性蛋白酶基因aprE的基因表达框(SEQ ID NO.2所示,包括启动子、aprE基因和终止子),得到aprE基因序列1740bp;
2.采用EcoRI和XbaI对得到的aprE基因进行酶切,得到双酶切片段;
3.采用EcoRI和XbaI对芽胞杆菌表达载体pHY300PLK进行双酶切,得到双酶切载体片段;
4.将步骤2和3得到的双酶切片段和双酶切载体经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有四环素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:pHY-F和pHY-R)。若转化子的PCR验证结果为:在1992bp处出现电泳条带,说明表达载体构建成功,上述转化子为阳性转化子(命名为:表达载体pHY-AprE);
AprE-F CGGAATTCTGATCTCATAAAATAAATGAATAGT
AprE-R GCTCTAGAGGGGTCATCTCTTTCGCGTCGT
pHY-F GTTTATTATCCATACCCTTAC
pHY-R CAGATTTCGTGATGCTTGTC。
角蛋白酶游离表达载体pHY-Ker的制备:
1.以地衣芽胞杆菌WX-02基因组DNA为模板,设计引物Ker-F/Ker-R扩增碱性蛋白酶基因aprE的基因簇序列(SEQ ID NO.3所示,包括启动子、基因和终止子),得到ker基因片段1713bp;
2.采用EcoRI和XbaI对得到的aprE基因进行酶切,得到酶切后的双酶切片段;
3.采用EcoRI和XbaI对芽胞杆菌表达载体pHY300PLK进行双酶切,得到双酶切载体片段;
4.将步骤2和3得到的双酶切片段和双酶切载体经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有四环素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:pHY-F和pHY-R)。若转化子的PCR验证结果为:在1965bp处出现电泳条带,说明表达载体构建成功,上述转化子为阳性转化子(命名为:表达载体pHY-Ker);
Ker-F CGGAATTCTTTACAAACGCAGTTTCGAGGCA
Ker-R GCTCTAGATGATCTCATAAAATAAATGAATAG.
中性蛋白酶游离表达载体pHY-NprE的制备:
1.以地衣芽胞杆菌WX-02基因组DNA为模板,设计引物NprE-F/NprE-R扩增碱性蛋白酶基因aprE的基因簇序列(SEQ ID NO.4所示,包括启动子、基因和终止子),得到aprE基因片段2238bp;
2.采用EcoRI和XbaI对得到的aprE基因进行酶切,得到酶切后的双酶切片段;
3.采用EcoRI和XbaI对芽胞杆菌表达载体pHY300PLK进行双酶切,得到双酶切载体片段;
4.将步骤2和3得到的双酶切片段和双酶切载体经T4 DNA连接酶进行连接,得到连接产物;通过氯化钙转化法将该连接产物转入大肠杆菌DH5α,在37℃的条件下经含有四环素抗性的培养基进行筛选,筛选得到转化子,对转化子挑质粒进行菌落PCR验证(所用引物为:pHY-F和pHY-R)。若转化子的PCR验证结果为:在2490bp处出现电泳条带,说明表达载体构建成功,上述转化子为阳性转化子(命名为:表达载体pHY-NprE);
NprE-F CGGAATTCATGAAATATCTGTCGAAATGCTG
NprE-R GCTCTAGACCCTTCAAACGGAAAACCGTGG。
实施例3:
三种表达外源蛋白基因工程菌的构建及应用:
将碱性蛋白酶游离表达质粒pHY-AprE、角蛋白酶游离表达载体pHY-Ker、中性蛋白酶游离表达载体pHY-NprE分别电转入地衣芽胞杆菌WX-02Δbcd中,以四环素抗性作为筛选标记,并经过菌落PCR筛选,以pHY-F和pHY-R作为验证引物,PCR验证得到阳性转化子,获得碱性蛋白酶表达菌株地衣芽胞杆菌WX-02Δbcd/pHY-AprE、角蛋白酶表达菌株地衣芽胞杆菌WX-02Δbcd/pHY-Ker、中性蛋白酶表达菌株地衣芽胞杆菌WX-02Δbcd/pHY-NprE;
本实施例,将碱性蛋白酶游离表达质粒pHY-AprE、角蛋白酶游离表达载体pHY-Ker、中性蛋白酶游离表达载体pHY-NprE分别电转入地衣芽胞杆菌WX-02中,以上述相同的方法筛选出基因工程菌碱性蛋白酶表达菌株地衣芽胞杆菌WX-02/pHY-AprE、角蛋白酶表达菌株地衣芽胞杆菌WX-02/pHY-Ker、中性蛋白酶表达菌株地衣芽胞杆菌WX-02/pHY-NprE作为对照。
本实施例通过向15种不同的发酵培养基中,分别接种上述六种外源蛋白基因工程菌,以考察不同的培养基对目标产物的影响,以及验证缺失了bcd基因的地衣芽胞杆菌确实能提高外源蛋白的表达量。所用的15中发酵培养基配方如表1所示。
种子发酵的具体步骤为:先将地衣芽胞杆菌活化,即从甘油管以体积百分比1%接种于装有5mL LB培养基中,230r/min、温度37℃,培养12小时,然后将菌种活化后的菌液以体积百分比按1%接种量接种于种子发酵培养基于230r/min、37℃中培养10小时,得到种子培养的菌液;
生产发酵的具体步骤为:
向500mL三角瓶中装入50mL的发酵培养基,然后将种子培养的菌液(OD600 4.0-5.0)以接种量为2%(体积百分比),转速230r/min,温度37℃,发酵培养48小时,得到生产发酵的菌液。
以上所述的种子发酵培养基和发酵培养基的配方相同,如表1所示。
表1
15种培养基中其他成分均为:10g/L玉米浆,10g/L酵母粉,10g/L氯化钠,3g/LK2HPO4,6g/L(NH4)2SO4,pH7.0~7.2。
上述三种蛋白酶酶活测定参照中华人民共和国国家标准中所描述的福林法进行。
一个单位酶活(U)定义为:一定温度、一定pH条件下,蛋白酶液在1min内水解酪蛋白产生1μg酪氨酸所需要的酶量。
其中标准曲线的测定:将标准酪氨酸溶液配置成等梯度的溶液(10、20……80、90、100μg/mL),进行上述文献中的反应。
样品的蛋白酶活力计算公式=A×4×N/10
A—样品在分光光度计660nm处测得的数值经标准曲线计算而得的酪氨酸微克数;
N—蛋白酶原液经稀释的倍数;
10—蛋白酶液与酪蛋白的反应时间(min)。
根据此方法计算出发酵菌液中异源蛋白酶活差异(见表2)。
根据此方法计算出WX-02/pHY-AprE和WX-02Δbcd/pHY-AprE发酵菌液中碱性蛋白酶活差异(见表2);WX-02/pHY-Ker和WX-02Δbcd/pHY-Ker发酵菌液中角蛋白酶活差异(见表3);WX-02/pHY-NprE和WX-02Δbcd/pHY-NprE发酵菌液中性蛋白酶活差异(见表4)。
表2碱性蛋白酶酶活数据统计
表3角蛋白酶酶活数据统计
表4中性蛋白酶酶活数据统计
从表2-4可看出,在相同的发酵条件下,采用本发明的地衣芽胞杆菌WX-02Δbcd/pHY-AprE、WX-02Δbcd/pHY-Ker和WX-02Δbcd/pHY-NprE的发酵液中蛋白酶活较对照菌均有大幅提升,均提高了23%以上。说明本发明中的基因工程改造方法在提高地衣芽胞杆菌异源蛋白生产方面具有重要的应用价值。
序列表
<110> 湖北大学
<120> 缺失亮氨酸脱氢酶基因的地衣芽胞杆菌在异源蛋白生产中的应用
<160> 20
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1095
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atggaactat ttcgatatat ggaacagtat gactacgagc aattggtatt ttgccaagat 60
aaacagtccg gtttaaaagc gatcatcgcg attcatgata cgacgctcgg gccggctctc 120
ggcggcacaa gaatgtggac atacgaaagt gaagaagccg caattgaaga tgcgctgcgc 180
cttgcgcggg gaatgaccta caaaaatgcg gcggccggac tgaacctcgg aggaggcaaa 240
accgttatta tcggagatcc gcgcaaagat aaaaacgaag aaatgttccg cgctttcggc 300
cgctacattc aaggcttgaa cggcagatac atcacagccg aagacgtcgg tacaaccgtt 360
gaagatatgg acatcattca tgacgaaacc gatttcgtta caggcatttc acctgctttc 420
ggttcatcag gaaatccttc tccggtaaca gcttacgggg tatataaagg gatgaaggcg 480
gcggcgaaag cggcattcgg aacggattcg cttgaaggca aaaccgttgc ggttcaaggc 540
gtcggaaacg tggcctacaa cctgtgccgg cacctccacg aagaaggcgc gaaactgatc 600
gtgaccgaca tcaacaaaga agcagttgaa cgtgcagtcg ccgaattcgg cgcccgcgcc 660
gtcgatccgg atgatattta ttcgcaggaa tgcgatatat atgcgccgtg tgccctcgga 720
gcgacaatca acgatgatac gattccgcag ctgaaagcca aagtgattgc cggggcagcc 780
aacaaccagc tgaaagaaac ccgccacggt gatcaaatcc acgacatggg catcgtttat 840
gccccggact atgtcatcaa tgccggcggc gtcatcaatg tcgctgacga gctttacggc 900
tataattcgg agcgcgcgct gaagaaagtc gaaggcatct acggaaacat tgaacgcgtc 960
cttgaaattt cgaagcgcga ccgcattccg acatacttgg ccgcagaccg tctggcggaa 1020
gaacgaattg agcgcatgcg ccaatcgaga agccaatttt tgcaaaacgg ccatcacatt 1080
ttaagcagac gttaa 1095
<210> 2
<211> 1740
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgatctcata aaataaatga atagtatttt cataaaatga atcagatgga gcaatctcct 60
gtcattcgcg gccctcggga cctctttccc tgccaggctg aagcggtcta ttcatacttt 120
cgaactgaac atttttctaa aacagttatt aataaccaaa aaattttaaa ttggtcctcc 180
aaaaaaatag gcctaccata taattcattt tttttctata ataaattaac agaataattg 240
gaatagatta tattatcctt ctatttaaat tattctgaat aaagaggagg agagtgagta 300
atgatgagga aaaagagttt ttggcttggg atgctgacgg ccttcatgct cgtgttcacg 360
atggcattca gcgattccgc ttctgctgct caaccggcga aaaatgttga aaaggattat 420
attgtcggat ttaagtcagg agtgaaaacc gcatctgtca aaaaggacat catcaaagag 480
agcggcggaa aagtggacaa gcagtttaga atcatcaacg cggcaaaagc gaagctagac 540
aaagaagcgc ttaaggaagt caaaaatgat ccggatgtcg cttatgtgga agaggatcat 600
gtggcccatg ccttggcgca aaccgttcct tacggcattc ctctcattaa agcggacaaa 660
gtgcaggctc aaggctttaa gggagcgaat gtaaaagtag ccgtcctgga tacaggaatc 720
caagcttctc atccggactt gaacgtagtc ggcggagcaa gctttgtggc tggcgaagct 780
tataacaccg acggcaacgg acacggcaca catgttgccg gtacagtagc tgcgcttgac 840
aatacaacgg gtgtattagg cgttgcgcca agcgtatcct tgtacgcggt taaagtactg 900
aattcaagcg gaagcggatc atacagcggc attgtaagcg gaatcgagtg ggcgacaaca 960
aacggcatgg atgttatcaa tatgagcctt gggggagcat caggctcgac agcgatgaaa 1020
caggcagtcg acaatgcata tgcaaaaggg gttgtcgttg tagctgcagc agggaacagc 1080
ggatcttcag gaaacacgaa tacaattggc tatcctgcga aatacgattc tgtcatcgct 1140
gttggtgcgg tagactctaa cagcaacaga gcttcatttt ccagtgtggg agcagagctt 1200
gaagtcatgg ctcctggcgc aggcgtatac agcacttacc caacgaacac ttatgcaaca 1260
ttgaacggaa cgtcaatggc ttctcctcat gtagcgggag cagcagcttt gatcttgtca 1320
aaacatccga acctttcagc ttcacaagtc cgcaaccgtc tctccagcac ggcgacttat 1380
ttgggaagct ccttctacta tgggaaaggt ctgatcaatg tcgaagctgc cgctcaataa 1440
catattctaa caaatagcat atagaaaaag ctagtgtttt tagcactagc tttttcttca 1500
ttctgatgag ggttgttcaa tattttgaat ccgttccatg atcgtcggat ggccgtattt 1560
aaaaatcttg acgagaaacg gcgggtttgc ctcgctcagc ccggcttttg agagctcttg 1620
aaacgtcgaa accgctgcat cgctgttttg cgtcagttca atcgcatact ggtcagcagc 1680
tttttcctga tgcctcgaaa ctgcgttcgt aaatggagac gacgcgaaag agatgacccc 1740
<210> 3
<211> 1713
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tttacaaacg cagtttcgag gcatcaggaa aaagccgctg accagtatgc gattgaactg 60
acgcaaaaca gcgatgcagc ggtttcgacg tttcaagagc tctcaaaagc cgggctgagc 120
gaggcaaacc cgccgtttct cgtcaagatt tttaaatacg gccatccgac gatcatggaa 180
cggattcaaa atattgaaca gtcttcatca gaatgaagaa aaagctagtg ctaaaaacac 240
tagctttttc tatatgctat ttgttagaat atgttattga gcggcagctt cgacattgat 300
cagacctttc ccatagtaga aggagcttcc caaataagtc gccgtgctgg agagacggtt 360
gcggacttgt gaagctgaaa ggttcggatg ttttgacaag atcaaagctg ctgctcccgc 420
tacatgagga gaagccattg acgttccgtt caatgttgca taagtgttcg ttgggtaagt 480
gctgtatacg cctgcgccag gagccatgac ttcaagctct gctcccacac tggaaaatga 540
agctctgttg ctgttagagt ctaccgcgcc aacagcgatg acagaatcgt atttcgcagg 600
atagccaatt gtattcgtgt ttcctgaaga tccgctgttc cctgctgcag ctacaacgac 660
aacccctctt gcatatgcat tgtcgactgc ctgtttcatc gctgtcgagc ctgatgctcc 720
cccaaggctc atattgataa catccatgcc gtttgttgtc gcccactcga ttccgcttac 780
aatgccgctg tatgatccgc ttccgcttga attcagtact ttaaccgcgt acaaggatac 840
gcttggcgca acgcctaata cacccgttgt attgtcaagc gcagctactg taccggcaac 900
atgtgtgccg tgtccgttgc cgtcggtgtt ataagcttcg ccagccacaa agcttgctcc 960
gccgactacg ttcaagtccg gatgagaagc ttggattcct gtatccagga cggctacttt 1020
tacattcgct cccttaaagc cttgagcctg cactttgtcc gctttaatga gaggaatgcc 1080
gtaaggaacg gtttgcgcca aggcatgggc cacatgatcc tcttccacat aagcgacatc 1140
cggatcattt ttgacttcct taagcgcttc tttgtctagc ttcgcttttg ccgcgttgat 1200
gattctaaac tgcttgtcca cttttccgcc gctctctttg atgatgtcct ttttgacaga 1260
tgcggttttc actcctgact taaatccgac aatataatcc ttttcaacat ttttcgccgg 1320
ttgagcagca gaagcggaat cgctgaatgc catcgtgaac acgagcatga aggccgtcag 1380
catcccaagc caaaaactct ttttcctcat cattactcac tctcctcctc tttattcaga 1440
ataatttaaa tagaaggata atataatcta ttccaattat tctgttaatt tattatagaa 1500
aaaaaatgaa ttatatggta ggcctatttt tttggaggac caatttaaaa ttttttggtt 1560
attaataact gttttagaaa aatgttcagt tcgaaagtat gaatagaccg cttcagcctg 1620
gcagggaaag aggtcccgag ggccgcgaat gacaggagat tgctccatct gattcatttt 1680
atgaaaatac tattcattta ttttatgaga tca 1713
<210> 4
<211> 2238
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgaaatatc tgtcgaaatg ctgaataaaa tgactgaaaa tctctgacat ctgtaacaat 60
cctttacgtt tattaaggcc tcacccgttt agacaaccgg cattcaaaaa agttttaaag 120
atcttaacat ttttccccta tcatttttcc cgtcttcatt tgtcattttt tccagaaaaa 180
atcgcgtcat tcgactcatg tctaatccaa cacgtgtctc tcggcttatc ccctgacacc 240
gcccgccgac agcccgcatg ggacgattct atcaattcag ccgcggagtc tagttttata 300
ttgcagaatg cgagattgct ggtttattat aacaatataa gttttcatta ttttcaaaaa 360
gggggattta ttgtgggttt aggtaagaaa ttgtctgttg ctgtcgccgc ttcctttatg 420
agtttaacca tcagtctgcc gggtgttcag gccgctgaga atcctcagct taaagaaaac 480
ctgacgaatt ttgtaccgaa gcattctttg gtgcaatcag aattgccttc tgtcagtgac 540
aaagctatca agcaatactt gaaacaaaac ggcaaagtct ttaaaggcaa tccttctgaa 600
agattgaagc tgattgacca aacgaccgat gatctcggct acaagcactt ccgttatgtg 660
cctgtcgtaa acggtgtgcc tgtgaaagac tctcaagtca ttattcacgt cgataaatcc 720
aacaacgtct atgcgattaa cggtgaatta aacaacgatg tttccgccaa aacggcaaac 780
agcaaaaaaa tatctgcaaa tcaggcgctg gatcatgctt ataaagcgat cggcaaatca 840
cctgaagccg tttctaacgg aaccgttgca aacaaaaaca aagccgagct gaaagcagca 900
gccacaaaag acggcaaata ccgcctcgcc tatgatgtaa ccatccgcta catcgaaccg 960
gaacctgcaa actgggaagt aaccgttgat gcggaaacag gaaaaatcct gaaaaagcaa 1020
aacaaagtgg agcatgccgc cacaaccgga acaggtacga ctcttaaagg aaaaacggtc 1080
tcattaaata tttcttctga aagcggcaaa tatgtgctgc gcgatctttc taaacctacc 1140
ggaacacaaa ttattacgta cgatctgcaa aaccgcgagt ataacctgcc gggcacactc 1200
gtatccagca ccacaaacca gtttacaact tcttctcagc gcgctgccgt tgatgcgcat 1260
tacaacctcg gcaaagtgta tgattatttc tatcagaagt ttaatcgcaa cagctacgac 1320
aataaaggcg gcaagatcgt atcctccgtt cattacggca gcagatacaa taacgcagcc 1380
tggatcggcg accaaatgat ttacggtgac ggcgacggtt cattcttctc acctctttcc 1440
ggttcaatgg acgtaaccgc tcatgaaatg acacatggcg ttacacagga aacagccaac 1500
ctgaactacg aaaatcagcc gggcgcttta aacgaatcct tctctgatgt attcgggtac 1560
ttcaacgata ctgaggactg ggatatcggt gaagatatta cggtcagcca gccggctctc 1620
cgcagcttat ccaatccgac aaaatacgga cagcctgata atttcaaaaa ttacaaaaac 1680
cttccgaaca ctgatgccgg cgactacggc ggcgtgcata caaacagcgg aatcccgaac 1740
aaagccgctt acaatacgat tacaaaaatc ggcgtgaaca aagcggagca gatttactat 1800
cgtgctctga cggtatacct cactccgtca tcaactttta aagatgcaaa agccgctttg 1860
attcaatctg cgcgggacct ttacggctct caagatgctg caagcgtaga agctgcctgg 1920
aatgcagtcg gattgtaaac aagaaaagag accggaaatc cggtctcttt tttatatcta 1980
aaaacatttc acagtggctt caccatgatc atatatgtct tttcccgatc gtctttttca 2040
agcttcagct gttcaaagcc gcactggctt aaaaacaaca cccattcctg cctggcaagg 2100
ggaacggctg taaacatcgc tttatgctcc gctctcagcc ggccggcaat ctcttcaatg 2160
accgcgcgcc cgattccttt ctcttttgcc tccggagcga cggccacagt tccgagccac 2220
ggttttccgt ttgaaggg 2238
<210> 5
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gatcttttct acgagctcca cgtgctgtca catgtagca 39
<210> 6
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tagagaatag gggttatgat tttacatttt ttattcctcc tcatg 45
<210> 7
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
catgaggagg aataaaaaat gtaaaatcat aacccctatt ctcta 45
<210> 8
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gtggcggccg ctctagatga tcattttcat atcttcataa 40
<210> 9
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atgtgataac tcggcgta 18
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gcaagcagca gattacgc 18
<210> 11
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gtggatatca ttcattcgga at 22
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gccggaaaag cacatatcga tc 22
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gccggaaaag cacatatcga tc 22
<210> 14
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gctctagagg ggtcatctct ttcgcgtcgt 30
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gtttattatc cataccctta c 21
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
cagatttcgt gatgcttgtc 20
<210> 17
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cggaattctt tacaaacgca gtttcgaggc a 31
<210> 18
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gctctagatg atctcataaa ataaatgaat ag 32
<210> 19
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cggaattcat gaaatatctg tcgaaatgct g 31
<210> 20
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gctctagacc cttcaaacgg aaaaccgtgg 30