CN108531471B - 一种长基因合成方法 - Google Patents

一种长基因合成方法 Download PDF

Info

Publication number
CN108531471B
CN108531471B CN201710116019.6A CN201710116019A CN108531471B CN 108531471 B CN108531471 B CN 108531471B CN 201710116019 A CN201710116019 A CN 201710116019A CN 108531471 B CN108531471 B CN 108531471B
Authority
CN
China
Prior art keywords
fragment
sequence
fragments
primary
sites
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710116019.6A
Other languages
English (en)
Other versions
CN108531471A (zh
Inventor
李一凡
邱蔚
张婷婷
张丽华
柳振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Jinsirui Science and Technology Biology Corp
Original Assignee
Nanjing Jinsirui Science and Technology Biology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Jinsirui Science and Technology Biology Corp filed Critical Nanjing Jinsirui Science and Technology Biology Corp
Priority to CN201710116019.6A priority Critical patent/CN108531471B/zh
Publication of CN108531471A publication Critical patent/CN108531471A/zh
Application granted granted Critical
Publication of CN108531471B publication Critical patent/CN108531471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA

Abstract

本发明公开了一种长基因合成方法。一种长基因合成方法,包含以下步骤:1)按照基因片段内部的typeIIs酶切位点对长基因进行两级分段;2)通过传统的基因合成获得二级片段;3)由二级片段利用Golden Gate拼接成一级片段;4)由一级片段利用酶切‑LCR的方法,或者PCR‑LCR的方法拼接成全长基因。此方法使用typeIIs酶切位点对大片段基因进行分段,typeIIs酶切位点有很多可供选择,因此方法适用于绝大部分的序列特征。本方法能够快速的将短片段拼接成长片段。由二级片段拼接成全长可以在五天内实现。整个技术方案流程化,可以利用软件进行自动化设计,同时可以使用自动化平台进行生产。

Description

一种长基因合成方法
技术领域
本发明属于生物领域,涉及一种长基因合成方法。
背景技术
现代分子生物学、基因工程以及合成生物学对长基因合成的需求越来越大。在分子生物学领域,研究者为了表达蛋白或者探究某一通路的功能,经常需要重新设计并且从头构建大于10kb的质粒。合成生物学科学家构建的基因线路和代谢通路经常包含十几个甚至几十个原件,单个模块的长度经常在10kb甚至20kb以上。
基因组的重新设计和合成是合成生物学的研究热点之一。在2010年,Venter研究院从头合成了一种支原体基因组,并将其移植到一个细胞中,首次成功构建了人工合成生命。由约翰霍普金斯大学Boeke教授领导的一个国际团队也正在进行酿酒酵母基因组的重新设计及合成。在2016年,由哈佛大学Church教授和Boeke教授组织的一次研讨会正式将合成人类基因组的计划提上日程。这些基因组级别的DNA重新合成的研究对大片段的基因合成能力提出了新的挑战。
对绝大多数技术,一轮基因合成只能合成小于1kb的DNA片段。长基因的合成是通过DNA组装的方法来进行的。目前可用的DNA组装的技术有很多种,下面分别描述一些这些方法。传统的酶切连接技术可以分步的将合成的短基因片段连入目标载体,从而合成目标的长基因片段。然而酶切连接方法一般只能将单一片段连入目标载体,不能进行多片段的连接,使整个方法非常低效。同时,酶切连接方法非常依赖目标片段上独一无二的酶切位点,如果目标片段比较长,会严重限制酶切连接策略的选择。
Gibson组装是Venter研究院合成支原体基因组的过程中发明的组装技术。该技术利用体外同源重组的方法对多个DNA片段进行组装,但是重组过程需要片段之间存在同源臂。通常情况下,组装片段之间同源臂需要利用PCR的方法通过合成在引物5’端加入,这个特点致使组装大片段的时候比较容易发生突变。而且当Gibson组装的片段个数大于5个的时候,组装效率显著下降。
Golden Gate克隆技术利用IIs型核酸酶,通过边切边连的方法将多个片段组装在一起。有报道称Golden Gate克隆可以一次性将10个片段拼接在一起。但是Golden Gate克隆的一个最大的缺点是,当拼接序列内部存在所使用的IIs型核酸酶酶切位点的情况下,就无法使用该技术。
利用酿酒酵母的体内同源重组系统也是一种常用的拼接大片段的方法。但是酵母的生长周期为两天,而且将片段组装后,还需要转化大肠杆菌获得高浓度的片段。因此酵母体内组装的周期显著高于体外组装的周期,而且操作上也比体外组装复杂很多。这些都限制了酵母体内重组的广泛应用。
综上所述,每一种组装技术都有内在的优点和缺点,某一个技术可能适用于某一类特征的序列拼接,但是没有一种技术是普遍适用于所有的序列的合成。在提供长片段基因合成的服务过程中,客户的需求通常是多种多样的。比如,目标基因中或许会有存在IIs型核酸酶酶切位点,就无法使用Golden Gate克隆的方法。
发明内容
本发明的目的是针对现有技术的上述不足,提供一种适用于3kb-50kb的长基因的合成方法,尤其是适用于长度大于8kb以上长基因的合成。
一种长基因合成方法,包含以下步骤:
1)按照基因片段内部的IIs型限制性内切酶酶切位点对长基因进行两级分段:首先计算IIs型限制性内切酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,在一级分段酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此IIs型核酸酶酶切位点;如果有一大段序列超过5kb,其中没有合适的IIs型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段;之后再对一级片段进行二级分段,以使各个二级片段能够通过Golden Gate的方法进行拼接;
2)获得二级片段;
3)由二级片段利用Golden Gate拼接成一级片段;
4)由一级片段利用酶切-LCR的方法,或者PCR-LCR的方法拼接成全长基因。
二级片段通常通过传统基因合成方法获得,也可通过其他制备基因的方法得到。
长基因的合成流程每一步的详细操作步骤:
1.长基因进行两级分段方法优选如下:
首先计算整个序列中的BsaI、BsmBI、BbsI、BspQI等IIs型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段。例如序列中有一个BsaI位点,两个BsmBI位点,而BbsI和BspQI位点比较多,则可以用序列中的BsaI和BsmBI共计三个位点将整段序列分成A1、A2、A3、A4共4段(图2)。如果有一大段序列超过5kb,其中没有合适的IIs型核酸酶酶切位点将其分段,可以人为的将其从靠中间的任意位置分成两段。将所选择的两个酶切位点,其中一个酶(比如BsaI)定义为A酶切位点,另一个(BsmBI)为B酶切位点(图2)。
在酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此IIs型核酸酶酶切位点(图3)。具体的,对BbsI(GAAGAC),将GAAGA分在前一段序列,将AAGAC分在后一段序列。BsaI(GGTCTC),BsmBI(CGTCTC),BspQI(GCTCTTC)处理方式于BsaI类似(图3)。
当一级片段拼接成全长基因采用酶切-LCR的方法,在每个一级分段片段的两端加上A酶切识别位点,作为最终的一级片段序列,对应的酶切-LCR中使用A酶进行酶切;当一级片段拼接成全长基因采用PCR-LCR的方法,则A酶切位点的加入不是必须的,即一级分段的两端可以加上A酶切识别位点,也可以不加上A酶切识别位点。
之后再对一级片段进行二级分段,以使各个二级片段可以通过Golden Gate的方法进行拼接。二级片段的分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。例如对于一个3kb的A2片段可以分成5段,每段约600bp(图4)。最后,在每个二级片段的两端加上B酶切识别位点(一级分段中的另一个酶切位点),作为最终的二级片段序列。
为了方便分段的粘性末端的选择以及后续获得稳定的组装效率,我们设计并测试了一组4bp的粘性末端:CCCT;TATG;ATCC;GCTG;TACA;GAGT;GTCG;TGCC;GAAC。
经过两级分段,可以将一段3kb-50kb的基因分成小于700bp若干段。将这些短片段分别合成后,可以利用两级合成方法拼接成全长。
2.二级片段的合成优选:
二级片段通过普通的基因合成获得,克隆到Amp抗性的pUC57载体上。
3.由二级片段拼接一级片段优选:
二级片段组装成一级片段通过B酶介导的Golden Gate克隆的方法实现(图5)。具体的,将各二级片段和对应的二级辅助载体混合,进行Golden Gate克隆反应,转化大肠杆菌感受态,涂布Kan抗性平板,挑取正确克隆。
4.由一级片段拼接基因全长优选:
一级片段拼接为全长可以通过两种方法实现:
1)通过PCR-LCR的方法拼接全长(图6)。具体的,设计PCR引物,将一级片段所有片段和pUC57载体骨架扩增出来。PCR引物的设计应使扩增片段首尾相接同时没有重叠区域。之后,将PCR片段和Bridging Oligo合并进行LCR反应。反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆。
2)通过酶切-LCR的方法拼接全长(图7)。具体的,将所有的一级片段和一级辅助载体混合在一起,用A酶进行酶切。之后将酶切混合物和Bridging Oligo合并进行LCR反应。反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆。
其中,Bridging Oligo为LCR反应术语,指辅助两个片段拼接的Oligo,与两个片段的末端均有同源片段。
二级辅助载体是拼接二级片段用的,一级辅助载体是拼接一级片段用的。辅助载体对应片段的数量不确定,从2-12都可以,优选2-5条。图4和图5有具体的展示。
辅助载体的构建:
此基因合成流程需要使用一级辅助载体和二级辅助载体,它们均由pUC57载体改造而来。其中二级载体需要满足:带有Kan抗性标记;lacZα片段两端各带有一个IIs型核酸酶酶切位点;两端的IIs型核酸酶酶切位点分别切出“AACG”和“CCGA”的4bp的粘性末端或者“TCT”的3bp的粘性末端;整个载体的其他位置没有所对应IIs型核酸酶酶切位点(图1)。二级辅助载体可以直接作为Golden Gate克隆的载体骨架来使用,同时还可以进行蓝白斑筛选。在本技术方案中,二级辅助载体与二级片段组装,得到一级载体。
一级辅助载体需要满足:带有Amp抗性,lacZalpha片段两端各带有一段Linker序列和一个IIs型限制性内切酶酶切位点,整个载体的其他位置没有所对应IIs型核酸酶酶切位点(图1)。一级辅助载体可以直接作为载体骨架用于酶切-LCR克隆,同时还可以进行蓝白斑筛选。在本技术方案中,一级辅助载体与一级片段进行组装,获得合成基因的全长。
有益效果
1.此方法使用IIs型核酸酶酶切位点对大片段基因进行分段,IIs型核酸酶酶切位点有很多可供选择,因此方法适用于绝大部分的序列。
2.如果使用酶切-LCR的方法将一级片段组装成基因全长,整个组装流程可以完全避免PCR的反应,从而将突变发生的可能性降到最低。
3.能够快速的将短片段拼接成长片段。由二级片段拼接成全长可以在五天内实现。
4.整个技术方案流程化,可以利用软件进行自动化设计,同时可以使用自动化平台进行生产。
附图说明
图1:二级辅助载体图谱
图2:一级片段分段方法示例。
图3:一级片段断点处酶切位点序列处理方法
图4:二级片段分段方法示例
图5:由二级片段利用Golden Gate克隆拼接成一级片段
图6:通过PCR-LCR的方法拼接全长
图7:通过酶切-LCR的方法拼接全长
图8:序列一的一级分段
图9:序列一的一级和二级分段片段大小
图10:序列二的一级分段
图11:序列二的一级和二级分段片段大小
具体实施方式
实施例1:辅助载体的构建
以pUC57-Kan-BsmBI-free1为模板,利用引物Level1pUC57-Kan-BbsI-1/Level1pUC57-Kan-BbsI-2扩增获得pUC57-Kan骨架,Level1lacZa-Kan-BbsI-1/Level1lacZa-Kan-BbsI-2扩增获得lacZα片段。所使用的引物序列为:
Level1pUC57-Kan-BbsI-1 tgacGAAGACtaGGCAGCTGCATGTGTCAGAGG
Level1pUC57-Kan-BbsI-2 tgacGAAGACatTGAGCTCGCTCACTGACTCGCT
Level1lacZa-Kan-BbsI-1 gtacGAAGACtaTGCCaacgCgagaccCACGACAGGTTTCCCGACTGGA
Level1lacZa-Kan-BbsI-2 gatcGAAGACgcCTCAtcggCgagaccTGTCGGGGCTGGCTTAACTAT
PCR反应体系为:10XPBO Buffer 5μL,10mM dNTPs 0.8μL、上游引物1μL、下游引物1μL、模板DNA1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。
通过BbsI介导的Golden Gate将pUC57-Kan和lacZα片段拼接获得pUC57level1-Kan-BsaI。配制如下的反应体系:pUC57-Kan和lacZα片段各1μL、T4DNA ligase buffer(NEB)2μL、BbsI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应程序为:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。获得的最终载体pUC57level1-Kan-BsaI序列见SEQ ID NO.1。
pUC57-Kan-BsmBI-free1为不含BsmBI的pUC57载体,其序列见SEQ ID NO.2。
pUC57level1-Kan-BsmBI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:
Level1pUC57-Kan-BsmBI-1 tgacGAAGACtaGGCAGCTGCATGTGTCAGAGG
Level1pUC57-Kan-BsmBI-2 tgacGAAGACatTGAGCTCGCTCACTGACTCGCT
Level1lacZa-Kan-BsmBI-3 gtacGAAGACtaTGCCaacgCgagacgCACGACAGGTTTCCCGACTGGA
Level1lacZa-Kan-BsmBI-4 gatcGAAGACgcCTCAtcggCgagacgTGTCGGGGCTGGCTTAACTAT
pUC57level1-Kan-BbsI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:
Level1pUC57-Kan-BbsI-1 tgacGGTCTCaGGCAGCTGCATGTGTCAGAGG
Level1pUC57-Kan-BbsI-2 tgacGGTCTCtTGAGCTCGCTCACTGACTCGCT
Level1lacZa-Kan-BbsI-3 gtacGGTCTCaTGCCaacgCggtcttcCACGACAGGTTTCCCGACTGGA
Level1lacZa-Kan-BbsI-4 gatcGGTCTCcCTCAtcggCggtcttcTGTCGGGGCTGGCTTAACTAT
pUC57level1-Kan-BspQI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:
Level1pUC57-Kan-BspQI-1 tgacGGTCTCaGGCAGCTGCATGTGTCAGAGG
Level1pUC57-Kan-BspQI-2 tgacGGTCTCtTGAGCTCGCTCACTGACTCGCT
Level1lacZa-Kan-BspQI-3 gtacGGTCTCaTGCCtctAgaagagcCACGACAGGTTTCCCGACTGGA
Level1lacZa-Kan-BspQI-4 gatcGGTCTCcCTCAagaCgaagagcTGTCGGGGCTGGCTTAACTAT
pUC57level2-Amp-BsaI的构建方法如下:
以pUC57-BsaI free(SEQ ID NO.3)为模板,利用引物pUC57-BsmBI-1/pUC57-BsmBI-2扩增获得pUC57骨架,lacZα-BsmBI-1/lacZα-BsmBI-2扩增获得lacZα片段。PCR反应体系为:10XPBO Buffer 5μL,10mM dNTPs 0.8μL、上游引物1μL、下游引物1μL、模板DNA1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。
通过BsmBI介导的Golden Gate将pUC57和lacZα片段拼接获得pUC57level2-Amp-BsaI。配置如下的反应体系:pUC57和lacZα片段各1μL、T4DNA ligase buffer(NEB)2μL、BsmBI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应程序为:step 1:42℃2min;step 2:16℃5min;Step1-step2共20个循环。Step 3:55℃10min;Step 4:80℃10min;完成Golden Gate组装。如果使用的TypIIs是BsaI或者BbsI,反应程序如下:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 580℃5min。
将上述反应液中取出10μl转化至DH5α感受态细胞,涂布在Amp抗性显色平板上。长出的蓝色克隆活化后直接测序,确认正确后,将此克隆保种。
过程中使用的引物序列如下:
Level2pUC57-BsaI-1:
TCAGcgtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat
Level2pUC57-BsaI-2:
TCAGcgtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgc
Level2lacZa-BsaI-1::
TCAGcgtctcTatcccaggcaatagcgaaaagggaacgCgagaccCACGACAGGTTTCCCGACTGG
Level2lacZa-BsaI-2:
TCAGcgtctcTagggttcccgatagttctgcgtatcggCgagaccTGTCGGGGCTGGCTTAACTATG
pUC57level2-Amp-BsmBI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:
Level2pUC57-BsmBI-1:
TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat
Level2pUC57-BsmBI-2:
TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
Level2lacZa-BsmBI-1:
TCAGggtctcTatcccaggcaatagcgaaaagggaacgCgagacgCACGACAGGTTTCCCGACTGG
Level2lacZa-BsmBI-2:
TCAGggtctcTagggttcccgatagttctgcgtatcggCgagacgTGTCGGGGCTGGCTTAACTATG
pUC57level2-Amp-BbsI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:
Level2pUC57-BbsI-1:
TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat
Level2pUC57-BbsI-2:
TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
Level2lacZa-BbsI-3:
TCAGggtctcTatcccaggcaatagcgaaaagggaacgCGgtcttcCACGACAGGTTTCCCGACTGG
Level2lacZa-BbsI-4:
TCAGggtctcTagggttcccgatagttctgcgtatcggCGgtcttcTGTCGGGGCTGGCTTAACTATG
pUC57level2-Amp-BsmBI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:
Level2pUC57-BsaI-1:
TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat
Level2pUC57-BsaI-2:
TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
Level2lacZa-BsaI-5:
TCAGggtctcTatcccaggcaatagcgaaaagggtctAgaagagcCACGACAGGTTTCCCGACTG
Level2lacZa-BsaI-6:
TCAGggtctcGagggttcccgatagttctgcgtaagaCgaagagcTGTCGGGGCTGGCTTAACTAT
pUC57level2-Amp-BspQI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:
Level2pUC57-BspQI-1:
TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat
Level2pUC57-BspQI-2:
TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
Level2lacZa-BspQI-5:
TCAGggtctcTatcccaggcaatagcgaaaagggtctAgaagagcCACGACAGGTTTCCCGACTG
Level2lacZa-BspQI-6:
TCAGggtctcGagggttcccgatagttctgcgtaagaCgaagagcTGTCGGGGCTGGCTTAACTAT
实施例2:序列一的合成示例
序列一(SEQ ID NO.4)的分析显示,序列共含有1个BsaI位点、7个BbsI位点、2个BsmBI位点和1个BspQI位点,选择BsaI和BsmBI对序列进行分段。在进行长基因合成的过程中,二级组装采用BsaI Golden Gate,一级组装采用PCR产物进行LCR反应。利用BsaI和BsmBI位点将序列分为四段,对于其中大于5Kb的一段再利用特定的碱基(在后续组装中作为粘性末端)将其分为两段,最终将全长分成A,B,C,D,E共5个片段,如图8所示。
将A,B,C,D,E五个一级片段再次继续的分成二级片段,便于进行基因合成。分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共16个,序列见SEQ ID NO.5-SEQ ID NO.20。一级和二级片段大小如图9所示。
二级片段通过普通的基因合成获得。设计引物。合成得到的引物,将每条引物稀释至50μM,将所有的引物进行混合并稀释10倍(Oligo Mix中每条引物浓度为5μM)。配制第一轮PCR反应体系:10XPBO Buffer 5μL、10mM dNTPs 1μL、Oligo Mix 10μL、PBO DNAPolymerase1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,25个循环;最后72℃延伸反应10min。第二轮PCR以第一轮PCR反应的产物作为模板,反应体系:一轮PCR产物10μL、10XPBO Buffer 5μL、10mM dNTPs 1μL、首尾引物各1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,30循环;最后72℃延伸反应10min。PCR产物进行纯化。将基因合成得到的片段通过平末端连接至EcoRV酶切后的pUC57-BsaI free载体,酶连产物转入Top10感受态细胞,涂布在Amp抗性显色平板上,将白斑活化后测序。
利用BsaI Golden Gate把二级片段拼接成A,B,C,D,E一级片段。
反应体系:含二级片段的载体各100ng、pUC57level1-Kan-BsaI 100ng、T4DNAligase buffer(NEB)2μL、BsaI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应条件:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。将上述反应液中取出10μl转化至Top10感受态细胞,涂布在Kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如BsmBI),正确的质粒命名为pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C,pUC57level1-Kan-D,pUC57level1-Kan-E。
一级组装利用PCR产物进行LCR。具体的,以二级片段中验证正确的质粒为模板,通过以下引物分别扩增得到A,B,C,D,E五个片段;一级载体采用PCR的方式扩增获得。引物序列如下:
Figure BDA0001235627030000101
Figure BDA0001235627030000111
具体操作步骤为,以扩增A片段为例,PCR反应体系:10XPBO Buffer 5μL,10mMdNTPs0.8μL、A-F 1μL、A-R 1μL、模板(pUC57level1-Kan-A)50ng、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸90s,30个循环;最后72℃延伸反应10min。B,C,D,E片段获取方式与A片段一致。一级载体骨架的获取以pUC57level2-Amp-BsmBI为模板,以Vector-F和Vector-R为引物进行扩增,体系与获取A片段的体系一致。
之后,片段和载体进行磷酸化处理,具体的,将需要进行组装的片段和载体骨架混合起来进行磷酸化。反应体系为:10XT4PNK Buffer:5μL;片段ABCDE和一级载体骨架每个片段各3nM;10mM ATP:5μL;T4Polynucleotide Kinase:1μL;Total:50μL。
片段的加入量需要根据片段的大小和浓度,及其磷酸化产物回收效率进行计算后添加,保证各个片段的量符合后续LCR反应要求(每个片段需要3nM)。37℃反应30min后,按照纯化PCR产物的方式进行过柱回收或者乙醇沉淀法进行回收。LCR反应中DNA parts在片段和载体骨架磷酸化处理时已经混合在一起,因此在此步骤时只需要加入磷酸化后的回收产物。LCR体系为:DNA parts(A,B,C,D,E,一级载体骨架),3nM each;10xAmpligaseBuffer,2.5μL;ssDNA bridging oligo,30nM each;DMSO,8%(v/v);Betaine,0.45M;Ampligase,2μL;H2O至25μL。反应条件为:Step 1:94℃2min;Step 2:94℃10sec;Step 3:55℃30sec;Step 4:66℃60sec;Repeat 2-4 50cycles;Step 5:4℃Hold。
其中ssDNA bridging oligo序列如下:
bridging oligo1:
gcaacgatctgcatcagccatCGTTcccttttcgctattgcctgggattacg
bridging oligo2:
cacgtacgtttcatcggtttacccatcatctgttcgttatcaaacagttcaccgtgccagg
bridging oligo3:
gctgactttcagattgctacgaccgcctgagacggtacacagataaacgtcacgattgtt
bridging oligo4:
cgcgacggggtgcctgagaccatgtcgatgcgttgacctgaaatcagg
bridging oligo5:
ttcgttgatcggcgaaaattcgacgcgagacgtacgcatttcgtgcgg
bridging oligo6:
agggttcccgatagttctgcgtatcggttacaggttacaatcagcacgacaaatggaatacac
反应产物取2.5μL转化至Top10感受态细胞,涂布于Amp抗性显色平板。对白斑进行PCR验证,正确的克隆送测序。测序结果显示合成的基因序列正确。
实施例3:序列二的合成示例
对序列二(SEQ ID NO.21)的分析显示序列共含有1个BsaI位点、3个BbsI位点、1个BsmBI位点,在进行长基因合成的过程中,二级组装采用BsaI Golden Gate或者BsmBIGolden Gate,一级组装采用BspQI酶切产物进行LCR反应。利用碱基TCT将全长分成A,B,C共3个片段,如图10所示。将A,B,C三个一级片段的两端均加上BspQI的酶切识别位点,之后再次继续的分成二级片段,便于进行基因合成。二级片段分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共12个,序列见(SEQ ID NO.22-SEQ ID NO.33)。一级和二级片段大小如图11所示。
该序列二级片段的合成过程与序列一相同。
序列二的的二级组装过程使用Golden Gate进行。其中A和B片段使用BsaI GoldenGate连接。C片段使用BsmBI Golden Gate连接。反应体系:二级片段各100ng、pUC57level1-Kan-BsaI 100ng、T4DNA ligase buffer(NEB)2μL、BsaI(NEB)或者BsmBI(NEB)1μL、T4DNAligase(NEB)1μL、无菌水至20μL。BsaI Golden Gate反应条件:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。BsmBI Golden Gate反应条件:step 1:42℃2min;step 2:16℃5min;Step1-step2共20个循环。Step 4:55℃10min;Step 5 80℃10min;完成GoldenGate组装。将上述反应液中取出10μl转化至Top10感受态细胞,涂布在Kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如BspQI),正确的质粒命名为pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C。
一级组装通过BspQI酶切LCR完成。具体的将pUC57level2-Amp-BspQI用BspQI进行酶切,酶切产物进行胶回收。pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C可以分别用BspQI进行酶切,酶切产物分别进行胶回收。在此步骤中,可以将pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C混合在一起酶切;进行混合酶切时需要保证每个质粒加入的摩尔数一致。
LCR体系为:DNA parts(A,B,C,D,E,一级载体骨架),3nM each;10xAmpligaseBuffer,2.5μL;ssDNA bridging oligo,30nM each;DMSO,8%(v/v);Betaine,0.45M;Ampligase,2μL;H2O至25μL。反应条件为:Step 1:94℃2min;Step 2:94℃10sec;Step 3:55℃30sec;Step 4:66℃60sec;Repeat 2-4 50cycles;Step 5:4℃Hold。
其中ssDNA bridging oligo序列如下:
bridging oligo1:
aaagatccgcttgacgagcctatatggaagacccttttcgctattgcctgggattacg
bridging oligo2:
gacttgtatctagctatacgtgggcggcaagaagctgacctacagctgttgcgaactgttg
bridging oligo3:
ggtgaccattgtgaaggcttaggtgttttagaagataattgtggcaatgctgatccacataagggt
bridging oligo4:
tgtaaaagggttcccgatagttctgcgtaagactcttgtctactcaattcaactaaacgaaattttgtccttc
反应产物取2.5μL转化至Top10感受态细胞,涂布于Amp抗性显色平板。对白斑进行PCR验证,正确的克隆送测序。测序结果显示合成的基因序列正确。
SEQUENCE LISTING
<110> 南京金斯瑞生物科技有限公司
<120> 一种长基因合成方法
<130> 1
<160> 33
<210> 1
<211> 2453
<212> DNA
<213> 人工序列
<223> 载体pUC57level1-Kan-BsaI
<400> 1
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctgcca acgcgagacc 60
cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag 120
ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga 180
attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt 240
gcatgcaggc ctctgcagtc gacgggcccg ggatccgata tctagatgca ttcgcgaggt 300
accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 360
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 420
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 480
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 540
tacaatctgc tctgatgccg catagttaag ccagccccga caggtctcgc cgatgagctc 600
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 660
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 720
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 780
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 840
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 900
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 960
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 1020
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 1080
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 1140
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 1200
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 1260
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 1320
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 1380
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 1440
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caagcccaat 1500
ctgaataatg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg agcatcaaat 1560
gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 1620
gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 1680
ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 1740
ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 1800
tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 1860
tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 1920
cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca 1980
gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aatgctgttt 2040
ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 2100
tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 2160
cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 2220
acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 2280
ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 2340
tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgatgata 2400
tatttttatc ttgtgcaatg taacatcaga gattttgaga cacgggccag agc 2453
<210> 2
<211> 2453
<212> DNA
<213> 人工序列
<223> 载体pUC57-Kan-BsmBI-free1
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctgcca acgcgagacg 60
cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag 120
ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga 180
attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt 240
gcatgcaggc ctctgcagtc gacgggcccg ggatccgata tctagatgca ttcgcgaggt 300
accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 360
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 420
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 480
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 540
tacaatctgc tctgatgccg catagttaag ccagccccga cacgtctcgc cgatgagctc 600
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 660
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 720
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 780
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 840
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 900
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 960
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 1020
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 1080
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 1140
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 1200
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 1260
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 1320
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 1380
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 1440
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caagcccaat 1500
ctgaataatg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg agcatcaaat 1560
gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 1620
gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 1680
ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 1740
ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 1800
tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 1860
tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 1920
cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca 1980
gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aatgctgttt 2040
ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 2100
tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 2160
cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 2220
acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 2280
ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 2340
tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgatgata 2400
tatttttatc ttgtgcaatg taacatcaga gattttgaga cacgggccag agc 2453
<210> 3
<211> 2710
<212> DNA
<213> 人工序列
<223> 载体pUC57-BsaI free
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420
tgcatctaga tatcggatcc cgggcccgtc gactgcagag gcctgcatgc aagcttggcg 480
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 540
atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 600
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 660
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 720
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 780
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 840
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 900
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 960
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 1020
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 1080
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 1140
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 1200
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 1260
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 1320
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1380
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1440
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1500
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1560
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1620
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1680
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1740
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agatccacgc 1800
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1860
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1920
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1980
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 2040
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 2100
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 2160
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 2220
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 2280
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 2340
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 2400
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 2460
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 2520
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2580
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2640
gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 2700
ccctttcgtc 2710
<210> 4
<211> 10654
<212> DNA
<213> 人工序列
<223> 序列一
<400> 4
atggctgatg cagatcgttg cctgatgtgt ttccgtccgg tgtgtgacct ggtttgtccg 60
gctgatgttc gtccggcggc tgttatccag gctctgcatc tggataacga atcaggcgcg 120
ggtctgcgtc tgggcgacgg tacggcatgc ctgaattgca atgatccgaa atgcgaaaaa 180
gcgtgtgcac gcggccgtat tgatcatgca attcagattc gtgacatctg ccgtgccctg 240
agcggtcaag aaaagaaaca agttaacggt aaagcggatc tgagcgtgga cttctgtggt 300
gtgcgttgcg aaaacccgtt tctgctggct tccagcccgg tcgccagcag ttacgaaatg 360
tgctgtcgcg cgtttgacca gggttgggca ggtgttgcgt acaaaaccat tagcttttat 420
caaacgcgcg aagtgagccc gcgtttcgac tgcctgccgc cgcgttcatc gtcgagcttt 480
cagggtttta aaaacctgga acagctgagc ccgtataccg ccgaagaaaa cttcgatatt 540
ctgtgtcgcc tgaaagaaaa atatccggaa aaagtgatca ttgcgtctat catgggtcag 600
acgaccgaag aatggaccac gctggcgcgt atggcagaag aagcgggcgc agacatggtg 660
gaatgcaact tcagctgtcc gcagatggcg aaacagggcc tgggtagcga cattggccag 720
tccccggaac tgatcagcct gtatacccag acgacccgta aaggttgtgg tctgccgatt 780
atcgcgaaaa tgaccccgaa cgcaggtaat atggaaccgc tggcagtcgc ggcagtgacg 840
tcaggcgcag atagcgtggc agcgatcaac acgattaaat ccatcacccg tatccatccg 900
gaaaactaca gctcgtttcc ggatattgaa ggtaaaagcg ctgtcggtgg ctacagcggt 960
cgtgcggtga aaccgattgc gctgcgtttc attcgcgatc tggcggtgta tccgccgctg 1020
gcaggtgtta gcctgtgcgg tattggcggt attacgacct ggcgtgatgc gatggatttt 1080
ctgctgctgg gttgtgatac cgtgcaagtt tgtaccagcg tgatggaata cggttatcgc 1140
atcatcgacc acctgaaaga aggtctgtcg atctatatgc aagaaaaagg ctacaatcgc 1200
gtcgaagaat ttcgtggcaa agcgctgccg catatcgtcc tgccggaaca gctgaaccgt 1260
aaccgccgtc tggtttgcga aatcgatcgt caatcgtgta tcggttgtgg ccgttgctat 1320
ctgtcgtgtc aagatggcgg tcatcaggca atccgttggg acggtcatcg tccgcaggtg 1380
gaagaaacca aatgcgtggg ctgtggtctg tgcaccctgg tctgcccgac ggaagcgatt 1440
ggtctgaaag aagtccacga cattggctaa tatgaatcct atctaataat cttgtattat 1500
gaaacaaacc gcaccgctga gcaaatcaca gtatggcatc tatgtcgaat gtatgaacca 1560
cgttggcgaa atctattata acaccgcatt cgtcttccgc ctggacggct cgctggatgg 1620
tcaaaaactg tgcaaagccg tggaagctac ggtgatggcc cacccggccc tgtttacccg 1680
cattgctctg aacgatgata atgaaccggt gcagagcgtt ggtctgtccg aagaaacctg 1740
gagcctggac gtggaaccgg tcgaagacat tgatcaagca ctgtcaggcc tgattcaacc 1800
gttcgatctg cataaagatc gcctgtttcg catccgtctg ttcaaagatg cagaatattt 1860
tcacctgttt gttgacattc atcacatcgt gaacgatggc acgtcacagg cgatctttct 1920
gcaagacatt gaaacggcat ataacggcga accgattgct ccggaatgca tcacgctgtg 1980
tgaacaggcg accgaagaag ttggcctgcg tgcaaccgct gaatttgaag aaggcaaaca 2040
atggtacgca cgcaattttg attgtgcgga tacgtttacg ggcctgaccc cggatctgga 2100
agaagaaggc cgtgaagaag gcacgctgcg ccgcacgctg gccgttaacc tggaagcagt 2160
ggatgcgttt tgtaaagaac acggcatctt taaatcgaac tttttcacga tggcgtatgc 2220
atttctgctg gcaaaataca acaacgaaca ggaatctttc ttcacgatgg tgtataacgg 2280
ccgctcagac aaacgtctgg ctcgtacgat cggcatgttc gtgaaaagcg tcccggtttt 2340
cacgaaattc acgagcgata cgtcagtgat ggaactgctg cgtaatggcc aagaacaaat 2400
gggtggctgt cgcaaacatg aagcatacag cttcgtggat tttatgcagg atattgcacc 2460
gcagtacgac aatatgtttg cctggcacgg tgaactgttt gataacgaac agatgatggg 2520
taaaccgatg aaacgtacgt ggctgatgga ttctccgctg gacatccaac tgtacctgaa 2580
agcgtttatt gaaaatggta aatgtcagat tgtggcagaa tacaatgcaa aagcgtactc 2640
acaagaactg gtctgccaat tcatggaatc ctatgaagcg gtcgtcaatg gctttctgag 2700
ccaagaattt ctgcgtgata ttagcatcgt gaccgaatcg cagaccacgg tcctggactc 2760
ctttaatcgc accgactgcg aatatgatga cacccagacg atcgtgagtc tgttccgtcg 2820
ccaggctgaa gccaccccgg ataatgtggc actgatctat aaagataaac gttttaccta 2880
tagccagatc gacgaaatta gcgaccgcat cgcggcacgc atcgcttcga tgggcctggg 2940
cgccgaagac gtggtttcaa ttctgatttc acgttgcgaa tggatgggca tcattccgat 3000
gggtgtgctg aaagcaggct gcgcgtacca gccgctggac ccgacgtacc cgaaagaacg 3060
cctgaacttc atgatgaaag atgcgggtgt gtcactgctg atcgcggatg aaggcctgcg 3120
tccgctggca gatgaatttc aaggtgaaac gctgtttacc ggtgaactga tggatctgcc 3180
gcgtgcggaa gtgcaaccgg ttgcaccgag tccgtctagc ctgtttatcc tgctgtatac 3240
gagcggctcg accggtattc cgaaaggttg tcagctggaa catggcaatc tggttgcttt 3300
ctgtcactgg tatcagtcgt actacggtct gcatgcgggt gataaagtgg cagcatacgc 3360
atctttcggt ttcgatgctt ccatgatgga tatgtatccg gcactgacct gcggcgcaac 3420
ggtgtgcatc attccggaag aaatccgtct ggacctgatg gcgctgaatg aatatctgga 3480
acaaaatggt gtcacgcact cgtttatgac cacgcaggtc ggctatcagt ttgcaaccag 3540
cattgaaaat cgctcgctgc gtcatctgtc caccggcggc gaaaaactgg tttcgctggc 3600
accgccgcaa gaatataatt tttataatgt gtatggtccg accgaaacca cgattctggt 3660
tacggcatac cgtatcacgc aaaaactgaa agaaatcccg attggtaaac cgctggataa 3720
tatgaaactg tacattgtgg ataatcatgg ccaccgcctg ccggtgggtg cggctggtga 3780
actgtggatt tccggcccgc aggtgtcacg cggttacctg aaccgtccgg aaaaaaccca 3840
ggaagtgtat atcgcgaacc cgttcaccga caatgaaaaa tatgcgcgta tctaccgctc 3900
aggcgatgtg gtccgctatc tgccgtcagg cgacatccaa tttgtgggcc gtcgtgatgg 3960
tcaagtgaaa attcgtggct ttcgcatcga actgaaagaa gtcgaaggta tcatccgcga 4020
atttccgggt attaaagacg ccacggttca ggcattcgat gaagaaggtg gtggcaaatt 4080
catcgcagcg tatatcgttt cggatgaaca aatcgacatt gaagcgctga accgctttat 4140
cctggaagaa aaaccgccgt atatggtgcc ggcagttacc atgcagattg atagcattcc 4200
gctgaaccaa aaccaaaaag ttaacaaacg tgtcctgccg aaaccggaaa agaaaccggt 4260
gtccgttgcc gaaggtaatg tgccgatgaa tgtgctggaa acggaactgc atcaactgat 4320
cgcggccatc gtcaatcatg aaaactttgg cgtcaccacg gtgctgggct atgcaggcct 4380
gaccagcatc acggcaatta aactggcagt gcaaatcaac aaacgctatg gcgttgtggt 4440
ggacgcgaaa tcgctggtta aaaatggtac gctgcaaagc atcgaaaacg aaatcctgcg 4500
taaaatgctg cacgatgcgt cggcggacgg tcgtcaggaa gaagcggtga aaaaggaaat 4560
tgttacgtcg gcgccgctgt cgtacgcgca aaccggtgtc tatttcgaat gcatgaaaaa 4620
cccgtttagc accgtttata acatcccgtg cctgctgacc tatccgagcg gtacggacgc 4680
atgccaactg gcagatgcag tgaaaaccgt tatccatgca catacggcga tgaacattcg 4740
ttttgaaacc cagggcgaag gtgttcgtca gtatctggat gccgacctgg cgattcaagt 4800
tccggtcaaa gcgatgacgg aagaagaact gaccctgtac aaagaagaat ttgtgcgtcc 4860
gtttaacctg caaaaagccc cgctgtggcg ttttgaagtc atcgaaaccc cgtcggccgt 4920
gcacctgctg atggatgtgc atcacctgat ctttgacggc ggttcggttg acctgtttat 4980
tcgtcaggtt agcgaagcac tggaaggcca aaccgtttcg aaagaaacgt ataccttcct 5040
ggatttcgtg cacgaccaaa tgcaggccga acagaccgaa tccttccgta aagcggaaaa 5100
attcttcgca gaaaaactgc aagcatgcga aggtgcgtcg gaagttccgg ccgatctgca 5160
aaaaaccgat aaagaatcac gtatcggtga agcatgctgt ccggtgaatc atgaagaagt 5220
ggcacgcttc tgtcgtagcc acgacattac cccggcacac ctgttctacg cagcagttac 5280
gtatgttgtg tcccgttaca cgaacaatcg tgacgtttat ctgtgtaccg tctcaggcgg 5340
tcgtagcaat ctgaaagtca gcgaaaccgt gggcatgttt gtgaataccc tggccctggg 5400
tctgtccgtt gacgatgtca cggttgaaga cttcctgcaa acggcgagcc gtacctttac 5460
cgaaaccctg gaaaacgaaa actatccgtt cgcgcgcatc gcatcagatt atggcttcca 5520
gccggccatt gcttacgctt atcaagtcgg tgtgctgtcc gcttattcgc tgaaaggtca 5580
atcaattggt caggaagtcc tggaactgga cgtcccgaaa tttaaaatta acatccagat 5640
ccagtcacaa ggtgtggtgg tggaatacga cgatgccctg tattcccgtt cggtcggcga 5700
agcactggca gaaagcattg tcgccgtggt tgaacgcatg atgcaaatgc cgtccgaacg 5760
tattcgttca ctgagcatcg tgagccgtaa acaggctacg gcactggaca aagttcgcac 5820
gacgggcagc ggtgaatctc cgtttcgcct gttccacgaa tgcattcacc attatgcggt 5880
ggtggcgccg gatcgcgaag ccctggttgc gtgcgatgca acgttcacct atgctgaaat 5940
ggatgaactg accgatcgca tcgcaagtgg tctgcgcgct cgcggtgtgc tgccgcgcga 6000
ccgtgtggcg ctgctgctgc cgcgtagctc gcgcctgatt ctgtcgctgt ttggcgtgct 6060
gaaagccgaa gcatcttaca ttccgtgtga tccggaatat ccggctgatc gcgtcaaata 6120
tatcctggaa gattcgggct cagcatacat catcacggat ggcaatcatg ctaaaggcct 6180
gccgaaagac aaagtgatcg atgtggaagg cctggtcaaa catccgattg aacgctgggc 6240
accgtcgatt acgagtgacg atctggccta tattatttat acgtctggct cgaccggtaa 6300
accgaaaggt gtgatgctgc gtcatgaagg tatttgtaac tatctgaccg cgcacccggc 6360
aaatgtgctg gcacatgcag tgcaggccga tacggaacgt atcctgagtg tgacgacgat 6420
tagctttgac gcggcgctgc aagacattgg cacggcattc tttaatggca aaaccctggt 6480
cctggctacg gaagaacagg caaataaccc gattgaactg gcacgcctga tttcaggtca 6540
acgcatcgac atggtctcag gcaccccgtc gcgctggctg acgtggctga ccagcggcga 6600
ctttgctgaa gcaatccgtt acattcgcat cgctcgtgcg ggcggtgaaa aattctccgg 6660
tcagctgctg gaactgctga aagcgaaaac gtcggcgcgc atttttaact gctatggccc 6720
gacggaaacc accgtcgcct caaataataa agaactgacg cacgcggttt cggtgaccgt 6780
tggtaaaccg cagctgaacg ttaaagaatt tgtggttgat caggacggca atgaactgcc 6840
ggtcggtgtt gtcggcgaac tgtatattgg cggtcgtggc gtggcgcgcg gttacaataa 6900
tctggatgac atgacccgcg aacgcttcat cgcctaccag ggcgaacgtg tttataaatc 6960
cggcgactac gcgaaatgga acgcggatgg cgacatcgtt atcctgggcc gcaccgacaa 7020
tcaaatcaaa ctgcgtggtc tgcgcattga actgggtgaa attgaaaacg tgatgctgaa 7080
agtcgaaggc ctggaaaaag tcgtgatcct gattcgtaaa ctgaacgaca aagaacatct 7140
gtgtgcgtac tacacggccg atcgcccgat cgcgccggat gctctgaaag cagaaatctc 7200
aaaatcgctg acccaatata tggttccgac cgcatatctg caagtcgata aaatgccgat 7260
gaccccgtcg ggcaaaaccg acgtgaaagc gctgccggaa ccggtgctgg ccgtgtctag 7320
tgcgtatgaa gccccggcca atccgacgga acatattttc tgcgatattt ttgcaagcgt 7380
gctgcaaatc gacaaagtcg gcgcaaccga taacttcttc gaaagcggtg gcaccagcct 7440
ggtggtcacg cgcgttatta ttgaagcgga caaagcaggt ctgcgcatca cgtacggtga 7500
cgtgttcgcg catccgaccc cgcgtcaact ggcacgtctg gtcaacggtg ataaagaaac 7560
cgacggtcag gatgaagttg cagactatga ctatggtatc attaactcgc tgctgaaaag 7620
caatacgctg gaagcattta aaaagggcga acgtctgtcg ctgggcaatg tgctgctgac 7680
cggcgctacc ggctatctgg gtattcacat cctgaaagaa ctgatcggtt cggacattgc 7740
acacatctat tgcctggtgc gtgacaaaaa cctggaagcg gcagaacgcc gtctgaaaac 7800
cctgctgttt tattaccatg atgacgaatt ttcttcactg ttcggtaacc gtattcatct 7860
ggtcctgggt gatgtgaccc aaaccatcga cgaaacgctg ccggttgaca ccgtgttcaa 7920
ttgcgcagcc gttgtcaaac atttcagcga aggcacgttc atcgaagacg ttaatatcgg 7980
tggcgcccag cattgtgtgg atttctgcct gaaaaagaat gcacgtctgg tgcatatctc 8040
taccgcctcc acccgtggtc tgtcggttaa tggtattccg gactcccagg aagtgtttac 8100
cgaacaaaaa ctgtatatgg gtcagtatct gggtaacaaa tatatctaca gcaaattcat 8160
ggcggaacgt ctgatcctgg aagctattgc cacgcagggc ctgagtgcaa aaattatgcg 8220
cgtgggtaac ctggccgcgc gcagcaccga tggcgaattt caaatcaact ttctgacgaa 8280
tagctttatg ggccgcatta aagtgtacaa tatgctgggt tgctgcccgc acgaaatgcg 8340
tacgtctcgc gtcgaatttt cgccgatcaa cgaagtgagc aaagcgattc tgctgctggc 8400
gagcaccccg aaagaatgct gcgtctttca tccgtttaac attcacacgc agttcctggg 8460
cgacgtcctg gaagtgctga aatcggtcac gggcggtatt gactttgttg aaatggaaca 8520
atttgaagaa gtgatggaaa aagcaaaatc agacccgacc aaagcaaaaa tcctgtcctc 8580
gctgctggca tatcaggaca tggcgcacgg ccaaaaaacg tctgacgtca atcgcgataa 8640
ttcgtacacc acccaggttc tgtttcgtct gggctttaat tggagcgcca cgtcttggga 8700
ttacattgaa cgtatgctgc acgctatctg cggtctgggt ttctttgaca tctaaatgaa 8760
agaaaccaat gaaaaagacc gtgaactgag cgttgtgttc tggcgttacc tgtggagcag 8820
catcctgatt agcctgtcgg cgtcggtggg caccgttgtc gatggtatca ttgtgggcaa 8880
tctgattggt gaagatggtg tctcggcagt gaacctgagc agtccgatga ttcagctgct 8940
gttcaccatc agcctggtcg ttgcatcagg cgcgggcatg ctgatcggtt ttgcactggg 9000
ccaaaaagac ggtcgtcgtg tccgctacat ttttaccctg agcatggtgg cgtcgctgct 9060
ggttggtgtg ctgtttacgg gtgcgggttt ttacttctcg gattctatta cccgcgcatt 9120
ttgccacgat gattacctgt tcacgtacac ccatgattat ctgaaagtga tcctgattgg 9180
cgcgccgagc ttcatgatgc tgtgggaaat cagcgcagtg attggtgtgg acggctcgcc 9240
gcgtctggca tcgctggcga ttatcgtgga taatctggtc aacctgtgtc tggacattgt 9300
gtttatcgaa tatgtgggct ggggcattgc gggctcggca gcagcgaccg ttgtgggtca 9360
cctggtgggc attctgatca tgctgcgtca ttttaaaggt aaaggcaatt cgctgacgtt 9420
ttcgctgacg cacgataaac cggaatttct gaacatcgtg ctgcaaggcg cgccgctggc 9480
gatcgcatcc gtgtgcctga ccctgctgct ggtgtcagca aatcacgtgt ttctgagtgc 9540
gaaaggccaa aatggtatct tcgtgtttgc tgtgtgcatg aacctgctgc aaatttacaa 9600
tatgtatatc agcggcacct gtcgtaccct gcaatcactg ggtgcggtgc agattggcaa 9660
aaatgatgac catgcgttca gtctgatcct gcgcaaatca tttctgttca ttaccgtgag 9720
catggctgtg acctgcctgc tgatttgcct gtttccgggt gtgatttcgc gtgcctttgg 9780
tgcagatagc ccggaagtga ttgcggaatg caatcatgtc ttccgcattt ttgcggtgtc 9840
cttcattccg ttttgttaca tctacctgat tatgatcgtt tataaactgt acaaacagga 9900
ttgcatggcc ctgttcatta gctttgcact gtcgctgacc gtgatcccgg tgctgctgct 9960
gtttttccac tatgcgccgc agtatctgtg gtacagctat ctggtggcgt acctgctgga 10020
aatcgtcgca atctttgtgc tgcataaact gacccacgct cgtctgtccc tgtgaaatga 10080
tatggtgctg ctgacggaag acatctggag ttttaacctg gacgctgcct ggcaagaaat 10140
ctcgggtcaa cgccgcgaat acgccctgaa atatcgtacc gaactggatc gtcgcctgtg 10200
tgtgcgtgca tatctgctgc tgtgtgaagg tctgcgtaaa ggctatggta ttaccagcgt 10260
gccgctgttt gaatttggca aatacggtaa accgatgctg gtcggttatc cggatattca 10320
tttcagcatt tcgcattgcc cggaagcagt gatctgtgtg ctggatgaca atccggtggg 10380
cgtcgatatt gaactggtgt cgagctttga cgaacaggtt gcgcgttatg cgatgaacca 10440
ggaagaactg cgccagatca aaagctcttc acgcccggat gtggaatttg cgtgtctgtg 10500
gacccgtaaa gaagccgtgc tgaaacagtc cggttttggc ctgagcgata acgtgaaaga 10560
agttctgacc gcacatccgc tgccggtgga aacgtttatt tcccgcaacc tgcattatgt 10620
gtattccatt tgtcgtgctg attgtaacct gtaa 10654
<210> 5
<211> 668
<212> DNA
<213> 人工序列
<223> 序列一二级片段A1
<400> 5
agtcggtctc gaacgtctcg aacgatggct gatgcagatc gttgcctgat gtgtttccgt 60
ccggtgtgtg acctggtttg tccggctgat gttcgtccgg cggctgttat ccaggctctg 120
catctggata acgaatcagg cgcgggtctg cgtctgggcg acggtacggc atgcctgaat 180
tgcaatgatc cgaaatgcga aaaagcgtgt gcacgcggcc gtattgatca tgcaattcag 240
attcgtgaca tctgccgtgc cctgagcggt caagaaaaga aacaagttaa cggtaaagcg 300
gatctgagcg tggacttctg tggtgtgcgt tgcgaaaacc cgtttctgct ggcttccagc 360
ccggtcgcca gcagttacga aatgtgctgt cgcgcgtttg accagggttg ggcaggtgtt 420
gcgtacaaaa ccattagctt ttatcaaacg cgcgaagtga gcccgcgttt cgactgcctg 480
ccgccgcgtt catcgtcgag ctttcagggt tttaaaaacc tggaacagct gagcccgtat 540
accgccgaag aaaacttcga tattctgtgt cgcctgaaag aaaaatatcc ggaaaaagtg 600
atcattgcgt ctatcatggg tcagacgacc gaagaatgga ccacgctggc gcgtatgcga 660
gaccgact 668
<210> 6
<211> 588
<212> DNA
<213> 人工序列
<223> 序列一二级片段A2
<400> 6
agtcggtctc gtatggcaga agaagcgggc gcagacatgg tggaatgcaa cttcagctgt 60
ccgcagatgg cgaaacaggg cctgggtagc gacattggcc agtccccgga actgatcagc 120
ctgtataccc agacgacccg taaaggttgt ggtctgccga ttatcgcgaa aatgaccccg 180
aacgcaggta atatggaacc gctggcagtc gcggcagtga cgtcaggcgc agatagcgtg 240
gcagcgatca acacgattaa atccatcacc cgtatccatc cggaaaacta cagctcgttt 300
ccggatattg aaggtaaaag cgctgtcggt ggctacagcg gtcgtgcggt gaaaccgatt 360
gcgctgcgtt tcattcgcga tctggcggtg tatccgccgc tggcaggtgt tagcctgtgc 420
ggtattggcg gtattacgac ctggcgtgat gcgatggatt ttctgctgct gggttgtgat 480
accgtgcaag tttgtaccag cgtgatggaa tacggttatc gcatcatcga ccacctgaaa 540
gaaggtctgt cgatctatat gcaagaaaaa ggctacacga gaccgact 588
<210> 7
<211> 666
<212> DNA
<213> 人工序列
<223> 序列一二级片段A3
<400> 7
agtcggtctc gtacaatcgc gtcgaagaat ttcgtggcaa agcgctgccg catatcgtcc 60
tgccggaaca gctgaaccgt aaccgccgtc tggtttgcga aatcgatcgt caatcgtgta 120
tcggttgtgg ccgttgctat ctgtcgtgtc aagatggcgg tcatcaggca atccgttggg 180
acggtcatcg tccgcaggtg gaagaaacca aatgcgtggg ctgtggtctg tgcaccctgg 240
tctgcccgac ggaagcgatt ggtctgaaag aagtccacga cattggctaa tatgaatcct 300
atctaataat cttgtattat gaaacaaacc gcaccgctga gcaaatcaca gtatggcatc 360
tatgtcgaat gtatgaacca cgttggcgaa atctattata acaccgcatt cgtcttccgc 420
ctggacggct cgctggatgg tcaaaaactg tgcaaagccg tggaagctac ggtgatggcc 480
cacccggccc tgtttacccg cattgctctg aacgatgata atgaaccggt gcagagcgtt 540
ggtctgtccg aagaaacctg gagcctggac gtggaaccgg tcgaagacat tgatcaagca 600
ctgtcaggcc tgattcaacc gttcgatctg cataaagatc gcctgtttcg catcccgaga 660
ccgact 666
<210> 8
<211> 715
<212> DNA
<213> 人工序列
<223> 序列一二级片段A4
<400> 8
agtcggtctc gatccgtctg ttcaaagatg cagaatattt tcacctgttt gttgacattc 60
atcacatcgt gaacgatggc acgtcacagg cgatctttct gcaagacatt gaaacggcat 120
ataacggcga accgattgct ccggaatgca tcacgctgtg tgaacaggcg accgaagaag 180
ttggcctgcg tgcaaccgct gaatttgaag aaggcaaaca atggtacgca cgcaattttg 240
attgtgcgga tacgtttacg ggcctgaccc cggatctgga agaagaaggc cgtgaagaag 300
gcacgctgcg ccgcacgctg gccgttaacc tggaagcagt ggatgcgttt tgtaaagaac 360
acggcatctt taaatcgaac tttttcacga tggcgtatgc atttctgctg gcaaaataca 420
acaacgaaca ggaatctttc ttcacgatgg tgtataacgg ccgctcagac aaacgtctgg 480
ctcgtacgat cggcatgttc gtgaaaagcg tcccggtttt cacgaaattc acgagcgata 540
cgtcagtgat ggaactgctg cgtaatggcc aagaacaaat gggtggctgt cgcaaacatg 600
aagcatacag cttcgtggat tttatgcagg atattgcacc gcagtacgac aatatgtttg 660
cctggcacgg tgaactgttt gataacgaac agacgagacg ccgacgagac cgact 715
<210> 9
<211> 752
<212> DNA
<213> 人工序列
<223> 序列一二级片段B1
<400> 9
agtcggtctc gaacgtctcg cagatgatgg gtaaaccgat gaaacgtacg tggctgatgg 60
attctccgct ggacatccaa ctgtacctga aagcgtttat tgaaaatggt aaatgtcaga 120
ttgtggcaga atacaatgca aaagcgtact cacaagaact ggtctgccaa ttcatggaat 180
cctatgaagc ggtcgtcaat ggctttctga gccaagaatt tctgcgtgat attagcatcg 240
tgaccgaatc gcagaccacg gtcctggact cctttaatcg caccgactgc gaatatgatg 300
acacccagac gatcgtgagt ctgttccgtc gccaggctga agccaccccg gataatgtgg 360
cactgatcta taaagataaa cgttttacct atagccagat cgacgaaatt agcgaccgca 420
tcgcggcacg catcgcttcg atgggcctgg gcgccgaaga cgtggtttca attctgattt 480
cacgttgcga atggatgggc atcattccga tgggtgtgct gaaagcaggc tgcgcgtacc 540
agccgctgga cccgacgtac ccgaaagaac gcctgaactt catgatgaaa gatgcgggtg 600
tgtcactgct gatcgcggat gaaggcctgc gtccgctggc agatgaattt caaggtgaaa 660
cgctgtttac cggtgaactg atggatctgc cgcgtgcgga agtgcaaccg gttgcaccga 720
gtccgtctag cctgtttatc ccgagaccga ct 752
<210> 10
<211> 680
<212> DNA
<213> 人工序列
<223> 序列一二级片段B2
<400> 10
agtcggtctc gatcctgctg tatacgagcg gctcgaccgg tattccgaaa ggttgtcagc 60
tggaacatgg caatctggtt gctttctgtc actggtatca gtcgtactac ggtctgcatg 120
cgggtgataa agtggcagca tacgcatctt tcggtttcga tgcttccatg atggatatgt 180
atccggcact gacctgcggc gcaacggtgt gcatcattcc ggaagaaatc cgtctggacc 240
tgatggcgct gaatgaatat ctggaacaaa atggtgtcac gcactcgttt atgaccacgc 300
aggtcggcta tcagtttgca accagcattg aaaatcgctc gctgcgtcat ctgtccaccg 360
gcggcgaaaa actggtttcg ctggcaccgc cgcaagaata taatttttat aatgtgtatg 420
gtccgaccga aaccacgatt ctggttacgg cataccgtat cacgcaaaaa ctgaaagaaa 480
tcccgattgg taaaccgctg gataatatga aactgtacat tgtggataat catggccacc 540
gcctgccggt gggtgcggct ggtgaactgt ggatttccgg cccgcaggtg tcacgcggtt 600
acctgaaccg tccggaaaaa acccaggaag tgtatatcgc gaacccgttc accgacaatg 660
aaaaatatgc gagaccgact 680
<210> 11
<211> 721
<212> DNA
<213> 人工序列
<223> 序列一二级片段B3
<400> 11
agtcggtctc gtatgcgcgt atctaccgct caggcgatgt ggtccgctat ctgccgtcag 60
gcgacatcca atttgtgggc cgtcgtgatg gtcaagtgaa aattcgtggc tttcgcatcg 120
aactgaaaga agtcgaaggt atcatccgcg aatttccggg tattaaagac gccacggttc 180
aggcattcga tgaagaaggt ggtggcaaat tcatcgcagc gtatatcgtt tcggatgaac 240
aaatcgacat tgaagcgctg aaccgcttta tcctggaaga aaaaccgccg tatatggtgc 300
cggcagttac catgcagatt gatagcattc cgctgaacca aaaccaaaaa gttaacaaac 360
gtgtcctgcc gaaaccggaa aagaaaccgg tgtccgttgc cgaaggtaat gtgccgatga 420
atgtgctgga aacggaactg catcaactga tcgcggccat cgtcaatcat gaaaactttg 480
gcgtcaccac ggtgctgggc tatgcaggcc tgaccagcat cacggcaatt aaactggcag 540
tgcaaatcaa caaacgctat ggcgttgtgg tggacgcgaa atcgctggtt aaaaatggta 600
cgctgcaaag catcgaaaac gaaatcctgc gtaaaatgct gcacgatgcg tcggcggacg 660
gtcgtcagga agaagcggtg aaaaaggaaa ttgttacgtc ggcgccgctg cgagaccgac 720
t 721
<210> 12
<211> 790
<212> DNA
<213> 人工序列
<223> 序列一二级片段B4
<400> 12
agtcggtctc ggctgtcgta cgcgcaaacc ggtgtctatt tcgaatgcat gaaaaacccg 60
tttagcaccg tttataacat cccgtgcctg ctgacctatc cgagcggtac ggacgcatgc 120
caactggcag atgcagtgaa aaccgttatc catgcacata cggcgatgaa cattcgtttt 180
gaaacccagg gcgaaggtgt tcgtcagtat ctggatgccg acctggcgat tcaagttccg 240
gtcaaagcga tgacggaaga agaactgacc ctgtacaaag aagaatttgt gcgtccgttt 300
aacctgcaaa aagccccgct gtggcgtttt gaagtcatcg aaaccccgtc ggccgtgcac 360
ctgctgatgg atgtgcatca cctgatcttt gacggcggtt cggttgacct gtttattcgt 420
caggttagcg aagcactgga aggccaaacc gtttcgaaag aaacgtatac cttcctggat 480
ttcgtgcacg accaaatgca ggccgaacag accgaatcct tccgtaaagc ggaaaaattc 540
ttcgcagaaa aactgcaagc atgcgaaggt gcgtcggaag ttccggccga tctgcaaaaa 600
accgataaag aatcacgtat cggtgaagca tgctgtccgg tgaatcatga agaagtggca 660
cgcttctgtc gtagccacga cattaccccg gcacacctgt tctacgcagc agttacgtat 720
gttgtgtccc gttacacgaa caatcgtgac gtttatctgt gtaccgtctc aggcgccgac 780
gagaccgact 790
<210> 13
<211> 634
<212> DNA
<213> 人工序列
<223> 序列一二级片段C1
<400> 13
agtcggtctc gaacgcgtct caggcggtcg tagcaatctg aaagtcagcg aaaccgtggg 60
catgtttgtg aataccctgg ccctgggtct gtccgttgac gatgtcacgg ttgaagactt 120
cctgcaaacg gcgagccgta cctttaccga aaccctggaa aacgaaaact atccgttcgc 180
gcgcatcgca tcagattatg gcttccagcc ggccattgct tacgcttatc aagtcggtgt 240
gctgtccgct tattcgctga aaggtcaatc aattggtcag gaagtcctgg aactggacgt 300
cccgaaattt aaaattaaca tccagatcca gtcacaaggt gtggtggtgg aatacgacga 360
tgccctgtat tcccgttcgg tcggcgaagc actggcagaa agcattgtcg ccgtggttga 420
acgcatgatg caaatgccgt ccgaacgtat tcgttcactg agcatcgtga gccgtaaaca 480
ggctacggca ctggacaaag ttcgcacgac gggcagcggt gaatctccgt ttcgcctgtt 540
ccacgaatgc attcaccatt atgcggtggt ggcgccggat cgcgaagccc tggttgcgtg 600
cgatgcaacg ttcacctatg ctgcgagacc gact 634
<210> 14
<211> 657
<212> DNA
<213> 人工序列
<223> 序列一二级片段C2
<400> 14
agtcggtctc ggctgaaatg gatgaactga ccgatcgcat cgcaagtggt ctgcgcgctc 60
gcggtgtgct gccgcgcgac cgtgtggcgc tgctgctgcc gcgtagctcg cgcctgattc 120
tgtcgctgtt tggcgtgctg aaagccgaag catcttacat tccgtgtgat ccggaatatc 180
cggctgatcg cgtcaaatat atcctggaag attcgggctc agcatacatc atcacggatg 240
gcaatcatgc taaaggcctg ccgaaagaca aagtgatcga tgtggaaggc ctggtcaaac 300
atccgattga acgctgggca ccgtcgatta cgagtgacga tctggcctat attatttata 360
cgtctggctc gaccggtaaa ccgaaaggtg tgatgctgcg tcatgaaggt atttgtaact 420
atctgaccgc gcacccggca aatgtgctgg cacatgcagt gcaggccgat acggaacgta 480
tcctgagtgt gacgacgatt agctttgacg cggcgctgca agacattggc acggcattct 540
ttaatggcaa aaccctggtc ctggctacgg aagaacaggc aaataacccg attgaactgg 600
cacgcctgat ttcaggtcaa cgcatcgaca tggtcttgag acgccgacga gaccgac 657
<210> 15
<211> 632
<212> DNA
<213> 人工序列
<223> 序列一二级片段D1
<400> 15
agtcggtctc gaacgtctca gtctcaggca ccccgtcgcg ctggctgacg tggctgacca 60
gcggcgactt tgctgaagca atccgttaca ttcgcatcgc tcgtgcgggc ggtgaaaaat 120
tctccggtca gctgctggaa ctgctgaaag cgaaaacgtc ggcgcgcatt tttaactgct 180
atggcccgac ggaaaccacc gtcgcctcaa ataataaaga actgacgcac gcggtttcgg 240
tgaccgttgg taaaccgcag ctgaacgtta aagaatttgt ggttgatcag gacggcaatg 300
aactgccggt cggtgttgtc ggcgaactgt atattggcgg tcgtggcgtg gcgcgcggtt 360
acaataatct ggatgacatg acccgcgaac gcttcatcgc ctaccagggc gaacgtgttt 420
ataaatccgg cgactacgcg aaatggaacg cggatggcga catcgttatc ctgggccgca 480
ccgacaatca aatcaaactg cgtggtctgc gcattgaact gggtgaaatt gaaaacgtga 540
tgctgaaagt cgaaggcctg gaaaaagtcg tgatcctgat tcgtaaactg aacgacaaag 600
aacatctgtg tgcgtactac acgagaccga ct 632
<210> 16
<211> 584
<212> DNA
<213> 人工序列
<223> 序列一二级片段D2
<400> 16
agtcggtctc gtacacggcc gatcgcccga tcgcgccgga tgctctgaaa gcagaaatct 60
caaaatcgct gacccaatat atggttccga ccgcatatct gcaagtcgat aaaatgccga 120
tgaccccgtc gggcaaaacc gacgtgaaag cgctgccgga accggtgctg gccgtgtcta 180
gtgcgtatga agccccggcc aatccgacgg aacatatttt ctgcgatatt tttgcaagcg 240
tgctgcaaat cgacaaagtc ggcgcaaccg ataacttctt cgaaagcggt ggcaccagcc 300
tggtggtcac gcgcgttatt attgaagcgg acaaagcagg tctgcgcatc acgtacggtg 360
acgtgttcgc gcatccgacc ccgcgtcaac tggcacgtct ggtcaacggt gataaagaaa 420
ccgacggtca ggatgaagtt gcagactatg actatggtat cattaactcg ctgctgaaaa 480
gcaatacgct ggaagcattt aaaaagggcg aacgtctgtc gctgggcaat gtgctgctga 540
ccggcgctac cggctatctg ggtattcaca tcccgagacc gact 584
<210> 17
<211> 671
<212> DNA
<213> 人工序列
<223> 序列一二级片段D3
<400> 17
agtcggtctc gatcctgaaa gaactgatcg gttcggacat tgcacacatc tattgcctgg 60
tgcgtgacaa aaacctggaa gcggcagaac gccgtctgaa aaccctgctg ttttattacc 120
atgatgacga attttcttca ctgttcggta accgtattca tctggtcctg ggtgatgtga 180
cccaaaccat cgacgaaacg ctgccggttg acaccgtgtt caattgcgca gccgttgtca 240
aacatttcag cgaaggcacg ttcatcgaag acgttaatat cggtggcgcc cagcattgtg 300
tggatttctg cctgaaaaag aatgcacgtc tggtgcatat ctctaccgcc tccacccgtg 360
gtctgtcggt taatggtatt ccggactccc aggaagtgtt taccgaacaa aaactgtata 420
tgggtcagta tctgggtaac aaatatatct acagcaaatt catggcggaa cgtctgatcc 480
tggaagctat tgccacgcag ggcctgagtg caaaaattat gcgcgtgggt aacctggccg 540
cgcgcagcac cgatggcgaa tttcaaatca actttctgac gaatagcttt atgggccgca 600
ttaaagtgta caatatgctg ggttgctgcc cgcacgaaat gcgtacgtct cgcgtcccga 660
cgagaccgac t 671
<210> 18
<211> 833
<212> DNA
<213> 人工序列
<223> 序列一二级片段E1
<400> 18
agtcggtctc gaacgcgtct cgcgtcgaat tttcgccgat caacgaagtg agcaaagcga 60
ttctgctgct ggcgagcacc ccgaaagaat gctgcgtctt tcatccgttt aacattcaca 120
cgcagttcct gggcgacgtc ctggaagtgc tgaaatcggt cacgggcggt attgactttg 180
ttgaaatgga acaatttgaa gaagtgatgg aaaaagcaaa atcagacccg accaaagcaa 240
aaatcctgtc ctcgctgctg gcatatcagg acatggcgca cggccaaaaa acgtctgacg 300
tcaatcgcga taattcgtac accacccagg ttctgtttcg tctgggcttt aattggagcg 360
ccacgtcttg ggattacatt gaacgtatgc tgcacgctat ctgcggtctg ggtttctttg 420
acatctaaat gaaagaaacc aatgaaaaag accgtgaact gagcgttgtg ttctggcgtt 480
acctgtggag cagcatcctg attagcctgt cggcgtcggt gggcaccgtt gtcgatggta 540
tcattgtggg caatctgatt ggtgaagatg gtgtctcggc agtgaacctg agcagtccga 600
tgattcagct gctgttcacc atcagcctgg tcgttgcatc aggcgcgggc atgctgatcg 660
gttttgcact gggccaaaaa gacggtcgtc gtgtccgcta catttttacc ctgagcatgg 720
tggcgtcgct gctggttggt gtgctgttta cgggtgcggg tttttacttc tcggattcta 780
ttacccgcgc attttgccac gatgattacc tgttcacgta cacgagaccg act 833
<210> 19
<211> 789
<212> DNA
<213> 人工序列
<223> 序列一二级片段E2
<400> 19
agtcggtctc gtacacccat gattatctga aagtgatcct gattggcgcg ccgagcttca 60
tgatgctgtg ggaaatcagc gcagtgattg gtgtggacgg ctcgccgcgt ctggcatcgc 120
tggcgattat cgtggataat ctggtcaacc tgtgtctgga cattgtgttt atcgaatatg 180
tgggctgggg cattgcgggc tcggcagcag cgaccgttgt gggtcacctg gtgggcattc 240
tgatcatgct gcgtcatttt aaaggtaaag gcaattcgct gacgttttcg ctgacgcacg 300
ataaaccgga atttctgaac atcgtgctgc aaggcgcgcc gctggcgatc gcatccgtgt 360
gcctgaccct gctgctggtg tcagcaaatc acgtgtttct gagtgcgaaa ggccaaaatg 420
gtatcttcgt gtttgctgtg tgcatgaacc tgctgcaaat ttacaatatg tatatcagcg 480
gcacctgtcg taccctgcaa tcactgggtg cggtgcagat tggcaaaaat gatgaccatg 540
cgttcagtct gatcctgcgc aaatcatttc tgttcattac cgtgagcatg gctgtgacct 600
gcctgctgat ttgcctgttt ccgggtgtga tttcgcgtgc ctttggtgca gatagcccgg 660
aagtgattgc ggaatgcaat catgtcttcc gcatttttgc ggtgtccttc attccgtttt 720
gttacatcta cctgattatg atcgtttata aactgtacaa acaggattgc atggccctcg 780
agaccgact 789
<210> 20
<211> 783
<212> DNA
<213> 人工序列
<223> 序列一二级片段E3
<400> 20
agtcggtctc gccctgttca ttagctttgc actgtcgctg accgtgatcc cggtgctgct 60
gctgtttttc cactatgcgc cgcagtatct gtggtacagc tatctggtgg cgtacctgct 120
ggaaatcgtc gcaatctttg tgctgcataa actgacccac gctcgtctgt ccctgtgaaa 180
tgatatggtg ctgctgacgg aagacatctg gagttttaac ctggacgctg cctggcaaga 240
aatctcgggt caacgccgcg aatacgccct gaaatatcgt accgaactgg atcgtcgcct 300
gtgtgtgcgt gcatatctgc tgctgtgtga aggtctgcgt aaaggctatg gtattaccag 360
cgtgccgctg tttgaatttg gcaaatacgg taaaccgatg ctggtcggtt atccggatat 420
tcatttcagc atttcgcatt gcccggaagc agtgatctgt gtgctggatg acaatccggt 480
gggcgtcgat attgaactgg tgtcgagctt tgacgaacag gttgcgcgtt atgcgatgaa 540
ccaggaagaa ctgcgccaga tcaaaagctc ttcacgcccg gatgtggaat ttgcgtgtct 600
gtggacccgt aaagaagccg tgctgaaaca gtccggtttt ggcctgagcg ataacgtgaa 660
agaagttctg accgcacatc cgctgccggt ggaaacgttt atttcccgca acctgcatta 720
tgtgtattcc atttgtcgtg ctgattgtaa cctgtaaccg acgagacgcc gacgagaccg 780
act 783
<210> 21
<211> 8190
<212> DNA
<213> 人工序列
<223> 序列二
<400> 21
tcttccatat aggctcgtca agcggatctt tgattactcg tgcaaaggtt tagatgaaaa 60
ggtactgcgt tcccctcatg acagtgctat ggtaatatcc ttcttgcact gacattacca 120
ctggcttacc gttgtgtgca agaccaagac cgctagttag agggcaaagc catagcccag 180
cagccaagtc gctagaaaaa cactcagtaa taacagtgta atggcactac cctgggacat 240
agccaggata agccagtcaa acattgttta atttcctgtg tcgaagatct cgttgataat 300
ttcaacggcc gtgtcaccac catcaacagc tgtgtcccat tccaaattgg catgagtcac 360
atcagatggc acacccacat catcgtagat ggcctcttca ttcagctgct gcgtggtttc 420
acgcttgttc ttcttttcct tctttctctg gggttttgca ttcccagttt taaatgcatc 480
cacctgtgaa acaagaagct ctacatttgg atcagacttt ggcacagtca ttttataatt 540
atatgtaatc tcgtaagagt ccgctagctc acgaacagcc acattaccac caaagagcaa 600
tgctgcaaca tttggtgcta aactggcgat ctgagcatag cctgaggcat caacaccttt 660
ttcgacaaat tccgcatctc caaaattttt gaagcctccc ctgggtccga agcaagctgc 720
tacgctattt tcgcccttgg gaattctcct ccactctggg atgtctttga ggtcacgttc 780
tttcgaagtg gctctggatt tgttcttctt aggtgtattt ttgccgctgc tgtcagacct 840
ttcctgtttg ggcttctgct gttgcttaag cttgtcaggg ttttcgccaa tacccaaaga 900
tttaagggca tccttgacag cagccaccag atcatcgcgt gatgttacac caccacggtc 960
atttgactgg tttctgttct tggactggtt acgagacttg ttattgttat tattattgcc 1020
tcctctgttc tgagaagctc cacgaccctg gttatttcca cgattctgtg aattaccgcg 1080
ggactggtta ttgcctctgt tgttacttgg agatctggac ctgttgttgc cattaccacg 1140
actcctgcta cgtgaatttg cacgtgaagt aggaggtgtg ttaggttcaa caatctcaac 1200
tacgctggga agctgttgag agaaatttgg aataattggc ttttcagacg cctttctgac 1260
acccaggtta gtgggttcag tctttgcgcc ttctttagca acccagaaaa caccctcagt 1320
acgagtccta tagcggaggt cggcgtgagg tcctgttccg aggtagtaga aatgccaatt 1380
ggaaggttgt tcaattcgct caccacggcg catgcgccag cgaatttgct cattccagta 1440
tccaatttgc tggtccttat ttcctttatt agtgggtaca gcattatttg caagtacctt 1500
agaaaggggt ttgtcattag taaccctaag aggggcatag agggataatg gcacccgttt 1560
gcggccacga tcctgaaaac tgacagaagc cataaagttt ctgtttagac taaatgaagc 1620
actttctcac tatctgtgag aaccgaactc ggattactca cagctgagta gtcgccgtgt 1680
ttggaccgga catagaaagc ccaaccagtg ccagatgaag cattgactga acgaccaaca 1740
cgtccgtaga caattgttgt agtggccttg gcgactgtga cgaaattagg taattgactt 1800
acctgtacgc cagtagcaac cttatagccc tctacaagca atgtaccact aaggagtgtt 1860
agcgttacac cagttggtgc tccaagcact ggaatgcaga cctgtcggcc catcacagaa 1920
gtagtgagaa gcgcgtctgt ttcaggattg aaagaccacc aagaatgtgt cctgcgccac 1980
aaccgaatgc tattgacaaa gtacattatc cacagcataa gagtgatgca agccataagg 2040
atgctgaaag caaaaaagac ccaattgacc tgaaagctag cccatgcatc aaaaagtgac 2100
agtgctaaca caagaggcca aagtatccat agaatagcca tcttgacacc atacaagaac 2160
gcagagtact tgtaatggcc atactgaagc actacaagta gtatcgtcag tatgatattc 2220
catgtgaaat tccagtttct aaggtgttga atcacctcat caacgggaat agaaccgtta 2280
gacatatttc gtttatacgt caataacagt actagggagg gggtctattt gcatgtaaga 2340
cttataaact ctatacaaac gccctatagg tatgtaaact gcgctattac acaaccggtg 2400
acaagtgaag cacagattaa ccaattggac gaaagtaatg cttataataa gcaggaaaaa 2460
gagtacgaaa agccaaagta taacattaac tactagacca ttatcattca ctaattgtag 2520
catactcgtc tagttgaatt gagtcaaatg cagcattagt aatgccaaca atttgatgtt 2580
gcgaaaagac ataaagcttc ttgccatcaa gaagctcaac agttcgcaac agctgtaggt 2640
cagcttcttg ccgcccacgt atagctagat acaagtcgat gctactaaca aaagcaacaa 2700
aagagttgcc aaaagtgatg taatggtcac caccttctaa aatcacaatg gatttgccgt 2760
cataataagc tgctttacca ttgaggaaag aaagtgtcgt agtattaaaa ataataaaga 2820
gcgcattttt atagcgccag gagtaaaagc agactaaaca aagcctgcca ataagtgtgc 2880
aacaaataat agttgcatct aaaaatgcac cacaataata taaaagtggg caataaagaa 2940
caatgacagc aaaacgcgct gccaacataa tataattgcg cctcaaagaa gacgctttaa 3000
acagtgcaaa gaagtagata aaaacactgg tgaaaagaaa acccgtcaca tttgaagctt 3060
gtctaattgg aactacattg agctccaact cttggacagc atccaaagac aagttagcag 3120
actttgagac atctttgaca actgtgtcaa tcgtgtattg aaaaagtcca agaaacatca 3180
ctgcacgtgg accttttcaa aaacttcgta aggttgaagt ctaggacccc tacaacaacc 3240
tgagaaacaa gcacagcagc agccgcagca tccacaacaa cccgtggaaa tgcagcagaa 3300
cactagtaat gacacaacaa agatgagaac aatgaaaata atcaaccaaa cccaccacgg 3360
ccactttcac atacatttca tatgtgccaa cttccttgag gttgatgtag ctctcattta 3420
acttcttaat tgcatcctga atcctgttca tctcatacgt caggtccagc aaagtaacat 3480
ttaacttctc gaaatcgaga gataaatcag gcgcaataga cgtctgattc ttaaaccatt 3540
tatctaactc ctccttaaag tcgggtggat taggtattga agtgttcaag aaaacttcag 3600
gtgcctttgt gtagtttact gcgcaactac tcataatgac actgttttta tctgtaatgg 3660
gttcagggta gtaatatgaa ctgcctgtga acttccattc tccatcatct tgaacaaaat 3720
atccagcttt aggtgctaat cctctatcac cagaaatgca aagtccagga ctcacatttg 3780
cggttgtaaa ggatattggc acatagctga agtgtataaa atataagcca taaggcgcat 3840
tctggacaag agataatata tgattaccat tgccacagaa attaatacgc gtggtttggc 3900
tcttaacgca ctcattgacc ttttctatgg cctgagcagc actaacttta ataagcgtac 3960
tatcactaag ttgcttggat atatacgcat taagtgcagt taacctgcca ttaataagac 4020
gatctatctg ggcttttgct tctacagcct caagccgagt tagaatttct tgtaaagaag 4080
cactaatagc accaaacctg ttagaaagtt gatttagtaa gttattgagt gcttcagcat 4140
ttgcattaac aacggactgg atcttaccta aagcagaatt ggttgcatca aacccatcct 4200
ggatagcacc cagcgcattg ttaaaagcac tagcaatcat cttttggttc tcactaagca 4260
cattcatagt gacacctaaa ccattaattc tatattgaac acttaaacta aatggcacac 4320
cggcagctgc tgaccacggt gggaacatag ctgccgcagt agcaccggtt gtgtagccag 4380
agatctgact ctctgacaac acaggaggta atactttgat gccattaaaa gattgtacac 4440
aaaggaggtc acgaacttct tgaccaccgg tgcaattatt ataagcctcg acaaagccaa 4500
catcagataa tttgaccttg tcaaataaca aatcctctat agcagaacgc cctcggattg 4560
cactaggtcc attgccgtct tcagcacatg ttgaacctat gcatccaagt agaggactaa 4620
aattaatgtc atctataggg cctgagatgc cgtctggcag tctcgagctt atagtaacac 4680
cctgcattaa tgcactagca acttgtagtt gcatattatc caagaggtta ttaacctcat 4740
taagaatggc attaacatta acacagaaag agccatactc aaccaactgc tgcctgcatg 4800
cagtgttatc accacagaca aatgcagcac aatctatagt cacctttgga gatctagttt 4860
gaatgaactc ctcatggtgc ccaatagtaa aattggttgg tatttgcatc tcatataatc 4920
catcaacgga ttggacacta tcattaacta acatcggagt gtatggctca aatgtagtta 4980
accgatagcc agtagaaact gatcggtgag ccctgcgtga ttttgaataa tcaacgcata 5040
agccagcacc catacggaga tcacaattag gaagcgcctc atccgtgcgg ttatcagcat 5100
taacaacaca acccaaataa ctatcaaagt aattaagtgg gttctcctca cgggaaatat 5160
tattgctaaa aacatagcta caatttatat tacgatagag cagagccggt tcgggtgcat 5220
ctttatgaaa tgcagcagaa acacggccac tataacagct ccttatcgta taagtcttgt 5280
tagtggtaag atcacgaaaa ccattcaaat taccattaac atcatacaga agggtttgcc 5340
agctattata atagtcagcc ttaacctctt taaaaacacc ttgtccagta ataccgtaga 5400
ggtcatattt gacacaaatg ccagtaacca cttcagtatt aggcaactgc aaatctgtgg 5460
aacatgtggt accactatta atgccattta acaatatatt agcaaaaatt tggcagcgat 5520
cattaacaag gcaggtatca tgtgaccatc caataaatga attgttggca cagatacaac 5580
ccttatgtgg atcagcattg ccacaattat cttctaaaac acctaagcct tcacaatggt 5640
cacccacatt aacaaaagca gacttaggct tagtctgagt agtgcaaggg ctaactatgt 5700
ccggttgagc acacgggcaa taactagatc ttacagtaaa acattgctga gcgtaaacaa 5760
cgtcatgttg gtttttgcca aagacgccag catcattaaa gccatacctc ctattccaag 5820
acgaggggtt atggttgttt atggtgacat tattcttagg caaggtgtaa tgcagctgac 5880
acgaagtggc agctgtatca atcttataat tagcagtctg cagaaatcca gagttaccaa 5940
gctgtaaatc aacttgccta cttcggggta cagcaaactt atcaactgaa atactaccaa 6000
agcacctgcc atacactttg gaagcatcga tattattaca aaacaaactc tcagcctgaa 6060
cataacgtaa caggctgctt aaattaaaat tacaattctg aaaagtctta cgctcccagt 6120
tgagagggga ggggactgac ctagcagtaa gccactcctc tatattacaa gctgggaggt 6180
tagcaacacg ccggtataca actccaactg gttggaccgt ataaccggat aactcataga 6240
caccagtgct aggtaacatg ctctgggtct tacattttat ttcactggta taactactag 6300
cacaatcaac agcactagta atgacaccct tctggttgaa attaaacaaa tattggcgct 6360
taaccaaagg tgtaacccaa tagcgcggag caaaagtgct accagctgtt gggttgcaga 6420
tgaaaggtaa cacataatac tgtgttaaaa tatcgccaat atatacacta aacaaaaacg 6480
tagtagcgga gggtttatcc gcatagtacg cataaaaagt accaccatgt tggtaaaaat 6540
gaaaataaaa tgcatcagca ttaacattaa gcgtgaaatt tcgctttaac acacaaattg 6600
ggggttttac atccgtgtgc caaaacccta ttaatttatt accattagtg ttaggcttac 6660
aatcagtgta aggtaactga caaatggtat actggcacac tgaggccatt ataacaccat 6720
tatatggctc tattacaacg gtataggaag tatagccaaa caaactacct ataactatag 6780
taggaaaata tgcagttgca cctgatggcg tacttgtctt aaggttctgc accttcgcaa 6840
atatgccatc attaaactga cttaaatagg gtggttgaaa ccacgacaag ctaactgagt 6900
tagttcccgt aagagcgagg tttctaaact tagaaccatc gaccgggtag taaccagtaa 6960
gcaataatgt ggcatttaaa taaactcgat ctaacacata atatgtcccc aggccttgtg 7020
aaacttcaac ggtctcagtg ctaatgcttg gagcactaac attagcaccg tttgaattca 7080
caagctggat acatctaaaa tcaccaatat accctaaaca agagggcaaa aatagaataa 7140
acacgaacag cattcatttg tttacgttga ccaaatgatt agaaaaacca caaatggcgt 7200
cattattacg cactagcaac ttaccattct tcaacaaacc taacacaaca tcactaatgg 7260
atgaatcttt taaattaatg acaactgtag ccttatgctt acaattgaac ttgcttaaat 7320
caagtacact attgtaagac atagtcataa ttgtggaatt acgccagaag atataattgg 7380
catgcatagt gttgccgtca atcacagcgc cacttgcaaa atcacctaaa tagtgaacac 7440
caattaagaa tgcctctgac gatgacgtgt taacactggt acagaacatt gtccaatact 7500
caaacctctg aatgagttca tacaacttct tattccaact aaactccgtc accttaatag 7560
ctacagtacc accaagtgcc aacttttcgg tgagtcaact ggcacgatgt taccaccacg 7620
acgaccaaaa gtaagctcta actcttcaag gaagtaatta cagttagaaa ataacagcca 7680
accacaaatg tttttggggc ggctaccaaa agtgtccaca tacgcactaa gcttggtagt 7740
gccgaccacc accatgacat agtcttcggg aagcaatccc tcaacagtgt cagcgagatc 7800
gaaggacacg aaacggcatt gcataaatcc actagcggcg gcctcagaat agtatgagac 7860
ggcttcacta gcagtgcaaa agccaagagc tgaaatttct gcatcattgg caaaagccaa 7920
tgtaacatgg ttgctagcca tagccgacag ttactggttt caaactagac ggaactagtt 7980
atccacacaa cccccagacg gaaccggagg aaggctgttt gtctagtatg tagaaggcga 8040
cggaacgcca accaggaact agaggacagc acagcacttg cgatggctac ttaagcaaac 8100
ctaatgaaat tccacgtcag cttccagcag catggacatg cggccggaag gacaaaattt 8160
cgtttagttg aattgagtag acaagagtct 8190
<210> 22
<211> 770
<212> DNA
<213> 人工序列
<223> 序列二二级片段A1
<400> 22
atcgggtctc aaacggctct tcatcttcca tataggctcg tcaagcggat ctttgattac 60
tcgtgcaaag gtttagatga aaaggtactg cgttcccctc atgacagtgc tatggtaata 120
tccttcttgc actgacatta ccactggctt accgttgtgt gcaagaccaa gaccgctagt 180
tagagggcaa agccatagcc cagcagccaa gtcgctagaa aaacactcag taataacagt 240
gtaatggcac taccctggga catagccagg ataagccagt caaacattgt ttaatttcct 300
gtgtcgaaga tctcgttgat aatttcaacg gccgtgtcac caccatcaac agctgtgtcc 360
cattccaaat tggcatgagt cacatcagat ggcacaccca catcatcgta gatggcctct 420
tcattcagct gctgcgtggt ttcacgcttg ttcttctttt ccttctttct ctggggtttt 480
gcattcccag ttttaaatgc atccacctgt gaaacaagaa gctctacatt tggatcagac 540
tttggcacag tcattttata attatatgta atctcgtaag agtccgctag ctcacgaaca 600
gccacattac caccaaagag caatgctgca acatttggtg ctaaactggc gatctgagca 660
tagcctgagg catcaacacc tttttcgaca aattccgcat ctccaaaatt tttgaagcct 720
cccctgggtc cgaagcaagc tgctacgcta ttttcgccct cgagacccat 770
<210> 23
<211> 768
<212> DNA
<213> 人工序列
<223> 序列二二级片段A2
<400> 23
atcgggtctc acccttggga attctcctcc actctgggat gtctttgagg tcacgttctt 60
tcgaagtggc tctggatttg ttcttcttag gtgtattttt gccgctgctg tcagaccttt 120
cctgtttggg cttctgctgt tgcttaagct tgtcagggtt ttcgccaata cccaaagatt 180
taagggcatc cttgacagca gccaccagat catcgcgtga tgttacacca ccacggtcat 240
ttgactggtt tctgttcttg gactggttac gagacttgtt attgttatta ttattgcctc 300
ctctgttctg agaagctcca cgaccctggt tatttccacg attctgtgaa ttaccgcggg 360
actggttatt gcctctgttg ttacttggag atctggacct gttgttgcca ttaccacgac 420
tcctgctacg tgaatttgca cgtgaagtag gaggtgtgtt aggttcaaca atctcaacta 480
cgctgggaag ctgttgagag aaatttggaa taattggctt ttcagacgcc tttctgacac 540
ccaggttagt gggttcagtc tttgcgcctt ctttagcaac ccagaaaaca ccctcagtac 600
gagtcctata gcggaggtcg gcgtgaggtc ctgttccgag gtagtagaaa tgccaattgg 660
aaggttgttc aattcgctca ccacggcgca tgcgccagcg aatttgctca ttccagtatc 720
caatttgctg gtccttattt cctttattag tgggtacacg agacccat 768
<210> 24
<211> 698
<212> DNA
<213> 人工序列
<223> 序列二二级片段A3
<400> 24
atcgggtctc atacagcatt atttgcaagt accttagaaa ggggtttgtc attagtaacc 60
ctaagagggg catagaggga taatggcacc cgtttgcggc cacgatcctg aaaactgaca 120
gaagccataa agtttctgtt tagactaaat gaagcacttt ctcactatct gtgagaaccg 180
aactcggatt actcacagct gagtagtcgc cgtgtttgga ccggacatag aaagcccaac 240
cagtgccaga tgaagcattg actgaacgac caacacgtcc gtagacaatt gttgtagtgg 300
ccttggcgac tgtgacgaaa ttaggtaatt gacttacctg tacgccagta gcaaccttat 360
agccctctac aagcaatgta ccactaagga gtgttagcgt tacaccagtt ggtgctccaa 420
gcactggaat gcagacctgt cggcccatca cagaagtagt gagaagcgcg tctgtttcag 480
gattgaaaga ccaccaagaa tgtgtcctgc gccacaaccg aatgctattg acaaagtaca 540
ttatccacag cataagagtg atgcaagcca taaggatgct gaaagcaaaa aagacccaat 600
tgacctgaaa gctagcccat gcatcaaaaa gtgacagtgc taacacaaga ggccaaagta 660
tccatagaat agccatcttg acaccatacg agacccat 698
<210> 25
<211> 532
<212> DNA
<213> 人工序列
<223> 序列二二级片段A4
<400> 25
atcgggtctc acatacaaga acgcagagta cttgtaatgg ccatactgaa gcactacaag 60
tagtatcgtc agtatgatat tccatgtgaa attccagttt ctaaggtgtt gaatcacctc 120
atcaacggga atagaaccgt tagacatatt tcgtttatac gtcaataaca gtactaggga 180
gggggtctat ttgcatgtaa gacttataaa ctctatacaa acgccctata ggtatgtaaa 240
ctgcgctatt acacaaccgg tgacaagtga agcacagatt aaccaattgg acgaaagtaa 300
tgcttataat aagcaggaaa aagagtacga aaagccaaag tataacatta actactagac 360
cattatcatt cactaattgt agcatactcg tctagttgaa ttgagtcaaa tgcagcatta 420
gtaatgccaa caatttgatg ttgcgaaaag acataaagct tcttgccatc aagaagctca 480
acagttcgca acagctgtag gtcagcttct tgaagagccc gatgagaccg ct 532
<210> 26
<211> 772
<212> DNA
<213> 人工序列
<223> 序列二二级片段B1
<400> 26
atcgggtctc aaacggctct tcatcttgcc gcccacgtat agctagatac aagtcgatgc 60
tactaacaaa agcaacaaaa gagttgccaa aagtgatgta atggtcacca ccttctaaaa 120
tcacaatgga tttgccgtca taataagctg ctttaccatt gaggaaagaa agtgtcgtag 180
tattaaaaat aataaagagc gcatttttat agcgccagga gtaaaagcag actaaacaaa 240
gcctgccaat aagtgtgcaa caaataatag ttgcatctaa aaatgcacca caataatata 300
aaagtgggca ataaagaaca atgacagcaa aacgcgctgc caacataata taattgcgcc 360
tcaaagaaga cgctttaaac agtgcaaaga agtagataaa aacactggtg aaaagaaaac 420
ccgtcacatt tgaagcttgt ctaattggaa ctacattgag ctccaactct tggacagcat 480
ccaaagacaa gttagcagac tttgagacat ctttgacaac tgtgtcaatc gtgtattgaa 540
aaagtccaag aaacatcact gcacgtggac cttttcaaaa acttcgtaag gttgaagtct 600
aggaccccta caacaacctg agaaacaagc acagcagcag ccgcagcatc cacaacaacc 660
cgtggaaatg cagcagaaca ctagtaatga cacaacaaag atgagaacaa tgaaaataat 720
caaccaaacc caccacggcc actttcacat acatttcata tgcgagaccc at 772
<210> 27
<211> 840
<212> DNA
<213> 人工序列
<223> 序列二二级片段B2
<400> 27
atcgggtctc atatgtgcca acttccttga ggttgatgta gctctcattt aacttcttaa 60
ttgcatcctg aatcctgttc atctcatacg tcaggtccag caaagtaaca tttaacttct 120
cgaaatcgag agataaatca ggcgcaatag acgtctgatt cttaaaccat ttatctaact 180
cctccttaaa gtcgggtgga ttaggtattg aagtgttcaa gaaaacttca ggtgcctttg 240
tgtagtttac tgcgcaacta ctcataatga cactgttttt atctgtaatg ggttcagggt 300
agtaatatga actgcctgtg aacttccatt ctccatcatc ttgaacaaaa tatccagctt 360
taggtgctaa tcctctatca ccagaaatgc aaagtccagg actcacattt gcggttgtaa 420
aggatattgg cacatagctg aagtgtataa aatataagcc ataaggcgca ttctggacaa 480
gagataatat atgattacca ttgccacaga aattaatacg cgtggtttgg ctcttaacgc 540
actcattgac cttttctatg gcctgagcag cactaacttt aataagcgta ctatcactaa 600
gttgcttgga tatatacgca ttaagtgcag ttaacctgcc attaataaga cgatctatct 660
gggcttttgc ttctacagcc tcaagccgag ttagaatttc ttgtaaagaa gcactaatag 720
caccaaacct gttagaaagt tgatttagta agttattgag tgcttcagca tttgcattaa 780
caacggactg gatcttacct aaagcagaat tggttgcatc aaacccatcc cgagacccat 840
<210> 28
<211> 789
<212> DNA
<213> 人工序列
<223> 序列二二级片段B3
<400> 28
atcgggtctc aatcctggat agcacccagc gcattgttaa aagcactagc aatcatcttt 60
tggttctcac taagcacatt catagtgaca cctaaaccat taattctata ttgaacactt 120
aaactaaatg gcacaccggc agctgctgac cacggtggga acatagctgc cgcagtagca 180
ccggttgtgt agccagagat ctgactctct gacaacacag gaggtaatac tttgatgcca 240
ttaaaagatt gtacacaaag gaggtcacga acttcttgac caccggtgca attattataa 300
gcctcgacaa agccaacatc agataatttg accttgtcaa ataacaaatc ctctatagca 360
gaacgccctc ggattgcact aggtccattg ccgtcttcag cacatgttga acctatgcat 420
ccaagtagag gactaaaatt aatgtcatct atagggcctg agatgccgtc tggcagtctc 480
gagcttatag taacaccctg cattaatgca ctagcaactt gtagttgcat attatccaag 540
aggttattaa cctcattaag aatggcatta acattaacac agaaagagcc atactcaacc 600
aactgctgcc tgcatgcagt gttatcacca cagacaaatg cagcacaatc tatagtcacc 660
tttggagatc tagtttgaat gaactcctca tggtgcccaa tagtaaaatt ggttggtatt 720
tgcatctcat ataatccatc aacggattgg acactatcat taactaacat cggagtgtac 780
gagacccat 789
<210> 29
<211> 687
<212> DNA
<213> 人工序列
<223> 序列二二级片段B4
<400> 29
atcgggtctc atgtatggct caaatgtagt taaccgatag ccagtagaaa ctgatcggtg 60
agccctgcgt gattttgaat aatcaacgca taagccagca cccatacgga gatcacaatt 120
aggaagcgcc tcatccgtgc ggttatcagc attaacaaca caacccaaat aactatcaaa 180
gtaattaagt gggttctcct cacgggaaat attattgcta aaaacatagc tacaatttat 240
attacgatag agcagagccg gttcgggtgc atctttatga aatgcagcag aaacacggcc 300
actataacag ctccttatcg tataagtctt gttagtggta agatcacgaa aaccattcaa 360
attaccatta acatcataca gaagggtttg ccagctatta taatagtcag ccttaacctc 420
tttaaaaaca ccttgtccag taataccgta gaggtcatat ttgacacaaa tgccagtaac 480
cacttcagta ttaggcaact gcaaatctgt ggaacatgtg gtaccactat taatgccatt 540
taacaatata ttagcaaaaa tttggcagcg atcattaaca aggcaggtat catgtgacca 600
tccaataaat gaattgttgg cacagataca acccttatgt ggatcagcat tgccacaatt 660
atcttgaaga gcccgatgag accgcta 687
<210> 30
<211> 698
<212> DNA
<213> 人工序列
<223> 序列二二级片段C1
<400> 30
atcgcgtctc aaacggctct tcatcttcta aaacacctaa gccttcacaa tggtcaccca 60
cattaacaaa agcagactta ggcttagtct gagtagtgca agggctaact atgtccggtt 120
gagcacacgg gcaataacta gatcttacag taaaacattg ctgagcgtaa acaacgtcat 180
gttggttttt gccaaagacg ccagcatcat taaagccata cctcctattc caagacgagg 240
ggttatggtt gtttatggtg acattattct taggcaaggt gtaatgcagc tgacacgaag 300
tggcagctgt atcaatctta taattagcag tctgcagaaa tccagagtta ccaagctgta 360
aatcaacttg cctacttcgg ggtacagcaa acttatcaac tgaaatacta ccaaagcacc 420
tgccatacac tttggaagca tcgatattat tacaaaacaa actctcagcc tgaacataac 480
gtaacaggct gcttaaatta aaattacaat tctgaaaagt cttacgctcc cagttgagag 540
gggaggggac tgacctagca gtaagccact cctctatatt acaagctggg aggttagcaa 600
cacgccggta tacaactcca actggttgga ccgtataacc ggataactca tagacaccag 660
tgctaggtaa catgctctgg gtcttacacg agacgcat 698
<210> 31
<211> 598
<212> DNA
<213> 人工序列
<223> 序列二二级片段C2
<400> 31
atcgcgtctc atacatttta tttcactggt ataactacta gcacaatcaa cagcactagt 60
aatgacaccc ttctggttga aattaaacaa atattggcgc ttaaccaaag gtgtaaccca 120
atagcgcgga gcaaaagtgc taccagctgt tgggttgcag atgaaaggta acacataata 180
ctgtgttaaa atatcgccaa tatatacact aaacaaaaac gtagtagcgg agggtttatc 240
cgcatagtac gcataaaaag taccaccatg ttggtaaaaa tgaaaataaa atgcatcagc 300
attaacatta agcgtgaaat ttcgctttaa cacacaaatt gggggtttta catccgtgtg 360
ccaaaaccct attaatttat taccattagt gttaggctta caatcagtgt aaggtaactg 420
acaaatggta tactggcaca ctgaggccat tataacacca ttatatggct ctattacaac 480
ggtataggaa gtatagccaa acaaactacc tataactata gtaggaaaat atgcagttgc 540
acctgatggc gtacttgtct taaggttctg caccttcgca aatatgcccg agacgcat 598
<210> 32
<211> 586
<212> DNA
<213> 人工序列
<223> 序列二二级片段C3
<400> 32
atcgcgtctc atgccatcat taaactgact taaatagggt ggttgaaacc acgacaagct 60
aactgagtta gttcccgtaa gagcgaggtt tctaaactta gaaccatcga ccgggtagta 120
accagtaagc aataatgtgg catttaaata aactcgatct aacacataat atgtccccag 180
gccttgtgaa acttcaacgg tctcagtgct aatgcttgga gcactaacat tagcaccgtt 240
tgaattcaca agctggatac atctaaaatc accaatatac cctaaacaag agggcaaaaa 300
tagaataaac acgaacagca ttcatttgtt tacgttgacc aaatgattag aaaaaccaca 360
aatggcgtca ttattacgca ctagcaactt accattcttc aacaaaccta acacaacatc 420
actaatggat gaatctttta aattaatgac aactgtagcc ttatgcttac aattgaactt 480
gcttaaatca agtacactat tgtaagacat agtcataatt gtggaattac gccagaagat 540
ataattggca tgcatagtgt tgccgtcaat cacagccgag acgcat 586
<210> 33
<211> 820
<212> DNA
<213> 人工序列
<223> 序列二二级片段C4
<400> 33
atcgcgtctc acagcgccac ttgcaaaatc acctaaatag tgaacaccaa ttaagaatgc 60
ctctgacgat gacgtgttaa cactggtaca gaacattgtc caatactcaa acctctgaat 120
gagttcatac aacttcttat tccaactaaa ctccgtcacc ttaatagcta cagtaccacc 180
aagtgccaac ttttcggtga gtcaactggc acgatgttac caccacgacg accaaaagta 240
agctctaact cttcaaggaa gtaattacag ttagaaaata acagccaacc acaaatgttt 300
ttggggcggc taccaaaagt gtccacatac gcactaagct tggtagtgcc gaccaccacc 360
atgacatagt cttcgggaag caatccctca acagtgtcag cgagatcgaa ggacacgaaa 420
cggcattgca taaatccact agcggcggcc tcagaatagt atgagacggc ttcactagca 480
gtgcaaaagc caagagctga aatttctgca tcattggcaa aagccaatgt aacatggttg 540
ctagccatag ccgacagtta ctggtttcaa actagacgga actagttatc cacacaaccc 600
ccagacggaa ccggaggaag gctgtttgtc tagtatgtag aaggcgacgg aacgccaacc 660
aggaactaga ggacagcaca gcacttgcga tggctactta agcaaaccta atgaaattcc 720
acgtcagctt ccagcagcat ggacatgcgg ccggaaggac aaaatttcgt ttagttgaat 780
tgagtagaca agagtcttga agagcccgat gagacggcta 820

Claims (9)

1.一种长基因合成方法,其特征在于包含以下步骤:
1)按照基因片段内部的IIs型核酸酶酶切位点对长基因进行两级分段:首先计算IIs型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,在一级分段酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此IIs型核酸酶酶切位点;如果有一大段序列超过5 kb,其中没有合适的IIs型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段;之后再对一级片段进行二级分段,以使各个二级片段能够通过Golden Gate的方法进行拼接;
2)获得二级片段;
3)由二级片段利用Golden Gate拼接成一级片段;
4)由一级片段利用酶切-LCR的方法,或者PCR-LCR的方法拼接成全长基因;
其中,
当一级片段拼接成全长基因采用酶切-LCR的方法,则步骤1)所述的两级分段中的一级分段方法为:首先计算IIs型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,将所选择的两个酶切位点中的一个酶切位点定义为A酶切位点,另一个酶切位点为B酶切位点,在每个一级分段片段的两端加上A酶切识别位点,作为最终的一级片段序列;如果有一大段序列超过5 kb,其中没有合适的IIs型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段, 在断点两端均加上A酶切位点,作为最终的一级片段序列;对应的酶切-LCR中使用A酶进行酶切;当一级片段拼接成全长基因采用PCR-LCR的方法,则A酶切位点的加入不是必须的。
2.根据权利要求1所述的长基因合成方法,其特征在于步骤1)所述的IIs型核酸酶酶切位点选自BsaI、BsmBI、BbsI或BspQI酶切位点。
3.根据权利要求1所述的长基因合成方法,其特征在于步骤1)所述的两级分段中的二级片段的分段的步骤为:每个片段尽量等长但是每个片段不超过700 bp;同一个片段内部没有大于20 bp的重复;片段之间会有4 bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列;最后,在每个二级片段的两端加上B酶切识别位点,作为最终的二级片段序列。
4.根据权利要求3所述的长基因合成方法,其特征在于所述的4bp的粘性末端选自:CCCT、TATG、ATCC、GCTG、TACA、GAGT、GTCG、TGCC或GAAC中的任意一种。
5.根据权利要求1或3所述的长基因合成方法,其特征在于二级片段组装成一级片段通过BsaI酶介导的Golden Gate克隆的方法实现,具体的,将各二级片段和对应的二级辅助载体混合,进行Golden Gate克隆反应,转化大肠杆菌感受态,涂布Kan抗性平板,挑取正确克隆。
6.根据权利要求5所述的长基因合成方法,其特征在于所述的二级辅助载体具有如下特征:带有Kan抗性标记; lacZα片段两端各带有一个IIs型核酸酶酶切位点;两端的IIs型核酸酶酶切位点分别切出“AACG”和“CCGA”的4 bp的粘性末端或者“TCT”的3 bp的粘性末端;整个载体的其他位置没有所对应IIs型核酸酶酶切位点;二级辅助载体可以直接作为Golden Gate克隆的载体骨架来使用,同时还可以进行蓝白斑筛选。
7.根据权利要求2所述的长基因合成方法,其特征在于所述的一级片段拼接为全长可以通过以下任一种方法实现:
1)通过PCR-LCR的方法拼接全长:设计PCR引物,将一级片段所有片段和载体骨架扩增出来,PCR引物的设计应使扩增片段首尾相接同时没有重叠区域,之后,将PCR片段和Bridging Oligo合并进行LCR反应,反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆;
2)通过酶切-LCR的方法拼接全长:将所有的一级片段和一级辅助载体混合在一起,用A酶进行酶切,之后将酶切混合物和Bridging Oligo合并进行LCR反应,反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆。
8.根据权利要求7所述的长基因合成方法,其特征在于所述的载体骨架为pUC57载体。
9.根据权利要求7或8所述的长基因合成方法,其特征在于一级辅助载体需要满足:带有Amp抗性,lacZα片段两端各带有一段Linker序列和一个IIs型核酸酶酶切位点,整个载体的其他位置没有所对应IIs型核酸酶酶切位点;一级辅助载体能够直接作为载体骨架用于酶切-LCR克隆,同时还能够进行蓝白斑筛选;一级辅助载体与一级片段进行组装,获得合成基因的全长。
CN201710116019.6A 2017-03-01 2017-03-01 一种长基因合成方法 Active CN108531471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710116019.6A CN108531471B (zh) 2017-03-01 2017-03-01 一种长基因合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710116019.6A CN108531471B (zh) 2017-03-01 2017-03-01 一种长基因合成方法

Publications (2)

Publication Number Publication Date
CN108531471A CN108531471A (zh) 2018-09-14
CN108531471B true CN108531471B (zh) 2020-08-07

Family

ID=63488635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710116019.6A Active CN108531471B (zh) 2017-03-01 2017-03-01 一种长基因合成方法

Country Status (1)

Country Link
CN (1) CN108531471B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111378645B (zh) * 2018-12-27 2020-12-01 江苏金斯瑞生物科技有限公司 一种基因合成的方法
CN111349638A (zh) * 2020-03-17 2020-06-30 深圳市泽龙生物技术有限公司 构建包含大片段反向互补序列载体的方法
CN115605590A (zh) * 2021-02-10 2023-01-13 清华大学(Cn) 一种制备定点修饰的长链dna的方法
CN113005137B (zh) * 2021-02-25 2022-10-11 石河子大学 一种具有启动、终止双功能调控元件的构建方法、双功能元件库和应用
CN113388607B (zh) * 2021-05-20 2021-12-28 北京擎科生物科技有限公司 一种复杂dna的合成方法及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103725674A (zh) * 2013-12-31 2014-04-16 湖北大学 一种在大肠杆菌中一步法合成dna片段并组装合成基因的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103725674A (zh) * 2013-12-31 2014-04-16 湖北大学 一种在大肠杆菌中一步法合成dna片段并组装合成基因的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Rapid and Simple Method for DNA Engineering Using Cycled Ligation Assembly;Theodore L. Roth et al.;《plos one》;20140930;全文 *
Advanced DNA assembly strategies and standards for synthetic biology;Arturo Casini;《spiral.imperial.ac.uk》;20140923;全文 *
Bricks and blueprints: methods and standards for DNA assembly;Arturo Casini et al.;《PERSPECTIVES》;20150930;全文 *
DNA组装新方法的研究进展;李雷 等;《生物工程学报》;20130825;全文 *
Recent advances in DNA assembly technologies;Ran Chao et al.;《FEMS Yeast Research》;20151231;全文 *

Also Published As

Publication number Publication date
CN108531471A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN108531471B (zh) 一种长基因合成方法
US20020025561A1 (en) Vectors for gene-self-assembly
CN113549618B (zh) 基于RAA扩增和CRISPR-Cas13a系统的SARS-CoV-2核酸检测方法
CN113481327B (zh) 基于RAA扩增和CRISPR-Cas12a的新型冠状病毒ORF1ab基因检测方法
CN106755092A (zh) GLCCI1基因基于Cre‑LoxP条件性基因敲除小鼠模型构建试剂盒及构建方法
CN108395996B (zh) 一种猪瘟病毒亚单位疫苗及其制备方法和用途
CN111733290A (zh) 一种检测新型冠状病毒及近缘冠状病毒的试剂盒及其制备方法
CN108285886A (zh) 重组枯草芽孢杆菌全细胞转化生产n-乙酰神经氨酸的方法
CN109609579B (zh) 一种产β-胡萝卜素的基因工程菌及其构建方法
CN112626266A (zh) 新型冠状病毒SARS-CoV-2的检测引物组及应用
CN114933970B (zh) 缺失6-磷酸葡萄糖酸脱氢酶1基因的弓形虫基因敲除虫株
CN109652352B (zh) 一株用于屎肠球菌谷氨酸脱羧酶高效固定化的基因工程菌及固定化方法
CN113584223B (zh) 基于CRISPR-Cas12a的SARS-CoV-2中D614G突变鉴定方法
CN114292864B (zh) 高产表面活性素的贝莱斯芽孢杆菌突变株及其构建方法和应用
CN112626116B (zh) 定点整合大片段外源dna的方法
CN111321163B (zh) 一种枯草芽孢杆菌线性质粒系统的构建与应用
CN112322706A (zh) 一种特异性人源基因片段及其引物探针和应用
CN107661496A (zh) 一种猪细小病毒免疫组合物及其制备方法与应用
CN113073097B (zh) 一种cho细胞内源性的温度敏感型启动子及其应用
CN114214347B (zh) 示踪肝前体细胞的质粒系统及应用
CN111378718A (zh) 一种基因测序文库的构建方法
CN114540345B (zh) 一种发夹结构的标签荧光探针和荧光检测方法
CN110607380B (zh) 桑树植原体ltrA基因及其在桑树植原体分子检测中的应用
KR102468650B1 (ko) T7 RNA 중합효소 및 mRNA 캡핑 효소를 유도 발현하는 재조합 벡터 및 이의 용도
CN113718047B (zh) 荧光定量方法检测人母乳内10属细菌的试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant