CN109868271A

CN109868271A - 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法

Info

Publication number: CN109868271A
Application number: CN201910215880.7A
Authority: CN
Inventors: 宛雯; 洪泂
Original assignee: Jiangsu Normal University
Current assignee: Jiangsu Normal University
Priority date: 2019-03-21
Filing date: 2019-03-21
Publication date: 2019-06-11
Anticipated expiration: 2039-03-21
Also published as: CN109868271B

Abstract

利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法，主要包括：结合比对软件进行亲本序列切割成寡核苷酸序列；利用错配结合蛋白MutS固定化纤维素柱进行寡核苷酸文库的高通量纠错；使用切割后的寡核苷酸进行全长重组文库组装。本发明的方法与现有的方法相比，重组率高，降低了组装成为全长基因序列的难度，并降低了合成成本，提高了序列的多样性，oligo pool的准确性，合成基因文库的保真性和重组的概率。

Description

利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法

技术领域

本发明涉及DNA重组文库的构建方法，具体涉及一种利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法。

背景技术

DNA洗牌(DNA shuffling)技术是一种重要的体外分子定向进化方法，该方法可以用于生成大量重组突变体，这些突变体结合了多个个体的有效突变。DNA shuffling方法通过将一些功能相关的基因片段，随机片段化成为一个兼并片段文库，这些片段文库中的DNA通过相互之间的同源区域互为引物和模板通过重组反应，在组装的过程中，来源于不同亲本序列之间的片段相互组装成为全长突变体基因文库。DNA shuffling的优势在于，当对一个基因家族进行重组时，通过体外重组同源亲本基因，以创建一个不同的后代基因库。可以允许以一个可控的比率重组来自多个物种的两个或多个同源基因，从而将自然重组和突变产生更大的多样库。

目前，基于传统的DNA shufflling方法，已经发展出了很多改进了的DNAshuffling方法。如：体外外显子洗牌(In vitro exon shuffling)、基于瞬时模板的随机嵌合方法(Random chimeragenesis on transient templates，RACHITT)、交错延伸技术(Staggered extension process，StEP))、基于增长截短的杂合酶构建方法(Incrementaltruncation for the creation of hybrid enzymes，ITCHY)等。而随着从头DNA合成技术的进步和单链DNA合成成本的不断降低，也报道了一些，利用从头合成寡核苷酸进行突变文库构建的方法。如合成洗牌策略(The synthetic shuffling strategy，SS)、兼并同源双链重组(Degenerate homoduplex recombination，DHR)和设计寡核苷酸的组装(Assembly ofdesigned oligonucleotides，ADO)等。然而使用芯片合成的寡核苷酸文库，进行基因突变文库的从头设计和合成还没有报道。

利用芯片合成的寡核苷酸文库进行DNA shuffling，具有很多的优势。如：(1)由于可以通过化学方法直接合成重组所需要的DNA片段，而不需要原始亲本DNA片段。所以可以选择任意已知的DNA序列进行组装，而不受到DNA序列来源的限制，甚至可以选择一些自然界中不存在的DNA片段进行组装。(2)在合成寡核苷酸之初，就可以随机突变一些重要的位点，增加有义突变，提高突变文库的效率。(3)由于通过设计在同源区末端进行交错切割，使得来源于不同亲本的DNA具有相似的同源末端，可以有效的提高重组效率，可以实现同源性相对较低的序列的有效组装。(4)使用直接合成的寡核苷酸进行组装，组装系统稳定、组装条件易于优化，相对于传统DNA shuffling方法组装效率高。(5)由于高效的组装效率，可以同时选择更多的亲本序列进行shuffling反应，获得更多更优的突变性状。

发明内容

本发明的目的在于提供一种利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法。

为实现上述目的，本发明的技术方案具体如下：

利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法，包括以下步骤：

S1：选择具有特定功能的蛋白基因序列，比对这些序列，寻找同源区域，在同源区域进行交错切割，将模板基因序列双链设计成具有同源末端的寡核苷酸片段oligo，实现将全长基因序列在互补区域末端交错切割成较短的寡核苷酸文库oligo pool，再使用DNA芯片合成该oligo pool；

S2：使用固定化有错配识别蛋白MutS的纤维素凝胶柱进行oligo pool的错误移除；

S3：将错误移除的oligo文库通过基于连接酶的组装方法组装成为全长重组文库。

进一步的，所述步骤S3之后还包括步骤S4：组装反应后，以获得的组装产物为模板，通过PCR循环，进一步提高重组概率。

进一步的，所述步骤S4之后还包括步骤S5：向反应体系中加入全长序列两段通用引物，进行PCR扩增获得大量重组的基因全长序列。

进一步的，所述蛋白为红色荧光蛋白，所述方法具体包括：

使用比对软件Bioedit对选择的21条红色荧光蛋白模板序列进行比对，根据比对结果，按照互补区域交错切割的要求设计oligo pool；向所有设计的oligo序列两端分别加入一对引物序列，该对引物含有一个Mly I限制性内切酶酶切位点，可以通过酶切去除；以第一项合成的oligo pool为模板，以oligo两端通用引物为引物，PCR反应扩增获得大量oligo，然后通过重新变性退火将合成错误的碱基展示为错配；

将重新变性退火的oligo pool上样到MICC柱子上，DNA样本在重力的作用下穿过柱体；在该过程中含有合成错误碱基的oligo被固定化在柱子中的MutS结合而滞留在柱子上，而合成正确的oligo流过柱子被收集下来；以收集的含有错误移除oligo pool的滤液为模板，通过PCR扩增获得大量的ED-oligo pool；

将ED-oligo pool通过Mly I酶切去除其两端的通用引物序列，使用UNIQ-10oligo回收试剂盒回收引物去除的oligo pool；

将EP-oligo pool通过基于连接和PCR的组装方法方法组装成为重组全长文库，然后以组装产物为模板，使用全长通用引物为引物，PCR扩增获得大量重组文库序列。

与现有技术相比，本发明的有益效果：

本发明的方法使用计算机软件进行辅助设计，通过在亲本序列的同源区进行切割，进行亲本序列的片段化；与传统的使用DNAse酶切的方法亲本序列的片段化相比较有多个优点：

(1)提高重组率，使用计算机辅助设计，通过序列比对，在同源区进行切割，使切割后的来源于不同序列的oligo具有相似的同源末端，较DNAse额随机切割相比较，不同序列之间更加容易组装，提高了序列的重组率；

(2)组装难度降低，由于在同源区进行切割时来源于不同亲本序列的oligo之间具有相似的末端序列。较DNAse的随机切割相比较，更容易进行全长序列的组装；

(3)由于组装难度的降低使得可以选择更多的序列作为亲本序列，提高了序列的多样性；

本发明的方法使用DNA微芯片合成技术合成设计的oligo pool，降低了oligopool的合成成本；

使用MICC对整个oligo pool进行错误纠正，可以提高oligo pool的准确性，提高了合成基因文库的保真性；

本发明的方法使用LCR-PCA的组装方法进行oligo pool的组装，与传统的基于PCR的组装反应相比较，先通过一轮连接循环，可使部分oligo之间进行连接从未形成较长的序列，然后再进行一轮PCR反应，可以使oligo和组装的长片段之间进一步重组，既降低了组装成为全长基因序列的难度，也提高了重组的概率。

附图说明

图1为利用oligo进行shuffling文库构建的流程示意图；

图2为重组文库全长片段重组情况分析，其中，横轴表示基因的长度，纵轴表示和亲本序列比对上的序列。

具体实施方式：

下面为红色荧光蛋白(red fluorescent protein,RFP)重组文库的从头合成为例例对本发明的技术方案进行具体进行说明，需要说明的是，实施例仅仅对本发明的优选实例进行描述，并非对本发明的构思和范围进行限定。在不脱离本发明设计思路的前提下，本领域中专业技术人员对本发明所做的改变与替换，均属于本发明的保护范围。

此外，所用试剂均是市场购买的试剂级以上试剂。微晶纤维素Avicel PH105(20m)购自FMC Co(Philadelphia,PA)。大肠杆菌(Escherichia coli)XL10 gold作为DNA操作时使用的宿主菌，包含100g/mL氨苄青霉素的Luria-Bertani(LB)培养基用作培养E.coli。大肠杆菌BL21(DE3)用于表达重组蛋白质，包含4mmol/L异丙基-β-D-硫代半乳糖苷(IPTG)的ddH2O喷雾作为诱导表达。引物由生工生物工程(上海)股份有限公司合成。芯片合成的Oligo pool通过联川生物公司提供。

寡核苷酸文库错误纠正使用的MICC的制备方法参考文献(Wan,W.,et al.(2014)."Error removal in microchip-synthesized DNA using immobilized MutS."Nucleic Acids Research 42(12).)进行制备。

RFP文库制备所用引物如下：

序列1：MlyI-1F CACAGGAGTCCTCAC(SEQ ID No.1)

序列2：MlyI-1F CCAAGGAGTCGCTAG(SEQ ID No.2)

序列3：RFP-NheI-F GTCAAAGTCAGTCGCTAGC(SEQ ID No.3)

序列4：RFP-XhoI-R GTCACTGAGATCACTCGAG(SEQ ID No.4)

序列5-25：如SEQ ID No.5-25所示。

实施例1：RFP oligo pool的设计、合成及扩增

1.RFP oligo pool的设计

先将选择的21条RFP亲本序列，根据大肠杆菌密码子使用频率进行密码子优化，并将序列中含有的限制性内切酶酶切位点去除形成优化后的REP基因全长序列(SEQ IDNo.5-25)。然后将这些序列的两段分别添加一对引物序列，便于后续全长序列的扩增。然后将这些序列进行序列比对，比对后的序列在其同源区的末端如图1所示进行交错切割成为多条oligos。分别向这些oligo的两段添加一对通用引物，这对引物含有一个IIS型限制性内切酶Mly I位点，可以在后续组装反应之前通过酶切去除。这些寡核苷酸可以通过基于连接的重组方法(LCR)，通过基于PCR的组装方法(PCA)，或者通过两者的组合方法(LCR-PCA)组装成目标全长基因序列。

2.RFP oligo pool合成和扩增

RFP oligo pool的合成由杭州联川生物公司采用微流体技术在芯片上合成后提供。

利用芯片合成的RFP oligo pool可以直接作为oligo pool扩增的模板，而不需要额外的纯化。以芯片上切割下来的oligo pool做为模板，采用KOD plus DNA聚合酶(TOYOBO，Osaka,Japan)PCR扩增获得RFP oligo pool。PCR产物使用oligo纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒，生工生物工程(上海)股份有限公司纯化回收。

RFP oligo pool的PCR体系：

PCR程序

3.RFP oligo pool的重新退火杂交(Re-hybridization)

通过重新变性退火的杂交过程，可以将合成错误的碱基展示为错配碱基。该发明中将制备的RFP oligo pool使用杂交缓冲液[10mM Tris-Cl(pH 7.6),50mM NaCl and 1mMEDTA]稀释至50ng/μl的浓度。然后在PCR仪中通过下述程序进行重新变性退火。

RFP oligo pool的变性退火体系：

10x变性退火缓冲液 5μl

Oligo pool 2.5μg

ddH₂O 至50μl

变性退火程序：

实施例2：RFP oligo pool合成错误的纠正效率分析

该实施案例中，通过使用MICC对实施例1所述的的RFP oligo pool进行一轮纠错处理。该纠错处理后的样本，作为模板，重新PCR扩增出ED-oligo pool，然后将这个oligopool通过LCR-PCA的方法组装成为全长重组文库序列。最后将这些组装的全长基因克隆到pMD18-T载体(宝生物工程(大连)有限公司生物)。进行测序，使用DNA分析软件Bioedit将测序结果与亲本基因全长进行比对分析。

具体的实施步骤为：

1.MICC处理重新杂交的RFP oligo pool：

1)上样。取60μl变性退火的RFP oligo pool，加入180μl结合缓冲液混合，DNA的终浓度为12.5ng/μl。再将稀释后的变性退火的RFP oligo pool上样到MICC上。

2)洗脱。上柱的oligo样品在重力的作用下，缓慢流入固定化有MutS的纤维素凝胶，在该过程中含有合成错误的oligo被MutS结合而滞留在柱子中，而合成正确的oligo穿过柱子而被收集起来。收集的含有ED-oligo pool的滤液可以作为模板，通过PCR扩增获得大量ED-oligo pool。

3)PCR扩增ED-oligo pool。以获得的含有ED-oligo pool的滤液为模板，采用KODplus DNA聚合酶(TOYOBO,Osaka,Japan)PCR扩增获得ED-oligo pool。PCR产物使用PCR纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒，生工生物工程(上海)股份有限公司，中国)，按照使用说明书纯化。

ED-oligo pool的PCR体系：

PCR程序

2.组装前引物序列的去除

在oligo pool组装前，需要通过酶切去除其两端的通用引物。PCR扩增获得的ED-oligo pool通过Mly I(Fermentas)限制性内切酶切割。切割产物使用oligo纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒，生工生物工程(上海)股份有限公司，中国纯化。由于切割下来的prime序列较短15bp，在纯化的过程中别去除。

引物去除的酶切体系：

10x酶切缓冲液 5μl

ED-oligo pool 5μg

ddH₂O 至50μl

酶切条件：

步骤1：37℃ 5小时

步骤2：4℃ 保持

3.ED-oligo pool的组装

引物序列去除的ED-oligo pool通过LCR-PCA组装成重组全长文库。LCR-PCA反应包括两步。先使用Taq DNA连接酶(NEB,中国南京)体系进行一轮连接循环。然后，以组装循环产物为模板，不添加引物序列，使组装片段之间互为引物和模板，使用KOD plus DNA聚合酶(TOYOBO,Osaka,Japan)PCR延伸循环进一步进行组装。

LCR组装：

LCR组装反应体系：

10X连接缓冲液 4μl

ED-oligo pool 2μg

ddH₂O 至40μl

LCR程序

使用PCR纯化试剂盒(Axygen，中国上海)纯化上述LCR组装产物，以40μl ddH2O洗脱。以纯化的LCR产物进行下述PCA反应。

PCA反应体系：

PCA程序：

4.RFP重组文库全长序列的扩增

以上述组装产物为模板，使用全长扩增通用引物(序列3，4)为引物，使用使用KODplus DNA聚合酶(TOYOBO,Osaka,Japan)PCR扩增全长重组文库序列。PCR产物使用1％agarose gel电泳分析，切割目标片段使用凝胶回收试剂盒(Axygen，中国上海)按照产品说明书回收。

ED-oligo pool的PCR体系：

PCR程序

5.RFP重组文库全长序列的测序分析

通过向上述扩增获得的RFP重组文库全长序列“RFP-lib-NX”进行末端加‘A’，然后使用TA克隆试剂盒(TaKaRa)克隆入pMD18-t载体中，再随机挑选克隆送样测序。DNA测序所获得的序列通过使用Bioedit软件与亲本序列进行比对。比对结果可用于计算合成片段的突变率及重组率。

加A体系：

TA克隆连接体系：

测序分析结果如下表1所示，可以看出，MICC能够显著的提高合成基因片段的保真度，降低其错误率。经过MICC的处理，错误率由10.83/kb减低为2.40/kb。其次，使用该组装方法合成的基因片段的重组率很高，接近100％。如图2所示，分析的23条全长基因序列全部是由>3条亲本序列组装而来。

表1.MICC对于RFP oligo pool的纠错效率

实施例3、RFP重组文库的平板诱导表达，阳性可隆比率分析及阳性克隆测序分析

1.RFP重组文库表达文库的构建

将实施例2中制备的重组文库全长基因序列RFP-lib-NX与pET-21c载体分别利用Nhe I和Xho I进行双酶切，通过连接将RFP-lib-NX序列插入到pET-21c载体中，获得质粒pTaqMutS。具体操作如下：

将扩增产物RFP-lib-NX基因序列与pET-21c载体分别利用Nhe I和Xho I进行双酶切，连接，从而构建质粒文库“pet-RFP lib”。

RFP-lib-NX基因序列的酶切体系：

pET-21c载体的酶切体系：

RFP-lib-NX基因序列和pET-21c载体的连接体系：

将获得的连接产物使用使用PCR纯化试剂盒(Axygen，中国上海)按照产品说明书回收，使用20μl ddH2O洗脱。纯化的连接体系通过电转化的方法(ref)转化进入BL21(DE3)细胞中。

2.RFP重组文库的诱导表达及平板上

将上述制备的RFP文库克隆涂布在含有100μg/ml氨苄抗生素的LB平板上，调整适合的菌体浓度，使每块平板上(150mm)的克隆数约为3000左右。37℃培养约10小时。向平板上喷4mM IPTG喷雾诱导蛋白表达，正置，待液体吸收后，37℃倒置培养4小时后取出，4℃放置一周后，计数有颜色的克隆的数目占总可隆数目的比率。实验结果显示，含有功能表达的荧光突变体的克隆的比率为6.03％(筛选的32560个克隆中有1965显示有荧光)。

3.RFP文库阳性克隆测序分析

随机选择含有荧光的克隆，Sanger测序。DNA测序所获得的序列通过使用Bioedit软件与亲本序列进行比对。比对结果可用于计算合成片段的突变率及重组率。

序列表

<110> 江苏师范大学

<120> 利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法

<160> 25

<170> SIPOSequenceListing 1.0

<210> 1

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

cacaggagtc ctcac 15

<210> 2

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ccaaggagtc gctag 15

<210> 3

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gtcaaagtca gtcgctagc 19

<210> 4

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gtcactgaga tcactcgag 19

<210> 5

<211> 693

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atggcgagcc tggtgaccga agatatgtgt attaaaatga ccatggaagg caccgtgaac 60

ggccatcatt ttaaatgtgt gggcgaaggc gaaggcaaac cgtttgaagg cacccaggtg 120

gaaaagattc gcattaccga aggcggcccg ctgccgtttg cgtatgatat tctggcgccg 180

tgttgtatgt atggcagcaa aacctttatt aaacatgtga gcggcattcc ggattatttt 240

aaagaaagtt ttccggaagg ctttacctgg gaacgcaccc agattttcga agatggcggc 300

agcctgacca ttcatcagga taccagcctt cagggcaaca actttatttt caaagtgaac 360

gtgattggcg cgaactttcc ggcgaacggc ccggtgatgc agaagaaaac agcgggctgg 420

gaaccgagcg tggaaattct gtatccgcgc gatggcgtgc tgtgtggcca ggcgctgatg 480

gcgctgaaat gtaccgatgg caaccatctg accagccatc tgcgcaccac ctatcgcagc 540

cgcaaaccga gcaacgcggt gaacatgccg gaatttcatt ttggcgatca tcgcattgaa 600

attctgaaag cggaacaggg caaattttat gaacagtatg aaagcgcggt ggcgcgctat 660

tgtgaagcgg cgccgagcaa actgggccat cat 693

<210> 6

<211> 678

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaaca gcatatggaa 60

ggcagcgtga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120

ggcacccaga ccgcgcgcct gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180

attctgagcc cgcagattat gtatggcagc aaagcgtatg tgaaacatcc ggcggatatt 240

ccggattatc tgaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300

gaagatggcg gcgtggtgac cgtgacccag gatagcagcc ttcaggatgg cgaatttatt 360

tataaagtga aagtgcgcgg caccaacttt ccgagcgatg gcccggtgat gcagaagaaa 420

accatgggct gggaagcgag cagcgaacgc atgtatccgg aagatggcgc gctgaaaggc 480

gaaatgaaaa tgcgcctgcg cctgaaagat ggcggccatt atgatgcgga agtgaaaaca 540

acctatatgg cgaagaaacc ggtgcagctg ccgggcgcgt ataaaaccga tattaaactg 600

gatattacca gccataacga agattatacc attgtggaac agtatgaacg cgcggaaggc 660

cgccatagca ccggcgcg 678

<210> 7

<211> 693

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atgagcgtgc tgattaccga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60

gatcatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120

atgaaaatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180

agctttatgt atggcagcaa aacctttatt aaccataccc agggcattcc ggatttcttt 240

aaacagagct ttccggaagg ctttacctgg gaacgcatta ccacctatga agatggcggc 300

gtgctgaccg cgacccagga taccagcctt cagaacggct gtctgattta taacgtgaaa 360

attaacggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420

gaagcgagca ccgaaatgct gtatccggcg gatagcggcc tgcgcggcca tagccagatg 480

gcgctgaaac tggtgggcgg cggctatctg cattgtagcc tgaaaaccac ctatcgcagc 540

aagaaaccgg cgaagaacct gaaaatgccg ggcttttatt ttgtggatcg ccgcctggaa 600

cgcattaaag aagcggataa agaaacctat gtggaacagc atgaaatggc ggtggcgcgc 660

tattgtgatc tgccgagcaa actgggccat agc 693

<210> 8

<211> 699

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

atgagcgaac tgattaccga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60

aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120

atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180

agctttatgt atggcagcaa aacctttatt aaccataccc agggcattcc ggatttcttt 240

aaacagagct ttccggaagg ctttacctgg gaacgcgtga ccacctatga agatggcggc 300

gtgctgaccg cgacccagga taccagcctt caggatggct gtctgattta taacgtgaaa 360

attcgcggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420

gaagcgagca ccgaaatgct gtatccggcg gatggcggcc tggaaggccg cagcgatatg 480

gcgctgaaac tggtgggcgg cggccatctg atttgtaacc tgaaaaccac ctatcgcagc 540

aagaaaccgg cgaagaacct gaaaatgccg ggcgtgtatt atgtggatcg ccgcctggaa 600

cgcattaaag aagcggataa agaaacctat gtggaacagc atgaagtggc ggtggcgcgc 660

tattgtgatc tgccgagcaa actgggccat aaactgaac 699

<210> 9

<211> 678

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaagt gcgcatggaa 60

ggcagcgtga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120

ggcacccaga ccgcgaaact gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180

attctgagcc cgcagtgtat gtatggcagc aaaggctatg tgaaacatcc ggcggatatt 240

ccggattatc tgaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300

gaagatggcg gcgtggtgac cgtgacccag gatagcagcc ttcaggatgg cgaatttatt 360

tataaagtga aactgcgcgg caccaacttt ccgagcgatg gcccggtgat gcagaagaaa 420

accatgggct gggaagcgag cagcgaacgc atgtatccgg aagatggcgc gctgaaaggc 480

gaaatgaaaa tgcgcctgaa actgaaagat ggcggccatt atgatgcgga agtgaaaaca 540

acctatatgg cgaagaaacc ggtgcagctg ccgggcgcgt ataaaaccga tattaaactg 600

gatattacca gccataacga agattatacc attgtggaac agtatgaacg cgcggaaggc 660

cgccatagca ccggcgcg 678

<210> 10

<211> 666

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60

ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120

gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180

cagcttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattatttt 240

aaactgagct ttccggaagg ctttaaatgg gaacgcagca tgaactttga agatggcggc 300

gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360

tttattggcg aaaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420

gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480

gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540

aagaaaccgg tgcagctgcc gggccgctat gaaattgata gcaaactgga tattaccagc 600

cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660

tttctg 666

<210> 11

<211> 681

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

atggcgggcc tgctgaaaga aagcatgcgc attaaaatgt atatggaagg caccgtgaac 60

ggccattatt ttaaatgtga aggcgaaggc gatggcaacc cgtttaccgg cacccagagc 120

atgcgcattc atgtgaccga aggcgcgccg ctgccgtttg cgtttgatat tctggcgccg 180

tgttgtgaat atggcagccg cacctttgtg catcatacag cggaaattcc ggatttgttt 240

aaacagagct ttccggaagg ctttacctgg gaacgcacca ccacctatga agatggcggc 300

attctgaccg cgcatcagga taccagcctg gaaggcaact gtctgattta taaagtgaaa 360

gtgctgggca ccaactttcc ggcggatggc ccggtgatga agaacaaaag cggcggctgg 420

gaaccgtgta ccgaagtggt gtatccggaa aacggcgtgc tgtgtggccg caacgtgatg 480

gcgctgaaag tgggcgatcg ccgcctgatt tgtcatctgt ataccagcta tcgcagcaag 540

aaagcggtgc gcgcgctgac catgccgggc tttcatttta ccgatattcg ccttcagatg 600

ccgcgcaaga agaaagatga atattttgaa ctgtatgaag cgagcgtggc gcgctatagc 660

gatctgccgg aaaaggcgaa c 681

<210> 12

<211> 666

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60

ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120

gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180

cagtttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattataag 240

aaactgagct ttccggaagg ctttaaatgg gaacgcacca tgaactttga agatggcggc 300

gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360

tttattggcg tgaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420

gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480

gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540

aagaaaccgg tgcagctgcc gggctattat tatgtggata gcaaactgga tattaccagc 600

cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660

tttctg 666

<210> 13

<211> 666

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60

ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120

gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180

cagtttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattataag 240

aaactgagct ttccggaagg ctttaaatgg gaacgcacca tgaactttga agatggcggc 300

gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360

tttattggca ccaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420

gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480

gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540

aagaaaccgg tgcagctgcc gggctattat tatattgata gcaaactgga tattaccagc 600

cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660

tttctg 666

<210> 14

<211> 693

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

atgaacagcc tgattaaaga aaacatgcgc atgatggtgg tgatggaagg cagcgtgaac 60

ggctatcagt ttaaatgtac cggcgaaggc gatggcaacc cgtatatggg cacccagacc 120

atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180

agctttatgt atggcagcaa aacctttatt aaacatacca aaggcattcc ggatttgttt 240

aaacagagct ttccggaagg ctttacctgg gaacgcgtga cccgctatga agatggcggc 300

gtgtttaccg tgatgcagga taccagcctg gaagatggct gtctggtgta tcatgcgaaa 360

gtgaccggcg tgaactttcc gagcaacggc gcggtgatgc agaagaaaac caaaggctgg 420

gaaccgaaca ccgaaatgct gtatccggcg gatggcggcc tgcgcggcta tagccagatg 480

gcgctgaacg tggatggcgg cggctatctg agttgtagct ttgaaaccac ctatcgcagc 540

aagaaaaccg tggaaaactt taaaatgccg ggctttcatt ttgtggatca tcgcctggaa 600

cgcctggaag aaagcgataa agaaatgttt gtggtgcagc atgaacatgc ggtggcgaaa 660

ttttgtgatc tgccgagcaa actgggccgc ctg 693

<210> 15

<211> 708

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

atggtgagca aaggcgaaga agataacatg gcgattatta aagaatttat gcgctttaaa 60

gtgcatatgg aaggcagcgt gaacggccat gaatttgaaa ttgaaggcga aggcgaaggc 120

cgcccgtatg aaggcaccca gaccgcgaaa ctgaaagtga ccaaaggcgg cccgctgccg 180

tttgcgtggg atattctgag cccgcagttt atgtatggca gcaaagcgta tgtgaaacat 240

ccggcggata ttccggatta tctgaaactg agctttccgg aaggctttaa atgggaacgc 300

gtgatgaact ttgaagatgg cggcgtggtg accgtgaccc aggatagcag ccttcaggat 360

ggcgaattta tttataaagt gaaactgcgc ggcaccaact ttccgagcga tggcccggtg 420

atgcagaaga aaaccatggg ctgggaagcg agcagcgaac gcatgtatcc ggaagatggc 480

gcgctgaaag gcgaaattaa acagcgcctg aaactgaaag atggcggcca ttatgatgcg 540

gaagtgaaaa ccacctataa agcgaagaaa ccggtgcagc tgccgggcgc gtataacgtg 600

aacattaaac tggatattac cagccataac gaagattata ccattgtgga acagtatgaa 660

cgcgcggaag gccgccatag caccggcggc atggatgaac tgtataaa 708

<210> 16

<211> 675

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60

agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120

acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180

ctgagcccgc agtttcagta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240

gattatctga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300

gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggcga atttatttat 360

aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420

atgggctggg aagcgagcac cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480

attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaacaacc 540

tatatggcga agaaaccggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600

attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcgc ggaaggccgc 660

catagcaccg gcgcg 675

<210> 17

<211> 681

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgaa aatggaaggc 60

agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120

acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180

ctgagcccgc agtttcagta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240

gattatctga aactgagctt tccggaaggc tttaaatggg aacgcattat gaactttgaa 300

gatggcggcg tggtgaccgt gacccaggat agcacccttc aggatggcga atttatttat 360

aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420

atgggctggg aagcgagcac cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480

attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaaccacc 540

tataaagcga agaaacaggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600

attattagcc ataacgaaga ttataccatt gtggaacagt atgaacgcgc ggaaggccgc 660

catagcaccg gcgcgggcag c 681

<210> 18

<211> 708

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

atggtgagca aaggcgaaga aaacaacatg gcgattatta aagaatttat gcgctttaaa 60

gtgcgcatgg aaggcagcgt gaacggccat gaatttgaaa ttgaaggcga aggcgaaggc 120

cgcccgtatg aaggcaccca gaccgcgaaa ctgaaagtga ccaaaggcgg cccgctgccg 180

tttgcgtggg atattctgac cccgaacttt acctatggca gcaaagcgta tgtgaaacat 240

ccggcggata ttccggatta tctgaaactg agctttccgg aaggctttaa atgggaacgc 300

gtgatgaact ttgaagatgg cggcgtggtg accgtgaccc aggatagcag ccttcaggat 360

ggcgaattta tttataaagt gaaactgcgc ggcaccaact ttccgagcga tggcccggtg 420

atgcagaaga aaaccatggg ctgggaagcg agcagcgaac gcatgtatcc ggaagatggc 480

gcgctgaaag gcgaaattaa aatgcgcctg aaactgaaag atggcggcca ttatgatgcg 540

gaagtgaaaa ccacctataa agcgaagaaa ccggtgcagc tgccgggcgc gtatattgtg 600

ggcattaaac tggatattac cagccataac gaagattata ccattgtgga actgtatgaa 660

cgcgcggaag gccgccatag caccggcggc atggatgaac tgtataaa 708

<210> 19

<211> 675

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60

agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120

acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180

ctgagcccgc agttttgtta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240

gattatctga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300

gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggcga atttatttat 360

aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420

atgggctggg aagcgagcag cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480

attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaacaacc 540

tatatggcga agaaaccggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600

attaccagcc ataacgaaga ttataccatt gtggaactgt atgaacgcgc ggaaggccgc 660

catagcaccg gcgcg 675

<210> 20

<211> 693

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

atgagcgaac tgattaaaga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60

aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120

atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180

agctttatgt atggcagccg cacctttatt aaccataccc agggcattcc ggatttgttt 240

aaacagagct ttccggaagg ctttacctgg gaacgcgtga ccacctatga agatggcggc 300

gtgctgaccg cgacccagga taccagcctt caggatggct gtctgattta taacgtgaaa 360

attcgcggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420

gaagcgaaca ccgaaatgct gtatccggcg gatggcggcc tggaaggccg cagcgatatg 480

gcgctgaaac tggtgggcgg cggccatctg atttgtaact ttaaaaccac ctatcgcagc 540

aagaaaccgg cgaagaacct gaaaatgccg ggcgtgtatt atgtggatca tcgcctggaa 600

cgcattaaag aagcggataa agaaacctat gtggaacagc atgaagtggc ggtggcgcgc 660

tattgtgatc tgccgagcaa actgggccat aaa 693

<210> 21

<211> 714

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

atgaaactgg cgagcagcga aaacgtgatt accgaattta tgcgctttaa agtgcgcatg 60

gaaggcaccg tgaacggcca tgaatttgaa attgaaggcg aaggcgaagg ccgcccgtat 120

gaaggccata acaccgtgaa actgaaagtg accaaaggcg gcccgctgcc gtttgcgtgg 180

gatattctga gcccgcagtt tcagtatggc agcaaagtgt atgtgaaaca tccggcggat 240

attccggatt ataagaaact gagctttccg gaaggcttta aatgggaacg cgtgatgaac 300

tttgaagatg gcggcgtggc gaccgtgacc caggatagca gccttcagga tggctgtttt 360

atttataaag tgaaatttat tggcgtgaac tttccgagcg atggcccggt gatgcagaag 420

aaaaccatgg gctgggaagc gagcaccgaa cgcctgtatc cgcgcgatgg cgtgctgaaa 480

ggcgaaaccc ataaagcgct gaaactgaaa gatggcggcc attatctggt ggaatttaaa 540

agcatttata tggcgaagaa accggtgcag ctgccgggct attattatgt ggatgcgaaa 600

ctggatatta ccagccataa cgaagattat accattgtgg aacagtatga acgcaccgaa 660

ggccgccatc atctgtttct gcgcagccgc gcgccgccgc cgccgccgct gacc 714

<210> 22

<211> 675

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

atgcgcagca gcaagaacgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60

accgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120

cataacaccg tgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180

ctgagcccgc agtttcagta tggcagcaaa gtgtatgtga aacatccggc ggatattccg 240

gattataaga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300

gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggctg ttttatttat 360

aaagtgaaat ttattggcgt gaactttccg agcgatggcc cggtgatgca gaagaaaacc 420

atgggctggg aagcgagcac cgaacgcctg tatccgcgcg atggcgtgct gaaaggcgaa 480

attcataaag cgctgaaact gaaagatggc ggccattatc tggtggaatt taaaagcatt 540

tatatggcga agaaaccggt gcagctgccg ggctattatt atgtggatag caaactggat 600

attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcac cgaaggccgc 660

catcatctgt ttctg 675

<210> 23

<211> 675

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

atggcgagca gcgaaaacgt gattaccgaa tttatgcgct ttaaagtgcg catggaaggc 60

accgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120

cataacaccg tgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180

ctgagcccgc agtttcagta tggcagcaaa gtgtatgtga aacatccggc ggatattccg 240

gattataaga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300

gatggcggcg tggcgaccgt gacccaggat agcagccttc aggatggctg ttttatttat 360

aaagtgaaat ttattggcgt gaactttccg agcgatggcc cggtgatgca gaagaaaacc 420

atgggctggg aagcgagcac cgaacgcctg tatccgcgcg atggcgtgct gaaaggcgaa 480

acccataaag cgctgaaact gaaagatggc ggccattatc tggtggaatt taaaagcatt 540

tatatggcga agaaaccggt gcagctgccg ggctattatt atgtggatgc gaaactggat 600

attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcac cgaaggccgc 660

catcatctgt ttctg 675

<210> 24

<211> 702

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaagt gcgcatggaa 60

ggcagcatga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120

ggcacccaga ccgcgaaact gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180

attctgagcc cgcagtttat gtatggcagc aaagcgtatg tgaaacatcc ggcggatatt 240

ccggattata agaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300

gaagatggcg gcctggtgac cgtgacccag gatagcagcc ttcaggatgg caccctgatt 360

tataaagtga aaatgcgcgg caccaacttt ccgccggatg gcccggtgat gcagaagaaa 420

accatgggct gggaagcgag caccgaacgc ctgtatccgc gcgatggcgt gctgaaaggc 480

gaaattcatc aggcgctgaa actgaaagat ggcggccatt atctggtgga atttaaaaca 540

atttatatgg cgaagaaacc ggtgcagctg ccgggctatt attatgtgga taccaaactg 600

gatattacca gccataacga agattatacc attgtggaac agtatgaacg cagcgaaggc 660

cgccatcatc tgtttctgta tggcatggat gaactgtata aa 702

<210> 25

<211> 690

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

atgagcgaac tgattaaaga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60

aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120

atgaaaatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tgcgaccagc 180

tttatgtatg gcagcaaagc gtttattaac catacccagg gcattccgga tttgtttaaa 240

cagagctttc cggaaggctt tacctgggaa cgcattacca cctatgaaga tggcggcgtg 300

ctgaccgcga cccaggatac cagctttcag aacggctgta ttatttataa cgtgaaaatt 360

aacggcgtga actttccgag caacggcccg gtgatgcaga agaaaacacg cggctgggaa 420

gcgaacaccg aaatgctgta tccggcggat ggcggcctgc gcggccatag ccagatggcg 480

ctgaaactgg tgggcggcgg ctatctgcat tgtagcttta aaaccaccta tcgcagcaag 540

aaaccggcga agaacctgaa aatgccgggc tttcattttg tggatcatcg cctggaacgc 600

attaaagaag cggataaaga aacctatgtg gaacagcatg aaatggcggt ggcgaaatat 660

tgtgatctgc cgagcaaact gggccatcgc 690

Claims

1.利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法，其特征在于，包括

以下步骤：

S1：选择具有特定功能的蛋白基因序列，比对这些序列，寻找同源区域，在同源区域进行交错切割，将模板基因序列双链设计成具有同源末端的寡核苷酸片段oligo，实现将全长基因序列在互补区域末端交错切割成较短的寡核苷酸文库oligo pool，再使用DNA芯片合成该oligo pool。

2.根据权利要求1所述的利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法，其特征在于，所述步骤S3之后还包括步骤S4：组装反应后，以获得的组装产物为模板，通过PCR循环，进一步提高重组概率。

3.根据权利要求2所述的利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法，其特征在于，所述步骤S4之后还包括步骤S5：向反应体系中加入全长序列两段通用引物，进行PCR扩增获得大量重组的基因全长序列。

4.根据权利要求3所述的方法，其特征在于，所述蛋白为红色荧光蛋白，所述方法具体包括：