CN109868271A - 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法 - Google Patents

利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法 Download PDF

Info

Publication number
CN109868271A
CN109868271A CN201910215880.7A CN201910215880A CN109868271A CN 109868271 A CN109868271 A CN 109868271A CN 201910215880 A CN201910215880 A CN 201910215880A CN 109868271 A CN109868271 A CN 109868271A
Authority
CN
China
Prior art keywords
library
oligo
dna
sequence
pool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910215880.7A
Other languages
English (en)
Other versions
CN109868271B (zh
Inventor
宛雯
洪泂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Normal University
Original Assignee
Jiangsu Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Normal University filed Critical Jiangsu Normal University
Priority to CN201910215880.7A priority Critical patent/CN109868271B/zh
Publication of CN109868271A publication Critical patent/CN109868271A/zh
Application granted granted Critical
Publication of CN109868271B publication Critical patent/CN109868271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法,主要包括:结合比对软件进行亲本序列切割成寡核苷酸序列;利用错配结合蛋白MutS固定化纤维素柱进行寡核苷酸文库的高通量纠错;使用切割后的寡核苷酸进行全长重组文库组装。本发明的方法与现有的方法相比,重组率高,降低了组装成为全长基因序列的难度,并降低了合成成本,提高了序列的多样性,oligo pool的准确性,合成基因文库的保真性和重组的概率。

Description

利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的 方法
技术领域
本发明涉及DNA重组文库的构建方法,具体涉及一种利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法。
背景技术
DNA洗牌(DNA shuffling)技术是一种重要的体外分子定向进化方法,该方法可以用于生成大量重组突变体,这些突变体结合了多个个体的有效突变。DNA shuffling方法通过将一些功能相关的基因片段,随机片段化成为一个兼并片段文库,这些片段文库中的DNA通过相互之间的同源区域互为引物和模板通过重组反应,在组装的过程中,来源于不同亲本序列之间的片段相互组装成为全长突变体基因文库。DNA shuffling的优势在于,当对一个基因家族进行重组时,通过体外重组同源亲本基因,以创建一个不同的后代基因库。可以允许以一个可控的比率重组来自多个物种的两个或多个同源基因,从而将自然重组和突变产生更大的多样库。
目前,基于传统的DNA shufflling方法,已经发展出了很多改进了的DNAshuffling方法。如:体外外显子洗牌(In vitro exon shuffling)、基于瞬时模板的随机嵌合方法(Random chimeragenesis on transient templates,RACHITT)、交错延伸技术(Staggered extension process,StEP))、基于增长截短的杂合酶构建方法(Incrementaltruncation for the creation of hybrid enzymes,ITCHY)等。而随着从头DNA合成技术的进步和单链DNA合成成本的不断降低,也报道了一些,利用从头合成寡核苷酸进行突变文库构建的方法。如合成洗牌策略(The synthetic shuffling strategy,SS)、兼并同源双链重组(Degenerate homoduplex recombination,DHR)和设计寡核苷酸的组装(Assembly ofdesigned oligonucleotides,ADO)等。然而使用芯片合成的寡核苷酸文库,进行基因突变文库的从头设计和合成还没有报道。
利用芯片合成的寡核苷酸文库进行DNA shuffling,具有很多的优势。如:(1)由于可以通过化学方法直接合成重组所需要的DNA片段,而不需要原始亲本DNA片段。所以可以选择任意已知的DNA序列进行组装,而不受到DNA序列来源的限制,甚至可以选择一些自然界中不存在的DNA片段进行组装。(2)在合成寡核苷酸之初,就可以随机突变一些重要的位点,增加有义突变,提高突变文库的效率。(3)由于通过设计在同源区末端进行交错切割,使得来源于不同亲本的DNA具有相似的同源末端,可以有效的提高重组效率,可以实现同源性相对较低的序列的有效组装。(4)使用直接合成的寡核苷酸进行组装,组装系统稳定、组装条件易于优化,相对于传统DNA shuffling方法组装效率高。(5)由于高效的组装效率,可以同时选择更多的亲本序列进行shuffling反应,获得更多更优的突变性状。
发明内容
本发明的目的在于提供一种利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法。
为实现上述目的,本发明的技术方案具体如下:
利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法,包括以下步骤:
S1:选择具有特定功能的蛋白基因序列,比对这些序列,寻找同源区域,在同源区域进行交错切割,将模板基因序列双链设计成具有同源末端的寡核苷酸片段oligo,实现将全长基因序列在互补区域末端交错切割成较短的寡核苷酸文库oligo pool,再使用DNA芯片合成该oligo pool;
S2:使用固定化有错配识别蛋白MutS的纤维素凝胶柱进行oligo pool的错误移除;
S3:将错误移除的oligo文库通过基于连接酶的组装方法组装成为全长重组文库。
进一步的,所述步骤S3之后还包括步骤S4:组装反应后,以获得的组装产物为模板,通过PCR循环,进一步提高重组概率。
进一步的,所述步骤S4之后还包括步骤S5:向反应体系中加入全长序列两段通用引物,进行PCR扩增获得大量重组的基因全长序列。
进一步的,所述蛋白为红色荧光蛋白,所述方法具体包括:
使用比对软件Bioedit对选择的21条红色荧光蛋白模板序列进行比对,根据比对结果,按照互补区域交错切割的要求设计oligo pool;向所有设计的oligo序列两端分别加入一对引物序列,该对引物含有一个Mly I限制性内切酶酶切位点,可以通过酶切去除;以第一项合成的oligo pool为模板,以oligo两端通用引物为引物,PCR反应扩增获得大量oligo,然后通过重新变性退火将合成错误的碱基展示为错配;
将重新变性退火的oligo pool上样到MICC柱子上,DNA样本在重力的作用下穿过柱体;在该过程中含有合成错误碱基的oligo被固定化在柱子中的MutS结合而滞留在柱子上,而合成正确的oligo流过柱子被收集下来;以收集的含有错误移除oligo pool的滤液为模板,通过PCR扩增获得大量的ED-oligo pool;
将ED-oligo pool通过Mly I酶切去除其两端的通用引物序列,使用UNIQ-10oligo回收试剂盒回收引物去除的oligo pool;
将EP-oligo pool通过基于连接和PCR的组装方法方法组装成为重组全长文库,然后以组装产物为模板,使用全长通用引物为引物,PCR扩增获得大量重组文库序列。
与现有技术相比,本发明的有益效果:
本发明的方法使用计算机软件进行辅助设计,通过在亲本序列的同源区进行切割,进行亲本序列的片段化;与传统的使用DNAse酶切的方法亲本序列的片段化相比较有多个优点:
(1)提高重组率,使用计算机辅助设计,通过序列比对,在同源区进行切割,使切割后的来源于不同序列的oligo具有相似的同源末端,较DNAse额随机切割相比较,不同序列之间更加容易组装,提高了序列的重组率;
(2)组装难度降低,由于在同源区进行切割时来源于不同亲本序列的oligo之间具有相似的末端序列。较DNAse的随机切割相比较,更容易进行全长序列的组装;
(3)由于组装难度的降低使得可以选择更多的序列作为亲本序列,提高了序列的多样性;
本发明的方法使用DNA微芯片合成技术合成设计的oligo pool,降低了oligopool的合成成本;
使用MICC对整个oligo pool进行错误纠正,可以提高oligo pool的准确性,提高了合成基因文库的保真性;
本发明的方法使用LCR-PCA的组装方法进行oligo pool的组装,与传统的基于PCR的组装反应相比较,先通过一轮连接循环,可使部分oligo之间进行连接从未形成较长的序列,然后再进行一轮PCR反应,可以使oligo和组装的长片段之间进一步重组,既降低了组装成为全长基因序列的难度,也提高了重组的概率。
附图说明
图1为利用oligo进行shuffling文库构建的流程示意图;
图2为重组文库全长片段重组情况分析,其中,横轴表示基因的长度,纵轴表示和亲本序列比对上的序列。
具体实施方式:
下面为红色荧光蛋白(red fluorescent protein,RFP)重组文库的从头合成为例例对本发明的技术方案进行具体进行说明,需要说明的是,实施例仅仅对本发明的优选实例进行描述,并非对本发明的构思和范围进行限定。在不脱离本发明设计思路的前提下,本领域中专业技术人员对本发明所做的改变与替换,均属于本发明的保护范围。
此外,所用试剂均是市场购买的试剂级以上试剂。微晶纤维素Avicel PH105(20m)购自FMC Co(Philadelphia,PA)。大肠杆菌(Escherichia coli)XL10 gold作为DNA操作时使用的宿主菌,包含100g/mL氨苄青霉素的Luria-Bertani(LB)培养基用作培养E.coli。大肠杆菌BL21(DE3)用于表达重组蛋白质,包含4mmol/L异丙基-β-D-硫代半乳糖苷(IPTG)的ddH2O喷雾作为诱导表达。引物由生工生物工程(上海)股份有限公司合成。芯片合成的Oligo pool通过联川生物公司提供。
寡核苷酸文库错误纠正使用的MICC的制备方法参考文献(Wan,W.,et al.(2014)."Error removal in microchip-synthesized DNA using immobilized MutS."Nucleic Acids Research 42(12).)进行制备。
RFP文库制备所用引物如下:
序列1:MlyI-1F CACAGGAGTCCTCAC(SEQ ID No.1)
序列2:MlyI-1F CCAAGGAGTCGCTAG(SEQ ID No.2)
序列3:RFP-NheI-F GTCAAAGTCAGTCGCTAGC(SEQ ID No.3)
序列4:RFP-XhoI-R GTCACTGAGATCACTCGAG(SEQ ID No.4)
序列5-25:如SEQ ID No.5-25所示。
实施例1:RFP oligo pool的设计、合成及扩增
1.RFP oligo pool的设计
先将选择的21条RFP亲本序列,根据大肠杆菌密码子使用频率进行密码子优化,并将序列中含有的限制性内切酶酶切位点去除形成优化后的REP基因全长序列(SEQ IDNo.5-25)。然后将这些序列的两段分别添加一对引物序列,便于后续全长序列的扩增。然后将这些序列进行序列比对,比对后的序列在其同源区的末端如图1所示进行交错切割成为多条oligos。分别向这些oligo的两段添加一对通用引物,这对引物含有一个IIS型限制性内切酶Mly I位点,可以在后续组装反应之前通过酶切去除。这些寡核苷酸可以通过基于连接的重组方法(LCR),通过基于PCR的组装方法(PCA),或者通过两者的组合方法(LCR-PCA)组装成目标全长基因序列。
2.RFP oligo pool合成和扩增
RFP oligo pool的合成由杭州联川生物公司采用微流体技术在芯片上合成后提供。
利用芯片合成的RFP oligo pool可以直接作为oligo pool扩增的模板,而不需要额外的纯化。以芯片上切割下来的oligo pool做为模板,采用KOD plus DNA聚合酶(TOYOBO,Osaka,Japan)PCR扩增获得RFP oligo pool。PCR产物使用oligo纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒,生工生物工程(上海)股份有限公司纯化回收。
RFP oligo pool的PCR体系:
PCR程序
3.RFP oligo pool的重新退火杂交(Re-hybridization)
通过重新变性退火的杂交过程,可以将合成错误的碱基展示为错配碱基。该发明中将制备的RFP oligo pool使用杂交缓冲液[10mM Tris-Cl(pH 7.6),50mM NaCl and 1mMEDTA]稀释至50ng/μl的浓度。然后在PCR仪中通过下述程序进行重新变性退火。
RFP oligo pool的变性退火体系:
10x变性退火缓冲液 5μl
Oligo pool 2.5μg
ddH2O 至50μl
变性退火程序:
实施例2:RFP oligo pool合成错误的纠正效率分析
该实施案例中,通过使用MICC对实施例1所述的的RFP oligo pool进行一轮纠错处理。该纠错处理后的样本,作为模板,重新PCR扩增出ED-oligo pool,然后将这个oligopool通过LCR-PCA的方法组装成为全长重组文库序列。最后将这些组装的全长基因克隆到pMD18-T载体(宝生物工程(大连)有限公司生物)。进行测序,使用DNA分析软件Bioedit将测序结果与亲本基因全长进行比对分析。
具体的实施步骤为:
1.MICC处理重新杂交的RFP oligo pool:
1)上样。取60μl变性退火的RFP oligo pool,加入180μl结合缓冲液混合,DNA的终浓度为12.5ng/μl。再将稀释后的变性退火的RFP oligo pool上样到MICC上。
2)洗脱。上柱的oligo样品在重力的作用下,缓慢流入固定化有MutS的纤维素凝胶,在该过程中含有合成错误的oligo被MutS结合而滞留在柱子中,而合成正确的oligo穿过柱子而被收集起来。收集的含有ED-oligo pool的滤液可以作为模板,通过PCR扩增获得大量ED-oligo pool。
3)PCR扩增ED-oligo pool。以获得的含有ED-oligo pool的滤液为模板,采用KODplus DNA聚合酶(TOYOBO,Osaka,Japan)PCR扩增获得ED-oligo pool。PCR产物使用PCR纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒,生工生物工程(上海)股份有限公司,中国),按照使用说明书纯化。
ED-oligo pool的PCR体系:
PCR程序
2.组装前引物序列的去除
在oligo pool组装前,需要通过酶切去除其两端的通用引物。PCR扩增获得的ED-oligo pool通过Mly I(Fermentas)限制性内切酶切割。切割产物使用oligo纯化试剂盒(UNIQ-10寡核苷酸回收试剂盒,生工生物工程(上海)股份有限公司,中国纯化。由于切割下来的prime序列较短15bp,在纯化的过程中别去除。
引物去除的酶切体系:
10x酶切缓冲液 5μl
ED-oligo pool 5μg
ddH2O 至50μl
酶切条件:
步骤1:37℃ 5小时
步骤2:4℃ 保持
3.ED-oligo pool的组装
引物序列去除的ED-oligo pool通过LCR-PCA组装成重组全长文库。LCR-PCA反应包括两步。先使用Taq DNA连接酶(NEB,中国南京)体系进行一轮连接循环。然后,以组装循环产物为模板,不添加引物序列,使组装片段之间互为引物和模板,使用KOD plus DNA聚合酶(TOYOBO,Osaka,Japan)PCR延伸循环进一步进行组装。
LCR组装:
LCR组装反应体系:
10X连接缓冲液 4μl
ED-oligo pool 2μg
ddH2O 至40μl
LCR程序
使用PCR纯化试剂盒(Axygen,中国上海)纯化上述LCR组装产物,以40μl ddH2O洗脱。以纯化的LCR产物进行下述PCA反应。
PCA反应体系:
PCA程序:
4.RFP重组文库全长序列的扩增
以上述组装产物为模板,使用全长扩增通用引物(序列3,4)为引物,使用使用KODplus DNA聚合酶(TOYOBO,Osaka,Japan)PCR扩增全长重组文库序列。PCR产物使用1%agarose gel电泳分析,切割目标片段使用凝胶回收试剂盒(Axygen,中国上海)按照产品说明书回收。
ED-oligo pool的PCR体系:
PCR程序
5.RFP重组文库全长序列的测序分析
通过向上述扩增获得的RFP重组文库全长序列“RFP-lib-NX”进行末端加‘A’,然后使用TA克隆试剂盒(TaKaRa)克隆入pMD18-t载体中,再随机挑选克隆送样测序。DNA测序所获得的序列通过使用Bioedit软件与亲本序列进行比对。比对结果可用于计算合成片段的突变率及重组率。
加A体系:
TA克隆连接体系:
测序分析结果如下表1所示,可以看出,MICC能够显著的提高合成基因片段的保真度,降低其错误率。经过MICC的处理,错误率由10.83/kb减低为2.40/kb。其次,使用该组装方法合成的基因片段的重组率很高,接近100%。如图2所示,分析的23条全长基因序列全部是由>3条亲本序列组装而来。
表1.MICC对于RFP oligo pool的纠错效率
实施例3、RFP重组文库的平板诱导表达,阳性可隆比率分析及阳性克隆测序分析
1.RFP重组文库表达文库的构建
将实施例2中制备的重组文库全长基因序列RFP-lib-NX与pET-21c载体分别利用Nhe I和Xho I进行双酶切,通过连接将RFP-lib-NX序列插入到pET-21c载体中,获得质粒pTaqMutS。具体操作如下:
将扩增产物RFP-lib-NX基因序列与pET-21c载体分别利用Nhe I和Xho I进行双酶切,连接,从而构建质粒文库“pet-RFP lib”。
RFP-lib-NX基因序列的酶切体系:
pET-21c载体的酶切体系:
RFP-lib-NX基因序列和pET-21c载体的连接体系:
将获得的连接产物使用使用PCR纯化试剂盒(Axygen,中国上海)按照产品说明书回收,使用20μl ddH2O洗脱。纯化的连接体系通过电转化的方法(ref)转化进入BL21(DE3)细胞中。
2.RFP重组文库的诱导表达及平板上
将上述制备的RFP文库克隆涂布在含有100μg/ml氨苄抗生素的LB平板上,调整适合的菌体浓度,使每块平板上(150mm)的克隆数约为3000左右。37℃培养约10小时。向平板上喷4mM IPTG喷雾诱导蛋白表达,正置,待液体吸收后,37℃倒置培养4小时后取出,4℃放置一周后,计数有颜色的克隆的数目占总可隆数目的比率。实验结果显示,含有功能表达的荧光突变体的克隆的比率为6.03%(筛选的32560个克隆中有1965显示有荧光)。
3.RFP文库阳性克隆测序分析
随机选择含有荧光的克隆,Sanger测序。DNA测序所获得的序列通过使用Bioedit软件与亲本序列进行比对。比对结果可用于计算合成片段的突变率及重组率。
序列表
<110> 江苏师范大学
<120> 利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法
<160> 25
<170> SIPOSequenceListing 1.0
<210> 1
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cacaggagtc ctcac 15
<210> 2
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ccaaggagtc gctag 15
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtcaaagtca gtcgctagc 19
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtcactgaga tcactcgag 19
<210> 5
<211> 693
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggcgagcc tggtgaccga agatatgtgt attaaaatga ccatggaagg caccgtgaac 60
ggccatcatt ttaaatgtgt gggcgaaggc gaaggcaaac cgtttgaagg cacccaggtg 120
gaaaagattc gcattaccga aggcggcccg ctgccgtttg cgtatgatat tctggcgccg 180
tgttgtatgt atggcagcaa aacctttatt aaacatgtga gcggcattcc ggattatttt 240
aaagaaagtt ttccggaagg ctttacctgg gaacgcaccc agattttcga agatggcggc 300
agcctgacca ttcatcagga taccagcctt cagggcaaca actttatttt caaagtgaac 360
gtgattggcg cgaactttcc ggcgaacggc ccggtgatgc agaagaaaac agcgggctgg 420
gaaccgagcg tggaaattct gtatccgcgc gatggcgtgc tgtgtggcca ggcgctgatg 480
gcgctgaaat gtaccgatgg caaccatctg accagccatc tgcgcaccac ctatcgcagc 540
cgcaaaccga gcaacgcggt gaacatgccg gaatttcatt ttggcgatca tcgcattgaa 600
attctgaaag cggaacaggg caaattttat gaacagtatg aaagcgcggt ggcgcgctat 660
tgtgaagcgg cgccgagcaa actgggccat cat 693
<210> 6
<211> 678
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaaca gcatatggaa 60
ggcagcgtga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120
ggcacccaga ccgcgcgcct gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180
attctgagcc cgcagattat gtatggcagc aaagcgtatg tgaaacatcc ggcggatatt 240
ccggattatc tgaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300
gaagatggcg gcgtggtgac cgtgacccag gatagcagcc ttcaggatgg cgaatttatt 360
tataaagtga aagtgcgcgg caccaacttt ccgagcgatg gcccggtgat gcagaagaaa 420
accatgggct gggaagcgag cagcgaacgc atgtatccgg aagatggcgc gctgaaaggc 480
gaaatgaaaa tgcgcctgcg cctgaaagat ggcggccatt atgatgcgga agtgaaaaca 540
acctatatgg cgaagaaacc ggtgcagctg ccgggcgcgt ataaaaccga tattaaactg 600
gatattacca gccataacga agattatacc attgtggaac agtatgaacg cgcggaaggc 660
cgccatagca ccggcgcg 678
<210> 7
<211> 693
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgagcgtgc tgattaccga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60
gatcatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120
atgaaaatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180
agctttatgt atggcagcaa aacctttatt aaccataccc agggcattcc ggatttcttt 240
aaacagagct ttccggaagg ctttacctgg gaacgcatta ccacctatga agatggcggc 300
gtgctgaccg cgacccagga taccagcctt cagaacggct gtctgattta taacgtgaaa 360
attaacggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420
gaagcgagca ccgaaatgct gtatccggcg gatagcggcc tgcgcggcca tagccagatg 480
gcgctgaaac tggtgggcgg cggctatctg cattgtagcc tgaaaaccac ctatcgcagc 540
aagaaaccgg cgaagaacct gaaaatgccg ggcttttatt ttgtggatcg ccgcctggaa 600
cgcattaaag aagcggataa agaaacctat gtggaacagc atgaaatggc ggtggcgcgc 660
tattgtgatc tgccgagcaa actgggccat agc 693
<210> 8
<211> 699
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
atgagcgaac tgattaccga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60
aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120
atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180
agctttatgt atggcagcaa aacctttatt aaccataccc agggcattcc ggatttcttt 240
aaacagagct ttccggaagg ctttacctgg gaacgcgtga ccacctatga agatggcggc 300
gtgctgaccg cgacccagga taccagcctt caggatggct gtctgattta taacgtgaaa 360
attcgcggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420
gaagcgagca ccgaaatgct gtatccggcg gatggcggcc tggaaggccg cagcgatatg 480
gcgctgaaac tggtgggcgg cggccatctg atttgtaacc tgaaaaccac ctatcgcagc 540
aagaaaccgg cgaagaacct gaaaatgccg ggcgtgtatt atgtggatcg ccgcctggaa 600
cgcattaaag aagcggataa agaaacctat gtggaacagc atgaagtggc ggtggcgcgc 660
tattgtgatc tgccgagcaa actgggccat aaactgaac 699
<210> 9
<211> 678
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaagt gcgcatggaa 60
ggcagcgtga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120
ggcacccaga ccgcgaaact gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180
attctgagcc cgcagtgtat gtatggcagc aaaggctatg tgaaacatcc ggcggatatt 240
ccggattatc tgaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300
gaagatggcg gcgtggtgac cgtgacccag gatagcagcc ttcaggatgg cgaatttatt 360
tataaagtga aactgcgcgg caccaacttt ccgagcgatg gcccggtgat gcagaagaaa 420
accatgggct gggaagcgag cagcgaacgc atgtatccgg aagatggcgc gctgaaaggc 480
gaaatgaaaa tgcgcctgaa actgaaagat ggcggccatt atgatgcgga agtgaaaaca 540
acctatatgg cgaagaaacc ggtgcagctg ccgggcgcgt ataaaaccga tattaaactg 600
gatattacca gccataacga agattatacc attgtggaac agtatgaacg cgcggaaggc 660
cgccatagca ccggcgcg 678
<210> 10
<211> 666
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60
ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120
gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180
cagcttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattatttt 240
aaactgagct ttccggaagg ctttaaatgg gaacgcagca tgaactttga agatggcggc 300
gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360
tttattggcg aaaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420
gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480
gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540
aagaaaccgg tgcagctgcc gggccgctat gaaattgata gcaaactgga tattaccagc 600
cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660
tttctg 666
<210> 11
<211> 681
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
atggcgggcc tgctgaaaga aagcatgcgc attaaaatgt atatggaagg caccgtgaac 60
ggccattatt ttaaatgtga aggcgaaggc gatggcaacc cgtttaccgg cacccagagc 120
atgcgcattc atgtgaccga aggcgcgccg ctgccgtttg cgtttgatat tctggcgccg 180
tgttgtgaat atggcagccg cacctttgtg catcatacag cggaaattcc ggatttgttt 240
aaacagagct ttccggaagg ctttacctgg gaacgcacca ccacctatga agatggcggc 300
attctgaccg cgcatcagga taccagcctg gaaggcaact gtctgattta taaagtgaaa 360
gtgctgggca ccaactttcc ggcggatggc ccggtgatga agaacaaaag cggcggctgg 420
gaaccgtgta ccgaagtggt gtatccggaa aacggcgtgc tgtgtggccg caacgtgatg 480
gcgctgaaag tgggcgatcg ccgcctgatt tgtcatctgt ataccagcta tcgcagcaag 540
aaagcggtgc gcgcgctgac catgccgggc tttcatttta ccgatattcg ccttcagatg 600
ccgcgcaaga agaaagatga atattttgaa ctgtatgaag cgagcgtggc gcgctatagc 660
gatctgccgg aaaaggcgaa c 681
<210> 12
<211> 666
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60
ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120
gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180
cagtttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattataag 240
aaactgagct ttccggaagg ctttaaatgg gaacgcacca tgaactttga agatggcggc 300
gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360
tttattggcg tgaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420
gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480
gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540
aagaaaccgg tgcagctgcc gggctattat tatgtggata gcaaactgga tattaccagc 600
cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660
tttctg 666
<210> 13
<211> 666
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atggtgaacg tgattaaaga atttatgcgc tttaaagtgc gcatggaagg caccgtgaac 60
ggccatgaat ttgaaattga aggcgaaggc gaaggccgcc cgtatgaagg ccataacacc 120
gtgaaactga aagtgaccaa aggcggcccg ctgccgtttg cgtgggatat tctgagcccg 180
cagtttcagt atggcagcaa agtgtatgtg aaacatccgg cggatattcc ggattataag 240
aaactgagct ttccggaagg ctttaaatgg gaacgcacca tgaactttga agatggcggc 300
gtggtgaccg tgacccagga tagcagcctt caggatggct gttttattta taaagtgaaa 360
tttattggca ccaactttcc gagcgatggc ccggtgatgc agaagaaaac catgggctgg 420
gaagcgagca ccgaacgcct gtatccgcgc gatggcgtgc tgaaaggcga agattataaa 480
gcgctgaaac tgaaagatgg cggccattat ctggtggaat ttaaaagcat ttatatggcg 540
aagaaaccgg tgcagctgcc gggctattat tatattgata gcaaactgga tattaccagc 600
cataaccgcg attataccag cgtggaacag tatgaacgcg cggaaggccg ccatcatctg 660
tttctg 666
<210> 14
<211> 693
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
atgaacagcc tgattaaaga aaacatgcgc atgatggtgg tgatggaagg cagcgtgaac 60
ggctatcagt ttaaatgtac cggcgaaggc gatggcaacc cgtatatggg cacccagacc 120
atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180
agctttatgt atggcagcaa aacctttatt aaacatacca aaggcattcc ggatttgttt 240
aaacagagct ttccggaagg ctttacctgg gaacgcgtga cccgctatga agatggcggc 300
gtgtttaccg tgatgcagga taccagcctg gaagatggct gtctggtgta tcatgcgaaa 360
gtgaccggcg tgaactttcc gagcaacggc gcggtgatgc agaagaaaac caaaggctgg 420
gaaccgaaca ccgaaatgct gtatccggcg gatggcggcc tgcgcggcta tagccagatg 480
gcgctgaacg tggatggcgg cggctatctg agttgtagct ttgaaaccac ctatcgcagc 540
aagaaaaccg tggaaaactt taaaatgccg ggctttcatt ttgtggatca tcgcctggaa 600
cgcctggaag aaagcgataa agaaatgttt gtggtgcagc atgaacatgc ggtggcgaaa 660
ttttgtgatc tgccgagcaa actgggccgc ctg 693
<210> 15
<211> 708
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
atggtgagca aaggcgaaga agataacatg gcgattatta aagaatttat gcgctttaaa 60
gtgcatatgg aaggcagcgt gaacggccat gaatttgaaa ttgaaggcga aggcgaaggc 120
cgcccgtatg aaggcaccca gaccgcgaaa ctgaaagtga ccaaaggcgg cccgctgccg 180
tttgcgtggg atattctgag cccgcagttt atgtatggca gcaaagcgta tgtgaaacat 240
ccggcggata ttccggatta tctgaaactg agctttccgg aaggctttaa atgggaacgc 300
gtgatgaact ttgaagatgg cggcgtggtg accgtgaccc aggatagcag ccttcaggat 360
ggcgaattta tttataaagt gaaactgcgc ggcaccaact ttccgagcga tggcccggtg 420
atgcagaaga aaaccatggg ctgggaagcg agcagcgaac gcatgtatcc ggaagatggc 480
gcgctgaaag gcgaaattaa acagcgcctg aaactgaaag atggcggcca ttatgatgcg 540
gaagtgaaaa ccacctataa agcgaagaaa ccggtgcagc tgccgggcgc gtataacgtg 600
aacattaaac tggatattac cagccataac gaagattata ccattgtgga acagtatgaa 660
cgcgcggaag gccgccatag caccggcggc atggatgaac tgtataaa 708
<210> 16
<211> 675
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60
agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120
acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180
ctgagcccgc agtttcagta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240
gattatctga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300
gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggcga atttatttat 360
aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420
atgggctggg aagcgagcac cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480
attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaacaacc 540
tatatggcga agaaaccggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600
attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcgc ggaaggccgc 660
catagcaccg gcgcg 675
<210> 17
<211> 681
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgaa aatggaaggc 60
agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120
acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180
ctgagcccgc agtttcagta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240
gattatctga aactgagctt tccggaaggc tttaaatggg aacgcattat gaactttgaa 300
gatggcggcg tggtgaccgt gacccaggat agcacccttc aggatggcga atttatttat 360
aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420
atgggctggg aagcgagcac cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480
attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaaccacc 540
tataaagcga agaaacaggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600
attattagcc ataacgaaga ttataccatt gtggaacagt atgaacgcgc ggaaggccgc 660
catagcaccg gcgcgggcag c 681
<210> 18
<211> 708
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atggtgagca aaggcgaaga aaacaacatg gcgattatta aagaatttat gcgctttaaa 60
gtgcgcatgg aaggcagcgt gaacggccat gaatttgaaa ttgaaggcga aggcgaaggc 120
cgcccgtatg aaggcaccca gaccgcgaaa ctgaaagtga ccaaaggcgg cccgctgccg 180
tttgcgtggg atattctgac cccgaacttt acctatggca gcaaagcgta tgtgaaacat 240
ccggcggata ttccggatta tctgaaactg agctttccgg aaggctttaa atgggaacgc 300
gtgatgaact ttgaagatgg cggcgtggtg accgtgaccc aggatagcag ccttcaggat 360
ggcgaattta tttataaagt gaaactgcgc ggcaccaact ttccgagcga tggcccggtg 420
atgcagaaga aaaccatggg ctgggaagcg agcagcgaac gcatgtatcc ggaagatggc 480
gcgctgaaag gcgaaattaa aatgcgcctg aaactgaaag atggcggcca ttatgatgcg 540
gaagtgaaaa ccacctataa agcgaagaaa ccggtgcagc tgccgggcgc gtatattgtg 600
ggcattaaac tggatattac cagccataac gaagattata ccattgtgga actgtatgaa 660
cgcgcggaag gccgccatag caccggcggc atggatgaac tgtataaa 708
<210> 19
<211> 675
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atggcgagca gcgaagatgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60
agcgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120
acccagaccg cgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180
ctgagcccgc agttttgtta tggcagcaaa gcgtatgtga aacatccggc ggatattccg 240
gattatctga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300
gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggcga atttatttat 360
aaagtgaaac tgcgcggcac caactttccg agcgatggcc cggtgatgca gaagaaaacc 420
atgggctggg aagcgagcag cgaacgcatg tatccggaag atggcgcgct gaaaggcgaa 480
attaaaatgc gcctgaaact gaaagatggc ggccattatg atgcggaagt gaaaacaacc 540
tatatggcga agaaaccggt gcagctgccg ggcgcgtata aaaccgatat taaactggat 600
attaccagcc ataacgaaga ttataccatt gtggaactgt atgaacgcgc ggaaggccgc 660
catagcaccg gcgcg 675
<210> 20
<211> 693
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
atgagcgaac tgattaaaga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60
aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120
atgcgcatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180
agctttatgt atggcagccg cacctttatt aaccataccc agggcattcc ggatttgttt 240
aaacagagct ttccggaagg ctttacctgg gaacgcgtga ccacctatga agatggcggc 300
gtgctgaccg cgacccagga taccagcctt caggatggct gtctgattta taacgtgaaa 360
attcgcggcg tgaactttcc gagcaacggc ccggtgatgc agaagaaaac cctgggctgg 420
gaagcgaaca ccgaaatgct gtatccggcg gatggcggcc tggaaggccg cagcgatatg 480
gcgctgaaac tggtgggcgg cggccatctg atttgtaact ttaaaaccac ctatcgcagc 540
aagaaaccgg cgaagaacct gaaaatgccg ggcgtgtatt atgtggatca tcgcctggaa 600
cgcattaaag aagcggataa agaaacctat gtggaacagc atgaagtggc ggtggcgcgc 660
tattgtgatc tgccgagcaa actgggccat aaa 693
<210> 21
<211> 714
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
atgaaactgg cgagcagcga aaacgtgatt accgaattta tgcgctttaa agtgcgcatg 60
gaaggcaccg tgaacggcca tgaatttgaa attgaaggcg aaggcgaagg ccgcccgtat 120
gaaggccata acaccgtgaa actgaaagtg accaaaggcg gcccgctgcc gtttgcgtgg 180
gatattctga gcccgcagtt tcagtatggc agcaaagtgt atgtgaaaca tccggcggat 240
attccggatt ataagaaact gagctttccg gaaggcttta aatgggaacg cgtgatgaac 300
tttgaagatg gcggcgtggc gaccgtgacc caggatagca gccttcagga tggctgtttt 360
atttataaag tgaaatttat tggcgtgaac tttccgagcg atggcccggt gatgcagaag 420
aaaaccatgg gctgggaagc gagcaccgaa cgcctgtatc cgcgcgatgg cgtgctgaaa 480
ggcgaaaccc ataaagcgct gaaactgaaa gatggcggcc attatctggt ggaatttaaa 540
agcatttata tggcgaagaa accggtgcag ctgccgggct attattatgt ggatgcgaaa 600
ctggatatta ccagccataa cgaagattat accattgtgg aacagtatga acgcaccgaa 660
ggccgccatc atctgtttct gcgcagccgc gcgccgccgc cgccgccgct gacc 714
<210> 22
<211> 675
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
atgcgcagca gcaagaacgt gattaaagaa tttatgcgct ttaaagtgcg catggaaggc 60
accgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120
cataacaccg tgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180
ctgagcccgc agtttcagta tggcagcaaa gtgtatgtga aacatccggc ggatattccg 240
gattataaga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300
gatggcggcg tggtgaccgt gacccaggat agcagccttc aggatggctg ttttatttat 360
aaagtgaaat ttattggcgt gaactttccg agcgatggcc cggtgatgca gaagaaaacc 420
atgggctggg aagcgagcac cgaacgcctg tatccgcgcg atggcgtgct gaaaggcgaa 480
attcataaag cgctgaaact gaaagatggc ggccattatc tggtggaatt taaaagcatt 540
tatatggcga agaaaccggt gcagctgccg ggctattatt atgtggatag caaactggat 600
attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcac cgaaggccgc 660
catcatctgt ttctg 675
<210> 23
<211> 675
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atggcgagca gcgaaaacgt gattaccgaa tttatgcgct ttaaagtgcg catggaaggc 60
accgtgaacg gccatgaatt tgaaattgaa ggcgaaggcg aaggccgccc gtatgaaggc 120
cataacaccg tgaaactgaa agtgaccaaa ggcggcccgc tgccgtttgc gtgggatatt 180
ctgagcccgc agtttcagta tggcagcaaa gtgtatgtga aacatccggc ggatattccg 240
gattataaga aactgagctt tccggaaggc tttaaatggg aacgcgtgat gaactttgaa 300
gatggcggcg tggcgaccgt gacccaggat agcagccttc aggatggctg ttttatttat 360
aaagtgaaat ttattggcgt gaactttccg agcgatggcc cggtgatgca gaagaaaacc 420
atgggctggg aagcgagcac cgaacgcctg tatccgcgcg atggcgtgct gaaaggcgaa 480
acccataaag cgctgaaact gaaagatggc ggccattatc tggtggaatt taaaagcatt 540
tatatggcga agaaaccggt gcagctgccg ggctattatt atgtggatgc gaaactggat 600
attaccagcc ataacgaaga ttataccatt gtggaacagt atgaacgcac cgaaggccgc 660
catcatctgt ttctg 675
<210> 24
<211> 702
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
atggtgagca aaggcgaaga agtgattaaa gaatttatgc gctttaaagt gcgcatggaa 60
ggcagcatga acggccatga atttgaaatt gaaggcgaag gcgaaggccg cccgtatgaa 120
ggcacccaga ccgcgaaact gaaagtgacc aaaggcggcc cgctgccgtt tgcgtgggat 180
attctgagcc cgcagtttat gtatggcagc aaagcgtatg tgaaacatcc ggcggatatt 240
ccggattata agaaactgag ctttccggaa ggctttaaat gggaacgcgt gatgaacttt 300
gaagatggcg gcctggtgac cgtgacccag gatagcagcc ttcaggatgg caccctgatt 360
tataaagtga aaatgcgcgg caccaacttt ccgccggatg gcccggtgat gcagaagaaa 420
accatgggct gggaagcgag caccgaacgc ctgtatccgc gcgatggcgt gctgaaaggc 480
gaaattcatc aggcgctgaa actgaaagat ggcggccatt atctggtgga atttaaaaca 540
atttatatgg cgaagaaacc ggtgcagctg ccgggctatt attatgtgga taccaaactg 600
gatattacca gccataacga agattatacc attgtggaac agtatgaacg cagcgaaggc 660
cgccatcatc tgtttctgta tggcatggat gaactgtata aa 702
<210> 25
<211> 690
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atgagcgaac tgattaaaga aaacatgcat atgaaactgt atatggaagg caccgtgaac 60
aaccatcatt ttaaatgtac cagcgaaggc gaaggcaaac cgtatgaagg cacccagacc 120
atgaaaatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tgcgaccagc 180
tttatgtatg gcagcaaagc gtttattaac catacccagg gcattccgga tttgtttaaa 240
cagagctttc cggaaggctt tacctgggaa cgcattacca cctatgaaga tggcggcgtg 300
ctgaccgcga cccaggatac cagctttcag aacggctgta ttatttataa cgtgaaaatt 360
aacggcgtga actttccgag caacggcccg gtgatgcaga agaaaacacg cggctgggaa 420
gcgaacaccg aaatgctgta tccggcggat ggcggcctgc gcggccatag ccagatggcg 480
ctgaaactgg tgggcggcgg ctatctgcat tgtagcttta aaaccaccta tcgcagcaag 540
aaaccggcga agaacctgaa aatgccgggc tttcattttg tggatcatcg cctggaacgc 600
attaaagaag cggataaaga aacctatgtg gaacagcatg aaatggcggt ggcgaaatat 660
tgtgatctgc cgagcaaact gggccatcgc 690

Claims (4)

1.利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法,其特征在于,包括
以下步骤:
S1:选择具有特定功能的蛋白基因序列,比对这些序列,寻找同源区域,在同源区域进行交错切割,将模板基因序列双链设计成具有同源末端的寡核苷酸片段oligo,实现将全长基因序列在互补区域末端交错切割成较短的寡核苷酸文库oligo pool,再使用DNA芯片合成该oligo pool。
S2:使用固定化有错配识别蛋白MutS的纤维素凝胶柱进行oligo pool的错误移除;
S3:将错误移除的oligo文库通过基于连接酶的组装方法组装成为全长重组文库。
2.根据权利要求1所述的利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法,其特征在于,所述步骤S3之后还包括步骤S4:组装反应后,以获得的组装产物为模板,通过PCR循环,进一步提高重组概率。
3.根据权利要求2所述的利用芯片合成寡核苷酸文库进行DNA洗牌文库从头合成的方法,其特征在于,所述步骤S4之后还包括步骤S5:向反应体系中加入全长序列两段通用引物,进行PCR扩增获得大量重组的基因全长序列。
4.根据权利要求3所述的方法,其特征在于,所述蛋白为红色荧光蛋白,所述方法具体包括:
使用比对软件Bioedit对选择的21条红色荧光蛋白模板序列进行比对,根据比对结果,按照互补区域交错切割的要求设计oligo pool;向所有设计的oligo序列两端分别加入一对引物序列,该对引物含有一个Mly I限制性内切酶酶切位点,可以通过酶切去除;以第一项合成的oligo pool为模板,以oligo两端通用引物为引物,PCR反应扩增获得大量oligo,然后通过重新变性退火将合成错误的碱基展示为错配;
将重新变性退火的oligo pool上样到MICC柱子上,DNA样本在重力的作用下穿过柱体;在该过程中含有合成错误碱基的oligo被固定化在柱子中的MutS结合而滞留在柱子上,而合成正确的oligo流过柱子被收集下来;以收集的含有错误移除oligo pool的滤液为模板,通过PCR扩增获得大量的ED-oligo pool;
将ED-oligo pool通过Mly I酶切去除其两端的通用引物序列,使用UNIQ-10oligo回收试剂盒回收引物去除的oligo pool;
将EP-oligo pool通过基于连接和PCR的组装方法方法组装成为重组全长文库,然后以组装产物为模板,使用全长通用引物为引物,PCR扩增获得大量重组文库序列。
CN201910215880.7A 2019-03-21 2019-03-21 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法 Active CN109868271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910215880.7A CN109868271B (zh) 2019-03-21 2019-03-21 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910215880.7A CN109868271B (zh) 2019-03-21 2019-03-21 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法

Publications (2)

Publication Number Publication Date
CN109868271A true CN109868271A (zh) 2019-06-11
CN109868271B CN109868271B (zh) 2020-10-30

Family

ID=66920943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910215880.7A Active CN109868271B (zh) 2019-03-21 2019-03-21 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法

Country Status (1)

Country Link
CN (1) CN109868271B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112079903A (zh) * 2019-06-14 2020-12-15 中国科学院青岛生物能源与过程研究所 一种错配结合蛋白的突变体及其编码基因
CN112079893A (zh) * 2020-09-23 2020-12-15 南京原码科技合伙企业(有限合伙) 一种基于固相化学合成法合成dna存储所需文本的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103755815A (zh) * 2014-01-17 2014-04-30 中国科学技术大学 一种新型错配结合蛋白与纤维素结合域3的融合蛋白及其高通量去除dna合成中错误的方法
CN104593354A (zh) * 2015-01-14 2015-05-06 江南大学 一种基于体外组合组装快速定向进化dna的方法
CN104877977A (zh) * 2015-04-29 2015-09-02 江南大学 一种基于合成单链dna文库进化酶的方法
CN104892711A (zh) * 2015-05-18 2015-09-09 中国科学技术大学 基于芯片进行规模化快速制备单根寡核苷酸的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103755815A (zh) * 2014-01-17 2014-04-30 中国科学技术大学 一种新型错配结合蛋白与纤维素结合域3的融合蛋白及其高通量去除dna合成中错误的方法
CN104593354A (zh) * 2015-01-14 2015-05-06 江南大学 一种基于体外组合组装快速定向进化dna的方法
CN104877977A (zh) * 2015-04-29 2015-09-02 江南大学 一种基于合成单链dna文库进化酶的方法
CN104892711A (zh) * 2015-05-18 2015-09-09 中国科学技术大学 基于芯片进行规模化快速制备单根寡核苷酸的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CAROLA ENGLER ET AL.: "Golden Gate Shuffling: A One-Pot DNA Shuffling Method Based on Type IIs Restriction Enzymes", 《PLOS ONE》 *
WEN WAN ET AL.: "Error removal in microchip-synthesized DNA using immobilized MutS", 《NUCLEIC ACIDS RESEARCH》 *
刘艳超等: "分段DNA shuffling: 一种大分子海藻糖合酶有效的定向进化方法", 《微生物学通报》 *
胡光星等: "DNA改组技术发展与应用", 《中国生物工程杂志》 *
陈健: "DNA SHUFFLING技术体外定向进化α-淀粉酶基因", 《中国优秀博硕士学位论文全文数据库(硕士)基础科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112079903A (zh) * 2019-06-14 2020-12-15 中国科学院青岛生物能源与过程研究所 一种错配结合蛋白的突变体及其编码基因
CN112079903B (zh) * 2019-06-14 2022-11-18 中国科学院青岛生物能源与过程研究所 一种错配结合蛋白的突变体及其编码基因
CN112079893A (zh) * 2020-09-23 2020-12-15 南京原码科技合伙企业(有限合伙) 一种基于固相化学合成法合成dna存储所需文本的方法
CN112079893B (zh) * 2020-09-23 2022-05-03 南京原码科技合伙企业(有限合伙) 一种基于固相化学合成法合成dna存储所需文本的方法

Also Published As

Publication number Publication date
CN109868271B (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
KR102084186B1 (ko) Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
Kagawa et al. The 60 kDa Heat Shock Proteins in the Hyperthermophilic ArchaeonSulfolobus shibatae
EA020657B1 (ru) Специализированная многосайтовая комбинаторная сборка
JP6552969B2 (ja) 定方向進化のためのライブラリーの作製方法
CN103755815B (zh) 一种错配结合蛋白与纤维素结合域3的融合蛋白及其去除dna合成中错误的方法
CN113234701B (zh) 一种Cpf1蛋白及基因编辑系统
Wyrwa et al. Integration of Lupinus angustifolius L.(narrow-leafed lupin) genome maps and comparative mapping within legumes
CN109868271A (zh) 利用芯片合成寡核苷酸文库进行dna洗牌文库从头合成的方法
AU782529C (en) Sequence based screening
CN115667283A (zh) Rna指导的千碱基规模基因组重组工程
CN113061171A (zh) 抗稻瘟病蛋白和基因、分离的核酸及其应用
CN114774399B (zh) 一种人工改造脱氨酶辅助的dna中5-羟甲基胞嘧啶修饰单碱基分辨率定位分析方法
US9856470B2 (en) Process for generating a variant library of DNA sequences
US20200347441A1 (en) Transposase compositions, methods of making, and methods of screening
EP1670932B1 (en) Libraries of recombinant chimeric proteins
WO2001081606A2 (en) Polynucleotide sequences from rice
CN114574464B (zh) 高保真dna聚合酶突变体及其应用
CN110438103B (zh) 一种新型高效的常温ii型限制性内切酶
KR102390826B1 (ko) 주황색 과육의 수박 선발용 caps 마커 및 이의 용도
EP4234690A1 (en) Recombinant kod polymerase
CN114854712B (zh) 玉米ZmWAK02基因在提高玉米灰斑病抗性中的应用
US20020031771A1 (en) Sequence based screening
EP1210460B1 (en) Gene cloning
CN114317492A (zh) 一种改造的人工核酸酶系统及其应用
KR20230041978A (ko) 포도에서 분리된 신규 u6 프로모터 및 이의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant