CN107828778A - 一种全基因合成方法 - Google Patents

一种全基因合成方法 Download PDF

Info

Publication number
CN107828778A
CN107828778A CN201710947566.9A CN201710947566A CN107828778A CN 107828778 A CN107828778 A CN 107828778A CN 201710947566 A CN201710947566 A CN 201710947566A CN 107828778 A CN107828778 A CN 107828778A
Authority
CN
China
Prior art keywords
artificial sequence
pcr
gene
primer
plasmid vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710947566.9A
Other languages
English (en)
Inventor
张辉
陈智毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Third Affiliated Hospital of Guangzhou Medical University
Original Assignee
Third Affiliated Hospital of Guangzhou Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Third Affiliated Hospital of Guangzhou Medical University filed Critical Third Affiliated Hospital of Guangzhou Medical University
Priority to CN201710947566.9A priority Critical patent/CN107828778A/zh
Publication of CN107828778A publication Critical patent/CN107828778A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种全基因合成方法,命名为STRP法(single tube reverse PCR‑based gene synthesis,STRP)。该方法仅需要一轮PCR反应、DpnI酶消化和大肠杆菌转化,在一天内即可完成。首先合成覆盖靶基因的寡核苷酸,相邻的寡核苷酸末端相互重叠,最外侧的寡核苷酸与质粒载体插入位点两侧序列同源。将所有寡核苷酸与质粒载体混合,在一轮PCR反应中,合成目的基因,同时将目的基因整合至质粒载体中。通过聚丙烯酰胺凝胶电泳(SDS‑PAGE)纯化寡核苷酸,利用高保真DNA聚合酶进行PCR扩增,可以降低合成基因中的突变。采用本方法,可以合成1638bp的DNA。实验证明,该方法是一种简单有效的全基因合成工具,适合高通量基因合成和载体构建。

Description

一种全基因合成方法
技术领域
本发明属于分子生物技术领域,具体涉及一种全基因合成的方法。
背景技术
全基因合成在合成生物学中具有关键的作用,包括异源蛋白表达、基因改造和修饰以及全基因组合成等。通过基因合成,不仅可以根据序列获得自然界中存在却难以获取的基因,也可以对密码子进行优化,或者随意对基因进行改造。基因合成方法的进步极大地提升了人们对基因和蛋白的操作能力。
基因合成主要由两种方式介导:连接酶和PCR。PCR介导的全基因合成是使用最为广泛的方法,其主要包括以下几个步骤:首先设计合成覆盖目的基因的相邻末端重叠的寡核苷酸,在第一阶段PCR中,DNA延伸合成全长的目的基因,在第二阶段PCR中,采用最外侧的一对引物,富集目的基因,最后通过酶切连接,将目的基因克隆至质粒载体中。许多报道的方法均在此基础上改进,包括热动力平衡/内向外的方法(TBIO)、传统热平衡方法(TBC)、改进的PCR介导的合成(IPS)等。另外,有报道采用一步法(one step method)进行基因合成,然而,该方法需要较多的参数优化,包括DNA聚合酶、引物浓度和退火温度方面,过程繁琐。
传统的全基因合成方法通常需要至少三天的时间才能完成,需要繁琐的操作而且技术门槛较高,增加了成本。总之,目前已报道的各类全基因合成方法中尚无一种高效率、可以在一天内完成、在合成目的基因的同时能将基因构建至质粒载体中的方法。
发明内容
本发明旨在提供一种快速、有效、低成本的全基因合成方法,以满足高通量全基因合成、基因功能研究、蛋白质的表达。具体来说,主要用于较长的基因合成,长度可达1638bp,能在全基因合成的同时将基因整合至质粒载体中。
为了达到上述目的,本发明提供了一种快速有效,基于单管反向PCR的全基因合成方法,命名为STRP(singletubereversePCR-basedgene synthesis,STRP)法。具体的技术方案为:
全基因合成方法包括如下步骤:
(1)STRP法合成基因的引物设计:设计覆盖目的基因全长的寡核苷酸即引物;
(2)酶链聚合反应:将所有步骤(1)设计的引物按照进行一定倍数的稀释,进行混合;把质粒载体和一定量的混合引物混合在一管中进行PCR反应;在一轮PCR中分两个阶段进行,第一个阶段10个循环,寡核苷酸互相退火延伸,形成长片段;第二个阶段20个循环,长片段以质粒载体为模板进行退火、成指数反向PCR方式延伸、扩增,得到含有全长目的基因的线性质粒,通过一轮PCR反应,可以同时合成目的基因并将目的基因整合到质粒载体中;
(3)DpnI酶消化及转化:采用DpnI酶消化步骤(2)得到的PCR产物以去除PCR产物即线性质粒中的质粒载体;将DpnI酶消化后的产物转化大肠杆菌感受态细胞并涂于含氨卞青霉素的LB琼脂平板皿上培养;
(4)菌落PCR筛选及测序验证:挑选在步骤(3)制备的含氨卞青霉素的LB琼脂平板皿上长出的菌落,进行菌落PCR,电泳,筛选长度正确的克隆,检测是否得到目的基因;
(5)通过原核表达验证合成的基因是否具有功能。采用异丙基硫代半乳糖苷(IPTG)诱导的方式,验证合成基因在BL21(DE3)中的表达。
进一步地,所述步骤(1)具体操作如下:从数据库调取基因序列,根据大肠杆菌密码子偏好性,对编码序列进行优化,手动或在线软件设计覆盖目的基因全长的寡核苷酸即引物,包括2个最外侧引物,通过聚丙烯酰胺凝胶电泳(SDS-PAGE)纯化寡核苷酸,根据Tm值设置相邻引物之间的重叠区,使相邻引物末端能够在PCR反应时相连,质粒载体插入位点一侧与一个最外侧的引物3’端序列同源,质粒载体插入位点另一侧与另一个最外侧的引物3’端序列同源。
进一步地,所述步骤(2)PCR条件如下:PCR体系为:1×缓冲液,40pmol~2pmol混合引物即步骤(1)设计的引物,0.4mM dNTP,1mM MgSO4,1U高保真DNA聚合酶和1ng~50ng质粒载体;
PCR反应包括两个阶段,第一阶段反应条件:94℃预变性2min;98℃变性10s,60℃退火30s,68℃延伸(2kb/min),10个循环;第一阶段过程中,引物即寡核苷酸互相退火延伸,形成不同的长片段,部分长片段由最外侧引物和寡核苷酸退火延伸而成,所以该部分长片段包括含有与质粒载体插入位点一侧同源序列的长片段以及含有与质粒载体插入位点另一侧同源序列的长片段;
第二阶段反应条件:98℃变性10s,60℃退火30s,68℃延伸(2kb/min),20个循环;然后保持68℃充分延伸,第二阶段过程中,含有与质粒载体插入位点一侧同源序列的长片段及含有与质粒载体插入位点另一侧同源序列的长片段与质粒载体部分序列发生互补,即这两种长片段作为大引物以质粒载体为模板,其他长片段和dNTP能够在这两种长片段3’端以反向PCR的方式进行退火延伸,得到含有目的基因全长的线性质粒。
步骤(3)所述的转化如下:从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的LB培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的LB琼脂平板皿上,37℃培养过夜。第三日晚在含氨卞青霉素的LB琼脂平板皿上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的LB培养基中。37℃,220rpm摇床培养过夜。
进一步地,所述步骤(4)具体如下:取若干灭菌的PCR管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从步骤(3)制备的含氨卞青霉素的LB琼脂平板皿上挑取菌落即转化子,溶解到PCR管中,制成菌液;整个过程需要在超净工作台中进行;取5μl所得菌液作为模板,加入含有DNA聚合酶、dNTP及引物的PCR混合液中,通过PCR扩增目的基因,电泳,筛选长度正确的克隆,检测是否得到目的片段。
进一步地,所述步骤(5)具体如下:将测序正确的质粒即合成的目的基因转入BL21(DE3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的LB培养基中,37℃,220rpm,摇床培养,约3h,当OD600达到0.6时,以1:100的比例转入500ml补充有抗生素的LB培养基中,继续37℃,220rpm,摇床培养至OD600达到0.6,加入0.5mM的异丙基硫代半乳糖苷(IPTG)进行诱导,37℃诱导4h或者25℃诱导过夜。
所述目的基因包括eGFP基因、RFP基因、烟草花叶蚀刻病毒蛋白酶基因。理论上,STRP可以在一轮PCR中可以合成更长的DNA片段。通过STRP法,能够合成一条长度达到1638bp的基因,挑取19个克隆,通过菌落PCR筛选得到8个阳性克隆,全部送去测序,如图4所示,结果表明,都有不同程度的突变,最少的有1处突变,可以选择突变最少的重组子,通过点突变的方式对其进行了修正,成功地合成了该1638bp基因。
本发明提出一种有效快捷的全基因合成方法——STRP法。STRP法与传统的基因合成方法有很大的不同,在原理上,传统的方法依赖于第一轮PCR中全长基因的形成,是采用一个正向PCR的扩增方式,再通过第二轮PCR来富集全长基因,而STRP法是通过长片段反向PCR延伸,得到包含目的基因的线性质粒,线性质粒的修复是在大肠杆菌中完成的,而且STRP法在一轮PCR中可以得到比较长的片段。在实验操作上,STRP法可以在一轮PCR中,在合成目的基因的同时将其整合到质粒载体中,不需要胶回收、酶切、连接等繁琐的步骤,一天内即可完成,极大地节省了时间。STRP法可作为一种有效而简单的全基因合成方法,可以被用来作为一种高通量克隆工具以满足日益增长的对基因组研究和蛋白质改造的研究需求。
附图说明
图1为STRP法进行全基因合成的策略示意图.
图2为通过对PCR过程中所使用的引物浓度进行优化,以及通过菌落PCR进行筛选阳性克隆实验图片。
图3为通过原核表达验证所合成基因的功能实验图片。
图4为1638bp基因合成电泳结果实验图片。
图5为全基因合成中错误的修正策略示意图。
具体实施方式
下面将结合具体实施例来详细说明本发明,在此以本发明的示意性实施例及说明用来解释本发明,但并不作为对本发明的限定。
本发明的技术原理是:
(1)STRP法合成基因的引物设计:设计覆盖目的基因全长的寡核苷酸即引物;从Uniprot数据库(http://www.uniprot.org/)调取基因序列,根据大肠杆菌密码子偏好性,利用Jcat在线软件(http://www.jcat.de/)对编码序列进行优化,手动或在线软件设计引物,包括2个最外侧引物,根据Tm值设置相邻引物之间的重叠区,使相邻引物末端在PCR反应时能够相连,一个最外侧引物3’端与质粒载体插入位点一侧序列同源,另一个最外侧引物3’端与质粒载体插入位点另一侧序列同源。
(2)酶链聚合反应:如图1所示的反应原理:箭头方向为5’-3’方向。相邻寡核苷酸之间有15bp~25bp的重叠区,一条最外侧引物3’端序列与质粒载体插入位点一侧序列同源,另一条最外侧引物3’端序列与质粒载体插入位点另一侧序列同源,PCR产物经DpnI酶消化后,转化至大肠杆菌。
详细操作步骤:将所有步骤(1)设计的引物按照进行一定倍数的稀释,进行混合;把质粒载体和一定量的混合引物混合在一管中进行PCR反应;
PCR体系为:1×缓冲液,40pmol~2pmol混合引物即步骤(1)设计的引物,0.4mMdNTP,1mMMgSO4,1U DNA聚合酶和1ng~50ng质粒载体;
PCR反应包括两个阶段。第一阶段反应条件:94℃预变性2min;98℃变性10s,60℃退火30s,68℃延伸(2kb/min),10个循环;第一阶段过程中,引物即寡核苷酸互相退火延伸,形成不同的长片段,部分长片段由最外侧引物和寡核苷酸退火延伸而成,所以该部分长片段包括含有与质粒载体插入位点一侧同源序列的长片段以及含有与质粒载体插入位点另一侧同源序列的长片段;
第二阶段反应条件:98℃变性10s,60℃退火30s,68℃延伸(2kb/min),20个循环;然后保持68℃充分延伸,第二阶段过程中,含有与质粒载体插入位点一侧同源序列的长片段及含有与质粒载体插入位点另一侧同源序列的长片段与质粒载体部分序列发生互补,即这两种长片段作为大引物以质粒载体为模板,因为相邻引物末端有重叠区,其他长片段和dNTP能够在这两种长片段3’端以反向PCR的方式进行退火、成指数反向PCR方式延伸、扩增,得到含有目的基因全长的线性质粒。通过一轮PCR反应,可以同时合成目的基因并将目的基因整合到质粒载体上;
(3)DpnI酶消化及转化:采用DpnI酶消化以去除PCR产物即线性质粒中的质粒载体;然后从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的LB培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的LB琼脂平板皿上,37℃培养过夜。第三日晚在平板上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的LB培养基中,37℃,220rpm摇床培养过夜;
(4)菌落PCR筛选及测序验证:取若干灭菌的PCR管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从步骤(3)制备的含氨卞青霉素的LB琼脂平板皿上挑取菌落即转化子,溶解到PCR管中,制成菌液;整个过程需要在超净工作台中进行;取5μl所得菌液作为模板,加入含有DNA聚合酶、dNTP及引物的PCR混合液中,通过PCR扩增目的基因,电泳,筛选长度正确的克隆,检测是否得到目的片段;
(5)通过原核表达验证合成的基因是否具有功能。
将测序正确的质粒即合成的目的基因转入BL21(DE3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的LB培养基中,37℃,220rpm,摇床培养约3h,当OD600达到0.6时,以1:100的比例转入500ml补充有抗生素的LB培养基中,继续37℃,220rpm,摇床培养至OD600达到0.6,加入0.5mM的异丙基硫代半乳糖苷(IPTG)进行诱导,37℃诱导4h或者25℃诱导过夜;
按上述技术原理,现提供下面几个实施例加以说明。
实施例1
STRP法合成700bp左右的基因并同时构建至表达载体中
从Uniprot数据库(http://www.uniprot.org/)调取增强型绿色荧光蛋白(eGFP,239AA)、红色荧光蛋白(RFP,231AA)及烟草花叶蚀刻病毒蛋白酶(TEVprotease,238AA)基因序列。按照大肠杆菌密码子偏好性,利用Jcat在线软件(http://www.jcat.de/)对编码序列进行优化。最初,合成eGFP的引物采用手动设计,包括2条最外侧引物,每条引物长度为59bp,相邻引物末端有15bp的重叠,一条最外侧的引物3’端序列与质粒载体插入位点一侧同源,另一条最外侧的引物3’端序列与质粒载体插入位点另一侧同源,同源区Tm值为70℃。
所有的寡核苷酸即合成eGFP的引物与质粒载体混合在一管中进行PCR反应,基因合成在一轮PCR中完成,理论上PCR包括两个阶段:第一阶段,寡核苷酸互相退火延伸,形成长片段;第二阶段,长片段、dNTP与质粒载体退火、成指数反向PCR方式延伸、扩增得到含有全长目的基因的线性质粒。通过一轮PCR反应,可以同时合成目的基因并将目的基因整合到质粒载体中。PCR产物经DpnI酶处理后直接转化到大肠杆菌DH5α感受态细胞中,得到修复。RFP基因与TEV蛋白酶基因的引物是通过在线软件设计。覆盖RFP基因的相邻引物之间的重叠区Tm值为70℃,RFP基因的引物由DNAWorks在线软件设计(http://helixweb.nih.gov/dnaworks/),覆盖TEV蛋白酶基因的相邻引物重叠区Tm值为60℃,由GeneDesign在线软件设计(http://54.235.254.95/gd/)。RFP基因与TEV蛋白酶基因同样用STRP法合成。如图2所示,通过对PCR过程中所使用的引物浓度进行优化,以及通过菌落PCR进行筛选阳性克隆。A为eGFP基因合成的引物浓度优化,星号标记为目标产物。B为RFP基因合成的引物浓度优化,星号标记为目标产物。C是采用最外侧的引物,通过菌落PCR筛选阳性的eGFP克隆。所有挑取的克隆均能扩增出来目标条带。上述三种基因合成所设计的引物见表1。
表1
得到的基因序列如下:
eGFP基因序列(717bp)
ATGGTGAGCAAAGGCGAAGAACTGTTTACCGGCGTGGTGCCGATTCTGGTGGAACTGGATGGCGATGTGAACGGCCATAAATTTAGCGTGAGCGGCGAAGGCGAAGGCGATGCGACCTATGGCAAACTGACCCTGAAATTTATTTGCACCACCGGCAAACTGCCGGTGCCGTGGCCGACCCTGGTGACCACCCTGACCTATGGCGTGCAGTGCTTTAGCCGTTATCCGGATCATATGAAACAGCATGATTTTTTTAAAAGCGCGATGCCGGAAGGCTATGTGCAGGAACGTACCATTTTTTTTAAAGATGATGGCAACTATAAAACCCGTGCGGAAGTGAAATTTGAAGGCGATACCCTGGTGAACCGTATTGAACTGAAAGGCATTGATTTTAAAGAAGATGGCAACATTCTGGGCCATAAACTGGAATATAACTATAACAGCCATAACGTGTATATTATGGCGGATAAACAGAAAAACGGCATTAAAGTGAACTTTAAAATTCGTCATAACATTGAAGATGGCAGCGTGCAGCTGGCGGATCATTATCAGCAGAACACCCCGATTGGCGATGGCCCGGTGCTGCTGCCGGATAACCATTATCTGAGCACCCAGAGCGCGCTGAGCAAAGATCCGAACGAAAAACGTGATCATATGGTGCTGCTGGAATTTGTGACCGCGGCGGGCATTACCCTGGGCATGGATGAACTGTATAAA
RFP基因序列(693bp)
ATGAACAGCCTGATTAAAGAAAACATGCGTATGATGGTGGTGATGGAAGGCAGCGTGAACGGCTATCAGTTTAAATGCACCGGCGAAGGCGATGGCAACCCGTATATGGGCACCCAGACCATGCGTATTAAAGTGGTGGAAGGCGGCCCGCTGCCGTTTGCGTTTGATATTCTGGCGACCAGCTTTATGTATGGCAGCAAAACCTTTATTAAACATACCAAAGGCATTCCGGATTTTTTTAAACAGAGCTTTCCGGAAGGCTTTACCTGGGAACGTGTGACCCGTTATGAAGATGGCGGCGTGTTTACCGTGATGCAGGATACCAGCCTGGAAGATGGCTGCCTGGTGTATCATGCGAAAGTGACCGGCGTGAACTTTCCGAGCAACGGCGCGGTGATGCAGAAAAAAACCAAAGGCTGGGAACCGAACACCGAAATGCTGTATCCGGCGGATGGCGGCCTGCGTGGCTATAGCCAGATGGCGCTGAACGTGGATGGCGGCGGCTATCTGAGCTGCAGCTTTGAAACCACCTATCGTAGCAAAAAAACCGTGGAAAACTTTAAAATGCCGGGCTTTCATTTTGTGGATCATCGTCTGGAACGTCTGGAAGAAAGCGATAAAGAAATGTTTGTGGTGCAGCATGAACATGCGGTGGCGAAATTTTGCGATCTGCCGAGCAAACTGGGCCGTCTG
TEV基因(747bp)
ATGGGCAGCCATCATCATCATCATCATCATCATGGCGAAAGCCTGTTTAAAGGCCCGCGTGATTATAACCCGATTAGCAGCACCATTTGCCATCTGACCAACGAAAGCGATGGCCATACCACCAGCCTGTATGGCATTGGCTTTGGCCCGTTTATTATTACCAACAAACATCTGTTTCGTCGTAACAACGGCACCCTGCTGGTGCAGAGCCTGCATGGCGTGTTTAAAGTGAAAAACACCACCACCCTGCAGCAGCATCTGATTGATGGCCGTGATATGATTATTATTCGTATGCCGAAAGATTTTCCGCCGTTTCCGCAGAAACTGAAATTTCGTGAACCGCAGCGTGAAGAACGTATTTGCCTGGTGACCACCAACTTTCAGACCAAAAGCATGAGCAGCATGGTGAGCGATACCAGCTGCACCTTTCCGAGCAGCGATGGCATTTTTTGGAAACATTGGATTCAGACCAAAGATGGCCAGTGCGGCAGCCCGCTGGTGAGCACCCGTGATGGCTTTATTGTGGGCATTCATAGCGCGAGCAACTTTACCAACACCAACAACTATTTTACCAGCGTGCCGAAAAACTTTATGGAACTGCTGACCAACCAGGAAGCGCAGCAGTGGGTGAGCGGCTGGCGTCTGAACGCGGATAGCGTGCTGTGGGGCGGCCATAAAGTGTTTATGGTGAAACCGGAAGAACCGTTTCAGCCGGTGAAAGAAGCGACCCAGCTGATGAACGAACTG
实施例2
用STRP法合成1638bp的基因
STRP法可以合成较长的基因,通过STRP法,本实施例设计表2所示引物,用STRP法和表2所示的引物合成了一条1638bp的基因,挑取19个克隆,通过菌落PCR筛选得到8个阳性克隆。
表2
8个克隆全部送去测序,结果表明,都有不同程度的突变,最少的有1处突变,见表3,编号F-8所示。本实施例选择突变最少的F-8,通过点突变的方式对其进行了修正,成功地合成了该1638bp基因。
表3
如图4所示,1638bp基因合成电泳结果,A为引物浓度优化。B为菌落PCR筛选结果,星号标记为目的基因。
该1638bp基因序列如下:
LS基因序列(1638bp)
ATGCGTCGCAGTGGTAATTACAACCCGTCACGTTGGGATGTGAATTTTATCCAATCCCTGCTGAGCGATTACAAAGAGGACAAACACGTCATTCGGGCAAGCGAACTGGTTACACTGGTTAAAATGGAACTGGAAAAAGAAACAGACCAAATTCGCCAATTAGAGCTGATTGACGACTTACAGCGCATGGGGCTGAGCGATCACTTTCAGAATGAGTTCAAAGAGATTCTGTCATCTATCTATCTGGACCACCATTACTATAAAAACCCTTTTCCGAAAGAGGAACGTGATCTGTATAGCACAAGCCTGGCCTTTCGGTTACTGCGTGAGCATGGCTTCCAAGTAGCACAAGAGGTATTCGATAGCTTCAAGAATGAAGAGGGCGAGTTCAAAGAATCACTGTCCGATGATACTCGTGGCTTATTACAACTGTATGAAGCGAGCTTTCTGCTGACCGAGGGGGAGACGACTCTGGAAAGCGCACGGGAATTTGCGACCAAATTCTTAGAAGAGAAAGTAAATGAAGGCGGCGTAGATGGCGATCTGTTAACCCGCATCGCGTATTCTCTGGACATTCCGTTACACTGGCGTATTAAACGGCCAAACGCGCCGGTGTGGATTGAGTGGTATCGCAAACGTCCAGACATGAACCCGGTGGTGCTGGAATTAGCAATTTTAGACTTAAACATCGTGCAGGCTCAATTTCAGGAAGAACTGAAAGAATCTTTTCGCTGGTGGCGCAACACCGGCTTCGTTGAAAAATTACCGTTTGCGCGCGATCGTCTGGTTGAATGTTATTTCTGGAATACCGGCATTATCGAACCGCGCCAGCACGCGAGCGCCCGTATTATGATGGGTAAGGTCAATGCGCTGATTACTGTCATTGACGATATTTACGATGTATACGGCACTCTGGAAGAACTGGAGCAGTTTACAGATTTAATCCGCCGGTGGGACATCAATAGCATCGACCAGCTGCCAGATTACATGCAGCTGTGTTTTCTGGCGCTGAATAACTTTGTGGACGACACCTCTTATGACGTCATGAAAGAAAAAGGCGTGAATGTTATCCCTTATCTGCGTCAGAGTTGGGTGGATCTGGCCGATAAATATATGGTTGAGGCACGCTGGTTCTACGGTGGGCACAAACCGAGTTTAGAAGAATATCTGGAGAACTCATGGCAGAGTATCAGTGGGCCATGCATGCTGACGCATATCTTCTTTCGCGTCACGGATTCATTTACCAAGGAGACGGTCGATTCCTTATATAAATACCATGACCTGGTTCGTTGGTCATCTTTCGTCCTGCGGCTGGCGGACGATCTGGGTACGTCTGTGGAAGAGGTGTCTCGTGGGGATGTTCCGAAATCCTTACAGTGCTACATGTCCGATTATAACGCAAGTGAAGCTGAAGCTCGCAAACATGTGAAGTGGCTGATCGCCGAAGTGTGGAAGAAGATGAACGCTGAACGTGTTTCCAAGGATAGTCCGTTTGGTAAGGATTTTATTGGTTGCGCCGTTGATCTGGGTCGTATGGCCCAGCTGATGTATCATAACGGTGATGGTCATGGGACCCAGCATCCTATTATTCATCAGCAGATGACGCGTACCCTGTTTGAACCTTTCGCCCTCGAGTGA
实施例3
通过重叠PCR方法进行错误修复
合成基因中的错误通常是在寡核苷酸化学合成和PCR介导基因拼接过程中引入的。前者是错误的主要的来源。寡核苷酸化学合成的正确率通常在98.5%-99.5%之间,很难达到100%,其中碱基缺失和插入是最常发生的错误。采用HPLC或者PAGE纯化寡核苷酸,可以在最大程度上减少基因合成中错误的引入。在挑取几个克隆经过测序之后,最理想的情况是合成基因序列完全正确,如果没有正确的基因,可以选择突变最少的进行错误修正,这通常是利用点突变或者称为重叠PCR法完成。如图5所示,在STRP法合成的基因中,错误修正通过点突变的方法可以很容易地在质粒载体上完成,从已有寡核苷酸中,在突变位点相应的位置选取引物对(1和2),以质粒载体为模板,进行错误修正。
用于点突变修正的引物直接从已合成的寡核苷酸中选取,无需重新设计合成引物。简单来说,合成基因经过测序之后,选择突变最少的合成基因进行错误修正。以突变位点处的寡核苷酸作为引物对,以该合成基因为模板,用高保真酶进行PCR扩增,PCR产物经电泳检测后,直接用DpnI酶消化,去除模板。
取5μl消化产物做转化,随机挑几个克隆测序。从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的LB培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的LB琼脂平板皿上,37℃培养过夜。第三日晚在平板上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的LB培养基中,37℃,220rpm摇床培养过夜;
取若干灭菌的PCR管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从含氨卞青霉素的LB琼脂平板皿上挑取菌落即转化子,溶解到PCR管中,制成菌液;整个过程需要在超净工作台中进行;将混有菌体的PCR混合物置于PCR仪中,按常规条件扩增,筛选长度正确的克隆,电泳检测是否得到目的片段;选择序列完全正确的合成基因进行下一步应用。
实施例4
通过原核表达验证基因功能
将测序正确的质粒即合成的目的基因转入BL21(DE3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的LB培养基中,37℃,220rpm,摇床培养,约3h,当OD600达到0.6时,以1:100的比例转入500ml补充有抗生素的LB培养基中,继续37℃,220rpm,摇床培养,约3h,至OD600达到0.6,加入0.5mM的IPTG进行诱导,37℃诱导4h或者25℃诱导过夜。
因为eGFP、RFP构建在pET表达载体中,可以直接通过异源表达观察荧光来验证基因功能。表达宿主均为BL21(DE3)。转化eGFP的菌液经25℃诱导过夜之后,得到图3A所示的绿色菌液,而转化RFP的菌液经过30℃诱导过夜之后,如图3B所示菌液变为粉红色。
以上实施例的说明只适用于帮助理解本发明的原理;本说明书内容不应理解为对本发明的限制。
序列表
<110> 广州医科大学附属第三医院
<120> 一种全基因合成方法
<130> 2017
<160> 104
<170> SIPOSequenceListing 1.0
<210> 1
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctgcccagcc ggcgatggcc atggtgagca aaggcgaaga actgtttacc ggcgtggtg 59
<210> 2
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aatttatggc cgttcacatc gccatccagt tccaccagaa tcggcaccac gccggtaaa 59
<210> 3
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gaacggccat aaatttagcg tgagcggcga aggcgaaggc gatgcgacct atggcaaac 59
<210> 4
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cggcaccggc agtttgccgg tggtgcaaat aaatttcagg gtcagtttgc cataggtcg 59
<210> 5
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaactgccgg tgccgtggcc gaccctggtg accaccctga cctatggcgt gcagtgctt 59
<210> 6
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ttttaaaaaa atcatgctgt ttcatatgat ccggataacg gctaaagcac tgcacgcca 59
<210> 7
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgatttttt taaaagcgcg atgccggaag gctatgtgca ggaacgtacc atttttttt 59
<210> 8
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tcaaatttca cttccgcacg ggttttatag ttgccatcat ctttaaaaaa aatggtacg 59
<210> 9
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggaagtgaaa tttgaaggcg ataccctggt gaaccgtatt gaactgaaag gcattgatt 59
<210> 10
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gttatattcc agtttatggc ccagaatgtt gccatcttct ttaaaatcaa tgcctttca 59
<210> 11
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aaactggaat ataactataa cagccataac gtgtatatta tggcggataa acagaaaaa 59
<210> 12
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
catcttcaat gttatgacga attttaaagt tcactttaat gccgtttttc tgtttatcc 59
<210> 13
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ataacattga agatggcagc gtgcagctgg cggatcatta tcagcagaac accccgatt 59
<210> 14
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gtgctcagat aatggttatc cggcagcagc accgggccat cgccaatcgg ggtgttctg 59
<210> 15
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ccattatctg agcacccaga gcgcgctgag caaagatccg aacgaaaaac gtgatcata 59
<210> 16
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gcccagggta atgcccgccg cggtcacaaa ttccagcagc accatatgat cacgttttt 59
<210> 17
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ggcattaccc tgggcatgga tgaactgtat aaataaatgg atatcggaat taattcgga 59
<210> 18
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ggccgcaagc ttgtcgacgg agctcgaatt cggatccgaa ttaattccga tatccat 57
<210> 19
<211> 717
<212> DNA
<213> 未知(Unknown)
<400> 19
atggtgagca aaggcgaaga actgtttacc ggcgtggtgc cgattctggt ggaactggat 60
ggcgatgtga acggccataa atttagcgtg agcggcgaag gcgaaggcga tgcgacctat 120
ggcaaactga ccctgaaatt tatttgcacc accggcaaac tgccggtgcc gtggccgacc 180
ctggtgacca ccctgaccta tggcgtgcag tgctttagcc gttatccgga tcatatgaaa 240
cagcatgatt tttttaaaag cgcgatgccg gaaggctatg tgcaggaacg taccattttt 300
tttaaagatg atggcaacta taaaacccgt gcggaagtga aatttgaagg cgataccctg 360
gtgaaccgta ttgaactgaa aggcattgat tttaaagaag atggcaacat tctgggccat 420
aaactggaat ataactataa cagccataac gtgtatatta tggcggataa acagaaaaac 480
ggcattaaag tgaactttaa aattcgtcat aacattgaag atggcagcgt gcagctggcg 540
gatcattatc agcagaacac cccgattggc gatggcccgg tgctgctgcc ggataaccat 600
tatctgagca cccagagcgc gctgagcaaa gatccgaacg aaaaacgtga tcatatggtg 660
ctgctggaat ttgtgaccgc ggcgggcatt accctgggca tggatgaact gtataaa 717
<210> 20
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tacgcatgtt ttctttaatc aggctgttca tcatatgtat atctccttct taaagttaa 59
<210> 21
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gattaaagaa aacatgcgta tgatggtggt gatggaaggc agcgtgaacg gctatcagt 59
<210> 22
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ccatatacgg gttgccatcg ccttcgccgg tgcatttaaa ctgatagccg ttcacgctg 59
<210> 23
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cgatggcaac ccgtatatgg gcacccagac catgcgtatt aaagtggtgg aaggcggcc 59
<210> 24
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
taaagctggt cgccagaata tcaaacgcaa acggcagcgg gccgccttcc accacttta 59
<210> 25
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tattctggcg accagcttta tgtatggcag caaaaccttt attaaacata ccaaaggca 59
<210> 26
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
taaagccttc cggaaagctc tgtttaaaaa aatccggaat gcctttggta tgtttaata 59
<210> 27
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gagctttccg gaaggcttta cctgggaacg tgtgacccgt tatgaagatg gcggcgtgt 59
<210> 28
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ggcagccatc ttccaggctg gtatcctgca tcacggtaaa cacgccgcca tcttcataa 59
<210> 29
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cagcctggaa gatggctgcc tggtgtatca tgcgaaagtg accggcgtga actttccga 59
<210> 30
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cccagccttt ggtttttttc tgcatcaccg cgccgttgct cggaaagttc acgccggtc 59
<210> 31
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gaaaaaaacc aaaggctggg aaccgaacac cgaaatgctg tatccggcgg atggcggcc 59
<210> 32
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
cgccatccac gttcagcgcc atctggctat agccacgcag gccgccatcc gccggatac 59
<210> 33
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ggcgctgaac gtggatggcg gcggctatct gagctgcagc tttgaaacca cctatcgta 59
<210> 34
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gaaagcccgg cattttaaag ttttccacgg tttttttgct acgataggtg gtttcaaag 59
<210> 35
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ctttaaaatg ccgggctttc attttgtgga tcatcgtctg gaacgtctgg aagaaagcg 59
<210> 36
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccaccgcatg ttcatgctgc accacaaaca tttctttatc gctttcttcc agacgttcc 59
<210> 37
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gcagcatgaa catgcggtgg cgaaattttg cgatctgccg agcaaactgg gccgtctgt 59
<210> 38
<211> 693
<212> DNA
<213> 未知(Unknown)
<400> 38
atgaacagcc tgattaaaga aaacatgcgt atgatggtgg tgatggaagg cagcgtgaac 60
ggctatcagt ttaaatgcac cggcgaaggc gatggcaacc cgtatatggg cacccagacc 120
atgcgtatta aagtggtgga aggcggcccg ctgccgtttg cgtttgatat tctggcgacc 180
agctttatgt atggcagcaa aacctttatt aaacatacca aaggcattcc ggattttttt 240
aaacagagct ttccggaagg ctttacctgg gaacgtgtga cccgttatga agatggcggc 300
gtgtttaccg tgatgcagga taccagcctg gaagatggct gcctggtgta tcatgcgaaa 360
gtgaccggcg tgaactttcc gagcaacggc gcggtgatgc agaaaaaaac caaaggctgg 420
gaaccgaaca ccgaaatgct gtatccggcg gatggcggcc tgcgtggcta tagccagatg 480
gcgctgaacg tggatggcgg cggctatctg agctgcagct ttgaaaccac ctatcgtagc 540
aaaaaaaccg tggaaaactt taaaatgccg ggctttcatt ttgtggatca tcgtctggaa 600
cgtctggaag aaagcgataa agaaatgttt gtggtgcagc atgaacatgc ggtggcgaaa 660
ttttgcgatc tgccgagcaa actgggccgt ctg 693
<210> 39
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gtttaacttt aagaaggaga tatacatatg ggcagccatc atcatcatca 50
<210> 40
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
tcacgcgggc ctttaaacag gctttcgcca tgatgatgat gatgatgatg atggctgcc 59
<210> 41
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gtttaaaggc ccgcgtgatt ataacccgat tagcagcacc atttgccatc tgaccaacg 59
<210> 42
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
agccaatgcc atacaggctg gtggtatggc catcgctttc gttggtcaga tggcaaatg 59
<210> 43
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gcctgtatgg cattggcttt ggcccgttta ttattaccaa caaacatctg tttcgtcgt 59
<210> 44
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cgccatgcag gctctgcacc agcagggtgc cgttgttacg acgaaacaga tgtttgttg 59
<210> 45
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
cagagcctgc atggcgtgtt taaagtgaaa aacaccacca ccctgcagca gcatctgat 59
<210> 46
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
aatctttcgg catacgaata ataatcatat cacggccatc aatcagatgc tgctgcagg 59
<210> 47
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gattattatt cgtatgccga aagattttcc gccgtttccg cagaaactga aatttcgtg 59
<210> 48
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gtggtcacca ggcaaatacg ttcttcacgc tgcggttcac gaaatttcag tttctgcgg 59
<210> 49
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
cgtatttgcc tggtgaccac caactttcag accaaaagca tgagcagcat ggtgagcga 59
<210> 50
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ttccaaaaaa tgccatcgct gctcggaaag gtgcagctgg tatcgctcac catgctgct 59
<210> 51
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
cagcgatggc attttttgga aacattggat tcagaccaaa gatggccagt gcggcagcc 59
<210> 52
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
gctatgaatg cccacaataa agccatcacg ggtgctcacc agcgggctgc cgcactggc 59
<210> 53
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctttattgtg ggcattcata gcgcgagcaa ctttaccaac accaacaact attttacca 59
<210> 54
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gttggtcagc agttccataa agtttttcgg cacgctggta aaatagttgt tggtgttgg 59
<210> 55
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
ctttatggaa ctgctgacca accaggaagc gcagcagtgg gtgagcggct ggcgtctga 59
<210> 56
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
caccataaac actttatggc cgccccacag cacgctatcc gcgttcagac gccagccgc 59
<210> 57
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
cggccataaa gtgtttatgg tgaaaccgga agaaccgttt cagccggtga aagaagcga 59
<210> 58
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ctattacagt tcgttcatca gctgggtcgc ttctttcacc ggct 44
<210> 59
<211> 747
<212> DNA
<213> 未知(Unknown)
<400> 59
atgggcagcc atcatcatca tcatcatcat catggcgaaa gcctgtttaa aggcccgcgt 60
gattataacc cgattagcag caccatttgc catctgacca acgaaagcga tggccatacc 120
accagcctgt atggcattgg ctttggcccg tttattatta ccaacaaaca tctgtttcgt 180
cgtaacaacg gcaccctgct ggtgcagagc ctgcatggcg tgtttaaagt gaaaaacacc 240
accaccctgc agcagcatct gattgatggc cgtgatatga ttattattcg tatgccgaaa 300
gattttccgc cgtttccgca gaaactgaaa tttcgtgaac cgcagcgtga agaacgtatt 360
tgcctggtga ccaccaactt tcagaccaaa agcatgagca gcatggtgag cgataccagc 420
tgcacctttc cgagcagcga tggcattttt tggaaacatt ggattcagac caaagatggc 480
cagtgcggca gcccgctggt gagcacccgt gatggcttta ttgtgggcat tcatagcgcg 540
agcaacttta ccaacaccaa caactatttt accagcgtgc cgaaaaactt tatggaactg 600
ctgaccaacc aggaagcgca gcagtgggtg agcggctggc gtctgaacgc ggatagcgtg 660
ctgtggggcg gccataaagt gtttatggtg aaaccggaag aaccgtttca gccggtgaaa 720
gaagcgaccc agctgatgaa cgaactg 747
<210> 60
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
ctgcccagcc ggcgatggcc atgcgtcgca gtggtaatta caacccgtca cgttggg 57
<210> 61
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
ctttgtaatc gctcagcagg gattggataa aattcacatc ccaacgtgac gggttgt 57
<210> 62
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
tgctgagcga ttacaaagag gacaaacacg tcattcgggc aagcgaactg gttacac 57
<210> 63
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
gaatttggtc tgtttctttt tccagttcca ttttaaccag tgtaaccagt tcgcttg 57
<210> 64
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
aagaaacaga ccaaattcgc caattagagc tgattgacga cttacagcgc atggggc 57
<210> 65
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
acagaatctc tttgaactca ttctgaaagt gatcgctcag ccccatgcgc tgtaagt 57
<210> 66
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
agttcaaaga gattctgtca tctatctatc tggaccacca ttactataaa aaccctt 57
<210> 67
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ccaggcttgt gctatacaga tcacgttcct ctttcggaaa agggttttta tagtaat 57
<210> 68
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
tgtatagcac aagcctggcc tttcggttac tgcgtgagca tggcttccaa gtagcac 57
<210> 69
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
actcgccctc ttcattcttg aagctatcga atacctcttg tgctacttgg aagccat 57
<210> 70
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
agaatgaaga gggcgagttc aaagaatcac tgtccgatga tactcgtggc ttattac 57
<210> 71
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
tctccccctc ggtcagcaga aagctcgctt catacagttg taataagcca cgagtat 57
<210> 72
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
tgctgaccga gggggagacg actctggaaa gcgcacggga atttgcgacc aaattct 57
<210> 73
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gatcgccatc tacgccgcct tcatttactt tctcttctaa gaatttggtc gcaaatt 57
<210> 74
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gcggcgtaga tggcgatctg ttaacccgca tcgcgtattc tctggacatt ccgttac 57
<210> 75
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
caatccacac cggcgcgttt ggccgtttaa tacgccagtg taacggaatg tccagag 57
<210> 76
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
acgcgccggt gtggattgag tggtatcgca aacgtccaga catgaacccg gtggtgc 57
<210> 77
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gagcctgcac gatgtttaag tctaaaattg ctaattccag caccaccggg ttcatgt 57
<210> 78
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ttaaacatcg tgcaggctca atttcaggaa gaactgaaag aatcttttcg ctggtgg 57
<210> 79
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
cgcgcaaacg gtaatttttc aacgaagccg gtgttgcgcc accagcgaaa agattct 57
<210> 80
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
aaaaattacc gtttgcgcgc gatcgtctgg ttgaatgtta tttctggaat accggca 57
<210> 81
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
ctggcgcggt tcgataatgc cggtattcca gaaata 36
<210> 82
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
attatcgaac cgcgccagca cgcgagcgcc cgtattatga tgggtaaggt caatgcg 57
<210> 83
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gccgtataca tcgtaaatat cgtcaatgac agtaatcagc gcattgacct tacccat 57
<210> 84
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
atttacgatg tatacggcac tctggaagaa ctggagcagt ttacagattt aatccgc 57
<210> 85
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gtaatctggc agctggtcga tgctattgat gtcccaccgg cggattaaat ctgtaaa 57
<210> 86
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gaccagctgc cagattacat gcagctgtgt tttctggcgc tgaataactt tgtggac 57
<210> 87
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
attcacgcct ttttctttca tgacgtcata agaggtgtcg tccacaaagt tattcag 57
<210> 88
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
aaagaaaaag gcgtgaatgt tatcccttat ctgcgtcaga gttgggtgga tctggcc 57
<210> 89
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
cccaccgtag aaccagcgtg cctcaaccat atatttatcg gccagatcca cccaact 57
<210> 90
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
cgctggttct acggtgggca caaaccgagt ttagaagaat atctggagaa ctcatgg 57
<210> 91
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
gaagatatgc gtcagcatgc atggcccact gatactctgc catgagttct ccagata 57
<210> 92
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
atgctgacgc atatcttctt tcgcgtcacg gattcattta ccaaggagac ggtcgat 57
<210> 93
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
agatgaccaa cgaaccaggt catggtattt atataaggaa tcgaccgtct ccttggt 57
<210> 94
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ctggttcgtt ggtcatcttt cgtcctgcgg ctggcggacg atctgggtac gtctgtg 57
<210> 95
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
ctgtaaggat ttcggaacat ccccacgaga cacctcttcc acagacgtac ccagatc 57
<210> 96
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
gttccgaaat ccttacagtg ctacatgtcc gattataacg caagtgaagc tgaagct 57
<210> 97
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
cttccacact tcggcgatca gccacttcac atgtttgcga gcttcagctt cacttgc 57
<210> 98
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
atcgccgaag tgtggaagaa gatgaacgct gaacgtgttt ccaaggatag tccgttt 57
<210> 99
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
acgacccaga tcaacggcgc aaccaataaa atccttacca aacggactat ccttgga 57
<210> 100
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
cgccgttgat ctgggtcgta tggcccagct gatgtatcat aacggtgatg gtcatgg 57
<210> 101
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
tacgcgtcat ctgctgatga ataataggat gctgggtccc atgaccatca ccgttat 57
<210> 102
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
catcagcaga tgacgcgtac cctgtttgaa cctttcgccc tcgagtgaat ggatatc 57
<210> 103
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ggatccgaat taattccgat atccattcac tcgagg 36
<210> 104
<211> 1638
<212> DNA
<213> 未知(Unknown)
<400> 104
atgcgtcgca gtggtaatta caacccgtca cgttgggatg tgaattttat ccaatccctg 60
ctgagcgatt acaaagagga caaacacgtc attcgggcaa gcgaactggt tacactggtt 120
aaaatggaac tggaaaaaga aacagaccaa attcgccaat tagagctgat tgacgactta 180
cagcgcatgg ggctgagcga tcactttcag aatgagttca aagagattct gtcatctatc 240
tatctggacc accattacta taaaaaccct tttccgaaag aggaacgtga tctgtatagc 300
acaagcctgg cctttcggtt actgcgtgag catggcttcc aagtagcaca agaggtattc 360
gatagcttca agaatgaaga gggcgagttc aaagaatcac tgtccgatga tactcgtggc 420
ttattacaac tgtatgaagc gagctttctg ctgaccgagg gggagacgac tctggaaagc 480
gcacgggaat ttgcgaccaa attcttagaa gagaaagtaa atgaaggcgg cgtagatggc 540
gatctgttaa cccgcatcgc gtattctctg gacattccgt tacactggcg tattaaacgg 600
ccaaacgcgc cggtgtggat tgagtggtat cgcaaacgtc cagacatgaa cccggtggtg 660
ctggaattag caattttaga cttaaacatc gtgcaggctc aatttcagga agaactgaaa 720
gaatcttttc gctggtggcg caacaccggc ttcgttgaaa aattaccgtt tgcgcgcgat 780
cgtctggttg aatgttattt ctggaatacc ggcattatcg aaccgcgcca gcacgcgagc 840
gcccgtatta tgatgggtaa ggtcaatgcg ctgattactg tcattgacga tatttacgat 900
gtatacggca ctctggaaga actggagcag tttacagatt taatccgccg gtgggacatc 960
aatagcatcg accagctgcc agattacatg cagctgtgtt ttctggcgct gaataacttt 1020
gtggacgaca cctcttatga cgtcatgaaa gaaaaaggcg tgaatgttat cccttatctg 1080
cgtcagagtt gggtggatct ggccgataaa tatatggttg aggcacgctg gttctacggt 1140
gggcacaaac cgagtttaga agaatatctg gagaactcat ggcagagtat cagtgggcca 1200
tgcatgctga cgcatatctt ctttcgcgtc acggattcat ttaccaagga gacggtcgat 1260
tccttatata aataccatga cctggttcgt tggtcatctt tcgtcctgcg gctggcggac 1320
gatctgggta cgtctgtgga agaggtgtct cgtggggatg ttccgaaatc cttacagtgc 1380
tacatgtccg attataacgc aagtgaagct gaagctcgca aacatgtgaa gtggctgatc 1440
gccgaagtgt ggaagaagat gaacgctgaa cgtgtttcca aggatagtcc gtttggtaag 1500
gattttattg gttgcgccgt tgatctgggt cgtatggccc agctgatgta tcataacggt 1560
gatggtcatg ggacccagca tcctattatt catcagcaga tgacgcgtac cctgtttgaa 1620
cctttcgccc tcgagtga 1638

Claims (7)

1.一种全基因合成方法,其特征在于,包括如下步骤:
(1)引物设计:
设计覆盖目的基因全长的寡核苷酸即引物;
(2)酶链聚合反应:
将所有步骤(1)设计的寡核苷酸与质粒载体混合在一管中进行PCR反应,基因合成在一轮PCR中完成:寡核苷酸互相退火延伸,形成长片段;长片段以质粒载体为模板进行退火、成指数反向PCR方式延伸、扩增,得到含有全长目的基因的线性质粒,通过一轮PCR反应,可以同时合成目的基因并将目的基因整合到质粒载体中;
(3)DpnI酶消化及转化:
采用DpnI酶消化步骤(2)得到的PCR产物,把质粒载体从线性质粒上消化去掉,将消化产物转化大肠杆菌感受态细胞并涂于含氨卞青霉素的LB琼脂平板皿上培养;
(4)菌落PCR筛选及测序验证:
挑选在步骤(3)制备的含氨卞青霉素的LB琼脂平板皿上长出的菌落,进行菌落PCR,电泳,筛选长度正确的克隆,检测是否得到目的基因;
(5)原核表达验证合成的基因是否具有功能:
采用异丙基硫代半乳糖苷(IPTG)诱导的方式,验证合成基因在BL21(DE3)中的表达。
2.如权利要求1所述的一种全基因合成方法,其特征在于,所述步骤(1)具体操作如下:从数据库调取基因序列,根据大肠杆菌密码子偏好性,对编码序列进行优化,手动或在线软件设计覆盖目的基因全长的寡核苷酸即引物,包括2个最外侧引物,通过聚丙烯酰胺凝胶电泳(SDS-PAGE)纯化寡核苷酸,根据Tm值设置相邻引物之间的重叠区,使相邻引物末端能够在PCR反应时相连,质粒载体插入位点一侧与一个最外侧的引物3’端序列同源,质粒载体插入位点另一侧与另一个最外侧的引物3’端序列同源。
3.如权利要求1所述的一种全基因合成方法,其特征在于,
所述步骤(2)PCR条件如下:PCR体系为:1×缓冲液,40pmol-2pmol混合引物即步骤(1)设计的引物,0.4mM dNTP,1mM MgSO4,1U高保真DNA聚合酶和1ng-50ng质粒载体;
PCR反应包括两个阶段,第一阶段反应条件:94℃预变性2min,98℃变性10s,60℃退火30s,68℃延伸,10个循环,第一阶段过程中,引物即寡核苷酸互相退火延伸,形成不同的长片段,部分长片段由最外侧引物和寡核苷酸退火延伸而成,所以该部分长片段包括含有与质粒载体插入位点一侧同源序列的长片段以及含有与质粒载体插入位点另一侧同源序列的长片段;
第二阶段反应条件:94℃预变性2min,98℃变性10s,60℃退火30s,68℃延伸,20个循环,然后保持68℃充分延伸,第二阶段过程中,含有与质粒载体插入位点一侧同源序列的长片段及含有与质粒载体插入位点另一侧同源序列的长片段与质粒载体部分序列发生互补,即这两种长片段作为大引物以质粒载体为模板,其他长片段和dNTP能够在这两种长片段3’端以反向PCR的方式进行退火延伸,得到含有目的基因全长的线性质粒。
4.如权利要求1所述的一种全基因合成方法,其特征在于,
所述步骤(3)所述的转化操作如下:从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的LB培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的LB琼脂平板皿上,37℃培养过夜;第三日晚在含氨卞青霉素的LB琼脂平板皿上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的LB培养基中,37℃,220rpm摇床培养过夜。
5.如权利要求1所述的一种全基因合成方法,其特征在于,
所述步骤(4)具体如下:取若干灭菌的PCR管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从步骤(3)制备的含氨卞青霉素的LB琼脂平板皿上挑取菌落即转化子,溶解到PCR管中,制成菌液,整个过程需要在超净工作台中进行;取5μl所得菌液作为模板,加入含有DNA聚合酶、dNTP及引物的PCR混合液中,通过PCR扩增目的基因,电泳,筛选长度正确的克隆,检测是否得到目的片段。
6.如权利要求1所述的一种全基因合成方法,其特征在于,
所述步骤(5)具体如下:将测序正确的质粒即合成的目的基因转入BL21(DE3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的LB培养基中,37℃,220rpm,摇床培养,当OD600达到0.6时,以1:100的比例转入500ml补充有抗生素的LB培养基中,继续37℃,220rpm,摇床培养至OD600达到0.6,加入0.5mM的异丙基硫代半乳糖苷(IPTG)进行诱导,37℃诱导4h或者25℃诱导过夜。
7.如权利要求1所述的一种全基因合成方法,其特征在于,
所述目的基因包括eGFP基因、RFP基因、烟草花叶蚀刻病毒蛋白酶基因、长度为1638bp的基因。
CN201710947566.9A 2017-10-12 2017-10-12 一种全基因合成方法 Pending CN107828778A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710947566.9A CN107828778A (zh) 2017-10-12 2017-10-12 一种全基因合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710947566.9A CN107828778A (zh) 2017-10-12 2017-10-12 一种全基因合成方法

Publications (1)

Publication Number Publication Date
CN107828778A true CN107828778A (zh) 2018-03-23

Family

ID=61648001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710947566.9A Pending CN107828778A (zh) 2017-10-12 2017-10-12 一种全基因合成方法

Country Status (1)

Country Link
CN (1) CN107828778A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110551802A (zh) * 2019-10-10 2019-12-10 周口师范学院 一种快速合成全基因序列的方法及其应用
CN114958886A (zh) * 2022-03-22 2022-08-30 江南大学 一种简便的基因合成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321612A (zh) * 2011-08-29 2012-01-18 苏州金唯智生物科技有限公司 工业化的基因合成方法
US20140273128A1 (en) * 2013-03-14 2014-09-18 Intrexon Corporation Biological Conversion of Multi-Carbon Compounds from Methane

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102321612A (zh) * 2011-08-29 2012-01-18 苏州金唯智生物科技有限公司 工业化的基因合成方法
US20140273128A1 (en) * 2013-03-14 2014-09-18 Intrexon Corporation Biological Conversion of Multi-Carbon Compounds from Methane

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
毕廷震等: "一种无缝基因克隆方法", 《中国畜牧兽医学会动物繁殖学分会第十六届学术研讨会论文集》 *
陆路等: "RF克隆结合巢式PCR构建金黄色葡萄球菌组氨酸蛋白激酶AgrC表达载体", 《中国生物工程杂志》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110551802A (zh) * 2019-10-10 2019-12-10 周口师范学院 一种快速合成全基因序列的方法及其应用
CN114958886A (zh) * 2022-03-22 2022-08-30 江南大学 一种简便的基因合成方法

Similar Documents

Publication Publication Date Title
JP6888162B2 (ja) デジタル生物学的コンバータ
Gibson Enzymatic assembly of overlapping DNA fragments
KR101467969B1 (ko) 핵산분자의 제조방법
Xiong et al. Chemical gene synthesis: strategies, softwares, error corrections, and applications
AU2002354854A1 (en) Process for the preparation of l-amino acids using strains of the enterobacteriaceae family which contain an enhanced phoe gene
CN106755037A (zh) 一种维吉尼亚链霉菌IBL14 type I‑B‑sv14型CAS基因编辑系统
CN111154739B (zh) 一种新型重组酶依赖型扩增方法及试剂盒
CN107828778A (zh) 一种全基因合成方法
CN109385417A (zh) 体内dna无缝组装方法
JP2007043963A (ja) Dnaリガーゼ変異体
CN108913700B (zh) gp32单链结合蛋白的制备方法、表达基因、重组表达载体及应用
WO2021147910A1 (en) Methods and kits for amplification and detection of nucleic acids
CN104404077B (zh) 一种将多个外源基因同时克隆到微生物基因组的方法
CN105969784A (zh) 一种不依赖重组酶的dna无缝克隆方法
EP2357225A1 (en) Thermostable primase/DNA polymerase of the Thermococcus nautilus 30/1 plasmid pTN2 and its applications
CN112980891A (zh) 一种基于CRISPR-Cas的大肠杆菌基因组编辑工具
JP2022513408A (ja) Dnaライブラリーの多重化決定論的アセンブリー
CN108486140A (zh) 一种基于无缝克隆技术的克隆载体制备方法以及试剂盒
CN111394379B (zh) 基于重组酶和超保真dna聚合酶的大载体dna的定点突变方法
US20060199185A1 (en) Plasmid having a function of t-vector and expression vector, and expression of the target gene using the same
CN104404029A (zh) 一种基于甲基化环状dna分子的突变方法
CN111434771A (zh) 一种线性化载体自重组的质粒构建方法
KR101155368B1 (ko) 나노아케움 이퀴탄스 플러스 DNA 중합효소, 이의제조방법 및 데옥시유티피 (dUTP)와 우라실-DNA글리코실라제 (UDG)를 이용한 중합효소 연쇄 반응(PCR) 방법
WO2010105276A1 (en) Method for constructing mutagenesis libraries in situ
CN115927422A (zh) 一种用于无缝克隆的质粒及其构建方法与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180323

RJ01 Rejection of invention patent application after publication