CN111926393A - 一种测序文库的构建方法及其应用 - Google Patents

一种测序文库的构建方法及其应用 Download PDF

Info

Publication number
CN111926393A
CN111926393A CN201910394932.1A CN201910394932A CN111926393A CN 111926393 A CN111926393 A CN 111926393A CN 201910394932 A CN201910394932 A CN 201910394932A CN 111926393 A CN111926393 A CN 111926393A
Authority
CN
China
Prior art keywords
sequencing
sequenced
mixed
sequence
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910394932.1A
Other languages
English (en)
Inventor
史泓杰
冯建龙
叶立
张利民
陈大飞
倪志伟
姜伟
张飞
陈豫
周祯祯
吴昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Jinweizhi Biological Technology Co ltd
Original Assignee
Suzhou Jinweizhi Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Jinweizhi Biological Technology Co ltd filed Critical Suzhou Jinweizhi Biological Technology Co ltd
Priority to CN201910394932.1A priority Critical patent/CN111926393A/zh
Priority to PCT/CN2019/121334 priority patent/WO2020228298A1/zh
Publication of CN111926393A publication Critical patent/CN111926393A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种测序文库的构建方法及其应用,所述方法包括以下步骤:(1)将M个待测序样本分别转入感受态细菌,划线过夜培养;(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,进行单独培养;(3)将包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;(4)对N份混合菌液分别提取质粒,线性化酶切;(5)向N份线性化混合质粒添加不同的标签序列,混合后得到测序文库;其中,M和N为正整数。本发明采用混合抽提酶切步骤,在提高样本量的同时,省去了单克隆筛选过程,减少了99%的质粒抽提工作,有利于实现三代测序替代一代测序应用于基因合成中。

Description

一种测序文库的构建方法及其应用
技术领域
本发明属于生物技术领域,涉及一种测序文库的构建方法及其应用。
背景技术
传统的工业化基因合成过程中,合成的片段需要导入载体进行测序验证,目前大多采用一代Sanger测序,使用的仪器是ABI公司的3730测序仪,一次可以进行96个反应,每个反应的测序读长约700bp,共计约76200bp。Sanger 测序的具体步骤为:将含有插入片段的载体转移到感受态细菌中,均匀涂抹于培养皿中过夜培养;挑选单克隆菌株在200μL培养基中培养2小时;用特异引物进行PCR扩增,将得到的条带进行Sanger测序验证,将测序结果与标准序列进行人工比对,选择100%正确的克隆进行下一步实验。然而,采用Sanger法进行测序验证,前期需要花费大量的人力进行样本扩增和筛选,成本高、耗时长。
CN 107760672 A公开了一种基于二代测序技术的工业化基因合成方法,该方法包括如下步骤:将待合成的序列拆分成多段小片段,然后用首尾合成引物合成拆分的多段小片段;采用5’端含有20个随机碱基的扩增用上下游引物对合成的小片段进行扩增;将扩增后的所有小片段混合,然后采用二代测序技术进行测序,将测序结果进行对比分析,找到与预期完全一致的序列,从而确定该序列两端的随机序列为所需序列,然后根据所需序列设计调取引物;采用调取引物对扩增后的小片段进行第一轮调取扩增,然后首尾合成引物进行第二轮调取扩增,然后将第二轮调取扩增后的片段进行组装即得序列产物。但是,该方法需要对样本进行拆分,设计多组引物进行PCR扩增,过程繁琐、耗时较长,且对高GC、高重复序列或含有poly结构的特殊样本测序效果差、测序准确度低。
三代Pacbio测序基于单分子实时测序和零模波导孔技术,可以对每个文库进行独立的单分子测序,测序过程由于不进行PCR扩增,无GC偏好性,测序深度达20×,测序准确度达99.99%,测序读长可达100kb以上。Pacbio测序芯片上有1百万个零模波导孔,读长达数千碱基,不需要额外设计测序引物,可以同时进行上万个样本的测序,在规定的样本数量内,测序成本不会随样本量的增加而升高。但是,三代测序在基因合成中的应用受限于样本数量大,建库成本高等条件,无法真正运用起来。
如何将三代测序替代一代或二代测序应用于基因合成,是本领域亟待解决的问题。
发明内容
针对现有技术的不足,本发明提供了一种混合抽提酶切方法及其应用,所述方法将菌液混合后抽提质粒,将质粒酶切后得到的线性化片段加标签序列进行三代测序,最后使用自动化拆分分析程序对结果进行处理,实现了大规模低成本对大量克隆进行三代测序,并成功应用于基因合成中。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供了一种测序文库的构建方法,所述方法包括以下步骤:
(1)将M个待测序样本分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,进行单独培养;
(3)将包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,线性化酶切;
(5)向N份线性化混合质粒添加不同的标签序列,混合后得到测序文库;
其中,M和N为正整数。
本发明中,文库构建过程中采用混合抽提酶切步骤,在提高样本量的同时,省去了单克隆筛选过程,减少了99%的质粒抽提工作,缩短了菌液培养时间,有利于实现三代测序替代一代测序应用于基因合成中。
优选地,步骤(1)所述待测序样本包括合成的基因片段。
优选地,所述基因片段的长度为500-10000bp,例如可以是500bp、1000bp、2000bp、3000bp、4000bp、5000bp、6000bp、7000bp、8000bp、9000bp或 10000bp,优选为4000-6000bp。
本发明中,文库构建过程和测序过程不涉及PCR,无需对待测序样本进行拆分,测序结果无需拼接组装,直接通过分析程序进行处理,实现了长片段的完整测序,显著降低了测序成本。
优选地,步骤(2)所述培养在96孔板中进行。
优选地,步骤(4)所述酶切采用限制性内切酶进行。
本发明中,根据质粒信息选取合适的酶切位点和限制性内切酶,对质粒进行线性化,所述限制性内切酶包括但不限于EcoR I、BamH I、Hind II、Hind III、 Alu I、BsuR I、Bal I、Hal III、HPa I或Sma I中的任意一种。
优选地,在步骤(5)之前还包括对线性化酶切质粒进行修复的步骤。
优选地,所述修复包括损伤修复和/或末端修复。
本发明中,通过对线性化酶切质粒进行修复,使产物呈完整的双链DNA,有利于后续三代测序的进行。
优选地,步骤(5)所述标签序列通过DNA连接酶连接在线性化质粒的两端。
优选地,在步骤(5)之后还包括对文库进行回收纯化的步骤。
优选地,所述回收纯化包括采用磁珠回收后,再用核酸酶消化未连接标签序列的DNA。
作为优选技术方案,本发明提供了一种测序文库的构建方法,所述方法包括以下步骤:
(1)将M个待验证的长度为500-10000bp合成的基因片段分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,单独培养在 96孔板的同一列中;
(3)将96孔板中同一行的包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,采用限制性内切酶进行线性化酶切,修复后得到完整双链的质粒DNA;
(5)采用DNA连接酶向N份线性化混合质粒添加不同的标签序列,混合后用磁珠回收一次,再用核酸酶消化未连接标签序列的DNA,得到测序文库;
其中,M和N为正整数。
第二方面,本发明提供了一种基于三代测序的测序验证方法,所述方法包括以下步骤:
(1’)采用如第一方面所述的方法进行文库构建;
(2’)对构建的文库进行浓度和分布范围的检测;
(3’)三代测序;
(4’)结果分析。
优选地,步骤(3’)所述三代测序包括Pacbio单分子荧光测序和/或纳米孔测序,优选为Pacbio单分子荧光测序。
优选地,步骤(4’)所述结果分析包括:
根据标签序列和待测序样本的保守序列拆分测序结果;
去除低丰度CCS序列;
将测序结果与参考序列进行比对。
本发明中,标签序列用于确定混合菌液的编号,待测样本的保守序列用于确定混合菌液中样本的种类,通过自动化拆分分析程序,根据标签序列和待测序样本的保守序列拆分测序结果,实现了测序结果与样本的自动化对应。
本发明中,术语“低丰度CCS序列”指丰度小于3的CCS序列。
第三方面,本发明提供了一种基因合成方法,所述方法包括将合成的基因片段采用如第二方面所述的方法进行测序验证的步骤。
作为优选技术方案,本发明提供了一种基因合成方法,所述方法包括以下步骤:
(1)将M个待验证的长度为500-10000bp合成的基因片段分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,单独培养在 96孔板的同一列中;
(3)将96孔板中同一行的包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,采用限制性内切酶进行线性化酶切,修复后得到完整双链的质粒DNA;
(5)采用DNA连接酶向N份线性化混合质粒添加不同的标签序列,混合后用磁珠回收一次,再用核酸酶消化未连接标签序列的DNA,得到测序文库;
(6)对构建的文库进行浓度和分布范围的检测;
(7)Pacbio单分子荧光测序;
(8)根据标签序列和待验证基因片段的保守序列拆分测序结果,去除小于 3的低丰度CCS序列,将测序结果与参考序列进行比对。
第四方面,本发明提供了一种如第一方面所述的测序文库的构建方法和/或如第二方面所述的基于三代测序的测序验证方法在基因合成中的应用。
与现有技术相比,本发明具有如下有益效果:
(1)本发明将菌液混合后抽提质粒,将质粒酶切后得到的线性化片段加标签序列进行三代测序,最后使用自动化拆分分析程序对结果进行处理,在提高样本量的同时,省去了单克隆筛选过程,减少了99%的质粒抽提工作,缩短了菌液培养时间,并成功应用于基因合成中;
(2)本发明采用三代测序进行合成基因的测序验证,一次测序可以至少完成5000个单克隆的测序,按照每个单克隆长度为5000bp,共计约2.5×107bp,单个碱基的测序成本仅为Sanger测序的4.7%,实现了大规模低成本对大量克隆进行三代测序;
(3)本发明采用混合抽提酶切步骤,不涉及扩增,对基因序列没有限制,不需要对序列进行拆分,测序结果无需组装,可以通过分析程序进行处理,实现了基因的全长测序。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例1文库构建
本实施例通过基因合成的方法合成了600条基因,编号为1、2、3……600,示例性地,本实施例列举6条基因的参考序列SEQ ID NO:1~6,序列信息详见序列表。
(1)将600条待验证的基因分别转入感受态细菌,涂平板后进行过夜培养;
(2)整理过夜培养后的平板,每条基因挑取8个圆润、独立、饱满的菌落,以表1-1和表1-2所示的对应方式放入50块96孔板中进行培养,共得到4800 个单克隆:
表1-1
Figure RE-GDA0002126669550000071
Figure RE-GDA0002126669550000081
表1-2
1 2 3 4 5 6 7 8 9 10 11 12
A 13A 14A 15A 16A 17A 18A 19A 20A 21A 22A 23A 24A
B 13B 14B 15B 16B 17B 18B 19B 20B 21B 22B 23B 24B
C 13C 14C 15C 16C 17C 18C 19C 20C 21C 22C 23C 24C
D 13D 14D 15D 16D 17D 18D 19D 20D 21D 22D 23D 24D
E 13E 14E 15E 16E 17E 18E 19E 20E 21E 22E 23E 24E
F 13F 14F 15F 16F 17F 18F 19F 20F 21F 22F 23F 24F
G 13G 14G 15G 16G 17G 18G 19G 20G 21G 22G 23G 24G
H 13H 14H 15H 16H 17H 18H 19H 20H 21H 22H 23H 24H
……
(3)待培养一定时长后,将50块96孔板中字母相同的菌液混合,得到8 份混合菌液AB…H;
(4)采用AXYGEN质粒抽提试剂盒对8份混合菌液进行抽提,得到8份混合质粒AB…H,采用Hind III限制性内切酶对混合质粒进行线性化酶切,得到8份混合的线性化质粒AB…H;
(5)使用Qubit 3.0进行定量,每份样品取150-200ng DNA进行SMRTbell 文库构建:对线性化质粒进行DNA修复后,采用T4DNA连接酶将如表2所示的标签序列连接到双链DNA上,连接反应结束后,将加有不同标签序列的8 份样品混合,用1.0×AMPure beads回收一次,再用核酸酶III和VII消化未连接上标签的双链DNA,得到纯化的文库。
表2
编号 序列
SEQ ID NO:7 CGTCTGACTACTCACG
SEQ ID NO:8 CAACTGACTACTCACG
SEQ ID NO:9 CCCCTGACTACTCACG
SEQ ID NO:10 CGGCTGACTACTCACG
SEQ ID NO:11 CTTCTGACTACTCACG
SEQ ID NO:12 CATCTGACTACTCACG
SEQ ID NO:13 CCTCTGACTACTCACG
SEQ ID NO:14 CTCCTGACTACTCACG
实施例2 Pacbio Sequel测序和结果分析
(1)将实施例1纯化的文库进行QC,采用Qubit定量检测文库浓度和 Aglient 2100检测文库的分布与大小;
(2)根据经验选择上机浓度为3pM,加入测序引物Pacbio Sequencing Primer v3和酶Sequel DNA Polymerase 2.1,进行Pacbio Sequel测序,耗时约13 小时;
(3)测序完成后,自动化分析流程检测到完成信号,开始进行生物信息学分析,并生成分析结果,具体步骤为:
a)分析流程定时检查测序结果目录,判断测序是否已经完成,并且数据是否已经上传完毕;
b)测序数据上传完成,启动Pacbio data质量矫正程序,依据设置的 passnumber大于10,生产高质量的测序片段;
c)利用提供的index信息和每个克隆的标签序列信息,进行数据拆分,在拆分的同时,去除低丰度(小于3)的CCS序列,将测序结果对应到每个测序样本,并统计不能进行拆分的数据信息;
d)根据合成序列两端的质粒保守序列,从测序序列中提取目标合成序列信息,并与参考序列进行比对,比对软件采用Minimap2;
e)统计比对结果中与参考序列一致的测序序列数目,突变序列数目,统计结果提供该样本测序序列中最优序列的结果和最高丰度序列比对结果;
f)对于有突变的序列,提供测序序列与参考序列的BLAST比对结果,展示突变信息,辅助进行序列修复;
g)将所有分析结果整理到GS上机信息表中。
在编号为0227-Amp-1的96孔板中,F1孔对应的参考序列编号为LB3214-1,克隆编号为L008133,参考序列长662bp,具体的序列信息如SEQ ID NO:1所示。
根据提供的index信息(TTTATTATTAGCATATAAAA)、单克隆的标签序列信息(CGTCTGACTACTCACG,CGTCTGACTACTCACG)、载体标签序列 gaattgacgcgtattgggat和atcccaatggcgcgccgagc后,比对上最优的PacBio测序序列与参考序列100%精确匹配,无突变位点,丰度为108,最优序列的丰度占该标签序列下总丰度的95.575%。
该标签序列下最高丰度的测序序列与参考序列100%精确匹配,无突变位点,丰度为108,最优序列的丰度占该标签序列下总丰度的95.575%,该标签序列下总丰度占总reads数为113。
对比例1
与实施例2相比,将实施例1纯化的文库采用一代测序进行测序验证。
对比例2
与实施例2相比,将实施例1纯化的文库采用二代测序进行测序验证。
实施例2、对比例1和对比例2的测序验证方法的时长和单个碱基成本见表3。
表3
编号 测序方法 耗时(h) 100个碱基成本(元)
实施例2 Pacbio Sequel测序 13 0.139
对比例1 一代测序 2040 1.667
对比例2 二代测序 40 8.403
由此可见,在基因合成的应用中,采用三代测序进行测序验证,相较于一代和二代测序,不仅缩短了测序时长,而且显著降低了测序成本。
综上所述,本发明采用混合抽提酶切步骤,将质粒酶切后得到的线性化片段加标签序列进行三代测序,最后使用自动化拆分分析程序对结果进行处理,在提高样本量的同时,省去了单克隆筛选过程,减少了99%的质粒抽提工作,缩短了菌液培养时间,降低了测序成本,将测序结果与样本自动化对应,实现了三代测序替代一代测序应用于基因合成中。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
序列表
<110> 苏州金唯智生物科技有限公司
<120> 一种测序文库的构建方法及其应用
<130> 20190508
<160> 14
<170> SIPOSequenceListing 1.0
<210> 1
<211> 662
<212> DNA
<213> 人工合成()
<400> 1
gaattcgtga ttatgtggat agaggaaaac aaagtttaga aaccatttgt ttattattag 60
catataaaat aaaatatcct gaaaattttt ttttattaag aggtaaccac gaatgcgctt 120
caataaatag aatatacgga ttctatgacg aatgtaaaag aagatatagt gtgaaattat 180
ggaaaacatt tattgattgc tttaattgct tacctgtggc agctattatt gacgaaaaaa 240
ttttttgtat gcatggtggt ttatcacctg aattaaataa tatggaacaa ataaggaaaa 300
taactaggcc tactgatgtt cctgataatg gtttattatg tgatttattg tggtctgatc 360
cagaaaaaga aattaatggg tggggagaaa acgaccgcgg agtttctttc acattcggtc 420
aagatgttgt tcataacttt ttaagaaaag acgaattaga tttaatatgc agggcacatc 480
aggtcgtgga ggatggatat gaattttttg caaagcgcca attagttaca ttattttctg 540
ctcctaatta ttgtggagag tttgataatg ccggtgcaat gatgagtgtt gacgagacat 600
taatgtgttc gtttcaaatt ttaaaaccag tggaaaaaaa gaaagcagca aattaagacg 660
tc 662
<210> 2
<211> 5021
<212> DNA
<213> 人工合成()
<400> 2
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctaa gtaagcttgg 60
cattccggta ctgttggtaa agccaccatg gccgatgcta agaacattaa gaagggccct 120
gctcccttct accctctgga ggatggcacc gctggcgagc agctgcacaa ggccatgaag 180
aggtatgccc tggtgcctgg caccattgcc ttcaccgatg cccacattga ggtggacatc 240
acctatgccg agtacttcga gatgtctgtg cgcctggccg aggccatgaa gaggtacggc 300
ctgaacacca accaccgcat cgtggtgtgc tctgagaact ctctgcagtt cttcatgcca 360
gtgctgggcg ccctgttcat cggagtggcc gtggcccctg ctaacgacat ttacaacgag 420
cgcgagctgc tgaacagcat gggcatttct cagcctaccg tggtgttcgt gtctaagaag 480
ggcctgcaga agatcctgaa cgtgcagaag aagctgccta tcatccagaa gatcatcatc 540
atggactcta agaccgacta ccagggcttc cagagcatgt acacattcgt gacatctcat 600
ctgcctcctg gcttcaacga gtacgacttc gtgccagagt ctttcgacag ggacaaaacc 660
attgccctga tcatgaacag ctctgggtct accggcctgc ctaagggcgt ggccctgcct 720
catcgcaccg cctgtgtgcg cttctctcac gcccgcgacc ctattttcgg caaccagatc 780
atccccgaca ccgctattct gagcgtggtg ccattccacc acggcttcgg catgttcacc 840
accctgggct acctgatttg cggctttcgg gtggtgctga tgtaccgctt cgaggaggag 900
ctgttcctgc gcagcctgca agactacaaa attcagtctg ccctgctggt gccaaccctg 960
ttcagcttct tcgctaagag caccctgatc gacaagtacg acctgtctaa cctgcacgag 1020
attgcctctg gcggcgcccc actgtctaag gaggtgggcg aagccgtggc caagcgcttt 1080
catctgccag gcatccgcca gggctacggc ctgaccgaga caaccagcgc cattctgatt 1140
accccagagg gcgacgacaa gcctggcgcc gtgggcaagg tggtgccatt cttcgaggcc 1200
aaggtggtgg acctggacac cggcaagacc ctgggagtga accagcgcgg cgagctgtgt 1260
gtgcgcggcc ctatgattat gtccggctac gtgaataacc ctgaggccac aaacgccctg 1320
atcgacaagg acggctggct gcactctggc gacattgcct actgggacga ggacgagcac 1380
ttcttcatcg tggaccgcct gaagtctctg atcaagtaca agggctacca ggtggcccca 1440
gccgagctgg agtctatcct gctgcagcac cctaacattt tcgacgccgg agtggccggc 1500
ctgcccgacg acgatgccgg cgagctgcct gccgccgtcg tcgtgctgga acacggcaag 1560
accatgaccg agaaggagat cgtggactat gtggccagcc aggtgacaac cgccaagaag 1620
ctgcgcggcg gagtggtgtt cgtggacgag gtgcccaagg gcctgaccgg caagctggac 1680
gcccgcaaga tccgcgagat cctgatcaag gctaagaaag gcggcaagat cgccgtgaat 1740
tctgcttgca agaactggtt cagtagctta agccactttg tgatccacct taacagccac 1800
ggcttccctc ccgaggtgga ggagcaggcc gccggcaccc tgcccatgag ctgcgcccag 1860
gagagcggca tggatagaca ccctgctgct tgcgccagcg ccaggatcaa cgtctagggc 1920
gcggacttta tttatttatt tctttctaga gtcggggcgg ccggccgctt cgagcagaca 1980
tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct 2040
ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac 2100
aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg 2160
ttttttaaag caagtaaaac ctctacaaat gtggtaaaat cgataaggat ccgtcgaccg 2220
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc 2280
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 2340
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 2400
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 2460
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 2520
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 2580
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 2640
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 2700
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 2760
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 2820
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 2880
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 2940
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 3000
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 3060
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 3120
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 3180
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 3240
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 3300
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 3360
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 3420
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 3480
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 3540
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 3600
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 3660
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 3720
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 3780
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 3840
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 3900
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 3960
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 4020
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 4080
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 4140
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 4200
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 4260
aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4320
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 4380
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4440
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 4500
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4560
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 4620
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 4680
ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt gccattcgcc 4740
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 4800
gcccaagcta ccatgataag taagtaatat taaggtacgg gaggtacttg gagcggccgc 4860
aataaaatat ctttattttc attacatctg tgtgttggtt ttttgtgtga atcgatagta 4920
ctaacatacg ctctccatca aaacaaaacg aaacaaaaca aactagcaaa ataggctgtc 4980
cccagtgcaa gtgcaggtgc cagaacattt ctctatcgat a 5021
<210> 3
<211> 4200
<212> DNA
<213> 人工合成()
<400> 3
aagcttatga aggctctgtg ggccctgctg ttggtcccat tgctgacagg atgcctggcc 60
gagggagagc tggaggtgac agatcagctc ccagggcaaa gcgaccaacc ctgggagcag 120
gccctgaacc gcttctggga ttacctgcgc tgggtgcaga cgctttctga ccaggtccag 180
gaagagctgc agagctccca agtcacacag gaactgacgg tactgatgga ggacactatg 240
acggaagtaa aggcatacaa aaaggagctg gaggaacagc tgggcccagt ggcggaggag 300
acacgggcca ggctggctaa agaggtgcag gcgacacagg cccgtctggg agctgacatg 360
gaggatctac gcaaccgact cgggcagtac cgcaacgagg taaacaccat gctgggccag 420
agcacagatg agctgcggtc gcgcctctcc acacacctgc gcaagatgcg caagcgcctg 480
atgcgggatg cggatgatct gcagaagcgc ctggcggtgt acaaggccgg ggcacaggag 540
ggcgccgagc gcggtgtgag tgctatccgt gagcgcctgg ggccactggt ggagcagggt 600
cgtcagcgca cagccaacct aggcgctggc gccgcccagc ccctgcgcga tcgcgcccag 660
gctttgagtg accgcatccg agggcggctg gaggaagtgg gcaaccaggc ccgagaccgc 720
ctagaggagg tgcgtgagca gatggaggag gtgcgctcca agatggagga gcagacccag 780
cagatacgcc tgcaggccga gatcttccag gcccgcatca agggctggtt cgagccgcta 840
gtggaagaca tgcagcgcca gtgggcaaac ctaatggaga agatacaggc ctctgtggct 900
accaactcca ttgcctccac cacagtgccc tggagaaatc aatgaggatc caagcttatg 960
aaggctctgt gggccctgct gttggtccca ttgctgacag gatgcctggc cgagggagag 1020
ctggaggtga cagatcagct cccagggcaa agcgaccaac cctgggagca ggccctgaac 1080
cgcttctggg attacctgcg ctgggtgcag acgctttctg accaggtcca ggaagagctg 1140
cagagctccc aagtcacaca ggaactgacg gtactgatgg aggacactat gacggaagta 1200
aaggcataca aaaaggagct ggaggaacag ctgggcccag tggcggagga gacacgggcc 1260
aggctggcta aagaggtgca ggcgacacag gcccgtctgg gagctgacat ggaggatcta 1320
cgcaaccgac tcgggcagta ccgcaacgag gtaaacacca tgctgggcca gagcacagat 1380
gagctgcggt cgcgcctctc cacacacctg cgcaagatgc gcaagcgcct gatgcgggat 1440
gcggatgatc tgcagaagcg cctggcggtg tacaaggccg gggcacagga gggcgccgag 1500
cgcggtgtga gtgctatccg tgagcgcctg gggccactgg tggagcaggg tcgtcagcgc 1560
acagccaacc taggcgctgg cgccgcccag cccctgcgcg atcgcgccca ggctttgagt 1620
gaccgcatcc gagggcggct ggaggaagtg ggcaaccagg cccgagaccg cctagaggag 1680
gtgcgtgagc agatggagga ggtgcgctcc aagatggagg agcagaccca gcagatacgc 1740
ctgcaggccg agatcttcca ggcccgcatc aagggctggt tcgagccgct agtggaagac 1800
atgcagcgcc agtgggcaaa cctaatggag aagatacagg cctctgtggc taccaactcc 1860
attgcctcca ccacagtgcc ctggagaaat caatgaggat ccaagcttat gaaggctctg 1920
tgggccctgc tgttggtccc attgctgaca ggatgcctgg ccgagggaga gctggaggtg 1980
acagatcagc tcccagggca aagcgaccaa ccctgggagc aggccctgaa ccgcttctgg 2040
gattacctgc gctgggtgca gacgctttct gaccaggtcc aggaagagct gcagagctcc 2100
caagtcacac aggaactgac ggtactgatg gaggacacta tgacggaagt aaaggcatac 2160
aaaaaggagc tggaggaaca gctgggccca gtggcggagg agacacgggc caggctggct 2220
aaagaggtgc aggcgacaca ggcccgtctg ggagctgaca tggaggatct acgcaaccga 2280
ctcgggcagt accgcaacga ggtaaacacc atgctgggcc agagcacaga tgagctgcgg 2340
tcgcgcctct ccacacacct gcgcaagatg cgcaagcgcc tgatgcggga tgcggatgat 2400
ctgcagaagc gcctggcggt gtacaaggcc ggggcacagg agggcgccga gcgcggtgtg 2460
agtgctatcc gtgagcgcct ggggccactg gtggagcagg gtcgtcagcg cacagccaac 2520
ctaggcgctg gcgccgccca gcccctgcgc gatcgcgccc aggctttgag tgaccgcatc 2580
cgagggcggc tggaggaagt gggcaaccag gcccgagacc gcctagagga ggtgcgtgag 2640
cagatggagg aggtgcgctc caagatggag gagcagaccc agcagatacg cctgcaggcc 2700
gagatcttcc aggcccgcat caagggctgg ttcgagccgc tagtggaaga catgcagcgc 2760
cagtgggcaa acctaatgga gaagatacag gcctctgtgg ctaccaactc cattgcctcc 2820
accacagtgc cctggagaaa tcaatgagga tccaagctta tgaaggctct gtgggccctg 2880
ctgttggtcc cattgctgac aggatgcctg gccgagggag agctggaggt gacagatcag 2940
ctcccagggc aaagcgacca accctgggag caggccctga accgcttctg ggattacctg 3000
cgctgggtgc agacgctttc tgaccaggtc caggaagagc tgcagagctc ccaagtcaca 3060
caggaactga cggtactgat ggaggacact atgacggaag taaaggcata caaaaaggag 3120
ctggaggaac agctgggccc agtggcggag gagacacggg ccaggctggc taaagaggtg 3180
caggcgacac aggcccgtct gggagctgac atggaggatc tacgcaaccg actcgggcag 3240
taccgcaacg aggtaaacac catgctgggc cagagcacag atgagctgcg gtcgcgcctc 3300
tccacacacc tgcgcaagat gcgcaagcgc ctgatgcggg atgcggatga tctgcagaag 3360
cgcctggcgg tgtacaaggc cggggcacag gagggcgccg agcgcggtgt gagtgctatc 3420
cgtgagcgcc tggggccact ggtggagcag ggtcgtcagc gcacagccaa cctaggcgct 3480
ggcgccgccc agcccctgcg cgatcgcgcc caggctttga gtgaccgcat ccgagggcgg 3540
ctggaggaag tgggcaacca ggcccgagac cgcctagagg aggtgcgtga gcagatggag 3600
gaggtgcgct ccaagatgga ggagcagacc cagcagatac gcctgcaggc cgagatcttc 3660
caggcccgca tcaagggctg gttcgagccg ctagtggaag acatgcagcg ccagtgggca 3720
aacctaatgg agaagataca ggcctctgtg gctaccaact ccattgcctc caccacagtg 3780
ccctggagaa atcaatgagg atccgaactg acggtactga tggaggacac tatgacggaa 3840
gtaaaggcat acaaaaagga gctggaggaa cagctgggcc cagtggcgga ggagacacgg 3900
gccaggctgg ctaaagaggt gcaggcgaca caggcccgtc tgggagctga catggaggat 3960
ctacgcaacc gactcgggca gtaccgcaac gaggtaaaca ccatgctggg ccagagcaca 4020
gatgagctgc ggtcgcgcct ctccacacac ctgcgcaaga tgcgcaagcg cctgatgcgg 4080
gatgcggatg atctgcagaa gcgcctggcg gtgtacaagg ccggggcaca ggagggcgcc 4140
gagcgcggtg tgagtgctat ccgtgagcgc ctggggccac tggtggagca gggtcgtcag 4200
<210> 4
<211> 6189
<212> DNA
<213> 人工合成()
<400> 4
atgacgataa aggcacggcc tccaacgaga cctgtgggca cggccatgtt gggggcgggg 60
cttccggtca cccgcgccgg tggtttccgc cctgtaggcc cgcctctcca gcaacctgac 120
acctgcgccg cgccccttca ctgcgttccc cgcccctgca gcggccacag tggtgcggcc 180
ggcggccgag cgttctgagt cacccgggac tggaggtagg aacccagcca tggtgaacga 240
agccagagga aacagcagcc tcaacccctg cttggagggc agtgccagca gtggcagtga 300
gagctccaaa gatagttcga gatgttccac cccgggcctg gaccccgagc ggcatgagag 360
actccgggag aagatgaggc ggcgattgga atctggtgac aagtggttct ccctggaatt 420
cttccctcct cgaactgctg agggagctgt caatctcatc tcaaggtttg accggatggc 480
agcaggtggc cccctctaca tagacgtgac ctggcaccca gcaggtgacc ctggctcaga 540
caaggagacc tcctccatga tgatcgccag caccgccgtg aactactgtg gcctggagac 600
catcctgcac atgacctgct gccgtcagcg cctggaggag atcacgggcc atctgcacaa 660
agctaagcag ctgggcctga agaacatcat ggcgctgcgg ggagacccaa taggtgacca 720
gtgggaagag gaggagggag gcttcaacta cgcagtggac ctggtgaagc acatccgaag 780
tgagtttggt gactactttg acatctgtgt ggcaggttac cccaaaggcc accccgaagc 840
agggagcttt gaggctgacc tgaagcactt gaaggagaag gtgtctgcgg gagccgattt 900
catcatcacg cagcttttct ttgaggctga cacattcttc cgctttgtga aggcatgcac 960
cgacatgggc atcacttgcc ccatcgtccc cgggatcttt cccatccagg gctaccactc 1020
ccttcggcag cttgtgaagc tgtccaagct ggaggtgcca caggagatca aggacgtgat 1080
tgagccaatc aaagacaacg atgctgccat ccgcaactat ggcatcgagc tggccgtgag 1140
cctgtgccag gagcttctgg ccagtggctt ggtgccaggc ctccacttct acaccctcaa 1200
ccgcgagatg gctaccacag aggtgctgaa gcgcctgggg atgtggactg aggaccccag 1260
gcgtccccta ccctgggctc tcagcgccca ccccaagcgc cgagaggaag atgtacgtcc 1320
catcttctgg gcctccagac caaagagtta catctaccgt acccaggagt gggacgagtt 1380
ccctaacggc cgctggggca attcctcttc ccctgccttt ggggagctga aggactacta 1440
cctcttctac ctgaagagca agtcccccaa ggaggagctg ctgaagatgt ggggggagga 1500
gctgaccagt gaagaaagtg tctttgaagt cttcgttctt tacctctcgg gagaaccaaa 1560
ccggaatggt cacaaagtga cttgcctgcc ctggaacgat gagcccctgg cggctgagac 1620
cagcctgctg aaggaggagc tgctgcgggt gaaccgccag ggcatcctca ccatcaactc 1680
acagcccaac atcaacggga agccgtcctc cgaccccatc gtgggctggg gccccagcgg 1740
gggctatgtc ttccagaagg cctacttaga gtttttcact tcccgcgaga cagcggaagc 1800
acttctgcaa gtgctgaaga agtacgagct ccgggttaat taccaccttg tcaatgtgaa 1860
gggtgaaaac atcaccaatg cccctgaact gcagccgaat gctgtcactt ggggcatctt 1920
ccctgggcga gagatcatcc agcccaccgt agtggatccc gtcagcttca tgttctggaa 1980
ggacgaggcc tttgccctgt ggattgagcg gtggggaaag ctgtatgagg aggagtcccc 2040
gtcccgcacc atcatccagt acatccacga caactacttc ctggtcaacc tggtggacaa 2100
tgacttccca ctggacaact gcctctggca ggtggtggaa gacacattgg agcttctcaa 2160
caggcccacc cagaatgcga gagaaacgga ggctccatga ccctgcgtcc tgacgccctg 2220
cgttggagcc actcctgtcc cgccttcctc ctccacagtg ctgcttctct tgggaactcc 2280
actctccttc gtgtctctcc caccccggcc tccactcccc cacctgacaa tggcagctag 2340
actggagtga ggcttccagg ctcttcctgg acctgagtcg gccccacatg ggaacctagt 2400
actctctgct ctagccagga gtctgtgctc ttttggtggg gagcacttgc gtcctgcaga 2460
ggaccacagt gggtggcacc tcctgagaag gcgaggagag tggttgttgc caactaagcc 2520
ctcgaaccaa ggcagcctcc agagccagcc tgggactccc agtgaactta cacttggagc 2580
ccgtgcagta caggcaaaac acgcaagggc atcaggcact ggtggcatcg tagaagagat 2640
gtggcaaagt gctgtaccct tccacctcct agaggtgggc agctgggccc cacctacttg 2700
tgactgaagg ggcacaccac tgccctgcct gcccacttag ccgtccatgg caccagcccc 2760
ctggatgggc attgggctga cacctaccat gctgcttttt ggcacagttg tctattctga 2820
gccttgagag aaaaagtgcc ccttaagggt tgaaggcagt ctgaaccctt gtgcttggtg 2880
gggctcgtgg ccttcccctt ttgcctggct gtggaggcct gatgctgccc cgttccctgt 2940
cagaggctaa gatgagattt gccagcacag gggccccaga tctgcctggg cctgtgcagc 3000
agcccagctt cctggtgtat ttttcaggta ggcccttgtc ctgccagctg ccttcctcat 3060
cccctcgtcc tgtcccagag gttatctgcc tggcctggct ccccacgagt cacctgcaag 3120
ccccagggcc tgggggcagt gactggcagg tgcagatggg ctgtttcgtg tagtggaaga 3180
gcagcctgat ggccaagggg gtggacgcaa ttgtgggatg tcctctttac tcccttcctg 3240
gcctcactgg ctggggcaga ggggcagccg ctaggagaga ctgaaagcag cagctaggac 3300
tgaggagtgg gttttattgt ccttcagagc tcttcaagct gtcccctctg tcatcactcc 3360
ctggatgtgt ggggcatggt tccttccctg ggaaggctaa gttcagttct gttttttatt 3420
ctatgagaac aagtcacagc tgcagctggg ccccatgctc tgccccaagc ccccaacccc 3480
gcggtgctct ggcggcttcc tgtccactct cggggccctt ggggcctggc ttgctccagg 3540
gtcttgggct actggcagct cctctccttg ggctcctggc tgccaggcgt tggtgccact 3600
tcttaaaggc ctggaaccag ggaggagagg aaatgctatt gttgtgggct ttctccgggg 3660
tctgtgctgt gcctgctaga gcaacccctg tacccagctc cttttgtccc cagggcccct 3720
ccctctgccc caagcagcca gccagtcttg cctaggccaa atgcacaagc tcagaataga 3780
tctgatggtg agctgggaag ctgtactcag agcagagcaa atgagggagg gggcgctcag 3840
gacccaggcc ctccatgggc tagtgtgagt ggcagccatg cctcatgcca caccttcttc 3900
gcaaactgat ggaccgggtg ggcctggcct gagctggggc cacaaatcaa agcaagggct 3960
ccagcatcca gcctgtgtgt tctgtaatgg aactgacccc ctcccctgaa aacgaagggg 4020
ccccggggct ggcaagcagg gaaagctcca cggtgcgtgg ctgtggcaca gacttctgga 4080
aggctggctg agtggaatgc agggaagagg gcagtacctg ggaaaggacc cacccatctt 4140
cctgctgctg taactgctga gccactcgca gtcgcaggat ccgctgccac cacgtctgcc 4200
aggcccatct caggtgccac tccctgagct ttggggacag ttggcagaga aggcctcttg 4260
tgctcacgct cccccgcagt ccccagccct tctgcctttc tcccccgaca ctgctgcacc 4320
agagtgaaag ggctatggca agggggtgtc atctgaggag tattaagaat gcagattcct 4380
gggcctgtcc cccaaggttt tggagtcagt aggtccaagg gccatacttt tgagaggggt 4440
ttgggttaag tatgaggtga aatgggagat ggtcagtgtg gagaggggtg cacccactca 4500
ccagggtccg caccagctgc tctgcccctt gggcatccac ccagtgctgc catgccactg 4560
ccaggcacct ggcctgctgg gaaccccgca gcccgtgaag cagtgcctcg aggcaccggc 4620
gctgcaggta cttcctcctg atggccaaga gcatcgtgac ccttcagggc cagaaggagg 4680
gcagagccat gggcctgggc ctgcttttcc aggatcctgc aggaacgagc actggccaga 4740
gagggcccag ctgtagccat ggctcaggca agcccctcag cccttgcccc catccctcgg 4800
acccaccaaa ctgcacacac agctcctctt accgtagcct ccgtttatgg gccttgcttt 4860
gggctttgca ggctctgggc tcagggctgg agtgcgctct tggtccctgg tccctcgtcc 4920
acaggggcag gcctgggacc cagctactct gtccaggcca ctgtggccag agctggaagg 4980
cagggcagag ggaatgttcc ctgcaccctg gaaaggggag ttgagtcaca agaggttaag 5040
gtgggtccag gaaggcagct gctcttagtg cccgcctagg agttgagtac agtgaggagg 5100
gtggaggaag gtgctgagct tagccttgtg ccctgccccc atctccccag gcctccagcc 5160
tctcccggct gcctgccgcc caaagagaaa tcacaggggc ggggcaggaa tgcaaagtgt 5220
tttctcagaa cagctgaaac attccgaaga gggaatggat ggggagaatg gtcaatacac 5280
ataagaccgt gtcccaagga gctgatttcc aggcccctga ggactggaga ccgcttcacc 5340
cctgcacttc agacaccgtt tgtcccccgg ggcaaggtct ccttactctg agcccaggcc 5400
gttccccttg gcttcctccg tccacccagg ctgcactgca gtgatggcgc gggaggcacc 5460
agctctgtgg cctgtgtcca gcagctgcgg gtctgaagga atagccagag aggagcacct 5520
gaaccccatg ggcttggact tcctggggcc ccgctgggat ttcttcgctg ctctagctgg 5580
caggacacat cccggcctct tccacccatt cccccatgtg gctgaagaca ttccaacaat 5640
ggggtgggcc cataatagtt agccctcagt cagttcccgg agcacagccc tgggaggggg 5700
ctatttctct ccccactgaa aacatttcaa agctgagtta cttgtctgag gcctcatccc 5760
tcggaagccg tctgactcca gagtctgagc ccccggctag taccctatag agagggggct 5820
ctccaaaggg gctgctgggg catgtgtgcc tgtggcagaa aagaggagac cctggaattc 5880
agcaccctgg gtgccattcc cagcgtttag tttctagagg cctcagtttc tccatcagct 5940
tatgggatcc ttgtctttac tgacaagaat ggaatagaaa tgtaaaagta ctctgaaaag 6000
caattgccct gtaacttatc tagaaagaaa agaccctgag actccagaat ctgctgttgc 6060
catagcccca tatgtgtgaa ttctgcaact agccaaggct agttcctttc aattccattt 6120
aaaaaacaaa aaccagcagg tgtggtggct catggcgtaa tgggcctgcc caatgctttg 6180
ggaggccaa 6189
<210> 5
<211> 2041
<212> DNA
<213> 人工合成()
<400> 5
ctaattttga tgtaacaata agcaaatcca tctcattgac atgtcaactt accttaatct 60
ttaataagtg ataaagtcat atgtatgcca aaaattgcct tagcattgcg ttatgaccta 120
ccgttagtag atgtctgatt tgcacaccca ctttatataa aacccctgcc cgagtttaca 180
taaacactcc tgtgaaaact agttgccggt gggaaacctt taagaagccg tgctcgactt 240
cacaatgagg gtttcagggt ctgaggaggg tctgcacagg ctgggtgaaa tgtacccatt 300
caggaagcca cctgcaaaac ttgggcagca gccctgtctt tgctgggtga gaaagaaaag 360
tcctcgtctc tggcttcgtg aaaaggaaaa gactggactg agcatgactg gttaacaagg 420
actcctgcta accaggagac ccacccaagg cgtctaaatt aggggaccag gtgattttgt 480
gaagaactcg gaaattctgg attgaatggg agcaggggac atttctcaga tggctaagaa 540
gcagtgacat tagttggtct ttgcttaagg aatttagttg ccggtcggtc ttgcagttca 600
gagacacatt tctactggcc aatttctagg tgaacttacc tggcaatttg cctcctggtg 660
tgtgtcaggg ctagcttggg tcactggagg ctgctaactg ctctaaagat atgtccactg 720
ttgtttgtgt taagtctttg cgttgagcga aggaatttgc ctgatgtgta ctctgctttg 780
cttttcaagc cctcctggct ggttccaggt gcagaaaatg ccgtggtttt gctcgtcaac 840
atgcatgcac tcacccagca aacatactga ggcctttctc tgtgccagga gttggctacc 900
cttctttcaa aagacatgga gggttctcga tgggatctga agaaccctca gacttctgag 960
tgccacttca gacgtgccgc tcccacctct gcccgagccg ttgggaactc tgcggccaag 1020
tcagtctgac ctgctgagat cccgcggtcc agaagttatg gagaataagt gaacagtgtc 1080
cccatctgta ttatttccaa cctgtgctct acggtaggac agtaaccgag gtggtctaga 1140
gttgttctct atttttcttg gaagaaagaa aagaagtaag aagttgggag acacagagga 1200
aaagagggga cactgacata gatttgactg ggcttcctag gtcctgaaat gcagcgcagt 1260
ggagtcccca ctcagaaatt aatcccaaag gccacccact gcccctctgc acgcagccag 1320
gactctcttc cagagccttg tctagtggtg gccaaggcca tccaccacca cctttccggc 1380
cactgcctgc tttcgatcct cgcggcgagc gcttcctctc tcctgccatt ctcctcctcc 1440
tagtttctct ggatccctcc tcctccactt agtccctcct cctcccgccc aacctccccc 1500
acgtcccgac cagggctagc tagacgcctg gacagcccca gcgcaacgct cagcagcctc 1560
cctcttcttc ccgcactgtg cgctcttcct gggctcgagc gtctggagcc agtcccggag 1620
gctaccgcca ccaagacagg cgacgggtca cctggacgca agtctgagtc cgggtcccgt 1680
cgtcgttgcc gacgcagtca ccgggcacga ccgtgggact cagtctgact cggattaatc 1740
ccggagagcc agagccaacg actgccgagc cgggatgcga ccctcaggga ctgcgagaac 1800
caagctactg ctgctgctgg ctgcgctctg cgccgcaggt ggggcgctgg aggaaaagtt 1860
aatcccaaag gccacccact gcccctctgc acgcagccag gactctcttc cagagccttg 1920
tctagtggtg gccaaggcca tccaccacca cctttccggc cactgcctgc tttcgatcct 1980
cgcggcgagc gcttcctctc tcctgccatt ctcctcctcc tagtttctct ggatccctcc 2040
t 2041
<210> 6
<211> 9985
<212> DNA
<213> 人工合成()
<400> 6
atttagggcc tatttaagca gcaagccagt ctgcactaat gctgcccttc gcgcttgtca 60
aaagccggtg atcgcatagt atcgaatatg ttgtagcacg ttgtcgtgtg ttattacact 120
gtaagtaaag tgcattagtc atcggtcgta taaccgtatg cggactggaa tcattggtgt 180
cggttatcgg tcagttatcg atcaagccct ccgccctgca cctctcattg aaaggacacc 240
gctgtggatt gtttgggtct acagatgttt agtccattat aatgcaagat gcatgctgat 300
gctcactgaa aatagccgta aacagctgaa aatcgttgat attttggggt gaagaatgac 360
cgaatataag cttgtggtcg tgggagctgg aggcgtaggc aaaagcgctc tcaccatcca 420
actcatccag aaccactttg tggacgaata tgacccaact atagaggact cgtacaggaa 480
gcaggtggtg attgacggag agacgtgtct actggacatc ctggacactg caggtcagga 540
ggagtacagt gccatgaggg accagtacat gaggacagga gagggcttcc tctgtgtctt 600
tgccatcaat aacaccaagt ccttcgagga cattcaccac tacagggagc agataaagcg 660
agtaaaggac tccgaggacg tccccatggt tctggtgggg aataagtgtg atcttcagtc 720
ccacaatgtg gactccaagc aggctcagga tttagcacgc agctacggca tcccatttat 780
agagacctca gcaaagacaa gacagagagt ggaagatgcc ttttatactc tggtacggga 840
gatcagggaa taccggctga gaaaactcag taaagaagaa agacgacaca atgcatcaag 900
cttttggtcc gttgacgcct tgttttatgg cttatgttag cagacgggct gtcagaactg 960
ggtatatttt gcagttggtt tgagtagttt tagcagattt ctaaagagaa gtgtggattt 1020
aaaatggtgt gcagagatta gctgttagac tgcatgcgag tcacttgatt tttgatggaa 1080
ttgaaacttt gaggaactat gattgttatt ttgtttttaa tggaccaaca cttcttttgg 1140
ggagatgatt tgatacatta tcactgtgta tgaccctgcc tttggttgtc ccagacttcc 1200
aaaaacgaca tgcatgtgaa cttccattgt agtcggatta acatgccctc tctataaagc 1260
catggtagtg tgtgtgtgtg tgtgtgtgtg tatatatggt gaaatcttaa ccacgttaac 1320
attatttccc cgtttgcatg ctttatgttc tttaaacttc cagggaacgg tcatgtcttg 1380
aatactgttt aatagccact gttgtgtcgt tggtccagac aggcggtatt gtttaaacat 1440
ggcttttttt tcttttgatt taaatttatg aaggttgttt ggaagctcat ttccaccact 1500
gtattattcc tacttataaa aacaaattac aattctgaat attttgcaat tgcgaggacg 1560
agtctcatgt taatatttgt aatggagttg caaagtctgt taaccttctc cctcaactgc 1620
gtccgtgcat cacaattacg agtcacaact ctgtagttaa aaggttagga ttgcaagaag 1680
taaactactg tgagttgcat caaagtcctt ttaatgggat ggttcacccg aaaaatgaac 1740
atgcattcat tacttaggct gcatttacac tgcactgttc aagtgactca attcctgaat 1800
tttaatttat tttttctccc atgtggcaca gatcggatat ggctcatgta catagaagca 1860
ggaacaaatc acatggattc caatttactc aattcagatt caggccttgt tcatatgtgg 1920
aaatttatcc gatataaatc ggatcggtgt tcttgtgtct gcattgtaag caggtagatc 1980
agattttcac ctgtcaatgc caaagcgaat gacgtcaagt ctgacactta aatttcataa 2040
cagacttcag cagagtccca aaccttaaat gtcatacaca aggactcaaa cagcttttat 2100
actgtcatat agcacaggta tttaagcatg ttaacgagag caaaatgtct ggcacgtaac 2160
caatataaac taatataaaa ctagtgcata gctacatcac gtgcataaat caccgcatgg 2220
acattaggta gcctaaaggt ttaaaaaagc caatataatc aaaagaagat agacaaataa 2280
aaacctttgt cataaaacag cttgtcaaaa gctgcgaaca gattaaatac aggaatagag 2340
aaaagagcgc tctattatta tcagctgtta gtcagcgccc actcttattt tttttcctgg 2400
tcattgtgcc tttgacgtgc actgtgtaaa ttcaaacgat cggatacgag tcacttttat 2460
aagatgcaag caggtcatca aaaaacgatc ctacgatcag atacagtcac aaaatcggaa 2520
ttgaccatca agatctgcag tgtaaatgca gccttacact cactcaagtg ctttcaagcc 2580
attatggggt tctttctttc gttgaacact aagttacttt gaaaaaagtt agagacctgt 2640
aaccattgac ttccacagta cttgtttaac aggaaagaaa ctcaaacagg tttataacag 2700
acaagtaaat gattttcatt tttggggtaa ccatctcttg aaggcaagtc ctttcactct 2760
gtggccatct ttgaaactcc tttaatgctg tgttcacacc agatgctgaa cattaagttt 2820
acttttcatt tgcacatcaa attcgcttca ttcgagcatc aaattcattt cacgataaac 2880
gatttgcttc tgtctgcctg gtgactttag tttcattgct aacatggatt ttattgaggg 2940
agtagctgtg tttgtgcttt aggaaggctg aaaacagcgt gtattcattt ggcactattt 3000
ggagatgcac ttagctttca taaactcctc cagaaactat acctggatgg aggctttcag 3060
cagtgcttcc cactgtgccc agcccagttt aatgaactgt tgtccggtgt caccggtatt 3120
tcctctcggg acaccaacaa gaagcactac ttctgattgg ttaatgcaaa tgtgaatgtc 3180
agctgaagtt cagagtttcc aactctagtg atttacatga tatgcaaata aatatcctgc 3240
agcgcaaaat gatctactca tgccgcttca ttcctgcaaa tttcatcatt cgtgctgcct 3300
cgttctcgtg tattgcgtcg taggatgtct attcgcttat ttgcattgac ttaatgtaaa 3360
tcactcatgg tagacgcttc atctgtgtct ggtgtgaacg cagcattagt catgcaagta 3420
ttttatccca ctgaatgggg aaacatcaga ttctctggaa cagtttgcca agctccgatt 3480
taaatttcat atttggaatc atcaatgaca tttaacacaa actctcttgt aattttagct 3540
tgtaaacatt gtaaaacaaa aagtgttttt tcctcattcc ttcgctaatg cgcaatgcca 3600
attcgtaact atgatttagt ggctaattca tatgaatttg tatgacctta ttcatacatt 3660
ttagtactat ttactcatcc tccaatgatg ggtggggttt ggtgtcatgc ctctttaaat 3720
atcatacatt tttcgtaaaa ctgcactatt catacgaatt agccactaaa ctgacaaaac 3780
ataaaatagt tatgtctcct catgcaatca ggctggcatg cgcaaccgaa cggaacaaat 3840
tcacaacacc accctccttt tatggccatt tctgaaggac gtaatcagac gtaatccttt 3900
caatcaaacc atgttacttc cattagagtc aacatcttgc atcttacact ccatcctcta 3960
aatcatgccg tgtctgtttg cgctggtctt ctgaagtcat ttccaactta tttctgactg 4020
caaatctccc aaaatcatgg caatctcttt gtttacaaat tttgtgagcg ttcaagtggt 4080
tgctgtcatg tgattttgca tttgaatggt tgaggcagga aagatgactg tttataaggc 4140
aagattctag tgttcgctga ctccagtgga ttcaaaatga agctgcagaa actgtcgtga 4200
aaacatgtct ggactgtcta tagcatgggt ctcaaactca attcctaggg ggccacagct 4260
cttaatggct gcgtccaaag tcgcatactt ccatactata tagtaagctt aaaacagtac 4320
gtgagcataa tagtaaattc ggattcaaaa atcagtatgt gagaagtgat aacctactac 4380
caggtgatga cccaccactt ccggcgagat tttgaagtga gcgtcgaatg cacgctacgc 4440
tattccatga tgcactgaga agtggaagtg aagcgacgca actgaagctg cggtcacact 4500
gcacttttct ccacacgcac acgaacgcgt cagaccacaa acgcacgctc tagcaacaag 4560
tttcgcaatt cgctgcgttg gaaagttcaa gtttggcgaa atcgcatcac atgattgcgt 4620
gatacactga aaaaaagtgt tggatgcaga actgttgcaa acaatttgtt tgttgaattt 4680
aaacaaacaa attaagttta gtaatgttca acttaatttg tttgtttaaa atcagcccaa 4740
ataaattgtt taccacctct taacataaag aaattaagta aatccaagga atcatctttg 4800
aataattttt ttcagtgtag caattaaaga tcaaaacatg accactggac aggattttaa 4860
accagaccaa tcgcttgctt ttttaatgtc taataattta atcccgcccc ttctcgcagt 4920
gacgtatgac agaatttcgc aagttcaaac tctagtgtga ccgcagcttc acgcaggtag 4980
atcatgccaa aatggcggat gtagtacatc tgaattccat tcatgctact cttattcata 5040
ctgtatagaa tgtacttttc taacggccga gtagtacatt ttaatttcaa atgcagtacc 5100
tactgagcag taggcgtttt cggacgcagc cttggtgttc gaaagagtct cgaacacctt 5160
cattagttgg atcaaaactg tgcagagctg cggccctcca ggaattgagt ttgagaccca 5220
tactctatag cagtggtgtc caagttcagt cctgggaggc cggtgtcctg gagagtttag 5280
ttccaacccc aatcaaacac acccgaacca gctaattagg ctcttactgg atgttctaga 5340
aacttcctgg caggtgtgtt gaagcaagct ggagctaaac ttagcaggac accggccctc 5400
caggactaag tttagacacc cctgctctat agtgtttcat tggctctttt actagaaggc 5460
ggggcttcct tcactggagt gtccatgttg actgttgcat ttttttctta ttttaaacta 5520
tacaactgac acgtcttttg gttgcatctt gcatttctga gagggggaaa aactatttat 5580
gaatgtaaac ctggaataga cgcaaagaag acaattgaga cttccgagga atgcgtaaaa 5640
tctgaatcgt gagaatttgt agtttattta ttttttgttg ctattctgta ttggaatagc 5700
agctatgttt catttctttc cttttgtaat gagattttca cctcttggtt ggttaagaga 5760
gcatttgaca taacacctct ggctaaaaac aacagtaatt ttaacgttga gatactgtac 5820
aaaaaaagtg attaggatcg aagcacaaaa acacatttgt attcagagaa aagtcatact 5880
aaaagataaa gctgctgttg atcagtcaga atcaagtatt taggaaagcg ttaaatatga 5940
ttccattttg gaaggatcta cactagttaa agcctcactt ctgctttcag aggtgtgaat 6000
ttttaccctc ttgtgctcag ccaaacagcg ccttagaagt ctgaataaac actttgattt 6060
attttttttg ctaaattttg attcacgagt atagcctacc attgtgattt taaaatgtat 6120
gttaatggaa taaaacaaat gccttgttcc tgctgccatc acctatcaag tcattactcc 6180
accagtttga tgtccaacag agctttcctt ttgaacattt gaattcccaa gaggctgtcg 6240
gagtctagta tactatggta aaacggggca agaactagct ttcagttctg gagggcaaat 6300
tttcagccat cactcaaacc aaagagagtg atgtaaagat ttttattttg cgtggcaata 6360
cttgtgatgt catgagatga tgtcatgtgt gcaacaagca gtacgttgct ttaaaactcc 6420
ttcggtgagt ggttttacca tggtagtttt gttttctgat aattacttgc atgcaatttg 6480
actaatactg aggatctaca tgcaaaataa atcaggatgt ccgctcttat gcaaagtatt 6540
tgttgtgtga tttctgttcc ctttaaatca agcagtctgt aatggaagta gcaaagtcac 6600
taggtttttt ttttttactt gtttctgaaa tgttttctgt ttgtgtgcca aatgcaaatg 6660
ttgataaaac ggttcacgtg tatatggacc ttggtttaac aacctttgca tggatgtgat 6720
gataaagatg aatattttgt aaattgtgct tttggtttaa tgaactgatc gacgcttaat 6780
tgaaattaag ggtcacatgt taacgtctat gagaaattgc tgatctgagg tcatctttcg 6840
cctttcatgt gttggtaaat gtgattttat tagaattgaa aaataaagct gttctcagat 6900
ctgcacggtt ttataaatgc aacccagtct tgtttttccc cattaatctc accagtctta 6960
tttaatgtgt aattaaaaga agaacttaaa acccaatttc cttttgtaat gagattttca 7020
cctcttggtt ggttaagaga gcatttgaca taacacctct ggctaaaaac aacagtaatt 7080
ttaacgttga gatactgtac aaaaaaagtg attaggatcg aagcacaaaa acacatttgt 7140
attcagagaa aagtcatact aaaagataaa gctgctgttg atcagtcaga atcaagtatt 7200
taggaaagcg ttaaatatga ttccattttg gaaggatcta cactagttaa agcctcactt 7260
ctgctttcag aggtgtgaat ttttaccctc ttgtgctcag ccaaacagcg ccttagaagt 7320
ctgaataaac actttgattt attttttttg ctaaattttg attcacgagt atagcctacc 7380
attgtgattt taaaatgtat gttaatggaa taaaacaaat gccttgttcc tgctgccatc 7440
acctatcaag tcattactcc accagtttga tgtccaacag agctttcctt ttgaacattt 7500
gaattcccaa gaggctgtcg gagtctagta tactatggta aaacggggca agaactagct 7560
ttcagttctg gagggcaaat tttcagccat cactcaaacc aaagagagtg atgtaaagat 7620
ttttattttg cgtggcaata cttgtgatgt catgagatga tgtcatgtgt gcaacaagca 7680
gtacgttgct ttaaaactcc ttcggtgagt ggttttacca tggtagtttt gttttctgat 7740
aattacttgc atgcaatttg actaatactg aggatctaca tgcaaaataa atcaggatgt 7800
ccgctcttat gcaaaaccgt atgcggactg gaatcattgg tgtcggttat cggtcagtta 7860
tcgatcaagc cctccgccct gcacctctca ttgaaaggac accgctgtgg attgtttggg 7920
tctacagatg tttagtccat tataatgcaa gatgcatgct gatgctcgga agaagctgct 7980
cgactgcgtg ttattcgtca ctttaatcgc ctccacctac tgaaaatagc cgtaaacagc 8040
tgaaaatcgt tgatattttg gggtgaagaa tgaccgaata taagcttgtg gtcgtgggag 8100
ctggaggcgt aggcaaaagc gctctcacca tccaactcat ccagaaccac tttgtggacg 8160
aatatgaccc aactatagag gactcgtaca ggaagcaggt ggtgattgac ggagagacgt 8220
gtctactgga catcctggac actgcaggtc aggaggagta cagtgccatg agggaccagt 8280
acatgaggac aggagagggc ttcctctgtg tctttgccat caataacacc aagtccttcg 8340
aggacattca ccactacagg gagcagataa agcgagtaaa ggactccgag gacgtcccca 8400
tggttctggt ggggaataag tgtgatcttc agtcccacaa tgtggactcc aagcaggctc 8460
aggatttagc acgcagctac ggcatcccat ttatagagac ctcagcaaag acaagacaga 8520
gagtggaaga tgccttttat actctggtac gggagatcag ggaataccgg ctgagaaaac 8580
tcagtaaaga agaaagacga cacaatgcat caagcttaaa aaatgtgttt tgatgtgagc 8640
gggtgtggac gacgcgtttt atactttagt ccgagaaatc cggaaacaca aggagaagat 8700
gagcaaggag ggcaaaaaga aaaagaagaa atccaaaaca aaatgtgcat taatgtgaac 8760
aagtctttcc tgtcattacg gactcaaaag taccacaact gcattttgta catttacact 8820
aaattattcg cctcttcaga atacagaatg gatccctgtt ctacttgctt tcttaaaaga 8880
aaataagctt tactcgttcg gtgccagttg ccccaaagtg ttggtccgtt gacgccttgt 8940
tttatggctt atgttagcag acgggctgtc agaactgggt atattttgca gttggtttga 9000
gtagttttag cagatttcta aagagaagtg tggatttaaa atggtgtgca gagattagct 9060
gttagactgc atgcgagtca cttgattttt gatggaattg aaactttgag gaactatgat 9120
tgttattttg tttttaatgg accaacactt cttttgggga gatgatttga tacattatca 9180
ctgtgtatga ccctgccttt ggttgtccca gacttccaaa aacgacatgc atgtgaactt 9240
ccattgtagt cggattaaca tgccctctct ataaagccat ggtagtgtgt gtgtgtgtgt 9300
gtgtgtgtat atatggtgaa atcttaacca cgttaacatt atttccccgt ttgcatgctt 9360
tatgttcttt aaacttccag ggaacggtca tgtcttgaat actgtttaat agccactgtt 9420
gtgtcgttgg tccagacagg cggtattgtt taaacatggc ttttttttct tttgatttaa 9480
atttatgaag gttgtttgga agctcatttc caccactgta ttattcctac ttataaaaac 9540
aaattacaat tctgaatatt ttgcaattgc gaggacgagt ctcatgttaa tatttgtaat 9600
ggagttgcaa agtctgttaa ccttctccct caactgcgtc cgtgcatcac aattacgagt 9660
cacaactctg tagttaaaag gttaggattg caagaagtaa actactgtga gttgcatcaa 9720
agtcctttta atgggatggt tcacccgaaa aatgaacatg cattcattac ttaggctgca 9780
tttacactgc actgttcaag tgactcaatt cctgaatttt aatttatttt ttctcccatg 9840
tggcacagat cggatatggc tcatgtacat agaagcagga acaaatcaca tggattccaa 9900
tttactcaat tcagattcag gccttgttca tatgtggaaa tttatccgat ataaatcgga 9960
tcggtgttct tgtgtctgca ttgta 9985
<210> 7
<211> 16
<212> DNA
<213> 人工合成()
<400> 7
cgtctgacta ctcacg 16
<210> 8
<211> 16
<212> DNA
<213> 人工合成()
<400> 8
caactgacta ctcacg 16
<210> 9
<211> 16
<212> DNA
<213> 人工合成()
<400> 9
cccctgacta ctcacg 16
<210> 10
<211> 16
<212> DNA
<213> 人工合成()
<400> 10
cggctgacta ctcacg 16
<210> 11
<211> 16
<212> DNA
<213> 人工合成()
<400> 11
cttctgacta ctcacg 16
<210> 12
<211> 16
<212> DNA
<213> 人工合成()
<400> 12
catctgacta ctcacg 16
<210> 13
<211> 16
<212> DNA
<213> 人工合成()
<400> 13
cctctgacta ctcacg 16
<210> 14
<211> 16
<212> DNA
<213> 人工合成()
<400> 14
ctcctgacta ctcacg 16

Claims (10)

1.一种测序文库的构建方法,其特征在于,所述方法包括以下步骤:
(1)将M个待测序样本分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,进行单独培养;
(3)将包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,线性化酶切;
(5)向N份线性化混合质粒添加不同的标签序列,混合后得到测序文库;
其中,M和N为正整数。
2.根据权利要求1所述的方法,其特征在于,步骤(1)所述待测序样本包括合成的基因片段;
优选地,所述基因片段的长度为500-10000bp,优选为4000-6000bp;
优选地,步骤(2)所述培养在96孔板中进行。
3.根据权利要求1或2所述的方法,其特征在于,步骤(4)所述酶切采用限制性内切酶进行。
4.根据权利要求1-3任一项所述的方法,其特征在于,在步骤(5)之前还包括对线性化酶切质粒进行修复的步骤;
优选地,所述修复包括损伤修复和/或末端修复;
优选地,步骤(5)所述标签序列通过DNA连接酶连接在线性化质粒的两端;
优选地,在步骤(5)之后还包括对文库进行回收纯化的步骤;
优选地,所述回收纯化包括采用磁珠回收后,再用核酸酶消化未连接标签序列的DNA。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法包括以下步骤:
(1)将M个待验证的长度为500-10000bp合成的基因片段分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,单独培养在96孔板的同一列中;
(3)将96孔板中同一行的包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,采用限制性内切酶进行线性化酶切,修复后得到完整双链的质粒DNA;
(5)采用DNA连接酶向N份线性化混合质粒添加不同的标签序列,混合后用磁珠回收一次,再用核酸酶消化未连接标签序列的DNA,得到测序文库;
其中,M和N为正整数。
6.一种基于三代测序的测序验证方法,其特征在于,所述方法包括以下步骤:
(1’)采用如权利要求1-5任一项所述的方法进行文库构建;
(2’)对构建的文库进行浓度和分布范围的检测;
(3’)三代测序;
(4’)结果分析。
7.根据权利要求6所述的方法,其特征在于,步骤(3’)所述三代测序包括Pacbio单分子荧光测序和/或纳米孔测序,优选为Pacbio单分子荧光测序;
优选地,步骤(4’)所述结果分析包括:
根据标签序列和待测序样本的保守序列拆分测序结果;
去除低丰度CCS序列;
将测序结果与参考序列进行比对。
8.一种基因合成方法,其特征在于,所述方法包括将合成的基因片段采用如权利要求6或7所述的方法进行测序验证的步骤。
9.根据权利要求8所述的方法,其特征在于,所述方法包括以下步骤:
(1)将M个待验证的长度为500-10000bp合成的基因片段分别转入感受态细菌,划线过夜培养;
(2)从每个待测序样本的感受态细菌中分别挑取N个菌落,单独培养在96孔板的同一列中;
(3)将96孔板中同一行的包含不同待测序样本的菌液混合,形成N份混合菌液,每份混合菌液中包含M种待测序样本的感受态细菌;
(4)对N份混合菌液分别提取质粒,采用限制性内切酶进行线性化酶切,修复后得到完整双链的质粒DNA;
(5)采用DNA连接酶向N份线性化混合质粒添加不同的标签序列,混合后用磁珠回收一次,再用核酸酶消化未连接标签序列的DNA,得到测序文库;
(6)对构建的文库进行浓度和分布范围的检测;
(7)Pacbio单分子荧光测序;
(8)根据标签序列和待验证基因片段的保守序列拆分测序结果,去除小于3的低丰度CCS序列,将测序结果与参考序列进行比对。
10.一种如权利要求1-5任一项所述的测序文库的构建方法和/或如权利要求6或7所述的基于三代测序的测序验证方法在基因合成中的应用。
CN201910394932.1A 2019-05-13 2019-05-13 一种测序文库的构建方法及其应用 Pending CN111926393A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910394932.1A CN111926393A (zh) 2019-05-13 2019-05-13 一种测序文库的构建方法及其应用
PCT/CN2019/121334 WO2020228298A1 (zh) 2019-05-13 2019-11-27 一种测序文库的构建方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910394932.1A CN111926393A (zh) 2019-05-13 2019-05-13 一种测序文库的构建方法及其应用

Publications (1)

Publication Number Publication Date
CN111926393A true CN111926393A (zh) 2020-11-13

Family

ID=73282900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910394932.1A Pending CN111926393A (zh) 2019-05-13 2019-05-13 一种测序文库的构建方法及其应用

Country Status (2)

Country Link
CN (1) CN111926393A (zh)
WO (1) WO2020228298A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010094772A1 (en) * 2009-02-20 2010-08-26 Febit Holding Gmbh Synthesis of sequence-verified nucleic acids
CN105671644A (zh) * 2016-02-26 2016-06-15 武汉冰港生物科技有限公司 一种基因组混样测序文库的制备方法
WO2016109981A1 (zh) * 2015-01-09 2016-07-14 深圳华大基因研究院 一种dna合成产物的高通量检测方法
CN107190001A (zh) * 2017-04-17 2017-09-22 武汉金开瑞生物工程有限公司 一种基因合成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107760672A (zh) * 2016-08-17 2018-03-06 苏州泓迅生物科技股份有限公司 一种基于二代测序技术的工业化基因合成方法
CN108866173A (zh) * 2017-05-16 2018-11-23 深圳华大基因科技服务有限公司 一种标准序列的验证方法、装置及其应用
CN109056077A (zh) * 2018-09-13 2018-12-21 武汉菲沙基因信息有限公司 一种适用于PacBio测序平台的扩增子混样测序文库构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010094772A1 (en) * 2009-02-20 2010-08-26 Febit Holding Gmbh Synthesis of sequence-verified nucleic acids
WO2016109981A1 (zh) * 2015-01-09 2016-07-14 深圳华大基因研究院 一种dna合成产物的高通量检测方法
CN105671644A (zh) * 2016-02-26 2016-06-15 武汉冰港生物科技有限公司 一种基因组混样测序文库的制备方法
CN107190001A (zh) * 2017-04-17 2017-09-22 武汉金开瑞生物工程有限公司 一种基因合成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖业等: "大肠杆菌cDNA文库的构建与质量分析", 《湖南师范大学自然科学学报》 *

Also Published As

Publication number Publication date
WO2020228298A1 (zh) 2020-11-19

Similar Documents

Publication Publication Date Title
CN109777761B (zh) 一种分泌表达几丁二糖脱乙酰酶的工程菌构建及其应用
CN107604004A (zh) 用于痘苗病毒天坛株tk基因的示踪打靶质粒及其制备方法
CN112225822B (zh) 高扩增、存续能力和杀瘤作用的CAR-iNKT及应用
CN108531510B (zh) 一种转基因斑马鱼在制备慢性粒细胞白血病的动物模型中的应用
CN102002509B (zh) 一种大肠杆菌-枯草芽孢杆菌穿梭表达载体及其应用
CN111239386B (zh) 一种靶向抑制维生素K依赖性γ-谷氨酰羧化酶的小分子化合物的筛选方法及应用
CN108718529B (zh) 用于产生l-半胱氨酸的突变微生物以及使用其产生l-半胱氨酸的方法
CN110944656A (zh) 编码人类fkrp蛋白的新型多核苷酸
WO1992017581A1 (en) Mammalian expression vector
CN113862235A (zh) 一种嵌合酶及其在体外一步反应合成Cap0 mRNA的用途和方法
CN101463362B (zh) 融合表达绿色荧光蛋白的表达载体及其构建方法与应用
CN113046369B (zh) 一种新型冠状病毒的mRNA疫苗
CN111926393A (zh) 一种测序文库的构建方法及其应用
CN101538611B (zh) Rna和dna双外参实时定量荧光pcr检测方法及其应用
CN111239385B (zh) 一种靶向抑制维生素k环氧化物还原酶的小分子化合物的筛选方法及应用
CN106497977A (zh) 一种基于pCDH的荧光素酶的重组载体及其应用
US20030186266A1 (en) Highly sensitive nucleic acid hybridization method and gene analysis method by using the same
CN114457113B (zh) 一种抑制单倍体胚胎干细胞二倍化的方法
CN107034233B (zh) 一种内源性启动子驱动外源基因表达的方法
CN100429309C (zh) 一种100bp梯度核糖核酸分子量标志物及其制备
CN111560392B (zh) miRNA表达载体及其应用
CN114164225B (zh) 一种使大肠杆菌获得有效nhej系统的高通量筛选工具及其应用
CN111206024B (zh) 一种表达果胶酸内切水解酶的工程菌及其应用
CN114716520B (zh) 一种库德里阿兹威毕赤酵母三羧酸转运蛋白及其编码基因与应用
CN108385170B (zh) 枯草芽孢杆菌f4启动子的调控序列文库

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201113