CN109295163A - 一种通用长片段染色体步移的方法 - Google Patents

一种通用长片段染色体步移的方法 Download PDF

Info

Publication number
CN109295163A
CN109295163A CN201811172205.2A CN201811172205A CN109295163A CN 109295163 A CN109295163 A CN 109295163A CN 201811172205 A CN201811172205 A CN 201811172205A CN 109295163 A CN109295163 A CN 109295163A
Authority
CN
China
Prior art keywords
dna
segment
primer
sequence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811172205.2A
Other languages
English (en)
Other versions
CN109295163B (zh
Inventor
常玉晓
邓策
丁俊强
谭彬
蒋睢睢
汪泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongnong Jingyue Biotechnology Co ltd
Original Assignee
Agricultural Genomics Institute at Shenzhen of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Genomics Institute at Shenzhen of CAAS filed Critical Agricultural Genomics Institute at Shenzhen of CAAS
Priority to CN201811172205.2A priority Critical patent/CN109295163B/zh
Publication of CN109295163A publication Critical patent/CN109295163A/zh
Application granted granted Critical
Publication of CN109295163B publication Critical patent/CN109295163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种通用长片段染色体步移Universal Long‑Steps Genome Walking(ULS‑GW)的方法。本发明的方法利用转座酶Tn5复合体通过一步反应在打断DNA的同时,在其两端断点处上加上DNA接头,操作简单,连接高效;一次制备的打断产物,可作为模板库进行任意基因的长片段染色体步移,通用快捷。可根据需要,选择较长分选模板进行PCR扩增,能获得更长的步移序列,且可以同时从已知序列DNA片段的两端同时设计引物,分离上下游的侧翼序列,获得更长的序列。

Description

一种通用长片段染色体步移的方法
技术领域
本发明属于基因工程技术领域,具体涉及一种通用长片段染色体步移的方法。
背景技术
染色体步移(chromosome walking)是一种常用的分子生物学技术,使用这种技术可以分离已知序列DNA片段上下游的未知序列。在非模式物种的基因组研究中,常用染色体步移的方法来获取目的基因的全长序列,比如在缺少某物种全基因组序列信息时,可以根据其它亲缘关系比较近的物种中目的基因的同源基因序列,寻找一段序列保守的区域设计一条目的基因特异引物,利用染色体步移来扩增目的基因的全部序列。
目前,市场上有四家公司提供染色体步移的kit,分别是美国Clontech公司(Clontech Laboratories,Inc,www.clontech.com)的GenomeWalkerTMUniversal kit(Catalog No.638904);韩国Seegene公司(Seegene,www.biogene.com)的DNA WalkingSpeedUpTMKit(Catalog No.DWSK-V101);美国Invitrogen公司(Life Technologies,www.invitrogen.com)的Walker Kit(Catalog No.K8000-01);北京庄盟国际生物基因科技有限公司(Beijing Zoman Biotechnology Co.,Ltd,www.zomanbio.com)的模板锁定染色体步移试剂盒(KX Genome Walking Kit,Catalog No.ZT601-1)。这些kit利用了不同的原理。GenomeWalkerTMUniversal kit利用的是adaptor ligation PCR的原理,具体而言,是利用限制性内切酶酶切基因组DNA,然后再连接可以与酶切产生的粘性末端序列退火的DNA接头,接下来用DNA接头上的引物和目的基因特异引物配对,来进行染色体步移。DNA Walking SpeedUpTMKit则是利用了序列独特的ACP(annealing control primer)引物与目的基因特异引物配对,来扩增目的基因片段。ACP引物由三部分组成,5’端为一段长度约25bp的非目标区域通用序列(Non-target universal sequence),3’端为长度约为6-10bp(根据其kit的说明书和相关的文献推测)的目标区域核心序列(Target coresequence),介于二者之间的是调和子(Regulator)序列,由5个多聚脱氧次黄苷(dI)组成,脱氧次黄苷与DNA序列中的四种脱氧核苷酸A、T、C、G都可以配对,在分子生物学实验中常用来替代简并引物中的高简并位点,可大幅度降低简并程度,显著提高扩增产物的特异性及扩增效率。Walker Kit则利用了技术将Linker连接到经过限制性内切酶酶切、去磷酸化、目的基因特异引物单链延伸后形成的DNA分子上,以此为PCR模板,用目的基因特异引物和Linker上的引物扩增目的基因片段。而KX Genome WalkingKit利用的是TAIL-PCR(Thermal Asymmetric Interlaced PCR,即热不对称交错式PCR)的原理,根据目的基因DNA序列,分别设计三条同向且退火温度较高的特异引物,与试剂盒中提供的九种经过独特设计的退火温度较低的兼并引物进行热不对称交错式PCR反应,该反应程序的设计使之可以有利于目标基因的扩增,而抑制兼并引物引发的非特异扩增,从而达到扩增目标基因片段的目的。除了上述四种商业化的kit外,反向PCR(inverse PCR)也是一种常用的染色体步移的方法,其实验原理是将已知序列酶切,然后环化,根据已知序列设计正向和反向引物,扩增目的基因片段。
这四家公司提供染色体步移的kit和反向PCR存在以下缺陷,使其进行长片段染色体步移时效率低下,甚至不能进行长片段染色体步移。第一,Clonetech的Genome WalkerTMUniversal kit和Invitrogen的Walker Kit以及反向PCR,进行染色体步移时能够扩增出来的DNA长度是由所用的限制性内切酶的酶切位点与目的基因上特异引物的之间的距离决定的,由于序列未知,因此这段距离具有很大的偶然性,为了得到合适的PCR片段,往往需要测试不同的酶和DNA接头。例如,Genome WalkerTMUniversal kit中提供了四种不同的限制性内切酶和相应DNA接头;Walker Kit也推荐了多种可以产生3′粘性末端的限制性内切酶。第二,Seegene的DNA Walking SpeedUpTMKit和庄盟的KX Genome Walking Kit利用的是引物或兼并引物,这些特殊引物在基因组上的退火也具有偶然性,不能控制PCR产物的长度,DNA Walking SpeedUpTMKit中提供了4种不同的引物供测试;KXGenome Walking Kit中也提供了9种不同的简并引物供测试。第三,这些kit提供的方法,实验操作复杂,效率低下,为了提高实验成功率,需要对一份样品进行多个限制性内切酶或引物的测试。第四,这些kit提供的方法,一次只能对一个目的基因进行染色体步移,缺乏通用性,当需要对多个目的基因进行染色体步移时,需要重新制备PCR模板。
发明内容
本发明的目的是提供一种通用长片段染色体步移的方法Universal Long-StepsGenome Walking(ULS-GW)。不仅可以对目的基因进行长片段染色体步移,而且制备的PCR模板库可以同时用于多个目的基因的染色体步移,在对多个基因(如基因家族)进行研究时,可以提高效率。
一种通用长片段染色体步移的方法,包括如下步骤:
(1)利用Tn5转座酶复合体将基因组DNA随机打断,且在DNA断点处加上ULS-GW接头,ULS-GW接头由两条退火在一起的DNA单链组成,作为后续PCR反应的引物结合位点;
(2)纯化转座酶打断后的DNA产物,检测片段大小,然后将纯化产物进行片段分选;
(3)选择7-9kb左右的片段,利用目的基因特异引物和位于ULS-GW接头上的引物GW1配对,扩增目的基因片段;
(4)对第一轮PCR产物再次进行片段分选,选择7-9kb的片段;
(5)以分选得到的7-9kb的PCR产物为模板,利用目的基因特异引物和位于ULS-GW接头上的引物进行第二轮巢式PCR扩增;经过两轮PCR扩增,已知序列DNA片段的上下游的未知序列能够被扩增出来,后续可用TA克隆的方法将目的片段克隆进载体,进行sanger测序,得到完整的未知序列的信息。
步骤(1)通过调整Tn5转座酶复合体和基因组DNA的比例,以及反应buffer的成分,将打断的DNA的长度控制在峰值为8kb左右,弥散分布于4-12kb。
所述引物GW1的核苷酸序列如序列表SEQ ID NO:1所示。
所述目的基因特异引物为Target_L1与Target_L2;所述Target_L1的核苷酸序列如序列表SEQ ID NO:2所示;所述Target_L2的核苷酸序列如序列表SEQ ID NO:3所示。
目前Tn5转座酶一般用于新一代测序(Next generation sequence)小片段文库的构建(Nextera DNA Library Preparation Kit,Catalog No.FC-121/1030/1031)和大片段文库构建(Nextera Mate Pair Sample Preparation Kit,Catalog No.FC-132-1001),其中,构建小片段文库时,Tn5转座酶可以将DNA打断成200-1000bp长的片段;而构建大片段文库时,通过控制所用的酶的量和转座酶反应buffer,可以将DNA打断成2-15kb的长度。此外,二者所用的接头序列不一样,Nextera DNA Library Preparation Kit中的接头连接到DNA上以后,可以进行PCR扩增;而Nextera Mate Pair Sample Preparation Kit中的接头连接到DNA上以后,不能进行PCR扩增。本发明的方法将这两者相结合,使用来源于Nextera DNALibrary Preparation Kit中转座酶,配合Nextera Mate Pair Sample Preparation Kit中的转座酶反应buffer,优化酶与DNA的比例,使之可以将打断的DNA的长度控制在峰值为8kb左右,弥散分布于4-12kb,而且接头连接上以后可以进行PCR扩增,用于开发一种新的染色体步移技术,使长片段染色体步移变得简单、易行。
和限制性内切酶切割DNA不同,Tn5转座酶是随机打断DNA,因此,当DNA被打断成8kb左右的片段时,可以保证目的基因特异引物上游8kb左右的各个长度都有转座酶的打断位点,通过对片段进行两次分选,可以保证长片段染色体步移的成功率。
Tn5转座酶是随机打断DNA,因此,打断的DNA进行片段分选后,得到的8kb左右的片段,可以作为模板来进行任意基因的长片段染色体步移,具有通用性。
本发明的有益效果:本发明的方法利用转座酶Tn5复合体通过一步反应在打断DNA的同时,在其两端断点处上加上DNA接头,操作简单,连接高效;一次制备的打断产物,可作为模板库进行任意基因的长片段染色体步移,通用快捷。可根据需要,选择较长分选模板进行PCR扩增,能获得更长的侧翼序列,且可以同时从已知序列DNA片段的两端同时设计引物,分离上下游的侧翼序列,获得更长的序列。
附图说明
图1为本发明的方法原理示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步说明。
下述本发明的实例中所用的Tn5转座酶复合体来自Nextera DNA LibraryPreparation Kit(Illumina,Catalog No.FC-121/1030/1031)中的成分。反应所用的buffer则是Nextera Mate Pair Sample Preparation Kit(Catalog No.FC-132-1001)中的Tagment Buffer。
本发明方法的原理如图1所示。
实施例1利用ULS-GW技术分离水稻GAPDH片段左端大约8kb的序列
1.1转座酶复合体打断水稻基因组并在DNA片段断点处连接ULS-GW接头
按表1成分在灭菌PCR管中配置反应体系:
表1.转座酶复合体反应体系
然后将PCR管置于PCR仪中,进行表2设置的反应程序:
表2.转座酶复合体反应程序
1.2利用柱式纯化试剂盒对转座酶复合体打断后的产物进行纯化
反应结束后,立即纯化,产物纯化所用的kit为Cycle-Pure Kit(Omega,货号:D6492-01/02),向打断后的产物中加入5倍体积的buffer CP,混合充分,将混合液加入收集管中,12000rpm离心2min,然后加入700uL的DNA Wash buffer洗两遍,最后空离2min并晾干,将收集管放入新的EP管中,加水分两次洗脱,洗脱体积为30uL,取2uL用3.0荧光计进行浓度测定。具体纯化步骤及浓度测定方法参见相关Protocol。
1.3利用Sage ELF对纯化后的产物进行片段选择
对打断回收后的产物进行分选,通过Sage Science公司的SageELF回收仪(SageScience,货号:ELF0001)来实现,将回收后的28uL样品与3uL的6×loading buffer混合处理,然后将混合液按照说明书要求,加入到SageELF 0.75%的琼脂糖凝胶回收胶盒(SageScience,货号:ELD7510)中,并使用如下设置的程序来回收不同大小的片段:分离时间(separation time):2h。电泳结束后,每个片段(well)取1uL进行浓度测定,并用AgilentAlilent High Sensitivity DNA kit(Alilent,货号:5067-4626)与2100Bioanlyzer(Alilent,货号:G2939A)检测每一个片段的大小。
1.4利用半巢式PCR特异性扩增GAPDH片段左端的侧翼序列
本发明中用到的GAPDH基因(SEQ ID NO:4),PCR扩增所需引物序列及引物结合位置信息如下:
表3.PCR扩增GAPDH左右两端侧翼序列所需引物序列及引物结合位置信息
选择回收后大小约7-9kb的片段为模板,按表4、表5成分在灭菌的PCR管中配置两轮PCR反应体系并在PCR仪中运行表6设置的反应程序,扩增GAPDH片段的左右两端的侧翼序列。
表4.第一轮PCR反应体系
表5.第二轮PCR反应体系
注:Template1为第一轮PCR的反应产物,经磁珠法纯化后的产物(具体方法见1.5)。
表6.第一轮与第二轮PCR的反应程序
1.5利用磁珠法纯化半巢式PCR扩增后的产物
反应完成后,将第二轮的PCR的反应终产物,用Vazyme公司VAHTSTMDNA cleanBeads(Vazyme,货号:N411-01/02/03)进行纯化,采用1.8×Beads纯化,即25μL打断产物中加入45μL磁珠,洗脱体积为30μL,取2μL用3.0荧光计进行浓度测定。具体纯化步骤及浓度测定方法参见相应Protocol。
1.6对纯化后的PCR产物进行末端加“A”反应
在灭菌的PCR管中配置如表7的PCR产物末端加“A”体系:
表7.PCR产物末端加“A”反应体系
然后并将PCR管置于PCR仪中,运行如下表的反应程序:
表8.PCR产物末端加“A”反应程序
反应结束后,将反应产物补水至50μL,再次用1.8×beads纯化,回溶20uL的无菌水,纯化步骤与浓度测定方法见实例1.5。
1.7末端加“A”后的PCR产物与T载体连接及连接产物转化
在灭菌的PCR管中配置下表片段与pMD19-T载体的连接反应体系,并将反应管置于PCR仪中,运行如下反应程序:16℃连接过夜。
表9.片段与pMD19-T载体连接体系
注:目的片段与T载体之间摩尔比介于3:1~10:1之间
反应完成后,将连接体系加入到大肠杆菌的DH5α感受态细胞(Vazyme,货号:C502)中,复苏后的菌液涂布到含蓝白斑(IPTG,生工,货号:B541006,50mg/ml;X-gal,上海生工,货号:B541007,20mg/ml)筛选及氨苄霉素(上海生工,货号:B540722,10mg/mL)的LB培养皿中,待菌液在超净台中被吹干后,于37℃培养箱中,倒置平板,过夜培养。
1.8菌落PCR验证阳性单克隆
取培养过夜的平板,以白色单菌落各23个为扩增模板,并以水稻基因组作为阳性对照,以距离Target_L1引物上游8.5kb处均设计可扩增长约500bp的产物的正反引物,(见表10),然后按表11成分在96孔板中配置反应体系并置于PCR仪中运行表12的反应程序,进行菌落PCR扩增。
表10.菌落PCR鉴定所需的引物
表11.菌落PCR反应体系
表12.菌落PCR反应程序
1.9利用琼脂糖凝胶电泳检测阳性克隆并对其进行Sanger测序分析
取10个无菌的2mL的EP管中,加入1mL带氨苄霉素抗性的LB液体培养基,然后从鉴定的阳性菌落中挑取5个单克隆加入培养基,并置于37℃,140rpm摇床上培养3-4h,送至生物公司,以M13F与M13R为测序引物进行Sanger测序。然后将每个阳性单克隆测序得到的结果,分别与水稻的参考基因组进行Blastn比对,找到插入的片段在参考基因组上对应的位置,经过计算即可得到插入片段的具体大小。
通过本发明,我们分离到了GAPDH片段左端的侧翼序列,且分离到侧翼序列距离特异引物的距离达到了8.5kb以上,这对获得非模式物种的完整的基因具有重要的意义。
序列表
<110> 中国农业科学院深圳农业基因组研究所
<120> 一种通用长片段染色体步移的方法
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tcgtcggcag cgtc 14
<210> 2
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cagtgattgc atggacagtg gtcat 25
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caaaccctca acaataccaa acctg 25
<210> 4
<211> 18000
<212> DNA
<213> 水稻(Oryza sativa)
<400> 4
cggccctgtt gaaggtacca aaatgtccac atgcaataat ttcagatatg ccatagtcgt 60
ttacttgctt ggctaagttg ttttgacata gtaaatttga tgcaaagtca tttgcggact 120
agtcattttc cctttttatg gttgaccatc caaaaaagtg ctccaaaaca gtgagttttt 180
agtgatgcca tttttcttag tgtcatagaa gagctttcag tcctagctca ttaatttttc 240
tgatggcgta tgatttattg ttctcaaaat tttggatgaa cctaacattt aatttgaatt 300
gctcgatgtt gttgtggaat tgttgaaatt ctcgctttct catatgaagt tacaatcaag 360
gagaaaaagg cacctgttac tagcacttat aattagttgt ttgaccagta acaccaataa 420
agtataattt catttttacc atttttatta tcagattcat gtgttttgtt tatccaactc 480
ctgttatcaa tgatactctg atgtaactgt ggttatgaag acagaaccat gcatatcagt 540
gcatcatata tagttttact ctgattcttt tgctcttttc tgttttacag caagtggtag 600
atcattgcta agtgtcgaag atcgactaga acctgatagt catccacttg cattaacagc 660
tgatgcagtt gcaaccaatg gtgtaaatcc atggaactgg agagacacct ctaccaatgg 720
tactaatcca aatccaaaca cactaaaagt gataataata atctggatat ttatggcaga 780
ggaattggac tggttggaaa tattgctgct tgactgtgta cttatgaact tgattcaact 840
tccattggat aatatttatt ttgattgcat gaacttcctg ttctgctgag aaatattatt 900
tcaaaatatt tcataaacca ctgaatttaa ctatttagtc atatctgtca ttcctgaaat 960
atggatgagc tattggatac ttttttcttt ctaactgtta ttgtttcaat ttgtttctac 1020
gcatacggct aatatacacc atatacttta tttttactaa tgaagctata agttattaat 1080
ttcagatggt actaaaactc tataattctt atgttaatta attcgtggct ccttgtttta 1140
atattctgta ttaatcggga aacgtgcctc atacaggtgg agataatcag gttacttttg 1200
gtgggagagt cattttagtc aagtggggtg attacactaa aagaataggc attgatggta 1260
ctgcagacgc aattaaagaa gccatcaaat cggcatttgg tctaagaaca agacgggcct 1320
tttggcttga agatgaggat gaggttgtcc gttccttaga cagggatatg ccggttggaa 1380
catacaccct tcatctcgat accggtaatc ggaaaacgtt ttctctgctt atggacaaga 1440
ctttgttttc tccacaacta ggaataccgt agtagattat ttagatttgt aacagtattt 1500
tctgtattgt ggtgttgttg ttgttgttgt gtgtggtggg gggattattt tggaacatat 1560
ggcttttcag tttgtgactt ggttggtgca gtagacccta actaagaact gaaagcaagt 1620
ggcaccacac agaagatttg catccattaa ctttaaatgt gaatgccgat ttcttgtttg 1680
agattcttct tgttgagcta actagttcat gttggtcatc tgtacatcta actagaaagt 1740
atggtgctaa ctagaaattt cttttggggg tatttgtata ctagtgatgt ttgtcagtat 1800
ttatgtttgg atgctgccaa tagtgaatga cactctcatt accaacaaac tgtaaaaaat 1860
atcatgtttt atcagttgta atttacgtct caatttacga tgctattttg cgtccaagtt 1920
gcgcattgcc aactaaaaga tttagttttt tttctgaagt tttttttttc aaactctact 1980
gaaggatgtt catcaacact gctccctttt gttccaaata tagattactt tagacttctc 2040
aacaatttcc ttagtaagtc atttaggaac ttctaagcac ttattcaaaa aaaattcctc 2100
catgattgtc cttccaaaat agatgctcct tctctcataa agaaatgata catattttcc 2160
aatgtaatat aaatgaaggc caacaaggtc aatttgagtt agtgcacaga tctaaaacaa 2220
cttattttgg aatcagatag agttatattg attcaatcat tgctgcattc aatgttcaca 2280
ggaatgacca tcaaactata tatgttcgaa aatgatgagg tccggacaga agacaagaca 2340
ttctacactg aagaggactt ccgagacttt ctctcgcggc gtggttggac actcctcagg 2400
gagtattcag gctacagaat cgccgatact ctggatgacc ttcgtcctgg tgtgatttat 2460
gaagggatgc gatcacttgg tgattgattt ggtgacattg cctgaccaag gcatataata 2520
tatccaaagt agatatggag catactccta ccttttaatg caatttgaag ccaagcaaat 2580
catgggttcc tggttattgt aaatttagct tttggcatct tgacctaagc taattttaaa 2640
tgtccatgca gccgaagggg aaaagttata ctggatatac attggttacc cgaagtaaat 2700
agccttggaa gttggaactt gaaagttgga aatatgatca ttcaagctct ctgaagatcc 2760
aaggtgcttt ggctgagtac aaagattaca gcctaaatga ggacctgtta gttgctgcca 2820
acaggtcctg gggttcctct ggtttatatg taaatgtaaa tgtagctctg tagcatcttg 2880
gtgttagtta gtttccaatg tgtttgttac ccatgctgat actgggtttt acatttgtca 2940
caaatagtct tggaagctgg aaacaaatac attcatcaga agtgtaattt gtccggacaa 3000
cgaaggttgt ctggcaaaat gtaagatttc tgatggattg ttgcaaacag ccttggaagt 3060
tccgaagctg gaataaattc attcagcaga agtgcatttt gtcttgagat tgaagatggt 3120
acaaaattac ttctaattta atatgcaagt tttgacaaga aaaacggtgg tcgatataac 3180
ataaactttg aggatacggc tgtcttgaga ttgaagatgg tacagaatta cttttaattt 3240
aagtgcattt tgttattcac agagcatatg acttcaaaac accttgaatc ttttgagatt 3300
ctgaagtgag aaacaacaca tataattgaa caacacagtg aagaaatcgt ggcacacgat 3360
cacgatgcat tcaactccag tggtactttc aacccaggat ttcaaaggct gaggaaaaaa 3420
aaatcatggt gaagcagcga tacacagtcg attctcccaa aatgcggtaa agaacaagaa 3480
aagggattct cccagagcac acgagttccg atagggctag ggcgtgaatg aacgaacgat 3540
tcacacaagc atcacgccta gcaagctaag ctagctaaat aagctagcag caataaacta 3600
gcaagggggt ctcctcctca tggctccaac ctccaccggc ggcttctact cctcgtccca 3660
ctcgtcgacc ttgtaggaga cgagcgtgtc caccttgtga atctgccatg gcaagaacac 3720
ggcgctgtaa cgtcagcaat ctgggagagg cagcgaaaaa aaagaaacgg agtcgattca 3780
gtgatattca ccttggtgtc gaaggaatgc agcttcacca tctgtggatt ctcgatgagc 3840
ttggcgtcgc tctccaccca ggtgaagggc accgcgacgt ccatgtcggt gtacgccagc 3900
acgtcgaata tgcctgcaaa atcaatcaat caatcaatca atcaatcgac gaatgcggat 3960
gagctgggag gaattggggg ggagagcaga ggcgatgaac actgaacact gaagaagtag 4020
aggtggtggt aatggcgctt acatggctcg tcgaggcagg ggaggtaggt gatgcaggag 4080
gcgacctggc gcatgatggc ctggatctcc ctcatgatct ccttgtcgct cttctccttg 4140
atgacaccct tgtcgaccac ctccgggtcg gtctggatgc tgaagttcca ccgctccagc 4200
acctcggagg tggccttgct catgatcacc agcacgatcc tctgcagctt cccggcctcc 4260
agccactctg cgcgcggcaa cgcaggaaac acaggcaaga tcaatcagca gcagcaaaag 4320
aaaaagaaaa aagaaaccaa atggagacag gcaggctagt gatccggtga gtgaggccag 4380
acgacctgag agctgggtgt tgaggttggc gatgaaggtc ttcacccctt cgtcctgcgt 4440
cagcagcatc gtgaggccgt acttcttcac cttggtgaag ctctcctccg ggtacacccc 4500
gcggttgtac aggatgctgc gccacgcaca aaccaagaac acaaaacacc ccggatcaga 4560
aattaaccct gaatctgcag caaccgtttt ttatattttt tttctttcaa aggaaaccag 4620
catcagcgca gcggcggccg tcgatcctgg cacccgcaac cgcgcgaagc gcgcacctgt 4680
tcgcggcgta gcctgccaca cgagaaaagg cattcgatca aacacctatc gggcgcgcgc 4740
acgcgtgaga ggagccgagg gcgaaaaaaa ataaaagaaa cggaagcgga gatcggcttc 4800
taccgaagaa ctcgctgacg atggcggcgg agccccgcag cgtgatgatg tccttggacg 4860
ccgtcctcga cgccatctcc tgatccgcct caccttctta actcctcctc ttgcctcccg 4920
tgcggcggcg gcggcggcgg cggatggggg gagaggaaag aggaaagggg gggaaaagcc 4980
gggcaaaggc aacggctagt gtggagcgga tcggctgcgg gctgcggcgc ttgggaactt 5040
gggagcgttg tttgtcgatg ggtcgtgttg ggtcaggtgc gggggagaga aggtgtcggc 5100
gtgcgggtgg gtttcgggag tttttaaagg tgggccggac ctgcgctccc aacggtcgtg 5160
tgggcggtgg gccagtgggc ttcggttggc gcgattcgcc caagccgcgc gctctcttcg 5220
agtcctttac ctcttgttga tgatgaattg tactggtacc agtagactac tagtagaacc 5280
gtagaaacac cattttcttg gagaaaatgc tcctgggtgg ctgggttttt gaacttgttc 5340
ggacggttgg cctttagggc agtcccaacc cataacacta gacatagttt tcataaactc 5400
tacatcatca agaaattagt actagacact actctttcaa tataaacacc actattccat 5460
acttcaattt aatgcaattt atcttacatg atattttgtg tagaaaccat atctcatgca 5520
agacatggtt tccttctctt tcctcattta tttacttgcc acatcatttt ttatcctagg 5580
tggcaactta tataatgtta tggacatcat cctagacatt gggttgggaa taaccttaga 5640
aacggaggga aggtatttgc cctttgccgc caacaacccc tatttgccct catattcgtc 5700
cgtttagcac agttataact taccaaacaa ttttggtttc accaaaaaaa atagagtaaa 5760
gctggttaga gtgttctcgc aaaatgagcg tcttaccaaa cgagacatct gtttcttact 5820
gtttttctgg gcttattcgg ccgaattgta aatcgaaaag tttattcttc accagactaa 5880
aaaaatacgc ttattcatta tattatcaga gcatatcatt tgattcacgg tttggaaaat 5940
tatgttttga aaatacaaaa acttatactg tagtccttcc atcacggcac aacaactttt 6000
ttccatgtct tgtaatataa ggtgtgtgtg catgcatgca cattaactat cacctcttag 6060
tcctttaaat ttggtttgtt ttaaaccatc taccatcaag cccccaatca cactgcttgc 6120
ctgtacggat gtgatctaac cgatgcgata atcaaattat ttctcggtct tttgcgttag 6180
aagtgattta gcctaacacc cattttggca tgtagggagt attacttaga ccactcattt 6240
tagacatatt ttatcttaaa atattaaatt aaccactata atcggttata taatggcgat 6300
aataatatac tcaataatct aaatatagtt tttaatatat ttgtgaacta tgtgattcta 6360
tactaaaaac tacccctatg ccttaaaagc cactgactag cactgacatt ctgtttgcct 6420
tttgtttgaa agttaatttg gatgtattta aaattcaagt aggattatat tgtttcggta 6480
gagattattt ttcaagagaa agtttccttt gatttttttt ggtgcaacct tttttcttta 6540
caaagggaac ttttctaatg tttgttagaa gttttggtat atagctaact tttttatttc 6600
tcttgtagat ttttttccta tgaaaaacct ttatagttct tttggtgaaa gttctatcag 6660
gccctgccat ttttactggc acagcttaag aaatggagca ctatgtttga ttcattggcc 6720
aatgtatgca cggtaaattg ttaatgcatc gtatagcaac caatatatac aactaccagt 6780
tgtagaggag atatctcgtt tcagtaaccg ccattttttc accaaccaag tcacgtttta 6840
ataacattct aatcgaacat tttcaattta taactaaaac taaaccagag gaaatgactg 6900
tattctagga caaaatatac acggatcaaa tcacgtctta ttaagaagga atatttctca 6960
gtatcggttc ccttgctcta aatgatactg tatcaactat tcataacacc gtttatatgt 7020
ttcttgatca gcaggacgat agatcttcaa cggctgatta tcatcgatct tcttggggag 7080
gaagcctacc tttgccatta tcttttcgtg ggcccaaatc cagcagcggt ccaacgtttc 7140
tctccaccca caggaacctt ctggaaaccc acgccctctc tatcccctct cccaatccag 7200
cgacgtggcc gcatctccca ccgtccactt cccccctccc gattcaaacc aacggccccg 7260
atcccatcct tgagccgcgg gcacagagcc ctggatcccc cggcggagcc agttctatat 7320
aaaggcgagg ccgccccagc tggcaccacc cattcctcgc gtcgcatcgc acttgtagct 7380
ctcgaccccc gcatctcatc cctcctctcg cttagttcag atcgaaatcg caaatgggta 7440
actccgccat ctgatcccgc ttcctccgat ctcgatctgg tctccccgtt cccgttctgt 7500
tctagtggag tgattttttt gcattttttt ctgacttttt gctggttggt tttttggctt 7560
ctgcagcgaa gattaagatc gggatcaatg gtgagttgga ccttcgtctc cagatctgtg 7620
ttttgtgccg gtgtttgcgg ggttttgggg gtgggttttg attgttggat gtggattgtg 7680
tagggttcgg gaggatcggg aggctcgtgg ccagggtggc cctgcagagc gacgacgtcg 7740
agctcgtcgc cgtcaacgac cccttcatca ccaccgacta catggtaaac cctcctgcct 7800
tttgctttta tctcgttagc tgcacagatt tgtggataga tgcgagggga tgtttggttt 7860
gttttagatc tactattcca ggggctagtt tgtgggttta ggtgttagga ggttacagtc 7920
acagtgtgct cttgactggc ttgagcttga cccagcgtat tgatctgcat acgcgagcta 7980
gttttttgtg gctgcttatc atattgttgt cctaattaga tctgtgagtt tggaatttgg 8040
atatcagtgt gtcgacctgt cgatcaaata gtcattgata tgtcttcaga tgcatttgca 8100
catgcaaaat cacagattgt gccggttgct ttaaaattcc gcacagcgat atgctttgct 8160
gtggtactgg cttctgagat atgtttgcca catccagcta tttgtttcca gtttgttttg 8220
gtttgataat ggcccttctt aaatatctgt gattttcctt ttcatctgaa gtgtgaatcc 8280
aatcatctag acaatgcggt gataactttt ttttcaattt cctgcagaca tacatgttca 8340
agtatgacac tgtgcacggc cagtggaagc atcatgaggt taaggtgaag gactccaaga 8400
cccttctctt cggtgagaag gaggtcaccg tgttcggctg caggtttgct gtttttttcc 8460
ctctctgctg ttgtctgatg atatcatgag cagtatacca tatcgctcaa ccttaatttc 8520
tctgctcagg aaccctgagg agatcccatg gggtgagact ggcgctgagt ttgttgtgga 8580
gtccactggt gttttcactg acaaggacaa ggccgctgct cacctgaagg tattttctgc 8640
gaaacccaac atgtcattgt ttgattgtgg tgtcataaca attcatatga agaatgattc 8700
tcatggtatc atatgcgttt caatataggg tggtgctaag aaggtcgtca tctctgctcc 8760
cagcaaggat gcccccatgt ttgttgttgg tgtcaatgag aaggagtaca agcctgacat 8820
cgacattgtg tccaatgcta gctgcaccac caactgcctt gctccacttg ccaaggtgtg 8880
ttcctcactc attttcactt gtctactgtt gcaaattgtg tggtgatgtt aagaaattgg 8940
tcactactac catatgaagc cttgtcctta tcaaattgtc tgcctgcagg ttatcaatga 9000
tccacatgca ataatttcag atatgccata gtcgtttact tgcttggcta agttgttttg 9060
acatagtaaa tttgatgcaa agtcatttgc ggactagtca ttttcccttt ttatggttga 9120
ccatccaaaa aagtgctcca aaacagtgag tttttagtga tgccattttt cttagtgtca 9180
tagaagagct ttcagtccta gctcattaat ttttctgatg gcgtatgatt tattgttctc 9240
aaaattttgg atgaacctaa catttaattt gaattgctcg atgttgttgt ggaattgttg 9300
aaattctcgc tttctcatat gaagttacaa tcaaggagaa aaaggcacct gttactagca 9360
cttataatta gttgtttgac cagtaacacc aataaagtat aatttcattt ttaccatttt 9420
tattatcaga ttcatgtgtt ttgtttatcc aactcctgtt atcaatgata ctctgatgta 9480
actgtggtta tgaagacaga accatgcata tcagtgcatc atatatagtt ttactctgat 9540
tcttttgctc ttttctgttt tacagcaagt ggtagatcat tgctaagtgt cgaagatcga 9600
ctagaacctg atagtcatcc acttgcatta acagctgatg cagttgcaac caatggtgta 9660
aatccatgga actggagaga cacctctacc aatggtacta atccaaatcc aaacacacta 9720
aaagtgataa taataatctg gatatttatg gcagaggaat tggactggtt ggaaatattg 9780
ctgcttgact gtgtacttat gaacttgatt caacttccat tggataatat ttattttgat 9840
tgcatgaact tcctgttctg ctgagaaata ttatttcaaa atatttcata aaccactgaa 9900
tttaactatt tagtcatatc tgtcattcct gaaatatgga tgagctattg gatacttttt 9960
tctttctaac tgttattgtt tcaatttgtt tctacgcata cggctaatat acaccatata 10020
ctttattttt actaatgaag ctataagtta ttaatttcag atggtactaa aactctataa 10080
ttcttatgtt aattaattcg tggctccttg ttttaatatt ctgtattaat cgggaaacgt 10140
gcctcataca ggtggagata atcaggttac ttttggtggg agagtcattt tagtcaagtg 10200
gggtgattac actaaaagaa taggcattga tggtactgca gacgcaatta aagaagccat 10260
caaatcggca tttggtctaa gaacaagacg ggccttttgg cttgaagatg aggatgaggt 10320
tgtccgttcc ttagacaggg atatgccggt tggaacatac acccttcatc tcgataccgg 10380
taatcggaaa acgttttctc tgcttatgga caagactttg ttttctccac aactaggaat 10440
accgtagtag attatttaga tttgtaacag tattttctgt attgtggtgt tgttgttgtt 10500
gttgtgtgtg gtggggggat tattttggaa catatggctt ttcagtttgt gacttggttg 10560
gtgcagtaga ccctaactaa gaactgaaag caagtggcac cacacagaag atttgcatcc 10620
attaacttta aatgtgaatg ccgatttctt gtttgagatt cttcttgttg agctaactag 10680
ttcatgttgg tcatctgtac atctaactag aaagtatggt gctaactaga aatttctttt 10740
gggggtattt gtatactagt gatgtttgtc agtatttatg tttggatgct gccaatagtg 10800
aatgacactc tcattaccaa caaactgtaa aaaatatcat gttttatcag ttgtaattta 10860
cgtctcaatt tacgatgcta ttttgcgtcc aagttgcgca ttgccaacta aaagatttag 10920
ttttttttct gaagtttttt ttttcaaact ctactgaagg atgttcatca acactgctcc 10980
cttttgttcc aaatatagat tactttagac ttctcaacaa tttccttagt aagtcattta 11040
ggaacttcta agcacttatt caaaaaaaat tcctccatga ttgtccttcc aaaatagatg 11100
ctccttctct cataaagaaa tgatacatat tttccaatgt aatataaatg aaggccaaca 11160
aggtcaattt gagttagtgc acagatctaa aacaacttat tttggaatca gatagagtta 11220
tattgattca atcattgctg cattcaatgt tcacaggaat gaccatcaaa ctatatatgt 11280
tcgaaaatga tgaggtccgg acagaagaca agacattcta cactgaagag gacttccgag 11340
actttctctc gcggcgtggt tggacactcc tcagggagta ttcaggctac agaatcgccg 11400
atactctgga tgaccttcgt cctggtgtga tttatgaagg gatgcgatca cttggtgatt 11460
gatttggtga cattgcctga ccaaggcata taatatatcc aaagtagata tggagcatac 11520
tcctaccttt taatgcaatt tgaagccaag caaatcatgg gttcctggtt attgtaaatt 11580
tagcttttgg catcttgacc taagctaatt ttaaatgtcc atgcagccga aggggaaaag 11640
ttatactgga tatacattgg ttacccgaag taaatagcct tggaagttgg aacttgaaag 11700
ttggaaatat gatcattcaa gctctctgaa gatccaaggt gctttggctg agtacaaaga 11760
ttacagccta aatgaggacc tgttagttgc tgccaacagg tcctggggtt cctctggttt 11820
atatgtaaat gtaaatgtag ctctgtagca tcttggtgtt agttagtttc caatgtgttt 11880
gttacccatg ctgatactgg gttttacatt tgtcacaaat agtcttggaa gctggaaaca 11940
aatacattca tcagaagtgt aatttgtccg gacaacgaag gttgtctggc aaaatgtaag 12000
atttctgatg gattgttgca aacagccttg gaagttccga agctggaata aattcattca 12060
gcagaagtgc attttgtctt gagattgaag atggtacaaa attacttcta atttaatatg 12120
caagttttga caagaaaaac ggtggtcgat ataacataaa ctttgaggat acggctgtct 12180
tgagattgaa gatggtacag aattactttt aatttaagtg cattttgtta ttcacagagc 12240
atatgacttc aaaacacctt gaatcttttg agattctgaa gtgagaaaca acacatataa 12300
ttgaacaaca cagtgaagaa atcgtggcac acgatcacga tgcattcaac tccagtggta 12360
ctttcaaccc aggatttcaa aggctgagga aaaaaaaatc atggtgaagc agcgatacac 12420
agtcgattct cccaaaatgc ggtaaagaac aagaaaaggg attctcccag agcacacgag 12480
ttccgatagg gctagggcgt gaatgaacga acgattcaca caagcatcac gcctagcaag 12540
ctaagctagc taaataagct agcagcaata aactagcaag ggggtctcct cctcatggct 12600
ccaacctcca ccggcggctt ctactcctcg tcccactcgt cgaccttgta ggagacgagc 12660
gtgtccacct tgtgaatctg ccatggcaag aacacggcgc tgtaacgtca gcaatctggg 12720
agaggcagcg aaaaaaaaga aacggagtcg attcagtgat attcaccttg gtgtcgaagg 12780
aatgcagctt caccatctgt ggattctcga tgagcttggc gtcgctctcc acccaggtga 12840
agggcaccgc gacgtccatg tcggtgtacg ccagcacgtc gaatatgcct gcaaaatcaa 12900
tcaatcaatc aatcaatcaa tcgacgaatg cggatgagct gggaggaatt gggggggaga 12960
gcagaggcga tgaacactga acactgaaga agtagaggtg gtggtaatgg cgcttacatg 13020
gctcgtcgag gcaggggagg taggtgatgc aggaggcgac ctggcgcatg atggcctgga 13080
tctccctcat gatctccttg tcgctcttct ccttgatgac acccttgtcg accacctccg 13140
ggtcggtctg gatgctgaag ttccaccgct ccagcacctc ggaggtggcc ttgctcatga 13200
tcaccagcac gatcctctgc agcttcccgg cctccagcca ctctgcgcgc ggcaacgcag 13260
gaaacacagg caagatcaat cagcagcagc aaaagaaaaa gaaaaaagaa accaaatgga 13320
gacaggcagg ctagtgatcc ggtgagtgag gccagacgac ctgagagctg ggtgttgagg 13380
ttggcgatga aggtcttcac cccttcgtcc tgcgtcagca gcatcgtgag gccgtacttc 13440
ttcaccttgg tgaagctctc ctccgggtac accccgcggt tgtacaggat gctgcgccac 13500
gcacaaacca agaacacaaa acaccccgga tcagaaatta accctgaatc tgcagcaacc 13560
gttttttata ttttttttct ttcaaaggaa accagcatca gcgcagcggc ggccgtcgat 13620
cctggcaccc gcaaccgcgc gaagcgcgca cctgttcgcg gcgtagcctg ccacacgaga 13680
aaaggcattc gatcaaacac ctatcgggcg cgcgcacgcg tgagaggagc cgagggcgaa 13740
aaaaaataaa agaaacggaa gcggagatcg gcttctaccg aagaactcgc tgacgatggc 13800
ggcggagccc cgcagcgtga tgatgtcctt ggacgccgtc ctcgacgcca tctcctgatc 13860
cgcctcacct tcttaactcc tcctcttgcc tcccgtgcgg cggcggcggc ggcggcggat 13920
ggggggagag gaaagaggaa agggggggaa aagccgggca aaggcaacgg ctagtgtgga 13980
gcggatcggc tgcgggctgc ggcgcttggg aacttgggag cgttgtttgt cgatgggtcg 14040
tgttgggtca ggtgcggggg agagaaggtg tcggcgtgcg ggtgggtttc gggagttttt 14100
aaaggtgggc cggacctgcg ctcccaacgg tcgtgtgggc ggtgggccag tgggcttcgg 14160
ttggcgcgat tcgcccaagc cgcgcgctct cttcgagtcc tttacctctt gttgatgatg 14220
aattgtactg gtaccagtag actactagta gaaccgtaga aacaccattt tcttggagaa 14280
aatgctcctg ggtggctggg tttttgaact tgttcggacg gttggccttt agggcagtcc 14340
caacccataa cactagacat agttttcata aactctacat catcaagaaa ttagtactag 14400
acactactct ttcaatataa acaccactat tccatacttc aatttaatgc aatttatctt 14460
acatgatatt ttgtgtagaa accatatctc atgcaagaca tggtttcctt ctctttcctc 14520
atttatttac ttgccacatc attttttatc ctaggtggca acttatataa tgttatggac 14580
atcatcctag acattgggtt gggaataacc ttagaaacgg agggaaggta tttgcccttt 14640
gccgccaaca acccctattt gccctcatat tcgtccgttt agcacagtta taacttacca 14700
aacaattttg gtttcaccaa aaaaaataga gtaaagctgg ttagagtgtt ctcgcaaaat 14760
gagcgtctta ccaaacgaga catctgtttc ttactgtttt tctgggctta ttcggccgaa 14820
ttgtaaatcg aaaagtttat tcttcaccag actaaaaaaa tacgcttatt cattatatta 14880
tcagagcata tcatttgatt cacggtttgg aaaattatgt tttgaaaata caaaaactta 14940
tactgtagtc cttccatcac ggcacaacaa cttttttcca tgtcttgtaa tataaggtgt 15000
gtgtgcatgc atgcacatta actatcacct cttagtcctt taaatttggt ttgttttaaa 15060
ccatctacca tcaagccccc aatcacactg cttgcctgta cggatgtgat ctaaccgatg 15120
cgataatcaa attatttctc ggtcttttgc gttagaagtg atttagccta acacccattt 15180
tggcatgtag ggagtattac ttagaccact cattttagac atattttatc ttaaaatatt 15240
aaattaacca ctataatcgg ttatataatg gcgataataa tatactcaat aatctaaata 15300
tagtttttaa tatatttgtg aactatgtga ttctatacta aaaactaccc ctatgcctta 15360
aaagccactg actagcactg acattctgtt tgccttttgt ttgaaagtta atttggatgt 15420
atttaaaatt caagtaggat tatattgttt cggtagagat tatttttcaa gagaaagttt 15480
cctttgattt tttttggtgc aacctttttt ctttacaaag ggaacttttc taatgtttgt 15540
tagaagtttt ggtatatagc taactttttt atttctcttg tagatttttt tcctatgaaa 15600
aacctttata gttcttttgg tgaaagttct atcaggccct gccattttta ctggcacagc 15660
ttaagaaatg gagcactatg tttgattcat tggccaatgt atgcacggta aattgttaat 15720
gcatcgtata gcaaccaata tatacaacta ccagttgtag aggagatatc tcgtttcagt 15780
aaccgccatt ttttcaccaa ccaagtcacg ttttaataac attctaatcg aacattttca 15840
atttataact aaaactaaac cagaggaaat gactgtattc taggacaaaa tatacacgga 15900
tcaaatcacg tcttattaag aaggaatatt tctcagtatc ggttcccttg ctctaaatga 15960
tactgtatca actattcata acaccgttta tatgtttctt gatcagcagg acgatagatc 16020
ttcaacggct gattatcatc gatcttcttg gggaggaagc ctacctttgc cattatcttt 16080
tcgtgggccc aaatccagca gcggtccaac gtttctctcc acccacagga accttctgga 16140
aacccacgcc ctctctatcc cctctcccaa tccagcgacg tggccgcatc tcccaccgtc 16200
cacttccccc ctcccgattc aaaccaacgg ccccgatccc atccttgagc cgcgggcaca 16260
gagccctgga tcccccggcg gagccagttc tatataaagg cgaggccgcc ccagctggca 16320
ccacccattc ctcgcgtcgc atcgcacttg tagctctcga cccccgcatc tcatccctcc 16380
tctcgcttag ttcagatcga aatcgcaaat gggtaactcc gccatctgat cccgcttcct 16440
ccgatctcga tctggtctcc ccgttcccgt tctgttctag tggagtgatt tttttgcatt 16500
tttttctgac tttttgctgg ttggtttttt ggcttctgca gcgaagatta agatcgggat 16560
caatggtgag ttggaccttc gtctccagat ctgtgttttg tgccggtgtt tgcggggttt 16620
tgggggtggg ttttgattgt tggatgtgga ttgtgtaggg ttcgggagga tcgggaggct 16680
cgtggccagg gtggccctgc agagcgacga cgtcgagctc gtcgccgtca acgacccctt 16740
catcaccacc gactacatgg taaaccctcc tgccttttgc ttttatctcg ttagctgcac 16800
agatttgtgg atagatgcga ggggatgttt ggtttgtttt agatctacta ttccaggggc 16860
tagtttgtgg gtttaggtgt taggaggtta cagtcacagt gtgctcttga ctggcttgag 16920
cttgacccag cgtattgatc tgcatacgcg agctagtttt ttgtggctgc ttatcatatt 16980
gttgtcctaa ttagatctgt gagtttggaa tttggatatc agtgtgtcga cctgtcgatc 17040
aaatagtcat tgatatgtct tcagatgcat ttgcacatgc aaaatcacag attgtgccgg 17100
ttgctttaaa attccgcaca gcgatatgct ttgctgtggt actggcttct gagatatgtt 17160
tgccacatcc agctatttgt ttccagtttg ttttggtttg ataatggccc ttcttaaata 17220
tctgtgattt tccttttcat ctgaagtgtg aatccaatca tctagacaat gcggtgataa 17280
cttttttttc aatttcctgc agacatacat gttcaagtat gacactgtgc acggccagtg 17340
gaagcatcat gaggttaagg tgaaggactc caagaccctt ctcttcggtg agaaggaggt 17400
caccgtgttc ggctgcaggt ttgctgtttt tttccctctc tgctgttgtc tgatgatatc 17460
atgagcagta taccatatcg ctcaacctta atttctctgc tcaggaaccc tgaggagatc 17520
ccatggggtg agactggcgc tgagtttgtt gtggagtcca ctggtgtttt cactgacaag 17580
gacaaggccg ctgctcacct gaaggtattt tctgcgaaac ccaacatgtc attgtttgat 17640
tgtggtgtca taacaattca tatgaagaat gattctcatg gtatcatatg cgtttcaata 17700
tagggtggtg ctaagaaggt cgtcatctct gctcccagca aggatgcccc catgtttgtt 17760
gttggtgtca atgagaagga gtacaagcct gacatcgaca ttgtgtccaa tgctagctgc 17820
accaccaact gccttgctcc acttgccaag gtgtgttcct cactcatttt cacttgtcta 17880
ctgttgcaaa ttgtgtggtg atgttaagaa attggtcact actaccatat gaagccttgt 17940
ccttatcaaa ttgtctgcct gcaggttatc aatgacaggt ttggtattgt tgagggtttg 18000

Claims (4)

1.一种通用长片段染色体步移的方法,其特征在于,包括如下步骤:
(1)利用Tn5转座酶复合体将基因组DNA随机打断,且在DNA断点处加上ULS-GW接头,ULS-GW接头由两条退火在一起的DNA单链组成,作为后续PCR反应的引物结合位点;
(2)纯化转座酶打断后的DNA产物,检测片段大小,然后将纯化产物进行片段分选;
(3)选择7-9 kb左右的片段,利用目的基因特异引物和位于ULS-GW接头上的引物GW1配对,扩增目的基因片段;
(4)对第一轮PCR产物再次进行片段分选,选择7-9 kb的片段;
(5)以分选得到的7-9 kb的PCR产物为模板,利用目的基因特异引物和位于ULS-GW接头上的引物进行第二轮巢式PCR扩增;经过两轮PCR扩增,已知序列DNA片段的上下游的未知序列能够被扩增出来,后续可用TA克隆的方法将目的片段克隆进载体,进行sanger测序,得到完整的未知序列的信息。
2.根据权利要求1所述通用长片段染色体步移的方法,其特征在于,步骤(1)通过调整Tn5转座酶复合体和基因组DNA的比例,以及反应buffer的成分,将打断的DNA的长度控制在峰值为8kb左右,弥散分布于4-12kb。
3. 根据权利要求1所述通用长片段染色体步移的方法,其特征在于,所述引物GW1的核苷酸序列如序列表SEQ ID NO:1所示。
4. 根据权利要求1所述通用长片段染色体步移的方法,其特征在于,所述目的基因特异引物为Target_L1与Target_L2;所述Target_L1的核苷酸序列如序列表SEQ ID NO:2所示;所述Target_L2的核苷酸序列如序列表SEQ ID NO:3所示。
CN201811172205.2A 2018-10-09 2018-10-09 一种通用长片段染色体步移的方法 Active CN109295163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811172205.2A CN109295163B (zh) 2018-10-09 2018-10-09 一种通用长片段染色体步移的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811172205.2A CN109295163B (zh) 2018-10-09 2018-10-09 一种通用长片段染色体步移的方法

Publications (2)

Publication Number Publication Date
CN109295163A true CN109295163A (zh) 2019-02-01
CN109295163B CN109295163B (zh) 2022-11-15

Family

ID=65161980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811172205.2A Active CN109295163B (zh) 2018-10-09 2018-10-09 一种通用长片段染色体步移的方法

Country Status (1)

Country Link
CN (1) CN109295163B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102634506A (zh) * 2012-04-06 2012-08-15 湖南杂交水稻研究中心 一种黏性末端接头应用于侧翼序列分离的方法
CN103476950A (zh) * 2011-04-05 2013-12-25 陶氏益农公司 对转基因边界的高通量分析
CN103757014A (zh) * 2014-01-08 2014-04-30 上海大学 富集Ac/Ds侧翼序列用特异性引物及其富集方法
CN103938277A (zh) * 2014-04-18 2014-07-23 中国科学院北京基因组研究所 以痕量dna为基础的二代测序文库构建方法
CN105002570A (zh) * 2015-07-21 2015-10-28 中国农业科学院深圳农业基因组研究所 一种一次制备多个dna大片段插入双末端测序文库的方法
CN105525357A (zh) * 2014-09-30 2016-04-27 深圳华大基因股份有限公司 一种测序文库的构建方法及试剂盒和应用
CN106755451A (zh) * 2017-01-05 2017-05-31 苏州艾达康医疗科技有限公司 核酸制备及分析
CN107002153A (zh) * 2015-02-04 2017-08-01 深圳华大基因研究院 一种构建长片段测序文库的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103476950A (zh) * 2011-04-05 2013-12-25 陶氏益农公司 对转基因边界的高通量分析
CN102634506A (zh) * 2012-04-06 2012-08-15 湖南杂交水稻研究中心 一种黏性末端接头应用于侧翼序列分离的方法
CN103757014A (zh) * 2014-01-08 2014-04-30 上海大学 富集Ac/Ds侧翼序列用特异性引物及其富集方法
CN103938277A (zh) * 2014-04-18 2014-07-23 中国科学院北京基因组研究所 以痕量dna为基础的二代测序文库构建方法
CN105525357A (zh) * 2014-09-30 2016-04-27 深圳华大基因股份有限公司 一种测序文库的构建方法及试剂盒和应用
CN107002153A (zh) * 2015-02-04 2017-08-01 深圳华大基因研究院 一种构建长片段测序文库的方法
CN105002570A (zh) * 2015-07-21 2015-10-28 中国农业科学院深圳农业基因组研究所 一种一次制备多个dna大片段插入双末端测序文库的方法
CN106755451A (zh) * 2017-01-05 2017-05-31 苏州艾达康医疗科技有限公司 核酸制备及分析

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PENG LUO等: "A Novel and Simple PCR Walking Method for Rapid Acquisition of Long DNA Sequence Flanking a Known Site in Microbial Genome", 《MOL BIOTECHNOL》 *
XIANBO JIA等: "Linear and exponential TAIof fanking sequences adjacent to Tn5 transposon insertion sites", 《AMB EXPRESS》 *
YAO-GUANG LIU 等: "High-efficiency thermal asymmetric interlaced PCR for amplification of unknown flanking sequences", 《BIOTECHNIQUES》 *

Also Published As

Publication number Publication date
CN109295163B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
AU2020223681B2 (en) Plant regulatory elements and uses thereof
CN102212540A (zh) 同时适于七个转基因油菜品系特异性检测的标准分子
CN107488717A (zh) 基于高通量测序检测人类基因组突变负荷捕获探针和应用
WO1993000353A1 (en) Sequences characteristic of human gene transcription product
CN110863048A (zh) 一种检测dna同源重组修复通路有效性的探针库、检测方法和试剂盒
CN104673809B (zh) 一种苹果酸脱氢酶基因及其重组表达载体
CN105296509B (zh) 一种苹果酸脱氢酶基因rkmdh2及其重组表达载体
KR101891406B1 (ko) 살모넬라 타이피뮤리움 생균의 표면에 특이적으로 결합하는 dna 앱타머 및 이의 용도
CN109402092A (zh) 一种海洋环境来源的几丁质酶及其基因
RU2737829C1 (ru) Последовательность ДНК-аптамера, связывающаяся с пептидогликан-ассоциированным липопротеином Legionella pneumophila
CN105838724B (zh) 一种苹果酸脱氢酶基因rgmdh1及其重组表达载体
CN107266585A (zh) 一种mlh融合抗菌肽及其制备方法和应用
CN106754875A (zh) 基因饱和突变库及其构建方法、应用
CN109295163A (zh) 一种通用长片段染色体步移的方法
CN109487005A (zh) 用于扩增山羊地方性鼻内肿瘤病毒全基因组序列的引物
CN105886517B (zh) 一种苹果酸脱氢酶基因rkmdh1及其重组表达载体
KR101459547B1 (ko) 살모넬라 티피뮤리움에 특이적으로 결합하는 단일가닥 dna 압타머 및 그 제조방법
CN115605589A (zh) 改进的用于生产类异戊二烯的方法
CN105602977A (zh) 高活性人细胞因子Eotaxin-2的制备方法及应用
CN104087657A (zh) 一种检验Liddle’s相关基因突变的试剂盒
KR101811737B1 (ko) 대용량 메타지놈 분석을 통한 유용 유전자원 탐색 방법 및 이의 이용
KR101432897B1 (ko) 제초제 저항성 pat 단백질에 특이적으로 결합하는 dna 앱타머 및 이의 용도
CN103667426A (zh) 转基因玉米Bt11液相芯片检测方法
KR102516041B1 (ko) 대량 고효율의 상추 품종 식별을 위한 snp 마커, 프라이머 세트, 및 이의 용도
KR102175443B1 (ko) 멜론 품종 식별용 분자 마커 및 이를 이용한 식별 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230726

Address after: No.7 Pengfei Road, Dapeng New District, Shenzhen, Guangdong 518000

Patentee after: SHENZHEN ZHONGNONG JINGYUE BIOTECHNOLOGY CO.,LTD.

Address before: 518120 Pengfei Road, Dapeng new area, Shenzhen, Guangdong Province, No. 7

Patentee before: AGRICULTURAL GENOMICS INSTITUTE AT SHENZHEN, CHINESE ACADEMY OF AGRICULTURAL SCIENCES

TR01 Transfer of patent right