CN112831517A - 由番茄红素基因介导的改造的克隆载体及其应用 - Google Patents

由番茄红素基因介导的改造的克隆载体及其应用 Download PDF

Info

Publication number
CN112831517A
CN112831517A CN202011315896.4A CN202011315896A CN112831517A CN 112831517 A CN112831517 A CN 112831517A CN 202011315896 A CN202011315896 A CN 202011315896A CN 112831517 A CN112831517 A CN 112831517A
Authority
CN
China
Prior art keywords
pcci
brick
seq
vector
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011315896.4A
Other languages
English (en)
Other versions
CN112831517B (zh
Inventor
马小舒
李一凡
王嫚
吴政宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Jinsirui Science and Technology Biology Corp
Original Assignee
Nanjing Jinsirui Science and Technology Biology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Jinsirui Science and Technology Biology Corp filed Critical Nanjing Jinsirui Science and Technology Biology Corp
Publication of CN112831517A publication Critical patent/CN112831517A/zh
Application granted granted Critical
Publication of CN112831517B publication Critical patent/CN112831517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers

Abstract

本发明属于基因工程领域,涉及一系列由番茄红素基因介导的改造的克隆载体及其应用,所述改造的克隆载体是将番茄红素基因克隆至穿梭质粒pCCI‑Brick和pUC57‑Brick中,并在番茄红素基因序列的两端分别添加只出现一次且常用的酶切位点。本发明有效解决了载体PCR耗时过长的问题,由于插入序列两端不引入冗余序列且无需诱导物诱导就能表达显色,有效地避免了酵母细胞中单片段或多片段拼接过程中空载率的发生。此外,增加的多克隆位点也为在大肠杆菌中单片段或多片段基因克隆提供了便利。

Description

由番茄红素基因介导的改造的克隆载体及其应用
技术领域
本发明涉及一系列由番茄红素基因介导的改造的克隆载体、使用这些载体转化的酵母细胞、这些载体和细胞的制备方法、以及这些载体和细胞在基因工程领域中的应用。
背景技术
酵母质粒载体是基因表达载体的一种,既可以在大肠杆菌中、又可以在酵母系统中进行复制与扩增,所以也称为穿梭载体。它分为整合载体和自我复制载体两类。(1)整合载体:它带有一个酵母营养缺陷型标志基因和大肠杆菌中的复制和报告基因。在实际应用中,整合载体的转化效率往往较低,而且稳定性较差。(2)自我复制载体:该类载体除包含(1)中的原件外,还可在酵母中自我复制。其中自我复制质粒可用于酵母细胞介导的大片段拼接,从而获得了广泛的应用。然而,自我复制载体的使用必须仔细考虑以下几个方面:(a)需要简便且明显的筛选插入物的方式避免发生空载;(b)方便通过PCR扩增来进行后续的基因操作;(c)需要较多的酶切位点以利于后续应用。此外,自我复制载体在酵母和大肠杆菌中还要有适当的遗传标志、符合实际需要的复制方式和拷贝数等。
目前常用的穿梭质粒,以pCCI-Brick和pUC57-Brick(其均可从南京金斯瑞生物科技有限公司购得)为例,载体中可用的多克隆位点极少。因此克隆过程中多采用PCR扩增载体的方式进行拼接,特别是pCCI-Brick载体片段长达10.8kb,扩增阶段耗时长且回收效率低,会对后续实验的顺利进行造成一定的影响。除此之外,拼接实验后pUC57-Brick和pCCI-Brick空载的情况无法有效避免,给后续实验的验证带来诸多不便。
某些质粒(例如大肠杆菌质粒pMD19-T)中的lacZ基因介导的蓝白斑筛选技术可有效避免空载情况的发生,但在插入序列两端会引入冗余序列,而且无法在酵母细胞中通过显色进行筛选。因此,本领域亟待解决的技术问题至少为:克服现有技术中的上述缺陷,提供一种改进的克隆载体及其应用。
发明内容
有鉴于此,本发明首次将番茄红素基因克隆至穿梭质粒pCCI-Brick和pUC57-Brick中,并在番茄红素基因序列的两端分别添加只出现一次且常用的酶切位点(对于pCCI-Brick为NheI和PacI;对于pUC57-Brick为SpeI和SmaI)。本发明有效解决了载体PCR耗时过长的问题,由于插入序列两端不引入冗余序列且无需诱导物诱导就能表达显色,有效地避免了酵母细胞中单片段或多片段拼接过程中空载率的发生。此外,增加的多克隆位点也为在大肠杆菌中单片段或多片段克隆提供了便利。
本发明使用的现有质粒载体pCCI-Brick和pUC57-Brick为没有任何常用克隆位点的环状克隆载体,本发明的克隆载体提供了一种全新的克隆和拼接方式。
第一方面,本发明提供了一种改造的克隆载体,其为环状质粒载体,在pCCI-Brick和pUC57-Brick载体上分别添加了常用且只出现一次的多克隆酶切位点(对于pCCI-Brick为NheI和PacI;对于pUC57-Brick为SpeI和SmaI),并在多克隆位点间添加了可在酵母细胞中进行红白斑筛选的番茄红素基因。在插入序列两端不引入冗余序列的前提下,有效降低空载率的发生。常用的多克隆位点的引入为单个或多个片段在大肠杆菌中的克隆提供了便利。其中所述片段的长度可为60kb以下、40kb以下、20kb以下、5kb以下或3kb以下。
第二方面,本发明提供了使用上述克隆载体转化的酵母细胞。
第三方面,本发明提供了制备上述克隆载体和上述转化细胞的方法和使用这些载体和细胞克隆外源基因序列的方法。
第四方面,本发明提供了上述克隆载体和细胞在基因工程领域中用于克隆外源基因序列或制备克隆试剂盒的用途。所述用途包括将本发明的载体和细胞用于在酵母中进行大片段组装,用于克隆大肠杆菌的基因,用于在酵母及大肠杆菌中复制。此外,本发明的载体和细胞对毒性基因也具有一定的耐受能力。
第五方面,本发明提供了包含上述克隆载体和细胞的试剂盒。
本发明的技术方案
本发明的技术方案涉及如下方面:
(1)载体的设计;
(2)待组装片段的获得;
(3)通过在酵母中组装片段获得本发明的载体;
(4)将本发明的载体用于外源基因序列的克隆,即在酵母中将本发明的载体的片段与外源基因序列的片段进行组装,并通过菌落PCR(菌检)验证组装的效率和准确性;
(5)转化大肠杆菌抽提质粒,通过高通量测序技术(NGS)验证序列。
本发明实现的有益效果
本发明提供的克隆载体pCCI-Brick-crt和pUC57-Brick-crt在PCR克隆时耗时短,由于插入序列两端不引入冗余序列并无需诱导即可在酵母细胞中进行红白斑筛选,从而降低了空载率并大幅提高了克隆的效率。由于本发明的载体为穿梭质粒,且为严谨性复制质粒,在酵母及大肠杆菌中均可复制。而且由于载体本身的性质,本发明的载体对毒性基因具有一定的耐受能力。此外,常用的多克隆位点的引入为一个或多个大片段的克隆操作提供了便利。在酵母细胞中分别拼接20kb和40kb的大肠杆菌基因组序列的菌检正确率可达到100%,经NGS测序验证,目的序列完整的插入了载体中。
本发明涉及如下各项:
1.一种可在酵母和大肠杆菌中复制的克隆载体,所述载体在现有质粒载体中插入可在酵母内表达的番茄红素基因作为颜色标记,其中所述的现有质粒载体选自下组:pCCI-Brick和pUC57-Brick。
2.根据项1所述的克隆载体,其中所述番茄红素基因包含SEQ ID NO:1的序列或由SEQ ID NO:1的序列组成。
3.根据项1或2所述的克隆载体,其中所述载体在番茄红素基因的两端各插入一个或多个只出现一次的酶切位点。
4.根据项3所述的克隆载体,其中所述现有质粒载体为pCCI-Brick,且所述酶切位点选自:NheI、PacI、MauBI、MluI和PmeI,优选NheI和PacI。
5.根据项3所述的克隆载体,其中所述现有质粒载体为pUC57-Brick,且所述酶切位点选自:SpeI、SmaI、PacI、PmeI、SalI、NotI、NheI、MauBI、MluI、PstI、FseI和SfiI,优选为SpeI和SmaI。
6.一种用项1-5中任一项所述的克隆载体转化的酵母细胞。
7.一种制备可在酵母和大肠杆菌中复制的克隆载体的方法,其包括如下步骤:
(1)根据番茄红素基因的序列设计PCR扩增引物pf1和pr1,所述pf1包含番茄红素基因5’端同源区域和选自NheI或SpeI的酶切位点,且所述pr1包含番茄红素基因3’端同源区域和选自PacI或SmaI的酶切位点,以番茄红素基因为模板,以pf1和pr1为引物扩增适于组装所述克隆载体的番茄红素基因片段;
(2)根据现有质粒载体的序列设计PCR扩增引物pf2和pr2,以现有质粒载体为模板,以pf2和pr2为引物扩增适于组装所述克隆载体的现有质粒载体基因片段,其中所述现有质粒载体选自下组:pCCI-Brick和pUC57-Brick;
(3)将所述番茄红素基因片段与现有质粒载体基因片段以等摩尔量混合并在酵母细胞中组装以获得所述克隆载体。
8.根据项7所述的方法,其中所述番茄红素基因包含SEQ ID NO:1的序列或由SEQID NO:1的序列组成。
9.根据项7或8所述的方法,其中所述现有质粒载体为pCCI-Brick,所述pf1包含5’同源区域SEQ ID NO:2和酶切位点NheI,且所述pr1包含番茄红素基因3’同源区域SEQ IDNO:3和酶切位点PacI。
10.根据项7-9中任一项所述的方法,其中所述现有质粒载体为pCCI-Brick,所述引物pf1和pr1分别为如SEQ ID NO:6所示的pCCI-f1和如SEQ ID NO:7所示的pCCI-r1。
11.根据项7-10任一项所述的方法,其中步骤(2)中的现有质粒载体基因片段通过两部分分别扩增,其中用于扩增第一部分的引物pf2a和pr2a分别为如SEQ ID NO:8所示的pCCI-f2和如SEQ ID NO:9所示的pCCI-r2,且其中用于扩增第二部分的引物pf2b和pr2b分别为如SEQ ID NO:10所示的pCCI-f3和如SEQ ID NO:11所示的pCCI-r3。
12.根据项7或8所述的方法,其中所述现有质粒载体为pUC57-Brick,所述pf1包含5’同源区域SEQ ID NO:4和酶切位点SpeI,且所述pr1包含番茄红素基因3’同源区域SEQ IDNO:5和酶切位点SmaI。
13.根据项7-8和12中任一项所述的方法,其中所述现有质粒载体为pUC57-Brick,所述引物pf1和pr1分别为如SEQ ID NO:12所示的pUC57-f1和如SEQ ID NO:13所示的pUC57-r1。
14.根据项7-8和12-13中任一项所述的方法,其中步骤(2)中的所述引物pf2和pr2分别为如SEQ ID NO:14所示的pUC57-f2和如SEQ ID NO:15所示的pUC57-r2。
15.一种制备项6的酵母细胞的方法,其包括:
(a)制备感受态的酵母细胞;和
(b)使用根据项1-5中任一项所述的克隆载体或通过根据项7-14中任一项所述的方法制备的克隆载体转化(a)制备的感受态的酵母细胞。
16.项15所述的方法,其中所述感受态的酵母细胞是通过收集过夜培养的酵母单菌落,并用醋酸锂转化方法制备的。
17.项15或16所述的方法,其中所述转化是通过将番茄红素基因片段与现有质粒载体基因片段的等摩尔混合物加入所述感受态的酵母细胞中来进行的。
18.项15-17中任一项所述的方法,所述方法进一步包括(c)将所述转化的酵母细胞在平板上培养并将得到的红色菌落作为项6的酵母细胞。
19.一种克隆外源基因序列的方法,其包括:
(a)将根据项1-5中任一项所述的克隆载体或从根据项6所述的酵母细胞中分离得到的克隆载体进行酶切以获得组装用载体片段;
(b)分别根据步骤(a)获得的组装用载体片段的序列以及所述外源基因序列设计PCR扩增引物对,并通过PCR反应得到待组装的各个基因片段;
(c)制备感受态的酵母细胞;和
(d)将步骤(a)获得的组装用载体片段与步骤(b)获得的待组装的各个基因片段转化入(c)制备的感受态的酵母细胞以获得含有组装后的外源基因序列的克隆载体。
20.根据项19所述的方法,其中所述感受态的酵母细胞是通过收集过夜培养的酵母单菌落,并用醋酸锂转化方法制备的。
21.根据项19或20所述的方法,其中所述转化是通过将组装用载体片段和待组装的各个基因片段的等摩尔混合物加入所述感受态的酵母细胞中来进行的。
22.根据项19-21中任一项所述的方法,所述方法进一步包括(e)将所述转化的酵母细胞在平板上培养并将得到的白色菌落作为携带所述外源基因序列的菌株。
23.根据项19-21中任一项所述的方法,其中所述外源基因序列的长度为60kb或40kb以下。
24.根据项1-5中任一项所述的克隆载体或根据项6所述的酵母细胞在基因工程领域中用于克隆外源基因序列的用途。
25.根据项1-5中任一项所述的克隆载体或根据项6所述的酵母细胞在制备克隆试剂盒中的用途。
26.一种克隆用试剂盒,其包含:
(i)根据项1-5中任一项所述的克隆载体或根据项6所述的酵母细胞;和
(ii)使用说明。
附图简述
图1A:pCCI-Brick-crt质粒结构示意图。
图1B:pUC57-Brick-crt质粒结构示意图。
图1C:pCCI-Brick-crt和pUC57-Brick-crt质粒构建示意图。左小图a:向现有pCCI-Brick质粒中插入番茄红素基因,同时在番茄红素两端引入两个酶切位点NheI和PacI;右小图b:向现有pUC57-Brick质粒中插入番茄红素基因,同时在番茄红素两端引入两个酶切位点Spe I和Sma I。
图2:构建pCCI-Brick-crt和pUC57-Brick-crt所需片段的电泳图。其中,pCCI-1(其为番茄红素基因片段)、pCCI-2和pCCI-3(其为现有质粒载体基因片段)用于组装pCCI-Brick-crt;pUC57-1(其为番茄红素基因片段)和pUC57-2(其为现有质粒载体基因片段)用于组装pUC57-Brick-crt。其中使用的1kb DNA梯带为天根生化科技有限公司的1kb定制梯带(MD111-T1)。
图3A:pCCI-Brick-crt和pUC57-Brick-crt平板菌落形态图。左小图a:pCCI-Brick-crt平板菌落形态,淡红色的菌落为阳性克隆,指示成功插入了番茄红素基因;白色菌落为阴性克隆,指示未插入番茄红素基因;右小图b:pUC57-Brick-crt平板菌落形态,淡红色的菌落为阳性克隆,指示成功插入了番茄红素基因;白色菌落为阴性克隆,指示未插入番茄红素基因。
图3B:pCCI-Brick-crt和pUC57-Brick-crt菌落验证图。左小图a:pCCI-Brick-crt菌检验证,以3对菌检引物进行PCR扩增,菌检阳性率为7/8;右小图b:pUC57-Brick-crt菌检验证,以2对引物菌检引物进行PCR扩增,菌检阳性率为2/2。其中使用的DNA梯带为GensciptReady-to-UseTM Plus 100bp DNA梯带(货号M105R-500)。
图3C:pCCI-Brick-crt和pUC57-Brick-crt大肠杆菌平板菌落形态及验证图。左小图a:pCCI-Brick-crt大肠杆菌平板菌落形态与菌检验证,酵母质粒转化大肠杆菌后,大肠杆菌克隆的阳性率为5/8;右小图b:pUC57-Brick-crt大肠杆菌平板菌落形态与菌检验证,酵母质粒转化大肠杆菌后,大肠杆菌克隆的阳性率为8/8。
图4A:pCCI-Brick-crt和pUC57-Brick-crt质粒与酶切载体回收图。左小图a:pCCI-Brick-crt质粒(17871bp)与酶切获得用于后期组装的载体片段图,目的条带大小为10814bp;右小图b:pUC57-Brick-crt质粒(12473bp)与酶切获得用于后期组装的载体片段图,目的条带大小为5418bp。其中,左侧DNA梯带为天根生化科技有限公司的1kb定制梯带(MD111-T1),右侧DNA梯带为TAKARA的超螺旋DNA梯带标记(3585A)。
图4B:40kb与20kb组装用片段扩增产物图。大肠杆菌-1(pCCI)、大肠杆菌-2~大肠杆菌-12用于组装pCCI-Brick-40k;大肠杆菌-1(pUC57)、大肠杆菌-2~大肠杆菌-5和大肠杆菌-6(pUC57)用于组装pUC57-Brick-20k。
图4C:pCCI-Brick-crt和pUC57-Brick-crt用于片段组装示意图。左小图a:pCCI-Brick-crt用于片段组装示意图;右小图b:pUC57-Brick-crt用于片段组装示意图。用内切酶消化各载体,将消化得到的片段回收后与插入片段组装,阳性转化子显示为白色菌落,阴性转化子显示为红色菌落。
图4D:pCCI-Brick-40k和pUC57-Brick-20k平板菌落形态图。左小图a:pCCI-Brick-40kb平板菌落形态,白色的菌落为阳性克隆,即成功插入了目的片段,红色菌落为阴性克隆,含有番茄红素的基因;右小图b:pUC57-Brick-crt平板菌落形态,白色的菌落为阳性克隆,即成功插入了目的片段,红色菌落为阴性克隆,含有番茄红素的基因。平板上都未见到红色菌落。
图4E:pCCI-Brick-40k和pUC57-Brick-20k平板菌落验证图。左小图a:pCCI-Brick-40kb菌检验证,以13对菌检引物进行PCR扩增,前12对引物菌检结果见左上电泳图,第13对菌检引物JJ-F13/JJ-R13(pCCI)的菌检结果见左下电泳图,阳性率8/8;右小图b:pUC57-Brick-crt菌检验证,以7对菌检引物进行PCR扩增,阳性率8/8。其中使用的DNA梯带为Ready-to-UseTM Plus 100bp DNA梯带。
图4F:pCCI-Brick-40k扩增测序结果图。左小图a:pCCI-Brick-40kb插入片段的分段扩增结果;右小图b:插入片段扩增产物的高通量测序技术(NGS)结果节选图。
发明详述
如本说明书和所附权利要求书中使用的,单数形式“一个”,“一种”和“该/所述”包括复数提及物,除非上下文明确另有规定。如此,例如,提及“一个/种分子”任选包括两个/种或更多个/种此类分子的组合,诸如此类。
如本文中使用的,术语“约”指技术领域技术人员容易知道的相应数值的常规误差范围。本文中提及“约”某个数值或参数包括(并描述)涉及该数值或参数本身的实施方案。
理解的是,本文中描述的本发明的方面和实施方案包括“包含”,“由……组成”,和“基本上由……组成”的方面和实施方案。
术语“酵母”意指是单细胞兼性厌氧的真菌微生物,有细胞核、细胞膜、细胞壁、线粒体、相同的酶和代谢途经,是基因克隆实验中常用的真核生物宿主细胞。本发明优选的酵母包括酵母属(Saccharomyces)的菌株,特别是酿酒酵母(Saccharomyces cerevisiae)或葡萄汁酵母(Saccharomyces uvarum)的菌株;毕赤酵母属(Pichia)的菌株,特别是树干毕赤酵母(Pichia stipitis)的菌株、巴斯德毕赤酵母(Pichia pastoris)的菌株;假丝酵母属(Candida)的菌株,特别是产朊假丝酵母(Candida utilis)、阿糖发酵假丝酵母(Candidaarabinofermentans)、迪丹斯假丝酵母(Candida diddensii)、Candida sonorensis、休哈塔假丝酵母(Candida shehatae)、热带假丝酵母(Candida tropicalis)或博伊丁氏假丝酵母(Candida boidinii)的菌株。其它发酵生物包括汉逊酵母属(Hansenula)的菌株,特别是多形汉逊酵母(Hansenula polymorpha)或异常汉逊酵母(Hansenula anomala)的菌株;克鲁维酵母属(Kluyveromyces),特别是脆壁克鲁维酵母(Kluyveromyces fragilis)或马克斯克鲁维酵母(Kluyveromyces marxianus)的菌株;裂殖酵母属(Schizosaccharomyces),特别是粟酒裂殖酵母(Schizosaccharomyces pombe)的菌株。
术语“大肠杆菌(Escherichia coli)”,又称大肠埃希氏菌。其为条件致病性细菌,在一定条件下可以引起人和多种动物发生胃肠道感染或尿道等多种局部组织器官感染。大肠杆菌作为研究生命科学中外源基因表达的宿主,遗传背景清楚,操作简单,培养条件易得,因此目前是应用最广泛、最成功的表达体系,常作为高效表达的首选宿主细胞。
术语“克隆载体”通常为从病毒、质粒或高等生物细胞中获取的DNA序列,在载体上插入合适大小的外源DNA片段,并注意不能破坏载体的自我复制性质。将重组后的载体引入到宿主细胞中,并在宿主细胞中大量繁殖。常见的载体有质粒、噬菌粒、酵母人工染色体。
术语“载体的复制”指从一个原始载体DNA分子产生两个相同的载体DNA分子的生物学过程。复制后的载体与原载体的序列完全一致,并且同样具备复制的功能。载体在宿主细胞中复制后,宿主细胞的子代细胞中仍然携带该载体。
术语“质粒”是指细菌、酵母菌和放线菌等生物中染色体(或拟核)以外的DNA分子,存在于细胞质中(酵母除外,酵母的2μm质粒存在于细胞核中),具有自主复制能力,使其存在在子代细胞中,保持恒定的拷贝数,并表达所携带的遗传信息。本发明的质粒为闭合环状的双链DNA分子。质粒不是细菌生长繁殖所必需的物质,可自行丢失或人工处理而消除,如高温、紫外线等。质粒携带的遗传信息能赋予宿主菌某些生物学性状,有利于细菌在特定的环境条件下生存。本发明的质粒为穿梭质粒,其可以在酵母和大肠杆菌中进行复制。本发明优选的质粒为pCCI-Brick和pUC57-Brick,其均可从南京金斯瑞生物科技有限公司购得。
术语“插入”是指将外源性多核苷酸序列插入到DNA链(特别是质粒)中。插入后的外源性多核苷酸序列可以被正常表达。
术语“表达”是指信息(例如基因编码的和/或表观遗传的)转化成细胞中存在并运行的结构的过程。因此,如本文中使用的,“表达”可以指转录成多核苷酸,翻译成多肽,或甚至多核苷酸和/或多肽修饰(例如多肽的翻译后修饰)。转录的多核苷酸的片段、翻译的多肽的片段、或多核苷酸和/或多肽修饰(例如多肽的翻译后修饰)的片段也应视为表达的,无论它们是源自通过可变剪接生成的转录物或经过降解的转录物,或者是源自多肽的翻译后加工(例如通过蛋白质水解)。“表达的基因”包括转录成多核苷酸(如mRNA),然后翻译成多肽的基因,还有转录成RNA但不翻译成多肽的基因(例如转运和核糖体RNA)。
术语“番茄红素”是指植物性食物中存在的一种类胡萝卜素,也是一种红色素。其为深红色针状结晶,溶于氯仿、苯及油脂中而不溶于水。对光和氧不稳定,遇铁变成褐色。分子式C40H56,相对分子质量536.85。番茄红素具有很强的抗氧化功能。成熟的红色植物果实中含量较高,尤以番茄、胡萝卜、西瓜、木瓜及番石榴等中更为丰富。在食品加工中可用作色素,也常用作抗氧化保健食品的原料。本发明的番茄红素基因是指能够表达为在番茄红素的生物合成中所需的蛋白质的基因。本发明优选的番茄红素基因包含SEQ ID NO:1所示的DNA序列或由SEQ ID NO:1所示的DNA序列组成。
本发明的载体或质粒优选包含一个或多个“标记/标记物”,其允许容易地选择转化的细胞。术语“标记/标记物”是指一种已知功能或已知序列的基因,该基因的产物能够起着特异性标记的作用,例如提供杀生物剂或病毒抗性,重金属抗性,针对营养缺陷型的原养型等。标记物的种类多种多样,主要包括抗性基因、颜色反应基因、代谢缺陷型互补基因和一些其他具有明显性状表型有关的基因等。本发明中采用番茄红素基因作为颜色标记基因。
术语“酶切位点”是指DNA链上一段特定的序列,限制性内切酶能够特异性地识别出这个序列并特定的方式在此将DNA序列切成两段。限制性内切酶是指可以识别并附着于特定的脱氧核苷酸序列,并对在每条链中特定部位的两个脱氧核糖核苷酸之间的磷酸二酯键进行切割的一类酶,简称限制酶。限制性核酸内切酶分布极广,几乎在所有细菌的属、种中都发现至少一种限制性内切酶。常见的酶切位点包括但不限于:AgeI、BamHI、BglII、EcoRI、EcoRV、FseI、HindIII、MauBI、MluI、NheI、NotI、PacI、PmeI、PstI、SacI、SacII、SalI、SmaI、SpeI、SfiI等等。在质粒上引入酶切位点可便于对质粒上存在的DNA序列进行操作和克隆。
术语“PCR扩增”是指聚合酶链式反应,其为用于扩增特定的DNA片段的分子生物学技术,它可看作是生物体外的特殊DNA复制,PCR的最大特点是能将微量的DNA大幅增加。具体而言,PCR技术的基本原理类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性-退火-延伸三个基本反应步骤构成:①模板DNA的变性:模板DNA经加热至90℃以上一定时间后,使模板DNA双链或经PCR扩增形成的双链DNA解离,使之成为单链,以便它与引物结合,为下轮反应作准备;②模板DNA与引物的退火(复性):模板DNA经加热变性成单链后,温度降至约50℃,引物与模板DNA单链的互补序列配对结合;③引物的延伸:DNA模板-引物结合物在约70℃在DNA聚合酶(如TaqDNA聚合酶)的作用下,以dNTP为反应原料,靶序列为模板,按碱基互补配对与半保留复制原理,合成一条新的与模板DNA链互补的半保留复制链,重复循环变性-退火-延伸三过程就可获得更多的“半保留复制链”,而且这种新链又可成为下次循环的模板。
术语“PCR引物(对)”是指一对核苷酸片段,其中一个片段与待进行PCR扩增的目的基因的DNA链中的一条模板链的头部碱基互补(A对T,C对G,反之亦然),而另一个片段则与目的基因的DNA链中的另一条互补链尾部碱基互补(A对T,C对G,反之亦然)。
酵母细胞内部的同源重组机制已经得到广泛的研究,已被广泛用于构建酵母人工合成染色体(YACs)。一些研究表明酵母细胞可以摄入多个DNA片段,可将四或者五个重叠的DNA片段组装连接到载体DNA上(参见Raymond,C.K.等,Biotechniques(1999)26:134-138)。
用于构建本发明的克隆载体并使用本发明的载体进行基因克隆而进行各种分子生物学操作时所采用的规程和方法(质粒抽提、酶切、连接、转化(包括用于酵母细胞的醋酸锂转化方法)、筛选等等)都是本领域技术人员所熟知的(参见,例如,Sambrook等,1989,分子克隆实验指南(第二版),冷泉港,纽约)。
序列说明
Figure BDA0002791397040000111
Figure BDA0002791397040000121
Figure BDA0002791397040000131
Figure BDA0002791397040000141
具体实施例
实例1.质粒设计
以现有载体质粒pCCI-Brick和pUC57-Brick为模板,以可在酵母内表达的番茄红素基因为颜色标记,构建带有颜色筛选标记的组装用载体质粒pCCI-Brick-crt和pUC57-Brick-crt,质粒结构示意图见图1A与图1B。
载体质粒pCCI-Brick和pUC57-Brick与番茄红素基因由南京金斯瑞生物科技有限公司提供,番茄红素基因序列请参见SEQ ID NO:1。
以现有载体质粒为模板扩增载体片段,在扩增得到的载体片段5’端和3’端各引入约40bp同源臂(分别与待插入的番茄红素基因5’端和3’端同源臂),并在待插入的番茄红素基因与载体间引入一个或多个只出现一次的酶切位点以便后续的酶切组装。对于以pCCI-Brick为模板构建的载体pCCI-Brick-crt,酶切位点可选自下组:NheI、PacI、MauBI、MluI、PmeI等,优选在番茄红素基因5’端和3’端分别引入NheI和PacI的酶切位点。对于以pUC57-Brick为模板构建的载体pUC57-Brick-crt,酶切位点可选自下组SpeI、SmaI、PacI、PmeI、SalI、NotI、NheI、MauBI、MluI、PstI、FseI、SfiI等,优选在番茄红素基因5’端和3’端分别引入SpeI和SmaI的酶切位点。构建示意图见图1C。
pCCI-Brick与番茄红素基因序列两侧的同源臂序列:
5’同源臂:GCTAGCACAATGCATACTTTGTACGTTCAAAATACAATGC(SEQ ID NO:2)
3’同源臂:ATGCTTACATTCGACCGTTTTAGCCGTGATCATTAATTAA(SEQ ID NO:3)
pUC57-Brick与番茄红素基因序列两侧的同源臂序列:
5’同源臂:actagtACAATGCATACTTTGTACGTTCAAAATAC(SEQ ID NO:4)
3’同源臂:ATATGCTTACATTCGACCGTTTTAGCCGTGATCAcccggg(SEQ ID NO:5)
实例2.待组装片段的获得
采用PCR技术扩增具有同源臂的载体片段与番茄红素基因片段。
引物名称与序列如下:
pCCI-f1:gctagcacaatgcatactttgtacgttcaaaatac(SEQ ID NO:6)
pCCI-r1:ttaattaatgatcacggctaaaacggtcgaatg(SEQ ID NO:7)
pCCI-f2:atgcttacattcgaccgttttagccgtgatcattaattaactcaacataacgagaacacacaggg(SEQ ID NO:8)
pCCI-r2:cttatccccaggcttgtccacatc(SEQ ID NO:9)
pCCI-f3:cgcgagtttcccacagatgatg(SEQ ID NO:10)
pCCI-r3:gcattgtattttgaacgtacaaagtatgcattgtgctagcgaaaaaaatagcatgcgccaattcactg(SEQ ID NO:11)
pUC57-f1:actagtacaatgcatactttgtacgttcaaaatac(SEQ ID NO:12)
pUC57-r1:cccgggtgatcacggctaaaacggtcgaatg(SEQ ID NO:13)
pUC57-f2:atatgcttacattcgaccgttttagccgtgatcacccgggcgcgaatgcatctagatatcggat(SEQ ID NO:14)
pUC57-r2:gcattgtattttgaacgtacaaagtatgcattgtactagtctcgaattcactggccgtcgt(SEQ ID NO:15)
以番茄红素基因SEQ ID NO:1为模板,以pCCI-f1/pCCI-r1为引物扩增用于组装pCCI-Brick-crt的番茄红素基因片段pCCI-1(7061bp),以pCCI-Brick质粒为模板,以pCCI-f2/pCCI-r2、pCCI-f3/pCCI-r3为引物扩增用于组装pCCI-Brick-crt的现有质粒载体基因片段pCCI-2(5094bp)和pCCI-3(5838bp)。
类似地,以番茄红素基因SEQ ID NO:1为模板,以pUC57-f1/pUC57-r1为引物扩增用于组装pUC57-Brick-crt的番茄红素基因片段pUC57-1(7059bp),以pUC57-Brick质粒为模板,以pUC57-f2/pUC57-r2为引物扩增用于组装pUC57-Brick-crt的现有质粒载体基因片段pUC57-2(5494bp)。
扩增体系如下:
Figure BDA0002791397040000151
Figure BDA0002791397040000161
反应程序如下:
Figure BDA0002791397040000162
构建pCCI-Brick-crt和pUC57-Brick-crt所需片段的电泳图见图2,片段pCCI-1(7061bp)、pCCI-2(5094bp)和pCCI-3(5838bp)用于组装pCCI-Brick-crt,片段pUC57-1(7059bp)和pUC57-2(5494bp)用于组装pUC57-Brick-crt。扩增片段使用的PrimeSTAR GXLDNA聚合酶(货号R050A)购买自Takara生物技术有限公司,按照琼脂糖凝胶回收试剂盒(购买自上海百赛生物技术有限公司,货号AP-GX-250)的操作回收片段。
实例3.通过在酵母中组装片段获得本发明的载体
3.1构建含有质粒pCCI-Brick-crt或pUC57-Brick-crt的酵母细胞
本实例中所使用的培养基具有如下组成:
YPD液体培养基:20g/l葡萄糖,20g/l蛋白胨,10g/l酵母粉。
YPD固体培养基:20g/l葡萄糖,20g/l蛋白胨,10g/l酵母粉,18g/l琼脂糖。
SC-Leu固体培养基:20g/l葡萄糖,6.7g/l YNB,1.62g/l去亮氨酸的氨基酸混合粉末(购买自SIGMA生物技术有限公司,货号Y1376-20G),18g/l琼脂糖。
采用醋酸锂转化方法进行酵母组装。首先通过如下步骤制备感受态的酵母细胞:
(1)将酵母BY4741甘油菌在YPD平板划线,30℃培养2天,挑取单个单菌落在YPD液体试管中,30℃,200rpm过夜培养约16h。
(2)将过夜培养的酵母按照初始OD600=0.1转接至50mL的YPD液体培养基中,30℃,200rpm培养。
(3)培养4小时后,OD600为0.5左右,3000rpm离心2分钟收集菌体。
(4)加入10ml的无菌水重新悬浮细胞,3000rpm离心2分钟收集菌体。
(5)加入10ml的0.1M的LiAC重新悬浮细胞,3000rpm离心2分钟收集菌体。重复以上操作一次。
(6)加入400μl的0.1M的LiAC重新悬浮细胞,取100μl至1.5ml离心管中,至冰上暂存。
(7)变性ssDNA:取25μl的载体ssDNA用PCR仪在99℃加热10分钟,4℃保存。
(8)将需要转化的DNA片段按照每个片段0.1pmol的量混合。
(9)将变性的ssDNA和混合好的DNA加入0.1M 100ul的LiAC悬浮的酵母感受态中,混匀。
(10)依次加入666ul的50%(w/v)的PEG3350,100ul 1M LiAC,加入ddH2O使最终体积为1ml,混匀,室温放置40分钟。
(11)在42℃热击30分钟。
(12)在3500rpm离心4分钟,弃上清。
(13)用1ml的5mM的CaCl2重悬菌体,并室温放置10分钟后,离心涂布在相应的筛选平板,缺少亮氨酸的全合成型培养基平板(SC-Leu)上。
然后通过如下转化步骤进行酵母组装:
DNA片段pCCI-1、pCCI-2和pCCI-3按照各0.1pmol的量等摩尔混合,用于转化上述制备的感受态酵母细胞,以在酵母中组装构建pCCI-Brick-crt载体。按浓度及片段大小计算所得组装所需片段的体系如下:
pCCI-Brick-crt:
片段 大小/bp ng/μL 体积/μL
pCCI-1 7061 64.4 7.13
pCCI-2 5094 235.6 1.41
pCCI-3 5838 135.3 2.80
类似地,DNA片段pUC57-1和pUC57-2各0.1pmol的量等摩尔混合,用于转化上述制备的感受态酵母细胞,以在酵母中组装构建pUC57-Brick-crt载体中。按浓度及片段大小计算所得组装所需片段的体系如下:
pUC57-Brick-crt:
片段 大小/bp ng/μL 体积/μL
pUC57-1 7059 112.6 4.07
pUC57-2 5494 63.7 5.61
在SC-Leu平板上在30℃培养3天后长出菌落,平板菌落生长状态见图3A,平板上长出大量淡红色菌落以及一些白色菌落,淡红色的菌落为阳性克隆,即成功插入了番茄红素的基因,白色菌落为阴性克隆,未插入番茄红素的基因。
3.2含有质粒pCCI-Brick-crt或pUC57-Brick-crt的酵母菌落的验证
挑取红色单菌落在SC-Leu平板上划线,对拼接片段的接头进行菌检。
菌检引物名称及序列如下:
JJ-pCCI-F1:gctggcttaactatgcggcatc(SEQ ID NO:16)
JJ-pCCI-R1:cttgggtgttttgaagtggtacgg(SEQ ID NO:17)
JJ-pCCI-F2:ccttgagatgctgtagtatttgggaac(SEQ ID NO:18)
JJ-pCCI-R2:ggcagacataggggcagacattag(SEQ ID NO:19)
JJ-pCCI-F3:gcaatggacagaacaacctaatgaacacag(SEQ ID NO:20)
JJ-pCCI-R3:gcccctcaagtgtcaaggatcg(SEQ ID NO:21)
JJ-pUC57-F1:tgtcggggctggcttaactatg(SEQ ID NO:22)
JJ-pUC57-R1:cttgggtgttttgaagtggtacgg(SEQ ID NO:23)
JJ-pUC57-F2:ccttgagatgctgtagtatttgggaac(SEQ ID NO:24)
JJ-pUC57-R2:gactctagggggatcgccaac(SEQ ID NO:25)
使用引物对JJ-pCCI-F1/R1、JJ-pCCI-F2/R2、JJ-pCCI-F3/R3用于pCCI-Brick-crt的菌检,使用引物对JJ-pUC57-F1/R1、pUC57-F2/R2用于pUC57-Brick-crt的菌检。
挑取适量有色酵母菌落至30μl的100U/μl的Lyticase酶解液中,肉眼可见浑浊即可,在37℃酶解30分钟,以酶解后的溶液作为菌检模板。
菌检的PCR体系如下:
组分 体积/μL
ddH<sub>2</sub>O 添加至30μL
10*pfu缓冲液 3
dNTP混合物 0.3
taq DNA聚合酶 0.15
正向引物F 0.15
反向引物R 0.15
模板 1
PCR反应的程序设定如下:
Figure BDA0002791397040000181
Figure BDA0002791397040000191
反应中添加的taq DNA聚合酶(货号E00051-1000)来自南京金斯瑞生物科技有限公司。菌检验证结果见图3B。pCCI-Brick-crt菌检验证中使用了3对菌检引物(SEQ ID NO:16/17,18/19,20/21),菌检阳性率为7/8。pUC57-Brick-crt菌检验证使用了2对引物(SEQID NOs:22/23,24/25),阳性率为2/2。
3.3用质粒pCCI-Brick-crt或pUC57-Brick-crt转化大肠杆菌TOP10
提取菌检正确的酵母质粒用于电转化大肠杆菌TOP10。大肠杆菌TOP10的感受态细胞来源于南京金斯瑞生物科技有限公司。
本实例中所使用的培养基具有如下组成:
LB+Amp液体培养基:10g/l蛋白胨,5g/l酵母粉,5g/l NaCl,30mg/l Amp。
LB+Amp固体培养基:10g/l蛋白胨,5g/l酵母粉,5g/l NaCl,30mg/lAmp,15g/l琼脂糖。
电转化后涂布相应抗性的平板(LB+Amp),平板菌落生长状态及菌落验证见图3C。pCCI-Brick-crt大肠杆菌菌落形态与菌检验证的结果显示,使用酵母质粒转化大肠杆菌后,大肠杆菌克隆的阳性率为5/8;pUC57-Brick-crt大肠杆菌菌落形态与菌检验证,使用酵母质粒转化大肠后,大肠杆菌克隆的阳性率为8/8。
提取菌检正确的大肠杆菌克隆中的质粒作为组装用载体质粒。
实例4.将本发明的载体用于外源基因序列的克隆
本实例中,将本发明的载体的片段与外源基因序列的片段在酵母中进行组装,并通过菌落PCR验证质粒pCCI-Brick-crt和pUC57-Brick-crt对于外源基因序列进行组装的效率和准确性。
4.1准备载体片段
提取菌检正确的大肠杆菌克隆中的质粒pCCI-Brick-crt和pUC57-Brick-crt,然后进行酶切以获得组装用载体片段。
对于pCCI-Brick-crt的酶切体系如下:
组分 体积/μL
ddH<sub>2</sub>O 添加至50μL
10x cutsmart缓冲液 5
pCCI-Brick-crt 30
Nhe I 1.5
Pac I 1.5
Xho I 1.5
对于pUC57-Brick-crt的酶切体系如下:
组分 体积/μL
ddH<sub>2</sub>O 添加至50μL
10x cutsmart缓冲液 5
pUC57-Brick-crt 30
Sma I 1.5
Spe I 1.5
分别在37℃消化3小时,质粒与消化后的片段结果见图4A。内切酶消化后,pCCI-Brick-crt获得的理论条带大小为:10814+5488+819+618+132bp,目的条带为10814bp;pUC57-Brick-crt获得的理论条带大小为7055+5418bp,目的条带为5418bp。酶切所用内切酶NheI(货号R3131V)、Pac I(货号R0547S)、Xho I(货号R0146V)、Sma I(货号R0141V)和SpeI(货号R0133S)均来源于NEB生物技术有限公司。
4.2通过PCR扩增获得待组装的外源基因序列的片段
以大肠杆菌BL21的基因组为模板,扩增多个3kb左右的片段,这些片段之间的同源臂为20-60bp。将组装后全长为40kb(40025bp)的12个片段与pCCI-Brick-crt酶切载体进行组装测试,将组装后全长为20kb(19974bp)的6个片段与pUC57-Brick-crt酶切载体进行组装测试。其中,20kb片段为40kb片段的前半段。20kb片段和40kb片段的具体序列分别参见SEQ ID NO:26和SEQ ID NO:27。
扩增用引物如下:
pCCI-大肠杆菌-f1:acgacgttgtaaaacgacggccagtgaattggcgcatgctatttttttcgctagcgtggacggacgcattgcacc(SEQ ID NO:28)
pCCI-大肠杆菌-r1:cgtacaaatcatcgcacccaaatcc(SEQ ID NO:29)
大肠杆菌-f2:tggaacggtttaatcaggcgatg(SEQ ID NO:30)
大肠杆菌-r2:cactttaccgctcacgatgcc(SEQ ID NO:31)
大肠杆菌-f3:gatgatgactaacggcttcggctg(SEQ ID NO:32)
大肠杆菌-r3:atgatcagtaatggaatgctaatcaccg(SEQ ID NO:33)
大肠杆菌-f4:tgctcgttgggtattgcggtg(SEQ ID NO:34)
大肠杆菌-r4:gagcattgcgttcaggatggtc(SEQ ID NO:35)
大肠杆菌-f5:ctggttgactgtatgcgtaaattgctg(SEQ ID NO:36)
大肠杆菌-r5:catacggtttagcttgtcaccctgc(SEQ ID NO:37)
大肠杆菌-f6:gacgaagaaaaaagcaaaatcacagcg(SEQ ID NO:38)
大肠杆菌-r6:ccgggaaacgtgtcgcaaca(SEQ ID NO:39)
大肠杆菌-f7:tttgattgccgagaatgtcagcc(SEQ ID NO:40)
大肠杆菌-r7:gagatcaaatttaactgttttcttggtagagg(SEQ ID NO:41)
大肠杆菌-f8:tcgtacaaatccatcctctaccaagaa(SEQ ID NO:42)
大肠杆菌-r8:tttctaatataccaaatcgcgcactaatg(SEQ ID NO:43)
大肠杆菌-f9:atgcttgtggtgtttggccc(SEQ ID NO:44)
大肠杆菌-r9:ctctgttcattggtctggctttataccg(SEQ ID NO:45)
大肠杆菌-f10:tgtcagcattgcctcctcacg(SEQ ID NO:46)
大肠杆菌-r10:ttcgccccgttgaaaatcga(SEQ ID NO:47)
大肠杆菌-f11:tgaatcacagctacggttgccag(SEQ ID NO:48)
大肠杆菌-r11:gatatcgtggcgctggagaatgc(SEQ ID NO:49)
大肠杆菌-f12:gttatccagtcggtacatatccagcg(SEQ ID NO:50)
pCCI-大肠杆菌-r12:atttgattctgtgcgatagcgcccctgtgtgttctcgttatgttgagttaattaacagaaaggctcgacggtaatcagtg(SEQ ID NO:51)
pUC57-大肠杆菌-f1:agggttttcccagtcacgacgttgtaaaacgacggccagtgaattcgagactagtgtggacggacgcattgcacc(SEQ ID NO:52)
pUC57-大肠杆菌-r6:cgatccgtcccctcagcctatgcggatccgatatctagatgcattcgcgcccgggccgggaaacgtgtcgcaaca(SEQ ID NO:53)
使用引物对pCCI-大肠杆菌-f1/pCCI-大肠杆菌-r1扩增与pCCI-Brick-crt组装的第1个3kb片段(大肠杆菌-1(pCCI));使用引物对大肠杆菌-f2/大肠杆菌-r2、大肠杆菌-f3/大肠杆菌-r3、大肠杆菌-f4/大肠杆菌-r4、大肠杆菌-f5/大肠杆菌-r5、大肠杆菌-f6/大肠杆菌-r6、大肠杆菌-f7/大肠杆菌-r7、大肠杆菌-f8/大肠杆菌-r8、大肠杆菌-f9/大肠杆菌-r9、大肠杆菌-f10/大肠杆菌-r10、大肠杆菌-f11/大肠杆菌-r11扩增与pCCI-Brick-crt组装的第2-11个3kb片段(大肠杆菌-2~大肠杆菌-11);使用引物对大肠杆菌-f12/pCCI-大肠杆菌-r12扩增与pCCI-Brick-crt组装的第12个3kb片段(大肠杆菌-12(pCCI))。
使用引物对pUC57-大肠杆菌-f1/大肠杆菌-r1扩增与pUC57-Brick-crt组装的第1个3kb片段(大肠杆菌-1(pUC57));使用引物对大肠杆菌-f2/大肠杆菌-r2、大肠杆菌-f3/大肠杆菌-r3、大肠杆菌-f4/大肠杆菌-r4、大肠杆菌-f5/大肠杆菌-r5扩增与pUC57-Brick-crt组装的第2-5个3kb片段(大肠杆菌-2~大肠杆菌-5)、使用引物对大肠杆菌-f6/大肠杆菌-r6扩增与pUC57-Brick-crt组装的第6个3kb片段(大肠杆菌-6(pUC57))。
3kb片段间同源臂序列如下:
大肠杆菌-1(pCCI)与大肠杆菌-2之间的同源臂序列:tggaacggtttaatcaggcgatgatggatttgggtgcgatgatttgtacg(SEQ ID NO:54)
大肠杆菌-1(pUC57)与大肠杆菌-2之间的同源臂序列:tggaacggtttaatcaggcgatgatggatttgggtgcgatgatttgtacg(SEQ ID NO:55)
大肠杆菌-2与大肠杆菌-3之间的同源臂序列:gatgatgactaacggcttcggctgtatcctcggcggcatcgtgagcggtaaagtg(SEQ ID NO:56)
大肠杆菌-3与大肠杆菌-4之间的同源臂序列:tgctcgttgggtattgcggtgtcggtgattagcattccattactgatcat(SEQ ID NO:57)
大肠杆菌-4与大肠杆菌-5之间的同源臂序列:ctggttgactgtatgcgtaaattgctgaccatcctgaacgcaatgctc(SEQ ID NO:58)
大肠杆菌-5与大肠杆菌-6之间的同源臂序列:gacgaagaaaaaagcaaaatcacagcgccgcagggtgacaagctaaaccgtatg(SEQ ID NO:59)
大肠杆菌-6与大肠杆菌-7之间的同源臂序列:tttgattgccgagaatgtcagcccgcagtcgctgttgcgacacgtttcccg(SEQ ID NO:60)
大肠杆菌-7与大肠杆菌-8之间的同源臂序列:tcgtacaaatccatcctctaccaagaaaacagttaaatttgatctc(SEQ ID NO:61)
大肠杆菌-8与大肠杆菌-9之间的同源臂序列:atgcttgtggtgtttggccccgccgcattagtgcgcgatttggtatattagaaa(SEQ ID NO:62)
大肠杆菌-9与大肠杆菌-10之间的同源臂序列:tgtcagcattgcctcctcacgagttcggtataaagccagaccaatgaacagag(SEQ ID NO:63)
大肠杆菌-10与大肠杆菌-11之间的同源臂序列:tgaatcacagctacggttgccagttgctggtcgattttcaacggggcgaa(SEQ ID NO:64)
大肠杆菌-11与大肠杆菌-12(pCCI)之间的同源臂序列:gttatccagtcggtacatatccagcgcattctccagcgccacgatatc(SEQ ID NO:65)
大肠杆菌-1(pCCI)与pCCI-Brick-crt载体片段之间的同源臂序列:acgacgttgtaaaacgacggccagtgaattggcgcatgctatttttttcGCTAGC(SEQ ID NO:66)
大肠杆菌-12(pCCI)与pCCI-Brick-crt载体片段之间的同源臂序列:TTAATTAActcaacataacgagaacacacaggggcgctatcgcacagaatcaaat(SEQ ID NO:67)
大肠杆菌-1(pUC57)与pUC57-Brick-crt载体片段之间的同源臂序列:agggttttcccagtcacgacgttgtaaaacgacggccagtgaattcgagactag(SEQ ID NO:68)
大肠杆菌-6(pUC57)与pUC57-Brick-crt载体片段之间的同源臂序列:cccgggcgcgaatgcatctagatatcggatccgcataggctgaggggacggatcg(SEQ ID NO:69)
PCR扩增体系如下:
组分 体积/μL
ddH<sub>2</sub>O 添加至50μL
5X反应缓冲液 10
2.5mM dNTP混合物 4
PrimeSTAR GXL DNA聚合酶 1.5
正向引物F 0.5
反向引物R 0.5
模板 1
PCR反应的程序设定如下:
Figure BDA0002791397040000231
反应产物的电泳如图4B所示,片段大肠杆菌-1(pCCI)、大肠杆菌-2~大肠杆菌-11和大肠杆菌-12(pCCI)用于组装插入pCCI-Brick-crt载体的40kb片段,片段大肠杆菌-1(pUC57)、大肠杆菌-2~大肠杆菌-5和大肠杆菌-6(pUC57)用于组装插入pUC57-Brick-crt载体的20kb片段。按照琼脂糖凝胶回收试剂盒说明操作,回收扩增的片段。
4.3将上述所得片段在酵母中组装
将回收后的各片段按照每个片段20ng/kb的量混合,按照实例3.1所述的醋酸锂转化步骤制备感受态的酵母细胞并进行转化,组装片段的大小、浓度以及加入量如下表所示:
用于制备pCCI-Brick-40kb的片段
Figure BDA0002791397040000241
用于制备pUC57-Brick-20kb的片段
Figure BDA0002791397040000242
转化后的酵母菌株,42℃热激30min,菌体离心2min去上清,1ml的5mM氯化钙重悬,室温放置10min,菌体离心去上清,留取100微升菌液悬浮后涂布在SC-leu固体培养基,放入30℃培养箱,培养3天,如图4C的组装示意图所示,白色菌落均为阳性克隆(即成功插入目的片段),红色菌落为阴性克隆(即仍含有番茄红素基因)。复苏后的菌体离心去上清,留取100微升菌液悬浮后涂布SC-Leu固体培养基,放入30℃培养箱,培养3天菌落生长状态如图4D所示。对于含有pCCI-Brick-40kb或pUC57-Brick-20kb的菌落,平板上均未出现红色菌落,即从表型观察的结果,没有出现阴性克隆,表型阳性率为100%。
4.4通过菌落PCR验证组装的效率和准确性
从表型观察,组装的阳性率为100%,没有出现红色菌落。挑取单克隆进行菌检验证,对所有片段的连接处进行菌检。
菌检引物名称及序列如下:
JJ-F1(pCCI):gctggcttaactatgcggcatc(SEQ ID NO:70)
JJ-R1:gtgactccgcaaccaaatctaactac(SEQ ID NO:71)
JJ-F2:gtatggctctcagaagtgatgttgcaa(SEQ ID NO:72)
JJ-R2:gcgtcaggttatcggcagcaa(SEQ ID NO:73)
JJ-F3:tgcacagcttcgacaaagatccg(SEQ ID NO:74)
JJ-R3:cgcggtgaagtggagttggt(SEQ ID NO:75)
JJ-F4:gatgatcttcgcctgctcgtt(SEQ ID NO:76)
JJ-R4:ctgtcgaactgaggtatacccgc(SEQ ID NO:77)
JJ-F5:accccgagtttgattccctttcg(SEQ ID NO:78)
JJ-R5:gagtcacgtatgccagcgagt(SEQ ID NO:79)
JJ-F6:gcgcttaagtttaaccagaccgt(SEQ ID NO:80)
JJ-R6:ggcagcacaccagtaaccag(SEQ ID NO:81)
JJ-F7:cgctttctctggtggtggatg(SEQ ID NO:82)
JJ-R7:gataacaaagcggactgtggatgac(SEQ ID NO:83)
JJ-F8:cgttattcttacctttccccaaccg(SEQ ID NO:84)
JJ-R8:ggagggtggagttccggaag(SEQ ID NO:85)
JJ-F9:cagtgagagcagagatagcgc(SEQ ID NO:86)
JJ-R9:tgctgttattctttctggtggttcagg(SEQ ID NO:87)
JJ-F10:tcagttcttcttgcttcgcgtat(SEQ ID NO:88)
JJ-R10:cttaagccgctgtatttcatctcc(SEQ ID NO:89)
JJ-F11:cagcaatatcggcagaatcatcacc(SEQ ID NO:90)
JJ-R11:ctgacgttgctgatgaatgtctcc(SEQ ID NO:91)
JJ-F12:cacggatcttttggcagtcgt(SEQ ID NO:92)
JJ-R12:cacattaagcatcctcaccgcc(SEQ ID NO:93)
JJ-F13:cgagacttcctgctcaatcacc(SEQ ID NO:94)
JJ-R13(pCCI):ggcagacataggggcagacattag(SEQ ID NO:95)
JJ-F1(pUC57):gctggcttaactatgcggcatc(SEQ ID NO:96)
JJ-R7(pUC57):tgtagaagaccacacacgaaaatcc(SEQ ID NO:97)
使用引物对JJ-F1(pCCI)/JJ-R1、JJ-F2/JJ-R2~JJ-F12/JJ-R12、JJ-F13/JJ-R13(pCCI)用于pCCI-Brick-40kb的菌检,使用引物对JJ-F1(pUC57)/JJ-R1、JJ-F2/JJ-R2~JJ-F6/JJ-R6、JJ-F7/JJ-R7(pUC57)用于pUC57-Brick-20kb的菌检。
菌检的PCR体系如下:
组分 体积/μL
ddH<sub>2</sub>O 添加至30μL
10X pfu缓冲液 3
dNTP混合物 0.3
taq DNA聚合酶 0.15
正向引物F 0.15
反向引物R 0.15
模板 1
PCR反应的程序设定如下:
Figure BDA0002791397040000261
菌落验证结果如图4E所示,pCCI-Brick-40kb菌检验证的阳性率为8/8,pUC57-Brick-crt菌检验证的阳性率为8/8。由此可得pCCI-Brick-40kb和pUC57-Brick-20kb组装的正确率均为100%。改造后的载体pCCI-Brick-crt以及pUC57-Brick-crt都能够实现较高的组装效率,并为菌落筛选提供一个表观依据。
挑选一个pCCI-Brick-40kb的克隆进行插入片段的扩增与测序验证。将插入片段全长40kb(40025bp)分成六段进行扩增,从菌检引物中选取合适的引物进行扩增。
扩增用引物名称与序列如下:
JJ-F1(pCCI):gctggcttaactatgcggcatc(SEQ ID NO:70)
JJ-R3:cgcggtgaagtggagttggt(SEQ ID NO:75)
JJ-F3:tgcacagcttcgacaaagatccg(SEQ ID NO:74)
JJ-R5:gagtcacgtatgccagcgagt(SEQ ID NO:79)
JJ-F5:accccgagtttgattccctttcg(SEQ ID NO:78)
JJ-R7:gataacaaagcggactgtggatgac(SEQ ID NO:83)
JJ-F7:cgctttctctggtggtggatg(SEQ ID NO:82)
JJ-R9:tgctgttattctttctggtggttcagg(SEQ ID NO:87)
JJ-F9:cagtgagagcagagatagcgc(SEQ ID NO:86)
JJ-R11:ctgacgttgctgatgaatgtctcc(SEQ ID NO:91)
JJ-F11:cagcaatatcggcagaatcatcacc(SEQ ID NO:90)
JJ-R13(pCCI):ggcagacataggggcagacattag(SEQ ID NO:95)
实例5.采用高通量测序技术(NGS)进行验证
分别使用引物对JJ-F1(pCCI)/JJ-R3扩增40kb-1(7253bp)、JJ-F3/JJ-R5扩增40kb-2(7868bp)、JJ-F5/JJ-R7扩增40kb-3(6804bp)、JJ-F7/JJ-R9扩增40kb-4(8151bp)、JJ-F9/JJ-R11扩增40kb-5(6591bp)、和JJ-F11/JJ-R13(pCCI)扩增40kb-6(7627bp)。产物回收后,按照等摩尔数混合,使用高通量测序技术(NGS)进行测序验证。扩增产物及测序结果如图4F所示。
NGS测序结果见下表:
Figure BDA0002791397040000271
插入片段全长为40025bp,为保证测序能测到全长,扩增时向两侧各延伸了一段约300bp的序列,提供的参考长度(RefLength)包含目的序列并向两侧各延伸了1kb左右。从结果可以看出目的序列完整而且正确地插入了载体pCCI-Brick-crt中。
因此,本发明的克隆载体pUC57-Brick-crt和pCCI-Brick-crt能够实现在酵母细胞中正确高效地拼接总长度分别达到20kb和40kb的外源基因片段,通过菌落PCR和NGS验证的正确率为100%。
还需要说明的是,在可实施且不明显违背本发明的主旨的前提下,在本说明书中作为某一技术方案的构成部分所描述的任一技术特征或技术特征的组合同样也可以适用于其它技术方案;并且,在可实施且不明显违背本发明的主旨的前提下,作为不同技术方案的构成部分所描述的技术特征之间也可以以任意方式进行组合,来构成其它技术方案。本发明也包含在上述情况下通过组合而得到的技术方案,并且这些技术方案相当于记载在本说明书中。
以上通过具体实施方式和实施例对本发明进行了说明,但本领域技术人员应该理解的是,这些并非意图对本发明的范围进行限定,本发明的范围应由权利要求书确定。
工业实用性
本发明提供了具有常用多克隆位点、能够在酵母细胞中进行红白斑筛选、且在酵母体内具有改进的单片段或多片段组装效率的克隆载体。
序列表
<110> 南京金斯瑞生物科技有限公司
<120> 由番茄红素基因介导的改造的克隆载体及其应用
<160> 97
<170> SIPOSequenceListing 1.0版
<210> 1
<211> 7047
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 番茄红素基因
<400> 1
acaatgcata ctttgtacgt tcaaaataca atgcagtaga tatatttatg catattacat 60
ataatacata tcacatagga agcaacaggc gcgttggact tttaattttc gaggaccgcg 120
aatccttaca tcacacccaa tcccccacaa gtgatccccc acacaccata gcttcaaaat 180
gtttctactc cttttttact cttccagatt ttctcggact ccgcgcatcg ccgtaccact 240
tcaaaacacc caagcacagc atactaaatt tcccctcttt cttcctctag ggtgtcgtta 300
attacccgta ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt 360
cgaaaaaggc aataaaaatt tttatcacgt ttctttttct tgaaaatttt tttttttgat 420
ttttttctct ttcgatgacc tcccattgat atttaagtta ataaacggtc ttcaatttct 480
caagtttcag tttcattttt cttgttctat tacaactttt tttacttctt gctcattaga 540
aagaaagcat agcaatctaa tctaagtttt aattacaaaa tggattacgc gaacatcctc 600
acagcaattc cactcgagtt tactcctcag gatgatatcg tgctccttga accgtatcac 660
tacctaggaa agaaccctgg aaaagaaatt cgatcacaac tcatcgaggc tttcaactat 720
tggttggatg tcaagaagga ggatctcgag gtcatccaga acgttgttgg catgctacat 780
accggtagct tattaatgga cgatgtggag gattcatcgg tcctcaggcg tgggtcgcct 840
gtggcccatc taatttacgg gattccgcag acaataaaca ctgcaaacta cgtctacttt 900
ctggcttatc aagagatctt caagcttcgc ccaacaccga tacccatgcc tgtaattcct 960
ccttcatctg cttcgcttca atcatccgtc tcctctgcat cctcctcctc ctcggcctcg 1020
tctgaaaacg ggggcacgtc aactcctaat tcgcagattc cgttctcgaa agatacgtat 1080
cttgataaag tgatcacaga cgagatactt tccctccata gagggcaggg cctggagcta 1140
ttctggagag atagtctgac gtgtcctagc gaagaggaat atgtgaaaat ggttcttgga 1200
aagacgggag gtttgttccg tatagcggtc agattgatga tggcaaagtc agaatgtgac 1260
atagactttg tccagcttgt caacttgatc tcaatatact tccagatcag ggatgactat 1320
atgaaccttc agtcttctga gtatgcccat aataagaatt ttgcagagga cctcacagaa 1380
gggaaattca gttttcccac tatccactcg attcatgcca acccctcatc gagactcgtc 1440
atcaatacgt tgcagaagaa atcgacctct cctgagatcc ttcaccactg tgtaaactac 1500
atgcgcacag aaacccactc attcgaatat actcaggaag tcctcaacac cttgtcaggt 1560
gcactcgaga gagaactagg aaggcttcaa ggagagttcg cagaagctaa ctcaaggatg 1620
gatcttggag acgtagattc ggaaggaaga acggggaaga acgtcaaatt ggaagcgatc 1680
ctgaaaaagc ttgccgatat ccctctgtga ataaaaaaca cgctttttca gttcgagttt 1740
atcattatca atactgccat ttcaaagaat acgtaaataa ttaatagtag tgattttcct 1800
aactttattt agtcaaaaaa ttagcctttt aattctgctg taacccgtac atgcccaaaa 1860
tagggggcgg gttacacaga atatataaca tcgtaggtgt ctgggtgaac agtttattcc 1920
tggcatccac taaatataat ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa 1980
tcccagcacc aaaatattgt tttcttcacc aaccatcagt tcataggtcc attctcttag 2040
cgcaactaca gagaacaggg gcacaaacag gcaaaaaacg ggcacaacct caatggagtg 2100
atgcaacctg cctggagtaa atgatgacac aaggcaattg acccacgcat gtatctatct 2160
cattttctta caccttctat taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa 2220
aggttgaaac cagttccctg aaattattcc cctacttgac taataagtat ataaagacgg 2280
taggtattga ttgtaattct gtaaatctat ttcttaaact tcttaaattc tacttttata 2340
gttagtcttt tttttagttt taaaacacca agaacttagt ttcgaataaa cacacataaa 2400
caaacaaaat gggaaaagaa caagatcagg ataaacccac agctatcatc gtgggatgtg 2460
gtatcggtgg aatcgccact gccgctcgtc ttgctaaaga aggtttccag gtcacggtgt 2520
tcgagaagaa cgactactcc ggaggtcgat gctctttaat cgagcgagat ggttatcgat 2580
tcgatcaggg gcccagtttg ctgctcttgc cagatctctt caagcagaca ttcgaagatt 2640
tgggggagaa gatggaagat tgggtcgatc tcatcaagtg tgaacccaac tatgtttgcc 2700
acttccacga tgaagagact ttcacttttt caaccgacat ggcgttgctc aagcgggaag 2760
tcgagcgttt tgaaggcaaa gatggatttg atcggttctt gtcgtttatc caagaagccc 2820
acagacatta cgagcttgct gtcgttcacg tcctacagaa gaacttccct ggcttcgcag 2880
cattcttacg gctacagttc attggccaaa tcctggctct tcaccccttc gagtctatct 2940
ggacaagagt ttgtcgatat ttcaagaccg acagattacg aagagtcttc tcgtttgcag 3000
tgatgtacat gggtcaaagc ccatacagtg cgcccggaac atattccttg ctccaataca 3060
ccgaattgac cgagggcatc tggtatccga gaggaggctt ttggcaggtt cctaatactc 3120
ttcttcagat cgtcaagcgc aacaatccct cagccaagtt caatttcaac gctccagttt 3180
cccaggttct tctctctcct gccaaggacc gagcgactgg tgttcgactt gaatccggcg 3240
aggaacatca cgccgatgtt gtgattgtca atgctgacct cgtttacgcc tccgagcact 3300
tgattcctga cgatgccaga aacaagattg gccaactggg tgaagtcaag agaagttggt 3360
gggctgactt agttggtgga aagaagctca agggaagttg cagtagtttg agcttctact 3420
ggagcatgga ccgaatcgtg gacggtctgg gcggacacaa tatcttcttg gccgaggact 3480
tcaagggatc attcgacaca atcttcgagg agttgggtct cccagccgat ccttcctttt 3540
acgtgaacgt tccctcgcga atcgatcctt ctgccgctcc cgaaggcaaa gatgctatcg 3600
tcattcttgt gccgtgtggc catatcgacg cttcgaaccc tcaagattac aacaagcttg 3660
ttgctcgggc aaggaagttt gtgatccaaa cgctttccgc caagcttgga cttcccgact 3720
ttgaaaaaat gattgtggca gagaaggttc acgatgctcc ctcttgggag aaagaattta 3780
acctcaagga cggaagcatc ttgggactgg ctcacaactt tatgcaagtt cttggtttca 3840
ggccgagcac cagacatccc aagtatgaca agttgttctt tgtcggggct tcgactcatc 3900
ccggaactgg ggttcccatc gtcttggctg gagccaagtt aactgccaac caagttctcg 3960
aatcctttga ccgatcccca gctccagatc ccaatatgtc actctccgta ccatatggaa 4020
aacctctcaa atcaaatgga acgggtatcg attctcaggt ccagctgaag ttcatggatt 4080
tggagagatg ggtatacctt ttggtgattt gttgattggg gccgtgatcg ctcgatccgt 4140
tggtgttctt gctttctgaa taacaatact gacagtacta aataattgcc tacttggctt 4200
cacatacgtt gcatacgtcg atatagataa taatgataat gacagcagga ttatcgtaat 4260
acgtaatagt tgaaaatctc aaaaatgtgt gggtcattac gtaaataatg ataggaatgg 4320
gattcttcta tttttccttt ttccattcta gcagccgtcg ggaaaacgtg gcatcctctc 4380
tttcgggctc aattggagtc acgctgccgt gagcatcctc tctttccata tctaacaact 4440
gagcacgtaa ccaatggaaa agcatgagct tagcgttgct ccaaaaaagt attggatggt 4500
taataccatt tgtctgttct cttctgactt tgactcctca aaaaaaaaaa atctacaatc 4560
aacagatcgc ttcaattacg ccctcacaaa aacttttttc cttcttcttc gcccacgtta 4620
aattttatcc ctcatgttgt ctaacggatt tctgcacttg atttattata aaaagacaaa 4680
gacataatac ttctctatca atttcagtta ttgttcttcc ttgcgttatt cttctgttct 4740
tctttttctt ttgtcatata taaccataac caagtaatac atattcaaaa tgacggctct 4800
cgcatattac cagatccatc tgatctatac tctcccaatt cttggtcttc tcggcctgct 4860
cacttccccg attttgacaa aatttgacat ctacaaaata tcgatcctcg tatttattgc 4920
gtttagtgca accacaccat gggactcatg gatcatcaga aatggcgcat ggacatatcc 4980
atcagcggag agtggccaag gcgtgtttgg aacgtttctg gatgttccat atgaagagta 5040
cgctttcttt gtcattcaaa ccgtaatcac cggcttggtc tacgtcttgg caactaggca 5100
ccttctccca tctctcgcgc ttcccaagac tagatcgtcc gccctttctc tcgcgctcaa 5160
ggcgctcatc cctctgccca ttatctacct atttaccgct caccccagcc catcgcccga 5220
cccgctcgtg acagatcact acttctacat gcgggcactc tccttactca tcaccccacc 5280
taccatgctc ttggcagcat tatcaggcga atatgctttc gattggaaaa gtggccgagc 5340
aaagtcaact attgcagcaa tcatgatccc gacggtgtat ctgatttggg tagattatgt 5400
tgctgtcggt caagactctt ggtcgatcaa cgatgagaag attgtagggt ggaggcttgg 5460
aggtgtacta cccattgagg aagctatgtt cttcttactg acgaatctaa tgattgttct 5520
gggtctgtct gcctgcgatc atactcaggc cctatacctg ctacacggtc gaactattta 5580
tggcaacaaa aagatgccat cttcatttcc cctcattaca ccgcctgtgc tctccctgtt 5640
ttttagcagc cgaccatact cttctcagcc aaaacgtgac ttggaactgg cagtcaagtt 5700
gttggaggaa aagagccgga gcttttttgt tgcctcggct ggatttccta gcgaagttag 5760
ggagaggctg gttggactat acgcattctg ccgggtgact gatgatctta tcgactctcc 5820
tgaagtatct tccaacccgc atgccacaat tgacatggtc tccgattttc ttaccctact 5880
atttgggccc ccgctacacc cttcgcaacc tgacaagatc ctttcttcgc ctttacttcc 5940
tccttcgcac ccttcccgac ccacgggaat gtatcccctc ccgcctcctc cttcgctctc 6000
gcctgccgag ctcgttcaat tccttaccga aagggttccc gttcaatacc atttcgcctt 6060
caggttgctc gctaagttgc aagggctgat ccctcgatac ccactcgacg aactccttag 6120
aggatacacc actgatctta tctttccctt atcgacagag gcagtccagg ctcggaagac 6180
gcctatcgag accacagctg acttgctgga ctatggtcta tgtgtagcag gctcagtcgc 6240
cgagctattg gtctatgtct cttgggcaag tgcaccaagt caggtccctg ccaccataga 6300
agaaagagaa gctgtgttag tggcaagccg agagatggga actgcccttc agttggtgaa 6360
cattgctagg gacattaaag gggacgcaac agaagggaga ttttacctac cactctcatt 6420
ctttggtctt cgggatgaat caaagcttgc gatcccgact gattggacgg aacctcggcc 6480
tcaagatttc gacaaactcc tcagtctatc tccttcgtcc acattaccat cttcaaacgc 6540
ctcagaaagc ttccggttcg aatggaagac gtactcgctt ccattagtcg cctacgcaga 6600
ggatcttgcc aaacattctt ataagggaat tgaccgactt cctaccgagg ttcaagcggg 6660
aatgcgagcg gcttgcgcga gctacctact gatcggccga gagatcaaag tcgtttggaa 6720
aggagacgtc ggagagagaa ggacagttgc cggatggagg agagtacgga aagtcttgag 6780
tgtggtcatg agcggatggg aagggcagta aatttaactc cttaagttac tttaatgatt 6840
tagtttttat tattaataat tcatgctcat gacatctcat atacacgttt ataaaactta 6900
aatagattga aaatgtatta aagattcctc agggattcga tttttttgga agtttttgtt 6960
tttttttcct tgagatgctg tagtatttgg gaacaattat acaatcgaaa gatatatgct 7020
tacattcgac cgttttagcc gtgatca 7047
<210> 2
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-Brick与番茄红素基因5’同源臂序列
<400> 2
gctagcacaa tgcatacttt gtacgttcaa aatacaatgc 40
<210> 3
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-Brick与番茄红素基因3’同源臂序列
<400> 3
atgcttacat tcgaccgttt tagccgtgat cattaattaa 40
<210> 4
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-Brick与番茄红素基因的5’同源臂序列
<400> 4
actagtacaa tgcatacttt gtacgttcaa aatac 35
<210> 5
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-Brick与番茄红素基因的3’同源臂序列
<400> 5
atatgcttac attcgaccgt tttagccgtg atcacccggg 40
<210> 6
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-f1
<400> 6
gctagcacaa tgcatacttt gtacgttcaa aatac 35
<210> 7
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-r1
<400> 7
ttaattaatg atcacggcta aaacggtcga atg 33
<210> 8
<211> 65
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-f2
<400> 8
atgcttacat tcgaccgttt tagccgtgat cattaattaa ctcaacataa cgagaacaca 60
caggg 65
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-r2
<400> 9
cttatcccca ggcttgtcca catc 24
<210> 10
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-f3
<400> 10
cgcgagtttc ccacagatga tg 22
<210> 11
<211> 68
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-r3
<400> 11
gcattgtatt ttgaacgtac aaagtatgca ttgtgctagc gaaaaaaata gcatgcgcca 60
attcactg 68
<210> 12
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-f1
<400> 12
actagtacaa tgcatacttt gtacgttcaa aatac 35
<210> 13
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-r1
<400> 13
cccgggtgat cacggctaaa acggtcgaat g 31
<210> 14
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-f2
<400> 14
atatgcttac attcgaccgt tttagccgtg atcacccggg cgcgaatgca tctagatatc 60
ggat 64
<210> 15
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-r2
<400> 15
gcattgtatt ttgaacgtac aaagtatgca ttgtactagt ctcgaattca ctggccgtcg 60
t 61
<210> 16
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-F1
<400> 16
gctggcttaa ctatgcggca tc 22
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-R1
<400> 17
cttgggtgtt ttgaagtggt acgg 24
<210> 18
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-F2
<400> 18
ccttgagatg ctgtagtatt tgggaac 27
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-R2
<400> 19
ggcagacata ggggcagaca ttag 24
<210> 20
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-F3
<400> 20
gcaatggaca gaacaaccta atgaacacag 30
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pCCI-R3
<400> 21
gcccctcaag tgtcaaggat cg 22
<210> 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pUC57-F1
<400> 22
tgtcggggct ggcttaacta tg 22
<210> 23
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pUC57-R1
<400> 23
cttgggtgtt ttgaagtggt acgg 24
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pUC57-F2
<400> 24
ccttgagatg ctgtagtatt tgggaac 27
<210> 25
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-pUC57-R2
<400> 25
gactctaggg ggatcgccaa c 21
<210> 26
<211> 19974
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 20 kb序列
<400> 26
gtggacggac gcattgcacc gaccatcacc accggtttgt cgcatttcac cgtcaggtcg 60
aggaagtaag cggtttcttc catcgtgtcg gtaccgtggg taatgacgaa gccgtcagtt 120
ttatcgcagt cggtgttaat ttttttcgcc agtgtcagcc agacatcatc gttcatgtcc 180
tgggagccaa tattcactac ctgctcgcct ttaacgttcg caatgtcctt cagttgcggc 240
accgcattaa ccagattttc tacgccaact ttacccgctg tgtagttaga tttggttgcg 300
gagtcaccac caccggcaat ggtcccgccg gttgctaaaa tggtgatatt gggtaatgcc 360
aatgctgcac cactaaaacc cataaccagt gcggcaagtg ccgtcttttt gaaaaactcc 420
atttcattcc tccagttacg tgaacgctac acattatccc ttagctttgc atgggaaatt 480
tgacgttaaa caatttacaa cgtgaatata ttttggagat ctacaaagtt agaggcaggt 540
aacaaaacga agaattaaac ggcataaaaa agtattatgc cgtcttaaaa tagaggatta 600
ttttaaattc ccgaccaggg ctttgcggct atcttccaga gtcacaacgc ggctacaaac 660
atctttgcca aactgctgga aatctttttc ctgctttttc cactcggttt ggattgagga 720
ttgcaggccg cccaggcttc ccagcacgtt ctgtaatggg ttaccgccgc ttttcagcac 780
cgctttcgcg cccatttcat taatgctgtc ctgtaaaatt ccgcccattg cctgattcac 840
taattgctgg ccttcggcgc gaacctgatc aatggcttta tagtgaaacg tcaggccatc 900
gctgcgcgtt tcgataatgc ggttcatctg ctctttcagc tgcgcatcaa gtttggtcag 960
acggctgcgc attttgctgc tttcgcccat ctcctgaacg ataattttat ccagcgcaat 1020
acgggctttt tcgacgcggc ttttcgcgcc ttcatcaatc cacggcagcg tgctgcgtag 1080
ttcagcctga taatccttcg cctgctcgcg ctgggcggca ttcagggaat attgcttacc 1140
gttatacatc acgttgccgt ctggcgtgat caccagattg ccgttttcgc ccttcacctg 1200
cacggtttgc gggctgacaa tcacatcgtc acgcggcgtg acgctgcact ggtagtcggc 1260
gtgagcggtc attgccgtca ctgaaagtgc tgccgccagc agcattttgc gcatcatagt 1320
cttccctcaa gaaaaaatca ggccagcatt tgctggcccc agattgataa caaagtacgc 1380
gttttccatg ccggatgcgg cgtaaacacc ttatcccgcc tactcgatcg tgcatctttc 1440
caggcctgat aagcgtagcg catcaggcag ttttgcattt gtcatcgccc gtatgctttc 1500
ttagtcccac caaacgtcga aaagttcgct ggtgcgtacc tcatccagtt tgcgctcttc 1560
cagccactta cgcacaatcg cctgatgttc ttcggtgcat ttgccgattt cctgcatgca 1620
gatcagacct tcccaggcca gataaccgct gccgtcaaag gccagtttgt tcggttcgat 1680
aacctcgtta ataaaatcat caacggtttt atcaatctgt tcttccgatg taccttccgg 1740
gaatcgccat gccaccgaaa atcctaattc ctggaattcg tcgatgtgca tttttttacg 1800
cagacgacgg ctacggttct ttgccattat ttcaccctct cgaacattaa gtcccatact 1860
ccgtgaccaa gacgatgacc acgttgttca aatttcgtca ccggacgtga tgccggacgc 1920
ggtacgtaat cattgctctc tgacaggttt ttataaccgt caatagaaga catcacttca 1980
agcatatgtt ccgcataagg ttcccagtcg gtcgccatat ggaatacgcc ccccagctgc 2040
agtttgcttt ttaccagttc ggcaaacggc acctgaacga tacggcgttt attatggcgc 2100
gctttgtgcc acgggtcagg gaaaaagagc tgcaccatgc gcaatgaatt gtcaggaatc 2160
attttatgca gcacttcaac cgcatcgtga cacatcacgc gcaggttgct taaaccttct 2220
tcatgcgcag aagccaggca cgcaccaacg cccggtgaat gcacttcaat gccgaggaag 2280
tcctgctcag ggcgatcttt agccattgcc accagcgacg cccccatgcc aaaaccaatc 2340
tcaagcgtca ccggcgcttc acggccaaaa agcgcgggga aatccagcat atcttcgctg 2400
aactcaacgc ccatcaccgg ccagtagttt tccagcgcat gttcctggcc tttggtcagt 2460
cgcccctggc ggcgcacaaa actacggata cggcgcagtg ggcggccgtt ttcatcaaat 2520
tccggtgaaa tgacgtcgtt tttcataaag gtttagtcgc ttgtgaaagt gttctgaaaa 2580
cgggcattat ccaaagttag ttgccggatg caagcatgat aaggccgtgg ctgcggaaag 2640
ttccggttta caccctgccg tcgctgtgct gcaatcttgc ccccaacaac agtgaattcg 2700
gtgaccatgc aagcgtcgca attttcagcc caggttctgg actggtacga taaatacggg 2760
cgaaaaactc tgccctggca aattgacaag acgccctaca aagtatggct ctcagaagtg 2820
atgttgcaac aaactcaggt tgcgaccgtt atcccctatt ttgaacgctt tatggcgcgc 2880
ttcccgacgg tgaccgatct cgccaatgcg ccgctcgacg aagttctcca cttgtggacc 2940
gggcttggct attacgcccg cgcgcgcaat ctgcataaag cggcacaaca agtggcgacc 3000
ttacacggcg gtaaattccc ggaaaccttt gaggaagttg cagcactgcc gggcgtcggg 3060
cgttccaccg caggcgcgat tctctcgctt tctctgggta agcactttcc gattctcgac 3120
ggtaacgtca aacgggtgct ggcgcgctgc tatgctgtaa gcggctggcc agggaaaaaa 3180
gaggtcgaga ataaattatg gagtttgagc gagcaggtga cgcccgcggt tggcgtggaa 3240
cggtttaatc aggcgatgat ggatttgggt gcgatgattt gtacgcgctc gaaaccgaaa 3300
tgttcgctct gtccgctaca aaacggatgt attgccgccg ccaacaatag ctgggcgctt 3360
tatccgggca aaaaaccgaa acagacgctg ccggagcgca ccggctactt tttgctatta 3420
cagcacgaag atgaagtatt gctggcgcag cgtccgccga gcggattgtg gggcggttta 3480
tactgtttcc cgcagtttgc cgacgaagaa agtttgcggc agtggctggc gcaacggcag 3540
attgctgccg ataacctgac gcaactgacc gcgtttcggc ataccttcag ccatttccac 3600
ttagatattg tgcctatgtg gcttcccgtg tcgtcattca ccggctgcat ggatgaaggc 3660
aatgcgctct ggtataactt agcgcaaccg ccgtcagttg gcctggcggc tcccgtggag 3720
cgtttgttac agcagttacg cactggcgcg ccggtttagc gcgtgagtcg ataaagagga 3780
tgatttatga gcagaacgat tttttgtact ttcctgcaac gtgaagcaga aggtcaggat 3840
tttcagctgt accccggcga gctgggaaaa cgcatctata acgagatctc caaagaagcc 3900
tgggcgcagt ggcagcacaa gcaaaccatg ctgattaatg aaaagaaact caacatgatg 3960
aatgccgagc accgcaagct gcttgagcag gagatggtca acttcctgtt cgagggtaaa 4020
gaggtgcata tcgagggcta tacgccggaa gataaaaaat aaaaacagtg ccggagcacg 4080
cctccggcaa cttgcataaa aacaaacaca acacgcaccc ggaatgatga aaaaatatct 4140
cgcgctggct ttgattgcgc cgttgctcat ctcctgttcg acgaccaaaa aaggcgatac 4200
ctataacgaa gcctgggtca aagataccaa cggttttgat attctgatgg ggcaatttgc 4260
ccacaatatt gagaacatct ggggcttcaa agaggtggtg atcgctggtc ctaaggacta 4320
cgtgaaatac accgatcaat atcagacccg cagccacatc aacttcgatg acggtacgat 4380
tactatcgaa accatcgccg ggacagaacc tgccgcgcat ttgcgccggg caattatcaa 4440
aacgttgctg atgggtgacg atccgagttc ggtcgatctc tattccgacg ttgatgatat 4500
tacgatttcg aaagaacctt tcctttacgg tcaggtggtg gacaacaccg ggcagccgat 4560
tcgctgggaa ggtcgcgcaa gcaacttcgc ggattatctg ctgaaaaacc gtctgcaaag 4620
ccgcagtaac gggctgcgta tcatctacag cgtcaccatt aacatggtac cgaaccacct 4680
tgataaacgt gcgcacaaat atctcggtat ggtccgccag gcgtcacgga aatatggcgt 4740
tgatgagtcg ctgattctgg caattatgca gactgaatct tcctttaacc cgtatgcggt 4800
cagccgttcc gatgcgctgg gattaatgca ggtggtacaa catactgccg ggaaagatgt 4860
gttccgctcg caggggaaat ccggcacgcc gagccgcagt ttcttgtttg atcctgccag 4920
caatattgat accggcaccg cgtatctggc gatgctgaac aatgtttatc tcggcggaat 4980
tgataaccca acatcgcggc gttatgccgt catcaccgcc tataacggcg gcgcaggcag 5040
cgtgctgcga gtcttttcga atgataagat tcaggctgcc aatattatta acaccatgac 5100
gccgggcgat gtttatcaga cgctgacgac ccgccatccc tctgcggaat ctcgccgtta 5160
tctttataaa gtgaataccg cgcaaaaatc ctaccgccgc cgataattcc attaaccgcc 5220
cctgacgatg ctcaggggca aaaatgttat ccacatcaca atttcgtttt gcaaattggg 5280
aatgtttgca attatttgcc acaggtaaca aaaaaccagt ccgcgaagtt gatagaatcg 5340
catcatctcg cacggtcaaa tgtgcttttt caaacactca tccgcatcac gatgtgagga 5400
aattaacatg aatcttaagc tgcagctgaa aatcctctct tttctgcagt tctgtctgtg 5460
gggaagttgg ctgacgaccc tcggctccta tatgtttgtt accctgaagt ttgacggtgc 5520
ttctattggc gcagtttata gctcactggg tatcgcagcg gtctttatgc ctgcgctgct 5580
ggggattgtg gccgacaaat ggttaagtgc gaaatgggta tatgccattt gccacaccat 5640
tggcgctatc acgctgttca tggcggcaca ggtcacgaca ccggaagcga tgttccttgt 5700
gatattgatt aactcgtttg cttatatgcc aacgcttggg ttaatcaaca ccatctctta 5760
ctatcgcctg caaaatgccg ggatggatat cgttactgac ttcccgccaa tccgtatctg 5820
gggcaccatc ggctttatca tggcaatgtg ggtggtgagc ctgtctggct tcgaattaag 5880
ccacatgcag ctgtatattg gcgcagcact ttccgccatt ctggttctgt ttaccctgac 5940
tctgccgcat attccggttg ctaaacagca agcgaatcag agctggacaa ccctgctggg 6000
cctcgatgca ttcgcgctgt ttaaaaacaa gcgtatggca atcttcttca tcttctcaat 6060
gctgctgggc gcggaactgc agattaccaa catgttcggt aacaccttcc tgcacagctt 6120
cgacaaagat ccgatgtttg ccagcagctt catcgtgcag catgcgtcaa tcatcatgtc 6180
gatttcgcag atctctgaaa ccctgttcat tctgaccatc ccgttcttct taagccgcta 6240
cggcattaag aacgtaatga tgatcagtat cgtggcgtgg atcctgcgtt ttgcgctgtt 6300
tgcttacggt gacccgactc cgttcggcac cgtactgctg gttctgtcga tgattgttta 6360
cggctgcgca ttcgacttct tcaacatctc tggttcggtg tttgtcgaaa aagaagttag 6420
cccggcaatt cgcgccagtg cgcaggggat gttcctgatg atgactaacg gcttcggctg 6480
tatcctcggc ggcatcgtga gcggtaaagt ggttgagatg tacacccaaa acggcattac 6540
cgactggcag accgtatggc tgattttcgc aggttactcc gtggttctgg ccttcgcgtt 6600
catggcgatg ttcaaatata aacacgttcg tgtcccgaca ggcacacaga cggttagcca 6660
ctaattacgc aaagaaaaac gggtcgccag aaggtgaccc gtttttttat tcttacttca 6720
acacataccc gtacaaccgt ttcatgccat ctgcatcggt ttcgctatag acaccttgca 6780
gctccggcga aaatcccggc aacaaattca ccccttcttc cagcgcaagg aaataacgtt 6840
gaaccgcccc accccagact tctccgggta ccacgcaaag cacgcctggt ggataaggca 6900
acgccccttc tgccgcaatt cgcccttcgg catcacgaat ccgcaccaac tccacttcac 6960
cgcgaatata agcgctatgc gcatcctggg gattcatcac cactgacggg aaactctgct 7020
ggcggaacat cgctttttgt aggtctttga cgtcgaaact gacatacaaa tcgtgcatct 7080
cctgacacaa ctggcgcagg gtgtagtcgc gatagcgcac cggatatttg ttataaacgc 7140
tcggcaacac ctcagccagc ggcgagtcat cctcaatatg ctgttcaaac tgcgccagca 7200
tcgccaccag ttgtgccagc ttctcgtggc tttccgccgg agttaataag aacagaatgg 7260
agttgagatc gcacttctcc ggcacaatgc cgttctcacg caggtagtgc gccagaatcg 7320
tcgccggaac gccaaagtcg ctatattcgc cggtttcggc attgatacct ggtgtagtga 7380
gtaacagctt gcacggatca acaaaatact gatccgcggc atatccttca aagccgtgcc 7440
acttcgcccc cggctcaaaa ctgaaaaaac gacggtcact ggctaacact gatgtcggat 7500
aatcctgcca caatttgcca tcaacaacag gcgggataaa cgggcggaac agcttacagc 7560
gcgcaagaat cgccttccgg gcttcaatcc ccaacgcaac gcactccgcc cacagccgac 7620
gcccactctc cccttcatga attttggcgt taacgtccag cgcggcaaac agcggataga 7680
acgggctggt agaagcatgg agcataaagg cattatttaa ccgcttatgc gggcaaaaac 7740
gcgcctgccc gcgaatatgg ttatcttttt tatggatctg cgatgtctgc gagaagcccg 7800
cctgctgttt gtgcaccgac tgggtcacaa agatccccgg atcgttttcg ttaagttcta 7860
acagcagcgg cgagctatcc gccatcatcg ggataaactg ttcgtaaccg acccacgcgg 7920
aatcaaacag aatgtaatca cacagatgcc caacggtatc gatcacctga cgggcgttat 7980
agacagtgcc gtcataggtt cccagctgaa taatcgccag gcgaaacggg cgcggcaggt 8040
cggctttttc tggcgcaacg tcgcgaattt gctggcgcag atactcttca ttaaaacagt 8100
gcgcatcaat accgccaatg aaaccaaacg ggttacgtga agcttccaga tagaccggcg 8160
tcgcccccgc ctgaatcagc gcgccgtgat gattcgactt atggttgtta cggtcgaaga 8220
gcaccagatc gccacgcgtt aacagcgcat tcgtcaccac tttattcgct gccgatgtgc 8280
cgttcagtac aaaataggtt ttatcggcat gaaagacttt ggctgcgaat ttctgcgcat 8340
ccttcgccga tccttcatga ataagcagat cgcccaattt tacgtcagcg ttacacatat 8400
cggcgcgaaa gatgttctcg ccaaagaaat cgtaaaaatg gcgtccggca ggatgctttt 8460
taaagaacgc accatgttga tgtccagggc aagcaaaggt gctgttgccc atctcaacgt 8520
actgcgtcag cgtgtcataa aacggtggca gcaaattctc ttcatactga caggctgcgg 8580
attccagctc cagccactgc tgctcgttgc cgttgattac cgccgtaacg cccgcaggta 8640
attcaacagc atgttcggaa tacaaaaaca ccggtagatg aaaaccggtg cgcttaagca 8700
acgcaagaat gccactgcga ctatccgcag cggtaatgac gactgccgcg acgtccgtaa 8760
aatcagtatc tcccaacgcc accacgcggc gatgagtaga aagtcgggat accagttcac 8820
tactggcggc aatattcatt gatttcataa gcgcaaaacc cgtttcgggg aagtaagaat 8880
accggacaag gtgaaaaacc ctgccccacg agatatgggt caaactggtc accagctccg 8940
accgccagac atcagtaaaa gcagaaacgc tctgatttta ctgttgtcct gcagtgagcg 9000
tgcgttaacc tcaccgcatg agcagaaaaa gggaggagtt tcgcgcgaaa cggcgataag 9060
cgagagaatg taaggaggtg gcgtgcatcg ggcaaactcc gtacagagag gagaaaattc 9120
gcgcaatcat ggcacctttc gccagagcgt gcaagccagg actttgcgaa caaacaagcc 9180
atcgaaggag ccaaacggtc ataataagaa aatcagacaa tgcagctaac aggaactctt 9240
gtggtcatcg gtccttttat caacgcaagt gcagtattac tgggtggcgt tctcggtgca 9300
ctccttagtc aacgcttacc ggaacgtatc cgcgtctcca tgacatcaat ttttggtctg 9360
gcatcgctgg ggattggtat tttactggtg gtgaaatgcg ccaaccttcc ggcgatggtt 9420
ttaacaacct tactcggggc attaatcggc gaaatttgtc tgctggaaaa aggcgtcaat 9480
accgcggtca ccaaagcaca aaatctgttt cgccactcac gtaagaagcc agcgcatgaa 9540
tcttttattc agaattatgt cgcgattatt gtcctgtttt gcgccagcgg caccgggatc 9600
ttcggggcga tgaacgaagg gatgaccggc gatccgagta ttttaatcgc caagtcattt 9660
ctcgatttct ttacggcgat gatcttcgcc tgctcgttgg gtattgcggt gtcggtgatt 9720
agcattccat tactgatcat ccagttaacg ctggcgtggg ctgccgcgct gatattaccg 9780
ctgaccacac cgtcgatgat ggcagacttc agcgctgtag gcggtttatt gctgctggca 9840
accggattac gcatctgtgg cattaaaatg ttcccggtgg tcaacatgct tccagcactc 9900
cttctggcaa tgccgctttc cgccgcctgg accgcctggt ttgcctgaca atgcgtgcaa 9960
tagcggcaaa gtgatgatag attgtgcagt ctgccctaaa ttgaagaaat ttgattgacg 10020
agacgaggcg aatcaggttt aatgcgcccc gttgcccgga tagctcagtc ggtagagcag 10080
gggattgaaa atccccgtgt ccttggttcg attccgagtc cgggcaccaa attcatatca 10140
acggacctcc acggaggtcc gtttttcgtt tcagaacacc atgatttaag tgttcttcct 10200
ccaaatcaat tctaccgaac tcaaccagat tccccccaca tcaaccccat tgtgtgggta 10260
taattgcggg tatacctcag ttcgacagaa tttgtaccct ctttaacgca ttcagaaggc 10320
tgaaatatgg cactgactga cgcaaaaatt cgggctgcaa agcccactga caaggcgtat 10380
aaactcactg acggagctgg catgctcatg ctggtacatc ccaatagttc ccgttactgg 10440
cgtctccgtt atcgtatttt gggtaaggag aagactcttg cacttggtgt gtatccagaa 10500
gtttctctct ccgaagctcg tgcaaaacgg gatgaggccc gaaaactaat ttcggcgggg 10560
attgaccctt gcgaacagaa aagagctaaa aaagtagtcc ctgatttaca gctctctttt 10620
gaacatattg cacgacgctg gcatgccagt aataaacaat ggacacaatc acacagcgat 10680
aaagtactca aaagcctcga gacgcatgtt ttccctttta tcggcaaccg ggatatcaca 10740
aaactcaaca ctccggacct gcttatccca gttcgcgctg cagaggctaa acagatttat 10800
gaaatcgcca gtcgtctgca gcaaaggata tctgctgtaa tgcgttatgc cgtacagtct 10860
ggcatcatca gatataatcc tgctctggat atggctggcg cattgaccac tgtaaaacgc 10920
cagcatcgcc ccgctcttga tctttcacgt cttcctgaac ttctgtcccg tattggcagt 10980
tataaaggtc agcctgttac ccgacttgct gttatgctga atttactggt ttttattcgc 11040
tccagtgaac tcagatatgc ccgctggtca gaaattgata ttgaaaatgc catgtggact 11100
attcctgctg aacgcgagcc tctgccaggc gtaaatttct cgcaccgggg ttccaagatg 11160
agaactccgc atcttgttcc cctcagcaag caggctgtac cttcccttcc tcctgcattt 11220
cctgtcagaa tgactgtaca gcgcgcagat tgccttttta ttgaccacct taatatacca 11280
ttataaactt ctttttatca tgttattatc accttattat gtttaatttt taagcaaccg 11340
gagaaagagg atggttcaga aaattttgtc ggataaggtt atgaatgaaa gaacaaatgc 11400
gtattactct tattatcttg gagagcgtaa tatctccgta ctgcccctta atgtttatga 11460
tcccccggaa cgttttatcg cttacataaa aaaaaacaga gaaaatctga acatcacact 11520
ttcagatttt gaacttgaac aaataatttc tggtatgcgt ctgaaggccc tggccttcct 11580
ggtccccctg gaaaaaatat cctggatcgc gggcagtgaa cgcgcatgct tattttcctg 11640
gtatctgttg atgcagttta tccagaataa cagggcaaaa ataagcgcag acttgcttca 11700
aaagaataaa ctgtatctta aagaagagta tctggaaggg aatgccttcc cgtcggactc 11760
atcgacacag ttcagacaaa tactcagagt tctcgatatt ctttctgata agaatttgcg 11820
ggatgagtgg ataatccaga ccaaagacag atggatgcgg gcatttaaat caaagagtcc 11880
tttcagttac ctcctcccgg agaacgaaca tgaatgcata tggacatgga attatttgaa 11940
gggaaaaaat attgcactgg aaaaactggc cagttttcct ggttctgctg atatttacca 12000
cgcaattcac ctttcatttg acatatgggt tacctgtcca ctcacctcac ctgacgatat 12060
aaaaaatttc agaaacagtt tcaataaggc caaggcgcag cgcaagtaca aaaaaatgca 12120
ggaagataaa gtcaatgtac agttttttct tgacgcagaa accagggcgc agctcaaaga 12180
attatcgagg gtcagaagac tcagtaccgg cgaaatgctg catgacctga ttgttgaaga 12240
gtataaaagg taccgacatt ccagataatt tcagacatat attatctccg tgagtccccc 12300
gccacctttc cggtgtgcgg gggttttgtc ttttttcacc gggaatacat gtatgaatcc 12360
gtctgatgcc attgaggcaa ttgaaaaacc gctctcctcc ctgccttact cactttcccg 12420
tcacatcctg gaacatctgc gcaaactcac cagtcacgaa ccgcactgga tattctgatt 12480
gcgtggctgc aggacaatat cgactgcgaa tcgggaatta tctttgacaa caatgaggat 12540
aaaacggatt cagcagcact gtttccctgt atcgaacagg ccagagagga tatccgtacc 12600
ctgcgccaac tgcagcttca gcaccagaac cggtgagtct cactcatcat ctcactcacc 12660
agacttcatt ccactgacgc cagcctgaac acggctggcg ttttcattta tctgcaaaaa 12720
ggaatatcga ttatgtctga aatcacagtc tcccgtccgg aagtggtcaa cgagaatacg 12780
gacgttatct gctccacctc agtcaggtac aggtcactgg aatatgataa ttttccggaa 12840
atcagcgaag cgaacattct gagcacattt gaacaactgc accagaacaa agatgaagtg 12900
tttgaacggg gagtgatcaa cgtcttcaaa gagctgagct gggattacaa aaccaactca 12960
ccctgtaaat ttggcagtaa aattatcgtc aacaatctgg tgaggtggga ccagtgggga 13020
tttcatctta tcagtggaat gcaggcagat cgcctggctg acctggaaag aatgttgcat 13080
ctgctcagcg gtaaaccgat ccccgacaac cgagggaata tcaccattaa tctggatgac 13140
cacatacagt ccgctcaggg taaaggacgc tatgaagatg agatgttcat cattaaatac 13200
tttaagaagg gatctgcaca catcactttc aaaaggctgg agctgattga cagaattaac 13260
gatataatag ccaggcactt tccttctgtg ctctcagcct gaccccgagt ttgattccct 13320
ttcgatatca aaagggactg cgggtacaaa agagggtaca tctttcacca aaccaaacaa 13380
aataaactaa tatcaacatg atagaagcat tcttcgattc cgagtccggc accactaatt 13440
cttaagaacc cgcccacaag gcgggttttt gcttttggat ctttatataa aataaacttg 13500
ggagcataac gccatcaggt cttaaacact cccgaatcat caataaacat cccccgttaa 13560
caaaacacag ttcagttcac ataacatccc tgttatccca cacatatctg ctggccgaac 13620
gacgccagtg cgcgtacgga ggcaagagca gccctgcaca tggcagcgct tgtggtaacc 13680
tggtttaatc cggtgataaa ggcgttttac atgcatctgc cagcagccgg aaaaaccaaa 13740
aaagtggcgc tggttgactg tatgcgtaaa ttgctgacca tcctgaacgc aatgctcaga 13800
aaaaacgaag agtgaaatga atcgtagcat catgttgctc cataattttt acgttcaaga 13860
cagttgatta tcggcgcata tgactcaaaa agagcctgat gattgcctct tttccatagg 13920
ctctttctct gaagtgaagg aaggcccgga agaaagcact cgctggcata cgtgactcca 13980
gctcaaccgg agataatcac cattgttatt tttctattta ataataatct cctgaaaaat 14040
agatatagca aaaatacaat ccggccagat ttaattccgc attcattacc agaaataatc 14100
aacaccacaa ctatcatatc attcaatagt caccgctaaa attttattat tttcctcttc 14160
tttacatgga aattgtcaac ctgtttatta tgccgcactt aaatagttaa tcacaaaaca 14220
acatcaccat tatttgcgtg ttttatttat taataacata gtcatacgtt ctttttttac 14280
aaggaaataa tcaattgata aattgttttt ggtcttaata gtcaagtagg aaacatttta 14340
ataaatgata aaaatcctaa attccttgtt cataatgtag gggtgtgtta aataggtggg 14400
caaaatttgg ttccccttct cgcctgtaat attgcagcat cttcgcacct ccatgagaca 14460
ttgcgactta ataagaaggt gataagtcct gcatataagc atggactgac catggtttta 14520
tattcattaa aaattttgtt acaacccatt gatttagcat aaataaatta tagtgggttc 14580
gggttagttg tgactgtggc attatttccg tgcaaaggag ctgatatgtc tgaaagacat 14640
ttacctgatg accagagcag tactatcgat ccatatctaa ttacctctgt tcgccagact 14700
ctggcagaac aaggcgcagc attacaaaac ttgtctaaac aactggattc cgggcagtac 14760
cagcgtgtcc ttaatttgat aatgaactgt aaagggcacg ttattctttc aggaatgggt 14820
aaatcagggc atgtcggtcg taaaatgtca gcgacgctgg cctctacggg tacgcctagt 14880
ttctttattc atcctacaga agctttccat ggcgatctgg gcatgattac gccttacgat 14940
cttctgatcc ttatttctgc cagcggtgaa acggatgaaa tcctcaagct agttccttca 15000
ctgaaaaatt tcggcaaccg aattatcgcc attaccaata atggaaattc cacgctggcg 15060
aaaaatgctg atgccgtgct ggaactccac atggcgaatg aaacctgccc gaataatctt 15120
gcaccaacaa cgtctaccac gctgacgatg gcgatcggcg atgcgctggc gattgccatg 15180
atccaccaac gcaaatttat gccgaatgat tttgcgcgct atcacccggg cggttcatta 15240
ggtcgtcgcc tgctgacccg cgttgctgat gtcatgcagc atgatgttcc tgcggtacag 15300
ctggatgcgt catttaaaac cgtgattcaa cgtatcacca gcggatgcca gggaatggtg 15360
atggtagaag acgcagaagg tgggctagcg ggcattatca ccgacggtga cctgcgtcgc 15420
tttatggaaa aagaggattc tctgacatcc gccacggctg cgcagatgat gacacgtgaa 15480
ccgctgacgc taccggaaga caccatgatc attgaagcgg aagaaaaaat gcaaaagcac 15540
cgcgtctcaa cattattggt gaccaacaag gcaaataaag tcactggcct tgtgcgcatt 15600
ttcgactaat taagcaacgg ggttcgagag gttagtctct cattgagttt gcgccccact 15660
gaaactttga taatcgttac atgttgataa aagtgaagtc tgccgtatcc tggatgcgtg 15720
ctcgtctgtc tgccatctca ctggcagata tccaaaaaca cctggcgaaa atcatcattc 15780
tgacaccgat ggcggtgctg ctgatctatc tggctatctt cagccagcct cgctatatga 15840
gcgagtcgaa agtcgccatt aaacgctcgg atgatttaaa cagcggcagc ctgaattttg 15900
gtctgcttct gggtgcctct aaccccagtt ccgcagaaga tgcgttgtat ctgaaagagt 15960
acatcaactc gccggatatg ctggcggcgc tggataagca actaaatttt cgtgaagcgt 16020
ttagccacag cgggctcgat tttcttaatc atcttagcaa ggatgaaact gcagaaggct 16080
tcctgaagta ctacaaggac cgtatcaacg tctcgtatga cgataaaacc ggattactga 16140
atattcagac gcagggcttt agcccggagt ttgcgcttaa gtttaaccag accgtgctga 16200
aagagtcaga gcgctttatc aatgagatgt cacatcgcat cgcgcgtgac cagcttgcct 16260
ttgcagaaac ggagatggaa aaggcacgcc agcgtctgga cgccagcaaa gcggaattgc 16320
tctcttatca agacaacaac aacgttctgg atccacaggc acaggcacag gcggcgagca 16380
cgttagtgaa tacgctgatg ggccagaaga tccagatgga agcggacctg cggaacttgc 16440
tgacgtatct gcgtgaggac gccccgcaag ttgtgagtgc gcgtaatgcg attcagtcat 16500
tgcaggcaca aattgacgaa gaaaaaagca aaatcacagc gccgcagggt gacaagctaa 16560
accgtatggc ggtggatttt gaagaaatca aatcaaaagt agagttcaac accgagctgt 16620
acaaactgac cctgacctcc attgaaaaga cccgtgtaga agcggctcgt aagctcaagg 16680
tgctgtcagt gatcagttcg ccacagttgc cgcaggaatc gtcttttcca aatatccctt 16740
atttgatcgc ctgctggtta ctggtgtgct gcctgctgtt cggcaccctg aaactgttgc 16800
tggctgttat tgaagatcac cgagactaac gctgtcgctg aatgagtttg tgatgaaatt 16860
atttaaatca attttactga ttgccgcctg tcacgcggcg caggccagcg cggccattga 16920
tattaacgct gacccaaacc ttacaggagc cgcgccgctt accggtattc tgaacgggca 16980
acagtcggat acgcaaaaca tgagcggctt cgacaatacc ccgccgcccg caccgccggt 17040
ggtcatgagc cgcatgtttg gtgctcaact tttcaacggc accagcgcgg atagcggtgc 17100
gacggtagga ttcaaccctg actatattct gaatccgggt gatagcattc aggttcgctt 17160
gtggggtgcg ttcacctttg atggtgcatt acagattgat cccaaaggta atatttttct 17220
gccaaacgtt ggtccggtga aagttgccgg ggttagcaat agtcagttga acactctggt 17280
tacatcaaaa gtgaaggaag tgtaccagtc caacgtcaac gtctacgcct ccttattaca 17340
ggcgcagcca gtaaaagtgt acgtgaccgg atttgtgcgt aatcctggtc tgtatggcgg 17400
tgtgacgtct gattcgttac tcaattatct gatcaaggct ggcggcgttg atccagagcg 17460
cggaagttac gttgatattg tggtcaagcg cggtaaccgc gtgcgctcca acgtcaacct 17520
gtacgacttc ctgctgaacg gcaaactggg gctttcgcag ttcgccgatg gtgacaccat 17580
catcgtcggg ccgcgtcagc atactttcag cgttcagggc gatgtcttta acagctacga 17640
ctttgagttc cgcgaaagca gcattcccgt aacggaagct ttgagctggg cgcgccctaa 17700
gcctggcgcg actcacatta cgattatgcg taaacagggg ctgcaaaaac gcagcgaata 17760
ctatccgatc agttctgcgc caggccgtat gttgcaaaat ggcgatacct taatcgtgag 17820
cactgaccgc tatgccggca ccattcaggt gcgggttgaa ggcgcacact ccggtgaaca 17880
tgccatggta ctgccttatg gttccactat gcgtgcggtt ctggaaaaag tccgcccgaa 17940
cagcatgtcg cagatgaacg cagttcagct ttatcgccca tcagtggctc agcgtcagaa 18000
agagatgctg aatctctcgc tgcaaaagct ggaggaagcc tcactttctg cccagtcatc 18060
caccaaagaa gaagccagcc tgcgaatgca ggaggcacaa ctgatcagcc gctttgtggc 18120
gaaagcacgc accgtggttc cgaaaggtga agtgatcctc aacgaatcca atattgattc 18180
tgttctgctt gaagatggcg acgtcatcaa tattccggag aaaacatcgc tgattatggt 18240
tcatggcgaa gtgctgttcc cgaacgcggt gagctggcag aagggtatga ccaccgagga 18300
ttacatcgag aaatgtggtg gcctgacgca aaaatcgggt aacgccagaa ttatcgtcat 18360
tcgtcagaac ggtgctgccg tcaacgcgga agacgtggat tcactcaagc cgggcgatga 18420
gattatggtt ctgccgaaat atgaatcgaa aaatattgaa gttacccgtg gtatttccac 18480
catcctctat cagctggcgg tgggtgcaaa agtgattctg tctttgtaag gagttgaaat 18540
gagcaaagct gttattgtca tcccggctcg ttatggctca tcgcgtctgc cgggtaagcc 18600
gctactcgat attgtcggca aaccgatgat ccagcatgtt tacgagtgtg cgttacaggt 18660
ggcgggcgtt gcggaagttt gggtggcaac agacgatccg cgtgttgaac aggccgtgca 18720
ggcatttggc gggaaagcca tcatgacgcg caacgatcat gaatccggca ccgatcggct 18780
ggtcgaggtg atgcataaag tcgaggcaga tatctacatt aacctgcagg gcgacgaacc 18840
aatgattcgc ccgcgggatg tagaaacgct gttacaagga atgcgtgatg accccgcgtt 18900
gccagtggca acgctatgcc acgcgatttc tgccgaagaa gcgaccgagc caagcacggt 18960
aaaagtggtg gtaaataccc gccaggatgc gctttatttc agccgttcgc ctattccgta 19020
tccgtgtaat gctgaaaaag cgcgctacct gaaacacgtt ggtatttacg cttatcgtcg 19080
cgatgtgctg caaaactaca gccagttacc ggagtccatg caggagcagg cagaatcact 19140
ggagcagctg cggttgatga gcgcggggat caacatccgc acatttgagg ttgccgcaac 19200
cggtccgggc gtcgacaccc cagcatgcct ggaaaaagtg cgcgccctga tggcacagga 19260
actggctgaa aacgcatgat tggcattttc tcgtccggta tctggcgtat tccgcatctg 19320
gagaaatttc tggcgcaacc gtgccagaaa ctttctctgc tgcgccctgt tccgcaagaa 19380
gttgatgcta tcgccgtgtg gggacatcgt cccagcgcgg cgaaaccagt cgccatcgcc 19440
aaagcagcgg gaaaacccgt cattcgtctg gaagatggat ttgtgcgttc gctggatctt 19500
ggcgtcaatg gcgagccgcc gctttctctg gtggtggatg attgtggcat ttactacgat 19560
gccagcaagc cttcagcact ggagaaactg gtaaaggata aagccggaaa tacagctctg 19620
ataagccagg ccagagaagc gatgcacacc atcgtgaccg gggatttgtc gaaatataac 19680
ctggcacctg cgtttgtggc tgatgagtca gaacgttcag acatcgttct ggttgtcgat 19740
cagacattta atgatatgtc agtgacgtat ggcaatgctg gcccgcatga gtttgctgcc 19800
atgctggaag ccgcgatggc ggaaaatcct caagccgaaa tttgggtgaa ggtgcatccg 19860
gatgtcctgg aaggaaagaa aacaggttat ttcgctgatc tgtgcgccac gcaacgagta 19920
cgtttgattg ccgagaatgt cagcccgcag tcgctgttgc gacacgtttc ccgg 19974
<210> 27
<211> 40025
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 40 kb 序列
<400> 27
gtggacggac gcattgcacc gaccatcacc accggtttgt cgcatttcac cgtcaggtcg 60
aggaagtaag cggtttcttc catcgtgtcg gtaccgtggg taatgacgaa gccgtcagtt 120
ttatcgcagt cggtgttaat ttttttcgcc agtgtcagcc agacatcatc gttcatgtcc 180
tgggagccaa tattcactac ctgctcgcct ttaacgttcg caatgtcctt cagttgcggc 240
accgcattaa ccagattttc tacgccaact ttacccgctg tgtagttaga tttggttgcg 300
gagtcaccac caccggcaat ggtcccgccg gttgctaaaa tggtgatatt gggtaatgcc 360
aatgctgcac cactaaaacc cataaccagt gcggcaagtg ccgtcttttt gaaaaactcc 420
atttcattcc tccagttacg tgaacgctac acattatccc ttagctttgc atgggaaatt 480
tgacgttaaa caatttacaa cgtgaatata ttttggagat ctacaaagtt agaggcaggt 540
aacaaaacga agaattaaac ggcataaaaa agtattatgc cgtcttaaaa tagaggatta 600
ttttaaattc ccgaccaggg ctttgcggct atcttccaga gtcacaacgc ggctacaaac 660
atctttgcca aactgctgga aatctttttc ctgctttttc cactcggttt ggattgagga 720
ttgcaggccg cccaggcttc ccagcacgtt ctgtaatggg ttaccgccgc ttttcagcac 780
cgctttcgcg cccatttcat taatgctgtc ctgtaaaatt ccgcccattg cctgattcac 840
taattgctgg ccttcggcgc gaacctgatc aatggcttta tagtgaaacg tcaggccatc 900
gctgcgcgtt tcgataatgc ggttcatctg ctctttcagc tgcgcatcaa gtttggtcag 960
acggctgcgc attttgctgc tttcgcccat ctcctgaacg ataattttat ccagcgcaat 1020
acgggctttt tcgacgcggc ttttcgcgcc ttcatcaatc cacggcagcg tgctgcgtag 1080
ttcagcctga taatccttcg cctgctcgcg ctgggcggca ttcagggaat attgcttacc 1140
gttatacatc acgttgccgt ctggcgtgat caccagattg ccgttttcgc ccttcacctg 1200
cacggtttgc gggctgacaa tcacatcgtc acgcggcgtg acgctgcact ggtagtcggc 1260
gtgagcggtc attgccgtca ctgaaagtgc tgccgccagc agcattttgc gcatcatagt 1320
cttccctcaa gaaaaaatca ggccagcatt tgctggcccc agattgataa caaagtacgc 1380
gttttccatg ccggatgcgg cgtaaacacc ttatcccgcc tactcgatcg tgcatctttc 1440
caggcctgat aagcgtagcg catcaggcag ttttgcattt gtcatcgccc gtatgctttc 1500
ttagtcccac caaacgtcga aaagttcgct ggtgcgtacc tcatccagtt tgcgctcttc 1560
cagccactta cgcacaatcg cctgatgttc ttcggtgcat ttgccgattt cctgcatgca 1620
gatcagacct tcccaggcca gataaccgct gccgtcaaag gccagtttgt tcggttcgat 1680
aacctcgtta ataaaatcat caacggtttt atcaatctgt tcttccgatg taccttccgg 1740
gaatcgccat gccaccgaaa atcctaattc ctggaattcg tcgatgtgca tttttttacg 1800
cagacgacgg ctacggttct ttgccattat ttcaccctct cgaacattaa gtcccatact 1860
ccgtgaccaa gacgatgacc acgttgttca aatttcgtca ccggacgtga tgccggacgc 1920
ggtacgtaat cattgctctc tgacaggttt ttataaccgt caatagaaga catcacttca 1980
agcatatgtt ccgcataagg ttcccagtcg gtcgccatat ggaatacgcc ccccagctgc 2040
agtttgcttt ttaccagttc ggcaaacggc acctgaacga tacggcgttt attatggcgc 2100
gctttgtgcc acgggtcagg gaaaaagagc tgcaccatgc gcaatgaatt gtcaggaatc 2160
attttatgca gcacttcaac cgcatcgtga cacatcacgc gcaggttgct taaaccttct 2220
tcatgcgcag aagccaggca cgcaccaacg cccggtgaat gcacttcaat gccgaggaag 2280
tcctgctcag ggcgatcttt agccattgcc accagcgacg cccccatgcc aaaaccaatc 2340
tcaagcgtca ccggcgcttc acggccaaaa agcgcgggga aatccagcat atcttcgctg 2400
aactcaacgc ccatcaccgg ccagtagttt tccagcgcat gttcctggcc tttggtcagt 2460
cgcccctggc ggcgcacaaa actacggata cggcgcagtg ggcggccgtt ttcatcaaat 2520
tccggtgaaa tgacgtcgtt tttcataaag gtttagtcgc ttgtgaaagt gttctgaaaa 2580
cgggcattat ccaaagttag ttgccggatg caagcatgat aaggccgtgg ctgcggaaag 2640
ttccggttta caccctgccg tcgctgtgct gcaatcttgc ccccaacaac agtgaattcg 2700
gtgaccatgc aagcgtcgca attttcagcc caggttctgg actggtacga taaatacggg 2760
cgaaaaactc tgccctggca aattgacaag acgccctaca aagtatggct ctcagaagtg 2820
atgttgcaac aaactcaggt tgcgaccgtt atcccctatt ttgaacgctt tatggcgcgc 2880
ttcccgacgg tgaccgatct cgccaatgcg ccgctcgacg aagttctcca cttgtggacc 2940
gggcttggct attacgcccg cgcgcgcaat ctgcataaag cggcacaaca agtggcgacc 3000
ttacacggcg gtaaattccc ggaaaccttt gaggaagttg cagcactgcc gggcgtcggg 3060
cgttccaccg caggcgcgat tctctcgctt tctctgggta agcactttcc gattctcgac 3120
ggtaacgtca aacgggtgct ggcgcgctgc tatgctgtaa gcggctggcc agggaaaaaa 3180
gaggtcgaga ataaattatg gagtttgagc gagcaggtga cgcccgcggt tggcgtggaa 3240
cggtttaatc aggcgatgat ggatttgggt gcgatgattt gtacgcgctc gaaaccgaaa 3300
tgttcgctct gtccgctaca aaacggatgt attgccgccg ccaacaatag ctgggcgctt 3360
tatccgggca aaaaaccgaa acagacgctg ccggagcgca ccggctactt tttgctatta 3420
cagcacgaag atgaagtatt gctggcgcag cgtccgccga gcggattgtg gggcggttta 3480
tactgtttcc cgcagtttgc cgacgaagaa agtttgcggc agtggctggc gcaacggcag 3540
attgctgccg ataacctgac gcaactgacc gcgtttcggc ataccttcag ccatttccac 3600
ttagatattg tgcctatgtg gcttcccgtg tcgtcattca ccggctgcat ggatgaaggc 3660
aatgcgctct ggtataactt agcgcaaccg ccgtcagttg gcctggcggc tcccgtggag 3720
cgtttgttac agcagttacg cactggcgcg ccggtttagc gcgtgagtcg ataaagagga 3780
tgatttatga gcagaacgat tttttgtact ttcctgcaac gtgaagcaga aggtcaggat 3840
tttcagctgt accccggcga gctgggaaaa cgcatctata acgagatctc caaagaagcc 3900
tgggcgcagt ggcagcacaa gcaaaccatg ctgattaatg aaaagaaact caacatgatg 3960
aatgccgagc accgcaagct gcttgagcag gagatggtca acttcctgtt cgagggtaaa 4020
gaggtgcata tcgagggcta tacgccggaa gataaaaaat aaaaacagtg ccggagcacg 4080
cctccggcaa cttgcataaa aacaaacaca acacgcaccc ggaatgatga aaaaatatct 4140
cgcgctggct ttgattgcgc cgttgctcat ctcctgttcg acgaccaaaa aaggcgatac 4200
ctataacgaa gcctgggtca aagataccaa cggttttgat attctgatgg ggcaatttgc 4260
ccacaatatt gagaacatct ggggcttcaa agaggtggtg atcgctggtc ctaaggacta 4320
cgtgaaatac accgatcaat atcagacccg cagccacatc aacttcgatg acggtacgat 4380
tactatcgaa accatcgccg ggacagaacc tgccgcgcat ttgcgccggg caattatcaa 4440
aacgttgctg atgggtgacg atccgagttc ggtcgatctc tattccgacg ttgatgatat 4500
tacgatttcg aaagaacctt tcctttacgg tcaggtggtg gacaacaccg ggcagccgat 4560
tcgctgggaa ggtcgcgcaa gcaacttcgc ggattatctg ctgaaaaacc gtctgcaaag 4620
ccgcagtaac gggctgcgta tcatctacag cgtcaccatt aacatggtac cgaaccacct 4680
tgataaacgt gcgcacaaat atctcggtat ggtccgccag gcgtcacgga aatatggcgt 4740
tgatgagtcg ctgattctgg caattatgca gactgaatct tcctttaacc cgtatgcggt 4800
cagccgttcc gatgcgctgg gattaatgca ggtggtacaa catactgccg ggaaagatgt 4860
gttccgctcg caggggaaat ccggcacgcc gagccgcagt ttcttgtttg atcctgccag 4920
caatattgat accggcaccg cgtatctggc gatgctgaac aatgtttatc tcggcggaat 4980
tgataaccca acatcgcggc gttatgccgt catcaccgcc tataacggcg gcgcaggcag 5040
cgtgctgcga gtcttttcga atgataagat tcaggctgcc aatattatta acaccatgac 5100
gccgggcgat gtttatcaga cgctgacgac ccgccatccc tctgcggaat ctcgccgtta 5160
tctttataaa gtgaataccg cgcaaaaatc ctaccgccgc cgataattcc attaaccgcc 5220
cctgacgatg ctcaggggca aaaatgttat ccacatcaca atttcgtttt gcaaattggg 5280
aatgtttgca attatttgcc acaggtaaca aaaaaccagt ccgcgaagtt gatagaatcg 5340
catcatctcg cacggtcaaa tgtgcttttt caaacactca tccgcatcac gatgtgagga 5400
aattaacatg aatcttaagc tgcagctgaa aatcctctct tttctgcagt tctgtctgtg 5460
gggaagttgg ctgacgaccc tcggctccta tatgtttgtt accctgaagt ttgacggtgc 5520
ttctattggc gcagtttata gctcactggg tatcgcagcg gtctttatgc ctgcgctgct 5580
ggggattgtg gccgacaaat ggttaagtgc gaaatgggta tatgccattt gccacaccat 5640
tggcgctatc acgctgttca tggcggcaca ggtcacgaca ccggaagcga tgttccttgt 5700
gatattgatt aactcgtttg cttatatgcc aacgcttggg ttaatcaaca ccatctctta 5760
ctatcgcctg caaaatgccg ggatggatat cgttactgac ttcccgccaa tccgtatctg 5820
gggcaccatc ggctttatca tggcaatgtg ggtggtgagc ctgtctggct tcgaattaag 5880
ccacatgcag ctgtatattg gcgcagcact ttccgccatt ctggttctgt ttaccctgac 5940
tctgccgcat attccggttg ctaaacagca agcgaatcag agctggacaa ccctgctggg 6000
cctcgatgca ttcgcgctgt ttaaaaacaa gcgtatggca atcttcttca tcttctcaat 6060
gctgctgggc gcggaactgc agattaccaa catgttcggt aacaccttcc tgcacagctt 6120
cgacaaagat ccgatgtttg ccagcagctt catcgtgcag catgcgtcaa tcatcatgtc 6180
gatttcgcag atctctgaaa ccctgttcat tctgaccatc ccgttcttct taagccgcta 6240
cggcattaag aacgtaatga tgatcagtat cgtggcgtgg atcctgcgtt ttgcgctgtt 6300
tgcttacggt gacccgactc cgttcggcac cgtactgctg gttctgtcga tgattgttta 6360
cggctgcgca ttcgacttct tcaacatctc tggttcggtg tttgtcgaaa aagaagttag 6420
cccggcaatt cgcgccagtg cgcaggggat gttcctgatg atgactaacg gcttcggctg 6480
tatcctcggc ggcatcgtga gcggtaaagt ggttgagatg tacacccaaa acggcattac 6540
cgactggcag accgtatggc tgattttcgc aggttactcc gtggttctgg ccttcgcgtt 6600
catggcgatg ttcaaatata aacacgttcg tgtcccgaca ggcacacaga cggttagcca 6660
ctaattacgc aaagaaaaac gggtcgccag aaggtgaccc gtttttttat tcttacttca 6720
acacataccc gtacaaccgt ttcatgccat ctgcatcggt ttcgctatag acaccttgca 6780
gctccggcga aaatcccggc aacaaattca ccccttcttc cagcgcaagg aaataacgtt 6840
gaaccgcccc accccagact tctccgggta ccacgcaaag cacgcctggt ggataaggca 6900
acgccccttc tgccgcaatt cgcccttcgg catcacgaat ccgcaccaac tccacttcac 6960
cgcgaatata agcgctatgc gcatcctggg gattcatcac cactgacggg aaactctgct 7020
ggcggaacat cgctttttgt aggtctttga cgtcgaaact gacatacaaa tcgtgcatct 7080
cctgacacaa ctggcgcagg gtgtagtcgc gatagcgcac cggatatttg ttataaacgc 7140
tcggcaacac ctcagccagc ggcgagtcat cctcaatatg ctgttcaaac tgcgccagca 7200
tcgccaccag ttgtgccagc ttctcgtggc tttccgccgg agttaataag aacagaatgg 7260
agttgagatc gcacttctcc ggcacaatgc cgttctcacg caggtagtgc gccagaatcg 7320
tcgccggaac gccaaagtcg ctatattcgc cggtttcggc attgatacct ggtgtagtga 7380
gtaacagctt gcacggatca acaaaatact gatccgcggc atatccttca aagccgtgcc 7440
acttcgcccc cggctcaaaa ctgaaaaaac gacggtcact ggctaacact gatgtcggat 7500
aatcctgcca caatttgcca tcaacaacag gcgggataaa cgggcggaac agcttacagc 7560
gcgcaagaat cgccttccgg gcttcaatcc ccaacgcaac gcactccgcc cacagccgac 7620
gcccactctc cccttcatga attttggcgt taacgtccag cgcggcaaac agcggataga 7680
acgggctggt agaagcatgg agcataaagg cattatttaa ccgcttatgc gggcaaaaac 7740
gcgcctgccc gcgaatatgg ttatcttttt tatggatctg cgatgtctgc gagaagcccg 7800
cctgctgttt gtgcaccgac tgggtcacaa agatccccgg atcgttttcg ttaagttcta 7860
acagcagcgg cgagctatcc gccatcatcg ggataaactg ttcgtaaccg acccacgcgg 7920
aatcaaacag aatgtaatca cacagatgcc caacggtatc gatcacctga cgggcgttat 7980
agacagtgcc gtcataggtt cccagctgaa taatcgccag gcgaaacggg cgcggcaggt 8040
cggctttttc tggcgcaacg tcgcgaattt gctggcgcag atactcttca ttaaaacagt 8100
gcgcatcaat accgccaatg aaaccaaacg ggttacgtga agcttccaga tagaccggcg 8160
tcgcccccgc ctgaatcagc gcgccgtgat gattcgactt atggttgtta cggtcgaaga 8220
gcaccagatc gccacgcgtt aacagcgcat tcgtcaccac tttattcgct gccgatgtgc 8280
cgttcagtac aaaataggtt ttatcggcat gaaagacttt ggctgcgaat ttctgcgcat 8340
ccttcgccga tccttcatga ataagcagat cgcccaattt tacgtcagcg ttacacatat 8400
cggcgcgaaa gatgttctcg ccaaagaaat cgtaaaaatg gcgtccggca ggatgctttt 8460
taaagaacgc accatgttga tgtccagggc aagcaaaggt gctgttgccc atctcaacgt 8520
actgcgtcag cgtgtcataa aacggtggca gcaaattctc ttcatactga caggctgcgg 8580
attccagctc cagccactgc tgctcgttgc cgttgattac cgccgtaacg cccgcaggta 8640
attcaacagc atgttcggaa tacaaaaaca ccggtagatg aaaaccggtg cgcttaagca 8700
acgcaagaat gccactgcga ctatccgcag cggtaatgac gactgccgcg acgtccgtaa 8760
aatcagtatc tcccaacgcc accacgcggc gatgagtaga aagtcgggat accagttcac 8820
tactggcggc aatattcatt gatttcataa gcgcaaaacc cgtttcgggg aagtaagaat 8880
accggacaag gtgaaaaacc ctgccccacg agatatgggt caaactggtc accagctccg 8940
accgccagac atcagtaaaa gcagaaacgc tctgatttta ctgttgtcct gcagtgagcg 9000
tgcgttaacc tcaccgcatg agcagaaaaa gggaggagtt tcgcgcgaaa cggcgataag 9060
cgagagaatg taaggaggtg gcgtgcatcg ggcaaactcc gtacagagag gagaaaattc 9120
gcgcaatcat ggcacctttc gccagagcgt gcaagccagg actttgcgaa caaacaagcc 9180
atcgaaggag ccaaacggtc ataataagaa aatcagacaa tgcagctaac aggaactctt 9240
gtggtcatcg gtccttttat caacgcaagt gcagtattac tgggtggcgt tctcggtgca 9300
ctccttagtc aacgcttacc ggaacgtatc cgcgtctcca tgacatcaat ttttggtctg 9360
gcatcgctgg ggattggtat tttactggtg gtgaaatgcg ccaaccttcc ggcgatggtt 9420
ttaacaacct tactcggggc attaatcggc gaaatttgtc tgctggaaaa aggcgtcaat 9480
accgcggtca ccaaagcaca aaatctgttt cgccactcac gtaagaagcc agcgcatgaa 9540
tcttttattc agaattatgt cgcgattatt gtcctgtttt gcgccagcgg caccgggatc 9600
ttcggggcga tgaacgaagg gatgaccggc gatccgagta ttttaatcgc caagtcattt 9660
ctcgatttct ttacggcgat gatcttcgcc tgctcgttgg gtattgcggt gtcggtgatt 9720
agcattccat tactgatcat ccagttaacg ctggcgtggg ctgccgcgct gatattaccg 9780
ctgaccacac cgtcgatgat ggcagacttc agcgctgtag gcggtttatt gctgctggca 9840
accggattac gcatctgtgg cattaaaatg ttcccggtgg tcaacatgct tccagcactc 9900
cttctggcaa tgccgctttc cgccgcctgg accgcctggt ttgcctgaca atgcgtgcaa 9960
tagcggcaaa gtgatgatag attgtgcagt ctgccctaaa ttgaagaaat ttgattgacg 10020
agacgaggcg aatcaggttt aatgcgcccc gttgcccgga tagctcagtc ggtagagcag 10080
gggattgaaa atccccgtgt ccttggttcg attccgagtc cgggcaccaa attcatatca 10140
acggacctcc acggaggtcc gtttttcgtt tcagaacacc atgatttaag tgttcttcct 10200
ccaaatcaat tctaccgaac tcaaccagat tccccccaca tcaaccccat tgtgtgggta 10260
taattgcggg tatacctcag ttcgacagaa tttgtaccct ctttaacgca ttcagaaggc 10320
tgaaatatgg cactgactga cgcaaaaatt cgggctgcaa agcccactga caaggcgtat 10380
aaactcactg acggagctgg catgctcatg ctggtacatc ccaatagttc ccgttactgg 10440
cgtctccgtt atcgtatttt gggtaaggag aagactcttg cacttggtgt gtatccagaa 10500
gtttctctct ccgaagctcg tgcaaaacgg gatgaggccc gaaaactaat ttcggcgggg 10560
attgaccctt gcgaacagaa aagagctaaa aaagtagtcc ctgatttaca gctctctttt 10620
gaacatattg cacgacgctg gcatgccagt aataaacaat ggacacaatc acacagcgat 10680
aaagtactca aaagcctcga gacgcatgtt ttccctttta tcggcaaccg ggatatcaca 10740
aaactcaaca ctccggacct gcttatccca gttcgcgctg cagaggctaa acagatttat 10800
gaaatcgcca gtcgtctgca gcaaaggata tctgctgtaa tgcgttatgc cgtacagtct 10860
ggcatcatca gatataatcc tgctctggat atggctggcg cattgaccac tgtaaaacgc 10920
cagcatcgcc ccgctcttga tctttcacgt cttcctgaac ttctgtcccg tattggcagt 10980
tataaaggtc agcctgttac ccgacttgct gttatgctga atttactggt ttttattcgc 11040
tccagtgaac tcagatatgc ccgctggtca gaaattgata ttgaaaatgc catgtggact 11100
attcctgctg aacgcgagcc tctgccaggc gtaaatttct cgcaccgggg ttccaagatg 11160
agaactccgc atcttgttcc cctcagcaag caggctgtac cttcccttcc tcctgcattt 11220
cctgtcagaa tgactgtaca gcgcgcagat tgccttttta ttgaccacct taatatacca 11280
ttataaactt ctttttatca tgttattatc accttattat gtttaatttt taagcaaccg 11340
gagaaagagg atggttcaga aaattttgtc ggataaggtt atgaatgaaa gaacaaatgc 11400
gtattactct tattatcttg gagagcgtaa tatctccgta ctgcccctta atgtttatga 11460
tcccccggaa cgttttatcg cttacataaa aaaaaacaga gaaaatctga acatcacact 11520
ttcagatttt gaacttgaac aaataatttc tggtatgcgt ctgaaggccc tggccttcct 11580
ggtccccctg gaaaaaatat cctggatcgc gggcagtgaa cgcgcatgct tattttcctg 11640
gtatctgttg atgcagttta tccagaataa cagggcaaaa ataagcgcag acttgcttca 11700
aaagaataaa ctgtatctta aagaagagta tctggaaggg aatgccttcc cgtcggactc 11760
atcgacacag ttcagacaaa tactcagagt tctcgatatt ctttctgata agaatttgcg 11820
ggatgagtgg ataatccaga ccaaagacag atggatgcgg gcatttaaat caaagagtcc 11880
tttcagttac ctcctcccgg agaacgaaca tgaatgcata tggacatgga attatttgaa 11940
gggaaaaaat attgcactgg aaaaactggc cagttttcct ggttctgctg atatttacca 12000
cgcaattcac ctttcatttg acatatgggt tacctgtcca ctcacctcac ctgacgatat 12060
aaaaaatttc agaaacagtt tcaataaggc caaggcgcag cgcaagtaca aaaaaatgca 12120
ggaagataaa gtcaatgtac agttttttct tgacgcagaa accagggcgc agctcaaaga 12180
attatcgagg gtcagaagac tcagtaccgg cgaaatgctg catgacctga ttgttgaaga 12240
gtataaaagg taccgacatt ccagataatt tcagacatat attatctccg tgagtccccc 12300
gccacctttc cggtgtgcgg gggttttgtc ttttttcacc gggaatacat gtatgaatcc 12360
gtctgatgcc attgaggcaa ttgaaaaacc gctctcctcc ctgccttact cactttcccg 12420
tcacatcctg gaacatctgc gcaaactcac cagtcacgaa ccgcactgga tattctgatt 12480
gcgtggctgc aggacaatat cgactgcgaa tcgggaatta tctttgacaa caatgaggat 12540
aaaacggatt cagcagcact gtttccctgt atcgaacagg ccagagagga tatccgtacc 12600
ctgcgccaac tgcagcttca gcaccagaac cggtgagtct cactcatcat ctcactcacc 12660
agacttcatt ccactgacgc cagcctgaac acggctggcg ttttcattta tctgcaaaaa 12720
ggaatatcga ttatgtctga aatcacagtc tcccgtccgg aagtggtcaa cgagaatacg 12780
gacgttatct gctccacctc agtcaggtac aggtcactgg aatatgataa ttttccggaa 12840
atcagcgaag cgaacattct gagcacattt gaacaactgc accagaacaa agatgaagtg 12900
tttgaacggg gagtgatcaa cgtcttcaaa gagctgagct gggattacaa aaccaactca 12960
ccctgtaaat ttggcagtaa aattatcgtc aacaatctgg tgaggtggga ccagtgggga 13020
tttcatctta tcagtggaat gcaggcagat cgcctggctg acctggaaag aatgttgcat 13080
ctgctcagcg gtaaaccgat ccccgacaac cgagggaata tcaccattaa tctggatgac 13140
cacatacagt ccgctcaggg taaaggacgc tatgaagatg agatgttcat cattaaatac 13200
tttaagaagg gatctgcaca catcactttc aaaaggctgg agctgattga cagaattaac 13260
gatataatag ccaggcactt tccttctgtg ctctcagcct gaccccgagt ttgattccct 13320
ttcgatatca aaagggactg cgggtacaaa agagggtaca tctttcacca aaccaaacaa 13380
aataaactaa tatcaacatg atagaagcat tcttcgattc cgagtccggc accactaatt 13440
cttaagaacc cgcccacaag gcgggttttt gcttttggat ctttatataa aataaacttg 13500
ggagcataac gccatcaggt cttaaacact cccgaatcat caataaacat cccccgttaa 13560
caaaacacag ttcagttcac ataacatccc tgttatccca cacatatctg ctggccgaac 13620
gacgccagtg cgcgtacgga ggcaagagca gccctgcaca tggcagcgct tgtggtaacc 13680
tggtttaatc cggtgataaa ggcgttttac atgcatctgc cagcagccgg aaaaaccaaa 13740
aaagtggcgc tggttgactg tatgcgtaaa ttgctgacca tcctgaacgc aatgctcaga 13800
aaaaacgaag agtgaaatga atcgtagcat catgttgctc cataattttt acgttcaaga 13860
cagttgatta tcggcgcata tgactcaaaa agagcctgat gattgcctct tttccatagg 13920
ctctttctct gaagtgaagg aaggcccgga agaaagcact cgctggcata cgtgactcca 13980
gctcaaccgg agataatcac cattgttatt tttctattta ataataatct cctgaaaaat 14040
agatatagca aaaatacaat ccggccagat ttaattccgc attcattacc agaaataatc 14100
aacaccacaa ctatcatatc attcaatagt caccgctaaa attttattat tttcctcttc 14160
tttacatgga aattgtcaac ctgtttatta tgccgcactt aaatagttaa tcacaaaaca 14220
acatcaccat tatttgcgtg ttttatttat taataacata gtcatacgtt ctttttttac 14280
aaggaaataa tcaattgata aattgttttt ggtcttaata gtcaagtagg aaacatttta 14340
ataaatgata aaaatcctaa attccttgtt cataatgtag gggtgtgtta aataggtggg 14400
caaaatttgg ttccccttct cgcctgtaat attgcagcat cttcgcacct ccatgagaca 14460
ttgcgactta ataagaaggt gataagtcct gcatataagc atggactgac catggtttta 14520
tattcattaa aaattttgtt acaacccatt gatttagcat aaataaatta tagtgggttc 14580
gggttagttg tgactgtggc attatttccg tgcaaaggag ctgatatgtc tgaaagacat 14640
ttacctgatg accagagcag tactatcgat ccatatctaa ttacctctgt tcgccagact 14700
ctggcagaac aaggcgcagc attacaaaac ttgtctaaac aactggattc cgggcagtac 14760
cagcgtgtcc ttaatttgat aatgaactgt aaagggcacg ttattctttc aggaatgggt 14820
aaatcagggc atgtcggtcg taaaatgtca gcgacgctgg cctctacggg tacgcctagt 14880
ttctttattc atcctacaga agctttccat ggcgatctgg gcatgattac gccttacgat 14940
cttctgatcc ttatttctgc cagcggtgaa acggatgaaa tcctcaagct agttccttca 15000
ctgaaaaatt tcggcaaccg aattatcgcc attaccaata atggaaattc cacgctggcg 15060
aaaaatgctg atgccgtgct ggaactccac atggcgaatg aaacctgccc gaataatctt 15120
gcaccaacaa cgtctaccac gctgacgatg gcgatcggcg atgcgctggc gattgccatg 15180
atccaccaac gcaaatttat gccgaatgat tttgcgcgct atcacccggg cggttcatta 15240
ggtcgtcgcc tgctgacccg cgttgctgat gtcatgcagc atgatgttcc tgcggtacag 15300
ctggatgcgt catttaaaac cgtgattcaa cgtatcacca gcggatgcca gggaatggtg 15360
atggtagaag acgcagaagg tgggctagcg ggcattatca ccgacggtga cctgcgtcgc 15420
tttatggaaa aagaggattc tctgacatcc gccacggctg cgcagatgat gacacgtgaa 15480
ccgctgacgc taccggaaga caccatgatc attgaagcgg aagaaaaaat gcaaaagcac 15540
cgcgtctcaa cattattggt gaccaacaag gcaaataaag tcactggcct tgtgcgcatt 15600
ttcgactaat taagcaacgg ggttcgagag gttagtctct cattgagttt gcgccccact 15660
gaaactttga taatcgttac atgttgataa aagtgaagtc tgccgtatcc tggatgcgtg 15720
ctcgtctgtc tgccatctca ctggcagata tccaaaaaca cctggcgaaa atcatcattc 15780
tgacaccgat ggcggtgctg ctgatctatc tggctatctt cagccagcct cgctatatga 15840
gcgagtcgaa agtcgccatt aaacgctcgg atgatttaaa cagcggcagc ctgaattttg 15900
gtctgcttct gggtgcctct aaccccagtt ccgcagaaga tgcgttgtat ctgaaagagt 15960
acatcaactc gccggatatg ctggcggcgc tggataagca actaaatttt cgtgaagcgt 16020
ttagccacag cgggctcgat tttcttaatc atcttagcaa ggatgaaact gcagaaggct 16080
tcctgaagta ctacaaggac cgtatcaacg tctcgtatga cgataaaacc ggattactga 16140
atattcagac gcagggcttt agcccggagt ttgcgcttaa gtttaaccag accgtgctga 16200
aagagtcaga gcgctttatc aatgagatgt cacatcgcat cgcgcgtgac cagcttgcct 16260
ttgcagaaac ggagatggaa aaggcacgcc agcgtctgga cgccagcaaa gcggaattgc 16320
tctcttatca agacaacaac aacgttctgg atccacaggc acaggcacag gcggcgagca 16380
cgttagtgaa tacgctgatg ggccagaaga tccagatgga agcggacctg cggaacttgc 16440
tgacgtatct gcgtgaggac gccccgcaag ttgtgagtgc gcgtaatgcg attcagtcat 16500
tgcaggcaca aattgacgaa gaaaaaagca aaatcacagc gccgcagggt gacaagctaa 16560
accgtatggc ggtggatttt gaagaaatca aatcaaaagt agagttcaac accgagctgt 16620
acaaactgac cctgacctcc attgaaaaga cccgtgtaga agcggctcgt aagctcaagg 16680
tgctgtcagt gatcagttcg ccacagttgc cgcaggaatc gtcttttcca aatatccctt 16740
atttgatcgc ctgctggtta ctggtgtgct gcctgctgtt cggcaccctg aaactgttgc 16800
tggctgttat tgaagatcac cgagactaac gctgtcgctg aatgagtttg tgatgaaatt 16860
atttaaatca attttactga ttgccgcctg tcacgcggcg caggccagcg cggccattga 16920
tattaacgct gacccaaacc ttacaggagc cgcgccgctt accggtattc tgaacgggca 16980
acagtcggat acgcaaaaca tgagcggctt cgacaatacc ccgccgcccg caccgccggt 17040
ggtcatgagc cgcatgtttg gtgctcaact tttcaacggc accagcgcgg atagcggtgc 17100
gacggtagga ttcaaccctg actatattct gaatccgggt gatagcattc aggttcgctt 17160
gtggggtgcg ttcacctttg atggtgcatt acagattgat cccaaaggta atatttttct 17220
gccaaacgtt ggtccggtga aagttgccgg ggttagcaat agtcagttga acactctggt 17280
tacatcaaaa gtgaaggaag tgtaccagtc caacgtcaac gtctacgcct ccttattaca 17340
ggcgcagcca gtaaaagtgt acgtgaccgg atttgtgcgt aatcctggtc tgtatggcgg 17400
tgtgacgtct gattcgttac tcaattatct gatcaaggct ggcggcgttg atccagagcg 17460
cggaagttac gttgatattg tggtcaagcg cggtaaccgc gtgcgctcca acgtcaacct 17520
gtacgacttc ctgctgaacg gcaaactggg gctttcgcag ttcgccgatg gtgacaccat 17580
catcgtcggg ccgcgtcagc atactttcag cgttcagggc gatgtcttta acagctacga 17640
ctttgagttc cgcgaaagca gcattcccgt aacggaagct ttgagctggg cgcgccctaa 17700
gcctggcgcg actcacatta cgattatgcg taaacagggg ctgcaaaaac gcagcgaata 17760
ctatccgatc agttctgcgc caggccgtat gttgcaaaat ggcgatacct taatcgtgag 17820
cactgaccgc tatgccggca ccattcaggt gcgggttgaa ggcgcacact ccggtgaaca 17880
tgccatggta ctgccttatg gttccactat gcgtgcggtt ctggaaaaag tccgcccgaa 17940
cagcatgtcg cagatgaacg cagttcagct ttatcgccca tcagtggctc agcgtcagaa 18000
agagatgctg aatctctcgc tgcaaaagct ggaggaagcc tcactttctg cccagtcatc 18060
caccaaagaa gaagccagcc tgcgaatgca ggaggcacaa ctgatcagcc gctttgtggc 18120
gaaagcacgc accgtggttc cgaaaggtga agtgatcctc aacgaatcca atattgattc 18180
tgttctgctt gaagatggcg acgtcatcaa tattccggag aaaacatcgc tgattatggt 18240
tcatggcgaa gtgctgttcc cgaacgcggt gagctggcag aagggtatga ccaccgagga 18300
ttacatcgag aaatgtggtg gcctgacgca aaaatcgggt aacgccagaa ttatcgtcat 18360
tcgtcagaac ggtgctgccg tcaacgcgga agacgtggat tcactcaagc cgggcgatga 18420
gattatggtt ctgccgaaat atgaatcgaa aaatattgaa gttacccgtg gtatttccac 18480
catcctctat cagctggcgg tgggtgcaaa agtgattctg tctttgtaag gagttgaaat 18540
gagcaaagct gttattgtca tcccggctcg ttatggctca tcgcgtctgc cgggtaagcc 18600
gctactcgat attgtcggca aaccgatgat ccagcatgtt tacgagtgtg cgttacaggt 18660
ggcgggcgtt gcggaagttt gggtggcaac agacgatccg cgtgttgaac aggccgtgca 18720
ggcatttggc gggaaagcca tcatgacgcg caacgatcat gaatccggca ccgatcggct 18780
ggtcgaggtg atgcataaag tcgaggcaga tatctacatt aacctgcagg gcgacgaacc 18840
aatgattcgc ccgcgggatg tagaaacgct gttacaagga atgcgtgatg accccgcgtt 18900
gccagtggca acgctatgcc acgcgatttc tgccgaagaa gcgaccgagc caagcacggt 18960
aaaagtggtg gtaaataccc gccaggatgc gctttatttc agccgttcgc ctattccgta 19020
tccgtgtaat gctgaaaaag cgcgctacct gaaacacgtt ggtatttacg cttatcgtcg 19080
cgatgtgctg caaaactaca gccagttacc ggagtccatg caggagcagg cagaatcact 19140
ggagcagctg cggttgatga gcgcggggat caacatccgc acatttgagg ttgccgcaac 19200
cggtccgggc gtcgacaccc cagcatgcct ggaaaaagtg cgcgccctga tggcacagga 19260
actggctgaa aacgcatgat tggcattttc tcgtccggta tctggcgtat tccgcatctg 19320
gagaaatttc tggcgcaacc gtgccagaaa ctttctctgc tgcgccctgt tccgcaagaa 19380
gttgatgcta tcgccgtgtg gggacatcgt cccagcgcgg cgaaaccagt cgccatcgcc 19440
aaagcagcgg gaaaacccgt cattcgtctg gaagatggat ttgtgcgttc gctggatctt 19500
ggcgtcaatg gcgagccgcc gctttctctg gtggtggatg attgtggcat ttactacgat 19560
gccagcaagc cttcagcact ggagaaactg gtaaaggata aagccggaaa tacagctctg 19620
ataagccagg ccagagaagc gatgcacacc atcgtgaccg gggatttgtc gaaatataac 19680
ctggcacctg cgtttgtggc tgatgagtca gaacgttcag acatcgttct ggttgtcgat 19740
cagacattta atgatatgtc agtgacgtat ggcaatgctg gcccgcatga gtttgctgcc 19800
atgctggaag ccgcgatggc ggaaaatcct caagccgaaa tttgggtgaa ggtgcatccg 19860
gatgtcctgg aaggaaagaa aacaggttat ttcgctgatc tgtgcgccac gcaacgagta 19920
cgtttgattg ccgagaatgt cagcccgcag tcgctgttgc gacacgtttc ccgggtttac 19980
gtcgtgacct cccaatatgg ctttgaagcc ttgctggcag gaaaaccagt aacatgcttc 20040
ggccagccct ggtatgcagg ttggggctta accgacgatc gtcatccaca gtccgctttg 20100
ttatctgccc gacgcggttc tgccacgctg gaggaacttt ttgccgctgc atacctgcgt 20160
tactgtcgct atatcgatct gcaaacggga gaagtaagcg atctatttac cgtgctgcaa 20220
tggctgcaat tacaacgtcg acatctgcaa cagcgtaatg gttatttatg ggcgccaggc 20280
ttaacgctgt ggaagtcagc gatcctgaaa cctttcttgc aaacggcaac aaaccggctg 20340
agtttttcac gtcgttgtac tgcggcgagc gcctgcgtgg tatggggtgt aaagggagaa 20400
cagcaatggc gagccgaagc gcaacgaaaa tcactgccgt tatggcgaat ggaagatggt 20460
tttctgcgtt catccggact tggctctgac ctgctgccgc cgctatcgtt ggtgctggat 20520
aaacgcggga tctactatga cgccacgcgc cccagcgacc tggaagtgct gattaatcac 20580
agccagttaa cgctggcgca gcagatgcga gctgaaaaat tacgccagcg gctagttgaa 20640
agtaaactga gcaagtacaa cttgggggcc gatttctctc tgcctgccga agccaaagat 20700
aaaaaaatca tcctggtgcc gggtcaggta gaagacgatg cctctattaa aactggcact 20760
gtgtcgatta agagcaacct tgagttatta cgcacagtgc gcgagcgtaa tccgcacgcc 20820
tacattattt ataaaccgca cccggatgta ttagtgggga atcgtaaggg caatattccg 20880
gctaaattga tcgctgaact tgccgactat caggcactgg acgcagatat tattcaatgc 20940
attcagcgcg cagatgaagt gcacaccatg acatcattgt ccgggtttga agcgttatta 21000
catggcaagc aagttcattg ttacggcctg cccttctatg ccggttgggg tttaaccgct 21060
gatgaacatc actgcccgcg ccgcgagcgc agattaacga tagcagactt gatctatcag 21120
gcgttgattg tttatccaac ctatatccac ccaatacggc tacaacctat tactgttgaa 21180
gaggcggcgg aatatttgat ccagacgccg cgcaagccga tgtttattac ccgaaaaaaa 21240
gcggggcgag taatacgcta ttaccgcaaa ttaattatgt tctgcaaggt cagatttggc 21300
taaacaattt catagttgac tattacgcaa attatttatg caagacaacg cactaaccat 21360
tttattatcg ggtaaaaaat atctgctatt gcaggggcca atgggaccct ttttcaatga 21420
cgtcgccgaa tggttagagt cattagaccg taacgctgtg aatgttgtct tcaacggcgg 21480
ggatcgtttt tactgccgcc atcgacaata cctggcttac taccaaacgc cgaaagagtt 21540
tcccggttgg ctgcgagatc tccaccgaca atatgacttt gataccatcc tctgctttgg 21600
tgactgccgc ccattgcaca aagaagcaaa acgctgggca aagtcgaaag ggatccgctt 21660
tctggcattt gaagaaggat atttacgccc gcaatttata accgttgaag aaggcggagt 21720
gaacgcatat tcatcgctac cgcgcgaccc ggatttttat cgtaagttgc cagatatgcc 21780
tgcgccgcac gttgagaact taaaaccttc aacgatgaaa cgtataggtc atgcgatgtg 21840
gtattacctg atgggttggc attaccgtca tgagttccct cgctaccgcc accacaaatc 21900
attttccccg tggtatgaag ctcgttgctg ggttcgtgca tactggcgca agcaacttta 21960
caaggtaaca cagcgtaagg tattgccgag gttaatgaat gagctggatc agcgttatta 22020
tcttgccgtt ttgcaggtgt ataacgatag ccagattcgt aaccacagca attataacga 22080
tgtgcgtgac tatattaatg aagtcatgta ctcattttcg cgtaaagcgc cgaaagaaag 22140
ttatttggtg atcaaacatc atccgatgga tcgtggtcac agactctatc gaccattaat 22200
taagcggttg agtaaggaat atggcttagg tgagcgagtc atatacgtgc acgatctccc 22260
aatgccggaa ttattacgcc acgcaaaagc ggtggtgaca attaacagta cggcggggat 22320
ctctgcgctg attcataaca aaccactcaa agtgatgggc aatgccctgt acgacatcaa 22380
aggcttgacg tataaagggc atttgcacca gttctggcag gccgatttta aaccggatat 22440
gaaactgttt aagaagtttc gtgggtattt gttggttaag acgcaggtta atggggttta 22500
ttatggggag atgattttta acaagataaa actggataaa tattttcaga gcttgtcgcg 22560
tcaagtatga aatataataa taaacaacac aaaacaatta ttaaaatgat gccattttaa 22620
tattacaaat ataaacaacc cccatccaca agccaagtta aaaatccaag atgtaatttt 22680
gtcattatct ataaatgata caagtataat ctatacgcta atcaattatt tttgtagaaa 22740
atttatttta ttagtattca cacgaaaata tgacgaagtt attagcatta cacatttata 22800
atcatcaaat attgttacta tcatcactcc tcaataagtt tatctaaagg aatataatat 22860
aattgagcaa atcttttttt atgatcccca agagcaaaca tgataaccaa tgattttgat 22920
ttgcgatcaa tagctaaacc ttcaggttcc caatgttttt ctttgccact gttaagagaa 22980
tcttttttcc ctactgttac attattaaac tttcttacaa gctctccttt taacgtgtaa 23040
atatagattc ttttgttttc tctattccct cccccactca acaaatatat atatttatta 23100
tcagcggtaa tggcttgcaa tacataatta tcattggtta aacctgcatc gataaaccat 23160
tctgtatttt gttctgatga aatatcactc tcgattcgaa agttaacttc ttcactatta 23220
tagactctta ataagtctct accattcaac ttacttctta ctattaaata tttagcatct 23280
aaggttaaaa caggcattgt actaacacga gtattatatg gtctatcgaa tacttttgta 23340
aatttcatat catacggaaa cgtttgctgc tgatatttaa agtgcgtgat aaaccatccc 23400
ttgtaactaa atgcatcacc agccgaagaa actaaatacc cattgctata atcaaaagtt 23460
aaaccttgat gaccgataaa atccgtagga ttctgaaaag aacaagccgt aattttatta 23520
gattcgtcaa caagcaaaaa ataatttaca actccttttt ctggtttccc tgttacatgt 23580
agtgtgtata gaccatcagt tttatcatca atcacaagac cttgagtaac gttattctta 23640
cctttcccca accgatgtag ctttattttt ttaaatatat aattatcatc tataataaca 23700
tctttatcag aagtgatgct tgccttaaca ttaaaacaca acaataacaa caacaagaga 23760
tataaattct taatcgcatt cataaaaaat aatcatcatc ctgacaacaa gaatatttta 23820
atatattgac tctaggagtt ttgtctttat tttcttatct tcatacacat aattacatag 23880
ccattgtatt ctctcagaat atgttttatg ttttaacgta ggcagggaat aagatatcat 23940
gtaatcaatt atatcattag ggcatgatgg aatacttgaa ttacacacca ccttatcaaa 24000
taaaatattc ttataaaacg gcagcattct tttggggata tgtattcttt ccgccttgtt 24060
ttcttttagc actacgctac atggaattct tcgagagtga aactgtacct ccatagcaga 24120
aatatcagta attgcaaatg aaacgccgat attttctacc tttttttttc tgcctttcca 24180
aaaaacaaaa taataatatt gtcgtacaaa tccatcctct accaagaaaa cagttaaatt 24240
tgatctcaaa aaaaaatcaa tgcattcatt caaataatat cgatactttg catctctatg 24300
tcctaaatta ggatgaggtt gtataaaaat ttttttaatg ttattttttt tacagaattt 24360
atctatgttt tttgcgatag acatactaat cgagcaataa ttttcttccg gaactccacc 24420
ctcccatgta ggggcataga caagactatg cgaatttgat tcgtatttaa aaatattgct 24480
accgataaaa gtatcgccta attttagcac tttcccattg ttgatatcgt actgagtgaa 24540
tatacctgat ttcaaatatc tatcaactcc aacatcacct gatgtaatta catagtcgta 24600
gattctaata attggtttaa cagaggctag cttatgactc tcgccgtgag ttacaaaaac 24660
atggataaga tctctattgg ctacgacacg acaattggac tgtgcattaa acaaataaaa 24720
tacaatcttt cccttgataa aggatagatc tgaatttttt ttaataaact taaacgttat 24780
attatgttta ttaaatacct cgacagctaa atgttctatt tccttataat atttacaaaa 24840
aacactaata caatccttgt tattaaatac ttgtgattga aagtaacgaa taagttgctc 24900
aaatgcacct tttatctttg tatctatata tatataatat aggctattat tggacataat 24960
gtatgcccct tgtatttatt gtcatattaa catctattta tttatgatat ctcacagggt 25020
ttaatatttt ataaatgtta ttaacaagac cagcaggttt atctttaaca attataaaaa 25080
cacaaaccaa taactattgg tgcaatttat ctggagcaat gctatttaaa atcttattct 25140
taataaaaaa tgtagtaaaa tcttgtaaaa aataaattta taatgcttta tggaaaacct 25200
aaatgaaata tacattcatc cattttttgt taagaatatt aaattacaga tcgtttatta 25260
aaataactaa aactcaaaaa cagtcatgtt ataagtaaaa cattgataat tacatgttat 25320
attaggccat gataaataaa cataatttaa ataaggtagt agcataatga aatttatagt 25380
actaatcatt tttgtttact tattaacttt aatgattaat catttatgat tactatctgt 25440
aaaatgatta ttagccacta cctgtgatat agcgtttgtt aattgcccac cggttaatta 25500
acacccgtat aattctctat caattacaaa tcatcttcca tctttacgga tatcaacaat 25560
aagccctgtt ctgtttgagc ctaacacttt aaggcttgta agggcaacat ctttggggtc 25620
aagaagcaag tcgcttggtt caacgccaaa attcgatgtt ctcatcggtg ttgcagttct 25680
ttctggatta atacaattaa cttttatgtt gtctgaggtc cattcttctg caattgcttg 25740
ggtaaagttt acaattgcag ccttcgaaga tgaataaaga gcataataag aacgtccacg 25800
agtatacgaa cttgatgtaa aattcaatag catccctgaa gattttttta aatatttttt 25860
tgcagcgata gctatattaa cagcgccaac ataattaatg cctattagag aattcacttc 25920
attaaatgta agtgcatcaa ttggtttctt tatcaaaaca ccagctgtat ttattatata 25980
atctattgat cccaactttt cattaacatt attaaggaag tgttctatat tctcgatatt 26040
agcaatatca acattattga aagaacgact tgcaacttca acatttgcgc ctaataaaat 26100
tgcctccttt tgtatttcca atccaatacc actgttccca ccaaagatga caatattttt 26160
ccctttaata aaacttaaat catcacctgt agaaaaagat attttattcg cttcctgggt 26220
aatgactcca acttattgat agtgttttat gttcagataa tgcccgatga ctttgtcatg 26280
cagctccacc gattttgaga acgacagcga cttccgtccc agccgtgcca ggtgctgcct 26340
cagattcagg ttatgccgct caattcgctg cgtatatcgc ttgctgatta cgtgcagctt 26400
tcccttcagg cgggattcat acagcggcca gccatccgtc atccatatca ccacgtcaaa 26460
gggtgacagc aggctcataa gacgccccag cgtcgccata gtgcgttcac cgaatacgtg 26520
cgcaacaacc gtcttccgga gactgtcata cgcgtaaaac agccagcgct ggcgcgattt 26580
agccccgaca tagccccact gttcgtccat ttccgcgcag acgatgacgt cactgcccgg 26640
ctgtatgcgc gaggttaccg actgcggcct gagtttttta agtgacgtaa aatcgtgttg 26700
aggccaacgc ccataatgcg ggctgttgcc cggcatccaa cgccattcat ggccatatca 26760
atgattttct ggtgcgtacc gggttgagaa gcggtgtaag tgaactgcag ttgccatgtt 26820
ttacggcagt gagagcagag atagcgctga tgtccggcgg tgcttttgcc gttacgcacc 26880
accccgtcag tagctgaaca ggagggacag ctgatagaaa cagaagccac tggagcacct 26940
caaaaacacc atcatacact aaatcagtaa gttggcagca tcacccgctt cctgaagtaa 27000
tttttctgcg ataaaaagat caataggttg tgttactttc atatttgctt cagtccccat 27060
gactgtagca acccggacac caggtaccat tgatcgaaca acaccacaat cacacgtaaa 27120
actaaaccgc ttttcagcaa ttgcacgttg atatgccaat tttattgttc ctaacttaaa 27180
tgcttgtggt gtttggcccc gccgcattag tgcgcgattt ggtatattag aaatacatcc 27240
gtcatcatag acctcgacta aggtatctgc cgatggaata acaacatcta cagcctcaaa 27300
aattttcagg gattcgatac aattactaat tattgtctca tcgattaatg gtcttacagc 27360
atcatggaaa aggatattgc aattatcgtc ttcgccttcc aagccttgta acgctgaata 27420
tgttgaatca aatcgctcct tccctccatt aaaaattttt gtaactttat tccattggtt 27480
tttcttcaca taatcccatg tcagttcagt gtaatttggt tgtgaaacta taataatttc 27540
atcaattaac tctgttcttt cgaaagcatc gatagtatat tctataactg ctcttcctgc 27600
taactttgta aactgctttg gtaaggttcc tccaaatctc gcacctgaac caccagaaag 27660
aataacagca atatttttca tattaaacca ccttattttt attgaatgac aaattcacgt 27720
ttattttctt tttctgaaac agttgaactt attctcttaa gctcacttaa aaatgcatcg 27780
tttactgttt catttacact caaaagataa tctaatgctt tatatctggc ttcagctaga 27840
tgatcattcc cattaataat tatgttttct attagttgca tcaactgctc tatatttgaa 27900
aaggtgtatg cataatcaga ataatgcata tcacttccag aagtaatcac attacgatct 27960
tcaggaatat aaatgaaaat tggagataat gaagatatac attcacttac tacagctgaa 28020
atatcacaaa taaacaaatc actgttaaca accaagttgg gtatcggttc tgacttgtta 28080
gcaattgaaa gcatgcaaga acgatctatg aaactatttt gtaatgcatc ttggatcgtt 28140
tctaatgttt tatctcgtga gcctgtaagt ggatggtatt tagctactat tttacaatta 28200
agtttttgtt gtaattcaga gagaaatata ggtgacaatc tagctgatga ataattattc 28260
tcctcaaaag caccttccca tgttggaaag taagttagtg ttttaataat atgttctgtc 28320
acattattat tactaacaga ttgttttaca atttgcttta aggaaggacg ccctacttta 28380
acaaacttta tatgttctac attgaatcct gcatttttaa atctatcaat atgtgcctgc 28440
cctgctaccc aaatttcatc atacacccta aaaaacttat gcgcacttgc tgctttatca 28500
ctatcgccat gtcctaaaaa tatatgttgg taaatattat atcttagagt atgaatcaaa 28560
ttaccagtat tagaaagata gtaaattgct ttaagatatg gtaactgatt cagaacctgt 28620
tccactgcga tggctgactt tgcatacaca atatccacat tgggatattg tgtaatagcc 28680
caattataaa gattaatgtc tctaattaat aatgcaaacc tttcatttga ggctataaat 28740
tcaccgatcc attgttcaat atgaaatgaa caatttatac cttctcccgt atgtatcaag 28800
tggtttattt ttgtaaacag cctaatgttt gttgtaatca ttttaggttc atttttagct 28860
aagttattag taatgttttt tttcttatct ttttcagcca acttaggtgt ttttgaaaca 28920
atattgactt tttctgattt atcaggttgt tttttattat ttgagtcttt tattgtatcc 28980
ccacgtcttt tcttaatcat atctctgaag aacatatcag gctttgttac taacttgctt 29040
aactttgaca agctccaact ccttttcaaa aacaattaat gctttaaaat atgaatgcat 29100
aaaatatttt tatcttaaga tgtgacatct aataaaaata ccattacatt ttacattttt 29160
tagctcaaca aaggcatact catcttattt tactatacac aattaaagtg tatttttata 29220
atataagata aatgctttag atcgattttt taataactct tttttacatc atcaatatat 29280
gacttatggt aatggattta atataccatc acacctatac tcctctatcc cgccctgaac 29340
atcttcataa aaactaaccg cgttatcatt tttaaataca atggccacat cgcaaaactc 29400
tttcaatgaa ttcaaactat gtgaaaccat taaaaaacta gattctttat gcctttcttt 29460
aaacaattga gcgcattttt ctttaaacct ggcatcaccg actgcggtta cttcatcgac 29520
gatataataa tcaaacttaa atgccatgct taaaccaaag cctaaacgcg atcgcatacc 29580
agatgagtaa gttttaatcg gcatatcaaa gtacttaccg agctcggcaa attcttcaac 29640
aaactcaatt ttctctttca gttcttcttg cttcgcgtat aaccgcgcaa caaattttac 29700
gttctcgcgt ccagttaaac ttccctgaaa tccaccggcg aggccgactg gccatgatat 29760
tgttttattg gtgatgatct ttccactgtc ggggcggtca ataccaccaa tcattcttag 29820
caacgttgat ttacccgcac cgttgcgacc aataaaggca acgctttttc ctgaagggat 29880
ttcgaggttt aaatccttaa acacatagtg tcgccccgtt ggggtacgat atgactttgt 29940
caaattctca atcttaatca tgatgtcagc attgcctcct cacgagttcg gtataaagcc 30000
agaccaatga acagagttat caatgtgaac attgccaggt agttcagact tacgccttcg 30060
ctgatatagc caggcataac agcctcgcgg cttagctcca ccacatgtac taatgggttc 30120
cagagtagat atgaccagta ttgctttgga atcgagtgta gagggaacat gatgcaggag 30180
atgaaataca gcggcttaag cagtatcggc agaacctttt gcatttcggg gaaggtttta 30240
ccaacgacca tgaatattaa gccgacgcca catgaaagaa tgatcagcag gctccaggta 30300
gccacaagtt gtaaaaaatt tgttatctcg aaatattcgc ctgccatcca gacaatgagc 30360
ataagcagaa tataaacagc aacgtaaatc agtgtctcaa gcagtgcgcg tgcaatgatc 30420
gtatcgatgg gttttactgg tcgataatta aacaacccct gattcgcttc aatagcacct 30480
acagaacgat tgctgatact gctaaagata aaaaagggaa tcaggccatt aagtaaaaac 30540
accgggaatg agatgtctgg catcgtgcgg tgcataatgt aaccaaaaat gcccaacagt 30600
atcagcaaat gcgcagaggg ttcgagaatc gcccacaaat atcccagacg gaacttacca 30660
aagcgtgttc gtatttctcg tagaaataat gcctctacgg tgactttctg gacttcaaat 30720
ccacttcttg ccatttgatg atgtgatcct aatctcttca ggtacgctac cgcccctggc 30780
ttaacagcta ccaatacact ggaggtaata cttgacttgt ttgtaactgg ataaaattca 30840
ttcggacggc ttgacctttt aatagccaaa aacaatttca gcagaaatta tttccgcagg 30900
gataaataga tctatttccg tctcgtttct tctaatccat tcttcaggca tgaatgtatt 30960
cggtcttctg gtaatttcag aaaactggcc gttttagaat gcagagttaa tttctcagga 31020
aattattttt tgtgattact gttaactact tgattataat atcccctatg gattttatgc 31080
gtaacaatac ctacaatctg tttcaaacca gaacgcacgc gattgattac caataaattg 31140
ttcaccgaga aactatttcc ctatttaaaa ttcactcgtg tacttcttat ttatatctac 31200
agccccctct ttacagccat atttgtgatt catatcacat ttaaatggtg ttatttaagt 31260
cgcatcaata atcccgaagg taattatttt cgtcgattaa aatatacatc ttgattattt 31320
tgtgtgttta ttttaaccag tgttacaacc aacaccatcc ctcagtagat atacctgagc 31380
agacatttct taaaatcaac gaatagtttc actggaaatt attatgctta tttgaaattc 31440
cctttctgat tatctccagg aattttacta atttccaagc tacacaaaat acagatcaca 31500
caagaattat cctatatgtt ttggtctatc aattgttact caatgattta ttgcaactat 31560
taataatcat aatgtgtcaa aacacttaag caactttaca gtctgagaaa ggtgtcgatt 31620
aacgaaggct acatggtgaa aaacaggttc cttcagtgtt accgaatatt ccgtggtggt 31680
ctggagggag ataattcttg ctacatcgaa actcagcccg gtaagcgggt ttgacagttc 31740
cgcactcacc attgggctaa gggttatcag gtggggttaa ggaaatggca atacctaccc 31800
ccgtccaaat tccagtcgct gcacattcac catcccaggc ttctcacccg cactgacatc 31860
aatttgtgtc acccgcagcg catatttttc atccagtgcg tttaaccatt tcagcaggtc 31920
attaaacacc acaggttcta tccagacctg aatattctcc ccacgctcgg ctattcgctt 31980
gatgaccaca gagtgcacgg aagcactatc gctgatgacc cgcgatacct gcgcaggcgt 32040
tgttgtggca gattttcgcg ctgcaataat atccggcgcg gcgctcttca gtcgcgcgtt 32100
catcgccacc agctgctgca acatcgtctc ctgttgctca atccgttcgc tcaacggctg 32160
ccagatgaga acgtaatatc cggcgctaaa caggaacact accgctgcca gtaacatgcc 32220
tttttcacgc ggagaacgcc ccgccaggtg ttgtgtcagc cagtgttcgc cacggcttaa 32280
ctggcgttca cgccattgct gaaaatagtg aataaattta tcgcgtaaca tgttatttcc 32340
tccgcaacgt tacgccgccg gaaaccgcat caccatcttt ctgtaacgcg tcctgttgca 32400
caacataatc tgccgccagt gcgctacgca gtttgtcgaa gctggcaaag ttcgcagccc 32460
gtagctggag gtgaagcgtc tggcgttttt gatcaaaggt gaaaccacgc atttcgatgt 32520
cggtaagtga cgctgatttc agggtactgg cgatcgctga caattctgcg agcagccggg 32580
tatcgtcggc ctgtgggcga tattttttca gcgccatcgt cacctgagag cgtaaattca 32640
caatccgctt ctgctccggg aatagcgtta agaactgttt ctccgcctgg gtgcggcttt 32700
gcgccacctg ttcgctgacg ctccataacg tcacgccccg ttccactacc agcgcaacca 32760
gaatcagcaa tatcggcaga atcatcaccc gccagcgcgc ccactgtttt cggtagctga 32820
cacgaggctg ccacggccct gttagcaggt tcccttccgg ttcgccataa gtggtaatgg 32880
ctggcagagc cgtaacggtc aggcgttcgg cgtccgcacc agcccatgca gatagttctt 32940
ccggtgcaat gccgaccacg gttagcgaaa gcggtaaatt ctgctcattg agctgtgcgc 33000
ggaacatgac cggagccagc gcccgcccgg cgctccatcc ccggcattca tcgatgcggc 33060
agataacccg ttgcgcatcg ccagccataa acccacaagg aatggacatc cagtccggcg 33120
cgacggtagc gtgggtgatg ccgtttgcct gcaaccattg cgcaatgttg cgcatatgct 33180
gctggtgaat cacagctacg gttgccagtt gctggtcgat tttcaacggg gcgaaatgca 33240
gttcatcgat atcctggttc agctcttctt ccagcaaggc gggcagaatc gtcggtatct 33300
gcttacgggg cacatcaggc agttcaacct gccagacgct gatccattcg ccgggaatat 33360
agagtcgaat cgcatcagtt tgcagccatt gctggagaca ttcatcagca acgtcaggcc 33420
agatgccgca ctccacgtcg gcggtacgac gctgccaacg gatgggagcg gaagcgcaaa 33480
gcgggaaaaa aatctcaagg atggaactca ctcactttct cctgtctgat gccagagaac 33540
agaaaagtgt tgtgggccca tgcggacaat taacgaattc atcgtcagtt caatctcatt 33600
cacggtgata tctgaacgca gccagaagta attgctgtcc acgctcagga cggtttttag 33660
ctgtttttta gtacgctcat cgacgtcagc gagtagcggc tgtgcaagaa actgatcgac 33720
atcttcccag cccttcgccg gacgttgttg taataacacc cgcgcctgaa cagggcttaa 33780
ccacgggtca aacagcgcct caagaatcac actttgcgtg acgtctaagg tattgatgtt 33840
gatttgctgg cgggtcatcg gcagcgcaca gaccagcggt ttcagttttt gataaagccc 33900
ggcgtccatt ccctgtacca cgcgcatctc actgatatcg gccagcggtt gattggcggc 33960
gtagaacggc accgagcggg cgagatactc gctgtcttca cgccccagac gcgtctgcac 34020
gctgcggtct tcgtcaataa actcccacag gctttcggct atcagttcgg cccgataagc 34080
aggcacatcc aggcgcgtga tcagggcaat cagttgttgt accgcgatag gacgcgacgc 34140
cgtcgtcggc tgagcgagag cattcaggtt aaagcaggcc tgtgcgtcac gcagagtgac 34200
ggcgatttgc ccctgcggca gtgggaaaaa acgagggccg gaagcccacg gctgcgccag 34260
atgcacgcgc ttttcatttt tcaggctcag actgagtgcg ctcaacgcca ggctttccgc 34320
actggcgctg taccacagcg cctgctggta ctcctgctgg ctgcgcgttc gcccaagttg 34380
ttgctgcatt cgcccggaaa gcgtgatggt caccagcatc ataaccgcca gcaataccag 34440
caccacgacc agtgccattc cgcgttttgg tggtgaggtg atcatgataa ttgcggcccg 34500
cgtaacaacc agatgcgttc aatttcgccc cattgcggcg aatgcagggt tatgcgtacc 34560
gccacaggga tcgcctgtac tgacgaccag ctctcctgcc agcgcgtgcc gtcgtagaac 34620
tgcaaacgga gcgaatccgc cggaatcaac ttttgcattg tcggcttcac gctgcctgct 34680
gcgtcggtca gcggccaggc taaccgttcg agatagccgt catgaatgcg gtaaccgacg 34740
gtgagcagat tactgcgtgg cagacgcatc aacgggttaa ccacaccgcc gcgcacaaag 34800
cgcatccctt cactctcaga cgccagcacg ccagcgccag ccagtaacgc tggttcacgc 34860
tggccctgat cgtctcttac cggacgcggc atcatttgtg tcagatcgtg ggtcagaaaa 34920
ctcatcgttt gctgcatgag gtttagtttt tgatcgtgtc cggcgacggc gctattcacg 34980
cgcgtgacgc cgttagtcac ctgctgcgcc atcagtgcca gcgaggcaaa aatggcaatt 35040
gccaccagca tttccagtaa cgtgaaacca gcgcgagccc ttctcactgt tggcctccca 35100
cggcgctaaa ccaggcgcgt cgtgactgaa tcaccggcga aaagtcttcg tgaaggctga 35160
cttcaatatc caccgcctgg agcagcgcgt tgcctgtact cagcggtgtg gttcgccagt 35220
accagcggct tcctgccata tcgctctcgc cctgatgcct gaccgcccgc tgctcgcggg 35280
tcatcaggta gagcagcgcg gtctggtttt cagccaccca ccccgctacc gttttttcct 35340
caagaacgtg ctgattactc agcgcgccgc tggcaatctg taacaccgcc gtggcagcca 35400
gcgcaaaaat cgccagcgcg agcatcactt ccagcaaggt aaatccgcgc ttcatcgcat 35460
cctctcatca cattgattga gggataacgc gccatcgtgt gccagtttta ccgcccaaca 35520
tgcgttttgc gccgccgagt agaagcgcag cgtaaacggc gtggcgggtt caaaaggcga 35580
aaaacggatc tgcggcgtct tctttttcgc ctctttttgc agctccagtt caatatcgtg 35640
cagcgtcagg cgacgacgct gcagctccag cgcatattcc ttctgccaga tatcacttcc 35700
gggttgtaac agcatctgca cctgtttcgg caccgtaacc tgtgccgata accgggtcgc 35760
agaaacgggc aaccactgcc cctgacgacg ctgcataaac tggtatcccg gcgggtcgat 35820
tagtacaccg agtgtctgcc cttcgatcac tgccctgtct ttaaactgcg caaagcgagt 35880
cagaaaatcc tgcgccgctt ttttcgcggg cgattcagaa tcggtcgcaa aagtctgcac 35940
cacgcccgca ctggcaaggc cgataaggaa aatcaccagc atgatttcca gaagtgtgaa 36000
tccgcgttca ggcactgatt actgaaactc ctgcaaattc cagttaccga tatctgcgcc 36060
agcgccctcc ccgttttcct gaccatctgc ccccagggta taaacatcaa acagtccttt 36120
ttcacccggg ctgagatact gataatcatt gccccacgga tcttttggca gtcgtttaat 36180
gtatccaccg gtacggtagt tgcgggagtc cgccatattg gccggttgct ggatcagcgc 36240
ctcaagcccc tgctcggtag tcggataacg cccgttatcc agtcggtaca tatccagcgc 36300
attctccagc gccacgatat cgctgatggc tttttgccga tcggctttct ctttgttgcc 36360
cagcaggtta ggcaccacca gacttgccag gacgccaaga ataacaatca ccaccatcac 36420
ttccagcagg gtaaaacctg cccgtggttt ttgtgtgcgg gataacgaat tcatgtgata 36480
actccgtaaa ttacattcca accatattgt tcagttgcag catcggctcg aggatggcga 36540
tgacgataaa cagcaccacg cccgccatca tcaccaccag cgccggttca aacagcccta 36600
acgccagccc cacctgggta tcaaattccc gttcctggtt gactgcggcc tgctcaagca 36660
tggtttccag ttcgccgctc tgttcgccgg aggcgatcat gtacagcatc atcggcggga 36720
acaggcgcaa ctccgccagc gcagcgcgca gactgcttcc ttcgcggacg cgatctgccg 36780
ccagcagcag ttgttgttcg acataacgat ttgccgacac ggcggcggcg gtctgaatgc 36840
cttccagcag cggaacactg ctggcggtga ggatgcttaa tgtgcgggaa aaacgcgccg 36900
tattcagtcc gcgcgcaaca cgccccgtca cgggcaaacg cagcaaggtt ttatcccagc 36960
gcaggcgcat cgcaggattt ttgagtagcc gttgccccag caccagaagc cccagcaaac 37020
ccgccagcca gtacacgccg ctggcctgta acgcgtcgct catggcgatg agcgtgcggg 37080
tggaggcagg cagcgcgtgt ccgagatgat caaactgttc gatgattttc ggcaccactg 37140
ccgtcagcaa aatagtgact acgcccgttg ccaccaccag caataccagc ggataaagca 37200
tggcctgcag caggcgagat ttcaggcgct gtcgctgttc ggtgtaatcc gccaggcgat 37260
tgagcaccac gtcgagatgc ccggattttt caccggcagc aaccatcgaa caaaacagag 37320
aatcaaagac gcggggatgt tcgcgcaggc tgtccgacag ggtgtaacct tcctgaatcc 37380
ggctgcgcag cgccattccg aggcttttta catgcagttt ttcactttgc tcactgaccg 37440
cctgtaagca ggtttccagc ggcattgctg cctgtactaa tgttgccagt tggcgtgtga 37500
acagcgccag atctgccgcc gccacgcgac gatgtgcgtg ccgccgacgc tgcaacatcc 37560
cccctgccga tgcattcatc cgggcttcaa tgtgcacggg aatgaggtct ttaccacgca 37620
acaattgacg ggcatgacgc gcggaatccg cctcaatcat gcctttggtt ttgcgaccat 37680
tacgctccag cgcctgatag taaaacagtg ccattacgcc tccatggtta cccgcagaac 37740
ttcatcgaga gaggtttctc cggcgagcac tttctcaatg ccattgctgc ggatgcccgc 37800
agagtgttgc cggacataac gttccagctc cagttccccg gcctgacggt ggatcaaatc 37860
acgcaatgtg gcgtccacca cgatcaactc atggatggca gtacgcccgc gaaaaccttt 37920
gtgattacag gcgggacagc cctgtggatg gtacagagtg acggtacggg cgtcggtaat 37980
tcccagcagg cgtttttctt cgtcagtggc aggcagggcc tggcggcagt cggggcacag 38040
cgtacggacc agtcgctgcg ccatcacgcc cgtcagactg gaagagagca ggaaaggctc 38100
tacccccata tcctgcaaac gcgtaatcgc ccccaccgcc gtgttggtat gcagcgtgga 38160
aaggaccagg tgtccggtaa gtgaagcctg gacggcgatt tctgcggttt cggtatcgcg 38220
gatttcaccg accatcacta catccgggtc ctgacgcaaa atcgcgcgca ggccacgggc 38280
gaaggtcatg ccgacgcggg tgttaacctg tgtctgaccg atcccttcaa tcatgtattc 38340
gatgggatct tcaaccgtga gaatgttgcg cgaatggttg ttcagctcct gcaatccggc 38400
gtacagcgtg gtgcttttgc cggaacctgt cggccccgtc accagaaaga tgccgtgcgg 38460
tttgtgtaac agctggcgca actgcgcagt cagttcgtga cttaaaccca gacgctccag 38520
cgtcaggcgg gcctggtttt tgtccagcag tcgcagcacc acgcgctcgc cccaggcgga 38580
aggcatggtg gagacgcgca cgtcgatcgc ccgaccgccc agcagcagcg caatacggcc 38640
atcctgtggt acgcgctttt cggcgatatc cagacgcgcc atcaccttga tacgcgagac 38700
cagcagcgag gccagcttgc gaccggggcg caacatttca tgtaatgtgc cgtcaacacg 38760
aaaacggatc accagactct tttcaaacgt ctcgatgtgg atatccgaag cgccttcttt 38820
aatcgcctct gccagcatgg cgttgatcag tttgatgatc ggcgcatcgt cgtcactttc 38880
cagcagatct tccgtttccg gcagttcttc tgcgagggta aaaaagtcct cggcagaacc 38940
gagatcttcc atcagttggc gagcctcgga agagtcccgc tgccagaccg cattcagccg 39000
ctgttcaaat tcggcttcgt cgatttgccg cagcgtaaag ggcgcgttca gcccccgctg 39060
cagctcctgc aaaacagaga gcgacaacgg atgaacatgg aggatctcca gcgacgcttc 39120
gcaccatgcc accaggctaa accgacggct gaaactgtag ggcagacgca cggtgttagc 39180
agtggtttcc tgtgctacag gcaccattaa cgcgttctcc cggcattgag gaatgcgcga 39240
acttccggcg gtaaggcctg gttttgcgct ggcagtaccg gctgcgcggt gtgcggcatc 39300
aggcttaagc cttgctcatc gcggtagatt tgctcggcgc gcatgtagtt atatttgcgc 39360
tgcgacacgc cgtctgccgc cataccgtca cgcagaatgg tcgggcggat aaacaccatc 39420
aggttacgtt tttctttttt atccgccgtc gatttaaaca ggttaccaat caacgggata 39480
tcgcccagca gcggcacttt cgccacgctt tctcctgcct gatcatccat cagaccgcca 39540
agcacaatca gctcgccatc gttagccagc acggtggtct tcagtttgcg ctcaccaaac 39600
acgacgtcga ggctggtctg tccttccacc ttcgagactt cctgctcaat caccatctgt 39660
accgcgtttc cttcgttaat ctgcggcgtg actttcagca tgatgccgac ttttttcctc 39720
tctaccgtat tgaaaggatt gctgttattg gagccaacgg tagatccagt taataccgga 39780
acgtcctggc ccaccatgaa gaaggcttcc tggttgtcca gcgtggtgat gctcggcgtg 39840
gagagcacgt tagagctgga gtcgttttta accgcctgca ccagcgccat ccagtcgcct 39900
ttcaccacac caaccgccgt accgctaaag ccggaaagaa gctgagcaag cgtggagaga 39960
tcgccgttag tatccggatt tatggtggta gcgccgtttt cactgattac cgtcgagcct 40020
ttctg 40025
<210> 28
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-大肠杆菌-f1
<400> 28
acgacgttgt aaaacgacgg ccagtgaatt ggcgcatgct atttttttcg ctagcgtgga 60
cggacgcatt gcacc 75
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-大肠杆菌-r1
<400> 29
cgtacaaatc atcgcaccca aatcc 25
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f2
<400> 30
tggaacggtt taatcaggcg atg 23
<210> 31
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r2
<400> 31
cactttaccg ctcacgatgc c 21
<210> 32
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f3
<400> 32
gatgatgact aacggcttcg gctg 24
<210> 33
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r3
<400> 33
atgatcagta atggaatgct aatcaccg 28
<210> 34
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f4
<400> 34
tgctcgttgg gtattgcggt g 21
<210> 35
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r4
<400> 35
gagcattgcg ttcaggatgg tc 22
<210> 36
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f5
<400> 36
ctggttgact gtatgcgtaa attgctg 27
<210> 37
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r5
<400> 37
catacggttt agcttgtcac cctgc 25
<210> 38
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f6
<400> 38
gacgaagaaa aaagcaaaat cacagcg 27
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r6
<400> 39
ccgggaaacg tgtcgcaaca 20
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f7
<400> 40
tttgattgcc gagaatgtca gcc 23
<210> 41
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r7
<400> 41
gagatcaaat ttaactgttt tcttggtaga gg 32
<210> 42
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f8
<400> 42
tcgtacaaat ccatcctcta ccaagaa 27
<210> 43
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r8
<400> 43
tttctaatat accaaatcgc gcactaatg 29
<210> 44
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f9
<400> 44
atgcttgtgg tgtttggccc 20
<210> 45
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r9
<400> 45
ctctgttcat tggtctggct ttataccg 28
<210> 46
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f10
<400> 46
tgtcagcatt gcctcctcac g 21
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r10
<400> 47
ttcgccccgt tgaaaatcga 20
<210> 48
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f11
<400> 48
tgaatcacag ctacggttgc cag 23
<210> 49
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-r11
<400> 49
gatatcgtgg cgctggagaa tgc 23
<210> 50
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-f12
<400> 50
gttatccagt cggtacatat ccagcg 26
<210> 51
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pCCI-大肠杆菌-r12
<400> 51
atttgattct gtgcgatagc gcccctgtgt gttctcgtta tgttgagtta attaacagaa 60
aggctcgacg gtaatcagtg 80
<210> 52
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-大肠杆菌-f1
<400> 52
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattcgaga ctagtgtgga 60
cggacgcatt gcacc 75
<210> 53
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pUC57-大肠杆菌-r6
<400> 53
cgatccgtcc cctcagccta tgcggatccg atatctagat gcattcgcgc ccgggccggg 60
aaacgtgtcg caaca 75
<210> 54
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-1 (pCCI)与大肠杆菌-2之间的同源臂序列
<400> 54
tggaacggtt taatcaggcg atgatggatt tgggtgcgat gatttgtacg 50
<210> 55
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-1 (pUC57) 与大肠杆菌-2之间的同源臂序列
<400> 55
tggaacggtt taatcaggcg atgatggatt tgggtgcgat gatttgtacg 50
<210> 56
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-2与大肠杆菌-3之间的同源臂序列
<400> 56
gatgatgact aacggcttcg gctgtatcct cggcggcatc gtgagcggta aagtg 55
<210> 57
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-3与大肠杆菌-4之间的同源臂序列
<400> 57
tgctcgttgg gtattgcggt gtcggtgatt agcattccat tactgatcat 50
<210> 58
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-4与大肠杆菌-5之间的同源臂序列
<400> 58
ctggttgact gtatgcgtaa attgctgacc atcctgaacg caatgctc 48
<210> 59
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-5与大肠杆菌-6之间的同源臂序列
<400> 59
gacgaagaaa aaagcaaaat cacagcgccg cagggtgaca agctaaaccg tatg 54
<210> 60
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-6与大肠杆菌-7之间的同源臂序列
<400> 60
tttgattgcc gagaatgtca gcccgcagtc gctgttgcga cacgtttccc g 51
<210> 61
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-7与大肠杆菌-8之间的同源臂序列
<400> 61
tcgtacaaat ccatcctcta ccaagaaaac agttaaattt gatctc 46
<210> 62
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-8与大肠杆菌-9之间的同源臂序列
<400> 62
atgcttgtgg tgtttggccc cgccgcatta gtgcgcgatt tggtatatta gaaa 54
<210> 63
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-9与大肠杆菌-10之间的同源臂序列
<400> 63
tgtcagcatt gcctcctcac gagttcggta taaagccaga ccaatgaaca gag 53
<210> 64
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-10与大肠杆菌-11之间的同源臂序列
<400> 64
tgaatcacag ctacggttgc cagttgctgg tcgattttca acggggcgaa 50
<210> 65
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-11与 大肠杆菌-12(pCCI)之间的同源臂序列
<400> 65
gttatccagt cggtacatat ccagcgcatt ctccagcgcc acgatatc 48
<210> 66
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-1 (pCCI)与pCCI-Brick-crt载体片段之间的同源臂序列
<400> 66
acgacgttgt aaaacgacgg ccagtgaatt ggcgcatgct atttttttcg ctagc 55
<210> 67
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-12 (pCCI)与pCCI-Brick-crt载体片段之间的同源臂序列
<400> 67
ttaattaact caacataacg agaacacaca ggggcgctat cgcacagaat caaat 55
<210> 68
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-1 (pUC57)与pUC57-Brick-crt载体片段之间的同源臂序列
<400> 68
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattcgaga ctag 54
<210> 69
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 大肠杆菌-6 (pUC57)与pUC57-Brick-crt载体片段之间的同源臂序列
<400> 69
cccgggcgcg aatgcatcta gatatcggat ccgcataggc tgaggggacg gatcg 55
<210> 70
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F1(pCCI)
<400> 70
gctggcttaa ctatgcggca tc 22
<210> 71
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R1
<400> 71
gtgactccgc aaccaaatct aactac 26
<210> 72
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F2
<400> 72
gtatggctct cagaagtgat gttgcaa 27
<210> 73
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R2
<400> 73
gcgtcaggtt atcggcagca a 21
<210> 74
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F3
<400> 74
tgcacagctt cgacaaagat ccg 23
<210> 75
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R3
<400> 75
cgcggtgaag tggagttggt 20
<210> 76
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F4
<400> 76
gatgatcttc gcctgctcgt t 21
<210> 77
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R4
<400> 77
ctgtcgaact gaggtatacc cgc 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F5
<400> 78
accccgagtt tgattccctt tcg 23
<210> 79
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R5
<400> 79
gagtcacgta tgccagcgag t 21
<210> 80
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F6
<400> 80
gcgcttaagt ttaaccagac cgt 23
<210> 81
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R6
<400> 81
ggcagcacac cagtaaccag 20
<210> 82
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F7
<400> 82
cgctttctct ggtggtggat g 21
<210> 83
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R7
<400> 83
gataacaaag cggactgtgg atgac 25
<210> 84
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F8
<400> 84
cgttattctt acctttcccc aaccg 25
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R8
<400> 85
ggagggtgga gttccggaag 20
<210> 86
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F9
<400> 86
cagtgagagc agagatagcg c 21
<210> 87
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R9
<400> 87
tgctgttatt ctttctggtg gttcagg 27
<210> 88
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F10
<400> 88
tcagttcttc ttgcttcgcg tat 23
<210> 89
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R10
<400> 89
cttaagccgc tgtatttcat ctcc 24
<210> 90
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F11
<400> 90
cagcaatatc ggcagaatca tcacc 25
<210> 91
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R11
<400> 91
ctgacgttgc tgatgaatgt ctcc 24
<210> 92
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F12
<400> 92
cacggatctt ttggcagtcg t 21
<210> 93
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R12
<400> 93
cacattaagc atcctcaccg cc 22
<210> 94
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F13
<400> 94
cgagacttcc tgctcaatca cc 22
<210> 95
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R13(pCCI)
<400> 95
ggcagacata ggggcagaca ttag 24
<210> 96
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-F1(pUC57)
<400> 96
gctggcttaa ctatgcggca tc 22
<210> 97
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> JJ-R7(pUC57)
<400> 97
tgtagaagac cacacacgaa aatcc 25

Claims (26)

1.一种可在酵母和大肠杆菌中复制的克隆载体,所述载体在现有质粒载体中插入可在酵母内表达的番茄红素基因作为颜色标记,其中所述的现有质粒载体选自下组:pCCI-Brick和pUC57-Brick。
2.根据权利要求1所述的克隆载体,其中所述番茄红素基因包含SEQ ID NO:1的序列或由SEQ ID NO:1的序列组成。
3.根据权利要求1或2所述的克隆载体,其中所述载体在番茄红素基因的两端各插入一个或多个只出现一次的酶切位点。
4.根据权利要求3所述的克隆载体,其中所述现有质粒载体为pCCI-Brick,且所述酶切位点选自:NheI、PacI、MauBI、MluI和PmeI,优选NheI和PacI。
5.根据权利要求3所述的克隆载体,其中所述现有质粒载体为pUC57-Brick,且所述酶切位点选自:SpeI、SmaI、PacI、PmeI、SalI、NotI、NheI、MauBI、MluI、PstI、FseI和SfiI,优选为SpeI和SmaI。
6.一种用权利要求1-5中任一项所述的克隆载体转化的酵母细胞。
7.一种制备可在酵母和大肠杆菌中复制的克隆载体的方法,其包括如下步骤:
(1)根据番茄红素基因的序列设计PCR扩增引物pf1和pr1,所述pf1包含番茄红素基因5’端同源区域和选自NheI或SpeI的酶切位点,且所述pr1包含番茄红素基因3’端同源区域和选自PacI或SmaI的酶切位点,以番茄红素基因为模板,以pf1和pr1为引物扩增适于组装所述克隆载体的番茄红素基因片段;
(2)根据现有质粒载体的序列设计PCR扩增引物pf2和pr2,以现有质粒载体为模板,以pf2和pr2为引物扩增适于组装所述克隆载体的现有质粒载体基因片段,其中所述现有质粒载体选自下组:pCCI-Brick和pUC57-Brick;
(3)将所述番茄红素基因片段与现有质粒载体基因片段以等摩尔量混合并在酵母细胞中组装以获得所述克隆载体。
8.根据权利要求7所述的方法,其中所述番茄红素基因包含SEQ ID NO:1的序列或由SEQ ID NO:1的序列组成。
9.根据权利要求7或8所述的方法,其中所述现有质粒载体为pCCI-Brick,所述pf1包含5’同源区域SEQ ID NO:2和酶切位点NheI,且所述pr1包含番茄红素基因3’同源区域SEQ IDNO:3和酶切位点PacI。
10.根据权利要求7-9中任一项所述的方法,其中所述现有质粒载体为pCCI-Brick,所述引物pf1和pr1分别为如SEQ ID NO:6所示的pCCI-f1和如SEQ ID NO:7所示的pCCI-r1。
11.根据权利要求7-10任一项所述的方法,其中步骤(2)中的现有质粒载体基因片段通过两部分分别扩增,其中用于扩增第一部分的引物pf2a和pr2a分别为如SEQ ID NO:8所示的pCCI-f2和如SEQ ID NO:9所示的pCCI-r2,且其中用于扩增第二部分的引物pf2b和pr2b分别为如SEQ ID NO:10所示的pCCI-f3和如SEQ ID NO:11所示的pCCI-r3。
12.根据权利要求7或8所述的方法,其中所述现有质粒载体为pUC57-Brick,所述pf1包含5’同源区域SEQ ID NO:4和酶切位点SpeI,且所述pr1包含番茄红素基因3’同源区域SEQID NO:5和酶切位点SmaI。
13.根据权利要求7-8和12中任一项所述的方法,其中所述现有质粒载体为pUC57-Brick,所述引物pf1和pr1分别为如SEQ ID NO:12所示的pUC57-f1和如SEQ ID NO:13的所示pUC57-r1。
14.根据权利要求7-8和12-13中任一项所述的方法,其中步骤(2)中的所述引物pf2和pr2分别为如SEQ ID NO:14所示的pUC57-f2和如SEQ ID NO:15所示的pUC57-r2。
15.一种制备权利要求6的酵母细胞的方法,其包括:
(a)制备感受态的酵母细胞;和
(b)使用根据权利要求1-5中任一项所述的克隆载体或通过根据权利要求7-14中任一项所述的方法制备的克隆载体转化(a)制备的感受态的酵母细胞。
16.权利要求15所述的方法,其中所述感受态的酵母细胞是通过收集过夜培养的酵母单菌落,并用醋酸锂转化方法制备的。
17.权利要求15或16所述的方法,其中所述转化是通过将番茄红素基因片段与现有质粒载体基因片段的等摩尔混合物加入所述感受态的酵母细胞中来进行的。
18.权利要求15-17中任一项所述的方法,所述方法进一步包括(c)将所述转化的酵母细胞在平板上培养并将得到的红色菌落作为权利要求6的酵母细胞。
19.一种克隆外源基因序列的方法,其包括:
(a)将根据权利要求1-5中任一项所述的克隆载体或从根据权利要求6所述的酵母细胞中分离得到的克隆载体进行酶切以获得组装用载体片段;
(b)分别根据步骤(a)获得的组装用载体片段的序列以及所述外源基因序列设计PCR扩增引物对,并通过PCR反应得到待组装的各个基因片段;
(c)制备感受态的酵母细胞;和
(d)将步骤(a)获得的组装用载体片段与步骤(b)获得的待组装的各个基因片段转化入(c)制备的感受态的酵母细胞以获得含有组装后的外源基因序列的克隆载体。
20.根据权利要求19所述的方法,其中所述感受态的酵母细胞是通过收集过夜培养的酵母单菌落,并用醋酸锂转化方法制备的。
21.根据权利要求19或20所述的方法,其中所述转化是通过将组装用载体片段和待组装的各个基因片段的等摩尔混合物加入所述感受态的酵母细胞中来进行的。
22.根据权利要求19-21中任一项所述的方法,所述方法进一步包括(e)将所述转化的酵母细胞在平板上培养并将得到的白色菌落作为携带所述外源基因序列的菌株。
23.根据权利要求19-21中任一项所述的方法,其中所述外源基因序列的长度为60kb以下或40kb以下。
24.根据权利要求1-5中任一项所述的克隆载体或根据权利要求6所述的酵母细胞在基因工程领域中用于克隆外源基因序列的用途。
25.根据权利要求1-5中任一项所述的克隆载体或根据权利要求6所述的酵母细胞在制备克隆试剂盒中的用途。
26.一种克隆用试剂盒,其包含:
(i)根据权利要求1-5中任一项所述的克隆载体或根据权利要求6所述的酵母细胞;和
(ii)使用说明。
CN202011315896.4A 2019-11-22 2020-11-22 由番茄红素基因介导的改造的克隆载体及其应用 Active CN112831517B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911155754 2019-11-22
CN2019111557543 2019-11-22

Publications (2)

Publication Number Publication Date
CN112831517A true CN112831517A (zh) 2021-05-25
CN112831517B CN112831517B (zh) 2024-05-14

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101675166A (zh) * 2007-04-05 2010-03-17 Sk能源株式会社 参与番茄红素生物合成的基因、含有该基因的重组载体以及带有重组载体的转化的微生物
US20140106398A1 (en) * 2011-03-11 2014-04-17 Dsm Ip Assets B.V. Vector-host system
CN104419701A (zh) * 2013-08-29 2015-03-18 天津大学 多片段dna的酵母快速组装方法
CN108949788A (zh) * 2018-07-10 2018-12-07 广东省微生物研究所(广东省微生物分析检测中心) 番茄红素合成相关基因及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101675166A (zh) * 2007-04-05 2010-03-17 Sk能源株式会社 参与番茄红素生物合成的基因、含有该基因的重组载体以及带有重组载体的转化的微生物
US20140106398A1 (en) * 2011-03-11 2014-04-17 Dsm Ip Assets B.V. Vector-host system
CN104419701A (zh) * 2013-08-29 2015-03-18 天津大学 多片段dna的酵母快速组装方法
CN108949788A (zh) * 2018-07-10 2018-12-07 广东省微生物研究所(广东省微生物分析检测中心) 番茄红素合成相关基因及其应用

Similar Documents

Publication Publication Date Title
KR102504198B1 (ko) 메틸영양성 효모를 유전적으로 조작하는 발현 구축물 및 방법
US20170088845A1 (en) Vectors and methods for fungal genome engineering by crispr-cas9
CN113881652B (zh) 新型Cas酶和系统以及应用
CN110719956A (zh) 用于改良真菌菌株的高通量基因组工程改造平台
CN109536525B (zh) 一种杜氏盐藻叶绿体同源重组空载体及其应用
CN110268063A (zh) 利用自动化遗传操作和菌株纯化步骤建立真菌生产菌株的方法
KR20210136997A (ko) 미생물에서 반복적 게놈 편집
CN112410234B (zh) 一种多靶点编辑重组曲霉菌株的可视化筛选方法
CN110066323B (zh) 微藻捕光蛋白NoHLR1基因及其应用
CN116368233A (zh) 通过发酵生产4-氨基苯乙胺的工程化生物合成途径
EP2383337B1 (en) Novel promoter for use in transformation of algae
CN113166741A (zh) Dna文库的多重确定性组装
CN112831517B (zh) 由番茄红素基因介导的改造的克隆载体及其应用
CN110592073A (zh) 一种基于crispr技术定向遗传改造米曲霉基因的方法
CN114107304B (zh) 一种表达α毒素蛋白和荧光标签蛋白的重组球虫载体及其检测方法
CN112831517A (zh) 由番茄红素基因介导的改造的克隆载体及其应用
CN102892884B (zh) 马克斯克鲁维酵母转化体的制造方法
CN110878293B (zh) 缺失yceD基因的地衣芽胞杆菌在异源蛋白生产中的应用
CN114540356A (zh) 一种红冬孢酵母启动子及其应用
Chen et al. Multiple-copy-gene integration on chromosome of Escherichia coli for beta-galactosidase production
CN104513830A (zh) 一种适用于氧化葡萄糖酸杆菌的基因表达载体及其应用
CN110628799A (zh) 一种细菌启动子报告载体的构建方法及其应用
CN114774421B (zh) 运动发酵单胞菌内源性启动子突变体
CN116426448B (zh) 可视化运动发酵单胞菌、构建方法及应用
JP6979484B2 (ja) 2,3−ブタンジオール生産用の組換え微生物および2,3−ブタンジオールの生産方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant