附图简述
图1至3代表用于去除导入或已经导入植物细胞内的目的DNA中所选择亚部分的方法的不同实施方案。这些实施方案仅用于说明目的并且不应当用来以限制性方式解释权利要求书。
图1是用于将具有所选择亚部分的目的DNA导入植物细胞并随后去除目的DNA中所选择亚部分的方法的示意图,其中所述的亚部分包含选择标记基因或筛选标记基因
特征:代表任何目的DNA序列;DSB:双链断裂诱导酶(“DSBIE”)的识别位点;SMG1:选择标记基因或筛选标记基因;drs:同向重复序列;SMG2:与编码DSBIE的嵌合基因连接的选择标记基因或筛选标记基因;MSP:小孢子特异性启动子;3’:转录终止和聚腺苷酸化信号;
图2是允许用替换性DNA序列精确替换靶DNA序列的方法的示意图。DSB1:第一个双链断裂诱导酶的识别位点;FS1:侧翼序列1;FS2:侧翼序列2;DSB2:第二个双链断裂诱导酶的识别位点;SMG1:选择标记基因1或筛选标记基因1;SMG2:选择标记基因2或筛选标记基因2;DSBIE:双链断裂诱导酶;dr1:同向重复序列1(其与作为侧翼序列2的一部分的同向重复序列2相似或相同;本文中也称作“部分侧翼DNA区域”);MSP:小孢子特异性启动子;3’:转录终止和聚腺苷酸化信号。
图3是与图2内所示方法类似的允许用替换性DNA序列精确替换靶DNA序列的方法的示意图。dr1在此情况下是这样的同向重复序列,其是来自侧翼序列1的一部分并与同向重复序列2(dr2)相似或相同。
发明的详细实施方案
本发明基于如此发现,即可以高效地去除侧翼为两个同向重复序列并位于切点罕见双链DNA断裂诱导酶的识别位点附近的DNA分子中所选择序列,这在当包含此DNA的植物首先与包含处于小孢子特异性启动子控制下的编码切点罕见双链DNA断裂诱导酶的嵌合基因的植物杂交并将所得植物的花药用来对受体植物授粉时实现。
因此,本发明在一个实施方案内涉及包含处于小孢子特异性启动子的控制下的、编码切点罕见双链DNA断裂诱导内切核酸酶的嵌合基因的植物的用途,以便通过杂交去除位于切点罕见双链DNA断裂诱导内切核酸酶的识别位点附近并还位于以同向重复方向存在的两个序列之间的DNA片段(见图1)。切点罕见的DSBI内切核酸酶在花药形成期间于小孢子内的表达足以诱导双链DNA断裂并因而显著刺激同向重复序列间的染色体内同源重组,导致去除位于这些同向重复序列之间的序列。
也就是说,在本发明的一个实施方案中,提供用于将目的DNA分子导入植物细胞或植物的基因组内,随后去除该DNA分子的亚序列的方法,该方法包括步骤:
a.将此目的DNA分子导入植物细胞的基因组,此目的DNA分子包含侧翼为同向重复排列的两个DNA序列的该DNA分子的亚序列,并且还包含至少一个切点罕见双链DNA断裂诱导(DSBI)酶的识别位点,其中所述的识别位点位于以同向重复排列的两个DNA序列之间;
b.选择在其中目的DNA分子整合进入基因组内的植物细胞并从植物细胞再生植物;
c.将此植物与包含编码DSBI酶的嵌合基因的第二个植物杂交,其中
所述的嵌合基因包含如下有效连接的DNA区段:
i.小孢子特异性启动子;
ii.编码识别所述识别位点的切点罕见双链断裂诱导酶的DNA区域;
iii.转录终止和聚腺苷酸化区域;
d.选择包含目的DNA分子和编码DSBI酶的嵌合基因的后代植物(F1植物);
e.将后代植物与另一植物杂交,由此使用后代植物作为花粉供体;
f.选择包含编码DSBI酶的嵌合基因的后代植物的群体(F2群体);和
g.选择在其中目的DNA分子的亚序列已经通过以同向重复排列的两个DNA序列间的同源重组被缺失的后代植物。
如本文中所用,“切点罕见双链DNA断裂诱导内切核酸酶”是能够在称作“识别位点”的特定核苷酸序列内诱导双链DNA断裂的酶。切点罕见内切核酸酶,有时又称作大范围核酸酶,具有14至40个连续核苷酸的识别位点。因此,切点罕见内切核酸酶具有非常低的切割频率,即便在较大的植物基因组内亦如此。归巢内切核酸酶构成此类切点罕见内切核酸酶的一个家族。它们可以由内含子、独立基因或间插序列编码,并展示出使之与通常来自细菌限制性修饰II型系统更常见的限制酶相区别的醒目结构特性和功能特性。它们的识别位点具有广泛非对称性,这与绝大多数限制酶识别位点的特征性二重对称相反。已经证实由内含子或内含肽编码的数种归巢内切核酸酶可促进它们各自的遗传元件归巢至无内含子或无内含肽的等位位点内。通过在无内含子或无内含肽的等位基因内产生位点特异性双链断裂,这些核酸酶产生重组性末端,该重组末端参与了复制编码序列并在DNA水平引起内含子或间插序列插入的基因转变过程。
充分得到表征的归巢内切核酸酶是I-SceI。I-SceI是酿酒酵母(Saccharomyces cerevisea)内负责线粒体中内含子移动的位点特异性内切核酸酶。该酶由21S rRNA基因的任选内含子Sc LSU.1编码并在内含子插入位点处诱导双链DNA断裂,产生带3’OH突出端的4bp交错切口。I-SceI内切核酸酶的识别位点延伸超过18bp非对称性序列(Colleaux等1988Proc.Natl.Acad.Sci.USA 85:6022-6026)。I-SceI的氨基酸序列和与线粒体I-SceI基因等效的通用密码子已经例如由WO96/14408提供。WO96/14408也公开了仍有功能的I-SceI蛋白的众多变体。
PCT申请PCT/EP04/013122(本文中引用作为参考)提供已经优化用于植物中表达的I-SceI的合成性核苷酸序列变体。此合成性I-Sce I编码区的核苷酸序列以UIPAC密码子描述于SEQ ID No 1。UIPAC密码子的符号具有它们的常用含义,即N=A或C或G或T;R=A或G;Y=C或T;B=C或G或T(非A);V=A或C或G(非T);D=A或G或T(非C);H=A或C或T(非G);K=G或T;M=A或C;S=G或C;W=A或T。
其它切点罕见的DSBI酶及它们相应的识别位点的列表提供于WO03/004659的表1内(第17至第20页)(本文中引用作为参考)。它们包括I-SceI、I-Chu I、I-Dmo I、I-Cre I、I-Csm I、PI-Fli I、Pt-Mtu I、I-Ceu I、I-SceII、I-Sce III、HO、PI-Civ I、PI-Ctr I、PI-Aae I、PI-BSU I、PI-DhaI、PI-Dra I、PI-Mav I、PI-Mch I、PI-Mfu I、PI-Mfl I、PI-Mga I、PI-Mgo I、PI-Min I、PI-Mka I、PI-Mle I、PI-Mma I、PI-Msh I、PI-Msm I、PI-MthI、PI-Mtu I、PI-Mxe I、PI-Npu I、PI-Pfu I、PI-Rma I、PI-Spb I、PI-SspI、PI-Fac I、PI-Mja I、PI-Pho I、PI-Tag I、PI-Thy I、PI-Tko I或PI-TspI。
此外,可获得设计基本上识别任何所选择靶核苷酸序列的客户定制型切点罕见内切核酸酶的方法。简而言之,嵌合性限制酶可以使用为识别特定核苷酸序列所设计的锌指结构域与来自天然限制酶如FokI的非特异性DNA切割结构域的杂合体加以制备。此类方法已经描述于WO03/080809、WO94/18313或WO95/09233以及Isalan等,2001,Nature Biotechnology 19,656-660;Liu等1997,Proc.Natl.Acad.Sci.USA 94,5525-5530内。通过从变体的文库中选择而产生客户定制型大范围核酸酶的另一个途径描述于WO2004/067736内。
如本文中所用,“侧翼为同向重复排列的两个DNA序列”表示两个DNA区域分别紧接在待从导入的DNA分子中去除的序列的每一端,其中所述的两个DNA区域在核苷酸序列上基本上相似。同向重复序列不必完全相同,但是可以在约75%至约100%序列同一性之间变化。重复序列越短,对序列相似性的要求越严格。然而,为了恢复DNA序列而不留下痕迹,如下文中所述,以同向重复排列的DNA序列优选应当完全相同。为避免疑问,如果在核苷酸序列上基本上相似的两个DNA区域包含于双链DNA分子内,则这些DNA序列应当位于同一DNA链上,处于相同的5’→3’方向。
重复的DNA序列可以是至少10个、50个或100个核苷酸长度,不过,序列当然可以更长。然而,已经发现长度超过300个核苷酸的重复序列不再显著地增强导致位于同向重复序列之间DNA序列去除的染色体内同源重组。
为本发明的目的,表述为百分数的两个相关性核苷酸序列或氨基酸序列的“序列同一性”指在两个优化比对序列内具有完全相同残基的位置数除以所比较的位置数(×100)。将空位(即对比中一个残基存在于一个序列内而不存在于另一序列的位置)视作不具有完全相同残基的位置。两个序列的对比通过Needleman和Wunsch算法(Needleman和Wunsch 1970)开展。计算机辅助的序列对比可以使用标准软件程序,如作为Wisconsin PackageVersion 10.1(Genetics Computer Group,Madison,Wisconsin,USA)部分的GAP,利用具有空位生成罚值50和空位延伸罚值3的默认计分矩阵方便地开展。
虽然DSBI识别位点优选地位于同向重复的DNA序列之间,但是这既非重要,也非需要。实际上,DSBI识别位点还可能是重复DNA序列中一个序列的一部分。
如本文中所用“位于附近”指DSBI的位置距离同向重复DNA序列在500bp、1kbp至10kbp之间。
本文中所述的方法需要利用编码切点罕见双链断裂诱导酶的嵌合基因,由此内切核酸酶的编码区处在小孢子特异性启动子片段的控制下。
如本文中所用的“小孢子特异性启动子区域”或“小孢子特异性启动子”或“小孢子特异性启动子片段”是能够选择性地、优选是特异性地在植物的单细胞性小孢子内促进转录的启动子区域或启动子或启动子片段。在被子植物中,有性繁殖需要产生有活力的雄性配子体和雌性配子体。作为雄性配子体的花粉在花药内形成并从造孢细胞开始,发育成性母细胞。性母细胞发生减数分裂以形成单倍体细胞的四分体,四分体随后释放至花药室。随着扩张和空泡形成,小孢子的非对称性有丝分裂产生含有营养细胞和生殖细胞的双细胞性花粉。在大部分物种内,花药在双细胞条件下散发。在WO97/30166(本文中引用作为参考;还见SEQ ID No 3)内描述了作为合适小孢子特异性启动子区域的烟草NTM19基因启动子区域。其功能性片段已经整合入实施例的嵌合基因(SEQ ID No 6)内。小孢子特异性启动子片段可以包括SEQ ID No 3中从位置1至位置954或从位置1至位置993的核苷酸序列或SEQ ID No 6中从位置1941至2926的核苷酸序列。
如本文中所用“切点罕见双链断裂诱导内切核酸酶的编码区”或“切点罕见双链断裂诱导酶的编码区”是编码特征为切点罕见的DSBI酶,如归巢内切核酸酶或在本申请内其它处所描述的嵌合内切核酸酶的核苷酸序列。编码区因此可以包含编码下表内所列归巢内切核酸酶中任意氨基酸序列的任意核苷酸序列,其中所述的归巢内切核酸酶可以在提到的登录号下于公共数据库内找到(它们在本文中均引用作为参考):
DSBI酶 |
登录号 |
I-AniI |
P03880 |
I-CvuI |
P56347 |
I-CreI |
P05725 |
I-ChuI |
Q32001 |
I-CpaI-I-CpaIII-I-CpaIV-I-CpaV |
Q39562/Q8WKZ5/Q8WKZ6/Q8WKZ8 |
I-CpaII |
Q39559 |
I-CeuI |
P32761 |
I-DmoI |
P21505 |
I-SceI |
P03882 |
I-SceII |
P03878 |
I-SceIII |
Q9ZZX3 |
PI-SceI |
P17255 |
I-NanI |
Q25535 |
I-NitI |
Q25567 |
I-NjaI |
Q25568 |
I-PpoI |
Q94702 |
PI-PfuI |
O73954 |
PI-PkoI |
P77933 |
PI-PkoII |
P77933 |
PI-PspI |
Q51334 |
PI-TfuI |
P74918 |
PI-TfuII |
P74918 |
PI-ThyI |
Q9HH05 |
PI-ThyII |
Q9HH05 |
PI-TliI |
P30317 |
PI-TliII |
P30317 |
I-TevI |
P13299 |
I-TevII |
P07072 |
I-TevIII |
Q38419 |
显而易见,为了在小孢子特异性启动子片段的控制下表达内切核酸酶,应当调整编码区以便使用通用密码子语言编码以上提到的多肽。编码区还可以优化用于在植物内表达,并且合成性编码区具有为满足如下标准而设计的核苷酸序列:
a)核苷酸序列编码有功能的切点罕见双链断裂诱导内切核酸酶,
b)核苷酸序列具有约50%至约60%的GC含量,
c)核苷酸序列不包含选自GATAAT、TATAAA、AATATA、AATATT、GATAAA、AATGAA、AATAAG、AATAAA、AATAAT、AACCAA、ATATAA、AATCAA、ATACTA、ATAAAA、ATGAAA、AAGCAT、ATTAAT、ATACAT、AAAATA、ATTAAA、AATTAA、AATACA和CATAAA的核苷酸序列;
d)核苷酸不包含选自CCAAT、ATTGG、GCAAT和ATTGC的核苷酸序列;
e)核苷酸序列不包含选自ATTTA、AAGGT、AGGTA、GGTA或GCAGG的序列;
f)核苷酸序列不包含由选自G或C的7个连续核苷酸组成的GC段;
g)核苷酸序列不包含由选自A或T的5个连续核苷酸组成的GC段;
和
h)核苷酸序列不包含如此密码子,其编码Leu、Ile、Val、Ser、Pro、Thr、Ala并在位置2和3内包含TA或CG双体(即核苷酸序列不包含密码子TTA、CTA、ATA、GTA、TCG、CCG、ACG和GCG)。
双链断裂诱导酶可以包含,但不是必须包含,核定位信号(NLS)[Raikhel,Plant Physiol.100:1627-1632(1992)及其中的参考文献],如SV40大T抗原的NLS[Kalderon等Cell 39:499-509(1984)]。核定位信号可以位于蛋白质内任何地方,但是合适地位于蛋白质的氨基末端。核定位信号可以替换双链断裂诱导酶中的一个或多个氨基酸。
虽然用于去除的方法在本文中描述为涉及导入目的DNA分子的活化步骤随后去除所选择亚片段,显而易见的是本发明的去除方法可以用来去除位于DNA同向重复序列之间的任何序列,只要可以找到或设计出识别在重复DNA序列附近的DSBI识别位点的DSBI酶。
还将显而易见的是,用来描述本方法的术语如“DNA片段的导入”及“从细胞再生植物”不表示该DNA片段必定需要通过转化技术而导入。实际上对于本领域技术人员而言立刻明白目的DNA分子还可以通过育种或杂交技术从一种植物导入另一种植物内。
然而,将显而易见的是目的DNA分子可以通过本领域已知的任何方法导入植物细胞,包括农杆菌介导性转化和DNA直接转移方法。可以使用任何便利的方法将转化性DNA分子转移至植物细胞内,包括但不限于DNA直接转移。如本文中所用“DNA直接转移”是将DNA导入植物细胞的任何方法,该方法不涉及利用天然的农杆菌物种并能够将DNA导入植物细胞。这包括本领域众所周知的方法,如通过电穿孔法将DNA导入原生质体、通过电穿孔法将DNA导入完整的植物细胞或经部分降解的组织或植物细胞、通过试剂如PEG等的作用将DNA导入原生质体、利用硅晶须以及用包被DNA微粒轰击。
DNA可以通过如在例如PCT/EP04/013122内所述的涉及在预先选择位点处导入双链断裂的同源重组或非同源末端连接的方法整合。
在本发明的一个特定实施方案中,去除的方法可以与DNA通过定向同源重组而插入、缺失或替换组合地使用,并且在该方法中如此实现定向DNA插入,即使用选择标记或筛选标记,随后在包含选择标记或筛选标记的植物细胞或植物的群体内验证在其中定向DNA插入通过同源重组而发生的植物细胞或植物。当侧翼序列和同向重复序列合适地进行选择时,该方法引起靶DNA精确替换成目的DNA,而不存在用来实现替换的目的DNA分子的任何残留(“痕迹”)。去除的方法也不需要任何额外的体外培养,因而避免产生体细胞性变异。本方法的示意图提纲可以在图2和3内找到。
有趣的是,已经观察到使用如PCT/EP04/013122内所述的借助同源重组定向插入外源目的DNA的方法,在其中外源DNA确实经同源重组插入的那些转化事件代表了在其中DNA通过任何手段整合入植物染色体内的事件总群体中的相对高比例(在1%至5%的数量级上)。因此,不需要依赖产生可识别表型的DNA序列(如同源重组后产生的完整选择标记基因)经同源重组的生成或再造,以鉴定DNA因而通过同源重组得以插入的那些事件。此外,选择标记基因或筛选标记基因可以包含于侧翼DNA序列之间的DNA区域内,随后分析数目相对较少的转化的植物细胞或植物,以鉴定在其中定向DNA插入经同源重组而发生的那些转化事件。
因此,在本发明的这个实施方案中,提供用于将植物细胞内的靶DNA序列交换成目的DNA序列(或外源DNA)的方法,该方法包含如下步骤:
-在细胞基因组内预先选择位点处诱导第一个双链DNA断裂,所述预先选择位点位于靶DNA序列内或位于该靶DNA序列的附近;
-将目的DNA分子(或外源DNA)导入植物细胞,由此DNA分子包含如下有效连接的DNA片段:
i.位于两个侧翼DNA区域之间的目的DNA序列,其中所述的侧翼DNA区域与靶DNA序列的侧翼DNA区域和预先选择位点的侧翼DNA区域具有至少80%序列同源性、优选100%序列同源性;
ii.位于侧翼DNA区域之间的选择标记基因或筛选标记基因,因而选择标记基因或筛选标记基因还位于侧翼DNA区域之一和以同向重复方式存在的所提及侧翼DNA区域之一的至少部分的另一个拷贝(又标示为部分侧翼序列)之间;
iii.位于侧翼DNA区域之一与以同向重复方式存在的部分侧翼DNA区域之间的DSBI酶的识别位点;
-选择包含选择标记或筛选标记的植物细胞的群体;
-选择在其中选择标记或筛选标记已经借助侧翼DNA区域通过同源重组导入的植物细胞,并从植物细胞再生植物;
-将包含选择标记基因的再生植物或其后代植物与包含编码DSBI酶的嵌合基因的植物杂交,其中该嵌合基因包含如下有效连接的DNA区段:
■小孢子特异性启动子;
■编码识别位于目的DNA内的识别位点的双链DNA断裂诱导酶的DNA区域;
■转录终止和聚腺苷酸化区域;
-选择包含选择标记基因或筛选标记基因和编码DSBI酶的嵌合基因的后代植物(F1植物);
-将后代植物与另一植物杂交,由此使用后代植物作为花粉供体;
-选择包含编码DSBI酶的嵌合基因的后代植物的群体(F2群体);
和
-选择所述F2群体内的后代植物,在所述后代植物中选择标记基因或筛选标记基因通过侧翼DNA区域之一与包含侧翼DNA区域之一的一部分的部分侧翼DNA区域间的同源重组被缺失。
因此,如本文中所用“预先选择位点”指示植物的核基因组内位于靶DNA序列内或附近的特定核苷酸序列,在该位置内需要插入外源DNA或将靶DNA序列交换。本领域技术人员将能够选择识别所选择靶核苷酸序列的双链DNA断裂诱导(“DSBI”)酶或设计此种DSBI内切核酸酶。或者,DSBI内切核酸酶识别位点可以使用任何常用的转化方法导入或使用在其基因组内具有DSBI内切核酸酶识别位的植物系通过常规育种法导入,并且任何所需要的外源DNA可以随后导入事先已导入的预先选则靶位点内。
在转化性DNA分子内的双链DNA断裂可以通过植物可表达的嵌合基因的瞬时导入而方便地诱导,其中所述的嵌合基因包含与编码双链断裂诱导酶的DNA区域有效连接的植物可表达启动子区域。编码双链断裂诱导酶的DNA区域可以是合成性DNA区域,如(但不限于)这样的合成性DNA区域,其中密码子根据本申请内其它处所述的用于I-SceI编码区设计方案而选择。作为蛋白质,内切核酸酶本身还可以例如通过电穿孔法导入植物细胞。然而,内切核酸酶还可以通过将嵌合基因(包含与诱导型植物可表达启动子有效连接的编码内切核酸酶的DNA区域)导入植物细胞或植物的基因组,并在导入转化性DNA分子之前、期间或之后立即提供合适的诱导化合物持续所限时间而以瞬时方式提供。内切核酸酶还可以作为编码内切核酸酶的RNA前体提供。
双链断裂诱导酶可以包含,但不必须包含,核定位信号(NLS)[Raikhel,Plant Physiol.100:1627-1632(1992)及其中参考文献],如SV40大T抗原的NLS[Kalderon等Cell 39:499-509(1984)]。核定位信号可以位于蛋白质内任何地方,但是合适地位于蛋白质的氨基末端。核定位信号可以替换双链断裂诱导酶中的一个或多个氨基酸。
如本文中所用,“靶DNA序列”是通过添加、缺失或置换而修饰的位于植物细胞基因组内的DNA序列。
如本文中所用“侧翼DNA区域”是分别与靶DNA序列上游或下游DNA区域具有同源性的DNA序列。这允许更好地控制外源DNA或目的DNA分子的插入。实际上,通过同源重组的整合将允许外源DNA片段与植物的核基因组在核苷酸水平上精确连接。
侧翼DNA区域可以在长度上变化,并且应当是至少约10个核苷酸长度。然而,侧翼区域可以按照实际可能尽量地长(例如直至约100-150kb,如完整的细菌人工染色体(BAC))。优选地,侧翼区域会是约50bp至约2000bp。此外,侧翼为外源目的DNA的区域不需要与预先选择位点的侧翼DNA区域完全相同,并且可以与预先选择位点的侧翼DNA区域具有约80%至约100%之间的序列同一性,优选地约95%至约100%序列同一性。侧翼区域越长,对同源性要求的严格性越低。此外,优选序列同一性在靠近精确插入外源DNA的位置处按照实际可能尽量地高。此外,为实现交换靶DNA序列而不改变毗邻DNA序列的DNA序列,侧翼DNA序列应当优选地与预先选择位点侧翼的DNA区域完全相同。
此外,外源目的DNA侧翼的区域不必与紧邻预先选择位点侧翼的区域具有同源性,但是可以与距离预先选择位点更远的核基因组的DNA区域具有同源性。外源DNA的插入随后将导致在预先所选择插入位点和同源DNA区域之间的靶DNA的去除。也就是说,位于同源区域之间的靶DNA将置换成外源目的DNA。
优选地,预先选择位点和另外提及的识别序列由不同的切点罕见双链断裂诱导内切核酸酶识别。
提及的“部分侧翼DNA区域”指邻近待缺失且通常包含选择标记或筛选标记的DNA区域的侧翼DNA区域中至少部分的DNA区域。很明显,部分侧翼DNA序列也可以在长度上与侧翼DNA序列相等或甚至包含更长的侧翼DNA序列。
“选择标记或筛选标记”如本文中所用具有本领域的通常含义并包括,但不限于植物可表达的膦丝菌素乙酰转移酶、新霉素磷酸转移酶、草甘膦氧化酶、草甘膦耐受EPSP酶、腈水解酶基因、突变的乙酰乳酸合酶或乙酰羟酸合酶基因、β-葡糖醛酸糖苷酶(GUS)、R-基因座基因、绿色荧光蛋白等。
选择在其中选择标记或筛选标记和外源DNA分子的剩余部分已经借助侧翼DNA区域通过同源重组得以导入的植物细胞或植物例如可以通过对如此序列的缺乏进行筛选而实现,其中所述序列存在于转化性DNA内,但位于侧翼DNA区域之外。实际上,来自转化性DNA但位于侧翼DNA区域之外的序列的存在表示着为来源于DNA随机插入的转化植物细胞。为此目的,选择标记或筛选标记可以包含于侧翼DNA区域之外的转化性DNA分子内,转化性DNA分子随后可以用于鉴定不具有位于转化性DNA之外的并且已经借助侧翼DNA区域通同源重组而产生的选择标记或筛选标记的植物细胞。备选地,转化性DNA分子可以含有允许对缺少此类基因(负选择标记基因)进行选择的、位于侧翼DNA区域之外的选择标记。
在本发明的另一个实施方案中,本文中所述的DNA去除方法可以与如此方法组合,即该方法以非同源末端连接为基础用于在细胞基因组内预先选择位点处插入DNA。
因此,本发明提供用于在基因组内、优选是植物细胞的核基因组内的预定位置处插入所选择DNA分子的方法,该方法包括如下步骤:
-在细胞基因组内预先选择位点处诱导第一个双链DNA断裂,所述预先选择位点优选地位于靶DNA序列内;
-将外源DNA分子导入植物细胞,因而该DNA分子包含如下有效连接的DNA片段:
○所选择目的DNA分子;
○在前面或后面具有重复DNA区域的选择标记基因或筛选标记基因,其中所述的重复DNA区域与位置紧邻预先选择位点的基因组DNA区域之一具有至少80%的序列同一性,因而当外源DNA分子通过非同源末端连接在预先选择位点内插入时,该DNA区域与其基因组拷贝以同向重复方式存在;
○切点罕见的DSBI酶的识别位点,位于包含所述重复DNA区域和所述选择标记基因的外源DNA区域内;
-选择包含选择标记或筛选标记的植物细胞的群体;
-选择在其中选择标记或筛选标记已经通过非同源末端连接在预先选择位点处导入的植物细胞,并从植物细胞再生植物;
-将包含选择标记基因的再生植物或其后代植物与包含编码DSBI酶的嵌合基因的植物杂交,其中该嵌合基因包含如下有效连接的DNA区段:
■小孢子特异性启动子;
■编码识别位于目的DNA内的识别位点的双链DNA断裂诱导酶的DNA区域;
■转录终止和聚腺苷酸化区域;
-选择包含选择标记基因或筛选标记基因和编码DSBI酶的嵌合基因的后代植物(F1植物);
-将后代植物与另一植物杂交,由此使用后代植物作为花粉供体;
-选择包含编码DSBI酶的嵌合基因的后代植物的群体(F2群体);
和
-选择所述F2群体内的后代植物,在所述后代植物中选择标记基因或筛选标记基因通过重复DNA区域和位置紧邻预先选择位点的基因组DNA区域间的同源重组被缺失。
以上提及的方法可以方便地用于打断所选择的任何DNA序列,例如多肽编码区、编码生物活性RNA的DNA序列、启动子区域、调节区、蛋白质或RNA结合的识别位点等。
在该实施方案中,在其中DNA分子已经通过非同源末端连接而插入的事件可以例如使用引物序列(识别位于预先选择位点附近的基因组序列并且还优选地不识别识别外源DNA)和在外源DNA分子内的引物通过PCR反应方便地进行鉴定。在通过非同源末端连接在预先选择位点处插入外源DNA时,DNA片段将扩增。当外源DNA随机整合时,不会扩增此DNA片段。
可以理解的是本发明的手段和方法可以用于能够通过花粉繁殖的任何植物内,包括玉米、烟草、谷物植物包括小麦、燕麦、大麦、黑麦、稻、草坪草、高粱、谷子或甘蔗。本发明的方法还可以应用于任何植物(被子植物或裸子植物),包括但不限于棉花、油菜、欧洲油菜、大豆、蔬菜、马铃薯、浮萍属某些种(Lemna spp.)、烟草属某些种(Nicotiana spp.)、拟南芥(Arabidopsis)、紫花苜蓿、大麦、菜豆、玉米、棉花、亚麻、豌豆、芸苔、稻、黑麦、红花、高粱、大豆、向日葵、烟草、小麦、芦笋、甜菜、西兰花、甘蓝、胡萝卜、花椰菜、芹菜、黄瓜、茄子、莴苣、洋葱、欧洲油菜、胡椒、马铃薯、西葫芦、萝卜、菠菜、南瓜、番茄、小胡瓜、扁桃、苹果、杏、香蕉、黑莓、蓝莓、可可、樱桃、椰子、蔓越橘、枣、葡萄、葡萄柚、番石榴、猕猴桃、柠檬、酸橙、芒果、甜瓜、油桃、桔、番木瓜、西番莲、桃、花生、梨、菠萝、阿月浑子、李、树莓、草莓、橘、胡桃和西瓜。
本发明的目的还是提供根据本发明方法所产生的植物细胞和植物。本发明的范围还包括通过传统育种方法产生的包含DNA插入事件的植物的配子、种子、胚、合子性或体细胞性后代或杂种。此类植物可以含有替代靶序列的异源DNA序列并且仅仅因交换后这种异源DNA或DNA序列的存在而与它们的祖先植物不同。
通过本文中所述方法得到的植物可以通过常规育种技术与其它植物进一步杂交,以得到包含根据本发明所得到的定向DNA插入事件的后代植物。
如下非限制性实施例描述使用处于小孢子特异性启动子控制下表达的编码双链DNA断裂诱导酶如I-SceI的嵌合基因从所导入DNA分子中去除所选择亚片段。
在实施例中除非另外说明,所有重组DNA技术根据如在Sambrook等(1989)Molecular Cloning:A Laboratory Manual,第二版,Cold SpringHarbor Laboratory Press,NY和在Ausubel等(1994)Current Protocols inMolecular Biology,Current Protocols,USA的第1和2卷内所述的标准方案开展。用于植物分子工作的标准材料和方法描述于BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications,UK联合出版的R.D.D.Croy编的Plant Molecular Biology Labfax(1993)内。对于标准分子生物学技术的其它参考文献包括Sambrook和Russell(2001)MolecularCloning:A Laboratory Manual,第三版,Cold Spring Harbor LaboratoryPress,NY、Brown(1998)Molecular Biology LabFax,第二版,AcademicPress(UK)第I和II卷。用于聚合酶链式反应的标准材料和方法可以在Dieffenbach和Dveksler(1995)PCR Primer:A Laboratory Manual,ColdSpring Harbor Laboratory Press并在McPherson等(2000)PCR-Basics:From Background to Bench,第一版,Springer Verlag,Germany内找到。
在说明书和实施例通篇范围内,提到如下序列:
SEQ ID No 1:合成性I-SceI编码区(UIPAC编码)的核苷酸序列。
SEQ ID No 2:合成性I-SceI编码区的核苷酸序列。
SQ ID No 3:包括启动子区域的小孢子选择性NTM19基因的核苷酸序列。
SEQ ID No 4:pTCV63的T-DNA的核苷酸序列。
SEQ ID No 5:pTCV64的T-DNA的核苷酸序列。
SEQ ID No 6:pTCV72的T-DNA的核苷酸序列。
实施例
通过染色体内同源重组(IHR)去除选择标记基因
已经开发出检测去除所选择DNA片段的重组分析法,其基于在同向重复序列(egfp序列的一部分;约300bp或约600bp)间的染色体内同源重组(IHR)而去除选择标记基因(hyg)(~2000bp)后恢复egfp-bar融合基因。重复序列之一的侧翼具有I-SceI(和锌指Zif268)识别位点,这有可能在重复序列间产生DSB。为了在一个世代转移至另一个世代期间允许IHR,将I-SceI内切核酸酶置于小孢子特异性启动子的控制下(pNTM19)。
使用标准重组DNA技术,构建以下DNA分子用于如下的实验:
1.pTCV63:具有含如下有效连接的DNA构建体的同向重复短序列(~300bp):
-p35S3:CaMV35S启动子片段
-egf(短):eGFP编码序列的第一个部分,包含与随后名为GFP序列重叠的300bp
-I-SceI内切核酸酶的识别位点
-含Zn指Zif268的DNA结合蛋白的识别位点
-pCsVMV:木薯叶脉花叶病毒启动子片段
-hyg:潮霉素抗性编码区
-3’35S:3’转录终止和聚腺苷酸化信号
-gfp(短):eGFP编码序列的3’部分,包含该质粒的先前egf部分的300bp的同向重复序列,并且在其中编码区翻译性地与bar基因编码区连接。
-3’nos:来自胭脂氨酸合酶基因的3’转录终止和聚腺苷酸化信号。
将该质粒导入根瘤农杆菌(Agrobacterium tumefaciens)并且使用得到的菌株(A4330)来产生转基因烟草植物(G7NT001)。
2.pTCV64:具有含如下有效连接的DNA构建体的同向重复长序列(~600bp):
-p35S3:CaMV35S启动子
-egf(长):eGFP编码序列的第一个部分,包含与随后名为gfp序列重叠的600bp
-I-SceI内切核酸酶的识别位点
-含Zn指Zif268的DNA结合蛋白的识别位点
-pCsVMV:木薯叶脉花叶病毒启动子
-hyg:潮霉素抗性编码区
-3’35S:3’转录终止和聚腺苷酸化信号
-gfp(长):efgp编码序列的3’部分,包含先前egf构建体的600bp的同向重复序列,并且在其中编码区翻译性地与bar基因编码区连接。
-3’nos:来自胭脂氨酸合酶基因的3’转录终止和聚腺苷酸化信号。
将该质粒导入根瘤农杆菌并且使用得到的菌株(A4364)来产生转基因烟草植物(G7NT004)。
3.pTCV72:
-pnos:胭脂氨酸合酶启动子
-neo:新霉素磷酸转移酶II编码区
-3’ocs:来自章鱼碱合酶基因的3’转录终止和聚腺苷酸化信号;
-pNTM19:小孢子特异性启动子片段
-I-SceI:内切核酸酶I-SceI的编码区
-3’nos:来自CaMV 35S转录物的3’转录终止和聚腺苷酸化信号。
将该质粒导入根瘤农杆菌并且使用得到的菌株(A4331)来产生转基因烟草植物(G7NT005)。
从G7NT001和G7NT004各自的三个独立的单拷贝转化烟草系中,使用G7NT005作为雄性植物开展与包含编码I-SceI的嵌合基因的两个独立的单拷贝转化系(G7NT005)杂交,其中所述的嵌合基因处于小孢子特异性启动子控制下,因而后代系如下所示:
G7NT001-0001×G7NT005-0001>04TDNT000001
G7NT001-0002×G7NT005-0001>04TDNT000002
G7NT001-0003×G7NT005-0001>04TDNT000003
G7NT001-0001×G7NT005-0002>04TDNT000004
G7NT001-0002×G7NT005-0002>04TDNT000005
G7NT001-0003×G7NT005-0002>04TDNT000006
G7NT004-0001×G7NT005-0001>04TDNT000007
G7NT004-0002×G7NT005-0001>(无后代)
G7NT004-0003×G7NT005-0001>04TDNT000012
G7NT004-0001×G7NT005-0002>04TDNT000008
G7NT004-0002×G7NT005-0002>04TDNT000010
G7NT004-0003×G7NT005-0002>04TDNT000011
从每一杂交中,将200粒种子播种在Km(200mg/L)培养基上、将200粒种子播种在Hyg(50mg/L)培养基上并且将200粒种子播种在Km(200mg/L)+Hyg(50mg/L)培养基上以检验转基因的正常传递。对于大多数杂交而言存在相当正常的不同转基因的转移(注意对于某些杂交,遇到污染问题和种子质量问题(见下表)):
对相应选择剂抵抗的幼苗数
系 |
幼苗数/50粒种子 |
KmR幼苗数/200粒种子 |
HygR幼苗数/200粒种子 |
kmR+HygR幼苗数/200粒种子 |
G7NT001-0001×G7NT005-0001 |
32 |
47/150 |
55 |
28/150 |
G7NT001-0001×G7NT005-0002 |
32 |
29 |
51 |
15 |
G7NT001-0002×G7NT005-0001 |
32 |
89 |
64 |
59 |
G7NT001-0002×G7NT005-0002 |
46 |
69 |
94 |
42 |
G7NT001-0003×G7NT005-0001 |
47 |
92 |
93 |
53 |
G7NT001-0003×G7NT005-0002 |
48 |
88 |
85 |
47 |
G7NT004-0001×G7NT005-0001 |
49 |
92 |
65/150 |
44 |
G7NT004-0002×G7NT005-0001 |
47 |
73/150 |
89 |
34/150 |
G7NT004-0002×G7NT005-0002 |
49 |
58/150 |
98 |
60 |
G7NT004-0003×G7NT005-0001 |
39 |
63 |
69 |
50 |
G7NT004-0003×G7NT005-0002 |
45 |
60 |
91 |
22 |
对于这12种杂交中的每一种,将少量KmR+HygR后代植物转移运至温室以作为WT SR1植物的授粉者使用。对于这些12种杂交,每次使用三株KmR+HygR植物作为根据如下方案的WT SR1授粉者:
SR1×04TDNT000001-001
-002
-003
SR1×04TDNT000002-001
-002
-003
SR1×04TDNT000003-001
-002
-003
SR1×04TDNT000004-001
-002
-003
SR1×04TDNT000005-001
-002
-003
SR1×04TDNT000006-001
-002
-003
SR1×04TDNT000007-001
-002
-003
SR1×04TDNT000012-001
-002
-003
SR1×04TDNT000008-001
-002
-003
SR1×04TDNT000010-001
-002
-003
SR1×04TDNT000011-001
-002
-003
从这些杂交的每一后代中(见下表),将50粒种子播种在非选择性基质上以测定萌发频率,将50粒种子播种在卡那霉素基质上以测定NTM19-I-SceI基因的传递率并且将约4000粒种子播种在PPT基质上以测定从一个世代转移至另一世代期间的IHR频率。也呈现KmR的PPTR幼苗数决定着NTM19-ISceI内切核酸酶所诱导的DSB是否影响从一个世代转至另一世代期间的IHR频率。
对22个后代的后代分析结果汇总于表A、B和C内。
NTM19-I-SceI对从一个世代转移至另一世代期间的IHR频率存在极强烈的影响,因为全部PPTR幼苗也呈KmR。
应当指出大部分的PPTR和GFPF幼苗没有进一步发育成植物并且因GFP的毒性效应而死亡。
表A:
杂交 |
萌发频率(幼苗数/50粒种子) |
KmR幼苗数/50粒种子 |
PPTR和GFPF幼苗数/种子数 |
KmR幼苗数/针对KmR筛选的PPTR和GFPF幼苗数 |
SR1×04TDNT000001-001短重复序列 |
43 |
24 |
77/4348(1.77%) |
5/5 |
SR1×04TDNT000001-002短重复序列 |
49 |
20 |
79/4835(1.63%) |
23/23 |
SR1×04TDNT000001-003短重复序列 |
47 |
22 |
98/4827(2.03%) |
27/27 |
SR1×04TDNT000002-001短重复序列 |
47 |
23 |
33/4762(0.69%) |
4/4 |
SR1×04TDNT000004-001短重复序列 |
49 |
30 |
123/4798(2.6%) |
36/36 |
SR1×04TDNT000004-002短重复序列 |
48 |
23 |
100/4745(2.1%) |
32/32 |
SR1×04TDNT000004-003短重复序列 |
48 |
15 |
118/4665(2.5%) |
6/6 |
SR1×04TDNT000005-001短重复序列 |
49 |
25 |
94/4665(2.01%) |
16/16 |
SR1×04TDNT000005-002短重复序列 |
48 |
20 |
47/4690(1%) |
7/7 |
SR1×04TDNT000005-003短重复序列 |
48 |
22 |
120/4658(2.6%) |
16/18(2个为S或R?) |
SR1×04TDNT000006-001短重复序列 |
47 |
28 |
136/4665(2.9%) |
24/24 |
SR1×04TDNT000006-003短重复序列 |
49 |
20 |
77/4650(1.66%) |
12/12 |
表B:
杂交 |
萌发频率(幼苗数/50粒种子)* |
KmR幼苗数/50粒种子 |
HygR幼苗数/50粒种子 |
KmR+HygR+幼苗数/100粒种子 |
PPTR和GFPF幼苗数/种子数** |
KmR幼苗数/针对KmR筛选的PPTR和GFPF幼苗 |
SR1×04TDNT000003-001短重复序列 |
23 |
14 |
12 |
13 |
44/4973(0.89%)** |
33/33 |
SR1×04TDNT000003-003短重复序列 |
20 |
16 |
11 |
16 |
46/4857(0.95%)** |
46/46 |
SR1×04TDNT000007-001长重复序列 |
19 |
7 |
7 |
7 |
16/4915(0.33%)** |
16/16 |
SR1×04TDNT000008-001长重复序列 |
28 |
17 |
12 |
12 |
33/4890(0.7%)** |
33/33 |
SR1×04TDNT000008-003长重复序列 |
20 |
7 |
8 |
8 |
33/4840(0.69%)** |
33/33 |
SR1×04TDNT000012-003长重复序列 |
16 |
10 |
9 |
9 |
14/4312(0.32%)** |
14/14 |
*同时播种本表内提到的后代。由于漂白剂过度强烈的灭菌作用,存在不良的和不规则的萌发(对于大多数系<50%)。**意味着PPTR和GFPF幼苗数/种子数低估至少因子2,因为大多数系的萌发频率小于50%。
表C:
杂交 |
萌发频率(幼苗数/50粒种子)* |
KmR幼苗数/50粒种子 |
HygR幼苗数/50粒种子 |
KmR+HygR幼苗数/100粒种子 |
PPTR和GFPF幼苗数/种子数** |
KmR幼苗数/针对KmR筛选的PPTR和GFPF幼苗数* |
SR1×04TDNT000002-002短重复序列 |
50 |
20 |
26 |
9 |
7/1330(0.5%) |
NT* |
SR1×04TDNT000002-003短重复序列 |
50 |
30 |
18 |
25 |
9/1355(0.66%) |
NT* |
SR1×04TDNT000003-002短重复序列 |
50 |
20 |
21 |
25 |
24/1389(1.7%) |
NT* |
SR1×04TDNT000007-003长重复序列 |
50 |
25 |
25 |
17 |
3/1346(0.2%) |
NT* |
*NT:未测试
此外,全部PPTR和GFPF幼苗确实是潮霉素敏感的,这表明hyg基因的确已经通过在IHR基因座内的染色体间重组被去除。
杂交 |
HygR幼苗数/对HygR筛选的PPTR和GFPF幼苗数 |
SR1×04TDNT000012-003 |
0/11 |
SR1×04TDNT000008-001 |
0/12 |
SR1×04TDNT000008-003 |
0/11 |
SR1×04TDNT000001-002 |
0/8 |
SR1×04TDNT000005-003 |
0/7 |
SR1×04TDNT000006-003 |
0/7 |
从18个后代群体的分离分析中,可以得出结论,NTM19-I-SceI对从一个世代转移至另一世代期间的IHR频率存在极强烈的影响,因为全部PPTR幼苗也呈KmR。
SR1(雌性)与04TDNT00000X-00Y间的杂交的后代通常将分离成:
25%仅具有NTM19-ISceI内切核酸酶
25%仅具有IHR构建体
25%同时具有NTM19-I-SceI内切核酸酶+IHR构建体
25%既没有NTM19-I-SceI内切核酸酶,也没有IHR构建体
全部PPTR幼苗也呈KmR的事实表明,全部IHR重组仅发生在含有处于NTM19小孢子特异性启动子控制下的I-SceI内切核酸酶和IHR构建体的部分内。我们的结果表明,在最佳情况下多达11%的含有NTM19-ISceI内切核酸酶+IHR构建体的小孢子已经发生了导致缺陷性egfp-bar融合基因恢复的染色体内同源重组(SR1×04TDNT000006-001)。由于在仅含有IHR构建体的部分中没有得到产生功能性egfp-bar基因的IHR重组,我们可以得出结论,即自发性IHR(在小孢子内缺乏定向DSB诱导情况下)没有发生,或如果自发性IHR的确发生,则它没有导致缺陷性egfp-bar融合基因恢复。相反,小孢子内DSB诱导的IHR允许导致陷性egfp-bar融合基因恢复的更精确的染色体内同源重组。
序列分析显示在通过小孢子内DSB诱导的IHR介导去除选择标记后,没有留下痕迹。
序列表
<110>拜尔生物科学公司(BAYER BIOSCIENCE N.V.)
<120>用于去除所选择DNA序列的方法和手段
<130>BCS 05-2007
<150>EP05075781.4
<151>2005-04-04
<150>US60/669,243
<151>2005-04-07
<160>6
<170>PatentIn 3.3版
<210>1
<211>732
<212>DNA
<213>人工的
<220>
<223>合成的工-SceI编码区(UIPAC)
<220>
<221>变异
<222>(25)..(27)
<223>AGA
<220>
<221>变异
<222>(73)..(75)
<223>AGC
<220>
<221>变异
<222>(97)..(99)
<223>AGC
<220>
<221>变异
<222>(169)..(171)
<223>AGA
<220>
<221>变异
<222>(172)..(174)
<223>AGC
<220>
<221>变异
<222>(175)..(177)
<223>AGA
<220>
<221>变异
<222>(268)..(270)
<223>AGC
<220>
<221>变异
<222>(289)..(291)
<223>AGA
<220>
<221>变异
<222>(436)..(438)
<223>AGC
<220>
<221>变异
<222>(490)..(492)
<223>AGC
<220>
<221>变异
<222>(502)..(504)
<223>AGC
<220>
<221>变异
<222>(523)..(525)
<223>AGC
<220>
<221>变异
<222>(565)..(567)
<223>AGA
<220>
<221>变异
<222>(631)..(633)
<223>AGC
<220>
<221>变异
<222>(637)..(639)
<223>AGC
<220>
<221>变异
<222>(712)..(714)
<223>AGC
<220>
<221>变异
<222>(715)..(717)
<223>AGC
<400>1
atggcyaarc chcchaaraa raarcgsaaa gt saacatya araaraacca ggt satgaac 60
ctsggmccha actcmaarct sctsaargag tacaartcmc arctsatyga rctsaacaty 120
garcarttcg argcyggmat cggmctsaty ctsggmgayg cytacatycg stcmcgsgay 180
garggmaara cytactgyat gcagttcgar tggaaraaca argcytacat ggaycaygts 240
tgyctsctst acgaycartg ggtsctstcm cchcchcaya araargarcg sgtsaaccay 300
ctsggmaacc tsgtsatyac ytggggmgcy caracyttca arcaycargc yttcaacaar 360
ctsgcsaacc tsttcatyct saacaacaar aaracyatyc chaacaacct sgtsgaraac 420
tacctsacyc cyatgtcmct sgcytactgg ttcatggayg ayggmggmaa rtgggaytac 480
aacaaraact cmacyaacaa rtcmatygts ctsaacacyc artcmttcac yttcgargar 540
gtsgartacc tsgtsaargg mctscgsaac aarttccarc tsaactgyta cgtsaagaty 600
aacaaraaca arccyatyat ctacatygay tcmatgtcmt acctsatytt ctacaaccts 660
atyaarccht acctsatycc hcaratgatg tacaarctsc chaacacyat ytcmtcmgar 720
acyttcctsa ar 732
<210>2
<211>732
<212>DNA
<213>人工的
<220>
<223>合成的I-SceI编码区
<400>2
atggccaagc ctcccaagaa gaagcgcaaa gtgaacatca agaagaacca ggtgatgaac 60
ctgggaccta acagcaagct cctgaaggag tacaagagcc agctgatcga actgaacatc 120
gagcagttcg aagctggcat cggcctgatc ctgggcgatg cctacatcag atcccgggac 180
gaaggcaaga cctactgcat gcagttcgag tggaagaaca aggcctacat ggaccacgtg 240
tgtctgctgt acgaccagtg ggtcctgagc cctcctcaca agaaggagcg cgtgaaccat 300
ctgggcaacc tcgtgatcac ctggggagcc cagaccttca agcaccaggc cttcaacaag 360
ctggccaacc tgttcatcgt gaacaacaag aagaccatcc ccaacaacct cgtggagaac 420
tacctcactc ccatgagcct ggcctactgg ttcatggacg acggaggcaa gtgggactac 480
aacaagaaca gcaccaacaa gtcaattgtg ctgaacaccc aaagcttcac cttcgaagaa 540
gtggagtacc tcgtcaaggg cctgcgcaac aagttccagc tgaactgcta cgtgaagatc 600
aacaagaaca agcctatcat ctacatcgac agcatgagct acctgatctt ctacaacctg 660
atcaagccat acctgatccc tcagatgatg tacaagctgc ccaacaccat cagcagcgag 720
accttcctga ag 732
<210>3
<211>1618
<212>DNA
<213>烟草(Nicotiana tabacum)
<220>
<221>TATA_信号
<222>(919)..(922)
<220>
<221>mRNA
<222>(954)..(1573)
<220>
<221>基因
<222>(993)..(1271)
<223>NTM19
<220>
<221>misc_feature
<222>(993)..(1271)
<223>编码区
<400>3
gatccagatt tatagggtcc taatgcgggt actgaacacc aggtgggaaa caaaaaatat 60
acagaacaac tcctttagaa tttacaattt ttgagcgtgt tggcttggta cgattctact 120
tttcatatct ctcgtcatct cctaactcct atggttcacc agccaccgat taattatgac 180
accgctaaca aaaatcttgc gacgacattg agagaaattt cttttcataa attggtaatt 240
cgtacatcat ttataggcgt tagctataac cttttagtta gtgaatacaa tactttttgc 300
tattattatg taacttttag atatgaattt actttcaaaa aaaaaaaaag gatcgatgtt 360
ggttatcaac taaggaccaa ccactttgga cgtctcacca ctaagttaaa taaatcactt 420
tgttctcgaa aaaaacccca aaagtgttaa aatgcttttc atatcataat caaacaacgt 480
gattaataaa atctattaag ttaatagaag tagggaataa atcgggcaaa agaatttgat 540
acaaaccaaa ccggtcaaaa aagctagtat tcatataaat ggactataca agttaatacc 600
agctagcaga aattaaatag tttattaagt tgattacaaa acaattcctc atttaaaaaa 660
agttaatgta atcaagagat cttttgcttc taattgatca gacgaggacc cctcttattt 720
attttctttt tcatataaga ttttgaatag atatagggaa atcttgttca ctctttatct 780
acttcaaatt gcatgcattt taagaattct ctttgtatgc aaacttcagt atttatgatt 840
gacataaatc aatattcata tcttcgataa agttaataac tctcctaata cttatgaata 900
tctcttcctt tacaacccta taaaaccccc cactatagct accttcataa ttcatcttag 960
agtaccaacc ctaaatttct tagtgattaa ccatggctaa gaaaagtctc acttttctca 1020
tttgcatttt cctacttctc aatttatgtt ttgcaattga gaacgtagaa actatgcaaa 1080
aatcggattc atcgtcacaa gataaagaat tagattggtt tcatccgtgg ttccatccac 1140
atccatggtg gctacatcca catccatggc cattcgttca tccgccaatg ccagctggcg 1200
gttttcatca tgcatggcca ttcccccatc caccgatgcc tgctggtggt tttaagtttc 1260
ctcatcaata atttcatcgt catccatggc cattcatgca tccaccagtt ccatctccac 1320
ctaaaggaga caagaattaa ttgaaaatat gaagagaagt gttggatcaa catcttattg 1380
atcacatatt tttctttagg ttaatatctt taggatttat gtcttaggtt atttttgata 1440
aaaattaaaa taaatgatcg ttctagggta gttattataa tttcttagat ttttccaagt 1500
agctttcgat ggtagaaatg ttattaattt gattcggctt atcatgaaat aaaatccgta 1560
gtattattgc tttagctttt atgatttgta gttattttat gttgattgtt ctccattt 1618
<210>4
<211>4683
<212>DNA
<213>人工的
<220>
<223>pTCV63的T-DNA
<220>
<221>misc_feature
<222>(191)..(222)
<223>T-DNA右边界
<220>
<221>misc_feature
<222>(270)..(818)
<223>CaMV35S启动子区域
<220>
<221>misc_feature
<222>(819)..(875)
<223>Cab22前导序列
<220>
<221>misc_feature
<222>(885)..(1391)
<223>eGFP编码区的5’部分
<220>
<221>misc_feature
<222>(1392)..(1409)
<223>I-SceI识别位点
<220>
<221>misc_feature
<222>(1411)..(1419)
<223>Zif268识别位点
<220>
<221>misc_feature
<222>(1433)..(1671)
<223>3’35S聚腺苷酸化区域(互补序列)
<220>
<221>misc_feature
<222>(1683)..(2708)
<223>潮霉素抗性编码区(互补序列)
<220>
<221>misc_feature
<222>(2715)..(2787)
<223>CsVMV前导区(互补序列)
<220>
<221>misc_feature
<222>(2788)..(3227)
<223>CsVMV启动子片段(互补序列)
<220>
<221>misc_feature
<222>(3269)..(3787)
<223>eGFP的3’部分
<220>
<221>misc_feature
<222>(3788)..(4339)
<223>膦丝菌素乙酰转移酶编码区
<220>
<221>misc_feature
<222>(4341)..(4549)
<223>3’nos:转录终止和聚腺苷酸化区域
<220>
<221>misc_feature
<222>(4659)..(4683)
<223>T-DNA右边界
<400>4
agattcgaag ctcggtcccg tgggtgttct gtcgtctcgt tgtacaacga aatccattcc 60
cattccgcgc tcaagatggc ttcccctcgg cagttcatca gggctaaatc aatctagccg 120
acttgtccgg tgaaatgggc tgcactccaa cagaaacaat caaacaaaca tacacagcga 180
cttattcaca cgcgacaaat tacaacggta tatatcctgc cagtactcgg ccgtcgacct 240
gcaggcaatt ggtacctacg tatgcatggc gcgccatatg caccatacat ggagtcaaaa 300
attcagatcg aggatctaac agaactcgcc gtgaagactg gcgaacagtt catacagagt 360
cttttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca cgacactctc 420
gtctactcca agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt 480
caacaaaggg taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc 540
atcaaaagga cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga 600
aaggctatcg ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg 660
aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt 720
gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca agacccttcc 780
tctatataag gaagttcatt tcatttggag aggactcgag ctcatttctc tattacttca 840
gccataacaa aagaactctt ttctcttctt attaaaccaa aaccatggtg agcaagggcg 900
aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc 960
acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga 1020
agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccctga 1080
cctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca 1140
agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca 1200
actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc 1260
tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact 1320
acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact 1380
tcaagatccg ctagggataa cagggtaatg gcgtgggcga ccggtcccgg ccgctgtacc 1440
atgcatgatc tggattttag tactggattt tggttttagg aattagaaat tttattgata 1500
gaagtatttt acaaatacaa atacatacta agggtttctt atatgctcaa cacatgagcg 1560
aaaccctata ggaaccctaa ttcccttatc tgggaactac tcacacatta ttatggagaa 1620
aatagagaga gatagatttg tagagagaga ctggtgattt cagcgtgtcc aagcttgata 1680
tcctattcct ttgccctcgg acgagtgctg gggcgtcggt ttccactatc ggcgagtact 1740
tctacacagc catcggtcca gacggccgcg cttctgcggg cgatttgtgt acgcccgaca 1800
gtcccggctc cggatcggac gattgcgtcg catcgaccct gcgcccaagc tgcatcatcg 1860
aaattgccgt caaccaagct ctgatagagt tggtcaagac caatgcggag catatacgcc 1920
cggagccgcg gcgatcctgc aagctccgga tgcctccgct cgaagtagcg cgtctgctgc 1980
tccatacaag ccaaccacgg cctccagaag aagatgttgg cgacctcgta ttgggaatcc 2040
ccgaacatcg cctcgctcca gtcaatgacc gctgttatgc ggccattgtc cgtcaggaca 2100
ttgttggagc cgaaatccgc gtgcacgagg tgccggactt cggggcagtc ctcggcccaa 2160
agcatcagct catcgagagc ctgcgcgacg gacgcactga cggtgtcgtc catcacagtt 2220
tgccagtgat acacatgggg atcagcaatc gcgcatatga aatcacgcca tgtagtgtat 2280
tgaccgattc cttgcggtcc gaatgggccg aacccgctcg tctggctaag atcggccgca 2340
gcgatcgcat ccatggcctc cgcgaccggc tgcagaacag cgggcagttc ggtttcaggc 2400
aggtcttgca acgtgacacc ctgtgcacgg cgggagatgc aataggtcag gctctcgctg 2460
aattccccaa tgtcaagcac ttccggaatc gggagcgcgg ccgatgcaaa gtgccgataa 2520
acataacgat ctttgtagaa accatcggcg cagctattta cccgcaggac atatccacgc 2580
cctcctacat cgaagctgaa agcacgagat tcttcgccct ccgagagctg catcaggtcg 2640
gagacgctgt cgaacttttc gatcagaaac ttctcgacag acgtcgcggt gagttcaggc 2700
tttttcatct cgagacaaac ttacaaattt ctctgaagtt gtatcctcag tacttcaaag 2760
aaaatagctt acaccaaatt ttttcttgtt ttcacaaatg ccgaacttgg ttccttatat 2820
aggaaaactc aagggcaaaa atgacacgga aaaatataaa aggataagta gtgggggata 2880
agattccttt gtgataaggt tactttccgc ccttacattt tccaccttac atgtgtcctc 2940
tatgtctctt tcacaatcac cgaccttatc ttcttctttt cattgttgtc gtcagtgctt 3000
acgtcttcaa gattcttttc ttcgcctggt tcttcttttt caatttctac gtattcttct 3060
tcgtattctg gcagtatagg atcttgtatc tgtacattct tcatttttga acataggttg 3120
catatgtgcc gcatattgat ctgcttcttg ctgagctcac ataatacttc catagttttt 3180
cccgtaaaca ttggattctt gatgctacat cttggataat taccttcggc gcgccatgca 3240
tacgtaggta ccaattgccg ggaccggtta cggcgtgcag tgcttcagcc gctaccccga 3300
ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg 3360
caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg 3420
cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat 3480
cctggggcac aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa 3540
gcagaagaac ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt 3600
gcagctcgcc gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc 3660
cgacaaccac tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga 3720
tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct 3780
gtacaagatg gacccagaac gacgcccggc cgacatccgc cgtgccaccg aggcggacat 3840
gccggcggtc tgcaccatcg tcaaccacta catcgagaca agcacggtca acttccgtac 3900
cgagccgcag gaaccgcagg agtggacgga cgacctcgtc cgtctgcggg agcgctatcc 3960
ctggctcgtc gccgaggtgg acggcgaggt cgccggcatc gcctacgcgg gcccctggaa 4020
ggcacgcaac gcctacgact ggacggccga gtcgaccgtg tacgtctccc cccgccacca 4080
gcggacggga ctgggctcca cgctctacac ccacctgctg aagtccctgg aggcacaggg 4140
cttcaagagc gtggtcgctg tcatcgggct gcccaacgac ccgagcgtgc gcatgcacga 4200
ggcgctcgga tatgcccccc gcggcatgct gcgggcggcc ggcttcaagc acgggaactg 4260
gcatgacgtg ggtttctggc agctggactt cagcctgccg gtaccgcccc gtccggtcct 4320
gcccgtcacc gagatctgag ctagcacgcg tctaggatcc gaagcagatc gttcaaacat 4380
ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata 4440
atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat 4500
gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa 4560
aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatcg 4620
ggaagatcct ctagatacgt agcgatcgcc atggagccat ttacaattga atatatcctg 4680
ccg 4683
<210>5
<211>4992
<212>DNA
<213>人工的
<220>
<223>pTCV64的T-DNA
<220>
<221>misc_feature
<222>(191)..(222)
<223>T-DNA右边界
<220>
<221>misc_feature
<222>(270)..(818)
<223>CaMV35S启动子片段
<220>
<221>misc_feature
<222>(819)..(875)
<223>cab22前导片段
<220>
<221>misc_feature
<222>(885)..(1553)
<223>eGFP编码区的5’部分
<220>
<221>misc_feature
<222>(1554)..(1571)
<223>I-SceI识别位点
<220>
<221>misc_feature
<222>(1573)..(1581)
<223>Zif268识别位点
<220>
<221>misc_feature
<222>(1595)..(1833)
<223>3’35S转录终止和聚腺苷酸化区域(互补序列)
<220>
<221>misc_feature
<222>(1845)..(2870)
<223>潮霉素磷酸转移酶编码区
<220>
<221>misc_feature
<222>(2877)..(2949)
<223>CsVMV的前导区(互补序列)
<220>
<221>misc_feature
<222>(2950)..(3389)
<223>CsVMV启动子片段(互补序列)
<220>
<221>misc_feature
<222>(3431)..(4096)
<223>eGFP编码区的3’部分
<220>
<221>misc_feature
<222>(4097)..(4648)
<223>膦丝菌素乙酰转移酶编码区
<220>
<221>misc_feature
<222>(4650)..(4858)
<223>3’nos:胭脂氨酸合酶基因的转录终止和聚腺苷酸化区域
<220>
<221>misc_feature
<222>(4968)..(4992)
<223>T-DNA左边界序列
<400>5
agattcgaag ctcggtcccg tgggtgttct gtcgtctcgt tgtacaacga aatccattcc 60
cattccgcgc tcaagatggc ttcccctcgg cagttcatca gggctaaatc aatctagccg 120
acttgtccgg tgaaatgggc tgcactccaa cagaaacaat caaacaaaca tacacagcga 180
cttattcaca cgcgacaaat tacaacggta tatatcctgc cagtactcgg ccgtcgacct 240
gcaggcaatt ggtacctacg tatgcatggc gcgccatatg caccatacat ggagtcaaaa 300
attcagatcg aggatctaac agaactcgcc gtgaagactg gcgaacagtt catacagagt 360
cttttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca cgacactctc 420
gtctactcca agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt 480
caacaaaggg taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc 540
atcaaaagga cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga 600
aaggctatcg ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg 660
aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt 720
gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca agacccttcc 780
tctatataag gaagttcatt tcatttggag aggactcgag ctcatttctc tattacttca 840
gccataacaa aagaactctt ttctcttctt attaaaccaa aaccatggtg agcaagggcg 900
aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc 960
acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga 1020
agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccctga 1080
cctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca 1140
agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca 1200
actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc 1260
tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact 1320
acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact 1380
tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga 1440
acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt 1500
ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagtagggat 1560
aacagggtaa tggcgtgggc gaccggtccc ggccgctgta ccatgcatga tctggatttt 1620
agtactggat tttggtttta ggaattagaa attttattga tagaagtatt ttacaaatac 1680
aaatacatac taagggtttc ttatatgctc aacacatgag cgaaacccta taggaaccct 1740
aattccctta tctgggaact actcacacat tattatggag aaaatagaga gagatagatt 1800
tgtagagaga gactggtgat ttcagcgtgt ccaagcttga tatcctattc ctttgccctc 1860
ggacgagtgc tggggcgtcg gtttccacta tcggcgagta cttctacaca gccatcggtc 1920
cagacggccg cgcttctgcg ggcgatttgt gtacgcccga cagtcccggc tccggatcgg 1980
acgattgcgt cgcatcgacc ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag 2040
ctctgataga gttggtcaag accaatgcgg agcatatacg cccggagccg cggcgatcct 2100
gcaagctccg gatgcctccg ctcgaagtag cgcgtctgct gctccataca agccaaccac 2160
ggcctccaga agaagatgtt ggcgacctcg tattgggaat ccccgaacat cgcctcgctc 2220
cagtcaatga ccgctgttat gcggccattg tccgtcagga cattgttgga gccgaaatcc 2280
gcgtgcacga ggtgccggac ttcggggcag tcctcggccc aaagcatcag ctcatcgaga 2340
gcctgcgcga cggacgcact gacggtgtcg tccatcacag tttgccagtg atacacatgg 2400
ggatcagcaa tcgcgcatat gaaatcacgc catgtagtgt attgaccgat tccttgcggt 2460
ccgaatgggc cgaacccgct cgtctggcta agatcggccg cagcgatcgc atccatggcc 2520
tccgcgaccg gctgcagaac agcgggcagt tcggtttcag gcaggtcttg caacgtgaca 2580
ccctgtgcac ggcgggagat gcaataggtc aggctctcgc tgaattcccc aatgtcaagc 2640
acttccggaa tcgggagcgc ggccgatgca aagtgccgat aaacataacg atctttgtag 2700
aaaccatcgg cgcagctatt tacccgcagg acatatccac gccctcctac atcgaagctg 2760
aaagcacgag attcttcgcc ctccgagagc tgcatcaggt cggagacgct gtcgaacttt 2820
tcgatcagaa acttctcgac agacgtcgcg gtgagttcag gctttttcat ctcgagacaa 2880
acttacaaat ttctctgaag ttgtatcctc agtacttcaa agaaaatagc ttacaccaaa 2940
ttttttcttg ttttcacaaa tgccgaactt ggttccttat ataggaaaac tcaagggcaa 3000
aaatgacacg gaaaaatata aaaggataag tagtggggga taagattcct ttgtgataag 3060
gttactttcc gcccttacat tttccacctt acatgtgtcc tctatgtctc tttcacaatc 3120
accgacctta tcttcttctt ttcattgttg tcgtcagtgc ttacgtcttc aagattcttt 3180
tcttcgcctg gttcttcttt ttcaatttct acgtattctt cttcgtattc tggcagtata 3240
ggatcttgta tctgtacatt cttcattttt gaacataggt tgcatatgtg ccgcatattg 3300
atctgcttct tgctgagctc acataatact tccatagttt ttcccgtaaa cattggattc 3360
ttgatgctac atcttggata attaccttcg gcgcgccatg catacgtagg taccaattgc 3420
cgggaccggt gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg 3480
cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct 3540
gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg 3600
ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt 3660
ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa 3720
gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga 3780
cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat 3840
ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga 3900
cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt 3960
gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga 4020
gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat 4080
ggacgagctg tacaagatgg acccagaacg acgcccggcc gacatccgcc gtgccaccga 4140
ggcggacatg ccggcggtct gcaccatcgt caaccactac atcgagacaa gcacggtcaa 4200
cttccgtacc gagccgcagg aaccgcagga gtggacggac gacctcgtcc gtctgcggga 4260
gcgctatccc tggctcgtcg ccgaggtgga cggcgaggtc gccggcatcg cctacgcggg 4320
cccctggaag gcacgcaacg cctacgactg gacggccgag tcgaccgtgt acgtctcccc 4380
ccgccaccag cggacgggac tgggctccac gctctacacc cacctgctga agtccctgga 4440
ggcacagggc ttcaagagcg tggtcgctgt catcgggctg cccaacgacc cgagcgtgcg 4500
catgcacgag gcgctcggat atgccccccg cggcatgctg cgggcggccg gcttcaagca 4560
cgggaactgg catgacgtgg gtttctggca gctggacttc agcctgccgg taccgccccg 4620
tccggtcctg cccgtcaccg agatctgagc tagcacgcgt ctaggatccg aagcagatcg 4680
ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 4740
tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 4800
gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 4860
agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 4920
actagatcgg gaagatcctc tagatacgta gcgatcgcca tggagccatt tacaattgaa 4980
tatatcctgc cg 4992
<210>6
<211>3987
<212>DNA
<213>人工的
<220>
<223>pTCV72的T-DNA
<220>
<221>misc_feature
<222>(191)..(222)
<223>T-DNA右边界
<220>
<221>misc_feature
<222>(251)..(539)
<223>3’ocs:章鱼碱合酶基因的聚腺苷酸化区域和聚腺苷酸化区域(互补序列)
<220>
<221>misc_feature
<222>(713)..(1510)
<223>新霉素磷酸转移酶II编码区(互补序列)
<220>
<221>misc_feature
<222>(1511)..(1529)
<223>接头序列
<220>
<221>misc_feature
<222>(1530)..(1816)
<223>胭脂氨酸合酶启动子片段(互补序列)
<220>
<221>misc_feature
<222>(1817)..(1929)
<223>接头序列
<220>
<221>misc_feature
<222>(1941)..(2926)
<223>来自烟草的NTM19基因的启动子片段
<220>
<221>misc_feature
<222>(2928)..(2961)
<223>核定位信号
<220>
<221>misc_feature
<222>(2962)..(3661)
<223>I-SceI编码区
<220>
<221>misc_feature
<222>(3665)..(3913)
<223>3’35S转录终止和聚腺苷酸化片段
<220>
<221>misc_feature
<222>(3963)..(3987)
<223>T-DNA左边界区
<400>6
agattcgaag ctcggtcccg tgggtgttct gtcgtctcgt tgtacaacga aatccattcc 60
cattccgcgc tcaagatggc ttcccctcgg cagttcatca gggctaaatc aatctagccg 120
acttgtccgg tgaaatgggc tgcactccaa cagaaacaat caaacaaaca tacacagcga 180
cttattcaca cgcgacaaat tacaacggta tatatcctgc cagtactcgg ccgtcgacct 240
gcaggcaatt gtttgttatt gtggcgctct atcatagatg tcgctataaa cctattcagc 300
acaatatatt gttttcattt taatattgta catataagta gtagggtaca atcagtaaat 360
tgaacggaga atattattca taaaaatacg atagtaacgg gtgatatatt cattagaatg 420
aaccgaaacc ggcggtaagg atctgagcta cacatgctca ggttttttac aacgtgcaca 480
acagaattga aagcaaatat catgcgatca taggcgtctc gcatatctca ttaaagcagg 540
gggtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca gccggcgtcc 600
cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc gaaatctcgt 660
gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc gctcagaaga 720
actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg ataccgtaaa 780
gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca cgggtagcca 840
acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg aatccagaaa 900
agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc acgacgagat 960
cctcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc gcgagcccct 1020
gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga gtacgtgctc 1080
gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca agcgtatgca 1140
gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg tgagatgaca 1200
ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct tcagtgacaa 1260
cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc cgcgctgcct 1320
cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga accgggcgcc 1380
cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt tgtgcccagt 1440
catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat ccatcttgtt 1500
caatccacat gatcatgggc cggatctttg attgagagtg aatatgagac tctaattgga 1560
taccgagggg aatttatgga acgtcagtgg agcatttttg acaagaaata tttgctagct 1620
gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta tgtgcttagc 1680
tcattaaact ccagaaaccc gcggctgagt ggctccttca atcgttgcgg ttctgtcagt 1740
tccaaacgta aaacggcttg tcccgcgtca tcggcggggg tcataacgtg actcccttaa 1800
ttctccgctc atgatcctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacat 1860
tatacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gaattgacgg 1920
gatctatggc gcgccatatg agatttatag ggtcctaatg cgggtactga acaccaggtg 1980
ggaaacaaaa aatatacaga acaactcctt tagaatttac aatttttgag cgtgttggct 2040
tggtacgatt ctacttttca tatctctcgt catctcctaa ctcctatggt tcaccagcca 2100
ccgattaatt atgacaccgc taacaaaaat cttgcgacga cattgagaga aatttctttt 2160
cataaattgg taattcgtac atcatttata ggcgttagct ataacctttt agttagtgaa 2220
tacaatactt tttgctatta ttatgtaact tttagatatg aatttacttt caaaaaaaaa 2280
aaaaggatcg atgttggtta tcaactaagg accaaccact ttggacgtct caccactaag 2340
ttaaataaat cactttgttc tcgaaaaaaa ccccaaaagt gttaaaatgc ttttcatatc 2400
ataatcaaac aacgtgatta ataaaatcta ttaagttaat agaagtaggg aataaatcgg 2460
gcaaaagaat ttgatacaaa ccaaaccggt caaaaaagct agtattcata taaatggact 2520
atacaagtta ataccagcta gcagaaatta aatagtttat taagttgatt acaaaacaat 2580
tcctcattta aaaaaagtta atgtaatcaa gagatctttt gcttctaatt gatcagacga 2640
ggacccctct tatttatttt ctttttcata taagattttg aatagatata gggaaatctt 2700
gttcactctt tatctacttc aaattgcatg cattttaaga attctctttg tatgcaaact 2760
tcagtattta tgattgacat aaatcaatat tcatatcttc gataaagtta ataactctcc 2820
taatacttat gaatatctct tcctttacaa ccctataaaa ccccccacta tagctacctt 2880
cataattcat cttagagtac caaccctaaa tttcttagtg attaaccatg gctaaacccc 2940
ccaagaagaa gcgcaaggtt aacatcaaaa aaaaccaggt aatgaacctg ggtccgaact 3000
ctaaactgct gaaagaatac aaatcccagc tgatcgaact gaacatcgaa cagttcgaag 3060
caggtatcgg tctgatcctg ggtgatgctt acatccgttc tcgtgatgaa ggtaaaacct 3120
actgtatgca gttcgagtgg aaaaacaaag catacatgga ccacgtatgt ctgctgtacg 3180
atcagtgggt actgtccccg ccgcacaaaa aagaacgtgt taaccacctg ggtaacctgg 3240
taatcacctg gggcgcccag actttcaaac accaagcttt caacaaactg gctaacctgt 3300
tcatcgttaa caacaaaaaa accatcccga acaacctggt tgaaaactac ctgaccccga 3360
tgtctctggc atactggttc atggatgatg gtggtaaatg ggattacaac aaaaactcta 3420
ccaacaaatc gatcgtactg aacacccagt ctttcacttt cgaagaagta gaatacctgg 3480
ttaagggtct gcgtaacaaa ttccaactga actgttacgt aaaaatcaac aaaaacaaac 3540
cgatcatcta catcgattct atgtcttacc tgatcttcta caacctgatc aaaccgtacc 3600
tgatcccgca gatgatgtac aaactgccga acactatctc ctccgaaact ttcctgaaat 3660
agggctagca agct tggaca cgctgaaatc accagtctct ctctacaaat ctatctctct 3720
ctattttctc cataataatg tgtgagtagt tcccagataa gggaattagg gttcctatag 3780
ggtttcgctc atgtgttgag catataagaa acccttagta tgtatttgta tttgtaaaat 3840
acttctatca ataaaatttc taattcctaa aaccaaaatc cagtactaaa atccagatca 3900
tgcatggtac agcggccgcg ttaacgcgta tactctagat acgtagcgat cgccatggag 3960
ccatttacaa ttgaatatat cctgccg 3987