CN101815432A - 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 - Google Patents

涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 Download PDF

Info

Publication number
CN101815432A
CN101815432A CN200880104809A CN200880104809A CN101815432A CN 101815432 A CN101815432 A CN 101815432A CN 200880104809 A CN200880104809 A CN 200880104809A CN 200880104809 A CN200880104809 A CN 200880104809A CN 101815432 A CN101815432 A CN 101815432A
Authority
CN
China
Prior art keywords
plant
sequence
recombinant dna
genetically modified
construction body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880104809A
Other languages
English (en)
Inventor
G·塔拉米诺
S·V·廷盖
H·萨凯
S·M·艾伦
D·托姆斯
S·拉克
牛小牧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Publication of CN101815432A publication Critical patent/CN101815432A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1229Phosphotransferases with a phosphate group as acceptor (2.7.4)

Abstract

本发明描述了尤其可用于改变植物的根构造的分离的多核苷酸和多肽及重组DNA构建体、包含这些重组DNA构建体的组合物(例如植物或种子),以及利用这些重组DNA构建体的方法。所述重组DNA构建体包含可操作地连接在植物中有功能的启动子的多核苷酸,其中所述多核苷酸编码可用于改变植物根构造的多肽。

Description

涉及编码核苷二磷酸激酶(NDK)多肽及其同源物的基因的用于修改植物根构造的方法
本专利申请要求提交于2007年8月29日的美国临时申请60/968754的优先权,其全部内容以引用方式并入本文。
发明领域
本发明领域涉及植物育种和遗传学以及具体地讲涉及用于改变植物根构造的重组DNA构建体。
发明背景
在所有(除了非常少的几个之外)自然生态系统中,水和营养物质的可用性限制了植物生长。它们在大多数农业生态系统中限制产量。植物根部起到重要作用,如水和营养物质摄取、在土壤中固定植物以及在根围建立生物相互作用。因此阐明植物根发育和功能的基因调控是农学和生态学中相当受关注的课题。
根系发源于在胚胎形成期间发育的初生根。初生根产生次生根,次生根继而产生三生根。所有次生、三生、四生以及更进一步分生的根均被称为侧根。包括玉米在内的许多植物也能从连续的地下节位(冠根)或地上节位(支柱根)处产生不定根。有三个主要过程影响根系的总体构造。第一个是在初生根分裂组织中的细胞分裂过程,该过程通过加入新生细胞到根中使得根不定生长。第二个是侧根形成过程,该过程增加根系的探索能力。第三个是根毛形成过程,该过程增加初生根和侧根的总表面(Lopez-Bucio等人,Current Opinion in PlantBiology(2003)6:280-287)。在已经分离出的玉米突变体中仅仅缺少根型的一个亚型。已经鉴定了拟南芥的根形态基因突变体如SHORTROOT和SCARECROW,它显示初生根和侧根的发育缺陷(J.E.Malamy,Plant,Cell and Environment(2005)28:67-77)。
已经鉴定了许多特异性影响根发育的玉米突变体(Hochholdinger等人,2004,Annals of Botany 93:359-368)。隐性突变体rtcs和rt1不形成或形成较少的冠根和支柱根,然而初生根和侧根不受影响。在隐性突变体des21中,缺失侧生种子根和根毛。隐性突变体rth1-3缺失根毛。突变体lrt1和rum1在侧根开始产生之前受影响,而突变体slr1和slr2的侧根伸长能力受到削弱。决定根系构造的内源响应途径包括激素、细胞循环调节子和调节基因。水分胁迫和营养物质可用性属于决定根系构造的环境响应途径。
提交于2005年2月14日的美国专利申请2005-57473(美国专利公开公布2005/223429A1,公布于2005年10月6日)涉及使用拟南芥细胞分裂素氧化酶基因改变植物中的细胞分裂素含量并刺激根生长。
美国专利公开6,344,601(公布于2002年2月5日)涉及在植物细胞中低表达或超表达肌动蛋白抑制蛋白(profilin)以改变植物生长习性例如减少根系或根毛系统会使花期推迟。
WO2004/US16432(提交于2004年5月21日(WO2004/106531,公布于2004年12月9日)涉及使用超表达顺式异戊烯转移酶的方法操纵生长速率和/或产量和/或构造。
提交于2004年9月30日的美国专利申请2004/489500(美国专利公开公布2005/059154A1,公布于2005年3月13日)涉及使用在植物中超表达转录因子E2F的方法改变细胞数量、构造和产量。
可利用激活标记来鉴定能影响性状的基因。已经在模型植物拟南芥中使用该方法(Weigel等人,2000,Plant Physiol.122:1003-1013)。
插入转录增强子元件能够显著激活和/或提高附近内源基因的表达。
发明概述
本发明包括:
在一个实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:25比较时具有至少80%的序列同一性或在与SEQ ID NO:23比较时具有至少85%的序列同一性,或在与SEQ ID NO:21比较时具有至少90%的序列同一性,或在与SEQ ID NO:33比较时具有至少95%的序列同一性。
在第二实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:25比较时具有至少85%的序列同一性,或在与SEQ ID NO:23比较时具有至少90%的序列同一性,或在与SEQ ID NO:21比较时具有至少95%的序列同一性。
在第三实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:25比较时具有至少90%的序列同一性,或在与SEQ ID NO:23比较时具有至少95%的序列同一性。
在第四实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:25比较时具有至少95%的序列同一性。
在第五实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列,其中所述多肽的氨基酸序列包含SEQ ID NO:21、23、25或33。
在第六实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码NDK或NDK样多肽的核酸序列,其中所述核酸序列包含SEQ IDNO:20、22、24或32。
在另一个实施方案中,包含任一前述多核苷酸的载体和重组构建体,以及包含所述重组构建体的细胞。
在另一个实施方案中,用任一前述多核苷酸来转化细胞的方法,以及用于生产和再生包含任一前述多核苷酸的转化植物的方法。
在另一个实施方案中,在基因组中包含重组DNA构建体的植物,该重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出改变的根构造。
在另一个实施方案中,在基因组中包含重组DNA构建体的植物,该重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或
(b)抑制DNA构建体,所述抑制DNA构建体包含至少一个调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
在另一个实施方案中,改变植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;以及(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该DNA构建体的对照植物比较时表现出改变的根构造;并且任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该DNA构建体的对照植物比较时表现出改变的根构造。
在另一个实施方案中,评价植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价与未包含该重组DNA构建体的对照植物比较时该转基因植物的根构造;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。
在另一个实施方案中,评价植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。
在另一个实施方案中,确定植物农学特性改变的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)确定该转基因植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)确定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特性改变的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;并且(d)确定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)确定该转基因植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;
以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及任选地,(e)确定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体,并且当与未包含所述抑制DNA构建体的对照植物比较时表现出改变的根构造;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(d)测定所述子代植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,改变植物根构造的方法,该方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;以及
(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造;以及
任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且其中该子代植物在与未包含该抑制DNA构建体的对照植物比较时表现出改变的农学特性;
在另一个实施方案中,评价植物根构造的方法,该方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)评价与未包含该抑制DNA构建体的对照植物比较时该转基因植物的根构造;
以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及任选地,(e)评价与未包含该抑制DNA构建体的对照植物比较时该子代植物的根构造。
在另一个实施方案中,评价植物根构造的方法,该方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(d)评价当与未包含所述抑制DNA构建体的对照植物比较时所述子代植物的根构造。
本发明中还包括上述植物的任何子代、上述植物的任何种子以及来自任一上述植物和子代植物的细胞。
生产可作为产品销售的种子的方法,该种子提供改变的根构造,该方法包括任一前述优选的方法,并且还包括从所述子代植物获得种子,其中所述种子在它们的基因组中包含所述重组DNA构建体。
附图以及序列表的说明
根据以下的详细描述和附图以及序列表,可更全面地理解本发明,以下的详细描述和附图以及序列表形成本申请的一部分。
图1示出pHSbarENDs激活标记构建体(SEQ ID NO:1)的图谱,该构建体用于制备拟南芥种群。
图2示出载体pDONRTM/Zeo(SEQ ID NO:2)的图谱。attP1位点位于核苷酸570至801;attP2位点位于核苷酸2754至2985(互补链)。
图3示出载体pDONRTM221(SEQ ID NO:3)的图谱。attP1位点位于核苷酸570至801;attP2位点位于核苷酸2754至2985(互补链)。
图4示出载体pBC-yellow(SEQ ID NO:4)的图谱,该载体是用于构建拟南芥表达载体的目的载体。attR1位点位于核苷酸11276至11399(互补链);attR2位点位于核苷酸9695至9819(互补链)。
图5示出PHP27840(SEQ ID NO:5)的图谱,该载体是用于构建大豆表达载体的目的载体。attR1位点位于核苷酸7310至7434;attR2位点位于核苷酸8890至9014。
图6示出PHP23236(SEQ ID NO:6)的图谱,该载体是用于构建Gaspe Bay Flint来源的玉米品系的表达载体的目的载体。attR1位点位于核苷酸2006至2130;attR2位点位于核苷酸2899至3023。
图7示出PHP10523(SEQ ID NO:7)的图谱,它是存在于农杆菌菌株LBA4404中的质粒DNA。
图8示出PHP23235(SEQ ID NO:8)的图谱,它是用于构建目的载体PHP23236的载体。
图9示出了入门克隆PHP20234(SEQ ID NO:9)的图谱,它是转运PINII终止子的载体。attR2位点位于核苷酸591至747;attL3位点位于核苷酸1100至1195。
图10示出PHP28529(SEQ ID NO:10)的图谱,该载体是用于构建玉米品系表达载体的目的载体。attR3位点位于核苷酸3613至3737;attR4位点位于核苷酸2035至2159。
图11示出了入门克隆PHP28408(SEQ ID NO:11)的图谱,它是转运组成型玉米GOS2启动子的载体。attL4位点位于核苷酸160至255;attR1位点位于核苷酸2301至2447。
图12示出了入门克隆PHP22020(SEQ ID NO:12)的图谱,它是转运玉米根NAS2启动子的载体。attR1位点位于核苷酸31至187;attL4位点位于核苷酸2578至2673。
图13示出PHP29635(SEQ ID NO:13)的图谱,该载体是用于构建Gaspe Bay Flint来源的玉米品系的表达载体的目的载体。attR1位点位于核苷酸40786至40910;attR2位点位于核苷酸41679至41803。
图14示出PIIOXS2a-FRT87(ni)m(SEQ ID NO:56)的图谱,该载体用于构建目的载体PHP29635。
图15A至15K示出以下全长氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、和37,以及SEQ IDNO:44、45、46、47、48、49和51。完全匹配共有序列的残基显示为暗色。将共有序列显示于每个比对上部。共有残基通过直接取多数决定。
图16示出图15A至15K中示出的NDK同源物的每对氨基酸序列的序列同一性百分比和趋异值图表。
图17是实施例17中用于半水栽玉米生长的培养基。
图18是列出实施例17中与不同硝酸盐浓度对Gaspe Bay Flint衍生的玉米系生长和发育的影响相关的数据的图表。
序列描述以及所附序列表遵循如37C.F.R.§1.821-1.825所列出的关于专利申请中核苷酸和/或氨基酸序列公开的规定。
序列表包含用于核苷酸序列字符的单字母码和用于氨基酸的三字母码,如遵照IUPAC-IUBMB标准所定义的,该标准在Nucleic Acids Res.13:3021-3030(1985)以及在Biochemical J.219(No.2):345-373(1984)中描述,这两篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中所列出的规定。
SEQ ID NO:1pHSbarENDs
SEQ ID NO:2pDONRTM/Zeo
SEQ ID NO:3pDONRTM221
SEQ ID NO:4pBC-yellow
SEQ ID NO:5PHP27840
SEQ ID NO:6PHP23236
SEQ ID NO:7PHP10523
SEQ ID NO:8PHP23235
SEQ ID NO:9PHP20234
SEQ ID NO:10PHP28529
SEQ ID NO:11PHP28408
SEQ ID NO:12PHP22020
SEQ ID NO:13PHP29635
表1列出了本文所述的多肽、包含编码多肽全部或其主要部分的核酸片段的cDNA克隆的命名、以及在所附序列表中使用的对应标识符(SEQ ID NO:)。
表1
核苷二磷酸激酶(NDK)
  蛋白质   克隆命名   SEQ ID NO:(核苷酸)  SEQ ID NO:(氨基酸)
  NDK   cest1s.pk013.p8:fis   14  15
  NDK   cfp2n.pk070.b22:fis   16  17
  NDK   cdr1f.pk002.a3.f:fis或以下的重叠群:cfp2n.pk069.c16cfp2n.pk069.c16.f   18  19
  NDK   lds1c.pk004.f12:fis   20  21
  NDK   ep2c.pk002.f17.f:fis   22  23
  NDK   ort1f.pk020.a13:fis   24  25
  NDK   hss1c.pk019.a16:fis   26  27
  NDK   sfl1.pk134.d19:fis   28  29
  NDK   egh1c.pk002.l14:fis   30  31
  蛋白质   克隆命名   SEQ ID NO:(核苷酸)  SEQ ID NO:(氨基酸)
  NDK   sfl1.pk133.14:fis   32  33
  NDK   my.p0031.ccmbo48   34  35
  NDK   p0095.cwsab57ra   36  37
  NDK   sfl1.pk126.p10   38  39
  NDK   rlr24.pk0071.e7   40  41
  NDK   cfp2n.pk069.c16   42  43
SEQ ID NO:44对应于NCBI GI NO:115465831(水稻)
SEQ ID NO:45对应于NCBI GI No:6435320(豌豆)
SEQ ID NO:46对应于NCBI GI No:15237018(拟南芥)
SEQ ID NO:47对应于NCBI GI No:147864944(葡萄藤)
SEQ ID NO:48对应于NCBI GI No:62870979(菥蓂)
SEQ ID NO:49对应于NCBI GI No:125595441(水稻)
SEQ ID NO:50是拟南芥核苷二磷酸激酶(NDK)(AT4G23900)的核苷酸序列,其中氨基酸序列的核苷酸51-764(终止)代码示于SEQID NO:51,NCBI General Identifier No.11990430)中。
SEQ ID NO:51对应于NCBI GI NO:11990430(AT4G23900)
SEQ ID NO:52是attB1序列。
SEQ ID NO:53是attB2序列。
SEQ ID NO:54是实施例9中的正向引物VC062。
SEQ ID NO:55是实施例9中的反向引物VC063。
SEQ ID NO:56PIIOXS2a-FRT87(ni)m。
SEQ ID NO:57是玉米NAS2启动子。
SEQ ID NO:58是GOS2启动子。
SEQ ID NO:59是泛素启动子。
SEQ ID NO:60是S2A启动子。
SEQ ID NO:61是PINII终止子。
优选实施方案的具体描述
本文中所列出的每篇参考文献的公开内容的全文以引用的方式并入本文。
如本文所用的并在所附的权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如,“一株植物”的涵义包括多株此类植物。“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
术语“根构造”指构成根的不同部分的布置方式。术语“根构造”、“根结构”、“根系”或“根系构造”在这里可互换使用。
一般来讲,植物由胚发育成的第一种根称为初生根。在大多数双子叶植物中,初生根被称为主根。这种主根向下生长并产生分枝根(侧根)。在单子叶植物中,植物的初生根发生分枝,生成须根系。
术语“改变的根构造”指与参照植株或对照植株比较,在其不同发育阶段构成根系的不同部分的改变状况。应当理解,改变的根构造涵盖了一种或多种可测量参数(包括但不限于一个或多个根系部分的直径、长度、数目、角度或表面)的改变,所述根系部分包括但不限于初生根、侧根或分枝根、不定根和根毛,所有这些均在本发明的范围内。这些改变可导致根所占的区域或空间的整体改变。参照植株或对照植株在其基因组中不含重组DNA构建体或异源构建体。
“农学特性”是可测量的参数,包括但不限于绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮胁迫耐受性、氮摄取、根倒伏、茎倒伏、植株高度、穗长和收获指数。
“氮胁迫耐受性”是植物的特性,指植物在氮限制条件下存活的能力。
植物“提高的氮胁迫耐受性”相对于参照或对照植物进行测量,并意指植物的氮胁迫耐受性在与参照或对照植物进行比较时提高的任何量或量度。
“氮胁迫耐受性植物”是指表现出氮胁迫耐受性的植物。氮胁迫耐受性植物优选地是在氮限制条件下相对于对照植物在至少一种农学特性上表现出提高的植物。
术语“V”阶段是指玉米植物的叶片生长阶段;例如V4=四片、V5=五片具有可见叶颈的叶片。叶颈是浅色领状“带”,位于暴露的叶片底部,靠近叶片接触植物茎部的区域。进行叶片计数,开始时计数最底下的、短的、圆顶真叶,最后计数具有可见叶颈的最上面的叶片。
“ndk”、“at-ndk本文可互换使用,指拟南芥位点AT4G23900(SEQID NO:50)。
NDK指AT4G23900(SEQ ID NO:50)编码的蛋白(SEQ ID NO:51)。
“ndk样”指拟南芥“NDK”位点AT4G23900(SEQ ID NO:50)的来自不同物种的核苷酸同源物,如玉米和大豆,并且不受限制的包括任何以下核苷酸序列:SEQ ID NO:14、16、18、20、22、24、26、28、30、32、34、36、38、40、和42。
“NDK样”指拟南芥“NDK”(SEQ ID NO:51)的来自不同物种的蛋白同源物,如玉米和大豆,并且不受限制的包括任何以下氨基酸序列:SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、和43。
在公开数据库中将拟南芥序列(AT4G23900)称为NDK4,将来自水稻、拟南芥和阿尔卑斯菥蓂、以及葡萄藤(分别是NCBI Gi No:115465831、15237018、62870979、和1477864944)的蛋白称为NDKIII,将来自豌豆、以及水稻(分别是6435320和125595441)的蛋白称为NDKI。不清楚什么决定NDK家族的不同成员的数目,因此该公开的序列通称为NDK或NDK样。所有所述公开NDK、全长NDK样蛋白同源物(SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、和37以及所述拟南芥NDK(SEQ ID NO:51)包含保守组氨酸,具有序列NXXHGSDXX。
“环境条件”指植物生长的条件,例如水的可用性、营养物质(例如氮)的可用性或者病害的存在。
“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
“基因组”在用于植物细胞时不仅涵盖存在于细胞核中的染色体DNA,而且还包括存在于细胞的亚细胞组分(如线粒体、质粒)中的细胞器DNA。
“植物”包括整个植株、植物器官、植物组织、种子和植物细胞以及同一植株的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。
“子代”包括植物的任何后续世代。
“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
“转基因植物”包括在其基因组内包含异源多核苷酸的植物。优选的是,异源多核苷酸被稳定地整合进基因组中,使得该多核苷酸传递至连续的世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。
针对序列而言的“异源”意指来自外来物种的序列,或者如果来自相同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。
“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用并且是任选含有合成的、非天然的或改变的核苷酸碱基的单链或双链RNA或DNA聚合物。核苷酸(通常以它们的5′-单磷酸形式存在)通过如下它们的单个字母名称来指代:“A”为腺苷酸或脱氧腺苷酸(分别对应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,而“N”表示任意核苷酸。
“多肽”、“肽”、“氨基酸序列”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”还可包括修饰,包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。
“信使RNA(mRNA)”指无内含子并且可通过细胞翻译成蛋白质的RNA。
“cDNA”指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。
“成熟”蛋白质指经翻译后加工的多肽;即已经去除了存在于初级翻译产物中的任何前肽或原肽的多肽。
“前体”蛋白质指mRNA的翻译初级产物;即具有仍然存在的前肽和原肽。前肽和原肽可以是并且不限于细胞内定位信号。
“分离的”指物质,例如核酸和/或蛋白质,该物质基本上不含在天然存在的环境中通常伴随该物质或与其反应的组分,或者说是该物质被从所述组分移出。分离的多核苷酸可从它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。
“重组体”指例如通过化学合成或者通过用基因工程技术操纵分离的核酸片段来实现的两个原本分离的序列片段的人工组合。“重组体”也包括指已经通过引入异源核酸而进行了修饰的细胞或载体,或源于经这样修饰的细胞的细胞,但不涵盖由天然发生的事件(如自发突变、自然转化/转导/转座)对细胞或载体的改变,例如没有蓄意人为干扰而发生的那些。
“重组DNA构建体”指在自然界中通常不会一起存在的核酸片段的组合。因此,重组DNA构建体可包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于通常天然存在的方式排列的调控序列和编码序列。
术语“入门克隆”和“入门载体”本文可互换使用。
“调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”指能够控制另一核酸片段转录的核酸片段。
“在植物中有功能的启动子”指能够控制植物细胞中的转录的启动子,无论其是否来源于植物细胞。
“组织特异性启动子”和“组织优选启动子”可互换使用,并且指主要但非必须专一地在一种组织或器官中表达,而是也可在一种特定细胞中表达的启动子。
“发育调控启动子”指其活性由发育事件决定的启动子。
术语“可操作地连接”指核酸片段联合成单一片段,使得其中一个核酸片段的功能受到另一个核酸片段的调控。例如,在启动子能够调控核酸片段的转录时,该启动子与该核酸片段进行了可操作地连接。
“表达”指功能产物的产生。因此,核酸片段的表达可指核酸片段的转录(如生成mRNA或功能RNA的转录)和/或RNA翻译成前体或成熟蛋白质。
“表型”意指细胞或生物体的可检测的特征。
有关将核酸片段(例如重组DNA构建体)插入细胞内的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内,转变成自主的复制子或瞬时表达(如转染的mRNA)。
“转化细胞”是将核酸片段(如重组DNA构建体)引入其中的任何细胞。
在此所用的“转化”指稳定转化和瞬时转化两者。
“稳定转化”指将核酸片段引入宿主生物体的基因组中,导致基因稳定遗传。一旦稳定转化,核酸片段稳定地整合进宿主生物体和任何连续世代的基因组中。
“瞬时转化”指将核酸片段引入宿主生物体的核中或包含DNA的细胞器中,引起基因表达而没有基因稳定遗传。
“等位基因”是占据染色体上给定位点的基因的几种供选择形式的其中一种。当二倍体植物中一对同源染色体上给定基因座上存在的等位基因相同时,该植物在该基因座处是纯合的。如果二倍体植物中一对同源染色体上给定基因座上存在的等位基因不同,则该植物在该基因座处是杂合的。如果转基因存在于二倍体植物中一对同源染色体中的其中之一上,则该植物在该基因座处是半合子的。
序列比对和同一性百分比可用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于
Figure GPA00001037680800191
生物信息计算包(
Figure GPA00001037680800192
Inc.,Madison,WI)的
Figure GPA00001037680800193
程序。除非另外说明,否则本文提供的序列的多重比对用Clustal V比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)采用默认参数(空位罚分=10,空位长度罚分=10)执行。用Clustal V方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数为KTUPLE=1、缺口罚分=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口=4和DIAGONALS SAVED=4。用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“同一性百分比”和“趋异”值。除非另外说明,本文提供的和申明的同一性百分比和趋异度是以该方式计算的。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory Press:Cold Spring Harbor,1989(下文称为“Sambrook”)。
现在来看优选的实施方案:
优选的实施方案包括分离的多核苷酸和多肽、重组DNA构建体、包含这些重组DNA构建体的组合物(例如植株或种子)以及利用这些重组DNA构建体的方法。
优选的分离的多核苷酸和多肽
本发明包括如下优选的分离的多核苷酸和多肽:
分离的多核苷酸,所述多核苷酸包含:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。所述多肽优选地是NDK或NDK样蛋白。
分离的多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。所述多肽优选地是NDK或NDK样蛋白。
分离的多核苷酸,该多核苷酸包含(i)基于Clustal V比对方法在与SEQ ID NO:14、16、18、20、22、24、26、28、30、32、34、36、38、40、42或50进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的核酸序列,或(ii)(i)核酸序列的全长互补序列。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。该分离的多核苷酸编码NDK或NDK样蛋白。
优选的重组DNA构建体和抑制DNA构建体。
在一个方面,本发明包括重组DNA构建体(包括抑制DNA构建体)。
在一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中该多核苷酸包含(i)编码氨基酸序列的核酸序列,所述氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列。
在另一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包含(i)在与SEQ ID NO:14、16、18、20、22、24、26、28、30、32、34、36、38、40、42或50进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的核酸序列,或(ii)(i)核酸序列的全长互补序列。
图15A至15K显示以下全长氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、和37,以及SEQ IDNO:44、45、46、47、48、49和51。用
Figure GPA00001037680800221
生物信息计算包(Madison,WI)的
Figure GPA00001037680800223
程序进行序列多重比对。具体地讲,使用Clustal V比对方法(Higgins和Sharp(1989)CABIOS.5:151-153),多重比对预设参数为空位罚分=10,空位长度罚分=10,成对比对预设参数为KTUPLE=1,空位罚分=3,窗口=5以及DIAGONALS SAVED=5。
图16示出图15A至15K中示出的NDK同源物的每对氨基酸序列的序列同一性百分比和趋异值。
在另一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码NDK或NDK样蛋白。
在另一方面,本发明包括抑制DNA构建体。
抑制DNA构建体优选包含至少一个调控序列(优选在植物中有功能的启动子),该调控序列可操作地连接至:(a)以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(a)(i)核酸序列的全长互补序列;或者(b)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样蛋白;或(c)以下序列的全部或部分:(i)基于Clustal V比对方法在与SEQ ID NO:14、16、18、20、22、24、26、28、30、32、34、36、38、40、42或50进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的核酸序列,或(c)(i)核酸序列的全长互补序列。该抑制DNA构建体优选包含共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制性构建体、茎环抑制性构建体、产生双链RNA的构建体、RNAi构建体或小RNA构建体(如,siRNA构建体或miRNA构建体)。
应当理解(正如本领域技术人员将会理解的),本发明不仅仅涵盖这些具体的示例性序列。导致给定位点处产生化学上等价的氨基酸但不影响所编码多肽的功能特性的核酸片段中的改变是本领域众所周知的。因此,氨基酸丙氨酸(一种疏水性氨基酸)的密码子可被编码另一个疏水性较弱的残基(例如甘氨酸)或疏水性较强的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,导致一个带负电荷的残基替换为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替换为另一个带正电荷的残基(例如,赖氨酸替换精氨酸)的改变也可预期产生功能上等价的产物。导致多肽分子的N-末端和C-末端部分改变的核苷酸变化也将预计不会改变多肽的活性。所提出的修饰中的每一种均完全在本领域常规技术内,如测定所编码的产物的生物活性的保留。
“抑制DNA构建体”是在转化或稳定整合进植物基因组时,导致该植物中的靶基因“沉默”的重组DNA构建体。对该植物来说,该靶基因可以是内源性的或是转基因的。如本文针对靶基因所使用的,“沉默”通常指在由靶基因表达的mRNA或蛋白质/酶的水平上的抑制,和/或在酶活性或蛋白质功能性的水平上的抑制。术语“抑制”包括降低、减少、下调、减弱、抑制、消除或阻止。“沉默”或“基因沉默”不确定机理并且包括(并且不限于)反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于RNAi的方法以及基于小RNAi的方法。
抑制DNA构建体可包含源自所关注的靶基因的区域并且可包含所关注的靶基因的有义链(或反义链)的核酸序列的全部或部分。取决于所要利用的方法,该区域可与所关注基因的有义链(或反义链)的全部或部分100%相同或者有少于100%的同一性(如,有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性)。
抑制DNA构建体是本领域所熟知的,一旦选定所关注的靶基因就很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制性构建体、茎环抑制性构建体、产生双链RNA的构建体,以及更通常的是,RNAi(RNA干扰)构建体和小RNA构建体,例如siRNA(短干扰RNA)构建体和miRNA(微RNA)构建体。
“反义抑制”指产生能够抑制靶蛋白表达的反义RNA转录物。
“反义RNA”指与靶初级转录物或mRNA的全部或部分互补,并阻断分离的靶核酸片段表达的RNA转录物(美国专利号:5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。
“共抑制”指产生能够抑制靶蛋白表达的有义RNA转录物。“有义”RNA指包括mRNA和在细胞内或体外可被翻译成蛋白质的RNA在内的RNA转录物。此前,已通过着眼于以有义方向过表达与内源mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见Vaucheret等人,1998,Plant J.,16:651-659;以及Gura,2000Nature 404:804-808)。
另一种变型描述了将植物病毒序列用于引导对近端mRNA编码序列的抑制(于1998年8月20日公开的PCT专利公开WO 98/36083)。
此前描述的是“发夹”结构的利用,该结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎环”结构(于1999年10月21日公开的PCT专利公开WO99/53050)。在这种情况下,茎由对应相对于启动子以有义或反义方向插入的相关基因的多核苷酸形成,并且环由一些相关基因的多核苷酸形成,在构建体中该多核苷酸不具有互补序列。这增加了获得的转基因植物中的共抑制或沉默频率。关于发夹抑制的综述,参见Wesley,S.V.等人,2003,Methods inMolecular Biology,Plant Functional Genomics:Methods and Protocols236:273-286。
其中茎由至少30个来自待抑制基因的核苷酸形成而环由任意的核苷酸序列形成的构建体也已经有效地用于抑制(于1999年12月2日公开的PCT专利公开WO 99/61632)。
使用聚-T和聚-A序列产生茎环结构中的茎已经有所描述(于2002年1月3日公开的PCT专利公开WO 02/00894)。
然而另一种变型涉及使用合成的重复序列来促进茎环结构中的茎的形成。用这种重组DNA片段产生的转基因生物体已经显示由形成茎环结构的核苷酸片段编码的蛋白质的水平降低,如于2002年1月3日公开的PCT专利公开WO 02/00904中所述。
RNA干扰是指由短干扰性RNA(siRNA)介导的动物中序列特异性转录后基因沉默的过程(Fire等人,Nature 391:806 1998)。在植物中的对应过程通常称为转录后基因沉默(PTGS)或RNA沉默,并且在真菌中也称为阻抑作用(quelling)。据信转录后基因沉默过程是用于防止外来基因表达的进化保守性细胞防御机制,并且通常由不同植物区系和门所共有(Fire等人,Trends Genet.15:358 1999)。这种防止外来基因表达的保护作用可能是通过特异性破坏病毒基因组RNA的同源单链RNA的细胞反应,响应源自病毒感染或源自转座因子随机整合到宿主基因组内的双链RNA(dsRNA)的生成而进化而来。dsRNA在细胞中的存在通过还没有完全表征的机制引发了RNAi反应。
细胞中长dsRNA的存在刺激了称为dicer的核糖核酸酶III的活性。Dicer涉及使dsRNA加工成称为短干扰RNA(siRNA)的短dsRNA片段(Berstein等人,Nature 409:3632001)。源自dicer活性的短干扰RNA的长度通常是约21至约23个核苷酸,并且包含约19个碱基对的双链体(Elbashir等人,Genes Dev.15:188,2001)。Dicer还涉及从保守结构的前体RNA上切下21个和22个核苷酸的小时序RNA(stRNA),该小时序RNA参与翻译控制(Hutvagner等人,2001,Science 293:834)。RNAi响应还涉及内切核酸酶复合物,通常称为RNA诱导沉默复合物(RISC),其介导具有与siRNA双链体的反义链互补的序列的单链RNA的裂解。靶RNA的裂解在与siRNA双链体的反义链互补的区域中间发生(Elbashir等人,Genes Dev.15:188,2001)。此外,RNA干扰还涉及小RNA(如miRNA)介导的基因沉默,可推定是通过调控染色质结构并由此防止靶基因序列转录的细胞机制(参见(例如)Allshire,Science 297:1818-1819 2002;Volpe等人,Science 297:1833-1837 2002;Jenuwein,Science 297:2215-2218 2002;和Hall等人,Science 297:2232-2237 2002)。这样,本发明的miRNA分子可用于通过与RNA转录物相互作用或者作为另一种选择通过与特定基因序列相互作用来介导基因沉默,其中这样的相互作用导致在转录或转录后水平上的基因沉默。
已经在多种系统中研究了RNAi。Fire等人(Nature 391:806,1998)首次在秀丽隐杆线虫(C.elegans)中观察到RNAi。Wianny和Goetz(Nature Cell Biol.2:70,1999)描述了在小鼠胚胎中由dsRNA介导的RNAi。Hammond等人(Nature 404:293,2000)描述了在用dsRNA转染的果蝇(Drosophila)细胞中的RNAi。Elbashir等人(Nature 411:494 2001)描述了通过将合成的21-核苷酸RNA的双链体引入包括人胚肾和HeLa细胞在内的培养的哺乳动物细胞中而诱导的RNAi。
小RNA在控制基因表达中起重要作用。很多发育过程(包括开花)的调控是由小RNA控制的。现在有可能通过使用在植物中产生小RNA的转基因构建体来以工程手段改变植物基因的基因表达。
小RNA似乎是通过与互补RNA或DNA靶序列碱基配对来行使功能的。当与RNA结合时,小RNA或者引发靶序列的RNA裂解或者引发翻译抑制。当与DNA靶序列结合时,据信小RNA可介导靶序列的DNA甲基化。无论具体机制是什么,这些事件的后果是基因表达受到抑制。
据认为,小RNA和它们的RNA靶标之间的序列互补性有助于确定采用了哪种机制(RNA裂解或翻译抑制)。据信,优选与它们的靶标互补的siRNA通过RNA裂解起作用。一些miRNA与它们的靶基因具有完全或几乎完全的互补性,并且对于至少一些这样的miRNA,已经验证了RNA裂解。其他miRNA与它们的靶标具有若干错配,并且在翻译水平上明显抑制了它们的靶标。同样,无需坚持特定的作用机理,出现了这样一种一般规律:完全或几乎完全的互补性引起RNA裂解,而当miRNA/靶标双链体含有许多错配时倾向于翻译抑制。对于此规律的一个明显例外是植物中微RNA 172(miR172)。miR172的其中一个靶标是APETALA2(AP2),尽管miR172与AP2具有几乎完全的互补性,但其表现出引起AP2的翻译抑制而不是引起RNA裂解。
微RNA(miRNA)是长度为约19至约24个核苷酸(nt)的已经在动物和植物中鉴定出的非编码RNA(Lagos-Quintana等人,Science294:853-858 2001,Lagos-Quintana等人,Curr.Biol.12:735-739 2002;Lau等人,Science 294:858-862,2001;Lee和Ambros,Science 294:862-864,2001;Llave等人,Plant Cell 14:1605-1619,2002;Mourelatos等人,Genes.Dev.16:720-728,2002;Park等人,Curr.Biol.12:1484-1495,2002;Reinhart等人,Genes.偏差(Dev.)16:1616-1626,2002)。它们是由大小为大约70至200nt的较长的前体转录物加工生成的,并且这些前体转录物能够形成稳定的发夹结构。在动物中,涉及加工miRNA前体的酶称为Dicer,这是一种核糖核酸酶III样蛋白(Grishok等人,Cell 106:23-34 2001;Hutvagner等人,Science 293:834-838 2001;Ketting等人,Genes.偏差(Dev.)15:2654-2659,2001)。植物也具有Dicer样酶,即DCL1(以前称为CARPEL FACTORY/SHORTINTEGUMENTS1/SUSPENSOR1),并且最近有证据表明,其像Dicer一样,也涉及发夹前体的加工以产生成熟miRNA(Park等人,Curr.Biol.12:1484-1495,2002;Reinhart等人,Genes.偏差(Dev.)16:1616-1626,2002)。此外,最近的研究已经清楚地表明,至少某些miRNA发夹前体最初是作为较长的聚腺苷酸化转录物存在,并且在单个转录物中可存在几种不同的miRNA以及相关发夹(Lagos-Quintana等人,Science294:853-858 2001;Lee等人,EMBO J 21:4663-4670 2002)。最近的研究还测定了从dsRNA产物的miRNA链选择,所述dsRNA产物是通过DICER加工发夹而产生的(Schwartz等人,2003,Cell 115:199-208)。看起来,经加工的dsRNA的两端的稳定性(即G∶C与A∶U的含量比,和/或错配)影响链选择,具有低稳定性的末端更容易因解旋酶活性而解旋。低稳定性末端的5′末端链被整合至RISC复合物内,而另一条链被降解。
微RNA看起来通过与位于由这些基因产生的转录物中的互补序列结合来调控靶基因。就lin-4和let-7而言,靶位点位于靶mRNA的3′非翻译区中(Lee等人,Cell 75:843-854,1993;Wightman等人,Cell75:855-862,1993;Reinhart等人,Nature 403:901-906,2000;Slack等人,Mol.Cell 5:659-669 2000),并且在lin-4和let-7miRNA与其靶位点之间有几个错配。lin-4或let-7miRNA的结合看起来引起了由靶mRNA编码的蛋白质的稳态水平下调,而不影响转录物自身(Olsen和Ambros,Dev.Biol.216:671-680,1999)。另一方面,最近有证据表明,在某些情况下,miRNA可引起靶转录物在靶位点内特异性RNA裂解,并且该裂解步骤看起来需要miRNA与靶转录物之间具有100%的互补性(Hutvagner和Zamore,Science 297:2056-2060 2002;Llave等人,Plant Cell 14:1605-1619 2002)。看起来有可能miRNA可进入至少两条靶基因调控途径:当靶互补性<100%时,蛋白下调,当靶互补性是100%时,RNA裂解。进入RNA裂解途径的微RNA与在动物中RNA干扰(RNAi)期间以及在植物中转录后基因沉默(PTGS)期间产生的21-25nt短干扰RNA(siRNA)类似(Hamilton和Baulcombe1999;Hammond等人,2000;Zamore等人,2000;Elbashir等人,2001),并且可能整合进与在RNAi情况中观察到的复合物类似或相同的RNA-诱导的沉默复合物(RISC)内。
用生物信息学鉴定miRNA的靶标在动物中没有成功,这可能是因为动物miRNA与它们的靶标具有低水平的互补性。另一方面,生物信息学方法已经成功地用于预测植物miRNA的靶标(Llave等人,PlantCell 14:1605-1619 2002;Park等人,Curr.Biol.12:1484-1495 2002;Rhoades等人,Cell 110:513-520 2002),因此,看起来植物miRNA与它们的推定靶标的整体互补性高于动物miRNA。植物miRNA的这些预测靶标中的大部分编码涉及植物发育模式或细胞分化的转录因子家族的成员。
本发明的重组DNA构建体(包括抑制DNA构建体)优选包含至少一种调控序列。
优选的调控序列是启动子。
多种启动子可用于本发明的重组DNA构建体(及抑制DNA构建体)中。可根据所需结果来选择启动子,并且可包括用于在宿主生物体中表达的组成型启动子、组织特异性启动子、细胞特异性启动子、诱导型启动子或其他启动子。
虽然候选基因当通过组成型启动子驱动表达时可预测其效应,但候选基因在35S或UBI启动子控制下的高水平、组成型表达可具有多重效应。
使用组织特异表达和/或胁迫特异表达可消除不需要的效应但保留改变根构造的能力。在拟南芥中已经观察到了该效应(Kasuga等人(1999)Nature Biotechnol.17:287-291)。
适用于植物宿主细胞的组成型启动子包括例如Rsyn7启动子的核心启动子和在WO 99/43838和美国专利6,072,050中公开的其他组成型启动子;CaMV 35S核心启动子(Odell等人,Nature 313:810-812(1985));水稻肌动蛋白启动子(McElroy等人,Plant Cell 2:163-171(1990));泛素启动子(UBI)(Christensen等人,Plant Mol.Biol.12:619-632(1989)和Christensen等人,Plant Mol.Biol.18:675-689(1992));pEMU(Last等人,Theor.Appl.Genet.81:581-588(1991));MAS(Velten等人,EMBO J.3:2723-2730(1984));ALS启动子(美国专利公开5,659,026)、玉米GOS2启动子(WO0020571A2,公布于2000年4月1日)等。其他组成型启动子包括例如在美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中公开的那些启动子。
在选择启动子用于本发明方法时,可能有利的是使用组织特异性启动子或发育调控启动子。
优选的组织特异性启动子或发育调控启动子是这样的DNA序列,该序列调控DNA序列选择性地在对雄穗发育、结籽或两者重要的植物细胞/组织中表达,并限制这种DNA序列只在植物的雄穗发育或种子成熟期间表达。任何引起所需时空表达的可鉴定启动子均可用于本发明的方法中。
种子或胚特异性的并且可用于本发明的启动子包括大豆Kunitz胰蛋白酶抑制剂(Kti3,Jofuku和Goldberg,Plant Cell 1:1079-1093(1989))、马铃薯块茎特异蛋白(patatin)(马铃薯块茎)(Rocha-Sosa,M.等人,1989,EMBO J.8:23-29)、convicilin、豌豆球蛋白和豆球蛋白(豌豆子叶)(Rerie,W.G.等人,1991,Mol.Gen.Genet.259:149-157;Newbigin,E.J.等人,1990,Planta 180:461-470;Higgins,T.J.V.等人,1988,Plant.Mol.Biol.11:683-695)、玉米蛋白(玉米胚乳)(Schemthaner,J.P.等人,1988,EMBO J.7:1249-1255)、菜豆蛋白(菜豆子叶)(Segupta-Gopalan,C.等人,1985,Proc.Natl.Acad.Sci.U.S.A.82:3320-3324)、植物凝集素(菜豆子叶)(Voelker,T.等人,1987,EMBO J.6:3571-3577)、B-伴球蛋白和大豆球蛋白(大豆子叶)(Chen,Z-L等人,1988,EMBO J.7:297-302)、谷蛋白(水稻胚乳)、大麦醇溶蛋白(大麦胚乳)(Marris,C.等人,1988,Plant Mol.Biol.10:359-366)、麦谷蛋白和麦醇溶蛋白(小麦胚乳)(Colot,V.等人,1987,EMBO J.6:3559-3564)和甘薯贮藏蛋白(sporamin)(甘薯块根)(Hattori,T.等人,1990,Plant Mol.Biol.14:595-604)。可操作地连接至嵌合基因构建体异源编码区的种子特异性基因的启动子在转基因植物中保持它们的时空表达模式。这样的实施例包括在拟南芥属和甘蓝型油菜(Brassica napus)种子中表达脑啡肽的拟南芥2S种子储藏蛋白基因启动子(Vanderkerckhove等人,Bio/Technology 7:L929-932(1989))、表达荧光素酶的菜豆凝集素和β-菜豆蛋白启动子(Riggs等人,Plant Sci.63:47-57(1989)),以及表达氯霉素乙酰转移酶的小麦谷蛋白启动子(Colot等人,EMBO J 6:3559-3564(1987))。
可诱导启动子响应内源性或外源性刺激的存在,例如通过化合物(化学诱导剂),或响应环境、激素、化学信号和/或发育信号而选择性表达可操作地连接的DNA序列。可诱导的或受调控的启动子包括例如受光、热、胁迫、水涝或干旱、植物激素、创伤或诸如乙醇、茉莉酮酸酯、水杨酸或安全剂之类的化学品调控的启动子。
优选的启动子包括如下启动子:1)胁迫诱导型RD29A启动子(Kasuga等人,1999,Nature Biotechnol.17:287-91);2)大麦启动子B22E;B22E的表达是发育中的玉米籽粒中的柄所特异性的(“Primary Structure of a Novel Barley Gene Differentially Expressed inImmature Aleurone Layers(在未成熟糊粉层中差异表达的新大麦基因的一级结构)”。Klemsdal,S.S.等人,Mol.Gen.Genet.228(1/2):9-16(1991));以及3)玉米启动子Zag2(“Identification and molecularcharacterization of ZAG1,the maize homolog of the Arabidopsis floralhomeotic gene AGAMOUS(ZAG1-拟南芥花同源异形基因AGAMOUS的玉米同系物的鉴定和分子表征)”,Schmidt,R.J.等人,Plant Cell 5(7):729-737(1993))。“Structural characterization,chromosomallocalization and phylogenetic evaluation of two pairs of AGAMOUS-likeMADS-box genes from maize(两对来自玉米的AGAMOUS样MADS-box基因的结构表征、染色体定位及系统发育评价)”,Theissen等人,Gene 156(2):155-166(1995);NCBI GenBank登录号X80206))。Zag2转录物可在授粉前5天至授粉后(DAP)7至8天被检测到,并且引导Ciml在发育中的雌花序心皮中表达,Ciml对发育中的玉米籽粒的籽仁而言是特异性的。Ciml转录物在授粉前4至5天至授粉后6至8天被检测到。其他可用的启动子包括可源自其表达与发育中的雌小花母系相关的基因的任何启动子。
用于在植物中调控本发明的核苷酸序列表达的其他优选启动子是维管元件特异性启动子或茎优选启动子。这种茎优选启动子包括苜蓿S2A启动子(GenBank登录号:EF030816;Abrahams等人,Plant Mol.Biol.27:513-528(1995))和S2B启动子(GenBank登录号:EF030817)等等,这些文献以引用方式并入本文。
启动子可整个源于天然基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到,由于在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro,J.K.和Goldberg,R.B.,Biochemistry of Plants 15:1-82(1989)的汇编中可找到许多实例。(将其与其他组成型启动子描述放在一起。)
优选的启动子可包括:RIP2、mLIP15、ZmCOR1、Rab17、CaMV35S、RD29A、B22E、Zag2、SAM合成酶启动子、泛素启动子(SEQ IDNO:61)、CaMV 19S、nos、Adh、蔗糖合成酶启动子、R-等位基因启动子、根细胞启动子、维管组织特异性启动子S2A(Genbank登录号EF030816;SEQ ID NO:62)和S2B(Genbank登录号EF030817)及来自6260玉米的组成型启动子GOS2(SEQ ID NO:60)。其他优选的启动子包括根优选的启动子,例如玉米NAS2启动子(SEQ ID NO:59)、玉米Cyclo启动子(US 2006/0156439,公开于2006年7月13日)、玉米ROOTMET2启动子(WO05063998,公开于2005年7月14日)、CR1BIO启动子(WO06055487,公开于2006年5月26日)、CRWAQ81(WO05035770,公开于2005年4月21日)和玉米ZRP2.47启动子(NCBI保藏号:U38790,gi:1063664)。
核苷酸序列的“主要部分”包含的核苷酸序列足以提供其包含的启动子的推定鉴定。核苷酸序列可由本领域技术人员来人工评估,或使用基于计算机的序列比较和鉴定工具进行评估,所述工具使用算法如BLAST(Basic Local Alignment Search Tool;Altschul等人(1993)J.Mol.Biol.215:403-410)。一般来讲,为了推定鉴定启动子核酸序列是否与已知启动子同源,包含三十或更多个邻接核苷酸的序列是必需的。具有如本文报道序列的有益效果,技术人员现在可使用全部公布序列或它们的主要部分用于本领域技术人员已知的目的。因此,本发明包括在附随序列表中报道的完全序列,以及那些上述序列的主要部分。
本发明的重组DNA构建体(及抑制DNA构建体)也可包括其他调控序列,包括但不限于翻译前导序列、内含子和多腺苷酸化识别序列。在本发明的另一个优选的实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。
内含子序列可加入到至部分编码序列的5’非翻译区或编码序列以增加积聚在胞浆中的成熟信息的量。已经显示,在植物和动物两者的表达构建体的转录单位中包含可剪接内含子可使基因表达在mRNA和蛋白质水平上均增强高达1000倍。参见Buchman和Berg,Mol.Cell Biol.8:4395-4405(1988);Callis等人,Genes Dev.1:1183-1200(1987)。这种内含子对基因表达的增强通常在将其设置接近转录单位的5’端时为最大。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的使用是本领域已知的。通常参见The Maize Handbook,第116章,Freeling和Walbot(编辑),Springer,纽约(1994)。
如果期望进行多肽表达,则通常希望在多核苷酸编码区的3′-端处包含有多腺苷酸化区。该多腺苷酸化区可源自天然基因,源自多种其他植物基因或源自T-DNA。要加入的3′端序列可源自(例如)胭脂碱合成酶或章鱼碱合成酶基因,或作为选择源自另外的植物基因,或较不优选的是源自任何其他真核基因。
“翻译前导序列”指位于基因启动子序列和编码序列之间的DNA序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。翻译前导序列的实例已经有所描述(Turner,R.和Foster,G.Molecular Biotechnology 3:225(1995))。
在本发明的另一个优选的实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。
任何植物均可选择用来鉴定将用于产生本发明重组DNA构建体和抑制DNA构建体的调控序列和基因。适用于分离基因和调控序列的靶植物的实例应该包括但不限于苜蓿、苹果、杏、拟南芥属植物、朝鲜蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、椰菜、抱子甘蓝、卷心菜、低芥酸菜籽、香瓜、胡萝卜、木薯、蓖麻、花椰菜、芹菜、樱桃、菊苣、芫荽、柑桔类、克莱门氏小柑橘类、三叶草、椰子、咖啡、玉米、棉花、酸果蔓、黄瓜、花旗松、茄子、菊苣、茅菜、桉树、茴香、无花果、大蒜、葫芦、葡萄、柚子树、白兰瓜、豆薯、猕猴桃、生菜、韭葱、柠檬、莱檬、火炬松、亚麻子、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕、油菜、秋葵、橄榄树、洋葱、橙、观赏植物、棕榈、番木瓜树、欧芹、欧洲防风草、豌豆、桃树、花生、梨树、胡椒、柿树、松树、菠萝、大蕉、李树、石榴树、白杨、马铃薯、南瓜、温柏、辐射松、红菊苣、萝卜、油菜、树莓、水稻、黑麦、高粱、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、枫香树、柑橘、茶、烟草、蕃茄、黑小麦、草皮草、芜菁、葡萄树、西瓜、小麦、薯蓣和西葫芦。用于鉴定调控序列的特别优选的植物是拟南芥属植物、玉米、小麦、大豆和棉花。
优选的组合物
本发明的优选组合物是其基因组中包含本发明的任何重组DNA构建体(包括任何抑制DNA构建体)(例如上面所讨论的那些优选构建体)的植物。优选的组合物也包括任何植物的子代,以及获取自植物或其子代的任何种子,其中所述子代或种子在基因组中包含重组DNA构建体(或抑制DNA构建体)。子代包括通过植物的自花授粉或异型杂交而获得的连续世代。子代也包括杂交种和近交系。
优选地,在杂交种子繁殖的农作物中,成熟的转基因植物可自花授粉而产生纯合的近交系植物。该近交系植物产生含有新引入的重组DNA构建体(或抑制DNA构建体)的种子。这些种子可生长而产生将会表现出改变的根(或植物)构造,或者可用于育种程序以产生杂交种子,这些杂交种子可生长而产生将会表现出改变的根(或植物)构造的植物。优选地,种子是玉米。
优选地,植物是单子叶植物或双子叶植物,更优选地,是玉米或大豆植物,甚至更优选的是玉米植物,例如玉米杂交种植物或玉米近交系植物。植物还可以是向日葵、高梁、蓖麻、葡萄、低芥酸菜籽、小麦、苜蓿、棉花、水稻、大麦或小米。
优选地,重组DNA构建体稳定地整合进植物的基因组中。
尤其优选的实施方案包括但不限于如下优选的实施方案:
1.在基因组中包含重组DNA构建体的植物(优选玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出改变的根构造。优选地,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。
2.植物(优选地玉米或大豆植物),所述植物在其基因组中包含:
重组DNA构建体,所述重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或
(b)抑制DNA构建体,所述抑制DNA构建体包含至少一个调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
3.在基因组中包含重组DNA构建体的植物(优选玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码NDK或NDK样蛋白,并且其中在与未包含所述重组DNA构建体的对照植物比较时,所述植物表现出改变的根构造。优选地,该植物还表现出至少一种农学特性的改变。
优选地,该NDK或NDK样蛋白来自拟南芥(Arabidopsisthaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycinetabacina)、野大豆(Glycine soja)和短绒野大豆(Glycinetomentella)。
4.在基因组中包含抑制DNA构建体的植物(优选玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域的调控元件,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样蛋白,并且其中在与未包含所述重组DNA构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
5.在基因组中包含抑制DNA构建体的植物(优选玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至以下序列的全部或部分的调控元件:(a)编码多肽的核酸序列,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(b)(a)核酸序列的全长互补序列,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
6.上述优选实施方案1-5中的植物的任何子代、上述优选实施方案1-5中的植物的任何种子、上述优选实施方案1-5中的植物的子代的任何种子以及来自上述优选实施方案1-5中的植物以及它们的子代的细胞。
在上述优选的实施方案1-6或本发明的任何其他实施方案中的任一项中,重组DNA构建体(或抑制DNA构建体)优选包含至少一个在植物中有功能的启动子作为优选的调控序列。
在上述优选的实施方案1-6或本发明的任何其他实施方案中的任一项中,至少一种农学特性的改变是增加或减少,优选增加。
在任一前述的优选实施方案1至6或本发明的任何其他实施方案中,至少一种农学特性优选选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、抗涝性、氮摄取、氮胁迫耐受性、根倒伏、茎倒伏、植株高度、穗长以及收获指数;产量、绿度、生物量和根倒状是尤其优选进行改变的农学特性(优选增加)。
在任一前述的优选实施方案1至6或本发明的任何其他实施方案中,在与对照植物比较时,植物优选表现出至少一种与环境条件例如水和营养物质的可用性无关的农学特性的改变。
本领域的普通技术人员熟悉确定植物根构造改变的规程。例如,可检测分析转基因玉米植物的根构造在幼苗期、花期或成熟期的改变。根构造的改变可以通过统计温室培育的植物顶部第3或第4节的节根数目或根带的宽度来确定。“根带”指成熟期植物在花盆底部的根丛宽度。植物根构造变化的其他量度包括但不限于侧根的数量、节根的平均根直径、侧根的平均根直径、根毛的数量和长度。侧根分枝的程度(如侧根数量、侧根长度)可通过这样确定:从完整的根系进行二次取样,将样本用平面扫描器或数码相机成像并用WinRHIZOTM软件(Regent Instruments Inc.)分析。
对提取的有关根表型的数据进行统计分析(通常为t检验),以将转基因根与非转基因姊妹株植株的根进行比较。在多个事件和/或构建体涉及该分析的情况下,还可以使用单因素方差分析。
下面的实施例描述了一些用于检测根构造改变的代表性规程和技术。
也可通过在田间测试中,在相同条件下比较植物与对照或参照植物提高产量的能力,评估植物根构造的改变。
也可通过在田间测试中比较植物在胁迫条件下(例如营养物质过剩或受限、水过剩或受限、存在病害)保持基本产量(优选地至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%产量)的能力,与非胁迫条件下的对照或参照植物的产量,评估根构造改变。
根构造的改变可以通过确定转基因植物与参照植物或对照植物比较的抗根倒伏性来测量。
在评估或测量其中利用了对照或参照植物的本发明任何实施方案(如,如本文描述的组合物或方法)中的转基因植物的农学特性或表型时,本领域的普通技术人员将很容易认识到要利用的合适对照或参照植物。例如,通过如下非限制性示例来说明:
1.转化植物的子代,该植物对于重组DNA构建体(或抑制DNA构建体)来说是半合子的,使得该子代分离成包含或不包含该DNA构建体(或抑制DNA构建体)的植株:包含该重组DNA构建体(或抑制DNA构建体)的子代将通常相对于未包含该重组DNA构建体(或抑制DNA构建体)的子代来进行测量(即,未包含该重组DNA构建体(或抑制DNA构建体)的子代是对照或参照植株)。
2.重组DNA构建体(或抑制DNA构建体)基因渗入至近交系中,例如在玉米中,或基因渗入进变体中,例如在大豆中:基因渗入品系将通常相对于亲本近交系或变种品系进行测量(即,亲本近交系或变种品系是对照或参照植物)。
3.双杂交系,其中第一杂交系由两个亲本近交系产生,而第二杂交系由相同的两个亲本近交系产生,不同的是其中一个亲本近交系含有重组DNA构建体(或抑制DNA构建体):第二杂交系通常将相对于第一杂交系进行测量(即亲本近交系或变种品系为对照植物或参照植物)。
4.包含重组DNA构建体(或抑制DNA构建体)的植株:该植株可以相对于这样的对照植株进行评估或测量,该对照植株不包含重组DNA构建体(或抑制DNA构建体),但具有与该植株相当的遗传背景(例如,与包含重组DNA构建体(或抑制DNA构建体)的植株相比较,核遗传物质具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性)。存在许多可用于分析、比较和表征植物遗传背景的基于实验室的技术;其中这些技术是同工酶电泳、限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、任意引物聚合成酶链反应(AP-PCR)、DNA扩增指纹(DAF)、序列特异扩增区域(SCAR)、扩增片段长度多态性
Figure GPA00001037680800381
和也称为微卫星的简单序列重复(SSR)。
此外,本领域的普通技术人员将容易认识到,评估或测量转基因植物的农学特性或表型时合适的对照或参照植物将不包括先前已经针对所需的农学特性或表型,通过诱变或转化而选择的植物。
优选的方法
优选的方法包括但不限于用于改变植物根构造的方法、用于评价植物根构造改变的方法、用于改变植物农学特性的方法、用于测定植物农学特性改变的方法以及用于产生种子的方法。优选地,植物是单子叶植物或双子叶植物,更优选地,是玉米或大豆植物,甚至更优选地,是玉米植物。植物还可以是向日葵、高梁、蓖麻、低芥酸菜籽、小麦、苜蓿、棉花、水稻、大麦或小米。种子优选的是玉米或大豆种子,更优选的是玉米种子,并且甚至更优选的是玉米杂交种子或玉米近交系种子。
特别优选的方法包括但不限于如下方法:
改变植物根构造的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(优选在植物中有功能的启动子)的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;以及(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出改变的根构造。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出改变的根构造。
改变植物根构造的方法,该方法包括:(a)将包含至少一个调控序列(优选在植物中有功能的启动子)的抑制DNA构建体导入可再生植物细胞,该调控序列可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;以及
(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造;
评价植物根构造改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价与未包含该重组DNA构建体的对照植物比较时该转基因植物的根构造;该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。
评价植物根构造改变的方法,所述方法包括:(a)将包含至少一个调控序列(优选在植物中有功能的启动子)的抑制DNA构建体导入可再生植物细胞,该调控序列可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或者(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;以及
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及(c)评价该转基因植物在与未包含该抑制DNA构建体的对照植物比较时改变的根构造。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与未包含该抑制DNA构建体的对照植物比较时改变的根构造。
评价植物根构造改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该子代植物在与未包含该重组DNA构建体的对照植物比较时改变的根构造。
评价植物根构造的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,当与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或者(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(d)评价与未包含该抑制DNA构建体的对照植物比较时该子代植物的根构造。
测定植物农学特性改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于ClustalV比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;以及(c)确定该转基因植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)确定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
测定植物农学特性改变的方法,该方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含至少一个调控序列(优选在植物中有功能的启动子),所述调控序列可操作地连接以下序列的全部或部分:(i)该核酸序列编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)确定该转基因植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)确定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
测定植物农学特性改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于ClustalV比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;并且(d)确定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。测定植物中农学特性改变的方法可进一步包括:测定所述转基因植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
测定植物农学特性改变的方法,该方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含至少一个调控序列(优选在植物中有功能的启动子),所述调控序列可操作地连接以下序列的全部或部分:(i)该核酸序列编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列;
(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)确定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
测定植物农学特性改变的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控元件,该调控元件可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)测定所述转基因植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。所述方法可进一步包括:(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(e)确定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
测定植物农学特性改变的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控元件,该调控元件可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样蛋白;(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(d)确定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
产生种子(优选可作为提供改变的根构造的产品销售的种子)的方法,该方法包括任一上述的优选方法,并且还包括从所述子代植物获得种子,其中所述种子在其基因组中包含所述重组DNA构建体(或抑制DNA构建体)。
在任一前述的优选方法或本发明方法的任何其他实施方案中,测定转基因植物中农学特性改变的步骤(如果适用的话)可优选地包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该转基因植物是否表现出至少一种农学特性的改变。
在任一前述的优选方法或本发明方法的任何其他实施方案中,测定子代植物中农学特性改变的步骤(如果适用的话)可优选地包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该子代植物是否表现出至少一种农学特性的改变。
在任一前述的优选方法或本发明方法的任何其他实施方案中,在所述导入步骤中所述可再生的植物细胞优选地包括愈伤组织细胞(优选胚胎)、配子细胞、分生细胞或未成熟胚芽细胞。可再生的植物细胞优选来自近交系玉米植物。
在任一上述的优选方法或本发明方法的任何其他实施方案中,所述再生步骤优选包括:(i)在包含促进胚发生的激素的培养基中培育所述转化的植物细胞直至观察到愈伤组织;(ii)将所述步骤(i)的转化的植物细胞转移至包含促进组织机体形成的激素的第一培养基;以及(iii)在第二培养基上传代培养步骤(ii)后的所述转化的植物细胞,以允许嫩芽伸长、根发育或这两者同时发生。
在任一前述的优选方法或本发明方法的任何其他实施方案中,存在供选择的替代方案用于将包含可操作地连接至少一个调控序列上的多核苷酸的重组DNA构建体导入可再生的植物细胞。例如,可将调控序列(例如一种或多种增强子、优选地作为转位因子的部件)导入可再生的植物细胞中,然后筛选其中将所述调控序列可操作地连接至编码本发明多肽的内源基因的事件。
将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于引导DNA摄取、化学处理、电穿孔、显微注射、细胞融合、感染、载体介导的DNA转移、轰击或农杆菌介导转化。
在任一上述的优选方法或本发明方法的任何其他实施方案中,至少一种农学特性优选选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、抗涝性、氮摄取、氮胁迫耐受性、根倒伏、茎倒伏、植株高度、穗长、茎倒伏以及收获指数。产量、绿度、生物量和根倒状是尤其优选进行改变的农学特性(优选增加)。
在任一上述的优选方法或本发明方法的任何其他实施方案中,在与对照植物比较时,所述植物优选表现出至少一种与环境条件无关的农学特性的改变。
将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于引导DNA摄取、化学处理、电穿孔、显微注射、细胞融合、感染、载体介导的DNA转移、轰击或农杆菌介导转化。
优选的技术如下文实施例所示,用于转化玉米植物细胞和大豆植物细胞。
用于转化双子叶植物(主要通过利用根癌农杆菌(Agrobacteriumtumefaciens))以及获得转基因植物的其他优选方法包括公开的用于棉花的那些(美国专利5,004,863、美国专利5,159,135、美国专利5,518,908);用于大豆的那些(美国专利5,569,834、美国专利5,416,011、McCabe等人,Bio/Technology 6:923(1988),Christou等人,PlantPhysiol.87:671674(1988));用于芸苔的那些(美国专利5,463,174);用于花生的那些(Cheng等人,Plant Cell Rep.15:653 657(1996),McKently等人,Plant Cell Rep.14:699 703(1995));用于番木瓜的那些;以及用于豌豆的那些(Grant等人,Plant Cell Rep.15:254 258,(1995))。
用电穿孔、粒子轰击和农杆菌转化单子叶植物也已有报道并且作为优选的方法包括例如在天门冬属(asparagus)中实现的转化和植物再生(Bytebier等人,Proc.Natl.Acad.Sci.U.S.A.84:5354,(1987));在大麦中实现的转化和植物再生(Wan和Lemaux,Plant Physiol.104:37(1994));在玉米中实现的转化和植物再生(Rhodes等人,Science240:204(1988);Gordon-Kamm等人,Plant Cell 2:603 618(1990);Fromm等人,Bio/Technology 8:833(1990);Koziel等人,Bio/Technology11:194,(1993);Armstrong等人,Crop Science 35:550-557(1995));在燕麦中实现的转化和植物再生(Somers等人,Bio/Technology 10:1589(1992));在鸭茅中实现的转化和植物再生(Horn等人,Plant Cell Rep.7:469(1988));在水稻中实现的转化和植物再生(Toriyama等人,Theor.Appl.Genet.205:34,(1986);Part等人,Plant Mol.Biol.32:1135 1148,(1996);Abedinia等人,Aust.J.Plant Physiol.24:133 141(1997);Zhang和Wu,Theor.Appl.Genet.76:835(1988);Zhang等人,Plant Cell Rep.7:379,(1988);Battraw和Hall,Plant Sci.86:191 202(1992);Christou等人,Bio/Technology 9:957(1991));裸麦(De la Pena等人,Nature 325:274(1987));在甘蔗中实现的转化和植物再生(Bower和Birch,Plant J.2:409(1992));在高羊茅(tall fescue)中实现的转化和植物再生(Wang等人,Bio/Technology10:691(1992))和在小麦中实现的转化和植物再生(Vasil等人,Bio/Technology 10:667(1992);美国专利5,631,152)。
存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及待再生的具体植物物种。
从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的(Weissbach和Weissbach(编辑),载于:Methods for Plant Molecular Biology,Academic Press,Inc.San Diego,CA,(1988))。该再生和生长方法通常包括如下步骤:选择转化的细胞、培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植株阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。
含有编码所关注蛋白质的外来的外源性分离核酸片段的植物的发育或再生是本领域所熟知的。优选地,将再生的植物进行自花授粉以产生纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员所熟知的方法培育含有所需多肽的本发明的转基因植物。
实施例
本发明将在下面的实施例中进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应当理解,尽管这些实施例说明了本发明的优选实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可以确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用法和条件。因此,除了那些本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在属于所附权利要求书的范围内。
实施例1
制备具有激活标记基因的拟南芥种群
构建18.4kb的T-DNA基二元构建体,pHSbarENDs(图1;SEQ IDNO:1;)包含四个来源于花椰菜花叶病毒35S启动子的四个多聚增强子元件,对应于序列-341至-64,如Odell等人(1985)Nature 313:810-812所述。该构建体也包含允许质粒救援的载体序列(pUC9)、再动员T-DNA的转座子序列(Ds)、以及允许草胺磷选择转基因植物的bar基因。仅将从右边界(RB)至左边界(LB)包含的10.8kb片段转移到寄主植物基因组中。因为增强子元件位于靠近RB处,它们可诱导T-DNA整合后的基因组位点顺式激活。
将pHSbarENDs构建体转化到根癌农杆菌菌株C58中,在25℃下在LB中培养至OD600~1.0。然后离心沉淀细胞,并重悬在相等体积的5%蔗糖/0.05%Silwet L-77(OSI Specialties,Inc)中。在早期抽薹时,生长拟南芥生态型Col-0的土壤使用农杆菌悬浮液进行顶部灌溉。一周后,相同植株再次用在蔗糖/Silwet中的相同农杆菌菌株进行顶部灌溉。然后将该植物的种子设为标准。所得T1种子在土壤中播种,通过喷洒草胺磷(AgrEvo;Bayer Environmental Science)选择转基因幼苗。从大约35,000个单个草胺磷抗性T1植株中收集T2种子。培养T2植株并收集来自96个分离T2品系的相同体积的T3种子。这组成了360个亚群。
农杆菌菌株和整个植株的转化如上所述进行。
选择总计100,000个草胺磷抗性T1幼苗。分开保存来自每个品系的T2种子。
实施例2A
筛选以鉴定具有改变根构造的品系(非限制性氮条件)
在与早期发育期间来自如实施例1所述的种群的对照幼苗进行比较时,可分析在不限制氮条件下培养的具有激活标记的拟南芥幼苗的根系构造。
来自每个96,000个分离T1激活标记品系的十个T2种子可用氯气进行灭菌并种植在培养皿上,培养皿包含以下培养基:0.5x N-FreeHoagland’s,60mM KNO3,0.1%蔗糖,1mM MES和1%PhytagelTM。通常将10个平板置于架子中。平板在4℃下保存三天以使种子分层,然后在22
Figure GPA00001037680800511
光照和20
Figure GPA00001037680800512
黑暗垂直保持11天。光周期为16h;8h黑暗,平均光照强度为~180μmol/m2/s。架子(通常每个装有10个平板)在每个搁板中每日旋转。在第14天,评估平板的幼苗状态,拍摄整个平板的数字图像并分析根面积。将平板随机分成10个水平区域。在板上10个水平区域的每个区域中的根面积以总面积百分比表示。仅仅使用区域3至9的面积进行品系根总面积计算。可使用ICORIA开发的Rootbot图像分析工具(专有)评估根面积。根总面积以mm2表示。
期望具有增加的根生长特性的品系位于根分布区域的上端。假定架子有最多两个异常值,可使用滑动窗方法评估给定架子的根区域的变化。包括生长培养基、温度、和湿度在内的多个因素的环境变量可引起根生长的显著改变,尤其是在播种期间更是如此。因此根据播种日期和搁板来将所述品系分组以用于数据分析。然后通过平均根面积来拣选特定播种日期/搁板组中的架子。通过将表示架子ri的数据与来自下一个最低架子(ri-1,以及下一个最高平均根面积,ri+1)的数据进行合并来执行滑动窗根面积分布。然后使用Grubbs型方法(Barnett等人,Outliers in Statistical Data,John Wiley&Sons,第3版(1994)分析组合分布的变量以鉴定ri中的异常值。
将通过上文所述方法测定的具有显著增加的根生长的品系命名为Phase 1 hits。在相同分析条件下进行Phase 1 hits的重复试样再筛选。当任一个或两个Phase 2重复试样显示与平均值的显著差异时,认为该品系是验证过的根构造品系。
在Phase 2的至少一个平板中再次发现是异常值的那些品系经过室内进行的Phase 3筛选以验证Phase 1和Phase 2中获得的结果。使用下文所述的Rootboot图像分析(如上所述)和
Figure GPA00001037680800513
验证Phase 3的结果。在第一轮筛选中进行相同方式的确认。T2种子用50%家用漂白剂,0.01%triton X-100溶液灭菌,并以10颗种子/平板的密度置于与第一轮筛选所述的相同平板培养基上。在4℃下保存平板三天以使种子分层,并在与首次实验相同的温度和光周期下培养种子,光照强度为~160μmol/m2/s。将平板垂直放入10平板架的八个中心位置,第一个和最后一个位置放空白平板。每隔一天旋转架子和架子中的平板。每隔平板拍摄两组照片。第一组在14-16天拍摄,此时大多数品系的初生根已经到达平板底部,第二组照片在发育出更多侧根两天后拍摄。通常用后面的一组照片进行数据分析。用软件
Figure GPA00001037680800521
(RegentInstruments Inc)分析在垂直平板上生长的这些幼苗的根生长,该软件是特别设计的一种进行根测量的图像分析系统。
Figure GPA00001037680800522
利用像素对照来从较暗的背景辨别出根构造。为了在不拍摄背景情况下鉴定的根的最大量,所述像素级别是150-170,并且使用滤光器移除长度/宽度比率小于10.0的物体。进行分析的平板上的面积为从植物叶片边缘至距离平板底部约1cm处。使用完全相同的
Figure GPA00001037680800523
设置和分析面积分析一批的所有平板。
Figure GPA00001037680800524
给出的一个平板的总根长度得分除以已经萌发并沿平板生长一半的植物数目。每个品系培养三个平板,取它们的得分均值。然后将该平均值与同时培养的包含野生型种子的三个平板的平均值比较。
然后使用通过与野生型相比具有更高根生长数值进行再确认的拟南芥激活标记品系,用于分子鉴定侧接T-DNA插入序列的DNA。
实施例2B
在突变种群中鉴定具有改变的根表型的突变品系(氮限制条件)
可使用两步筛选程序,该程序包括:
(1)用垂直平板检测分析法鉴定改变的根生长表型;
(2)在拯救的突变体品系中确认抗除草剂性和根表型;
初次筛选基于垂直平板,该平板包含无氮的Hoagland盐,0.3%蔗糖和1mM KNO3。该培养基也包含0.8%至1.0%PhytaGel作胶凝剂。具有1.0%Phytagel的培养基有时难以灌注,因为它凝固迅速,然而低于0.8%时当垂直放置时培养基将滑出平板。来自激活标记种群的突变体,其中100个单个品系的集合可用于总计36000个品系的筛选。在每个平板上,种植12个突变体和2个野生型Columbia种子。平板置于具有26℃恒温的培养室中,培养室为16小时-日循环,平板顶部的平均光照强度为110μE/m2s。这些平板在2.5周期限内拍照3-4次。当观察到清楚的根表型时拯救单个幼苗。拯救的幼苗在生长室(24℃,每日16小时,250至300μE/m2s)中生长至成熟以采集种子。
就次级筛选而言,将来自在初次筛选中鉴定的推定hits的种子播种于包含与上文相同的培养基(加上6mg/L双丙氨磷)的平板上。野生型Columbia种子在相同时间、但无双丙氨磷的相同培养基上播种。每个平板具有10个种子。每个突变体品系有3个平板,而野生型Columbia有2个平板作为重复试样。这些平板置于培养室中,生长条件与上文所述相同。剔除那些认为是假阳性的不具有抗除草剂性或无明显的根表型的品系。保存次级筛选验证的品系用于进一步研究。
实施例3
鉴定激活标记基因
使用下述两个标准程序中的一个或两个鉴定侧接导致根构造改变的T-DNA插入序列的基因:(1)热不对称交错PCR(TAIL)PCR(Liu等人,(1995),Plant J.8:457-63);以及(2)SAIFF PCR(Siebert等人,(1995)Nucleic Acids Res.23:1087-1088)。至于复杂的多聚T-DNA插入序列,TAIL PCR和SAIFF PCR可能都不足以鉴定候选基因。在这些情况下,可使用包括反式PCR、质粒拯救和/或基因组文库构建在内的其他程序。
成功的结果是其中单个TAIL或SAIFF PCR片段包含T-DNA边界序列和拟南芥基因组序列。
一旦获取侧接T-DNA插入序列的基因组序列标记,通过与公开可用的拟南芥基因组的序列比对来鉴定候选基因。
具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是激活的基因的候选基因。
为了验证鉴定的基因真的靠近T-DNA并排除TAIL/SAIFF片段是嵌合伪克隆的可能性,用一个T-DNA中的寡核苷酸和一个候选基因特异性的寡核苷酸进行对基因组DNA的诊断PCR。将提供PCR产品的基因组DNA样本理解为表示T-DNA插入序列。此分析也验证了其中一种以上的插入事件发生在相同品系中的情况,例如,在TAIL和/或SAIFF PCR分析中鉴定是否有多个不同基因组片段。
实施例4
鉴定激活标记ndk基因
通过如实施例2B所述的筛选程序,以及随后经过如实施例2A所述的阶段3(室内)筛选获取ndk基因。如实施例3所述进行激活标记基因的鉴定。
进一步分析显示具有改变的根构造的一个品系(1至6)。提取来自品系的DNA,使用T-DNA左边界内的引物通过连接介导PCR(Siebert等人,(1995)Nucleic Acids Res.23:1087-1088)建立T-DNA插入序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与完全拟南芥基因组的序列比对鉴定候选基因。将其中一个鉴定的插入位点鉴定为嵌合插入;左边界的T-DNA序列经测定位于T-DNA插入序列的两端。这仍然是可能的:位于靠近T-DNA右边界的增强子元件足够靠近以对附近的候选基因产生效应。在这种情况下,假定右边界位置位于插入位点,并将侧接插入位点的两个基因选作候选基因。最靠近嵌合插入序列的35S增强子的基因是AT4G23900(SEQ ID NO:50;NCBI GINO:11990430;拟南芥核苷二磷酸激酶4),它编码NDK4蛋白(SEQ IDNO:51),本文称为核苷二磷酸激酶或NDK。
实施例5A
验证候选拟南芥基因(AT4G23900)经由转化到拟南芥中增强植 物根构造的能力
可将候选基因转化到拟南芥中并在35S启动子作用下过表达。如果在转基因品系中观察到与亲本激活标记品系相同或相似的表型,则将候选基因认为是拟南芥中验证过的“前导基因”。
可直接测试拟南芥AT4G23900基因促进拟南芥中的根构造的能力。
拟南芥AT4G23900 cDNA用寡核苷酸进行PCR扩增,寡核苷酸导入attB1(SEQ ID NO:51)序列,其上游为ATG起始密码子的共有起始序列(CAACA)和AT4G23900 cDNA(SEQ ID NO:50的核苷酸51-764(终止))蛋白编码区的前23个核苷酸,以及attB2(SEQ ID NO:53)序列和包括所述cDNA终止密码子的蛋白编码区的最后21个核苷酸。使用InvitrogenTM 技术,用pDONRTM/Zeo(InvitrogenTM,图2;SEQ ID NO:2)进行MultiSite
Figure GPA00001037680800542
BP重组反应。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM/Zeo移除并定向地克隆了该在旁侧具有attB1(SEQ ID NO:52)和attB2(SEQID NO:53)位点的PCR产物而得到入门克隆PHP28731。
用紧接InvitrogenTM
Figure GPA00001037680800551
转化插入序列上游的1.3-kb35S启动子构建称为pBC-yellow(图4,SEQ ID NO:4)的16.8-kb T-DNA基的二元载体,所述插入序列包含侧接attR1和attR2序列的ccdB基因和氯霉素抗性基因(CAM)。该载体也包含在Rd29a启动子控制下的YFP标记用于选择转化过的种子。
使用InvitrogenTM 技术,对包含定向克隆PCR产物和pBC-yellow的入门克隆进行MultiSite
Figure GPA00001037680800553
重组反应。这使得能够迅速地和定向地克隆pBC-yellow中在35S启动子后的AT4G23900基因。
使用如实施例1所述的相同农杆菌介导的转化程序将35S-AT4G23900基因构建体导入野生型拟南芥生态型Col-0中。
通过存在的荧光YFP标记选择转基因T1种子。按照如实施例2A所述的程序对荧光种子进行根构造检测分析。每个构建体使用6个平板对转基因T1种子进行再筛选。包含从荧光种子中分选出的未转化的Columbia种子的两个平板(每个架子)作为对照。
每个构建体有六个平板进行统计学分析,并检测平板上生长的植物数量和它们的平均
Figure GPA00001037680800554
得分之间的趋势。
Figure GPA00001037680800555
得分进行趋势归一化处理,对应于构建体的根得分除以野生型根得分。
实施例5B
在氮限制条件下筛选候选基因
也可筛选如上文实施例5A所述通过存在的荧光标记YFP选择的转基因T1种子在氮限制条件下生长的抗性。为此目的,32个转基因个体可在一个有0.4mM KNO3或60mM KNO3的平板上紧邻着32个野生型个体生长。如果一个品系显示与对照的统计意义上的显著差异,可认为该品系是验证过的氮缺乏抗性品系。在掩蔽该平板图像以移除背景颜色后,每个个体收集两个不同的测量数据:总罗赛塔面积和进入绿色区的颜色百分比。使用色调、饱和度和强度数据(HIS),绿色区由色调50至66组成。总罗赛塔面积用作植物生物量的量度,而绿色区通过剂量响应研究已经显示指示氮同化作用。
实施例5C
验证候选拟南芥基因(AT4G23900)经由转化进入拟南芥后改善 植物氮利用率的能力
如实施例5B所述筛选能够在氮限制条件下生长的转基因种子。
在第10、11、12和13天评估植物。与野生型相比,表达拟南芥候选基因(AT4G23900)的转基因个体在氮限制条件下得分更佳,然而,当在包含有限浓度的氮(0.4mM KNO3)的培养基上生长时,与野生型植物相比,它们不被验证为氮缺乏抗性植物。在不限制氮条件下(60mMKNO3)未观察到转基因植物和野生型植物之间的差异。
实施例5D
筛选以鉴定具有改善的硝酸盐摄取的品系
就每个过表达品系而言,将十二个T2植株播种在96孔微滴定板上,所述微滴定板包含2mM MgSO4,0.5mM KH2PO4,1mM CaCl2,2.5mM KCl,0.15mM Sprint 330,0.06mM FeSO4,1μM MnCl2·4H2O,1μMZnSO4·7H2O,3μM H3BO3,0.1μM NaMoO4,0.1μM CuSO4·5H2O,0.8mM硝酸钾,0.1%蔗糖,1mM MES,200μM溴酚红和0.40%PhytagelTM(pH测定培养基)。培养基pH使得溴酚呈红色,pH指示染料是黄色的。
将四个品系种植于每个平板中,每个平板上包含12个野生型个体和来自某一已经显示具有改善的硝酸盐摄取(阳性对照)的品系的12个个体,在每个96孔微滴定板上总计有72个个体可使用基于网络的随机序列发生器测定每个平板上的品系顺序。不将种子种植在96孔微滴定板上的Row A或Row H中。每个实验使用四个平板,使得每个品系分析最多48株植物。在暗处、4℃条件下保持平板三天以使种子分层,然后在22℃,光照和黑暗交替条件下水平放置六天。光周期为16小时光照;8小时黑暗,平均光照强度为~200mmol/m2/s。旋转并振动每个架子中的平板。在第八或第九天(生长五天或六天),通过记录培养基颜色为粉红色、桃色、黄色或无发芽来评估幼苗状态。然后移除每孔上的植物和/或种子。将每个培养基块状物转移到1.2mL微滴定管中,并置于96孔深微滴定板中的相应孔中。将包含2μM荧光素的等体积水加入每个1.2mL微滴定管中。用土壤覆盖平板并用液体循环高压灭菌。将每个管充分混合,从每个管中移除等分试样并分析培养基中保留的硝酸盐的量。如果t检验显示某个品系与野生型对照植物具有显著差异(p<0.05),则可认为所述品系是验证过的具有改善的硝酸盐摄取品系。
实施例5E
验证包含候选拟南芥基因(AT4G23900)的转基因品系氮摄取增
如实施例5D所述筛选氮摄取增加的转基因种子。
与不过表达拟南芥候选基因的野生型植物相比,过表达拟南芥候选基因(AT4G23900)的转基因个体经验证为具有改善的硝酸盐摄取品系。
实施例6
cDNA文库的组成
cDNA克隆的分离和测序
制备提供来自Canna edulis(美人蕉)、Momordica charantia(苦瓜)、Brassica(芥辣)、Cyamopsis tetragonoloba(瓜耳)、Zea mays(玉米)、Oryza sativa(水稻)、Glycine max(大豆)、Helianthus annuus(向日葵)和Triticum aestivum(小麦)的不同组织的mRNA的cDNA文库。下面描述了对该文库的特征。
表2
来自美人蕉、苦瓜、芥辣、瓜耳、玉米、水稻、大豆、向日葵和 小麦的cDNA文库
  文库   组织   克隆
  cdr1f   玉米(玉米,B73)发育根(全长)   cdr1f.pk002.a3.f:fis
  cest1s   玉米,茎杆,伸长区域。   cest1s.pk013.p8:fis
cfp2n   授粉的和未授粉的玉米穗,集中的,全长富集的,标准化的。   cfpn.pk070.b22;fiscfpn.pk069.c16
  文库   组织   克隆
sfl1 大豆不成熟的花。   sfl1.pk126.p10sfl1.pk134.d19:fissfl1.pk133.14:fis
p0095   穗叶鞘,经筛选的1生长条件:田间;对照组织或未处理组织的生长阶段:花粉脱落后2至3周;允许植物天然授粉 p0095.cwsab57ra
rlr24   水稻萌发叶片后15天,感染菌株稻瘟病菌4360-R-62(AVR2-YAMO)后24小时;抗性。 rlr24.pk0071.e7
  hss1c   菌核菌属感染的向日葵植株。   hss1c.pk019.a16:fis
lds1c   15DAF时收获的瓜耳(Cyamopsistetragonoloba)种子。 lds1c.pk004.f12
epc2c   Frac,10和11车前籽表皮包含70%水溶性阿拉伯糖基木聚糖,玉米的主要细胞壁组分。 epc2c.pk003.l14:fis
egh1c   陆地棉(Gossypium hirsutum)发芽的种子。 egh1c.pk002.l14
  ort1f   燕麦(Avena strigosa)全长燕麦根尖。   ort1f.pk020.a13:fis
cDNA文库可通过许多可用的方法中的任一种制备。例如,通过首先根据生产商的说明书(Stratagene Cloning Systems,La Jolla,CA)制备Uni-ZAPTMXR载体中的cDNA文库,可将cDNA引入质粒载体中。根据Stratagene提供的说明书,将Uni-ZAPTMXR文库转换成质粒文库。转换后,cDNA插入序列将会包含在质粒载体pBluescript中。此外,可用T4DNA连接酶(New England Biolabs)将cDNA直接引入预切的Bluescript II SK(+)载体(Stratagene)中,然后根据生产商的说明书(GIBCO BRL Products)将其转染进DH10B细胞中。一旦cDNA插入序列处于质粒载体中,从随机选取的含重组pBluescript质粒的细菌菌落制备质粒DNA,或者用对插入的cDNA序列旁侧的载体序列特异性的引物,通过聚合酶链式反应扩增插入的cDNA序列。将扩增的DNA插入序列或质粒DNA在引物标记法测序反应(dye-primer sequencingreaction)中进行测序,以产生部分cDNA序列(表达序列标记或“EST”;参见Adams等人,1991,Science 252:1651-1656)。用Perkin Elmer Model377荧光测序仪分析所得的EST。
用改进的转座规程产生全长插入序列(FIS)数据。从归档的甘油原种作为单一菌落回收确定了FIS的克隆,并通过碱性裂解分离质粒DNA。将分离的DNA模板在基于PCR的测序反应中与载体引物M13正向和反向寡核苷酸反应并上样至自动化的测序仪上。通过与对其进行FIS查询的初始EST序列进行序列比对来确认克隆鉴定。
将确认的模板通过基于酿酒酵母(Saccharomyces cerevisiae)Ty1转座因子(Devine和Boeke,1994,Nucleic Acids Res.22:3765-3772)的Primer Island转座试剂盒(PE Applied Biosystems,Foster City,CA)进行转座。该体外转座系统在整个一组大DNA分子中随机地放入独特的结合位点。随后将转座的DNA用于通过电穿孔转化DH10B电感受态细胞(Gibco BRL/Life Technologies,Rockville,MD)。转座因子含有另外的可选标记(称为DHFR;Fling和Richards,1983,Nucleic AcidsRes.11:5147-5158),使得能在琼脂平板上仅双重筛选含有整合的转座子的那些亚克隆。从每次转座反应随机地选择多个亚克隆,通过碱性裂解制备质粒DNA,并用对转座子内的结合位点特异性的独特引物从转座事件位点向外进行测序(ABI Prism dye-terminator ReadyReaction mix)。
收集序列数据(ABI Prism Collections)并用Phred和Phrap(Ewing,等人,1998,Genome Res.8:175-185;Ewing和Green,1998,GenomeRes.8:186-194)进行装配。Phred是一种公用软件程序,该程序再次读取ABI序列数据,再次调出(recall)碱基,赋质量值,并将碱基序列(base call)和质量值写入可编辑的输出文件中。Phrap序列组装程序使用这些质量值来增加组装的序列重叠群的准确度。通过Consed序列编辑器(Gordon等人,1998,Genome Res.8:195-202)检查装配序列。
在一些克隆中,cDNA片段对应基因的3’-端的一部分并且不会涵盖整个开放阅读框。为了获得上游信息,使用两种不同规程中的一者。这两种方法中的第一种方法导致产生含有所需基因序列的部分的DNA片段,而第二种方法导致产生含有整个开放阅读框的片段。这两种方法均使用两轮PCR扩增以从一个或多个文库获得片段。有时基于以前的知识(特定的基因应该存在于某些组织中)选择文库,有时则进行随机地选择。获得相同基因的反应可平行地在若干文库中进行,或者在文库池中进行。文库池通常用3至5个不同的文库制备并且使其归一化而成为一致的稀释度。在第一轮扩增中,两种方法均使用载体特异性的(正向)引物,同时还使用基因特异性的(反向)引物,该正向引物对应位于克隆5’-端处的载体的一部分。第一种方法使用与已知基因序列的一部分互补的序列,而第二种方法使用与3’-非翻译区(也称为UTR)的一部分互补的基因特异性引物。在第二轮扩增中,两种方法均使用套式引物组。按照生产商的说明书,用市售试剂盒将所得DNA片段连接进pBluescript载体中。该试剂盒选自可得自包括InvitrogenTM(Carlsbad,CA)、Promega Biotech(Madison,WI)和Gibco-BRL(Gaithersburg,MD)在内的一些供应商的许多试剂盒。如上所述,将质粒DNA通过碱性裂解方法分离并进行测序和用Phred/Phrap进行装配。
实施例7
cDNA克隆的鉴定
编码NDK样多肽的cDNA克隆通过这样鉴定:进行BLAST(基本的局部比对搜索工具);Altschul等人,1993,J.Mol.Biol.215:403-410;还可参见国立卫生研究院国家医学图书馆的国家生物技术信息中心的万维网址上对BLAST算法的解释),寻找与BLAST“nr”数据库中所包含序列(包括所有非冗余GenBank CDS翻译序列、源自3-维结构Brookhaven蛋白质数据银行(Protein Data Bank)、SWISS-PROT蛋白质序列数据库的最新的主要版本、EMBL和DDBJ数据库的序列)的相似性。采用国家生物技术信息中心(NCBI)提供的BLASTN算法,分析如实施例6中获得的cDNA序列与包含在“nr”数据库中的所有可公开获得的DNA序列的相似性。在所有的阅读框中翻译DNA并用NCBI提供的BLASTX算法(Gish和States,1993,Nat.Genet.3:266-272)比较与“nr”数据库中包含的所有可公开获得的蛋白质序列的相似性。为方便起见,通过BLAST计算仅仅偶然观察到cDNA序列与所搜索的数据库中所包含序列的匹配的P值(概率)在本文报导为“pLog”值,它代表所报导的P值的负对数。因此,pLog值越大,cDNA序列和BLAST的“匹配”代表同源蛋白的可能性就越大。
将受分析的EST与上述Genbank数据库进行比较。通过使用BLASTn算法(Altschul等人,1997,Nucleic Acids Res.25:3389-3402.)对杜邦专利数据库比较具有序列同源共有区域或重叠区域的核苷酸序列,可找到含更5端或3端序列的EST。在两个或更多个核酸片段之间存在共有或重叠序列时,该序列可装配成单一的连续核苷酸序列,从而使最初的片段在5或3初始方向上延伸。一旦确定了最5的EST后,可如实施例6中所述,通过全长插入序列来确定其完整的序列。可用tBLASTn算法,通过将已知基因(来自专有来源或公开数据库的已知基因)的氨基酸序列对EST数据库进行比较,可找到属于不同物种的同源基因。tBLASTn算法对所有6个阅读框都翻译了的核苷酸数据库进行氨基酸查询的搜索。该搜索允许不同物种之间的核苷酸密码子使用的差异,并且允许密码子简并。
实施例8
表征编码NDK样多肽的cDNA克隆
使用表1列出的EST序列进行的BLASTX揭示cDNA编码的多肽与表3所示的来自水稻(GI No.115465831和125595441,分别对应于SEQ ID NO:44和49)、拟南芥a(GI No.15237018,对应于SEQ ID NO:46)、豌豆(GI No.6435320,对应于SEQ ID NO:45)、葡萄藤(GI No.147864944,对应于SEQ ID NO:47)、和菥蓂(GI No.62870979,对应于SEQ ID NO:48)的NDK样多肽的相似性。表3显示的是每个EST(“EST”)、包含指示cDNA克隆(“FIS”)的整个cDNA插入序列、两个或更多个EST装配的重叠群序列、FIS或PCR序列(“重叠群”)或编码来源于FIS或重叠群(“CGS”)的整个和功能蛋白的序列的BLAST结果:
表3
编码NDK样多肽同源物的多肽序列的BLAST结果和同一性百分
  序列   状况   NCBI GI   BLASTpLog打分   %同一性
  cest1s.pk013.p8:fisSEQ ID NO:14   CGS   115465831(水稻)SEQ ID NO:44   90   73.9
  cfp2n.pk070.b22;fisSEQ ID NO:16   CGS   115465831(水稻)SEQ ID NO:44   90   73.9
  cdr1f.pk002.a3.f:fisSEQ ID NO:18   CGS   115465831(水稻)SEQ ID NO:44   90   78.2
  lds1c.pk004.f12:fisSEQ ID NO:20   CGS   6435320(豌豆)SEQ ID NO:45   94   83.3
  ep2c.pk002.f17.f:fisSEQ ID NO:22   CGS   15237018(拟南芥)SEQ ID NO:46   89   76.8
  ort1f.pk020.a13:fisSEQ ID NO:24   CGS   115465831(水稻)SEQ ID NO:44   100   79.8
  HSS1C.PK019.A16:FISSEQ ID NO:26   CGS   147864944(葡萄藤)SEQ ID NO:47   91   77.9
  SFL1.PK134.D19:FISSEQ ID NO:28   CGS   6435320(豌豆)SEQ ID NO:45   89   83.3
  EGH1C.PK002.L14:FISSEQ ID NO:30   CGS   62870979(阿尔卑斯菥蓂)SEQ ID NO:48   93   79.8
  sfl1.pk133.14:fisSEQ ID NO:32   CGS   15237018(拟南芥)SEQ ID NO:46   91   77.1
  序列   状况   NCBI GI   BLASTpLog打分   %同一性
  p0095.cwsab57raSEQ ID NO:36   CGS   125595441(水稻)SEQ ID NO:49   78   90.8
  sfl1.pk126.p10SEQ ID NO:38   EST   15237018(拟南芥)SEQ ID NO:46   47   66.3
  rlr24.pk0071.e7SEQ ID NO:40   EST   115465831(水稻)SEQ ID NO:44   <10   64.5
  cfp2n.pk069.c16SEQ ID NO:42   EST   115465831(水稻)SEQ ID NO:44   46   67.1
图15A至15K显示以下全长氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、和37,以及SEQ IDNO:44、45、46、47、48、49和51图16显示图15A至15K中显示的每个序列对的序列同一性百分比和趋异值。
用LASERGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的Megalign程序进行序列比对和同一性百分比计算。用带默认参数(空位罚分=10,空位长度罚分=10)的Clustal比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)进行序列的多重比对。使用Clustal方法的成对比对的默认参数为KTUPLE 1,空位罚分=3,窗口=5,DIAGONALS SAVED=5。
序列比对和BLAST打分以及概率显示包含本发明cDNA克隆的核酸片段编码NDK样多肽。
表4
编码与NDK和NDK样多肽同源的多肽的序列的BLAST结果
  序列   状况   参照序列   BlastpLog打分   %同一性
  cest1s.pk013.p8:fisSEQ ID NO:14   CGS   SEQ ID NO:42932,在EP1033405-A2中   121   99.6
  cfp2n.pk070.b22;fisSEQ ID NO:16   CGS   SEQ ID NO:42932,在EP1033405-A2中   121   99.6
  cdr1f.pk002.a3.f:fisSEQ ID NO:18   CGS   SEQ ID NO:43288,在EP1033405-A2中   121   99.2
  lds1c.pk004.f12:fisSEQ ID NO:20   CGS   SEQ ID NO:13361,在US2005108791中   95   89.1
  ep2c.pk002.f17.f:fisSEQ ID NO:22   CGS   SEQ ID NO:2692,在WO2004035798中   90   82.6
  ort1f.pk020.a13:fisSEQ ID NO:24   CGS   SEQ ID NO:137093,在US2007044171中   105   75.6
  hss1c.pk019.a16:fisSEQ ID NO:26   CGS   SEQ ID NO:64801,在US2007061916中   93   97.4
  sfl1.pk134.d19:fisSEQ ID NO:28   CGS   SEQ ID NO:13364,在US2005108791中   101   98.7
  egh1c.pk002.l14:fisSEQ ID NO:30   CGS   SEQ ID NO:64801,在US200700196中   115   100
  SFL1.PK133.14:FISSEQ ID NO:32   CGS   SEQ ID NO:13364,在US2005108791中   101   90.7
  MY.P0031.CCMBO48SEQ ID NO:34   CGS   SEQ ID NO:43288,在EP1033405中   122   99.6
  序列   状况   参照序列   BlastpLog打分   %同一性
  p0095.cwsab57raSEQ ID NO:36   EST   SEQ ID NO:42932,在EP1033405中   85   99.3
  sfl1.pk126.p10SEQ ID NO:38   EST   SEQ ID NO:13364,在US2005108791中   54   80.2
  rlr24.pk0071.e7SEQ ID NO:40   EST   SEQ ID NO:13369,在US2005108791中   24   53.9
  cfp2n.pk069.c16SEQ ID NO:42   EST   SEQ ID NO:43288,在EP1033405中   68   94.4
实施例9
制备含有拟南芥前导基因(AT4G23900)的同源物的植物表达载
可使用诸如BLAST(基本的局部比对搜索工具(Basic LocalAlignment Search Tool);Altschul等人,J.Mol.Biol.215:403-410,1993;也参见美国国家卫生研究院(National Institutes of Health)国立医学图书馆(National Library of Medicine)的国家生物技术信息中心(NationalCenter for Biotechnology Information)的万维网网址上对BLAST算法的解释)之类的序列比较算法,鉴定与前导ndk基因同源的序列。同源NDK样序列,如实施例8所述的序列,可通过任一种以下方法进行PCR扩增。
方法1(基于RNA的方法):如果ndk同源物的蛋白编码区域的5’和3’序列信息是可用的,能如实施例5A所述设计基因特异性引物。可将RT-PCR用于植物RNA来获得含有RUM1蛋白编码区的核酸片段,该ndk蛋白编码区旁侧为attB1(SEQ ID NO:52)和attB2(SEQ ID NO:53)序列。引物可含有起始密码子上游的共有Kozak序列(CAACA)。
方法2(基于DNA的方法):作为另外一种选择,如果编码NDK多肽同源物的基因的cDNA克隆是可用的,可以PCR扩增完整cDNA插入序列(含有5′和3′非编码区)。可设计正向引物和反向引物,使它们分别或者含有attB1序列和在该cDNA插入序列前面的载体特异性序列或者含有attB2序列和在该cDNA插入序列后面的载体特异性序列。对于克隆进载体pBluescript SK+中的cDNA插入序列,可使用正向引物VC062(SEQ ID NO:54)和反向引物VC063(SEQ ID NO:55)。
方法1和方法2可根据本领域技术人员已知的步骤进行修改。例如,方法1的引物可含有限制性酶切位点而不是attB1和attB2位点,用于后来将PCR产物克隆进含有attB1和attB2位点的载体内。另外,方法2可涉及从cDNA克隆、λ克隆、BAC克隆或基因组DNA扩增。
可利用BP重组反应将通过任一种上述方法获得的PCR产物与
Figure GPA00001037680800661
供体载体(例如pDONRTM/Zeo(InvitrogenTM,图2;SEQ ID NO:2)或pDONRTM221(InvitrogenTM,图3;SEQ ID NO:3)组合。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM221移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entry clone)。使用InvitrogenTM
Figure GPA00001037680800662
ClonaseTM技术,然后能将来自入门克隆的同源NDK样基因转移到合适的目的载体中以获得植物表达载体,所述载体用于拟南芥、玉米和大豆,如pBC-Yellow(图4;SEQ ID NO:4)、PHP27840(图5;SEQ IDNO:5)或PHP23236(图6;SEQ ID NO:6),以获取植物表达载体,分别用于拟南芥、大豆和玉米。
作为另外一种选择,可进行多个入门克隆和合适的目的载体之间的MultiSite重组反应以产生表达载体。该程序的一个实例在实施例14A中有所描述,该实施例描述了用于转化玉米品系的玉米表达载体的构建。
实施例10
用验证过的拟南芥前导基因及其同源物制备大豆表达载体并转化 大豆
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥(Arabidopsis)基因(AT4G23900)和来自不同物种的对应同源物。
可将实施例5A和9中所述的入门克隆用于将每个基因定向克隆进PHP27840载体(图5,SEQ ID NO:5)中,使得该基因的表达处于SCP1启动子的控制下。
然后可用包含编码本多肽的序列的表达载体转化大豆胚。
为了诱导体细胞胚,可将子叶(长度为3-5mm,从大豆品种A2872的表面灭菌的未成熟种子解剖出来)于26℃在光下或黑暗下培养6-10周。然后切取体细胞胚(其产生次生胚)并将其置于合适的液体培养基内。在重复选择增殖为早期球形阶段胚的体细胞胚的簇后,按下面的描述保持该悬浮液。
可将大豆胚发生悬浮培养物在26℃下在摇床(150rpm)上的35mL液体培养基中保持,荧光光照采用16∶8小时(白天/黑夜)的时间表。通过将大约35mg组织移植进35ml液体培养基中,每两周将培养物进行传代培养。
然后可通过基因枪轰击方法(Klein等人,Nature(London)327:70-73,1987;美国专利4,945,050)转化大豆胚发生悬浮培养物。杜邦公司的BiolisticTMPDS1000/HE仪器(氦气改进型)可用于这些转化。
可用于帮助大豆转化的可选标记基因是由来自花椰菜花叶病毒的35S启动子(Odell等人,Nature 313:810-812,1985)、来自质粒pJR225(来自大肠杆菌;Gritz等人,Gene 25:179-188,1983)的潮霉素磷酸转移酶基因以及胭脂碱合成酶基因的3′区构成的嵌合基因,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T-DNA。可用于帮助大豆转化的另一种可选标记基因是来自大豆或拟南芥属的除草剂抗性乙酰乳酸合成酶(ALS)基因。ALS是支链氨基酸缬氨酸、亮氨酸和异亮氨酸的生物合成中的第一共用酶。已经鉴定出ALS中的突变导致对三类ALS抑制剂中的某些或全部具有抗性(美国专利5,013,659;其全部内容以引用的方式并入本文)。除草剂抗性ALS基因的表达可以处于SAM合成酶启动子(美国专利申请US-2003-0226166-A1;其全部内容以引用的方式并入本文)的控制下。
将如下物质(依次)加入到50μL 60mg/mL的1μm金颗粒悬浮液中:5μL DNA(1μg/μL)、20μL亚精胺(0.1M)和50μL CaCl2(2.5M)。然后搅拌该颗粒制备物三分钟,在微量离心机(microfuge)中离心10秒并移除上清液。然后将DNA包覆的颗粒在400μL 70%乙醇中洗涤一次并再悬浮于40μL无水乙醇中。可将DNA/颗粒悬浮液用超声波处理三次,每次一秒钟。然后将5μL该DNA-包覆的金颗粒装载至每个宏载体盘上。
将大约300-400mg两周大的悬浮培养物置于60×15mm的空培养皿中并用吸管将残留的液体从组织移除。对于每次转化实验,大约5-10板的组织受到正常轰击。膜破裂压力设定为1100psi并将腔室抽成28英寸汞柱的真空。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,可将组织分成两份并放回液体培养基中,如上所述进行培养。
轰击后五至七天,用新鲜培养基更换该液体培养基,并在轰击后七至十二天,用含有50mg/mL潮霉素的新鲜培养基更换。可每周更换这种选择培养基。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚芽发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新品系当成是独立的转化事件。然后可将这些悬浮培养物作为未成熟胚进行传代培养和维持,或者通过使单独体细胞胚成熟并萌发而再生成整株植株。
能通过在土壤中培养植物并在用
Figure GPA00001037680800681
分析总根质量前洗涤根部来测量大豆增大的根构造。
然后可分析用验证过的基因转化大豆植株以研究相对于对照或参照植株的农学特性。例如,在多种环境条件(如氮限制条件、干旱等)下的氮利用效率、产量增强和/或稳定性。
实施例11
使用粒子轰击用验证过的拟南芥前导基因转化玉米
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥前导基因或来自不同物种的对应同源物。
可将实施例5A中所述的入门克隆用于将每种基因定向克隆进玉米转化载体中。玉米基因的表达可以处于组成型启动子的控制下,例如玉米泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689,1992)。
然后可通过下面的方法将上述重组DNA构建体引入玉米细胞中。可从源于近交玉米系H99和LH132杂交的发育中的颖果切取未成熟的玉米胚。在授粉后10至11天分离胚,这时它们长为1.0至1.5mm。然后将胚以轴线侧朝下放置并与琼脂糖硬化的N6培养基(Chu等人,Sci.Sin.Peking 18:659-668,1975)接触。将胚在27℃下保持在黑暗中。从这些未成熟胚的胚鳞增生出易脆的胚发生愈伤组织,该愈伤组织由未分化的细胞块构成,在胚柄结构上长有体细胞原胚状体和胚状体。可将从该原外植体分离的胚发生愈伤组织在N6培养基上培养,并每两至三周在这种培养基上进行传代培养。
可将质粒p35S/Ac(得自Peter Eckes博士,Hoechst Ag,Frankfurt,Germany)用于转化实验以便提供可选标记。该质粒含有pat基因(见欧洲专利公布0242236),该基因编码草胺膦乙酰转移酶(PAT)。酶PAT赋予对除草性谷氨酰胺合成酶抑制剂例如草胺膦的抗性。p35S/Ac的pat基因处于来自花椰菜花叶病毒的35S启动子(Odell等人,Nature313:810-812(1985))和胭脂碱合成酶基因的3′区的控制下,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T-DNA。
可将粒子轰击法(Klein等人,Nature 327:70-73(1987))用于将基因转移至愈伤组织培养细胞。根据该方法,利用下面的技术用DNA包覆金颗粒(直径1μm)。将10μg质粒DNA加入到50μL金颗粒悬浮液(每mL 60mg)中。将氯化钙(50μL的2.5M溶液)和亚精胺游离碱(20μL的1.0M溶液)加入到该颗粒中。再加入这些溶液过程中涡旋该悬浮液。10分钟后,将试管粗略地离心(以15,000rpm进行5秒钟)并移除上清液。将该颗粒再悬浮于200μL的无水乙醇中,再次离心并移除上清液。再次进行乙醇冲洗并将颗粒再悬浮于终体积为30μL的乙醇中。可将DNA包覆的金颗粒等分试样(5μL)置于KaptonTM飞行圆盘(Bio-Rad Labs)的中心。然后使用
Figure GPA00001037680800691
PDS-1000/He(Bio-Rad Instruments,Hercules CA),采用1000psi的氦气压、0.5cm的间隙距离以及1.0cm的飞行距离,将颗粒加速射入玉米组织中。
对于轰击,将胚发生组织置于琼脂糖硬化的N6培养基上的滤纸上。组织布置成薄薄一层,并覆盖直径为约5cm的圆形区域。然后可将包含组织的培养皿置于离阻挡网大约8cm的PDS-1000/He的腔室内。然后将该腔室中的空气抽出至28英寸汞柱的真空。利用在击波管中氦气压力达到1000psi时破裂的可破裂膜,宏载体被氦气冲击波加速。
轰击后七天,可将组织转移至N6培养基中,该培养基含有双丙氨磷(每升5mg)并缺少酪蛋白或脯氨酸。组织继续在这种培养基上缓慢生长。另外两周后,可将组织转移至含有bialaphos的新鲜N6培养基上。六周后,在某些装有补充了双丙氨磷的培养基的盘上,可辨别直径约1cm的区域上有活性生长的愈伤组织。当在选择培养基上传代培养时,这些愈伤组织可继续生长。
通过首先将组织簇转移到补充有0.2mg每升的2,4-D的N6培养基中,可从该转基因愈伤组织再生出植物。两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。
可再生出转基因的T0植株并按照下面的HTP步骤确定它们的表型。可收集T1种子。
可栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。与合适的对照植物比较,导致根构造改变或上文列出的任何一种农学特性改变的表达构建体可被认为是拟南芥前导基因在玉米中发挥功能以改变根构造或植物构造的证据。
此外,可通过直接转化或者从单独转化的品系基因渗入而将含有验证的拟南芥基因的重组DNA构建体导入玉米品系内。
可对转基因植株(或者是近交的或者是杂交的)进行更有力的基于田间的实验来研究在多种环境条件下(如营养物质的改变和水的可利用性)的根构造或植物构造、产量提高和/或抗根倒伏性。
也可进行后续的产量分析,以确定含有验证过的拟南芥前导基因的植物与不包含验证过的拟南芥前导基因的对照(或参照)植物相比较时是否具有改善的产量表现。包含验证过的拟南芥前导基因的植物相对于对植物将具有改善的产量,优选地在不利环境条件下产量损失减少50%,或在不同环境条件下相对于对照植物将具有提高的产量。
实施例12
电穿孔根癌农杆菌LBA4404
将电穿孔感受态细胞(40μl),例如根癌农杆菌(Agrobacteriumtumefaciens)LBA4404(含有PHP10523)在冰上解冻(20至30分钟)。PHP10523含有用于T-DNA转移的VIR基因、农杆菌属的低拷贝数质粒复制起始区、四环素抗性基因以及用于体内DNA生物分子重组的cos位点。同时,将电穿孔管(electroporation cuvette)在冰上冷却。将该电穿孔仪的设置调节至2.1kV。
将DNA等分试样(0.5μL JT(US 7,087,812)亲代DNA,在低盐缓冲液或双蒸H2O中的浓度为0.2μg至1.0μg)与解冻的农杆菌细胞混合,同时仍然保持在冰上。将该混合物转移至电穿孔管的底部并静止保持在冰上1至2分钟。通过按下“pulse(脉冲)”键两次(理想的是获得4.0毫秒的脉冲)对细胞进行电穿孔(Eppendorf电穿孔仪2510)。随后,将0.5ml 2xYT培养基(或SOCmedium)加入到电穿孔管并转移至15ml Falcon管中。将细胞在28至30℃、200至250rpm下培养3小时。
将250μl的等分试样散布在#30B(YM+50μg/mL奇放线菌素)板上并在28至30℃下培养3天。为了增加转化体的数目,可进行如下两个可选步骤中的其中一个:
选择1:用30μl 15mg/ml的利福平覆盖平板。LBA4404具有针对利福平的染色体抗性基因。这种附加的选择消除了在使用较差的LBA4404感受态细胞制备物时观察到的一些污染克隆。
选择2:进行两次重复的电穿孔以补偿较差的电感受态细胞。
转化体的鉴定
选取四个独立的克隆并划痕接种在AB基本培养基+50mg/mL奇放线菌素的平板(#12S培养基)上用于分离单个克隆。将平板在28℃下培养2至3天。
对于每个推定的共整合体选取单个克隆并将其接种在4ml具有50mg/l的奇放线菌素的#60A中。将该混合物在28℃下摇动培养24小时。采用Qiagen Miniprep+可选的PB洗涤,从4ml培养物分离出质粒DNA。将DNA在30μl中洗提。如上所述,将2μl的等分试样用于电穿孔20μl DH10b+20μl ddH2O。
可任选地,可将15μl等分试样用于转化75至100μl的InvitrogenLibrary Efficiency DH5α。将细胞散布在LB培养基+50mg/mL奇放线菌素的平板(#34T培养基)上并将其在37℃下培养过夜。
对于每个推定的共整合体选取3至4个独立的克隆并将其接种在4ml具有50μg/ml奇放线菌素的2xYT(#60A)上。将细胞在37℃下摇晃培养过夜。
使用
Figure GPA00001037680800711
Miniprep,用任选PB洗涤液(稀释成50μl)从4mL培养物中分离质粒DNA,并且8μl质粒DNA用SalI(使用JT亲本和PHP10523作对照物)进行消化。
对于4个质粒利用限制性内切酶BamHI、EcoRI和HindIII再进行三次消化(使用亲代DNA和PHP 10523作为对照),这4个质粒代表2种具有正确SalI消化模式的推定共整合体。推荐电凝胶(Electronic gel)用于比较。
作为另一种选择,对于高通量应用,例如针对Gaspe Bay Flint衍生的玉米品系(实施例15-17)所描述的,代替通过限制性酶切分析来评价所得的共整合载体,可将三个克隆同时用于如实施例13所述的感染步骤。
实施例13
农杆菌介导的玉米的转化
为了检查所得表型,可转化玉米植株以过表达验证过的拟南芥前导基因或来自不同物种的对应同源物。
农杆菌介导的玉米转化基本上按照Zhao等人,Meth.Mol.Biol.318:315-323(2006)中描述的方法进行(还可参见Zhao等人,Mol.Breed.8:323-333(2001)和1999年11月9日公布的美国专利5,981,840,以引用的方式将该文献并入本文)。该转化过程涉及细菌接种、共培养、静止期、选择以及植株再生。
1.未成熟胚的制备
从颖果切取未成熟胚并置于装有2mL PHI-A培养基的2mL微型管中。
2.胚的农杆菌感染以及共培养
2.1感染步骤
用1mL微量吸移管移出PHI-A培养基并加入1mL农杆菌悬浮液。轻轻倒置该管进行混合。将该混合物在室温下培养5分钟。
2.2共培养步骤
用1mL微量吸移管将农杆菌悬浮液从感染步骤中移出。使用无菌刮刀将胚从管中刮出并转移到100×15mm培养皿中的PHI-B培养基的平板中。确定胚的朝向,使得胚轴在培养基表面上朝下。将具有胚的平板在20℃下于黑暗中培养3天。L-半胱氨酸可用于共培养阶段。采用标准二元载体,补充有100-400mg/L L-半胱氨酸的共培养培养基对于回收稳定的转基因事件是至关重要的。
3.推定的转基因事件的选择
向100×15mm培养皿中的PHI-D培养基的每平板中转移10个胚,保持朝向,并用石蜡膜将培养皿密封。将平板在黑暗中于28℃下培养。预计在6-8周将看见活性生长的推定事件(作为浅黄色胚组织)。不产生事件的胚可能是棕色和坏死的,并且几乎看不见脆性组织生长。取决于生长速率,以2至3周的间隔将推定的转基因胚组织转移到新鲜的PHI-D平板上进行传代培养。记录事件。
4.T0植株的再生
将在PHI-D培养基上增殖的胚组织转移至100×25mm培养皿中的PHI-E培养基(体细胞胚成熟培养基)进行传代培养并在28℃下,在黑暗中培养约10至18天,直至体细胞胚成熟。将具有良好限定的盾片和胚芽鞘的个体成熟体细胞胚芽转移到PHI-F胚芽发芽培养基中,并且在28℃下于光中(约80μE,来自冷光灯或同等荧光灯)培养。在7至10天,将约10cm高的再生植株盆载于园艺混合物中,并使用标准园艺方法使其受冷而变得耐寒。
用于植物转化的培养基
1.PHI-A:4g/L的CHU基础盐、1.0mL/L的1000×Eriksson维生素混合物、0.5mg/L的盐酸硫胺素、1.5mg/L的2,4-D、0.69g/L的L-脯氨酸、68.5g/L的蔗糖、36g/L的葡萄糖,pH为5.2。在使用前加入100μM的乙酰丁香酮,过滤灭菌。
2.PHI-B:无葡萄糖的PHI-A,2,4-D增加至2mg/L,蔗糖减少至30g/L并且补充有0.85mg/L的硝酸银(过滤灭菌),3.0g/L的固化剂(gelrite),100μM的乙酰丁香酮(过滤灭菌),pH为5.8。
3.PHI-C:无固化剂和乙酰丁香酮的PHI-B,2,4-D减少至1.5mg/L并且补充有8.0g/L的琼脂,0.5g/L的Ms-吗啉乙磺酸(MES)缓冲液,100mg/L的羧苄青霉素(过滤灭菌)。
4.PHI-D:补充有3mg/L的双丙氨磷(过滤灭菌)的PHI-C。
5.PHI-E:4.3g/L的Murashige and Skoog(MS)盐(Gibco,BRL11117-074)、0.5mg/L的烟酸、0.1mg/L的盐酸硫胺素、0.5mg/L的盐酸吡哆醇、2.0mg/L的甘氨酸、0.1g/L的肌醇、0.5mg/L的玉米素(Sigma,商品目录号:Z-0164)、1mg/L的吲哚乙酸(IAA)、26.4μg/L的脱落酸(ABA)、60g/L的蔗糖、3mg/L的双丙氨磷(过滤灭菌)、100mg/L的羧苄青霉素(过滤灭菌)、8g/L的琼脂,pH为5.6。
6.PHI-F:不含玉米素、IAA、ABA的PHI-E;蔗糖减少至40g/L;用1.5g/L的固化剂代替琼脂;pH为5.6。
通过首先将组织簇转移到补充有0.2mg每升的2,4-D的N6培养基中,可从该转基因愈伤组织中再生出植物。两周后,可将组织转移至再生培养基(Fromm等人,(1990)Bio/Technology 8:833-839)中。
可进行对转基因T0植株和T1植株的表型分析。
可分析T1植株表型的变化。利用图像分析,可在植株生长过程中在多个时间点,分析T1植株在植株面积、体积、生长速率方面的表型变化并且可进行颜色分析。可如实施例20中所述来分析根构造的改变。
可对农学特性的改变进行后续分析,以确定含有验证过的拟南芥前导基因的植株在与不含有验证过的拟南芥前导基因的对照(或参照)植株比较时是否具有至少一种农学特性的改善。还可在多种环境条件下研究改变。
导致根构造显著改变的表达构建体将被认为是拟南芥基因在玉米中发挥功能以改变根构造的证据。
实施例14A
利用农杆菌介导的转化构建具有拟南芥前导基因(AT4G23900) 的玉米表达载体
用拟南芥ndk基因(AT4G23900)在NAS2(SEQ ID NO:57和GOS2(SEQ ID NO:58)启动子控制下制备玉米表达载体。PINII是终止子(SEQ ID NO:61)
使用InvitrogenTM 技术,如实施例5A所述制备的、包含拟南芥ndk基因(AT4G23900)的入门克隆PHP 28731被用于独立的反应:
1)组成型玉米GOS2启动子入门克隆(PHP28408,图11,SEQ IDNO:11)和PinII终止子入门克隆(PHP20234,图9,SEQ ID NO:9)形成目的载体PHP28529(图10,SEQ ID NO:10)。将所得载体命名为PHP28911。
2)根玉米NAS2启动子入门克隆(PHP22020,图12,SEQ ID NO:12)和PinII终止子入门克隆(PHP20234,图9,SEQ ID NO:9)形成目的载体PHP28529(图10,SEQ ID NO:10)。将所得载体命名为PHP28912。
目的载体PHP28529被加到每个最终载体(PHP28911和PHP28912)中,也是:
1)RD29A启动子::黄色荧光蛋白::PinII终止子盒,用于拟南芥属种子分选。
2)泛素启动子::moPAT/红色荧光蛋白融合基因::PinII终止子盒,用于转化选择和玉米种子分选。
实施例14B
制备包含拟南芥ndk基因及其同源物的玉米表达构建体
可使用实施例5A和14A所述的程序将拟南芥ndk基因及其来自玉米和其他物种的对应同源物(表1)转化到玉米品系中。能如实施例5A和14A所述制备具有拟南芥ndk基因及其来自玉米和其他物种的对应同源物(表1)的玉米表达载体。除了GOS2或NAS2启动子,其他启动子,例如但不限于泛素启动子、S2A和S2B启动子、玉米ROOTMET2启动子、玉米Cyclo、CR1BIO、CRWAQ81以及玉米ZRP2.4447,可用于引导ndk和NDK样基因在玉米中的表达。此外,多种终止子,例如但不限于PINII终止子,可用于完成所关注基因在玉米中的表达。
实施例14C
使用农杆菌介导转化,用拟南芥前导基因(AT4G23900)和来自 其他物种的对应同源物转化玉米品系
然后可将最终载体(玉米中表达的载体,实施例14A和B)分别电穿孔进入包含PHP10523的LBA4404农杆菌(图7;SEQ ID NO:7,Komari等人,Plant J 10:165-174(1996),NCBI GI:59797027)中,以产生用于玉米转化的共整合载体。该共整合载体是通过最终载体(玉米表达载体)与PHP 10523的重组(通过每个载体上含有的COS重组位点)而形成。除了实施例14A-B中所述的表达盒,该共整合载体还含有农杆菌菌株以及农杆菌介导转化所需的基因(TET、TET、TRFA、ORI终止子、CTL、ORI V、VIR C1、VIR C2、VIR G、VIR B)。转化玉米品系可如实施例13所述进行。
实施例15
用于转化Gaspe Bay Flint衍生的玉米品系的目的载体PHP23236和 PHP29635的制备
目的载体PHP23236(图6,SEQ ID NO:6)是通过用质粒PHP23235(图8,SEQ ID NO:8)转化包含质粒PHP10523(图7,SEQ ID NO:7)的农杆菌菌株LBA4404并分离所得的共整合产物而获得。目的载体PHP23236可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化Gaspe Bay Flint衍生的玉米品系的玉米表达载体。所关注的基因的表达是处于泛素启动子(SEQ ID NO:59)的控制之下。
PHP29635(图13,SEQ ID NO:13)是通过用质粒PIIOXS2a-FRT87(ni)m(图14,SEQ ID NO:56)转化包含质粒PHP10523的农杆菌菌株LBA4404并分离所得的共整合产物而获得。目的载体PHP29635可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化Gaspe Bay Flint衍生的玉米品系的玉米表达载体。所关注的基因的表达是处于S2A启动子(SEQ ID NO:60)的控制之下。
实施例16
用于转化Gaspe Bay Flint衍生的玉米品系的质粒的制备
使用InvitrogenTM
Figure GPA00001037680800761
重组技术,可如实施例5A和9所述制备包含拟南芥ndk基因(AT4G23900)或玉米NDK样同源物的入门克隆,该克隆用于定向克隆每个基因进入目的载体PHP23236(实施例15)用于在泛素启动子下表达,或进入目的载体PHP29635(实施例15)用于在S2A启动子下表达。每一种表达载体都是用于农杆菌介导玉米转化的T-DNA二元载体。
Gaspe Bay Flint衍生的玉米品系可如实施例17中所述用表达构建体转化。
实施例17
用验证过的拟南芥前导基因和来自其他物种的对应同源物转化 Gaspe Bay Flint衍生的玉米品系
为了检查所得表型,玉米植株可如实施例16所述进行转化以过表达拟南芥AT4G23900基因和来自其他物种的同源物,如表1列出的基因。除了如实施例16所述的启动子之外,其他启动子,例如S2A和S2B启动子、玉米ROOTMET2启动子、玉米Cyclo、CR1BIO、CRWAQ81以及玉米ZRP2.4447,可用于引导ndk和NDK样基因在玉米中的表达。此外,多种终止子,例如但不限于PINII终止子,可用于完成所关注基因在Gaspe Bay Flint衍生的玉米品系中的表达。
受体植株
受体植株细胞可来自具有短的生活周期(“快速循环”)、大小减少以及转化潜能高的单一玉米品系。对玉米典型的这些植株细胞是来自可公开获得的Gaspe Bay Flint(GBF)品系变种的植株细胞。一种可能的候选植株品系变种是GBF×QTM(Quick Turnaround Maize(快速周转玉米),选择用于在温室条件下生长的Gaspe Bay Flint的可公开获得形式)的F1杂交种,其在Tomes等人的美国专利申请公开2003/0221212中有所公开。从该品系获得的转基因植株具有如此小的大小使得它们可在4英寸的盆中生长(是正常大小的玉米植株所需空间的1/4)并且它们在少于2.5个月时间内成熟。(传统上,一旦转基因植株适应温室后需要3.5个月来获得转基因T0种子。)另一合适的品系是GS3(高度可转化的品系)×Gaspe Flint的双单倍体品系。还有另一种合适的品系是携带引起较早开花、高度减小或这两者的转基因的可转化的优良近交系。
转化规程
任何合适的方法可用于将转基因引入玉米细胞中,包括但不限于利用基于农杆菌载体的接种类型的步骤,如实施例9所述。转化可在受体(靶标)植株的未成熟胚上进行。
精确的生长和植株跟踪
将由转化的玉米胚产生的转基因(T0)植株的事件群体在受控的温室环境中栽培,该温室使用改良的随机分块(block)设计以降低或消除环境误差。随机分块设计是这样一种植株布局,在该布局中,实验植株被分成组(如,每组30株植株),称为块,而每株植株随块被随机分配一个位置。
对于一组30株植株,24株转化的实验植株和6株对照植株(具有设定好的表型的植株)(总起来说称为“重复组”)被置于盆中,这些盆在位于温室内的桌子上布置成阵列(也叫做重复组或块)。每株植株(对照植株或实验植株)随块被随机分配一个位置,所述的块映射一个唯一的、温室物理位置以及映射该重复组。在单次实验中多个30株植株的重复组中的每一个可栽培在相同的温室中。应该确定重复组的布局(布置方式)以使对空间的要求最小以及温室内的环境影响最小。这样一种布局可称为压缩的温室布局。
对于加入特定的对照组的一种替代方法是鉴定不表达所关注基因的那些转基因植株。可将诸如RT-PCR之类的多种技术应用于定量评估引入基因的表达水平。可将不表达转基因的T0植株与表达转基因的那些植株进行比较。
在整个评价过程中鉴定和跟踪事件群体中的每株植株,并且从那些植株收集的数据自动与那些植株相关联,使得所搜集的数据可与由该植株携带的转基因关联。例如,每个植株容器具有机器可读的标签(例如通用货单代码(UPC)条形码),该标签包含了关于植物身份的信息,身份信息继而又与温室位置相关,使得从植物获得的数据可自动与该植物相关联。
作为另外一种选择,可使用任何有效的、机器可读的植物识别系统,例如二维矩阵代码或甚至是射频识别标签(RFID),其中数据被接收并由射频接收器/处理器进行翻译。参见美国公布的专利申请2004/0122592,将其以引用的方式并入本文。
利用三维成像进行表型分析
对T0事件群体中的每株温室植株(包括任何对照植株)分析所关注的农学特性,并且以这样一种方式记录或存储每株植株的农学数据,该方式使得数据与该植株的辨识数据(见上面)相关联。可利用与上述类似的实验设计,可在T1代中完成对表型(基因效应)的确认。
在植物的整个温室生活周期中,利用定量的非破坏性成像技术在表型水平上来分析T0植株以评估所关注的性状。优选的是,将数字成像分析仪用于整株植物的自动多维分析。成像可在温室内进行。将两个摄像系统(位于顶部和侧面)和用于旋转植物的装置用于从所有侧面观察植物和成像。从每株植物的顶部、前面和侧面采集图像。所有的三个图像一起提供了足够的信息用于评价每株植物的生物量、大小和形态。
由于植物在第一片叶片从土壤显现出来时到植物处于它们发育的末期时大小的改变,最好是从顶部以较高的放大倍率记录植物发育的早期。这可通过利用完全由成像软件控制的自动变焦镜头系统来完成。
在单次成像分析操纵中,进行如下事件:(1)将植株传送至分析仪区域内,旋转360度以便其机器可读标签可被读取,并且让其保持静止直至其叶片停止移动;(2)获取侧面图像并将其输入数据库;(3)将植株旋转90度并再次让其保持静止直至其叶片停止移动;以及(4)将该植株传送出分析仪。
每24小时的周期让植物至少6个小时处于黑暗以便具有正常的白天/黑夜周期。
成像仪器
可使用任何合适的成像仪器,包括但不限于可从LemnaTec GmbH(Wurselen,Germany)商购获得的光谱数字成像仪。获取图像并用具有1/2″IT Progressive Scan IEE CCD成像设备的LemnaTec ScanalyzerHTS LT-0001-2进行分析。该成像照相机可配备有自动变焦、自动调节光圈和自动聚焦。可利用LemnaTec软件设定所有的照相机设置。优选的是,对于主要组成成像分析仪的仪器差异小于约5%,对于次要组成成像分析仪的仪器差异小于约10%。
软件
成像分析系统包括用于颜色和结构分析的LemnaTec HTS Bonit软件程序和用于存储约500,000次分析的数据(包括分析数据)的服务器数据库。原始图像和分析过的图像储存在一起以允许用户根据需要进行再次分析。可将数据库连接至成像硬件用于自动的数据收集和存储。可将多种市售的软件系统(如Matlab等)用于定量判读成像数据,并且这些软件系统中的任一种均可应用于图像数据集。
传送系统
具有植物旋转装置的传送系统可用于将植物传送至成像区域并在成像过程中选择植物。例如,将最多4株植物(每株最高高度为1.5m)装上汽车,该汽车在循环的传送系统上行进并通过成像测量区域。在这种情况下,该单位(成像分析仪和传送环线)的总占有面积为约5m×5m。
可扩大传送系统以同时容纳更多植物。将植物沿传送环线传送至成像区域并对每株植物分析最多50秒。获取植物的三个视图。传送系统以及成像设备应该能够用于温室环境条件。
照明
任何合适的照明模式可用于图像采集。例如,可在暗背景上使用顶部照明。作为另外一种选择,可采用使用白色背景的顶部照明和背部照明的组合。应该将被照亮的区域围起来以确保恒定的照明条件。遮蔽物应该长于测量区域使得能保持恒定的光条件而不需要打开和关闭门。作为另一种选择,可变化照明以引起转基因(如,绿色荧光蛋白(GFP)、红色荧光蛋白(RFP))的激发或者引起内源性(如叶绿素)荧光基团的激发。
基于三维成像的生物量评价
为了更好地评价生物量,应该从至少三个轴(优选顶部视图和两个侧面(侧面1和侧面2)视图)获取植物图像。然后分析这些图像以将植物从背景(盆和花粉控制袋(如果适用的话))分离。可通过如下计算来评价植物的体积:
在上面的等式中,体积和面积的单位是“任意单位”。在该体系中,任意单位完全足以检测基因对植物大小和生长影响,因为所需的是检测与实验平均值或对照平均值的差值(正较大和负较小两者)。大小(如面积)的任意单位可通过将物理参照加入到成像过程而轻易地转化成物理量度。例如,可在顶部成像过程和侧面成像过程两者中均包括已知面积的物理参照。基于这些物理参照的面积,可测定转换因子以允许从像素转换为面积单位,例如平方厘米(cm2)。物理参照可以是或可以不是独立的样本。例如,具有已知直径和高度的盆足可用作物理参照。
颜色分类
成像技术还可用于确定植物颜色以及用于将植物颜色归为各种衍生类型。将图像颜色归属于颜色类型是LemnaTec软件的固有特色。使用其他图像分析软件系统,可通过多种计算方法确定颜色分类。
对于植物大小和生长参数的测定,一种有用的分类方案是定义一种单一颜色方案,包括绿色的两种或三种色调,此外,还有关于缺绿病、坏死和漂白(在这些条件出现时)的颜色类型。还使用了背景颜色类型,其包括图像中的非植物颜色(例如盆和土壤颜色),并将这些像素特别地从测定大小中排除。在受控的恒定照明下分析植物,使得可定量一株植物内随时间推移的任何改变,或者植物之间或植物不同分枝之间的任何改变(如季节差异)。
除了其在测定植物的大小、生长中的有效性之外,颜色分类还可用于评估其他产量构成性状。对于这些其他产量构成性状,可使用另外的颜色分离方案。例如,称为“保绿度(staygreen)”的性状(已经将其与产量的提高相关联)可通过颜色分类来评估,该颜色分类将绿色色调与黄色和棕色色调(其指示老化的组织)相分离。通过将这种颜色分类应用于在T0或T1植物生命周期末期获取的图像,可鉴定绿色的量相对于黄色和棕色(例如,可表示为绿色/黄色比率)增加的植物。这种绿色/黄色比率具有显著差异的植物可被鉴定为携带影响这种重要农学特性的转基因。
熟练的植物学家将认识到可指示植物健康或应激反应的其他植物颜色(花青素)的出现,并且认识到其他颜色分类方案可提供对基因在与这些响应相关的性状方面的作用的进一步度量。
植物构造分析
改变植物构造参数的转基因也可用本发明鉴定,包括诸如最大高度和宽度、节间距离、叶与茎之间的角度、在节处开始的叶片数以及叶片长度。LemnaTec系统软件可如下用于确定植物构造。在第一成像步骤中将植物简化至其主要的几何构造,并且随后基于该图像可进行不同构造参数的参数化鉴定。或者是单独地或者是组合地修改任何这些构造参数的转基因可通过应用此前所述的统计方法来鉴定。
花粉脱落日期
花粉脱落日期是转基因植物中要分析的一个重要参数,并且可通过活性雄花第一次出现在植物上来确定。为了找到雄花目标,通过用颜色对茎的上端进行分类以检测黄色或紫色花药。然后将这种颜色分类分析用于定义活性花,活性花继而可用于计算花粉脱落日期。
作为另外一种选择,花粉脱落日期和其他易于在视觉上检测到的植物属性(如授粉日期、第一穗丝日期)可由负责进行植物看护的工作人员来记录。为了使数据完整性和过程效率最大化,通过利用相同的由LemnaTec光谱数字分析设备利用的条形码来跟踪该数据。可将具有条形码阅读器的电脑、掌上设备或笔记本电脑用于使记录观察时间、植物标识符的数据捕捉变得容易,并且使捕捉数据的操作者感觉舒适。
植物的取向
以接近商业栽培的密度种植的成熟玉米植物通常具有平面的构造。也就是说,植物具有一可清晰分辨的宽的侧面和窄的侧面。对来自植物宽侧的图像进行测定。对于每株植物,给其赋予一个明确界定的基本取向以获得宽侧图像与窄侧(edgewise)图像之间的最大差别。将顶部图像用于确定植物的主轴,而将额外的旋转装置用于在开始主图像采集前将植物转至合适的取向。
实施例18
在氮限制条件下筛选Gaspe Bay Flint衍生的玉米品系和杂交种
一些转基因植物将含有两个或三个剂量的Gaspe Flint-3与一个剂量的GS3(GS3/(Gaspe-3)2X或GS3/(Gaspe-3)3X),并且对于显性转基因将会以1∶1分离。其他转基因植物将是常规近交系,并将被用于顶交以生成测试杂交种。将植物在Turface中栽培,每天用1mMKNO3生长培养基和2mM KNO3或更高的生长培养基浇洒四次(见图17)。生长于1mM KNO3培养基中的对照植物将绿度更低,产生更少的生物量并在开花期具有更小的穗。Gaspe衍生的品系将生长到开花阶段,而常规近交系和杂交种将生长到V4至V5阶段。
用统计学确定处理株之间所观察到的差异是否是显著差异。图18示出了一种方法,该方法将字母放在数值后面。同一列中其后具有相同字母(不是字母组)的那些值不具有显著的差异。使用该方法,如果在一列中的值的后面没有字母,则该列中的任意这些值之间不存在显著的差异,换句话讲,该列中的所有这些值是均等的。与无效转基因相比较,转基因的表达将导致植物在1mM KNO3中具有改善的植物生长。因此生物量和绿度数据(如实施例17所述)将在取样(Gaspe在开花期,而其他的品系在V4-V5阶段)时间采集,并与无效转基因植物比较。此外,将在基本组织中分析植物中的总氮。在开花期的生长、绿度、氮积聚和穗大小的改善将指示氮利用效率提高。
实施例19
具有验证过的拟南芥前导基因(AT4G23900)的玉米品系的产量 分析
可通过直接转化或者从单独转化的品系基因渗入而将含有验证过的拟南芥基因的重组DNA构建体导入玉米品系内。
可将转基因植物(近交系或顶交种)进行更强的基于田间的试验,以研究在不同环境条件(例如改变水和营养物质可利用性)下的产量增加和/或稳定性。标准化的产量试验将通常包括4至6次重复,以及至少4个位置。将收集合并的收获产量数据。
可对产量进行后续分析以确定含有验证过的拟南芥前导基因的植株在与不含有验证过的拟南芥前导基因的对照植株(无效构建体或野生型)比较时,在不同环境条件下是否具有产量的改善。可在氮胁迫或水分胁迫环境下测量产量减少情况。包含验证过的拟南芥前导基因的植物具有相对于对照植物更少的产量损失,优选50%更少的产量损失。
实施例20
测定玉米根构造改变的测定法
测定转基因玉米植物在幼苗期、花期或成熟期的根构造改变。测量玉米植物的根构造改变的测定法包括但不限于下面概述的方法。为了便于手动或自动地测定根构造改变,可让玉米植物在透明的盆中生长。
1)根量(干重)。让植物在Turface中生长。将烘干的根和根组织称重并计算根/苗比率。
2)侧根分枝的水平。侧根分枝的程度(如侧根数量、侧根长度)通过这样确定:从完整的根系进行二次取样,将样本用平面扫描器或数码相机成像并用WinRHIZOTM软件(RegentInstruments Inc.)分析。
3)根带宽度的测量。根带是植物成熟时在温室栽培盆的底部形成的根带或根量。测量成熟时根带的厚度(以mm为单位),作为对根量的粗略评价。
4)节生根的计数。从支持培养基(support medium)(如盆栽混合物(potting mix))中分离出根后,可测定上部节位处出现的冠根数。另外,可测量冠根和/或支柱根的角度。对节生根和节生根的分枝量的数值分析形成对上述手动方法的另一种延伸。
对提取的有关根表型的所有数据进行统计分析(通常为t检验),以将转基因根与非转基因姊妹株植株的根进行比较。在多个事件和/或构建体涉及该分析的情况下,还可使用单因素方差分析。
实施例21
包含拟南芥ndk基因的玉米幼苗的根与来自不包含ndk基因的幼 苗的根的比较分析
如实施例14A所述制备包含GOS2启动子和拟南芥ndk基因的玉米表达载体。如实施例14C所述经由农杆菌介导的转化,通过制备共合体载体(PHP29007)完成玉米转化,并使用如实施例20所述的幼苗检测分析法对根进行检测。在温室实验中检测分析所有10个来自构建体PHP29007(ZM-GOS2::AT-NDK4)的事件,其中每个事件使9个植株在Turface培养基中生长至V4阶段。种子来自T1代(来自从T0植株收集的穗)。实验中的对照是相同杂交玉米品系的15个植株,该植株不包含重组构建体并生长至相同阶段。使用完全随机分组设计种植种子。在种植后19天收获植株,此时它们达到V4阶段。洗涤根部并从苗中分开收集。在用分析天平称量干重之前,所有样本进行烘干。
从表5中可以看到,据发现与对照植物相比较,共4个事件的苗干重发生显著改变,2个事件的根干重发生显著改变。
进行t检验分析以显示每个转基因事件和对照植物之间的显著差异。显示了每种特性的p值:根干重、苗干重、以及根与苗的比率。粗体字指示转基因植物具有比对照植物更高的值。具有小于0.1的p值的那些值用星号(*)指示。
表5
转基因和对照幼苗的比较
  事件   根干重   苗干重   根/苗比率
  1   0.330   0.070   0.305
  2   0.405   0411   0.500
  3   0.002*   0.000*   0.008
  4   0.000*   0.000*   0.016
  5   0.225   0.082   0.436
  6   0.573   0.752   0.809
  7   0.955   0.576   0.181
  8   0.261   0.074   0.407
  9   0.683   0.463   0.608
  10   0.682   0.663   0.368
实施例22
在田间标准氮和低氮条件下生长的转基因杂交种产量测试
在2007季,在Johnston,Iowa的农场中进行田间实验。实验包括表达由玉米GOS2启动子启动的拟南芥NDK4基因的十个(10)转基因事件和两个对照植物。一个对照植物由批杂交所有10个事件的非无效转基因与无效转基因组成。另一个对照植物由转化中使用的野生型(不包含重组构建体的相同杂交玉米品系)组成。所有植物是由常见近交系受试者生成的杂交玉米品系。
施加两次处理,其中植物在“标准”氮条件下或在氮“耗尽”条件下进行处理。“标准”处理包括以250磅每英亩的比率施加氮肥。氮“耗尽”条件通过在其中土壤含氮量已经在以前多年的缺乏肥料条件下被作物耗尽的土地上种植转基因和非转基因对照玉米品系获得。
氮耗尽与标准氮处理相比引起30%的产量减少,并且需要每英亩100磅的施肥比率。用2排小块土地进行实验,其密度为每英亩32000株植物。在标准氮和氮耗尽处理中分别包括四次(4)和六次(6)重复。在2007年5月21日种植植物,并在2007年9月26日和27日一起收获。以每英亩蒲式耳来测量产量。
实验的产量数据在下表6中综述。总体上,在低氮条件下的一个(1)事件和在标准氮条件下的四个(4)事件显示与批无效转基因对照植物相比,产量显著增加。在低氮条件下一个事件具有与对照植物相比的产量显著减少。大部分测试的事件显示产量比无效转基因增加的正向趋势。
表6:在低氮和标准氮条件下转基因植物相对于对照植物的产量测
  事件   产量相对于无效转基因的增加   显著性   处理
  1   6.74%   低氮
  2   7.05%   低氮
  3   -1.84%   低氮
  4   0.33%   低氮
  5   1.66%   低氮
  6   4.34%   低氮
  7   -9.10%   P=0.1   低氮
  8   7.89%   P=0.1   低氮
  9   4.13%   低氮
  10   1.05%   低氮
  1   3.25%   标准氮
  事件   产量相对于无效转基因的增加   显著性   处理
  2   2.40%   标准氮
  3   -1.71%   标准氮
  4   9.16%   P=0.1   标准氮
  5   2.70%   标准氮
  6   5.26%   P=0.1   标准氮
  7   6.66%   P=0.1   标准氮
  8   -0.04%   标准氮
  9   -2.57%   标准氮
  10   7.27%   P=0.1   标准氮
序列表
<110>DuPont de Nemours
     Taramino,Graziana
     Tingey,Scott
     Sakai,Hajime
     Allen,Steve
     Tomes,Dwight
     Luck,Stanley
     Niu,Xiaomu
 
<120>涉及编码核苷二磷酸激酶(NDK)多肽及其同源物基因的具有改变根结构的植物、相关
     的构建体以及方法
 
<130>BB1573 USNA
 
<150>60/968754
<151>2007-08-29
 
<160>61
 
<170>PatentIn版本3.3
 
<210>1
<211>18444
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>1
catgaatcaa acaaacatac acagcgactt attcacacga gctcaaatta caacggtata   60
tatcctgccg tcgacaacca tggtctagac aggatccccg ggtaccgagc tcgaatttgc  120
aggtcgactg cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa  180
gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg  240
ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat  300
ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa  360
tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat tgccctttgg  420
tcttctgaga ctgttgcgtc atcccttacg tcagtggaga tatcacatca atccacttgc  480
tttgaagacg tggttggaac gtcttctttt tccacgatgc tcctcgtggg tgggggtcca  540
tctttgggac cactgtcggc agaggcatct tgaacgatag cctttccttt atcgcaatga  600
tggcatttgt aggtgccacc ttccttttct actgtccttt tgatgaagtg acagatagct  660
gggcaatgga atccgaggag gtttcccgat attacccttt gttgaaaagt ctcagttaac  720
ccgcgatcct gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga  780
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt     840
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca     900
tttgtaggtg ccaccttcct tttctactgt ccttttgatg aagtgacaga tagctgggca     960
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa ttgccctttg    1020
gtcttctgag actgttgcgt catcccttac gtcagtggag atatcacatc aatccacttg    1080
ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg gtgggggtcc    1140
atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt tatcgcaatg    1200
atggcatttg taggtgccac cttccttttc tactgtcctt ttgatgaagt gacagatagc    1260
tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag tctcagttaa    1320
cccgcaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc    1380
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc    1440
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggatc gatccgtcga    1500
tcgaccaaag cggccatcgt gcctccccac tcctgcagtt cgggggcatg gatgcgcgga    1560
tagccgctgc tggtttcctg gatgccgacg gatttgcact gccggtagaa ctccgcgagg    1620
tcgtccagcc tcaggcagca gctgaaccaa ctcgcgaggg gatcgagccc ctgctgagcc    1680
tcgacatgtt gtcgcaaaat tcgccctgga cccgcccaac gatttgtcgt cactgtcaag    1740
gtttgacctg cacttcattt ggggcccaca tacaccaaaa aaatgctgca taattctcgg    1800
ggcagcaagt cggttacccg gccgccgtgc tggaccgggt tgaatggtgc ccgtaacttt    1860
cggtagagcg gacggccaat actcaacttc aaggaatctc acccatgcgc gccggcgggg    1920
aaccggagtt cccttcagtg aacgttatta gttcgccgct cggtgtgtcg tagatactag    1980
cccctggggc cttttgaaat ttgaataaga tttatgtaat cagtctttta ggtttgaccg    2040
gttctgccgc tttttttaaa attggatttg taataataaa acgcaattgt ttgttattgt    2100
ggcgctctat catagatgtc gctataaacc tattcagcac aatatattgt tttcatttta    2160
atattgtaca tataagtagt agggtacaat cagtaaattg aacggagaat attattcata    2220
aaaatacgat agtaacgggt gatatattca ttagaatgaa ccgaaaccgg cggtaaggat    2280
ctgagctaca catgctcagg ttttttacaa cgtgcacaac agaattgaaa gcaaatatca    2340
tgcgatcata ggcgtctcgc atatctcatt aaagcagggg gtgggcgaag aactccagca    2400
tgagatcccc gcgctggagg atcatccagc cggcgtcccg gaaaacgatt ccgaagccca    2460
acctttcata gaaggcggcg gtggaatcga aatctcgtga tggcaggttg ggcgtcgctt    2520
ggtcggtcat ttcgaacccc agagtcccgc tcagaagaac tcgtcaagaa ggcgatagaa    2580
ggcgatgcgc tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca    2640
ttcgccgcca agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc    2700
cgccacaccc agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat    2760
attcggcaag caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgccccc    2820
caattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact    2880
taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac    2940
cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt    3000
tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg    3060
ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg    3120
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg    3180
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat    3240
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac    3300
ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat    3360
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag    3420
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc    3480
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc    3540
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc    3600
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc    3660
ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt    3720
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt    3780
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat    3840
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct    3900
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat    3960
gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc    4020
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg    4080
ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc    4140
tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta    4200
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc    4260
ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga    4320
tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat    4380
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat    4440
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa    4500
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa    4560
ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt    4620
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt    4680
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata    4740
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt    4800
ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag aaagcgccac    4860
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga    4920
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg    4980
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa    5040
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat    5100
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc    5160
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga    5220
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg    5280
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta    5340
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg    5400
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct    5460
ttctaggggg ggggtaccga tctgagatcg gtaacgaaaa cgaacgggta gggatgaaaa    5520
cggtcggtaa cggtcggtaa aatacctcta ccgttttcat tttcatattt aacttgcggg    5580
acggaaacga aaacgggata taccggtaac gaaaacgaac gggataaata cggtaatcga    5640
aaaccgatac gatccggtcg ggttaaagtc gaaatcggac gggaaccggt atttttgttc    5700
ggtaaaatca cacatgaaaa catatattca aaacttaaaa acaaatataa aaaattgtaa    5760
acacaagtct taattaaaca tagataaaat ccatataaat ctggagcaca catagtttaa    5820
tgtagcacat aagtgataag tcttgggctc ttggctaaca taagaagcca tataagtcta    5880
ctagcacaca tgacacaata taaagtttaa aacacatatt cataatcact tgctcacatc    5940
tggatcactt agcatgctac agctagtgca atattagaca ctttccaata tttctcaaac    6000
ttttcactca ttgcaacggc cattctccta atgacaaatt tttcatgaac acaccattgg    6060
tcaatcaaat cctttatctc acagaaacct ttgtaaaata aatttgcagt ggaatattga    6120
gtaccagata ggagttcagt gagatcaaaa aacttcttca aacacttaaa aagagttaat    6180
gccatcttcc actcctcggc tttaggacaa attgcatcgt acctacaata attgacattt    6240
gattaattga gaatttataa tgatgacatg tacaacaatt gagacaaaca tacctgcgag    6300
gatcacttgt tttaagccgt gttagtgcag gcttataata taaggcatcc ctcaacatca    6360
aataggttga attccatcta gttgagacat catatgagat ccctttagat ttatccaagt    6420
cacattcact agcacacttc attagttctt cccactgcaa aggagaagat tttacagcaa    6480
gaacaatcgc tttgattttc tcaattgttc ctgcaattac agccaagcca tcctttgcaa    6540
ccaagttcag tatgtgacaa gcacacctca catgaaagaa agcaccatca caaactagat    6600
ttgaatcagt gtcctgcaaa tcctcaatta tatcgtgcac agctacttca tttgcactag    6660
cattatccaa agacaaggca aacaattttt tctcaatgtt ccacttaacc atgattgcag    6720
tgaaggtttg tgataacctt tggccagtgt ggcgcccttc aacatgaaaa aagccaacaa    6780
ttcttttttg gagacaccaa tcatcatcaa tccaatggat ggtgacacac atgtatgact    6840
tattttgaca agatgtccac atatccatag ttgtactgaa gcgagactga acatctttta    6900
gttttccata caacttttct ttttcttcca aatacaaatc catgatatat tttctagcag    6960
tgacacggga ctttattgga aagtgagggc gcagagactt aacaaactca acaaagtact    7020
catgttctac aatattgaaa ggatattcat gcatgattat tgccaaatga agcttcttta    7080
ggctaaccac ttcatcgtac ttataaggct caatgagatt tatgtctttg ccatgatcct    7140
tttcactttt tagacacaac tgacctttaa ctaaactatg tgatgttctc aagtgatttc    7200
gaaatccgct tgttccatga tgaccctcag ccctatactt agccttgcaa ttaggaaagt    7260
tgcaatgtcc ccatacctga acgtatttct ttccatcgac ctccacttca atttccttct    7320
tggtgaaatg ctgccataca tccgatgtgc acttctttgc cctcttctgt ggtgcttctt    7380
cttcgggttc aggttgtggc tgtggttgtg gttctggttg tggttgtggt tgtggttgtg    7440
gttcatgaac aatagccata tcatcttgac tcggatctgt agctgtacca tttgcattac    7500
tactgcttac actctgaata aaatgcctct cggcctcagc tgttgatgat gatggtgatg    7560
tgcggccaca tccatgccca cgcgcacgtg cacgtacatt ctgaatccga ctagaagagg    7620
cttcagcttt tcttttcaac cctgttataa acagattttt cgtattattc tacagtcaat    7680
atgatgcttc ccaatctaca accaattagt aatgctaatg ctattgctac tgtttttcta    7740
atatatacct tgagcatatg cagagaatac ggaatttgtt ttgcgagtag aaggcgctct    7800
tgtggtagac atcaacttgg ccaatcttat ggctgagcct gagggaggat tatttccaac    7860
cggaggcgtc atctgaggaa tggagtcgta gccggctagc cgaagtggag agcagagccc    7920
tggacagcag gtgttcagca atcagcttgg tgctgtactg ctgtgacttg tgagcacctg    7980
gacggctgga cagcaatcag caggtgttgc agagcccctg gacagcacac aaatgacaca    8040
acagcttggt gcaatggtgc tgacgtgctg tactgctaag tgctgtgagc ctgtgagcag    8100
ccgtggagac agggagaccg cggatggccg gatgggcgag cgccgagcag tggaggtctg    8160
gaggaccgct gaccgcagat ggcggatggc ggatgggcgg accgcggatg ggcgagcagt    8220
ggagtggagg tctgggcgga tgggcggacc gcggcgcgga tgggcgagtc gcgagcagtg    8280
gagtggaggg cggaccgtgg atggcggcgt ctgcgtccgg cgtgccgcgt cacggccgtc    8340
accgcgtgtg gtgcctggtg cagcccagcg gccggccggc tgggagacag ggagagtcgg    8400
agagagcagg cgagagcgag acgcgtcgcc ggcgtcggcg tgcggctggc ggcgtccgga    8460
ctccggcgtg ggcgcgtggc ggcgtgtgaa tgtgtgatgc tgttactcgt gtggtgcctg    8520
gccgcctggg agagaggcag agcagcgttc gctaggtatt tcttacatgg gctgggcctc    8580
agtggttatg gatgggagtt ggagctggcc atattgcagt catcccgaat tagaaaatac    8640
ggtaacgaaa cgggatcatc ccgattaaaa acgggatccc ggtgaaacgg tcgggaaact    8700
agctctaccg tttccgtttc cgtttaccgt tttgtatatc ccgtttccgt tccgttttcg    8760
ttttttacct cgggttcgaa atcgatcggg ataaaactaa caaaatcggt tatacgataa    8820
cggtcggtac gggattttcc catcctactt tcatccctga gattattgtc gtttctttcg    8880
cagatcggta ccccccccct agagtcgaca tcgatctagt aacatagatg acaccgcgcg    8940
cgataattta tcctagtttg cgcgctatat tttgttttct atcgcgtatt aaatgtataa    9000
ttgcgggact ctaatcataa aaacccatct cataaataac gtcatgcatt acatgttaat    9060
tattacatgc ttaacgtaat tcaacagaaa ttatatgata atcatcgcaa gaccggcaac    9120
aggattcaat cttaagaaac tttattgcca aatgtttgaa cgatctgctt cgacgcactc    9180
cttctttagg tacggactag atctcggtga cgggcaggac cggacggggc ggtaccggca    9240
ggctgaagtc cagctgccag aaacccacgt catgccagtt cccgtgcttg aagccggccg    9300
cccgcagcat gccgcggggg gcatatccga gcgcctcgtg catgcgcacg ctcgggtcgt    9360
tgggcagccc gatgacagcg accacgctct tgaagccctg tgcctccagg gacttcagca    9420
ggtgggtgta gagcgtggag cccagtcccg tccgctggtg gcggggggag acgtacacgg    9480
tcgactcggc cgtccagtcg taggcgttgc gtgccttcca ggggcccgcg taggcgatgc   9540
cggcgacctc gccgtccacc tcggcgacga gccagggata gcgctcccgc agacggacga   9600
ggtcgtccgt ccactcctgc ggttcctgcg gctcggtacg gaagttgacc gtgcttgtct   9660
cgatgtagtg gttgacgatg gtgcagaccg ccggcatgtc cgcctcggtg gcacggcgga   9720
tgtcggccgg gcgtcgttct gggctcatgg atctggattg agagtgaata tgagactcta   9780
attggatacc gaggggaatt tatggaacgt cagtggagca tttttgacaa gaaatatttg   9840
ctagctgata gtgaccttag gcgacttttg aacgcgcaat aatggtttct gacgtatgtg   9900
cttagctcat taaactccag aaacccgcgg ctgagtggct ccttcaatcg ttgcggttct   9960
gtcagttcca aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc  10020
ccttaattct ccgctcatga tccccgggta ccgagctcga attgcggctg agtggctcct  10080
tcaatcgttg cggttctgtc agttccaaac gtaaaacggc ttgtcccgcg tcatcggcgg  10140
gggtcataac gtgactccct taattctccg ctcatgatct tgatcccctg cgccatcaga  10200
tccttggcgg caagaaagcc atccagttta ctttgcaggg cttcccaacc ttaccagagg  10260
gcgccccagc tggcaattcc ggttcgcttg ctgtatcgat atggtggatt tatcacaaat  10320
gggacccgcc gccgacagag gtgtgatgtt aggccaggac tttgaaaatt tgcgcaacta  10380
tcgtatagtg gccgacaaat tgacgccgag ttgacagact gcctagcatt tgagtgaatt  10440
atgtgaggta atgggctaca ctgaattggt agctcaaact gtcagtattt atgtatatga  10500
gtgtatattt tcgcataatc tcagaccaat ctgaagatga aatgggtatc tgggaatggc  10560
gaaatcaagg catcgatcgt gaagtttctc atctaagccc ccatttggac gtgaatgtag  10620
acacgtcgaa ataaagattt ccgaattaga ataatttgtt tattgctttc gcctataaat  10680
acgacggatc gtaatttgtc gttttatcaa aatgtacttt cattttataa taacgctgcg  10740
gacatctaca tttttgaatt gaaaaaaaat tggtaattac tctttctttt tctccatatt  10800
gaccatcata ctcattgctg atccatgtag atttcccgga catgaagcca tttacaattg  10860
aatatatcct gccgccgctg ccgctttgca cccggtggag cttgcatgtt ggtttctacg  10920
cagaactgag ccggttaggc agataatttc cattgagaac tgagccatgt gcaccttccc  10980
cccaacacgg tgagcgacgg ggcaacggag tgatccacat gggactttta aacatcatcc  11040
gtcggatggc gttgcgagag aagcagtcga tccgtgagat cagccgacgc accgggcagg  11100
cgcgcaacac gatcgcaaag tatttgaacg caggtacaat cgagccgacg ttcaccgtca  11160
ccctggatgc tgtaggcata ggcttggtta tgccggtact gccgggcctc ttgcgggata  11220
tcgtccattc cgacagcatc gccagtcact atggcgtgct gctagcgcta tatgcgttga  11280
tgcaatttct atgcgcaccc gttctcggag cactgtccga ccgctttggc cgccgcccag  11340
tcctgctcgc ttcgctactt ggagccacta tcgactacgc gatcatggcg accacacccg  11400
tcctgtggtc caacccctcc gctgctatag tgcagtcggc ttctgacgtt cagtgcagcc  11460
gtcttctgaa aacgacatgt cgcacaagtc ctaagttacg cgacaggctg ccgccctgcc  11520
cttttcctgg cgttttcttg tcgcgtgttt tagtcgcata aagtagaata cttgcgacta  11580
gaaccggaga cattacgcca tgaacaagag cgccgccgct ggcctgctgg gctatgcccg  11640
cgtcagcacc gacgaccagg acttgaccaa ccaacgggcc gaactgcacg cggccggctg  11700
caccaagctg ttttccgaga agatcaccgg caccaggcgc gaccgcccgg agctggccag  11760
gatgcttgac cacctacgcc ctggcgacgt tgtgacagtg accaggctag accgcctggc  11820
ccgcagcacc cgcgacctac tggacattgc cgagcgcatc caggaggccg gcgcgggcct  11880
gcgtagcctg gcagagccgt gggccgacac caccacgccg gccggccgca tggtgttgac  11940
cgtgttcgcc ggcattgccg agttcgagcg ttccctaatc atcgaccgca cccggagcgg  12000
gcgcgaggcc gccaaggccc gaggcgtgaa gtttggcccc cgccctaccc tcaccccggc  12060
acagatcgcg cacgcccgcg agctgatcga ccaggaaggc cgcaccgtga aagaggcggc  12120
tgcactgctt ggcgtgcatc gctcgaccct gtaccgcgca cttgagcgca gcgaggaagt  12180
gacgcccacc gaggccaggc ggcgcggtgc cttccgtgag gacgcattga ccgaggccga  12240
cgccctggcg gccgccgaga atgaacgcca agaggaacaa gcatgaaacc gcaccaggac  12300
ggccaggacg aaccgttttt cattaccgaa gagatcgagg cggagatgat cgcggccggg  12360
tacgtgttcg agccgcccgc gcacgtctca accgtgcggc tgcatgaaat cctggccggt  12420
ttgtctgatg ccaagctggc ggcctggccg gccagcttgg ccgctgaaga aaccgagcgc  12480
cgccgtctaa aaaggtgatg tgtatttgag taaaacagct tgcgtcatgc ggtcgctgcg  12540
tatatgatgc gatgagtaaa taaacaaata cgcaagggaa cgcatgaagt tatcgctgta  12600
cttaaccaga aaggcgggtc aggcaagacg accatcgcaa cccatctagc ccgcgccctg  12660
caactcgccg gggccgatgt tctgttagtc gattccgatc cccagggcag tgcccgcgat  12720
tgggcggccg tgcgggaaga tcaaccgcta accgttgtcg gcatcgaccg cccgacgatt  12780
gaccgcgacg tgaaggccat cggccggcgc gacttcgtag tgatcgacgg agcgccccag  12840
gcggcggact tggctgtgtc cgcgatcaag gcagccgact tcgtgctgat tccggtgcag  12900
ccaagccctt acgacatatg ggccaccgcc gacctggtgg agctggttaa gcagcgcatt  12960
gaggtcacgg atggaaggct acaagcggcc tttgtcgtgt cgcgggcgat caaaggcacg  13020
cgcatcggcg gtgaggttgc cgaggcgctg gccgggtacg agctgcccat tcttgagtcc  13080
cgtatcacgc agcgcgtgag ctacccaggc actgccgccg ccggcacaac cgttcttgaa  13140
tcagaacccg agggcgacgc tgcccgcgag gtccaggcgc tggccgctga aattaaatca  13200
aaactcattt gagttaatga ggtaaagaga aaatgagcaa aagcacaaac acgctaagtg  13260
ccggccgtcc gagcgcacgc agcagcaagg ctgcaacgtt ggccagcctg gcagacacgc  13320
cagccatgaa gcgggtcaac tttcagttgc cggcggagga tcacaccaag ctgaagatgt  13380
acgcggtacg ccaaggcaag accattaccg agctgctatc tgaatacatc gcgcagctac  13440
cagagtaaat gagcaaatga ataaatgagt agatgaattt tagcggctaa aggaggcggc  13500
atggaaaatc aagaacaacc aggcaccgac gccgtggaat gccccatgtg tggaggaacg  13560
ggcggttggc caggcgtaag cggctgggtt gtctgccggc cctgcaatgg cactggaacc  13620
cccaagcccg aggaatcggc gtgagcggtc gcaaaccatc cggcccggta caaatcggcg  13680
cggcgctggg tgatgacctg gtggagaagt tgaaggccgc gcaggccgcc cagcggcaac  13740
gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc ggccgctgat cgaatccgca  13800
aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat taggaagccg cccaagggcg  13860
acgagcaacc agattttttc gttccgatgc tctatgacgt gggcacccgc gatagtcgca  13920
gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga ccgacgagct ggcgaggtga  13980
tccgctacga gcttccagac gggcacgtag aggtttccgc agggccggcc ggcatggcca  14040
gtgtgtggga ttacgacctg gtactgatgg cggtttccca tctaaccgaa tccatgaacc  14100
gataccggga agggaaggga gacaagcccg gccgcgtgtt ccgtccacac gttgcggacg  14160
tactcaagtt ctgccggcga gccgatggcg gaaagcagaa agacgacctg gtagaaacct  14220
gcattcggtt aaacaccacg cacgttgcca tgcagcgtac gaagaaggcc aagaacggcc  14280
gcctggtgac ggtatccgag ggtgaagcct tgattagccg ctacaagatc gtaaagagcg  14340
aaaccgggcg gccggagtac atcgagatcg agctagctga ttggatgtac cgcgagatca  14400
cagaaggcaa gaacccggac gtgctgacgg ttcaccccga ttactttttg atcgatcccg  14460
gcatcggccg ttttctctac cgcctggcac gccgcgccgc aggcaaggca gaagccagat  14520
ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg agagttcaag aagttctgtt  14580
tcaccgtgcg caagctgatc gggtcaaatg acctgccgga gtacgatttg aaggaggagg  14640
cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa cctgatcgag ggcgaagcat  14700
ccgccggttc ctaatgtacg gagcagatgc tagggcaaat tgccctagca ggggaaaaag  14760
gtcgaaaagg tctctttcct gtggatagca cgtacattgg gaacccaaag ccgtacattg  14820
ggaaccggaa cccgtacatt gggaacccaa agccgtacat tgggaaccgg tcacacatgt  14880
aagtgactga tataaaagag aaaaaaggcg atttttccgc ctaaaactct ttaaaactta  14940
ttaaaactct taaaacccgc ctggcctgtg cataactgtc tggccagcgc acagccgaag  15000
agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct acgccccgcc gcttcgcgtc  15060
ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct acggccaggc aatctaccag  15120
ggcgcggaca agccgcgccg tcgccactcg accgccggcg cccacatcaa ggcaccctgc  15180
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc  15240
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt  15300
gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact  15360
ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa  15420
taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca  15480
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg  15540
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc  15600
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc  15660
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac  15720
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc  15780
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata  15840
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc  15900
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca  15960
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag  16020
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta  16080
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg  16140
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc  16200
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt  16260
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa  16320
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat  16380
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga  16440
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac  16500
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg  16560
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg  16620
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt  16680
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct  16740
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat  16800
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta  16860
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca  16920
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat  16980
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat accgcgccac  17040
atagcagaac tttaaaagtg ctcatcattg gaaaagacct gcaggggggg gggggaaagc  17100
cacgttgtgt ctcaaaatct ctgatgttac attgcacaag ataaaaatat atcatcatga  17160
acaataaaac tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa  17220
cgggaaacgt cttgctcgag gccgcgatta aattccaaca tggatgctga tttatatggg  17280
tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg attgtatggg  17340
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt  17400
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag  17460
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca  17520
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca  17580
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc  17640
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat  17700
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt  17760
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt  17820
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga  17880
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa  17940
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg  18000
atgctcgatg agtttttcta atcagaattg gttaattggt tgtaacactg gcagagcatt  18060
acgctgactt gacgggacgg cggctttgtt gaataaatcg aacttttgct gagttgaagg  18120
atcagatcac gcatcttccc gacaacgcag accgttccgt ggcaaagcaa aagttcaaaa  18180
tcaccaactg gtccacctac aacaaagctc tcatcaaccg tggctccctc actttctggc  18240
tggatgatgg ggcgattcag gcctggtatg agtcagcaac accttcttca cgaggcagac  18300
ctcagcgccc ccccccccct gcaggtcaat tcggtcgata tggctattac gaagaaggct  18360
cgtgcgcgga gtcccgtgaa ctttcccacg caacaagtga accgcaccgg gtttgccgga  18420
ggccatttcg ttaaaatgcg cagc                                         18444
 
<210>2
<211>4291
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>2
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga   60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga  120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca  180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc  240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta  300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc  360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa  420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg  480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa  540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac  600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa  660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa  720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt  780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct  840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca  900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg  960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt 1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta 1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt 1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat    1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca    1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc    1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc    1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc    1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc    1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac    1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc    1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac    1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg    1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt  2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata  3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt  3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga tcagtcctgc  3120
tcctcggcca cgaagtgcac gcagttgccg gccgggtcgc gcagggcgaa ctcccgcccc  3180
cacggctgct cgccgatctc ggtcatggcc ggcccggagg cgtcccggaa gttcgtggac  3240
acgacctccg accactcggc gtacagctcg tccaggccgc gcacccacac ccaggccagg  3300
gtgttgtccg gcaccacctg gtcctggacc gcgctgatga acagggtcac gtcgtcccgg  3360
accacaccgg cgaagtcgtc ctccacgaag tcccgggaga acccgagccg gtcggtccag  3420
aactcgaccg ctccggcgac gtcgcgcgcg gtgagcaccg gaacggcact ggtcaacttg  3480
gccatggttt agttcctcac cttgtcgtat tatactatgc cgatatacta tgccgatgat  3540
taattgtcaa cacgtgctga tcatgaccaa aatcccttaa cgtgagttac gcgtcgttcc  3600
actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc  3660
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg  3720
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa  3780
atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc  3840
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt  3900
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa  3960
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc  4020
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc  4080
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct  4140
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat  4200
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc  4260
tggccttttg ctggcctttt gctcacatgt t                                 4291
 
<210>3
<211>4762
<212>DNA
<213>人工序列
 
<220>
<223>载体
<400>3
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga     60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga    120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca    180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc    240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta    300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc    360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa    420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg    480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa    540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac    600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa    660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa    720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt    780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct    840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca    900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg    960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt   1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta   1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt   1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat   1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca   1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc   1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc   1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc   1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc   1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac   1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc   1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac   1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg   1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt    2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata    3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt    3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga acaataaaac    3120
tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt    3180
cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg    3240
ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc gatgcgccag    3300
agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca    3360
gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc    3420
ctgatgatgc atggttactc accactgcga tccccggaaa aacagcattc caggtattag    3480
aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt  3540
tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc  3600
aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta  3660
atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca ttctcaccgg  3720
attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat  3780
taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca  3840
tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat  3900
atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt  3960
tctaatcaga attggttaat tggttgtaac actggcagag cattacgctg acttgacggg  4020
acggcgcaag ctcatgacca aaatccctta acgtgagtta cgcgtcgttc cactgagcgt  4080
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct  4140
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc  4200
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc  4260
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc  4320
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg  4380
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt  4440
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg  4500
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg  4560
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt  4620
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag  4680
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt  4740
gctggccttt tgctcacatg tt                                           4762
 
<210>4
<211>16843
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>4
ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag     60
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg    120
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac    180
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc    240
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga    300
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat    360
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat    420
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt    480
ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg    540
tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc    600
cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc    660
tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg    720
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg    780
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg    840
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg    900
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg    960
ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa   1020
acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag   1080
acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata   1140
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc   1200
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga   1260
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta   1320
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc   1380
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc   1440
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt   1500
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag   1560
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc   1620
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta   1680
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc   1740
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga   1800
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa   1860
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt    1920
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca    1980
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc    2040
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca    2100
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg    2160
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat    2220
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc    2280
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga    2340
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata    2400
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga    2460
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca    2520
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta    2580
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt    2640
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga    2700
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga    2760
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga    2820
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa    2880
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc    2940
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt    3000
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga    3060
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact    3120
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg    3180
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga    3240
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag    3300
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag    3360
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg    3420
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg    3480
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca    3540
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc    3600
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta    3660
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca    3720
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt    3780
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg    3840
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt    3900
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg    3960
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga    4020
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt    4080
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg    4140
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg    4200
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg    4260
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac    4320
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc    4380
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag    4440
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg    4500
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg    4560
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc    4620
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat    4680
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat    4740
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga    4800
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta    4860
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc    4920
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc    4980
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat    5040
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt    5100
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg    5160
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg    5220
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac    5280
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat    5340
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac    5400
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc    5460
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg    5520
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt    5580
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc    5640
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt    5700
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta    5760
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag    5820
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca    5880
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt    5940
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag    6000
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat    6060
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga    6120
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt    6180
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc    6240
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga    6300
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc    6360
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg    6420
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cctgtatggc    6480
cgcattcgca aaacacacct agactagatt tgttttgcta acccaattga tattaattat    6540
atatgattaa tatttatatg tatatggatt tggttaatga aatgcatctg gttcatcaaa    6600
gaattataaa gacacgtgac attcatttag gataagaaat atggatgatc tctttctctt    6660
ttattcagat aactagtaat tacacataac acacaacttt gatgcccaca ttatagtgat    6720
tagcatgtca ctatgtgtgc atccttttat ttcatacatt aattaagttg gccaatccag    6780
aagatggaca agtctaggtt aaccatgtgg tacctacgcg ttcgaatatc catgggccgc    6840
ttcaggccag ggcgctgggg aaggcgatgg cgtgctcggt cagctgccac ttctggttct    6900
tggcgtcgct ccggtcctcc cgcagcagct tgtgctggat gaagtgccac tcgggcatct    6960
tgctgggcac gctcttggcc ttgtacacgg tgtcgaactg gcaccggtac cggccgccgt    7020
ccttcagcag caggtacatg ctcacgtcgc ccttcaggat gccctgctta ggcacgggca    7080
tgatcttctc gcagctggcc tcccagttgg tggtcatctt cttcatcacg gggccgtcgg    7140
cggggaagtt cacgccgttg aagatgctct tgtggtagat gcagttctcc ttcacgctca    7200
cggtgatgtc cacgttacag atgcacacgg cgccgtcctc gaacaggaag ctccggcccc    7260
aggtgtagcc ggcggggcag ctgttcttga agtagtccac gatgtcctgg gggtactcgg    7320
tgaagatccg gtcgccgtac ttgaagccgg cgctcaggat gtcctcgctg aagggcaggg    7380
ggccgccctc gatcacgcac aggttgatgg tctgcttgcc cttgaagggg tagccgatgc    7440
cctcgccggt gatcacgaac ttgtggccgt tcacgcagcc ctccatgtgg tacttcatgg    7500
tcatctcctc cttcaggccg tgcttgctgt gggccatggt ggcgaccggt gaattcgagc    7560
tcggtacccg gggatcctga gtaaaacaga ggagggtctc actaagttta tagagagact    7620
gagagagata aagggacacg tatgaagcgt ctgttttcgt ggtgtgacgt caaagtcatt    7680
ttgctctcta cgcgtgtctg tgtcggcttg atcttttttt ttgctttttg gaactcatgt    7740
cggtagtata tcttttattt attttttctt tttttccctt ttctttcaaa ctgatgtcgg    7800
tatgatattt attccatcct aaaatgtaac ttactattat tagtagtcgg tccatgtcta    7860
ttggcccatc atgtggtcat tttacgttta cgtcgtgtgg ctgtttatta taacaaacgg    7920
cacatccttc tcattcgaat tgtatttctc cttaatcgtt ctaataggta tgatctttta    7980
ttttatacgt aaaattaaaa ttgaatgatg tcaagaacga aaattaattt gtatttacaa    8040
aggagctaaa tattgtttat tcctctactg gtagaagata aaagaagtag atgaaataat    8100
gatcttacta gagaatattc ctcatttaca ctagtcaaat ggaaatcttg taaactttta    8160
caataattta tcctgaaaat atgaaaaaat agaagaaaat gtttacctcc tctctcctct    8220
taattcacct acgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat    8280
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa    8340
cgacggccag tgaattcgag ctcggtaccc ggggatcctc tagagtcgac ctgcaggcat    8400
gcaagcttgt tgaaacatcc ctgaagtgtc tcattttatt ttatttattc tttgctgata    8460
aaaaaataaa ataaaagaag ctaagcacac ggtcaaccat tgctctactg ctaaaagggt    8520
tatgtgtagt gttttactgc ataaattatg cagcaaacaa gacaactcaa attaaaaaat    8580
ttcctttgct tgtttttttg ttgtctctga cttgactttc ttgtggaagt tggttgtata    8640
aggattggga cacaccattg tccttcttaa tttaatttta tttctttgct gataaaaaaa    8700
aaaaatttca tatagtgtta aataataatt tgttaaataa ccaaaaagtc aaatatgttt    8760
actctcgttt aaataattga gagtcgtcca gcaaggctaa acgattgtat agatttatga    8820
caatatttac ttttttatag ataaatgtta tattataata aatttatata catatattat   8880
atgttattta ttatttatta ttattttaaa tccttcaata ttttatcaaa ccaactcata   8940
attttttttt tatctgtaag aagcaataaa attaaataga cccactttaa ggatgatcca   9000
acctttatac agagtaagag agttcaaata gtaccctttc atatacatat caactaaaat   9060
attagaaata tcatggatca aaccttataa agacattaaa taagtggata agtataatat   9120
ataaatgggt agtatataat atataaatgg atacaaactt ctctctttat aattgttatg   9180
tctccttaac atcctaatat aatacataag tgggtaatat ataatatata aatggagaca   9240
aacttcttcc attataattg ttatgtcttc ttaacactta tgtctcgttc acaatgctaa   9300
agttagaatt gtttagaaag tcttatagta cacatttgtt tttgtactat ttgaagcatt   9360
ccataagccg tcacgattca gatgatttat aataataaga ggaaatttat catagaacaa   9420
taaggtgcat agatagagtg ttaatatatc ataacatcct ttgtttattc atagaagaag   9480
tgagatggag ctcagttatt atactgttac atggtcggat acaatattcc atgctctcca   9540
tgagctctta cacctacatg cattttagtt catacttcat gcacgtggcc atcacagcta   9600
gctgcagcta catatttaca ttttacaaca ccaggagaac tgccctgtta gtgcataaca   9660
atcagaagat ggccgtggct actcgagtta tcgaaccact ttgtacaaga aagctgaacg   9720
agaaacgtaa aatgatataa atatcaatat attaaattag attttgcata aaaaacagac   9780
tacataatac tgtaaaacac aacatatcca gtcactatgg tcgacctgca gactggctgt   9840
gtataaggga gcctgacatt tatattcccc agaacatcag gttaatggcg tttttgatgt   9900
cattttcgcg gtggctgaga tcagccactt cttccccgat aacggagacc ggcacactgg   9960
ccatatcggt ggtcatcatg cgccagcttt catccccgat atgcaccacc gggtaaagtt  10020
cacgggagac tttatctgac agcagacgtg cactggccag ggggatcacc atccgtcgcc  10080
cgggcgtgtc aataatatca ctctgtacat ccacaaacag acgataacgg ctctctcttt  10140
tataggtgta aaccttaaac tgcatttcac cagtccctgt tctcgtcagc aaaagagccg  10200
ttcatttcaa taaaccgggc gacctcagcc atcccttcct gattttccgc tttccagcgt  10260
tcggcacgca gacgacgggc ttcattctgc atggttgtgc ttaccagacc ggagatattg  10320
acatcatata tgccttgagc aactgatagc tgtcgctgtc aactgtcact gtaatacgct  10380
gcttcatagc acacctcttt ttgacatact tcgggtatac atatcagtat atattcttat  10440
accgcaaaaa tcagcgcgca aatacgcata ctgttatctg gcttttagta agccggatcc  10500
tctagattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct  10560
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac  10620
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat  10680
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa  10740
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc  10800
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga  10860
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac  10920
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag  10980
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc  11040
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc  11100
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt  11160
ctccatttta gcttccttag ctcctgaaaa tctcgccgga tcctaactca aaatccacac  11220
attatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgcgg ccgccatagt  11280
gactggatat gttgtgtttt acagtattat gtagtctgtt ttttatgcaa aatctaattt  11340
aatatattga tatttatatc attttacgtt tctcgttcag cttttttgta caaacttgtt  11400
tgataaccgg tactagtgtg cacgtcgagc gtgtcctctc caaatgaaat gaacttcctt  11460
atatagagga agggtcttgc gaaggatagt gggattgtgc gtcatccctt acgtcagtgg  11520
agatgtcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga  11580
tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaatga  11640
tagcctttcc tttatcgcaa tgatggcatt tgtaggagcc accttccttt tctactgtcc  11700
tttcgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc gaaattatcc  11760
tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg acatttttgg  11820
agtagaccag agtgtcgtgc tccaccatgt tgacgaagat tttcttcttg tcattgagtc  11880
gtaaaagact ctgtatgaac tgttcgccag tcttcacggc gagttctgtt agatcctcga  11940
tttgaatctt agactccatg catggcctta gattcagtag gaactacctt tttagagact  12000
ccaatctcta ttacttgcct tggtttatga agcaagcctt gaatcgtcca tactggaata  12060
gtacttctga tcttgagaaa tatgtctttc tctgtgttct tgatgcaatt agtcctgaat  12120
cttttgactg catctttaac cttcttggga aggtatttga tctcctggag attgttactc  12180
gggtagatcg tcttgatgag acctgctgcg taggcctctc taaccatctg tgggtcagca  12240
ttctttctga aattgaagag gctaaccttc tcattatcag tggtgaacat agtgtcgtca  12300
ccttcacctt cgaacttcct tcctagatcg taaagataga ggaaatcgtc cattgtaatc  12360
tccggggcaa aggagatctc ttttggggct ggatcactgc tgggcctttt ggttcctagc  12420
gtgagccagt gggctttttg ctttggtggg cttgttaggg ccttagcaaa gctcttgggc  12480
ttgagttgag cttctccttt ggggatgaag ttcaacctgt ctgtttgctg acttgttgtg  12540
tacgcgtcag ctgctgctct tgcctctgta atagtggcaa atttcttgtg tgcaactccg  12600
ggaacgccgt ttgttgccgc ctttgtacaa ccccagtcat cgtatatacc ggcatgtgga  12660
ccgttataca caacgtagta gttgatatga gggtgttgaa tacccgattc tgctctgaga  12720
ggagcaactg tgctgttaag ctcagatttt tgtgggattg gaattggatc ctctagagca  12780
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat  12840
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag  12900
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg  12960
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggccaaa  13020
gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac ggaaattatt  13080
cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag agccagcaaa  13140
atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga aaccatcatc  13200
tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt  13260
ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa  13320
taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat  13380
gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt  13440
tgaacgatct gcttcgacgc actccttctt taggtacgga ctagatctcg gtgacgggca  13500
ggaccggacg gggcggtacc ggcaggctga agtccagctg ccagaaaccc acgtcatgcc  13560
agttcccgtg cttgaagccg gccgcccgca gcatgccgcg gggggcatat ccgagcgcct  13620
cgtgcatgcg cacgctcggg tcgttgggca gcccgatgac agcgaccacg ctcttgaagc  13680
cctgtgcctc cagggacttc agcaggtggg tgtagagcgt ggagcccagt cccgtccgct  13740
ggtggcgggg ggagacgtac acggtcgact cggccgtcca gtcgtaggcg ttgcgtgcct  13800
tccaggggcc cgcgtaggcg atgccggcga cctcgccgtc cacctcggcg acgagccagg  13860
gatagcgctc ccgcagacgg acgaggtcgt ccgtccactc ctgcggttcc tgcggctcgg  13920
tacggaagtt gaccgtgctt gtctcgatgt agtggttgac gatggtgcag accgccggca  13980
tgtccgcctc ggtggcacgg cggatgtcgg ccgggcgtcg ttctgggctc atggatctgg  14040
attgagagtg aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg  14100
agcatttttg acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg  14160
caataatggt ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt  14220
ggctccttca acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat  14280
cggcgggggt cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc  14340
gccttcagtt taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa  14400
agagcgttta ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc  14460
catttgtatg tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga  14520
gcaagattgg ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa  14580
attgcaccaa cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt  14640
gaaccagatc gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt  14700
cgagcgcgac agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc  14760
ggaccagcct ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg  14820
acatattatg tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt  14880
gatccgtgcc gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa  14940
actggcggaa cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg  15000
ggcgctgctc gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc  15060
gagagccgac gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc  15120
gctgctcgcc taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca  15180
gatggaaacg gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga  15240
cgccgtcaat gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca  15300
ggccggcgac agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc  15360
gctgttgcgg gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca  15420
gggactcgcg gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga  15480
aggaccgaga aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac  15540
agcagagcca tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag  15600
cccgctacgg gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc  15660
tctctggcgg ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc  15720
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa  15780
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 15840
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 15900
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 15960
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 16020
tccgcctttc tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt 16080
cattatagcg attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca 16140
aagggttcgt gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga 16200
agtaggccca cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt 16260
gctcaacggg aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg 16320
caagcggatg gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta 16380
ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct 16440
gtcggcctac ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga 16500
gcacgtccgc gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa 16560
actctggctc accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct 16620
gctggcgaag atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg 16680
cccgagggca gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg 16740
ccaagcacgt ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca 16800
tcaccgacga gcaaggcaag accgagcgcc tttgcgacgc tca                   16843
 
<210>5
<211>9142
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>5
ctagttatct gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca    60
cgtgtcttta taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata   120
taaatattaa tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt   180
gtgttttgcg aattcgatat caagcttgat gggtaccggc gcgcccgatc atccggatat   240
agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa ggggttatgc   300
tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt tgttagcagc   360
cggatcgatc caagctgtac ctcactattc ctttgccctc ggacgagtgc tggggcgtcg     420
gtttccacta tcggcgagta cttctacaca gccatcggtc cagacggccg cgcttctgcg     480
ggcgatttgt gtacgcccga cagtcccggc tccggatcgg acgattgcgt cgcatcgacc     540
ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag ctctgataga gttggtcaag     600
accaatgcgg agcatatacg cccggagccg cggcgatcct gcaagctccg gatgcctccg     660
ctcgaagtag cgcgtctgct gctccataca agccaaccac ggcctccaga agaagatgtt     720
ggcgacctcg tattgggaat ccccgaacat cgcctcgctc cagtcaatga ccgctgttat     780
gcggccattg tccgtcagga cattgttgga gccgaaatcc gcgtgcacga ggtgccggac     840
ttcggggcag tcctcggccc aaagcatcag ctcatcgaga gcctgcgcga cggacgcact     900
gacggtgtcg tccatcacag tttgccagtg atacacatgg ggatcagcaa tcgcgcatat     960
gaaatcacgc catgtagtgt attgaccgat tccttgcggt ccgaatgggc cgaacccgct    1020
cgtctggcta agatcggccg cagcgatcgc atccatagcc tccgcgaccg gctgcagaac    1080
agcgggcagt tcggtttcag gcaggtcttg caacgtgaca ccctgtgcac ggcgggagat    1140
gcaataggtc aggctctcgc tgaattcccc aatgtcaagc acttccggaa tcgggagcgc    1200
ggccgatgca aagtgccgat aaacataacg atctttgtag aaaccatcgg cgcagctatt    1260
tacccgcagg acatatccac gccctcctac atcgaagctg aaagcacgag attcttcgcc    1320
ctccgagagc tgcatcaggt cggagacgct gtcgaacttt tcgatcagaa acttctcgac    1380
agacgtcgcg gtgagttcag gcttttccat gggtatatct ccttcttaaa gttaaacaaa    1440
attatttcta gagggaaacc gttgtggtct ccctatagtg agtcgtatta atttcgcggg    1500
atcgagatct gatcaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc    1560
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc    1620
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    1680
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    1740
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    1800
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    1860
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    1920
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt    1980
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2040
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2100
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    2160
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    2220
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    2280
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    2340
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    2400
aagggatttt ggtcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc    2460
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca    2520
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    2580
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    2640
accatatgga catattgtcg ttagaacgcg gctacaatta atacataacc ttatgtatca    2700
tacacatacg atttaggtga cactatagaa cggcgcgcca agctgggtct agaactagaa    2760
acgtgatgcc acttgttatt gaagtcgatt acagcatcta ttctgtttta ctatttataa    2820
ctttgccatt tctgactttt gaaaactatc tctggatttc ggtatcgctt tgtgaagatc    2880
gagcaaaaga gacgttttgt ggacgcaatg gtccaaatcc gttctacatg aacaaattgg    2940
tcacaatttc cactaaaagt aaataaatgg caagttaaaa aaggaatatg cattttactg    3000
attgcctagg tgagctccaa gagaagttga atctacacgt ctaccaaccg ctaaaaaaag    3060
aaaaacattg aatatgtaac ctgattccat tagcttttga cttcttcaac agattctcta    3120
cttagatttc taacagaaat attattacta gcacatcatt ttcagtctca ctacagcaaa    3180
aaatccaacg gcacaataca gacaacagga gatatcagac tacagagata gatagatgct    3240
actgcatgta gtaagttaaa taaaaggaaa ataaaatgtc ttgctaccaa aactactaca    3300
gactatgatg ctcaccacag gccaaatcct gcaactagga cagcattatc ttatatatat    3360
tgtacaaaac aagcatcaag gaacatttgg tctaggcaat cagtacctcg ttctaccatc    3420
accctcagtt atcacatcct tgaaggatcc attactggga atcatcggca acacatgctc    3480
ctgatggggc acaatgacat caagaaggta ggggccaggg gtgtccaaca ttctctgaat    3540
tgccgctcta agctcttcct tcttcgtcac tcgcgctgcc ggtatcccac aagcatcagc    3600
aaacttgagc atgtttggga atatctcgct ctcgctagac ggatctccaa gataggtgtg    3660
agctctattg gacttgtaga acctatcctc caactgaacc accataccca aatgctgatt    3720
gttcaacaac aatatcttaa ctgggagatt ctccactctt atagtggcca actcctgaac    3780
attcatgatg aaactaccat ccccatcaat gtcaaccaca acagccccag ggttagcaac    3840
agcagcacca atagccgcag gcaatccaaa acccatggct ccaagacccc ctgaggtcaa    3900
ccactgcctc ggtctcttgt acttgtaaaa ctgcgcagcc cacatttgat gctgcccaac    3960
cccagtacta acaatagcat ctccattagt caactcatca agaacctcga tagcatgctg    4020
cggagaaatc gcgtcctgga atgtcttgta acccaatgga aacttgtgtt tctgcacatt    4080
aatctcttct ctccaacctc caagatcaaa cttaccctcc actcctttct cctccaaaat    4140
catattaatt cccttcaagg ccaacttcaa atccgcgcaa accgacacgt gcgcctgctt    4200
gttcttccca atctcggcag aatcaatatc aatgtgaaca atcttagccc tactagcaaa    4260
agcctcaagc ttcccagtaa cacggtcatc aaaccttacc ccaaaggcaa gcaacaaatc    4320
actattgtca acagcatagt tagcataaac agtaccatgc atacccagca tctgaaggga    4380
atattcatca ccaataggaa aagttccaag acccattaaa gtgctagcaa cgggaatacc    4440
agtgagttca acaaagcgcc tcaattcagc actggaattc aaactgccac cgccgacgta    4500
gagaacgggc ttttgggcct ccatgatgag tctgacaatg tgttccaatt gggcctcggc    4560
ggggggcctg ggcagcctgg cgaggtaacc ggggaggtta acgggctcgt cccaattagg    4620
cacggcgagt tgctgctgaa cgtctttggg aatgtcgatg aggaccggac cggggcggcc    4680
ggaggtggcg acgaagaaag cctcggcgac gacgcggggg atgtcgtcga cgtcgaggat    4740
gaggtagttg tgcttcgtga tggatctgct cacctccacg atcggggttt cttggaaggc    4800
gtcggtgccg atcatccggc gggcgacctg gccggtgatg gcgacgactg ggacgctgtc    4860
cattaaagcg tcggcgaggc cgctcacgag gttggtggcg ccggggccgg aggtggcaat    4920
gcagacgccg gggaggccgg aggaacgcgc gtagccttcg gcggcgaaga cgccgccctg    4980
ctcgtggcgc gggagcacgt tgcggatggc ggcggagcgc gtgagcgcct ggtggatctc    5040
catcgacgca ccgccggggt acgcgaacac cgtcgtcacg ccctgcctct ccagcgcctc    5100
cacaaggatg tccgcgccct tgcgaggttc gccggaggcg aaccgtgaca cgaagggctc    5160
cgtggtcggc gcttccttgg tgaagggcgc cgccgtgggg ggtttggaga tggaacattt    5220
gattttgaga gcgtggttgg gtttggtgag ggtttgatga gagagaggga gggtggatct    5280
agtaatgcgt ttggggaagg tggggtgtga agaggaagaa gagaatcggg tggttctgga    5340
agcggtggcc gccattgtgt tgtgtggcat ggttatactt caaaaactgc acaacaagcc    5400
tagagttagt acctaaacag taaatttaca acagagagca aagacacatg caaaaatttc    5460
agccataaaa aaagttataa tagaatttaa agcaaaagtt tcatttttta aacatatata    5520
caaacaaact ggatttgaag gaagggatta attcccctgc tcaaagtttg aattcctatt    5580
gtgacctata ctcgaataaa attgaagcct aaggaatgta tgagaaacaa gaaaacaaaa    5640
caaaactaca gacaaacaag tacaattaca aaattcgcta aaattctgta atcaccaaac    5700
cccatctcag tcagcacaag gcccaaggtt tattttgaaa taaaaaaaaa gtgattttat    5760
ttctcataag ctaaaagaaa gaaaggcaat tatgaaatga tttcgactag atctgaaagt    5820
caaacgcgta ttccgcagat attaaagaaa gagtagagtt tcacatggat cctagatgga    5880
cccagttgag gaaaaagcaa ggcaaagcaa accagaagtg caagatccga aattgaacca    5940
cggaatctag gatttggtag agggagaaga aaagtacctt gagaggtaga agagaagaga    6000
agagcagaga gatatatgaa cgagtgtgtc ttggtctcaa ctctgaagcg atacgagttt    6060
agaggggagc attgagttcc aatttatagg gaaaccgggt ggcaggggtg agttaatgac    6120
ggaaaagccc ctaagtaacg agattggatt gtgggttaga ttcaaccgtt tgcatccgcg    6180
gcttagattg gggaagtcag agtgaatctc aaccgttgac tgagttgaaa attgaatgta    6240
gcaaccaatt gagccaaccc cagcctttgc cctttgattt tgatttgttt gttgcatact    6300
ttttatttgt cttctggttc tgactctctt tctctcgttt caatgccagg ttgcctactc    6360
ccacaccact cacaagaaga ttctactgtt agtattaaat attttttaat gtattaaatg    6420
atgaatgctt ttgtaaacag aacaagacta tgtctaataa gtgtcttgca acatttttta    6480
agaaattaaa aaaaatatat ttattatcaa aatcaaatgt atgaaaaatc atgaataata    6540
taattttata cattttttta aaaaatcttt taatttctta attaatatct taaaaataat    6600
gattaatatt taacccaaaa taattagtat gattggtaag gaagatatcc atgttatgtt    6660
tggatgtgag tttgatctag agcaaagctt actagagtcg acctgcagcc cctccaccgc    6720
ggtggcggcc gctctagaga tccgtcaaca tggtggagca cgacactctc gtctactcca    6780
agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg    6840
taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc atcaaaagga    6900
cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga aaggctatcg    6960
ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg    7020
tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt gatgatccta    7080
tgcgtatggt atgacgtgtg ttcaagatga tgacttcaaa cctacctatg acgtatggta    7140
tgacgtgtgt cgactgatga cttagatcca ctcgagcggc tataaatacg tacctacgca    7200
ccctgcgcta ccatccctag agctgcagct tatttttaca acaattacca acaacaacaa    7260
acaacaaaca acattacaat tactatttac aattacagtc gacccatcaa caagtttgta    7320
caaaaaagct gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt    7380
gcataaaaaa cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc    7440
gcattaggca ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg    7500
agttaggatc cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact    7560
ggatatacca ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag    7620
tcagttgctc aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag    7680
accgtaaaga aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg    7740
atgaatgctc atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat    7800
agtgttcacc cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg    7860
agtgaatacc acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt    7920
tacggtgaaa acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca    7980
gccaatccct gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc    8040
ttcgcccccg ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg    8100
ctggcgattc aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat    8160
gaattacaac agtactgcga tgagtggcag ggcggggcgt aaagatctgg atccggctta    8220
ctaaaagcca gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat    8280
actgatatgt atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag    8340
tgacagttga cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg    8400
tctggtaagc acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc    8460
ggaaaatcag gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc    8520
tgacgagaac aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc    8580
gttatcgtct gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg    8640
tgatccccct ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg    8700
tggtgcatat cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg    8760
tctccgttat cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg    8820
ccattaacct gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg    8880
caggtcgacc atagtgactg gatatgttgt gttttacagt attatgtagt ctgtttttta    8940
tgcaaaatct aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc    9000
ttgtacaaag tggttgataa cctagacttg tccatcttct ggattggcca acttaattaa    9060
tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg tgggcatcaa  9120
agttgtgtgt tatgtgtaat ta                                           9142
 
<210>6
<211>49911
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>6
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta    60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt   120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca   180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt   240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg   300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta   360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct   420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa   480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta   540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt   600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca   660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg   720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag   780
gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct   840
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc   900
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc   960
ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct  1020
agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt  1080
tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac  1140
gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc  1200
tctagccgtt ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt  1260
tggtttgccc ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt  1320
tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc    1380
ggagtagaat tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg    1440
tgccatacat attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata    1500
ggtatacatg ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg    1560
gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac    1620
tgtttcaaac tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct    1680
tcatagttac gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat    1740
gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac    1800
cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat    1860
acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg    1920
ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact    1980
tctgcaggtc gactctagag gatccacaag tttgtacaaa aaagctgaac gagaaacgta    2040
aaatgatata aatatcaata tattaaatta gattttgcat aaaaaacaga ctacataata    2100
ctgtaaaaca caacatatcc agtcactatg gcggccgcat taggcacccc aggctttaca    2160
ctttatgctt ccggctcgta taatgtgtgg attttgagtt aggatttaaa tacgcgttga    2220
tccggcttac taaaagccag ataacagtat gcgtatttgc gcgctgattt ttgcggtata    2280
agaatatata ctgatatgta tacccgaagt atgtcaaaaa gaggtatgct atgaagcagc    2340
gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat atgatgtcaa    2400
tatctccggt ctggtaagca caaccatgca gaatgaagcc cgtcgtctgc gtgccgaacg    2460
ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc cggtttattg aaatgaacgg    2520
ctcttttgct gacgagaaca ggggctggtg aaatgcagtt taaggtttac acctataaaa    2580
gagagagccg ttatcgtctg tttgtggatg tacagagtga tatcattgac acgcccggtc    2640
gacggatggt gatccccctg gccagtgcac gtctgctgtc agataaagtc tcccgtgaac    2700
tttacccggt ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc gatatggcca    2760
gtgtgccggt ctccgttatc ggggaagaag tggctgatct cagccaccgc gaaaatgaca    2820
tcaaaaacgc cattaacctg atgttctggg gaatataaat gtcaggctcc cttatacaca    2880
gccagtctgc aggtcgacca tagtgactgg atatgttgtg ttttacagta ttatgtagtc    2940
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt    3000
tcagctttct tgtacaaagt ggtgttaacc tagacttgtc catcttctgg attggccaac    3060
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    3120
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    3180
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    3240
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    3300
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    3360
tggagctcga attccggtcc gggtcacctt tgtccaccaa gatggaactg cggccgctca    3420
ttaattaagt caggcgcgcc tctagttgaa gacacgttca tgtcttcatc gtaagaagac    3480
actcagtagt cttcggccag aatggccatc tggattcagc aggcctagaa ggccatttaa    3540
atcctgagga tctggtcttc ctaaggaccc gggatatcgg accgattaaa ctttaattcg    3600
gtccgaagct tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa    3660
tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt    3720
gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga ataatataat    3780
ctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg    3840
gtctaaagga caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg    3900
catgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat    3960
tagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat    4020
ctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt    4080
atttaataat ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc    4140
ctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc    4200
ctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc    4260
gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag    4320
ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg    4380
cagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgg    4440
gggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagaca    4500
ccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaacca    4560
gatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc    4620
cccccccctc tctaccttct ctagatcggc gttccggtcc atgcatggtt agggcccggt    4680
agttctactt ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag    4740
cgttcgtaca cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt    4800
ttctctttgg ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga    4860
ttttttttgt ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc    4920
gtgcacttgt ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg    4980
gtctggttgg gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat    5040
ttattaattt tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg    5100
atggatggaa atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat    5160
atacagagat gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc    5220
attcgttcta gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg    5280
gaactgtatg tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc    5340
gatctaggat aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata    5400
tgcagcatct attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg    5460
ttttataatt attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg    5520
gattttttta gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga    5580
tgctcaccct gttgtttggt gttacttctg caggtcgact ttaacttagc ctaggatcca    5640
cacgacacca tgtcccccga gcgccgcccc gtcgagatcc gcccggccac cgccgccgac    5700
atggccgccg tgtgcgacat cgtgaaccac tacatcgaga cctccaccgt gaacttccgc    5760
accgagccgc agaccccgca ggagtggatc gacgacctgg agcgcctcca ggaccgctac    5820
ccgtggctcg tggccgaggt ggagggcgtg gtggccggca tcgcctacgc cggcccgtgg    5880
aaggcccgca acgcctacga ctggaccgtg gagtccaccg tgtacgtgtc ccaccgccac    5940
cagcgcctcg gcctcggctc caccctctac acccacctcc tcaagagcat ggaggcccag    6000
ggcttcaagt ccgtggtggc cgtgatcggc ctcccgaacg acccgtccgt gcgcctccac    6060
gaggccctcg gctacaccgc ccgcggcacc ctccgcgccg ccggctacaa gcacggcggc    6120
tggcacgacg tcggcttctg gcagcgcgac ttcgagctgc cggccccgcc gcgcccggtg    6180
cgcccggtga cgcagatctg agtcgaaacc tagacttgtc catcttctgg attggccaac    6240
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    6300
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    6360
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    6420
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    6480
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    6540
tggagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg aagagctatg    6600
tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccgc aatgtgttat    6660
taagttgtct aagcgtcaat ttggtttaca ccacaatata tcctgccacc agccagccaa    6720
cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc    6780
cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg    6840
ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg    6900
tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct    6960
cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc    7020
gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg    7080
agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta    7140
attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca    7200
tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc    7260
cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt    7320
agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg    7380
accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg    7440
gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg    7500
acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg    7560
ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa    7620
tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg    7680
tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg    7740
tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga    7800
tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt    7860
cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg    7920
tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga    7980
taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc    8040
cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg    8100
gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc    8160
gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc    8220
tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc    8280
agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat    8340
tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca    8400
acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc    8460
aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc    8520
agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt    8580
acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga    8640
gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc    8700
cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag    8760
taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca    8820
atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt    8880
tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg    8940
atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata    9000
gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg    9060
aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg    9120
taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac    9180
acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc    9240
accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct    9300
tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg    9360
ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa    9420
attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat    9480
atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg    9540
aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg    9600
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca    9660
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca    9720
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa    9780
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    9840
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    9900
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    9960
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg   10020
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc  10080
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc  10140
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc  10200
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  10260
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  10320
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  10380
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc  10440
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  10500
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  10560
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  10620
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa  10680
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta  10740
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt  10800
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag  10860
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca  10920
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc  10980
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt  11040
tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca  11100
aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc  11160
tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac  11220
gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc  11280
tacctgtcgg atcaccggaa aggacccgta aagtgataat gattatcatc tacatatcac  11340
aacgtgcgtg gaggccatca aaccacgtca aataatcaat tatgacgcag gtatcgtatt  11400
aattgatctg catcaactta acgtaaaaac aacttcagac aatacaaatc agcgacactg  11460
aatacggggc aacctcatgt cccccccccc cccccccctg caggcatcgt ggtgtcacgc  11520
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga  11580
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt  11640
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc  11700
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa  11760
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca  11820
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca  11880
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct  11940
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc  12000
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa  12060
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt  12120
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc  12180
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt  12240
cgtcttcaag aattcggagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga  12300
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg  12360
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga  12420
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat  12480
gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg  12540
gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat  12600
cgaacttttg ctgagttgaa ggatcagatc acgcatcttc ccgacaacgc agaccgttcc  12660
gtggcaaagc aaaagttcaa aatcaccaac tggtccacct acaacaaagc tctcatcaac  12720
cgtggctccc tcactttctg gctggatgat ggggcgattc aggcctggta tgagtcagca  12780
acaccttctt cacgaggcag acctcagcgc cagaaggccg ccagagaggc cgagcgcggc  12840
cgtgaggctt ggacgctagg gcagggcatg aaaaagcccg tagcgggctg ctacgggcgt  12900
ctgacgcggt ggaaaggggg aggggatgtt gtctacatgg ctctgctgta gtgagtgggt  12960
tgcgctccgg cagcggtcct gatcaatcgt caccctttct cggtccttca acgttcctga  13020
caacgagcct ccttttcgcc aatccatcga caatcaccgc gagtccctgc tcgaacgctg  13080
cgtccggacc ggcttcgtcg aaggcgtcta tcgcggcccg caacagcggc gagagcggag  13140
cctgttcaac ggtgccgccg cgctcgccgg catcgctgtc gccggcctgc tcctcaagca  13200
cggccccaac agtgaagtag ctgattgtca tcagcgcatt gacggcgtcc ccggccgaaa  13260
aacccgcctc gcagaggaag cgaagctgcg cgtcggccgt ttccatctgc ggtgcgcccg  13320
gtcgcgtgcc ggcatggatg cgcgcgccat cgcggtaggc gagcagcgcc tgcctgaagc  13380
tgcgggcatt cccgatcaga aatgagcgcc agtcgtcgtc ggctctcggc accgaatgcg  13440
tatgattctc cgccagcatg gcttcggcca gtgcgtcgag cagcgcccgc ttgttcctga  13500
agtgccagta aagcgccggc tgctgaaccc ccaaccgttc cgccagtttg cgtgtcgtca  13560
gaccgtctac gccgacctcg ttcaacaggt ccagggcggc acggatcact gtattcggct  13620
gcaactttgt catgcttgac actttatcac tgataaacat aatatgtcca ccaacttatc  13680
agtgataaag aatccgcgcg ttcaatcgga ccagcggagg ctggtccgga ggccagacgt  13740
gaaacccaac atacccctga tcgtaattct gagcactgtc gcgctcgacg ctgtcggcat  13800
cggcctgatt atgccggtgc tgccgggcct cctgcgcgat ctggttcact cgaacgacgt  13860
caccgcccac tatggcattc tgctggcgct gtatgcgttg gtgcaatttg cctgcgcacc  13920
tgtgctgggc gcgctgtcgg atcgtttcgg gcggcggcca atcttgctcg tctcgctggc  13980
cggcgccact gtcgactacg ccatcatggc gacagcgcct ttcctttggg ttctctatat  14040
cgggcggatc gtggccggca tcaccggggc gactggggcg gtagccggcg cttatattgc  14100
cgatatcact gatggcgatg agcgcgcgcg gcacttcggc ttcatgagcg cctgtttcgg  14160
gttcgggatg gtcgcgggac ctgtgctcgg tgggctgatg ggcggtttct ccccccacgc  14220
tccgttcttc gccgcggcag ccttgaacgg cctcaatttc ctgacgggct gtttcctttt  14280
gccggagtcg cacaaaggcg aacgccggcc gttacgccgg gaggctctca acccgctcgc  14340
ttcgttccgg tgggcccggg gcatgaccgt cgtcgccgcc ctgatggcgg tcttcttcat  14400
catgcaactt gtcggacagg tgccggccgc gctttgggtc attttcggcg aggatcgctt  14460
tcactgggac gcgaccacga tcggcatttc gcttgccgca tttggcattc tgcattcact  14520
cgcccaggca atgatcaccg gccctgtagc cgcccggctc ggcgaaaggc gggcactcat  14580
gctcggaatg attgccgacg gcacaggcta catcctgctt gccttcgcga cacggggatg  14640
gatggcgttc ccgatcatgg tcctgcttgc ttcgggtggc atcggaatgc cggcgctgca  14700
agcaatgttg tccaggcagg tggatgagga acgtcagggg cagctgcaag gctcactggc  14760
ggcgctcacc agcctgacct cgatcgtcgg acccctcctc ttcacggcga tctatgcggc  14820
ttctataaca acgtggaacg ggtgggcatg gattgcaggc gctgccctct acttgctctg  14880
cctgccggcg ctgcgtcgcg ggctttggag cggcgcaggg caacgagccg atcgctgatc  14940
gtggaaacga taggcctatg ccatgcgggt caaggcgact tccggcaagc tatacgcgcc  15000
ctaggagtgc ggttggaacg ttggcccagc cagatactcc cgatcacgag caggacgccg  15060
atgatttgaa gcgcactcag cgtctgatcc aagaacaacc atcctagcaa cacggcggtc  15120
cccgggctga gaaagcccag taaggaaaca actgtaggtt cgagtcgcga gatcccccgg  15180
aaccaaagga agtaggttaa acccgctccg atcaggccga gccacgccag gccgagaaca  15240
ttggttcctg taggcatcgg gattggcgga tcaaacacta aagctactgg aacgagcaga  15300
agtcctccgg ccgccagttg ccaggcggta aaggtgagca gaggcacggg aggttgccac  15360
ttgcgggtca gcacggttcc gaacgccatg gaaaccgccc ccgccaggcc cgctgcgacg  15420
ccgacaggat ctagcgctgc gtttggtgtc aacaccaaca gcgccacgcc cgcagttccg  15480
caaatagccc ccaggaccgc catcaatcgt atcgggctac ctagcagagc ggcagagatg  15540
aacacgacca tcagcggctg cacagcgcct accgtcgccg cgaccccgcc cggcaggcgg  15600
tagaccgaaa taaacaacaa gctccagaat agcgaaatat taagtgcgcc gaggatgaag  15660
atgcgcatcc accagattcc cgttggaatc tgtcggacga tcatcacgag caataaaccc  15720
gccggcaacg cccgcagcag cataccggcg acccctcggc ctcgctgttc gggctccacg  15780
aaaacgccgg acagatgcgc cttgtgagcg tccttggggc cgtcctcctg tttgaagacc  15840
gacagcccaa tgatctcgcc gtcgatgtag gcgccgaatg ccacggcatc tcgcaaccgt  15900
tcagcgaacg cctccatggg ctttttctcc tcgtgctcgt aaacggaccc gaacatctct  15960
ggagctttct tcagggccga caatcggatc tcgcggaaat cctgcacgtc ggccgctcca  16020
agccgtcgaa tctgagcctt aatcacaatt gtcaatttta atcctctgtt tatcggcagt  16080
tcgtagagcg cgccgtgcgt cccgagcgat actgagcgaa gcaagtgcgt cgagcagtgc  16140
ccgcttgttc ctgaaatgcc agtaaagcgc tggctgctga acccccagcc ggaactgacc  16200
ccacaaggcc ctagcgtttg caatgcacca ggtcatcatt gacccaggcg tgttccacca  16260
ggccgctgcc tcgcaactct tcgcaggctt cgccgacctg ctcgcgccac ttcttcacgc  16320
gggtggaatc cgatccgcac atgaggcgga aggtttccag cttgagcggg tacggctccc  16380
ggtgcgagct gaaatagtcg aacatccgtc gggccgtcgg cgacagcttg cggtacttct  16440
cccatatgaa tttcgtgtag tggtcgccag caaacagcac gacgatttcc tcgtcgatca  16500
ggacctggca acgggacgtt ttcttgccac ggtccaggac gcggaagcgg tgcagcagcg  16560
acaccgattc caggtgccca acgcggtcgg acgtgaagcc catcgccgtc gcctgtaggc  16620
gcgacaggca ttcctcggcc ttcgtgtaat accggccatt gatcgaccag cccaggtcct  16680
ggcaaagctc gtagaacgtg aaggtgatcg gctcgccgat aggggtgcgc ttcgcgtact  16740
ccaacacctg ctgccacacc agttcgtcat cgtcggcccg cagctcgacg ccggtgtagg  16800
tgatcttcac gtccttgttg acgtggaaaa tgaccttgtt ttgcagcgcc tcgcgcggga  16860
ttttcttgtt gcgcgtggtg aacagggcag agcgggccgt gtcgtttggc atcgctcgca  16920
tcgtgtccgg ccacggcgca atatcgaaca aggaaagctg catttccttg atctgctgct  16980
tcgtgtgttt cagcaacgcg gcctgcttgg cctcgctgac ctgttttgcc aggtcctcgc  17040
cggcggtttt tcgcttcttg gtcgtcatag ttcctcgcgt gtcgatggtc atcgacttcg  17100
ccaaacctgc cgcctcctgt tcgagacgac gcgaacgctc cacggcggcc gatggcgcgg  17160
gcagggcagg gggagccagt tgcacgctgt cgcgctcgat cttggccgta gcttgctgga  17220
ccatcgagcc gacggactgg aaggtttcgc ggggcgcacg catgacggtg cggcttgcga  17280
tggtttcggc atcctcggcg gaaaaccccg cgtcgatcag ttcttgcctg tatgccttcc  17340
ggtcaaacgt ccgattcatt caccctcctt gcgggattgc cccgactcac gccggggcaa  17400
tgtgccctta ttcctgattt gacccgcctg gtgccttggt gtccagataa tccaccttat  17460
cggcaatgaa gtcggtcccg tagaccgtct ggccgtcctt ctcgtacttg gtattccgaa  17520
tcttgccctg cacgaatacc agcgacccct tgcccaaata cttgccgtgg gcctcggcct  17580
gagagccaaa acacttgatg cggaagaagt cggtgcgctc ctgcttgtcg ccggcatcgt  17640
tgcgccactc ttcattaacc gctatatcga aaattgcttg cggcttgtta gaattgccat  17700
gacgtacctc ggtgtcacgg gtaagattac cgataaactg gaactgatta tggctcatat  17760
cgaaagtctc cttgagaaag gagactctag tttagctaaa cattggttcc gctgtcaaga  17820
actttagcgg ctaaaatttt gcgggccgcg accaaaggtg cgaggggcgg cttccgctgt  17880
gtacaaccag atatttttca ccaacatcct tcgtctgctc gatgagcggg gcatgacgaa  17940
acatgagctg tcggagaggg caggggtttc aatttcgttt ttatcagact taaccaacgg  18000
taaggccaac ccctcgttga aggtgatgga ggccattgcc gacgccctgg aaactcccct  18060
acctcttctc ctggagtcca ccgaccttga ccgcgaggca ctcgcggaga ttgcgggtca  18120
tcctttcaag agcagcgtgc cgcccggata cgaacgcatc agtgtggttt tgccgtcaca  18180
taaggcgttt atcgtaaaga aatggggcga cgacacccga aaaaagctgc gtggaaggct  18240
ctgacgccaa gggttagggc ttgcacttcc ttctttagcc gctaaaacgg ccccttctct  18300
gcgggccgtc ggctcgcgca tcatatcgac atcctcaacg gaagccgtgc cgcgaatggc  18360
atcgggcggg tgcgctttga cagttgtttt ctatcagaac ccctacgtcg tgcggttcga  18420
ttagctgttt gtcttgcagg ctaaacactt tcggtatatc gtttgcctgt gcgataatgt  18480
tgctaatgat ttgttgcgta ggggttactg aaaagtgagc gggaaagaag agtttcagac  18540
catcaaggag cgggccaagc gcaagctgga acgcgacatg ggtgcggacc tgttggccgc  18600
gctcaacgac ccgaaaaccg ttgaagtcat gctcaacgcg gacggcaagg tgtggcacga  18660
acgccttggc gagccgatgc ggtacatctg cgacatgcgg cccagccagt cgcaggcgat  18720
tatagaaacg gtggccggat tccacggcaa agaggtcacg cggcattcgc ccatcctgga  18780
aggcgagttc cccttggatg gcagccgctt tgccggccaa ttgccgccgg tcgtggccgc  18840
gccaaccttt gcgatccgca agcgcgcggt cgccatcttc acgctggaac agtacgtcga  18900
ggcgggcatc atgacccgcg agcaatacga ggtcattaaa agcgccgtcg cggcgcatcg  18960
aaacatcctc gtcattggcg gtactggctc gggcaagacc acgctcgtca acgcgatcat  19020
caatgaaatg gtcgccttca acccgtctga gcgcgtcgtc atcatcgagg acaccggcga  19080
aatccagtgc gccgcagaga acgccgtcca ataccacacc agcatcgacg tctcgatgac  19140
gctgctgctc aagacaacgc tgcgtatgcg ccccgaccgc atcctggtcg gtgaggtacg  19200
tggccccgaa gcccttgatc tgttgatggc ctggaacacc gggcatgaag gaggtgccgc  19260
caccctgcac gcaaacaacc ccaaagcggg cctgagccgg ctcgccatgc ttatcagcat  19320
gcacccggat tcaccgaaac ccattgagcc gctgattggc gaggcggttc atgtggtcgt  19380
ccatatcgcc aggaccccta gcggccgtcg agtgcaagaa attctcgaag ttcttggtta  19440
cgagaacggc cagtacatca ccaaaaccct gtaaggagta tttccaatga caacggctgt  19500
tccgttccgt ctgaccatga atcgcggcat tttgttctac cttgccgtgt tcttcgttct  19560
cgctctcgcg ttatccgcgc atccggcgat ggcctcggaa ggcaccggcg gcagcttgcc  19620
atatgagagc tggctgacga acctgcgcaa ctccgtaacc ggcccggtgg ccttcgcgct  19680
gtccatcatc ggcatcgtcg tcgccggcgg cgtgctgatc ttcggcggcg aactcaacgc  19740
cttcttccga accctgatct tcctggttct ggtgatggcg ctgctggtcg gcgcgcagaa  19800
cgtgatgagc accttcttcg gtcgtggtgc cgaaatcgcg gccctcggca acggggcgct  19860
gcaccaggtg caagtcgcgg cggcggatgc cgtgcgtgcg gtagcggctg gacggctcgc  19920
ctaatcatgg ctctgcgcac gatccccatc cgtcgcgcag gcaaccgaga aaacctgttc  19980
atgggtggtg atcgtgaact ggtgatgttc tcgggcctga tggcgtttgc gctgattttc  20040
agcgcccaag agctgcgggc caccgtggtc ggtctgatcc tgtggttcgg ggcgctctat  20100
gcgttccgaa tcatggcgaa ggccgatccg aagatgcggt tcgtgtacct gcgtcaccgc  20160
cggtacaagc cgtattaccc ggcccgctcg accccgttcc gcgagaacac caatagccaa  20220
gggaagcaat accgatgatc caagcaattg cgattgcaat cgcgggcctc ggcgcgcttc  20280
tgttgttcat cctctttgcc cgcatccgcg cggtcgatgc cgaactgaaa ctgaaaaagc  20340
atcgttccaa ggacgccggc ctggccgatc tgctcaacta cgccgctgtc gtcgatgacg  20400
gcgtaatcgt gggcaagaac ggcagcttta tggctgcctg gctgtacaag ggcgatgaca  20460
acgcaagcag caccgaccag cagcgcgaag tagtgtccgc ccgcatcaac caggccctcg  20520
cgggcctggg aagtgggtgg atgatccatg tggacgccgt gcggcgtcct gctccgaact  20580
acgcggagcg gggcctgtcg gcgttccctg accgtctgac ggcagcgatt gaagaagagc  20640
gctcggtctt gccttgctcg tcggtgatgt acttcaccag ctccgcgaag tcgctcttct  20700
tgatggagcg catggggacg tgcttggcaa tcacgcgcac cccccggccg ttttagcggc  20760
taaaaaagtc atggctctgc cctcgggcgg accacgccca tcatgacctt gccaagctcg  20820
tcctgcttct cttcgatctt cgccagcagg gcgaggatcg tggcatcacc gaaccgcgcc  20880
gtgcgcgggt cgtcggtgag ccagagtttc agcaggccgc ccaggcggcc caggtcgcca  20940
ttgatgcggg ccagctcgcg gacgtgctca tagtccacga cgcccgtgat tttgtagccc  21000
tggccgacgg ccagcaggta ggccgacagg ctcatgccgg ccgccgccgc cttttcctca  21060
atcgctcttc gttcgtctgg aaggcagtac accttgatag gtgggctgcc cttcctggtt  21120
ggcttggttt catcagccat ccgcttgccc tcatctgtta cgccggcggt agccggccag  21180
cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac agtgaagaag  21240
gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggctgacg ccgttggata  21300
caccaaggaa agtctacacg aaccctttgg caaaatcctg tatatcgtgc gaaaaaggat  21360
ggatataccg aaaaaatcgc tataatgacc ccgaagcagg gttatgcagc ggaaaagcgc  21420
tgcttccctg ctgttttgtg gaatatctac cgactggaaa caggcaaatg caggaaatta  21480
ctgaactgag gggacaggcg agagacgatg ccaaagagct acaccgacga gctggccgag  21540
tgggttgaat cccgcgcggc caagaagcgc cggcgtgatg aggctgcggt tgcgttcctg  21600
gcggtgaggg cggatgtcga ggcggcgtta gcgtccggct atgcgctcgt caccatttgg  21660
gagcacatgc gggaaacggg gaaggtcaag ttctcctacg agacgttccg ctcgcacgcc  21720
aggcggcaca tcaaggccaa gcccgccgat gtgcccgcac cgcaggccaa ggctgcggaa  21780
cccgcgccgg cacccaagac gccggagcca cggcggccga agcagggggg caaggctgaa  21840
aagccggccc ccgctgcggc cccgaccggc ttcaccttca acccaacacc ggacaaaaag  21900
gatctactgt aatggcgaaa attcacatgg ttttgcaggg caagggcggg gtcggcaagt  21960
cggccatcgc cgcgatcatt gcgcagtaca agatggacaa ggggcagaca cccttgtgca  22020
tcgacaccga cccggtgaac gcgacgttcg agggctacaa ggccctgaac gtccgccggc  22080
tgaacatcat ggccggcgac gaaattaact cgcgcaactt cgacaccctg gtcgagctga  22140
ttgcgccgac caaggatgac gtggtgatcg acaacggtgc cagctcgttc gtgcctctgt  22200
cgcattacct catcagcaac caggtgccgg ctctgctgca agaaatgggg catgagctgg  22260
tcatccatac cgtcgtcacc ggcggccagg ctctcctgga cacggtgagc ggcttcgccc  22320
agctcgccag ccagttcccg gccgaagcgc ttttcgtggt ctggctgaac ccgtattggg  22380
ggcctatcga gcatgagggc aagagctttg agcagatgaa ggcgtacacg gccaacaagg  22440
cccgcgtgtc gtccatcatc cagattccgg ccctcaagga agaaacctac ggccgcgatt  22500
tcagcgacat gctgcaagag cggctgacgt tcgaccaggc gctggccgat gaatcgctca  22560
cgatcatgac gcggcaacgc ctcaagatcg tgcggcgcgg cctgtttgaa cagctcgacg  22620
cggcggccgt gctatgagcg accagattga agagctgatc cgggagattg cggccaagca  22680
cggcatcgcc gtcggccgcg acgacccggt gctgatcctg cataccatca acgcccggct  22740
catggccgac agtgcggcca agcaagagga aatccttgcc gcgttcaagg aagagctgga  22800
agggatcgcc catcgttggg gcgaggacgc caaggccaaa gcggagcgga tgctgaacgc  22860
ggccctggcg gccagcaagg acgcaatggc gaaggtaatg aaggacagcg ccgcgcaggc  22920
ggccgaagcg atccgcaggg aaatcgacga cggccttggc cgccagctcg cggccaaggt  22980
cgcggacgcg cggcgcgtgg cgatgatgaa catgatcgcc ggcggcatgg tgttgttcgc  23040
ggccgccctg gtggtgtggg cctcgttatg aatcgcagag gcgcagatga aaaagcccgg  23100
cgttgccggg ctttgttttt gcgttagctg ggcttgtttg acaggcccaa gctctgactg  23160
cgcccgcgct cgcgctcctg ggcctgtttc ttctcctgct cctgcttgcg catcagggcc  23220
tggtgccgtc gggctgcttc acgcatcgaa tcccagtcgc cggccagctc gggatgctcc  23280
gcgcgcatct tgcgcgtcgc cagttcctcg atcttgggcg cgtgaatgcc catgccttcc  23340
ttgatttcgc gcaccatgtc cagccgcgtg tgcagggtct gcaagcgggc ttgctgttgg  23400
gcctgctgct gctgccaggc ggcctttgta cgcggcaggg acagcaagcc gggggcattg  23460
gactgtagct gctgcaaacg cgcctgctga cggtctacga gctgttctag gcggtcctcg  23520
atgcgctcca cctggtcatg ctttgcctgc acgtagagcg caagggtctg ctggtaggtc  23580
tgctcgatgg gcgcggattc taagagggcc tgctgttccg tctcggcctc ctgggccgcc  23640
tgtagcaaat cctcgccgct gttgccgctg gactgcttta ctgccgggga ctgctgttgc  23700
cctgctcgcg ccgtcgtcgc agttcggctt gcccccactc gattgactgc ttcatttcga  23760
gccgcagcga tgcgatctcg gattgcgtca acggacgggg cagcgcggag gtgtccggct  23820
tctccttggg tgagtcggtc gatgccatag ccaaaggttt ccttccaaaa tgcgtccatt  23880
gctggaccgt gtttctcatt gatgcccgca agcatcttcg gcttgaccgc caggtcaagc  23940
gcgccttcat gggcggtcat gacggacgcc gccatgacct tgccgccgtt gttctcgatg  24000
tagccgcgta atgaggcaat ggtgccgccc atcgtcagcg tgtcatcgac aacgatgtac  24060
ttctggccgg ggatcacctc cccctcgaaa gtcgggttga acgccaggcg atgatctgaa  24120
ccggctccgg ttcgggcgac cttctcccgc tgcacaatgt ccgtttcgac ctcaaggcca  24180
aggcggtcgg ccagaacgac cgccatcatg gccggaatct tgttgttccc cgccgcctcg  24240
acggcgagga ctggaacgat gcggggcttg tcgtcgccga tcagcgtctt gagctgggca  24300
acagtgtcgt ccgaaatcag gcgctcgacc aaattaagcg ccgcttccgc gtcgccctgc  24360
ttcgcagcct ggtattcagg ctcgttggtc aaagaaccaa ggtcgccgtt gcgaaccacc  24420
ttcgggaagt ctccccacgg tgcgcgctcg gctctgctgt agctgctcaa gacgcctccc  24480
tttttagccg ctaaaactct aacgagtgcg cccgcgactc aacttgacgc tttcggcact  24540
tacctgtgcc ttgccacttg cgtcataggt gatgcttttc gcactcccga tttcaggtac  24600
tttatcgaaa tctgaccggg cgtgcattac aaagttcttc cccacctgtt ggtaaatgct  24660
gccgctatct gcgtggacga tgctgccgtc gtggcgctgc gacttatcgg ccttttgggc  24720
catatagatg ttgtaaatgc caggtttcag ggccccggct ttatctacct tctggttcgt  24780
ccatgcgcct tggttctcgg tctggacaat tctttgccca ttcatgacca ggaggcggtg  24840
tttcattggg tgactcctga cggttgcctc tggtgttaaa cgtgtcctgg tcgcttgccg  24900
gctaaaaaaa agccgacctc ggcagttcga ggccggcttt ccctagagcc gggcgcgtca  24960
aggttgttcc atctatttta gtgaactgcg ttcgatttat cagttacttt cctcccgctt  25020
tgtgtttcct cccactcgtt tccgcgtcta gccgacccct caacatagcg gcctcttctt  25080
gggctgcctt tgcctcttgc cgcgcttcgt cacgctcggc ttgcaccgtc gtaaagcgct  25140
cggcctgcct ggccgcctct tgcgccgcca acttcctttg ctcctggtgg gcctcggcgt  25200
cggcctgcgc cttcgctttc accgctgcca actccgtgcg caaactctcc gcttcgcgcc  25260
tggtggcgtc gcgctcgccg cgaagcgcct gcatttcctg gttggccgcg tccagggtct  25320
tgcggctctc ttctttgaat gcgcgggcgt cctggtgagc gtagtccagc tcggcgcgca  25380
gctcctgcgc tcgacgctcc acctcgtcgg cccgctgcgt cgccagcgcg gcccgctgct  25440
cggctcctgc cagggcggtg cgtgcttcgg ccagggcttg ccgctggcgt gcggccagct  25500
cggccgcctc ggcggcctgc tgctctagca atgtaacgcg cgcctgggct tcttccagct  25560
cgcgggcctg cgcctcgaag gcgtcggcca gctccccgcg cacggcttcc aactcgttgc  25620
gctcacgatc ccagccggct tgcgctgcct gcaacgattc attggcaagg gcctgggcgg  25680
cttgccagag ggcggccacg gcctggttgc cggcctgctg caccgcgtcc ggcacctgga  25740
ctgccagcgg ggcggcctgc gccgtgcgct ggcgtcgcca ttcgcgcatg ccggcgctgg  25800
cgtcgttcat gttgacgcgg gcggccttac gcactgcatc cacggtcggg aagttctccc  25860
ggtcgccttg ctcgaacagc tcgtccgcag ccgcaaaaat gcggtcgcgc gtctctttgt  25920
tcagttccat gttggctccg gtaattggta agaataataa tactcttacc taccttatca  25980
gcgcaagagt ttagctgaac agttctcgac ttaacggcag gttttttagc ggctgaaggg  26040
caggcaaaaa aagccccgca cggtcggcgg gggcaaaggg tcagcgggaa ggggattagc  26100
gggcgtcggg cttcttcatg cgtcggggcc gcgcttcttg ggatggagca cgacgaagcg  26160
cgcacgcgca tcgtcctcgg ccctatcggc ccgcgtcgcg gtcaggaact tgtcgcgcgc  26220
taggtcctcc ctggtgggca ccaggggcat gaactcggcc tgctcgatgt aggtccactc  26280
catgaccgca tcgcagtcga ggccgcgttc cttcaccgtc tcttgcaggt cgcggtacgc  26340
ccgctcgttg agcggctggt aacgggccaa ttggtcgtaa atggctgtcg gccatgagcg  26400
gcctttcctg ttgagccagc agccgacgac gaagccggca atgcaggccc ctggcacaac  26460
caggccgacg ccgggggcag gggatggcag cagctcgcca accaggaacc ccgccgcgat  26520
gatgccgatg ccggtcaacc agcccttgaa actatccggc cccgaaacac ccctgcgcat  26580
tgcctggatg ctgcgccgga tagcttgcaa catcaggagc cgtttctttt gttcgtcagt  26640
catggtccgc cctcaccagt tgttcgtatc ggtgtcggac gaactgaaat cgcaagagct  26700
gccggtatcg gtccagccgc tgtccgtgtc gctgctgccg aagcacggcg aggggtccgc  26760
gaacgccgca gacggcgtat ccggccgcag cgcatcgccc agcatggccc cggtcagcga  26820
gccgccggcc aggtagccca gcatggtgct gttggtcgcc ccggccacca gggccgacgt  26880
gacgaaatcg ccgtcattcc ctctggattg ttcgctgctc ggcggggcag tgcgccgcgc  26940
cggcggcgtc gtggatggct cgggttggct ggcctgcgac ggccggcgaa aggtgcgcag  27000
cagctcgtta tcgaccggct gcggcgtcgg ggccgccgcc ttgcgctgcg gtcggtgttc  27060
cttcttcggc tcgcgcagct tgaacagcat gatcgcggaa accagcagca acgccgcgcc  27120
tacgcctccc gcgatgtaga acagcatcgg attcattctt cggtcctcct tgtagcggaa  27180
ccgttgtctg tgcggcgcgg gtggcccgcg ccgctgtctt tggggatcag ccctcgatga  27240
gcgcgaccag tttcacgtcg gcaaggttcg cctcgaactc ctggccgtcg tcctcgtact  27300
tcaaccaggc atagccttcc gccggcggcc gacggttgag gataaggcgg gcagggcgct  27360
cgtcgtgctc gacctggacg atggcctttt tcagcttgtc cgggtccggc tccttcgcgc  27420
ccttttcctt ggcgtcctta ccgtcctggt cgccgtcctc gccgtcctgg ccgtcgccgg  27480
cctccgcgtc acgctcggca tcagtctggc cgttgaaggc atcgacggtg ttgggatcgc  27540
ggcccttctc gtccaggaac tcgcgcagca gcttgaccgt gccgcgcgtg atttcctggg  27600
tgtcgtcgtc aagccacgcc tcgacttcct ccgggcgctt cttgaaggcc gtcaccagct  27660
cgttcaccac ggtcacgtcg cgcacgcggc cggtgttgaa cgcatcggcg atcttctccg  27720
gcaggtccag cagcgtgacg tgctgggtga tgaacgccgg cgacttgccg atttccttgg  27780
cgatatcgcc tttcttcttg cccttcgcca gctcgcggcc aatgaagtcg gcaatttcgc  27840
gcggggtcag ctcgttgcgt tgcaggttct cgataacctg gtcggcttcg ttgtagtcgt  27900
tgtcgatgaa cgccgggatg gacttcttgc cggcccactt cgagccacgg tagcggcggg  27960
cgccgtgatt gatgatatag cggcccggct gctcctggtt ctcgcgcacc gaaatgggtg  28020
acttcacccc gcgctctttg atcgtggcac cgatttccgc gatgctctcc ggggaaaagc  28080
cggggttgtc ggccgtccgc ggctgatgcg gatcttcgtc gatcaggtcc aggtccagct  28140
cgatagggcc ggaaccgccc tgagacgccg caggagcgtc caggaggctc gacaggtcgc  28200
cgatgctatc caaccccagg ccggacggct gcgccgcgcc tgcggcttcc tgagcggccg  28260
cagcggtgtt tttcttggtg gtcttggctt gagccgcagt cattgggaaa tctccatctt  28320
cgtgaacacg taatcagcca gggcgcgaac ctctttcgat gccttgcgcg cggccgtttt  28380
cttgatcttc cagaccggca caccggatgc gagggcatcg gcgatgctgc tgcgcaggcc  28440
aacggtggcc ggaatcatca tcttggggta cgcggccagc agctcggctt ggtggcgcgc  28500
gtggcgcgga ttccgcgcat cgaccttgct gggcaccatg ccaaggaatt gcagcttggc  28560
gttcttctgg cgcacgttcg caatggtcgt gaccatcttc ttgatgccct ggatgctgta  28620
cgcctcaagc tcgatggggg acagcacata gtcggccgcg aagagggcgg ccgccaggcc  28680
gacgccaagg gtcggggccg tgtcgatcag gcacacgtcg aagccttggt tcgccagggc  28740
cttgatgttc gccccgaaca gctcgcgggc gtcgtccagc gacagccgtt cggcgttcgc  28800
cagtaccggg ttggactcga tgagggcgag gcgcgcggcc tggccgtcgc cggctgcggg  28860
tgcggtttcg gtccagccgc cggcagggac agcgccgaac agcttgcttg catgcaggcc  28920
ggtagcaaag tccttgagcg tgtaggacgc attgccctgg gggtccaggt cgatcacggc  28980
aacccgcaag ccgcgctcga aaaagtcgaa ggcaagatgc acaagggtcg aagtcttgcc  29040
gacgccgcct ttctggttgg ccgtgaccaa agttttcatc gtttggtttc ctgttttttc  29100
ttggcgtccg cttcccactt ccggacgatg tacgcctgat gttccggcag aaccgccgtt  29160
acccgcgcgt acccctcggg caagttcttg tcctcgaacg cggcccacac gcgatgcacc  29220
gcttgcgaca ctgcgcccct ggtcagtccc agcgacgttg cgaacgtcgc ctgtggcttc  29280
ccatcgacta agacgccccg cgctatctcg atggtctgct gccccacttc cagcccctgg  29340
atcgcctcct ggaactggct ttcggtaagc cgtttcttca tggataacac ccataatttg  29400
ctccgcgcct tggttgaaca tagcggtgac agccgccagc acatgagaga agtttagcta  29460
aacatttctc gcacgtcaac acctttagcc gctaaaactc gtccttggcg taacaaaaca  29520
aaagcccgga aaccgggctt tcgtctcttg ccgcttatgg ctctgcaccc ggctccatca  29580
ccaacaggtc gcgcacgcgc ttcactcggt tgcggatcga cactgccagc ccaacaaagc  29640
cggttgccgc cgccgccagg atcgcgccga tgatgccggc cacaccggcc atcgcccacc  29700
aggtcgccgc cttccggttc cattcctgct ggtactgctt cgcaatgctg gacctcggct  29760
caccataggc tgaccgctcg atggcgtatg ccgcttctcc ccttggcgta aaacccagcg  29820
ccgcaggcgg cattgccatg ctgcccgccg ctttcccgac cacgacgcgc gcaccaggct  29880
tgcggtccag accttcggcc acggcgagct gcgcaaggac ataatcagcc gccgacttgg  29940
ctccacgcgc ctcgatcagc tcttgcactc gcgcgaaatc cttggcctcc acggccgcca  30000
tgaatcgcgc acgcggcgaa ggctccgcag ggccggcgtc gtgatcgccg ccgagaatgc  30060
ccttcaccaa gttcgacgac acgaaaatca tgctgacggc tatcaccatc atgcagacgg  30120
atcgcacgaa cccgctgaat tgaacacgag cacggcaccc gcgaccacta tgccaagaat  30180
gcccaaggta aaaattgccg gccccgccat gaagtccgtg aatgccccga cggccgaagt  30240
gaagggcagg ccgccaccca ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt  30300
cgatgccagc acctgcggca cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca  30360
tcccgttact gccccgatcc cggcaatggc aaggactgcc agcgctgcca tttttggggt  30420
gaggccgttc gcggccgagg ggcgcagccc ctggggggat gggaggcccg cgttagcggg  30480
ccgggagggt tcgagaaggg ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg  30540
cgcagccctg gttaaaaaca aggtttataa atattggttt aaaagcaggt taaaagacag  30600
gttagcggtg gccgaaaaac gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg  30660
acagcccctc aaatgtcaat aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg  30720
tcaaggatcg cgcccctcat ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg  30780
cacttatccc caggcttgtc cacatcatct gtgggaaact cgcgtaaaat caggcgtttt  30840
cgccgatttg cgaggctggc cagctccacg tcgccggccg aaatcgagcc tgcccctcat  30900
ctgtcaacgc cgcgccgggt gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt  30960
cagtgagggc caagttttcc gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac  31020
acggcttcga cggcgtttct ggcgcgtttg cagggccata gacggccgcc agcccagcgg  31080
cgagggcaac cagcccggtg agcgtcggaa aggcgctgga agccccgtag cgacgcggag  31140
aggggcgaga caagccaagg gcgcaggctc gatgcgcagc acgacatagc cggttctcgc  31200
aaggacgaga atttccctgc ggtgcccctc aagtgtcaat gaaagtttcc aacgcgagcc  31260
attcgcgaga gccttgagtc cacgctagat gagagctttg ttgtaggtgg accagttggt  31320
gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg  31380
atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct  31440
ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta  31500
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgac  31560
tctagagctc gttcctcgag gaacggtacc tgcggggaag cttacaataa tgtgtgttgt  31620
taagtcttgt tgcctgtcat cgtctgactg actttcgtca taaatcccgg cctccgtaac  31680
ccagctttgg gcaagctcac ggatttgatc cggcggaacg ggaatatcga gatgccgggc  31740
tgaacgctgc agttccagct ttccctttcg ggacaggtac tccagctgat tgattatctg  31800
ctgaagggtc ttggttccac ctcctggcac aatgcgaatg attacttgag cgcgatcggg  31860
catccaattt tctcccgtca ggtgcgtggt caagtgctac aaggcacctt tcagtaacga  31920
gcgaccgtcg atccgtcgcc gggatacgga caaaatggag cgcagtagtc catcgagggc  31980
ggcgaaagcc tcgccaaaag caatacgttc atctcgcaca gcctccagat ccgatcgagg  32040
gtcttcggcg taggcagata gaagcatgga tacattgctt gagagtattc cgatggactg  32100
aagtatggct tccatctttt ctcgtgtgtc tgcatctatt tcgagaaagc ccccgatgcg  32160
gcgcaccgca acgcgaattg ccatactatc cgaaagtccc agcaggcgcg cttgatagga  32220
aaaggtttca tactcggccg atcgcagacg ggcactcacg accttgaacc cttcaacttt  32280
cagggatcga tgctggttga tggtagtctc actcgacgtg gctctggtgt gttttgacat  32340
agcttcctcc aaagaaagcg gaaggtctgg atactccagc acgaaatgtg cccgggtaga  32400
cggatggaag tctagccctg ctcaatatga aatcaacagt acatttacag tcaatactga  32460
atatacttgc tacatttgca attgtcttat aacgaatgtg aaataaaaat agtgtaacaa  32520
cgcttttact catcgataat cacaaaaaca tttatacgaa caaaaataca aatgcactcc  32580
ggtttcacag gataggcggg atcagaatat gcaacttttg acgttttgtt ctttcaaagg  32640
gggtgctggc aaaaccaccg cactcatggg cctttgcgct gctttggcaa atgacggtaa  32700
acgagtggcc ctctttgatg ccgacgaaaa ccggcctctg acgcgatgga gagaaaacgc  32760
cttacaaagc agtactggga tcctcgctgt gaagtctatt ccgccgacga aatgcccctt  32820
cttgaagcag cctatgaaaa tgccgagctc gaaggatttg attatgcgtt ggccgatacg  32880
cgtggcggct cgagcgagct caacaacaca atcatcgcta gctcaaacct gcttctgatc  32940
cccaccatgc taacgccgct cgacatcgat gaggcactat ctacctaccg ctacgtcatc  33000
gagctgctgt tgagtgaaaa tttggcaatt cctacagctg ttttgcgcca acgcgtcccg  33060
gtcggccgat tgacaacatc gcaacgcagg atgtcagaga cgctagagag ccttccagtt  33120
gtaccgtctc ccatgcatga aagagatgca tttgccgcga tgaaagaacg cggcatgttg  33180
catcttacat tactaaacac gggaactgat ccgacgatgc gcctcataga gaggaatctt  33240
cggattgcga tggaggaagt cgtggtcatt tcgaaactga tcagcaaaat cttggaggct  33300
tgaagatggc aattcgcaag cccgcattgt cggtcggcga agcacggcgg cttgctggtg  33360
ctcgacccga gatccaccat cccaacccga cacttgttcc ccagaagctg gacctccagc  33420
acttgcctga aaaagccgac gagaaagacc agcaacgtga gcctctcgtc gccgatcaca  33480
tttacagtcc cgatcgacaa cttaagctaa ctgtggatgc ccttagtcca cctccgtccc  33540
cgaaaaagct ccaggttttt ctttcagcgc gaccgcccgc gcctcaagtg tcgaaaacat  33600
atgacaacct cgttcggcaa tacagtccct cgaagtcgct acaaatgatt ttaaggcgcg  33660
cgttggacga tttcgaaagc atgctggcag atggatcatt tcgcgtggcc ccgaaaagtt  33720
atccgatccc ttcaactaca gaaaaatccg ttctcgttca gacctcacgc atgttcccgg  33780
ttgcgttgct cgaggtcgct cgaagtcatt ttgatccgtt ggggttggag accgctcgag  33840
ctttcggcca caagctggct accgccgcgc tcgcgtcatt ctttgctgga gagaagccat  33900
cgagcaattg gtgaagaggg acctatcgga acccctcacc aaatattgag tgtaggtttg  33960
aggccgctgg ccgcgtcctc agtcaccttt tgagccagat aattaagagc caaatgcaat  34020
tggctcaggc tgccatcgtc cccccgtgcg aaacctgcac gtccgcgtca aagaaataac  34080
cggcacctct tgctgttttt atcagttgag ggcttgacgg atccgcctca agtttgcggc  34140
gcagccgcaa aatgagaaca tctatactcc tgtcgtaaac ctcctcgtcg cgtactcgac  34200
tggcaatgag aagttgctcg cgcgatagaa cgtcgcgggg tttctctaaa aacgcgagga  34260
gaagattgaa ctcacctgcc gtaagtttca cctcaccgcc agcttcggac atcaagcgac  34320
gttgcctgag attaagtgtc cagtcagtaa aacaaaaaga ccgtcggtct ttggagcgga  34380
caacgttggg gcgcacgcgc aaggcaaccc gaatgcgtgc aagaaactct ctcgtactaa  34440
acggcttagc gataaaatca cttgctccta gctcgagtgc aacaacttta tccgtctcct  34500
caaggcggtc gccactgata attatgattg gaatatcaga ctttgccgcc agatttcgaa  34560
cgatctcaag cccatcttca cgacctaaat ttagatcaac aaccacgaca tcgaccgtcg  34620
cggaagagag tactctagtg aactgggtgc tgtcggctac cgcggtcact ttgaaggcgt  34680
ggatcgtaag gtattcgata ataagatgcc gcatagcgac atcgtcatcg ataagaagaa  34740
cgtgtttcaa cggctcacct ttcaatctaa aatctgaacc cttgttcaca gcgcttgaga  34800
aattttcacg tgaaggatgt acaatcatct ccagctaaat gggcagttcg tcagaattgc  34860
ggctgaccgc ggatgacgaa aatgcgaacc aagtatttca attttatgac aaaagttctc  34920
aatcgttgtt acaagtgaaa cgcttcgagg ttacagctac tattgattaa ggagatcgcc  34980
tatggtctcg ccccggcgtc gtgcgtccgc cgcgagccag atctcgccta cttcataaac  35040
gtcctcatag gcacggaatg gaatgatgac atcgatcgcc gtagagagca tgtcaatcag  35100
tgtgcgatct tccaagctag caccttgggc gctacttttg acaagggaaa acagtttctt  35160
gaatccttgg attggattcg cgccgtgtat tgttgaaatc gatcccggat gtcccgagac  35220
gacttcactc agataagccc atgctgcatc gtcgcgcatc tcgccaagca atatccggtc  35280
cggccgcata cgcagacttg cttggagcaa gtgctcggcg ctcacagcac ccagcccagc  35340
accgttcttg gagtagagta gtctaacatg attatcgtgt ggaatgacga gttcgagcgt  35400
atcttctatg gtgattagcc tttcctgggg ggggatggcg ctgatcaagg tcttgctcat  35460
tgttgtcttg ccgcttccgg tagggccaca tagcaacatc gtcagtcggc tgacgacgca  35520
tgcgtgcaga aacgcttcca aatccccgtt gtcaaaatgc tgaaggatag cttcatcatc  35580
ctgattttgg cgtttccttc gtgtctgcca ctggttccac ctcgaagcat cataacggga  35640
ggagacttct ttaagaccag aaacacgcga gcttggccgt cgaatggtca agctgacggt  35700
gcccgaggga acggtcggcg gcagacagat ttgtagtcgt tcaccaccag gaagttcagt  35760
ggcgcagagg gggttacgtg gtccgacatc ctgctttctc agcgcgcccg ctaaaatagc  35820
gatatcttca agatcatcat aagagacggg caaaggcatc ttggtaaaaa tgccggcttg  35880
gcgcacaaat gcctctccag gtcgattgat cgcaatttct tcagtcttcg ggtcatcgag  35940
ccattccaaa atcggcttca gaagaaagcg tagttgcgga tccacttcca tttacaatgt  36000
atcctatctc taagcggaaa tttgaattca ttaagagcgg cggttcctcc cccgcgtggc  36060
gccgccagtc aggcggagct ggtaaacacc aaagaaatcg aggtcccgtg ctacgaaaat  36120
ggaaacggtg tcaccctgat tcttcttcag ggttggcggt atgttgatgg ttgccttaag  36180
ggctgtctca gttgtctgct caccgttatt ttgaaagctg ttgaagctca tcccgccacc  36240
cgagctgccg gcgtaggtgc tagctgcctg gaaggcgcct tgaacaacac tcaagagcat  36300
agctccgcta aaacgctgcc agaagtggct gtcgaccgag cccggcaatc ctgagcgacc  36360
gagttcgtcc gcgcttggcg atgttaacga gatcatcgca tggtcaggtg tctcggcgcg  36420
atcccacaac acaaaaacgc gcccatctcc ctgttgcaag ccacgctgta tttcgccaac  36480
aacggtggtg ccacgatcaa gaagcacgat attgttcgtt gttccacgaa tatcctgagg  36540
caagacacac tttacatagc ctgccaaatt tgtgtcgatt gcggtttgca agatgcacgg  36600
aattattgtc ccttgcgtta ccataaaatc ggggtgcggc aagagcgtgg cgctgctggg  36660
ctgcagctcg gtgggtttca tacgtatcga caaatcgttc tcgccggaca cttcgccatt  36720
cggcaaggag ttgtcgtcac gcttgccttc ttgtcttcgg cccgtgtcgc cctgaatggc  36780
gcgtttgctg accccttgat cgccgctgct atatgcaaaa atcggtgttt cttccggccg  36840
tggctcatgc cgctccggtt cgcccctcgg cggtagagga gcagcaggct gaacagcctc  36900
ttgaaccgct ggaggatccg gcggcacctc aatcggagct ggatgaaatg gcttggtgtt  36960
tgttgcgatc aaagttgacg gcgatgcgtt ctcattcacc ttcttttggc gcccacctag  37020
ccaaatgagg cttaatgata acgcgagaac gacacctccg acgatcaatt tctgagaccc  37080
cgaaagacgc cggcgatgtt tgtcggagac cagggatcca gatgcatcaa cctcatgtgc  37140
cgcttgctga ctatcgttat tcatcccttc gcccccttca ggacgcgttt cacatcgggc  37200
ctcaccgtgc ccgtttgcgg cctttggcca acgggatcgt aagcggtgtt ccagatacat  37260
agtactgtgt ggccatccct cagacgccaa cctcgggaaa ccgaagaaat ctcgacatcg  37320
ctccctttaa ctgaatagtt ggcaacagct tccttgccat caggattgat ggtgtagatg  37380
gagggtatgc gtacattgcc cggaaagtgg aataccgtcg taaatccatt gtcgaagact  37440
tcgagtggca acagcgaacg atcgccttgg gcgacgtagt gccaattact gtccgccgca  37500
ccaagggctg tgacaggctg atccaataaa ttctcagctt tccgttgata ttgtgcttcc  37560
gcgtgtagtc tgtccacaac agccttctgt tgtgcctccc ttcgccgagc cgccgcatcg  37620
tcggcggggt aggcgaattg gacgctgtaa tagagatcgg gctgctcttt atcgaggtgg  37680
gacagagtct tggaacttat actgaaaaca taacggcgca tcccggagtc gcttgcggtt  37740
agcacgatta ctggctgagg cgtgaggacc tggcttgcct tgaaaaatag ataatttccc  37800
cgcggtaggg ctgctagatc tttgctattt gaaacggcaa ccgctgtcac cgtttcgttc  37860
gtggcgaatg ttacgaccaa agtagctcca accgccgtcg agaggcgcac cacttgatcg  37920
ggattgtaag ccaaataacg catgcgcgga tctagcttgc ccgccattgg agtgtcttca  37980
gcctccgcac cagtcgcagc ggcaaataaa catgctaaaa tgaaaagtgc ttttctgatc  38040
atggttcgct gtggcctacg tttgaaacgg tatcttccga tgtctgatag gaggtgacaa  38100
ccagacctgc cgggttggtt agtctcaatc tgccgggcaa gctggtcacc ttttcgtagc  38160
gaactgtcgc ggtccacgta ctcaccacag gcattttgcc gtcaacgacg agggtccttt  38220
tatagcgaat ttgctgcgtg cttggagtta catcatttga agcgatgtgc tcgacctcca  38280
ccctgccgcg tttgccaaga atgacttgag gcgaactggg attgggatag ttgaagaatt  38340
gctggtaatc ctggcgcact gttggggcac tgaagttcga taccaggtcg taggcgtact  38400
gagcggtgtc ggcatcataa ctctcgcgca ggcgaacgta ctcccacaat gaggcgttaa  38460
cgacggcctc ctcttgagtt gcaggcaatc gcgagacaga cacctcgctg tcaacggtgc  38520
cgtccggccg tatccataga tatacgggca caagcctgct caacggcacc attgtggcta  38580
tagcgaacgc ttgagcaaca tttcccaaaa tcgcgatagc tgcgacagct gcaatgagtt  38640
tggagagacg tcgcgccgat ttcgctcgcg cggtttgaaa ggcttctact tccttatagt  38700
gctcggcaag gctttcgcgc gccactagca tggcatattc aggccccgtc atagcgtcca  38760
cccgaattgc cgagctgaag atctgacgga gtaggctgcc atcgccccac attcagcggg  38820
aagatcgggc ctttgcagct cgctaatgtg tcgtttgtct ggcagccgct caaagcgaca  38880
actaggcaca gcaggcaata cttcatagaa ttctccattg aggcgaattt ttgcgcgacc  38940
tagcctcgct caacctgagc gaagcgacgg tacaagctgc tggcagattg ggttgcgccg  39000
ctccagtaac tgcctccaat gttgccggcg atcgccggca aagcgacaat gagcgcatcc  39060
cctgtcagaa aaaacatatc gagttcgtaa agaccaatga tcttggccgc ggtcgtaccg  39120
gcgaaggtga ttacaccaag cataagggtg agcgcagtcg cttcggttag gatgacgatc  39180
gttgccacga ggtttaagag gagaagcaag agaccgtagg tgataagttg cccgatccac  39240
ttagctgcga tgtcccgcgt gcgatcaaaa atatatccga cgaggatcag aggcccgatc  39300
gcgagaagca ctttcgtgag aattccaacg gcgtcgtaaa ctccgaaggc agaccagagc  39360
gtgccgtaaa ggacccactg tgccccttgg aaagcaagga tgtcctggtc gttcatcgga  39420
ccgatttcgg atgcgatttt ctgaaaaacg gcctgggtca cggcgaacat tgtatccaac  39480
tgtgccggaa cagtctgcag aggcaagccg gttacactaa actgctgaac aaagtttggg  39540
accgtctttt cgaagatgga aaccacatag tcttggtagt tagcctgccc aacaattaga  39600
gcaacaacga tggtgaccgt gatcacccga gtgataccgc tacgggtatc gacttcgccg  39660
cgtatgacta aaataccctg aacaataatc caaagagtga cacaggcgat caatggcgca  39720
ctcaccgcct cctggatagt ctcaagcatc gagtccaagc ctgtcgtgaa ggctacatcg  39780
aagatcgtat gaatggccgt aaacggcgcc ggaatcgtga aattcatcga ttggacctga  39840
acttgactgg tttgtcgcat aatgttggat aaaatgagct cgcattcggc gaggatgcgg  39900
gcggatgaac aaatcgccca gccttagggg agggcaccaa agatgacagc ggtcttttga  39960
tgctccttgc gttgagcggc cgcctcttcc gcctcgtgaa ggccggcctg cgcggtagtc  40020
atcgttaata ggcttgtcgc ctgtacattt tgaatcattg cgtcatggat ctgcttgaga  40080
agcaaaccat tggtcacggt tgcctgcatg atattgcgag atcgggaaag ctgagcagac  40140
gtatcagcat tcgccgtcaa gcgtttgtcc atcgtttcca gattgtcagc cgcaatgcca  40200
gcgctgtttg cggaaccggt gatctgcgat cgcaacaggt ccgcttcagc atcactaccc  40260
acgactgcac gatctgtatc gctggtgatc gcacgtgccg tggtcgacat tggcattcgc  40320
ggcgaaaaca tttcattgtc taggtccttc gtcgaaggat actgattttt ctggttgagc  40380
gaagtcagta gtccagtaac gccgtaggcc gacgtcaaca tcgtaaccat cgctatagtc  40440
tgagtgagat tctccgcagt cgcgagcgca gtcgcgagcg tctcagcctc cgttgccggg  40500
tcgctaacaa caaactgcgc ccgcgcgggc tgaatatata gaaagctgca ggtcaaaact  40560
gttgcaataa gttgcgtcgt cttcatcgtt tcctacctta tcaatcttct gcctcgtggt  40620
gacgggccat gaattcgctg agccagccag atgagttgcc ttcttgtgcc tcgcgtagtc  40680
gagttgcaaa gcgcaccgtg ttggcacgcc ccgaaagcac ggcgacatat tcacgcatat  40740
cccgcagatc aaattcgcag atgacgcttc cactttctcg tttaagaaga aacttacggc  40800
tgccgaccgt catgtcttca cggatcgcct gaaattcctt ttcggtacat ttcagtccat  40860
cgacataagc cgatcgatct gcggttggtg atggatagaa aatcttcgtc atacattgcg  40920
caaccaagct ggctcctagc ggcgattcca gaacatgctc tggttgctgc gttgccagta  40980
ttagcatccc gttgtttttt cgaacggtca ggaggaattt gtcgacgaca gtcgaaaatt  41040
tagggtttaa caaataggcg cgaaactcat cgcagctcat cacaaaacgg cggccgtcga  41100
tcatggctcc aatccgatgc aggagatatg ctgcagcggg agcgcatact tcctcgtatt  41160
cgagaagatg cgtcatgtcg aagccggtaa tcgacggatc taactttact tcgtcaactt  41220
cgccgtcaaa tgcccagcca agcgcatggc cccggcacca gcgttggagc cgcgctcctg  41280
cgccttcggc gggcccatgc aacaaaaatt cacgtaaccc cgcgattgaa cgcatttgtg  41340
gatcaaacga gagctgacga tggataccac ggaccagacg gcggttctct tccggagaaa  41400
tcccaccccg accatcactc tcgatgagag ccacgatcca ttcgcgcaga aaatcgtgtg  41460
aggctgctgt gttttctagg ccacgcaacg gcgccaaccc gctgggtgtg cctctgtgaa  41520
gtgccaaata tgttcctcct gtggcgcgaa ccagcaattc gccaccccgg tccttgtcaa  41580
agaacacgac cgtacctgca cggtcgacca tgctctgttc gagcatggct agaacaaaca  41640
tcatgagcgt cgtcttaccc ctcccgatag gcccgaatat tgccgtcatg ccaacatcgt  41700
gctcatgcgg gatatagtcg aaaggcgttc cgccattggt acgaaatcgg gcaatcgcgt  41760
tgccccagtg gcctgagctg gcgccctctg gaaagttttc gaaagagaca aaccctgcga  41820
aattgcgtga agtgattgcg ccagggcgtg tgcgccactt aaaattcccc ggcaattggg  41880
accaataggc cgcttccata ccaatacctt cttggacaac cacggcacct gcatccgcca  41940
ttcgtgtccg agcccgcgcg cccctgtccc caagactatt gagatcgtct gcatagacgc  42000
aaaggctcaa atgatgtgag cccataacga attcgttgct cgcaagtgcg tcctcagcct  42060
cggataattt gccgatttga gtcacggctt tatcgccgga actcagcatc tggctcgatt  42120
tgaggctaag tttcgcgtgc gcttgcgggc gagtcaggaa cgaaaaactc tgcgtgagaa  42180
caagtggaaa atcgagggat agcagcgcgt tgagcatgcc cggccgtgtt tttgcagggt  42240
attcgcgaaa cgaatagatg gatccaacgt aactgtcttt tggcgttctg atctcgagtc  42300
ctcgcttgcc gcaaatgact ctgtcggtat aaatcgaagc gccgagtgag ccgctgacga  42360
ccggaaccgg tgtgaaccga ccagtcatga tcaaccgtag cgcttcgcca atttcggtga  42420
agagcacacc ctgcttctcg cggatgccaa gacgatgcag gccatacgct ttaagagagc  42480
cagcgacaac atgccaaaga tcttccatgt tcctgatctg gcccgtgaga tcgttttccc  42540
tttttccgct tagcttggtg aacctcctct ttaccttccc taaagccgcc tgtgggtaga  42600
caatcaacgt aaggaagtgt tcattgcgga ggagttggcc ggagagcacg cgctgttcaa  42660
aagcttcgtt caggctagcg gcgaaaacac tacggaagtg tcgcggcgcc gatgatggca  42720
cgtcggcatg acgtacgagg tgagcatata ttgacacatg atcatcagcg atattgcgca  42780
acagcgtgtt gaacgcacga caacgcgcat tgcgcatttc agtttcctca agctcgaatg  42840
caacgccatc aattctcgca atggtcatga tcgatccgtc ttcaagaagg acgatatggt  42900
cgctgaggtg gccaatataa gggagataga tctcaccgga tctttcggtc gttccactcg  42960
cgccgagcat cacaccattc ctctccctcg tgggggaacc ctaattggat ttgggctaac  43020
agtagcgccc ccccaaactg cactatcaat gcttcttccc gcggtccgca aaaatagcag  43080
gacgacgctc gccgcattgt agtctcgctc cacgatgagc cgggctgcaa accataacgg  43140
cacgagaacg acttcgtaga gcgggttctg aacgataacg atgacaaagc cggcgaacat  43200
catgaataac cctgccaatg tcagtggcac cccaagaaac aatgcgggcc gtgtggctgc  43260
gaggtaaagg gtcgattctt ccaaacgatc agccatcaac taccgccagt gagcgtttgg  43320
ccgaggaagc tcgccccaaa catgataaca atgccgccga cgacgccggc aaccagccca  43380
agcgaagccc gcccgaacat ccaggagatc ccgatagcga caatgccgag aacagcgagt  43440
gactggccga acggaccaag gataaacgtg catatattgt taaccattgt ggcggggtca  43500
gtgccgccac ccgcagattg cgctgcggcg ggtccggatg aggaaatgct ccatgcaatt  43560
gcaccgcaca agcttggggc gcagctcgat atcacgcgca tcatcgcatt cgagagcgag  43620
aggcgattta gatgtaaacg gtatctctca aagcatcgca tcaatgcgca cctccttagt  43680
ataagtcgaa taagacttga ttgtcgtctg cggatttgcc gttgtcctgg tgtggcggtg  43740
gcggagcgat taaaccgcca gcgccatcct cctgcgagcg gcgctgatat gacccccaaa  43800
catcccacgt ctcttcggat tttagcgcct cgtgatcgtc ttttggaggc tcgattaacg  43860
cgggcaccag cgattgagca gctgtttcaa cttttcgcac gtagccgttt gcaaaaccgc  43920
cgatgaaatt accggtgttg taagcggaga tcgcccgacg aagcgcaaat tgcttctcgt  43980
caatcgtttc gccgcctgca taacgacttt tcagcatgtt tgcagcggca gataatgatg  44040
tgcacgcctg gagcgcaccg tcaggtgtca gaccgagcat agaaaaattt cgagagttta  44100
tttgcatgag gccaacatcc agcgaatgcc gtgcatcgag acggtgcctg acgacttggg  44160
ttgcttggct gtgatcttgc cagtgaagcg tttcgccggt cgtgttgtca tgaatcgcta  44220
aaggatcaaa gcgactctcc accttagcta tcgccgcaag cgtagatgtc gcaactgatg  44280
gggcacactt gcgagcaaca tggtcaaact cagcagatga gagtggcgtg gcaaggctcg  44340
acgaacagaa ggagaccatc aaggcaagag aaagcgaccc cgatctctta agcatacctt  44400
atctccttag ctcgcaacta acaccgcctc tcccgttgga agaagtgcgt tgttttatgt  44460
tgaagattat cgggagggtc ggttactcga aaattttcaa ttgcttcttt atgatttcaa  44520
ttgaagcgag aaacctcgcc cggcgtcttg gaacgcaaca tggaccgaga accgcgcatc  44580
catgactaag caaccggatc gacctattca ggccgcagtt ggtcaggtca ggctcagaac  44640
gaaaatgctc ggcgaggtta cgctgtctgt aaacccattc gatgaacggg aagcttcctt  44700
ccgattgctc ttggcaggaa tattggccca tgcctgcttg cgctttgcaa atgctcttat  44760
cgcgttggta tcatatgcct tgtccgccag cagaaacgca ctctaagcga ttatttgtaa  44820
aaatgtttcg gtcatgcggc ggtcatgggc ttgacccgct gtcagcgcaa gacggatcgg  44880
tcaaccgtcg gcatcgacaa cagcgtgaat cttggtggtc aaaccgccac gggaacgtcc  44940
catacagcca tcgtcttgat cccgctgttt cccgtcgccg catgttggtg gacgcggaca  45000
caggaactgt caatcatgac gacattctat cgaaagcctt ggaaatcaca ctcagaatat  45060
gatcccagac gtctgcctca cgccatcgta caaagcgatt gtagcaggtt gtacaggaac  45120
cgtatcgatc aggaacgtct gcccagggcg ggcccgtccg gaagcgccac aagatgacat  45180
tgatcacccg cgtcaacgcg cggcacgcga cgcggcttat ttgggaacaa aggactgaac  45240
aacagtccat tcgaaatcgg tgacatcaaa gcggggacgg gttatcagtg gcctccaagt  45300
caagcctcaa tgaatcaaaa tcagaccgat ttgcaaacct gatttatgag tgtgcggcct  45360
aaatgatgaa atcgtccttc tagatcgcct ccgtggtgta gcaacacctc gcagtatcgc  45420
cgtgctgacc ttggccaggg aattgactgg caagggtgct ttcacatgac cgctcttttg  45480
gccgcgatag atgatttcgt tgctgctttg ggcacgtaga aggagagaag tcatatcgga  45540
gaaattcctc ctggcgcgag agcctgctct atcgcgacgg catcccactg tcgggaacag  45600
accggatcat tcacgaggcg aaagtcgtca acacatgcgt tataggcatc ttcccttgaa  45660
ggatgatctt gttgctgcca atctggaggt gcggcagccg caggcagatg cgatctcagc  45720
gcaacttgcg gcaaaacatc tcactcacct gaaaaccact agcgagtctc gcgatcagac  45780
gaaggccttt tacttaacga cacaatatcc gatgtctgca tcacaggcgt cgctatccca  45840
gtcaatacta aagcggtgca ggaactaaag attactgatg acttaggcgt gccacgaggc  45900
ctgagacgac gcgcgtagac agttttttga aatcattatc aaagtgatgg cctccgctga  45960
agcctatcac ctctgcgccg gtctgtcgga gagatgggca agcattatta cggtcttcgc  46020
gcccgtacat gcattggacg attgcagggt caatggatct gagatcatcc agaggattgc  46080
cgcccttacc ttccgtttcg agttggagcc agcccctaaa tgagacgaca tagtcgactt  46140
gatgtgacaa tgccaagaga gagatttgct taacccgatt tttttgctca agcgtaagcc  46200
tattgaagct tgccggcatg acgtccgcgc cgaaagaata tcctacaagt aaaacattct  46260
gcacaccgaa atgcttggtg tagacatcga ttatgtgacc aagatcctta gcagtttcgc  46320
ttggggaccg ctccgaccag aaataccgaa gtgaactgac gccaatgaca ggaatccctt  46380
ccgtctgcag ataggtacca tcgatagatc tgctgcctcg cgcgtttcgg tgatgacggt  46440
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc  46500
gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc  46560
atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg gcatcagagc  46620
agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa  46680
aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc  46740
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag  46800
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa  46860
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc  46920
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc  46980
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg  47040
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt  47100
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc  47160
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc  47220
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag  47280
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg  47340
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa  47400
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag  47460
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact  47520
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa  47580
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt  47640
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag  47700
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca  47760
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc  47820
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt  47880
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg  47940
ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca ttccacggac  48000
aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac ctgtcgtttc  48060
ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga agaacggaaa  48120
cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc gccccgtagt  48180
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc  48240
gtggaggcca tcaaaccacg tcaaataatc aattatgacg caggtatcgt attaattgat  48300
ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa atcagcgaca ctgaatacgg  48360
ggcaacctca tgtccccccc cccccccccc ctgcaggcat cgtggtgtca cgctcgtcgt  48420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca  48480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg  48540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat  48600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta  48660
tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg ccacatagca  48720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct  48780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat  48840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa  48900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt  48960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa  49020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa  49080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtcttc  49140
aagaattggt cgacgatctt gctgcgttcg gatattttcg tggagttccc gccacagacc  49200
cggattgaag gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc  49260
gtgatgactg gccaggacgt cggccgaaag agcgacaagc agatcacgct tttcgacagc  49320
gtcggatttg cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga  49380
tcaagccaca gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt  49440
ggaatgctgc tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc  49500
gtacggaatg ccaagcactc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga  49560
cgaacggata aaccttttca cgccctttta aatatccgtt attctaataa acgctctttt  49620
ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg  49680
aaacgacaat ctgatcatga gcggagaatt aagggagtca cgttatgacc cccgccgatg  49740
acgcgggaca agccgtttta cgtttggaac tgacagaacc gcaacgttga aggagccact  49800
cagcaagctg gtacgattgt aatacgactc actatagggc gaattgagcg ctgtttaaac  49860
gctcttcaac tggaagagcg gttacccgga ccgaagcttg catgcctgca g           49911
 
<210>7
<211>36909
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>7
tctagagctc gttcctcgag gcctcgaggc ctcgaggaac ggtacctgcg gggaagctta    60
caataatgtg tgttgttaag tcttgttgcc tgtcatcgtc tgactgactt tcgtcataaa   120
tcccggcctc cgtaacccag ctttgggcaa gctcacggat ttgatccggc ggaacgggaa   180
tatcgagatg ccgggctgaa cgctgcagtt ccagctttcc ctttcgggac aggtactcca   240
gctgattgat tatctgctga agggtcttgg ttccacctcc tggcacaatg cgaatgatta   300
cttgagcgcg atcgggcatc caattttctc ccgtcaggtg cgtggtcaag tgctacaagg   360
cacctttcag taacgagcga ccgtcgatcc gtcgccggga tacggacaaa atggagcgca   420
gtagtccatc gagggcggcg aaagcctcgc caaaagcaat acgttcatct cgcacagcct   480
ccagatccga tcgagggtct tcggcgtagg cagatagaag catggataca ttgcttgaga   540
gtattccgat ggactgaagt atggcttcca tcttttctcg tgtgtctgca tctatttcga   600
gaaagccccc gatgcggcgc accgcaacgc gaattgccat actatccgaa agtcccagca   660
ggcgcgcttg ataggaaaag gtttcatact cggccgatcg cagacgggca ctcacgacct   720
tgaacccttc aactttcagg gatcgatgct ggttgatggt agtctcactc gacgtggctc   780
tggtgtgttt tgacatagct tcctccaaag aaagcggaag gtctggatac tccagcacga   840
aatgtgcccg ggtagacgga tggaagtcta gccctgctca atatgaaatc aacagtacat   900
ttacagtcaa tactgaatat acttgctaca tttgcaattg tcttataacg aatgtgaaat   960
aaaaatagtg taacaacgct tttactcatc gataatcaca aaaacattta tacgaacaaa  1020
aatacaaatg cactccggtt tcacaggata ggcgggatca gaatatgcaa cttttgacgt  1080
tttgttcttt caaagggggt gctggcaaaa ccaccgcact catgggcctt tgcgctgctt  1140
tggcaaatga cggtaaacga gtggccctct ttgatgccga cgaaaaccgg cctctgacgc  1200
gatggagaga aaacgcctta caaagcagta ctgggatcct cgctgtgaag tctattccgc  1260
cgacgaaatg ccccttcttg aagcagccta tgaaaatgcc gagctcgaag gatttgatta  1320
tgcgttggcc gatacgcgtg gcggctcgag cgagctcaac aacacaatca tcgctagctc  1380
aaacctgctt ctgatcccca ccatgctaac gccgctcgac atcgatgagg cactatctac  1440
ctaccgctac gtcatcgagc tgctgttgag tgaaaatttg gcaattccta cagctgtttt  1500
gcgccaacgc gtcccggtcg gccgattgac aacatcgcaa cgcaggatgt cagagacgct  1560
agagagcctt ccagttgtac cgtctcccat gcatgaaaga gatgcatttg ccgcgatgaa    1620
agaacgcggc atgttgcatc ttacattact aaacacggga actgatccga cgatgcgcct    1680
catagagagg aatcttcgga ttgcgatgga ggaagtcgtg gtcatttcga aactgatcag    1740
caaaatcttg gaggcttgaa gatggcaatt cgcaagcccg cattgtcggt cggcgaagca    1800
cggcggcttg ctggtgctcg acccgagatc caccatccca acccgacact tgttccccag    1860
aagctggacc tccagcactt gcctgaaaaa gccgacgaga aagaccagca acgtgagcct    1920
ctcgtcgccg atcacattta cagtcccgat cgacaactta agctaactgt ggatgccctt    1980
agtccacctc cgtccccgaa aaagctccag gtttttcttt cagcgcgacc gcccgcgcct    2040
caagtgtcga aaacatatga caacctcgtt cggcaataca gtccctcgaa gtcgctacaa    2100
atgattttaa ggcgcgcgtt ggacgatttc gaaagcatgc tggcagatgg atcatttcgc    2160
gtggccccga aaagttatcc gatcccttca actacagaaa aatccgttct cgttcagacc    2220
tcacgcatgt tcccggttgc gttgctcgag gtcgctcgaa gtcattttga tccgttgggg    2280
ttggagaccg ctcgagcttt cggccacaag ctggctaccg ccgcgctcgc gtcattcttt    2340
gctggagaga agccatcgag caattggtga agagggacct atcggaaccc ctcaccaaat    2400
attgagtgta ggtttgaggc cgctggccgc gtcctcagtc accttttgag ccagataatt    2460
aagagccaaa tgcaattggc tcaggctgcc atcgtccccc cgtgcgaaac ctgcacgtcc    2520
gcgtcaaaga aataaccggc acctcttgct gtttttatca gttgagggct tgacggatcc    2580
gcctcaagtt tgcggcgcag ccgcaaaatg agaacatcta tactcctgtc gtaaacctcc    2640
tcgtcgcgta ctcgactggc aatgagaagt tgctcgcgcg atagaacgtc gcggggtttc    2700
tctaaaaacg cgaggagaag attgaactca cctgccgtaa gtttcacctc accgccagct    2760
tcggacatca agcgacgttg cctgagatta agtgtccagt cagtaaaaca aaaagaccgt    2820
cggtctttgg agcggacaac gttggggcgc acgcgcaagg caacccgaat gcgtgcaaga    2880
aactctctcg tactaaacgg cttagcgata aaatcacttg ctcctagctc gagtgcaaca    2940
actttatccg tctcctcaag gcggtcgcca ctgataatta tgattggaat atcagacttt    3000
gccgccagat ttcgaacgat ctcaagccca tcttcacgac ctaaatttag atcaacaacc    3060
acgacatcga ccgtcgcgga agagagtact ctagtgaact gggtgctgtc ggctaccgcg    3120
gtcactttga aggcgtggat cgtaaggtat tcgataataa gatgccgcat agcgacatcg    3180
tcatcgataa gaagaacgtg tttcaacggc tcacctttca atctaaaatc tgaacccttg    3240
ttcacagcgc ttgagaaatt ttcacgtgaa ggatgtacaa tcatctccag ctaaatgggc    3300
agttcgtcag aattgcggct gaccgcggat gacgaaaatg cgaaccaagt atttcaattt    3360
tatgacaaaa gttctcaatc gttgttacaa gtgaaacgct tcgaggttac agctactatt    3420
gattaaggag atcgcctatg gtctcgcccc ggcgtcgtgc gtccgccgcg agccagatct    3480
cgcctacttc ataaacgtcc tcataggcac ggaatggaat gatgacatcg atcgccgtag    3540
agagcatgtc aatcagtgtg cgatcttcca agctagcacc ttgggcgcta cttttgacaa    3600
gggaaaacag tttcttgaat ccttggattg gattcgcgcc gtgtattgtt gaaatcgatc    3660
ccggatgtcc cgagacgact tcactcagat aagcccatgc tgcatcgtcg cgcatctcgc    3720
caagcaatat ccggtccggc cgcatacgca gacttgcttg gagcaagtgc tcggcgctca    3780
cagcacccag cccagcaccg ttcttggagt agagtagtct aacatgatta tcgtgtggaa    3840
tgacgagttc gagcgtatct tctatggtga ttagcctttc ctgggggggg atggcgctga    3900
tcaaggtctt gctcattgtt gtcttgccgc ttccggtagg gccacatagc aacatcgtca    3960
gtcggctgac gacgcatgcg tgcagaaacg cttccaaatc cccgttgtca aaatgctgaa    4020
ggatagcttc atcatcctga ttttggcgtt tccttcgtgt ctgccactgg ttccacctcg    4080
aagcatcata acgggaggag acttctttaa gaccagaaac acgcgagctt ggccgtcgaa    4140
tggtcaagct gacggtgccc gagggaacgg tcggcggcag acagatttgt agtcgttcac    4200
caccaggaag ttcagtggcg cagagggggt tacgtggtcc gacatcctgc tttctcagcg    4260
cgcccgctaa aatagcgata tcttcaagat catcataaga gacgggcaaa ggcatcttgg    4320
taaaaatgcc ggcttggcgc acaaatgcct ctccaggtcg attgatcgca atttcttcag    4380
tcttcgggtc atcgagccat tccaaaatcg gcttcagaag aaagcgtagt tgcggatcca    4440
cttccattta caatgtatcc tatctctaag cggaaatttg aattcattaa gagcggcggt    4500
tcctcccccg cgtggcgccg ccagtcaggc ggagctggta aacaccaaag aaatcgaggt    4560
cccgtgctac gaaaatggaa acggtgtcac cctgattctt cttcagggtt ggcggtatgt    4620
tgatggttgc cttaagggct gtctcagttg tctgctcacc gttattttga aagctgttga    4680
agctcatccc gccacccgag ctgccggcgt aggtgctagc tgcctggaag gcgccttgaa    4740
caacactcaa gagcatagct ccgctaaaac gctgccagaa gtggctgtcg accgagcccg    4800
gcaatcctga gcgaccgagt tcgtccgcgc ttggcgatgt taacgagatc atcgcatggt    4860
caggtgtctc ggcgcgatcc cacaacacaa aaacgcgccc atctccctgt tgcaagccac    4920
gctgtatttc gccaacaacg gtggtgccac gatcaagaag cacgatattg ttcgttgttc    4980
cacgaatatc ctgaggcaag acacacttta catagcctgc caaatttgtg tcgattgcgg    5040
tttgcaagat gcacggaatt attgtccctt gcgttaccat aaaatcgggg tgcggcaaga    5100
gcgtggcgct gctgggctgc agctcggtgg gtttcatacg tatcgacaaa tcgttctcgc    5160
cggacacttc gccattcggc aaggagttgt cgtcacgctt gccttcttgt cttcggcccg    5220
tgtcgccctg aatggcgcgt ttgctgaccc cttgatcgcc gctgctatat gcaaaaatcg    5280
gtgtttcttc cggccgtggc tcatgccgct ccggttcgcc cctcggcggt agaggagcag    5340
caggctgaac agcctcttga accgctggag gatccggcgg cacctcaatc ggagctggat    5400
gaaatggctt ggtgtttgtt gcgatcaaag ttgacggcga tgcgttctca ttcaccttct    5460
tttggcgccc acctagccaa atgaggctta atgataacgc gagaacgaca cctccgacga    5520
tcaatttctg agaccccgaa agacgccggc gatgtttgtc ggagaccagg gatccagatg    5580
catcaacctc atgtgccgct tgctgactat cgttattcat cccttcgccc ccttcaggac    5640
gcgtttcaca tcgggcctca ccgtgcccgt ttgcggcctt tggccaacgg gatcgtaagc    5700
ggtgttccag atacatagta ctgtgtggcc atccctcaga cgccaacctc gggaaaccga    5760
agaaatctcg acatcgctcc ctttaactga atagttggca acagcttcct tgccatcagg    5820
attgatggtg tagatggagg gtatgcgtac attgcccgga aagtggaata ccgtcgtaaa    5880
tccattgtcg aagacttcga gtggcaacag cgaacgatcg ccttgggcga cgtagtgcca    5940
attactgtcc gccgcaccaa gggctgtgac aggctgatcc aataaattct cagctttccg    6000
ttgatattgt gcttccgcgt gtagtctgtc cacaacagcc ttctgttgtg cctcccttcg    6060
ccgagccgcc gcatcgtcgg cggggtaggc gaattggacg ctgtaataga gatcgggctg    6120
ctctttatcg aggtgggaca gagtcttgga acttatactg aaaacataac ggcgcatccc    6180
ggagtcgctt gcggttagca cgattactgg ctgaggcgtg aggacctggc ttgccttgaa    6240
aaatagataa tttccccgcg gtagggctgc tagatctttg ctatttgaaa cggcaaccgc    6300
tgtcaccgtt tcgttcgtgg cgaatgttac gaccaaagta gctccaaccg ccgtcgagag    6360
gcgcaccact tgatcgggat tgtaagccaa ataacgcatg cgcggatcta gcttgcccgc    6420
cattggagtg tcttcagcct ccgcaccagt cgcagcggca aataaacatg ctaaaatgaa    6480
aagtgctttt ctgatcatgg ttcgctgtgg cctacgtttg aaacggtatc ttccgatgtc    6540
tgataggagg tgacaaccag acctgccggg ttggttagtc tcaatctgcc gggcaagctg    6600
gtcacctttt cgtagcgaac tgtcgcggtc cacgtactca ccacaggcat tttgccgtca    6660
acgacgaggg tccttttata gcgaatttgc tgcgtgcttg gagttacatc atttgaagcg    6720
atgtgctcga cctccaccct gccgcgtttg ccaagaatga cttgaggcga actgggattg    6780
ggatagttga agaattgctg gtaatcctgg cgcactgttg gggcactgaa gttcgatacc    6840
aggtcgtagg cgtactgagc ggtgtcggca tcataactct cgcgcaggcg aacgtactcc    6900
cacaatgagg cgttaacgac ggcctcctct tgagttgcag gcaatcgcga gacagacacc    6960
tcgctgtcaa cggtgccgtc cggccgtatc catagatata cgggcacaag cctgctcaac    7020
ggcaccattg tggctatagc gaacgcttga gcaacatttc ccaaaatcgc gatagctgcg    7080
acagctgcaa tgagtttgga gagacgtcgc gccgatttcg ctcgcgcggt ttgaaaggct    7140
tctacttcct tatagtgctc ggcaaggctt tcgcgcgcca ctagcatggc atattcaggc    7200
cccgtcatag cgtccacccg aattgccgag ctgaagatct gacggagtag gctgccatcg    7260
ccccacattc agcgggaaga tcgggccttt gcagctcgct aatgtgtcgt ttgtctggca    7320
gccgctcaaa gcgacaacta ggcacagcag gcaatacttc atagaattct ccattgaggc    7380
gaatttttgc gcgacctagc ctcgctcaac ctgagcgaag cgacggtaca agctgctggc    7440
agattgggtt gcgccgctcc agtaactgcc tccaatgttg ccggcgatcg ccggcaaagc    7500
gacaatgagc gcatcccctg tcagaaaaaa catatcgagt tcgtaaagac caatgatctt    7560
ggccgcggtc gtaccggcga aggtgattac accaagcata agggtgagcg cagtcgcttc    7620
ggttaggatg acgatcgttg ccacgaggtt taagaggaga agcaagagac cgtaggtgat    7680
aagttgcccg atccacttag ctgcgatgtc ccgcgtgcga tcaaaaatat atccgacgag    7740
gatcagaggc ccgatcgcga gaagcacttt cgtgagaatt ccaacggcgt cgtaaactcc    7800
gaaggcagac cagagcgtgc cgtaaaggac ccactgtgcc ccttggaaag caaggatgtc    7860
ctggtcgttc atcggaccga tttcggatgc gattttctga aaaacggcct gggtcacggc    7920
gaacattgta tccaactgtg ccggaacagt ctgcagaggc aagccggtta cactaaactg    7980
ctgaacaaag tttgggaccg tcttttcgaa gatggaaacc acatagtctt ggtagttagc    8040
ctgcccaaca attagagcaa caacgatggt gaccgtgatc acccgagtga taccgctacg    8100
ggtatcgact tcgccgcgta tgactaaaat accctgaaca ataatccaaa gagtgacaca    8160
ggcgatcaat ggcgcactca ccgcctcctg gatagtctca agcatcgagt ccaagcctgt    8220
cgtgaaggct acatcgaaga tcgtatgaat ggccgtaaac ggcgccggaa tcgtgaaatt    8280
catcgattgg acctgaactt gactggtttg tcgcataatg ttggataaaa tgagctcgca    8340
ttcggcgagg atgcgggcgg atgaacaaat cgcccagcct taggggaggg caccaaagat    8400
gacagcggtc ttttgatgct ccttgcgttg agcggccgcc tcttccgcct cgtgaaggcc    8460
ggcctgcgcg gtagtcatcg ttaataggct tgtcgcctgt acattttgaa tcattgcgtc    8520
atggatctgc ttgagaagca aaccattggt cacggttgcc tgcatgatat tgcgagatcg    8580
ggaaagctga gcagacgtat cagcattcgc cgtcaagcgt ttgtccatcg tttccagatt    8640
gtcagccgca atgccagcgc tgtttgcgga accggtgatc tgcgatcgca acaggtccgc    8700
ttcagcatca ctacccacga ctgcacgatc tgtatcgctg gtgatcgcac gtgccgtggt    8760
cgacattggc attcgcggcg aaaacatttc attgtctagg tccttcgtcg aaggatactg    8820
atttttctgg ttgagcgaag tcagtagtcc agtaacgccg taggccgacg tcaacatcgt    8880
aaccatcgct atagtctgag tgagattctc cgcagtcgcg agcgcagtcg cgagcgtctc    8940
agcctccgtt gccgggtcgc taacaacaaa ctgcgcccgc gcgggctgaa tatatagaaa    9000
gctgcaggtc aaaactgttg caataagttg cgtcgtcttc atcgtttcct accttatcaa    9060
tcttctgcct cgtggtgacg ggccatgaat tcgctgagcc agccagatga gttgccttct    9120
tgtgcctcgc gtagtcgagt tgcaaagcgc accgtgttgg cacgccccga aagcacggcg    9180
acatattcac gcatatcccg cagatcaaat tcgcagatga cgcttccact ttctcgttta    9240
agaagaaact tacggctgcc gaccgtcatg tcttcacgga tcgcctgaaa ttccttttcg    9300
gtacatttca gtccatcgac ataagccgat cgatctgcgg ttggtgatgg atagaaaatc    9360
ttcgtcatac attgcgcaac caagctggct cctagcggcg attccagaac atgctctggt    9420
tgctgcgttg ccagtattag catcccgttg ttttttcgaa cggtcaggag gaatttgtcg    9480
acgacagtcg aaaatttagg gtttaacaaa taggcgcgaa actcatcgca gctcatcaca    9540
aaacggcggc cgtcgatcat ggctccaatc cgatgcagga gatatgctgc agcgggagcg    9600
catacttcct cgtattcgag aagatgcgtc atgtcgaagc cggtaatcga cggatctaac    9660
tttacttcgt caacttcgcc gtcaaatgcc cagccaagcg catggccccg gcaccagcgt    9720
tggagccgcg ctcctgcgcc ttcggcgggc ccatgcaaca aaaattcacg taaccccgcg    9780
attgaacgca tttgtggatc aaacgagagc tgacgatgga taccacggac cagacggcgg    9840
ttctcttccg gagaaatccc accccgacca tcactctcga tgagagccac gatccattcg    9900
cgcagaaaat cgtgtgaggc tgctgtgttt tctaggccac gcaacggcgc caacccgctg    9960
ggtgtgcctc tgtgaagtgc caaatatgtt cctcctgtgg cgcgaaccag caattcgcca   10020
ccccggtcct tgtcaaagaa cacgaccgta cctgcacggt cgaccatgct ctgttcgagc   10080
atggctagaa caaacatcat gagcgtcgtc ttacccctcc cgataggccc gaatattgcc   10140
gtcatgccaa catcgtgctc atgcgggata tagtcgaaag gcgttccgcc attggtacga   10200
aatcgggcaa tcgcgttgcc ccagtggcct gagctggcgc cctctggaaa gttttcgaaa   10260
gagacaaacc ctgcgaaatt gcgtgaagtg attgcgccag ggcgtgtgcg ccacttaaaa  10320
ttccccggca attgggacca ataggccgct tccataccaa taccttcttg gacaaccacg  10380
gcacctgcat ccgccattcg tgtccgagcc cgcgcgcccc tgtccccaag actattgaga  10440
tcgtctgcat agacgcaaag gctcaaatga tgtgagccca taacgaattc gttgctcgca  10500
agtgcgtcct cagcctcgga taatttgccg atttgagtca cggctttatc gccggaactc  10560
agcatctggc tcgatttgag gctaagtttc gcgtgcgctt gcgggcgagt caggaacgaa  10620
aaactctgcg tgagaacaag tggaaaatcg agggatagca gcgcgttgag catgcccggc  10680
cgtgtttttg cagggtattc gcgaaacgaa tagatggatc caacgtaact gtcttttggc  10740
gttctgatct cgagtcctcg cttgccgcaa atgactctgt cggtataaat cgaagcgccg  10800
agtgagccgc tgacgaccgg aaccggtgtg aaccgaccag tcatgatcaa ccgtagcgct  10860
tcgccaattt cggtgaagag cacaccctgc ttctcgcgga tgccaagacg atgcaggcca  10920
tacgctttaa gagagccagc gacaacatgc caaagatctt ccatgttcct gatctggccc  10980
gtgagatcgt tttccctttt tccgcttagc ttggtgaacc tcctctttac cttccctaaa  11040
gccgcctgtg ggtagacaat caacgtaagg aagtgttcat tgcggaggag ttggccggag  11100
agcacgcgct gttcaaaagc ttcgttcagg ctagcggcga aaacactacg gaagtgtcgc  11160
ggcgccgatg atggcacgtc ggcatgacgt acgaggtgag catatattga cacatgatca  11220
tcagcgatat tgcgcaacag cgtgttgaac gcacgacaac gcgcattgcg catttcagtt  11280
tcctcaagct cgaatgcaac gccatcaatt ctcgcaatgg tcatgatcga tccgtcttca  11340
agaaggacga tatggtcgct gaggtggcca atataaggga gatagatctc accggatctt  11400
tcggtcgttc cactcgcgcc gagcatcaca ccattcctct ccctcgtggg ggaaccctaa  11460
ttggatttgg gctaacagta gcgccccccc aaactgcact atcaatgctt cttcccgcgg  11520
tccgcaaaaa tagcaggacg acgctcgccg cattgtagtc tcgctccacg atgagccggg  11580
ctgcaaacca taacggcacg agaacgactt cgtagagcgg gttctgaacg ataacgatga  11640
caaagccggc gaacatcatg aataaccctg ccaatgtcag tggcacccca agaaacaatg  11700
cgggccgtgt ggctgcgagg taaagggtcg attcttccaa acgatcagcc atcaactacc  11760
gccagtgagc gtttggccga ggaagctcgc cccaaacatg ataacaatgc cgccgacgac  11820
gccggcaacc agcccaagcg aagcccgccc gaacatccag gagatcccga tagcgacaat  11880
gccgagaaca gcgagtgact ggccgaacgg accaaggata aacgtgcata tattgttaac  11940
cattgtggcg gggtcagtgc cgccacccgc agattgcgct gcggcgggtc cggatgagga  12000
aatgctccat gcaattgcac cgcacaagct tggggcgcag ctcgatatca cgcgcatcat  12060
cgcattcgag agcgagaggc gatttagatg taaacggtat ctctcaaagc atcgcatcaa  12120
tgcgcacctc cttagtataa gtcgaataag acttgattgt cgtctgcgga tttgccgttg  12180
tcctggtgtg gcggtggcgg agcgattaaa ccgccagcgc catcctcctg cgagcggcgc  12240
tgatatgacc cccaaacatc ccacgtctct tcggatttta gcgcctcgtg atcgtctttt  12300
ggaggctcga ttaacgcggg caccagcgat tgagcagctg tttcaacttt tcgcacgtag  12360
ccgtttgcaa aaccgccgat gaaattaccg gtgttgtaag cggagatcgc ccgacgaagc  12420
gcaaattgct tctcgtcaat cgtttcgccg cctgcataac gacttttcag catgtttgca  12480
gcggcagata atgatgtgca cgcctggagc gcaccgtcag gtgtcagacc gagcatagaa  12540
aaatttcgag agtttatttg catgaggcca acatccagcg aatgccgtgc atcgagacgg  12600
tgcctgacga cttgggttgc ttggctgtga tcttgccagt gaagcgtttc gccggtcgtg  12660
ttgtcatgaa tcgctaaagg atcaaagcga ctctccacct tagctatcgc cgcaagcgta  12720
gatgtcgcaa ctgatggggc acacttgcga gcaacatggt caaactcagc agatgagagt  12780
ggcgtggcaa ggctcgacga acagaaggag accatcaagg caagagaaag cgaccccgat  12840
ctcttaagca taccttatct ccttagctcg caactaacac cgcctctccc gttggaagaa  12900
gtgcgttgtt ttatgttgaa gattatcggg agggtcggtt actcgaaaat tttcaattgc  12960
ttctttatga tttcaattga agcgagaaac ctcgcccggc gtcttggaac gcaacatgga  13020
ccgagaaccg cgcatccatg actaagcaac cggatcgacc tattcaggcc gcagttggtc  13080
aggtcaggct cagaacgaaa atgctcggcg aggttacgct gtctgtaaac ccattcgatg  13140
aacgggaagc ttccttccga ttgctcttgg caggaatatt ggcccatgcc tgcttgcgct  13200
ttgcaaatgc tcttatcgcg ttggtatcat atgccttgtc cgccagcaga aacgcactct  13260
aagcgattat ttgtaaaaat gtttcggtca tgcggcggtc atgggcttga cccgctgtca  13320
gcgcaagacg gatcggtcaa ccgtcggcat cgacaacagc gtgaatcttg gtggtcaaac  13380
cgccacggga acgtcccata cagccatcgt cttgatcccg ctgtttcccg tcgccgcatg  13440
ttggtggacg cggacacagg aactgtcaat catgacgaca ttctatcgaa agccttggaa  13500
atcacactca gaatatgatc ccagacgtct gcctcacgcc atcgtacaaa gcgattgtag  13560
caggttgtac aggaaccgta tcgatcagga acgtctgccc agggcgggcc cgtccggaag  13620
cgccacaaga tgacattgat cacccgcgtc aacgcgcggc acgcgacgcg gcttatttgg  13680
gaacaaagga ctgaacaaca gtccattcga aatcggtgac atcaaagcgg ggacgggtta  13740
tcagtggcct ccaagtcaag cctcaatgaa tcaaaatcag accgatttgc aaacctgatt  13800
tatgagtgtg cggcctaaat gatgaaatcg tccttctaga tcgcctccgt ggtgtagcaa  13860
cacctcgcag tatcgccgtg ctgaccttgg ccagggaatt gactggcaag ggtgctttca  13920
catgaccgct cttttggccg cgatagatga tttcgttgct gctttgggca cgtagaagga  13980
gagaagtcat atcggagaaa ttcctcctgg cgcgagagcc tgctctatcg cgacggcatc  14040
ccactgtcgg gaacagaccg gatcattcac gaggcgaaag tcgtcaacac atgcgttata  14100
ggcatcttcc cttgaaggat gatcttgttg ctgccaatct ggaggtgcgg cagccgcagg  14160
cagatgcgat ctcagcgcaa cttgcggcaa aacatctcac tcacctgaaa accactagcg  14220
agtctcgcga tcagacgaag gccttttact taacgacaca atatccgatg tctgcatcac  14280
aggcgtcgct atcccagtca atactaaagc ggtgcaggaa ctaaagatta ctgatgactt  14340
aggcgtgcca cgaggcctga gacgacgcgc gtagacagtt ttttgaaatc attatcaaag  14400
tgatggcctc cgctgaagcc tatcacctct gcgccggtct gtcggagaga tgggcaagca  14460
ttattacggt cttcgcgccc gtacatgcat tggacgattg cagggtcaat ggatctgaga  14520
tcatccagag gattgccgcc cttaccttcc gtttcgagtt ggagccagcc cctaaatgag  14580
acgacatagt cgacttgatg tgacaatgcc aagagagaga tttgcttaac ccgatttttt  14640
tgctcaagcg taagcctatt gaagcttgcc ggcatgacgt ccgcgccgaa agaatatcct  14700
acaagtaaaa cattctgcac accgaaatgc ttggtgtaga catcgattat gtgaccaaga  14760
tccttagcag tttcgcttgg ggaccgctcc gaccagaaat accgaagtga actgacgcca  14820
atgacaggaa tcccttccgt ctgcagatag gtaccatcga tagatctgct gcctcgcgcg  14880
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg  14940
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg  15000
gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac  15060
tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac  15120
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg  15180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg  15240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag  15300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac  15360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga  15420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt  15480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc  15540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc  15600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta  15660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat  15720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca  15780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct  15840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt  15900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct  15960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc  16020
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa  16080
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta  16140
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc  16200
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat  16260
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta  16320
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt  16380
aatagtttgc gcaacgttgt tgccattgct gcaggggggg gggggggggg gttccattgt  16440
tcattccacg gacaaaaaca gagaaaggaa acgacagagg ccaaaaagct cgctttcagc  16500
acctgtcgtt tcctttcttt tcagagggta ttttaaataa aaacattaag ttatgacgaa  16560
gaagaacgga aacgccttaa accggaaaat tttcataaat agcgaaaacc cgcgaggtcg  16620
ccgccccgta acctgtcgga tcaccggaaa ggacccgtaa agtgataatg attatcatct  16680
acatatcaca acgtgcgtgg aggccatcaa accacgtcaa ataatcaatt atgacgcagg  16740
tatcgtatta attgatctgc atcaacttaa cgtaaaaaca acttcagaca atacaaatca  16800
gcgacactga atacggggca acctcatgtc cccccccccc ccccccctgc aggcatcgtg  16860
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga  16920
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt  16980
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct  17040
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca  17100
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat  17160
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga  17220
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc  17280
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg  17340
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc  17400
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt  17460
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca  17520
cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg  17580
aggccctttc gtcttcaaga attcggagct tttgccattc tcaccggatt cagtcgtcac  17640
tcatggtgat ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat  17700
tgatgttgga cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg  17760
cctcggtgag ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa  17820
tcctgatatg aataaattgc agtttcattt gatgctcgat gagtttttct aatcagaatt  17880
ggttaattgg ttgtaacact ggcagagcat tacgctgact tgacgggacg gcggctttgt  17940
tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcttcc cgacaacgca  18000
gaccgttccg tggcaaagca aaagttcaaa atcaccaact ggtccaccta caacaaagct  18060
ctcatcaacc gtggctccct cactttctgg ctggatgatg gggcgattca ggcctggtat  18120
gagtcagcaa caccttcttc acgaggcaga cctcagcgcc agaaggccgc cagagaggcc  18180
gagcgcggcc gtgaggcttg gacgctaggg cagggcatga aaaagcccgt agcgggctgc  18240
tacgggcgtc tgacgcggtg gaaaggggga ggggatgttg tctacatggc tctgctgtag  18300
tgagtgggtt gcgctccggc agcggtcctg atcaatcgtc accctttctc ggtccttcaa  18360
cgttcctgac aacgagcctc cttttcgcca atccatcgac aatcaccgcg agtccctgct  18420
cgaacgctgc gtccggaccg gcttcgtcga aggcgtctat cgcggcccgc aacagcggcg  18480
agagcggagc ctgttcaacg gtgccgccgc gctcgccggc atcgctgtcg ccggcctgct  18540
cctcaagcac ggccccaaca gtgaagtagc tgattgtcat cagcgcattg acggcgtccc  18600
cggccgaaaa acccgcctcg cagaggaagc gaagctgcgc gtcggccgtt tccatctgcg  18660
gtgcgcccgg tcgcgtgccg gcatggatgc gcgcgccatc gcggtaggcg agcagcgcct  18720
gcctgaagct gcgggcattc ccgatcagaa atgagcgcca gtcgtcgtcg gctctcggca  18780
ccgaatgcgt atgattctcc gccagcatgg cttcggccag tgcgtcgagc agcgcccgct  18840
tgttcctgaa gtgccagtaa agcgccggct gctgaacccc caaccgttcc gccagtttgc  18900
gtgtcgtcag accgtctacg ccgacctcgt tcaacaggtc cagggcggca cggatcactg  18960
tattcggctg caactttgtc atgcttgaca ctttatcact gataaacata atatgtccac  19020
caacttatca gtgataaaga atccgcgcgt tcaatcggac cagcggaggc tggtccggag  19080
gccagacgtg aaacccaaca tacccctgat cgtaattctg agcactgtcg cgctcgacgc  19140
tgtcggcatc ggcctgatta tgccggtgct gccgggcctc ctgcgcgatc tggttcactc  19200
gaacgacgtc accgcccact atggcattct gctggcgctg tatgcgttgg tgcaatttgc  19260
ctgcgcacct gtgctgggcg cgctgtcgga tcgtttcggg cggcggccaa tcttgctcgt  19320
ctcgctggcc ggcgccactg tcgactacgc catcatggcg acagcgcctt tcctttgggt  19380
tctctatatc gggcggatcg tggccggcat caccggggcg actggggcgg tagccggcgc  19440
ttatattgcc gatatcactg atggcgatga gcgcgcgcgg cacttcggct tcatgagcgc  19500
ctgtttcggg ttcgggatgg tcgcgggacc tgtgctcggt gggctgatgg gcggtttctc  19560
cccccacgct ccgttcttcg ccgcggcagc cttgaacggc ctcaatttcc tgacgggctg  19620
tttccttttg ccggagtcgc acaaaggcga acgccggccg ttacgccggg aggctctcaa  19680
cccgctcgct tcgttccggt gggcccgggg catgaccgtc gtcgccgccc tgatggcggt  19740
cttcttcatc atgcaacttg tcggacaggt gccggccgcg ctttgggtca ttttcggcga  19800
ggatcgcttt cactgggacg cgaccacgat cggcatttcg cttgccgcat ttggcattct  19860
gcattcactc gcccaggcaa tgatcaccgg ccctgtagcc gcccggctcg gcgaaaggcg  19920
ggcactcatg ctcggaatga ttgccgacgg cacaggctac atcctgcttg ccttcgcgac  19980
acggggatgg atggcgttcc cgatcatggt cctgcttgct tcgggtggca tcggaatgcc  20040
ggcgctgcaa gcaatgttgt ccaggcaggt ggatgaggaa cgtcaggggc agctgcaagg  20100
ctcactggcg gcgctcacca gcctgacctc gatcgtcgga cccctcctct tcacggcgat  20160
ctatgcggct tctataacaa cgtggaacgg gtgggcatgg attgcaggcg ctgccctcta  20220
cttgctctgc ctgccggcgc tgcgtcgcgg gctttggagc ggcgcagggc aacgagccga  20280
tcgctgatcg tggaaacgat aggcctatgc catgcgggtc aaggcgactt ccggcaagct  20340
atacgcgccc taggagtgcg gttggaacgt tggcccagcc agatactccc gatcacgagc  20400
aggacgccga tgatttgaag cgcactcagc gtctgatcca agaacaacca tcctagcaac  20460
acggcggtcc ccgggctgag aaagcccagt aaggaaacaa ctgtaggttc gagtcgcgag  20520
atcccccgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag ccacgccagg  20580
ccgagaacat tggttcctgt aggcatcggg attggcggat caaacactaa agctactgga  20640
acgagcagaa gtcctccggc cgccagttgc caggcggtaa aggtgagcag aggcacggga  20700
ggttgccact tgcgggtcag cacggttccg aacgccatgg aaaccgcccc cgccaggccc  20760
gctgcgacgc cgacaggatc tagcgctgcg tttggtgtca acaccaacag cgccacgccc  20820
gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc tagcagagcg  20880
gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc gaccccgccc  20940
ggcaggcggt agaccgaaat aaacaacaag ctccagaata gcgaaatatt aagtgcgccg  21000
aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat catcacgagc  21060
aataaacccg ccggcaacgc ccgcagcagc ataccggcga cccctcggcc tcgctgttcg  21120
ggctccacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc gtcctcctgt  21180
ttgaagaccg acagcccaat gatctcgccg tcgatgtagg cgccgaatgc cacggcatct  21240
cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta aacggacccg  21300
aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc ctgcacgtcg  21360
gccgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa tcctctgttt  21420
atcggcagtt cgtagagcgc gccgtgcgtc ccgagcgata ctgagcgaag caagtgcgtc  21480
gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa cccccagccg  21540
gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg acccaggcgt  21600
gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc tcgcgccact  21660
tcttcacgcg ggtggaatcc gatccgcaca tgaggcggaa ggtttccagc ttgagcgggt  21720
acggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc gacagcttgc  21780
ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg acgatttcct  21840
cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg cggaagcggt  21900
gcagcagcga caccgattcc aggtgcccaa cgcggtcgga cgtgaagccc atcgccgtcg  21960
cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg atcgaccagc  22020
ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata ggggtgcgct  22080
tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc agctcgacgc  22140
cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt tgcagcgcct  22200
cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg tcgtttggca  22260
tcgctcgcat cgtgtccggc cacggcgcaa tatcgaacaa ggaaagctgc atttccttga  22320
tctgctgctt cgtgtgtttc agcaacgcgg cctgcttggc ctcgctgacc tgttttgcca  22380
ggtcctcgcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg tcgatggtca  22440
tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc acggcggccg  22500
atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc ttggccgtag  22560
cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc atgacggtgc  22620
ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt tcttgcctgt  22680
atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc ccgactcacg  22740
ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg tccagataat  22800
ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc tcgtacttgg  22860
tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac ttgccgtggg  22920
cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc tgcttgtcgc  22980
cggcatcgtt gcgccactct tcattaaccg ctatatcgaa aattgcttgc ggcttgttag  23040
aattgccatg acgtacctcg gtgtcacggg taagattacc gataaactgg aactgattat  23100
ggctcatatc gaaagtctcc ttgagaaagg agactctagt ttagctaaac attggttccg  23160
ctgtcaagaa ctttagcggc taaaattttg cgggccgcga ccaaaggtgc gaggggcggc  23220
ttccgctgtg tacaaccaga tatttttcac caacatcctt cgtctgctcg atgagcgggg  23280
catgacgaaa catgagctgt cggagagggc aggggtttca atttcgtttt tatcagactt  23340
aaccaacggt aaggccaacc cctcgttgaa ggtgatggag gccattgccg acgccctgga  23400
aactccccta cctcttctcc tggagtccac cgaccttgac cgcgaggcac tcgcggagat  23460
tgcgggtcat cctttcaaga gcagcgtgcc gcccggatac gaacgcatca gtgtggtttt  23520
gccgtcacat aaggcgttta tcgtaaagaa atggggcgac gacacccgaa aaaagctgcg  23580
tggaaggctc tgacgccaag ggttagggct tgcacttcct tctttagccg ctaaaacggc  23640
cccttctctg cgggccgtcg gctcgcgcat catatcgaca tcctcaacgg aagccgtgcc  23700
gcgaatggca tcgggcgggt gcgctttgac agttgttttc tatcagaacc cctacgtcgt  23760
gcggttcgat tagctgtttg tcttgcaggc taaacacttt cggtatatcg tttgcctgtg  23820
cgataatgtt gctaatgatt tgttgcgtag gggttactga aaagtgagcg ggaaagaaga  23880
gtttcagacc atcaaggagc gggccaagcg caagctggaa cgcgacatgg gtgcggacct  23940
gttggccgcg ctcaacgacc cgaaaaccgt tgaagtcatg ctcaacgcgg acggcaaggt  24000
gtggcacgaa cgccttggcg agccgatgcg gtacatctgc gacatgcggc ccagccagtc  24060
gcaggcgatt atagaaacgg tggccggatt ccacggcaaa gaggtcacgc ggcattcgcc  24120
catcctggaa ggcgagttcc ccttggatgg cagccgcttt gccggccaat tgccgccggt  24180
cgtggccgcg ccaacctttg cgatccgcaa gcgcgcggtc gccatcttca cgctggaaca  24240
gtacgtcgag gcgggcatca tgacccgcga gcaatacgag gtcattaaaa gcgccgtcgc  24300
ggcgcatcga aacatcctcg tcattggcgg tactggctcg ggcaagacca cgctcgtcaa  24360
cgcgatcatc aatgaaatgg tcgccttcaa cccgtctgag cgcgtcgtca tcatcgagga  24420
caccggcgaa atccagtgcg ccgcagagaa cgccgtccaa taccacacca gcatcgacgt  24480
ctcgatgacg ctgctgctca agacaacgct gcgtatgcgc cccgaccgca tcctggtcgg  24540
tgaggtacgt ggccccgaag cccttgatct gttgatggcc tggaacaccg ggcatgaagg  24600
aggtgccgcc accctgcacg caaacaaccc caaagcgggc ctgagccggc tcgccatgct  24660
tatcagcatg cacccggatt caccgaaacc cattgagccg ctgattggcg aggcggttca  24720
tgtggtcgtc catatcgcca ggacccctag cggccgtcga gtgcaagaaa ttctcgaagt  24780
tcttggttac gagaacggcc agtacatcac caaaaccctg taaggagtat ttccaatgac  24840
aacggctgtt ccgttccgtc tgaccatgaa tcgcggcatt ttgttctacc ttgccgtgtt  24900
cttcgttctc gctctcgcgt tatccgcgca tccggcgatg gcctcggaag gcaccggcgg  24960
cagcttgcca tatgagagct ggctgacgaa cctgcgcaac tccgtaaccg gcccggtggc  25020
cttcgcgctg tccatcatcg gcatcgtcgt cgccggcggc gtgctgatct tcggcggcga  25080
actcaacgcc ttcttccgaa ccctgatctt cctggttctg gtgatggcgc tgctggtcgg  25140
cgcgcagaac gtgatgagca ccttcttcgg tcgtggtgcc gaaatcgcgg ccctcggcaa  25200
cggggcgctg caccaggtgc aagtcgcggc ggcggatgcc gtgcgtgcgg tagcggctgg  25260
acggctcgcc taatcatggc tctgcgcacg atccccatcc gtcgcgcagg caaccgagaa  25320
aacctgttca tgggtggtga tcgtgaactg gtgatgttct cgggcctgat ggcgtttgcg  25380
ctgattttca gcgcccaaga gctgcgggcc accgtggtcg gtctgatcct gtggttcggg  25440
gcgctctatg cgttccgaat catggcgaag gccgatccga agatgcggtt cgtgtacctg  25500
cgtcaccgcc ggtacaagcc gtattacccg gcccgctcga ccccgttccg cgagaacacc  25560
aatagccaag ggaagcaata ccgatgatcc aagcaattgc gattgcaatc gcgggcctcg  25620
gcgcgcttct gttgttcatc ctctttgccc gcatccgcgc ggtcgatgcc gaactgaaac  25680
tgaaaaagca tcgttccaag gacgccggcc tggccgatct gctcaactac gccgctgtcg  25740
tcgatgacgg cgtaatcgtg ggcaagaacg gcagctttat ggctgcctgg ctgtacaagg  25800
gcgatgacaa cgcaagcagc accgaccagc agcgcgaagt agtgtccgcc cgcatcaacc  25860
aggccctcgc gggcctggga agtgggtgga tgatccatgt ggacgccgtg cggcgtcctg  25920
ctccgaacta cgcggagcgg ggcctgtcgg cgttccctga ccgtctgacg gcagcgattg  25980
aagaagagcg ctcggtcttg ccttgctcgt cggtgatgta cttcaccagc tccgcgaagt  26040
cgctcttctt gatggagcgc atggggacgt gcttggcaat cacgcgcacc ccccggccgt  26100
tttagcggct aaaaaagtca tggctctgcc ctcgggcgga ccacgcccat catgaccttg  26160
ccaagctcgt cctgcttctc ttcgatcttc gccagcaggg cgaggatcgt ggcatcaccg  26220
aaccgcgccg tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc  26280
aggtcgccat tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt  26340
ttgtagccct ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc  26400
ttttcctcaa tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc  26460
ttcctggttg gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta  26520
gccggccagc ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca  26580
gtgaagaagg aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc  26640
cgttggatac accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg  26700
aaaaaggatg gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg  26760
gaaaagcgct gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc  26820
aggaaattac tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag  26880
ctggccgagt gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt  26940
gcgttcctgg cggtgagggc ggatgtcgag gcggcgttag cgtccggcta tgcgctcgtc  27000
accatttggg agcacatgcg ggaaacgggg aaggtcaagt tctcctacga gacgttccgc  27060
tcgcacgcca ggcggcacat caaggccaag cccgccgatg tgcccgcacc gcaggccaag  27120
gctgcggaac ccgcgccggc acccaagacg ccggagccac ggcggccgaa gcaggggggc  27180
aaggctgaaa agccggcccc cgctgcggcc ccgaccggct tcaccttcaa cccaacaccg  27240
gacaaaaagg atctactgta atggcgaaaa ttcacatggt tttgcagggc aagggcgggg  27300
tcggcaagtc ggccatcgcc gcgatcattg cgcagtacaa gatggacaag gggcagacac  27360
ccttgtgcat cgacaccgac ccggtgaacg cgacgttcga gggctacaag gccctgaacg  27420
tccgccggct gaacatcatg gccggcgacg aaattaactc gcgcaacttc gacaccctgg  27480
tcgagctgat tgcgccgacc aaggatgacg tggtgatcga caacggtgcc agctcgttcg  27540
tgcctctgtc gcattacctc atcagcaacc aggtgccggc tctgctgcaa gaaatggggc  27600
atgagctggt catccatacc gtcgtcaccg gcggccaggc tctcctggac acggtgagcg  27660
gcttcgccca gctcgccagc cagttcccgg ccgaagcgct tttcgtggtc tggctgaacc  27720
cgtattgggg gcctatcgag catgagggca agagctttga gcagatgaag gcgtacacgg  27780
ccaacaaggc ccgcgtgtcg tccatcatcc agattccggc cctcaaggaa gaaacctacg  27840
gccgcgattt cagcgacatg ctgcaagagc ggctgacgtt cgaccaggcg ctggccgatg  27900
aatcgctcac gatcatgacg cggcaacgcc tcaagatcgt gcggcgcggc ctgtttgaac  27960
agctcgacgc ggcggccgtg ctatgagcga ccagattgaa gagctgatcc gggagattgc  28020
ggccaagcac ggcatcgccg tcggccgcga cgacccggtg ctgatcctgc ataccatcaa  28080
cgcccggctc atggccgaca gtgcggccaa gcaagaggaa atccttgccg cgttcaagga  28140
agagctggaa gggatcgccc atcgttgggg cgaggacgcc aaggccaaag cggagcggat  28200
gctgaacgcg gccctggcgg ccagcaagga cgcaatggcg aaggtaatga aggacagcgc  28260
cgcgcaggcg gccgaagcga tccgcaggga aatcgacgac ggccttggcc gccagctcgc  28320
ggccaaggtc gcggacgcgc ggcgcgtggc gatgatgaac atgatcgccg gcggcatggt  28380
gttgttcgcg gccgccctgg tggtgtgggc ctcgttatga atcgcagagg cgcagatgaa  28440
aaagcccggc gttgccgggc tttgtttttg cgttagctgg gcttgtttga caggcccaag  28500
ctctgactgc gcccgcgctc gcgctcctgg gcctgtttct tctcctgctc ctgcttgcgc  28560
atcagggcct ggtgccgtcg ggctgcttca cgcatcgaat cccagtcgcc ggccagctcg  28620
ggatgctccg cgcgcatctt gcgcgtcgcc agttcctcga tcttgggcgc gtgaatgccc  28680
atgccttcct tgatttcgcg caccatgtcc agccgcgtgt gcagggtctg caagcgggct  28740
tgctgttggg cctgctgctg ctgccaggcg gcctttgtac gcggcaggga cagcaagccg  28800
ggggcattgg actgtagctg ctgcaaacgc gcctgctgac ggtctacgag ctgttctagg  28860
cggtcctcga tgcgctccac ctggtcatgc tttgcctgca cgtagagcgc aagggtctgc  28920
tggtaggtct gctcgatggg cgcggattct aagagggcct gctgttccgt ctcggcctcc  28980
tgggccgcct gtagcaaatc ctcgccgctg ttgccgctgg actgctttac tgccggggac  29040
tgctgttgcc ctgctcgcgc cgtcgtcgca gttcggcttg cccccactcg attgactgct  29100
tcatttcgag ccgcagcgat gcgatctcgg attgcgtcaa cggacggggc agcgcggagg  29160
tgtccggctt ctccttgggt gagtcggtcg atgccatagc caaaggtttc cttccaaaat  29220
gcgtccattg ctggaccgtg tttctcattg atgcccgcaa gcatcttcgg cttgaccgcc  29280
aggtcaagcg cgccttcatg ggcggtcatg acggacgccg ccatgacctt gccgccgttg  29340
ttctcgatgt agccgcgtaa tgaggcaatg gtgccgccca tcgtcagcgt gtcatcgaca  29400
acgatgtact tctggccggg gatcacctcc ccctcgaaag tcgggttgaa cgccaggcga  29460
tgatctgaac cggctccggt tcgggcgacc ttctcccgct gcacaatgtc cgtttcgacc  29520
tcaaggccaa ggcggtcggc cagaacgacc gccatcatgg ccggaatctt gttgttcccc  29580
gccgcctcga cggcgaggac tggaacgatg cggggcttgt cgtcgccgat cagcgtcttg  29640
agctgggcaa cagtgtcgtc cgaaatcagg cgctcgacca aattaagcgc cgcttccgcg  29700
tcgccctgct tcgcagcctg gtattcaggc tcgttggtca aagaaccaag gtcgccgttg  29760
cgaaccacct tcgggaagtc tccccacggt gcgcgctcgg ctctgctgta gctgctcaag  29820
acgcctccct ttttagccgc taaaactcta acgagtgcgc ccgcgactca acttgacgct  29880
ttcggcactt acctgtgcct tgccacttgc gtcataggtg atgcttttcg cactcccgat  29940
ttcaggtact ttatcgaaat ctgaccgggc gtgcattaca aagttcttcc ccacctgttg  30000
gtaaatgctg ccgctatctg cgtggacgat gctgccgtcg tggcgctgcg acttatcggc  30060
cttttgggcc atatagatgt tgtaaatgcc aggtttcagg gccccggctt tatctacctt  30120
ctggttcgtc catgcgcctt ggttctcggt ctggacaatt ctttgcccat tcatgaccag  30180
gaggcggtgt ttcattgggt gactcctgac ggttgcctct ggtgttaaac gtgtcctggt  30240
cgcttgccgg ctaaaaaaaa gccgacctcg gcagttcgag gccggctttc cctagagccg  30300
ggcgcgtcaa ggttgttcca tctattttag tgaactgcgt tcgatttatc agttactttc  30360
ctcccgcttt gtgtttcctc ccactcgttt ccgcgtctag ccgacccctc aacatagcgg  30420
cctcttcttg ggctgccttt gcctcttgcc gcgcttcgtc acgctcggct tgcaccgtcg  30480
taaagcgctc ggcctgcctg gccgcctctt gcgccgccaa cttcctttgc tcctggtggg  30540
cctcggcgtc ggcctgcgcc ttcgctttca ccgctgccaa ctccgtgcgc aaactctccg  30600
cttcgcgcct ggtggcgtcg cgctcgccgc gaagcgcctg catttcctgg ttggccgcgt  30660
ccagggtctt gcggctctct tctttgaatg cgcgggcgtc ctggtgagcg tagtccagct  30720
cggcgcgcag ctcctgcgct cgacgctcca cctcgtcggc ccgctgcgtc gccagcgcgg  30780
cccgctgctc ggctcctgcc agggcggtgc gtgcttcggc cagggcttgc cgctggcgtg  30840
cggccagctc ggccgcctcg gcggcctgct gctctagcaa tgtaacgcgc gcctgggctt  30900
cttccagctc gcgggcctgc gcctcgaagg cgtcggccag ctccccgcgc acggcttcca  30960
actcgttgcg ctcacgatcc cagccggctt gcgctgcctg caacgattca ttggcaaggg  31020
cctgggcggc ttgccagagg gcggccacgg cctggttgcc ggcctgctgc accgcgtccg  31080
gcacctggac tgccagcggg gcggcctgcg ccgtgcgctg gcgtcgccat tcgcgcatgc  31140
cggcgctggc gtcgttcatg ttgacgcggg cggccttacg cactgcatcc acggtcggga  31200
agttctcccg gtcgccttgc tcgaacagct cgtccgcagc cgcaaaaatg cggtcgcgcg  31260
tctctttgtt cagttccatg ttggctccgg taattggtaa gaataataat actcttacct  31320
accttatcag cgcaagagtt tagctgaaca gttctcgact taacggcagg ttttttagcg  31380
gctgaagggc aggcaaaaaa agccccgcac ggtcggcggg ggcaaagggt cagcgggaag  31440
gggattagcg ggcgtcgggc ttcttcatgc gtcggggccg cgcttcttgg gatggagcac  31500
gacgaagcgc gcacgcgcat cgtcctcggc cctatcggcc cgcgtcgcgg tcaggaactt  31560
gtcgcgcgct aggtcctccc tggtgggcac caggggcatg aactcggcct gctcgatgta  31620
ggtccactcc atgaccgcat cgcagtcgag gccgcgttcc ttcaccgtct cttgcaggtc  31680
gcggtacgcc cgctcgttga gcggctggta acgggccaat tggtcgtaaa tggctgtcgg  31740
ccatgagcgg cctttcctgt tgagccagca gccgacgacg aagccggcaa tgcaggcccc  31800
tggcacaacc aggccgacgc cgggggcagg ggatggcagc agctcgccaa ccaggaaccc  31860
cgccgcgatg atgccgatgc cggtcaacca gcccttgaaa ctatccggcc ccgaaacacc  31920
cctgcgcatt gcctggatgc tgcgccggat agcttgcaac atcaggagcc gtttcttttg  31980
ttcgtcagtc atggtccgcc ctcaccagtt gttcgtatcg gtgtcggacg aactgaaatc  32040
gcaagagctg ccggtatcgg tccagccgct gtccgtgtcg ctgctgccga agcacggcga  32100
ggggtccgcg aacgccgcag acggcgtatc cggccgcagc gcatcgccca gcatggcccc  32160
ggtcagcgag ccgccggcca ggtagcccag catggtgctg ttggtcgccc cggccaccag  32220
ggccgacgtg acgaaatcgc cgtcattccc tctggattgt tcgctgctcg gcggggcagt  32280
gcgccgcgcc ggcggcgtcg tggatggctc gggttggctg gcctgcgacg gccggcgaaa  32340
ggtgcgcagc agctcgttat cgaccggctg cggcgtcggg gccgccgcct tgcgctgcgg  32400
tcggtgttcc ttcttcggct cgcgcagctt gaacagcatg atcgcggaaa ccagcagcaa  32460
cgccgcgcct acgcctcccg cgatgtagaa cagcatcgga ttcattcttc ggtcctcctt  32520
gtagcggaac cgttgtctgt gcggcgcggg tggcccgcgc cgctgtcttt ggggatcagc  32580
cctcgatgag cgcgaccagt ttcacgtcgg caaggttcgc ctcgaactcc tggccgtcgt  32640
cctcgtactt caaccaggca tagccttccg ccggcggccg acggttgagg ataaggcggg  32700
cagggcgctc gtcgtgctcg acctggacga tggccttttt cagcttgtcc gggtccggct  32760
ccttcgcgcc cttttccttg gcgtccttac cgtcctggtc gccgtcctcg ccgtcctggc  32820
cgtcgccggc ctccgcgtca cgctcggcat cagtctggcc gttgaaggca tcgacggtgt  32880
tgggatcgcg gcccttctcg tccaggaact cgcgcagcag cttgaccgtg ccgcgcgtga  32940
tttcctgggt gtcgtcgtca agccacgcct cgacttcctc cgggcgcttc ttgaaggccg  33000
tcaccagctc gttcaccacg gtcacgtcgc gcacgcggcc ggtgttgaac gcatcggcga  33060
tcttctccgg caggtccagc agcgtgacgt gctgggtgat gaacgccggc gacttgccga  33120
tttccttggc gatatcgcct ttcttcttgc ccttcgccag ctcgcggcca atgaagtcgg  33180
caatttcgcg cggggtcagc tcgttgcgtt gcaggttctc gataacctgg tcggcttcgt  33240
tgtagtcgtt gtcgatgaac gccgggatgg acttcttgcc ggcccacttc gagccacggt  33300
agcggcgggc gccgtgattg atgatatagc ggcccggctg ctcctggttc tcgcgcaccg  33360
aaatgggtga cttcaccccg cgctctttga tcgtggcacc gatttccgcg atgctctccg  33420
gggaaaagcc ggggttgtcg gccgtccgcg gctgatgcgg atcttcgtcg atcaggtcca  33480
ggtccagctc gatagggccg gaaccgccct gagacgccgc aggagcgtcc aggaggctcg  33540
acaggtcgcc gatgctatcc aaccccaggc cggacggctg cgccgcgcct gcggcttcct  33600
gagcggccgc agcggtgttt ttcttggtgg tcttggcttg agccgcagtc attgggaaat  33660
ctccatcttc gtgaacacgt aatcagccag ggcgcgaacc tctttcgatg ccttgcgcgc  33720
ggccgttttc ttgatcttcc agaccggcac accggatgcg agggcatcgg cgatgctgct  33780
gcgcaggcca acggtggccg gaatcatcat cttggggtac gcggccagca gctcggcttg  33840
gtggcgcgcg tggcgcggat tccgcgcatc gaccttgctg ggcaccatgc caaggaattg  33900
cagcttggcg ttcttctggc gcacgttcgc aatggtcgtg accatcttct tgatgccctg  33960
gatgctgtac gcctcaagct cgatggggga cagcacatag tcggccgcga agagggcggc  34020
cgccaggccg acgccaaggg tcggggccgt gtcgatcagg cacacgtcga agccttggtt  34080
cgccagggcc ttgatgttcg ccccgaacag ctcgcgggcg tcgtccagcg acagccgttc  34140
ggcgttcgcc agtaccgggt tggactcgat gagggcgagg cgcgcggcct ggccgtcgcc  34200
ggctgcgggt gcggtttcgg tccagccgcc ggcagggaca gcgccgaaca gcttgcttgc  34260
atgcaggccg gtagcaaagt ccttgagcgt gtaggacgca ttgccctggg ggtccaggtc  34320
gatcacggca acccgcaagc cgcgctcgaa aaagtcgaag gcaagatgca caagggtcga  34380
agtcttgccg acgccgcctt tctggttggc cgtgaccaaa gttttcatcg tttggtttcc  34440
tgttttttct tggcgtccgc ttcccacttc cggacgatgt acgcctgatg ttccggcaga  34500
accgccgtta cccgcgcgta cccctcgggc aagttcttgt cctcgaacgc ggcccacacg  34560
cgatgcaccg cttgcgacac tgcgcccctg gtcagtccca gcgacgttgc gaacgtcgcc  34620
tgtggcttcc catcgactaa gacgccccgc gctatctcga tggtctgctg ccccacttcc  34680
agcccctgga tcgcctcctg gaactggctt tcggtaagcc gtttcttcat ggataacacc  34740
cataatttgc tccgcgcctt ggttgaacat agcggtgaca gccgccagca catgagagaa  34800
gtttagctaa acatttctcg cacgtcaaca cctttagccg ctaaaactcg tccttggcgt  34860
aacaaaacaa aagcccggaa accgggcttt cgtctcttgc cgcttatggc tctgcacccg  34920
gctccatcac caacaggtcg cgcacgcgct tcactcggtt gcggatcgac actgccagcc  34980
caacaaagcc ggttgccgcc gccgccagga tcgcgccgat gatgccggcc acaccggcca  35040
tcgcccacca ggtcgccgcc ttccggttcc attcctgctg gtactgcttc gcaatgctgg  35100
acctcggctc accataggct gaccgctcga tggcgtatgc cgcttctccc cttggcgtaa  35160
aacccagcgc cgcaggcggc attgccatgc tgcccgccgc tttcccgacc acgacgcgcg  35220
caccaggctt gcggtccaga ccttcggcca cggcgagctg cgcaaggaca taatcagccg  35280
ccgacttggc tccacgcgcc tcgatcagct cttgcactcg cgcgaaatcc ttggcctcca  35340
cggccgccat gaatcgcgca cgcggcgaag gctccgcagg gccggcgtcg tgatcgccgc  35400
cgagaatgcc cttcaccaag ttcgacgaca cgaaaatcat gctgacggct atcaccatca  35460
tgcagacgga tcgcacgaac ccgctgaatt gaacacgagc acggcacccg cgaccactat  35520
gccaagaatg cccaaggtaa aaattgccgg ccccgccatg aagtccgtga atgccccgac  35580
ggccgaagtg aagggcaggc cgccacccag gccgccgccc tcactgcccg gcacctggtc  35640
gctgaatgtc gatgccagca cctgcggcac gtcaatgctt ccgggcgtcg cgctcgggct  35700
gatcgcccat cccgttactg ccccgatccc ggcaatggca aggactgcca gcgctgccat  35760
ttttggggtg aggccgttcg cggccgaggg gcgcagcccc tggggggatg ggaggcccgc  35820
gttagcgggc cgggagggtt cgagaagggg gggcaccccc cttcggcgtg cgcggtcacg  35880
cgcacagggc gcagccctgg ttaaaaacaa ggtttataaa tattggttta aaagcaggtt  35940
aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc  36000
tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc tcatctgtca gcactctgcc  36060
cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat  36120
accgcagggc acttatcccc aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc  36180
aggcgttttc gccgatttgc gaggctggcc agctccacgt cgccggccga aatcgagcct  36240
gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc  36300
ctcatctgtc agtgagggcc aagttttccg cgaggtatcc acaacgccgg cggccgcggt  36360
gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc agggccatag acggccgcca  36420
gcccagcggc gagggcaacc agcccggtga gcgtcggaaa ggcgctggaa gccccgtagc  36480
gacgcggaga ggggcgagac aagccaaggg cgcaggctcg atgcgcagca cgacatagcc  36540
ggttctcgca aggacgagaa tttccctgcg gtgcccctca agtgtcaatg aaagtttcca  36600
acgcgagcca ttcgcgagag ccttgagtcc acgctagatg agagctttgt tgtaggtgga  36660
ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt cgggaagatg  36720
cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc acgttgtgtc  36780
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact  36840
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc  36900
ttgctcgac                                                          36909
 
<210>8
<211>13019
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>8
gttacccgga ccgaagctta gcccgggcat gcctgcagtg cagcgtgacc cggtcgtgcc     60
cctctctaga gataatgagc attgcatgtc taagttataa aaaattacca catatttttt    120
ttgtcacact tgtttgaagt gcagtttatc tatctttata catatattta aactttactc    180
tacgaataat ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat    240
gaacagttag acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt    300
tatcttttta gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata    360
cttcatccat tttattagta catccattta gggtttaggg ttaatggttt ttatagacta    420
atttttttag tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc    480
tattttagtt tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa    540
aattaaacaa atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga    600
gtagataatg ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac    660
cagcagcgtc gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg    720
gacccctctc gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat    780
tgcgtggcgg agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg    840
cacggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc     900
gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca     960
cacacacaca accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc    1020
cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt    1080
tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc    1140
cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa    1200
cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat    1260
cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt    1320
caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt    1380
gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact    1440
acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg    1500
aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt    1560
tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg    1620
ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt    1680
tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg    1740
atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac    1800
atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat    1860
aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc    1920
agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt    1980
tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat    2040
ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa tgatataaat atcaatatat    2100
taaattagat tttgcataaa aaacagacta cataatactg taaaacacaa catatccagt    2160
cactatggcg gccgcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa    2220
tgtgtggatt ttgagttagg atttaaatac gcgttgatcc ggcttactaa aagccagata    2280
acagtatgcg tatttgcgcg ctgatttttg cggtataaga atatatactg atatgtatac    2340
ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta ttacagtgac agttgacagc    2400
gacagctatc agttgctcaa ggcatatatg atgtcaatat ctccggtctg gtaagcacaa    2460
ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag    2520
ggatggctga ggtcgcccgg tttattgaaa tgaacggctc ttttgctgac gagaacaggg    2580
gctggtgaaa tgcagtttaa ggtttacacc tataaaagag agagccgtta tcgtctgttt    2640
gtggatgtac agagtgatat cattgacacg cccggtcgac ggatggtgat ccccctggcc    2700
agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt acccggtggt gcatatcggg    2760
gatgaaagct ggcgcatgat gaccaccgat atggccagtg tgccggtctc cgttatcggg    2820
gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca aaaacgccat taacctgatg    2880
ttctggggaa tataaatgtc aggctccctt atacacagcc agtctgcagg tcgaccatag    2940
tgactggata tgttgtgttt tacagtatta tgtagtctgt tttttatgca aaatctaatt    3000
taatatattg atatttatat cattttacgt ttctcgttca gctttcttgt acaaagtggt    3060
gttaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    3120
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    3180
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    3240
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    3300
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    3360
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt ccggtccggg    3420
tcacctttgt ccaccaagat ggaactgcgg ccgctcatta attaagtcag gcgcgcctct    3480
agttgaagac acgttcatgt cttcatcgta agaagacact cagtagtctt cggccagaat    3540
ggccatctgg attcagcagg cctagaaggc catttaaatc ctgaggatct ggtcttccta    3600
aggacccggg atatcggacc gattaaactt taattcggtc cgaagcttgc atgcctgcag    3660
tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat    3720
aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta    3780
tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag    3840
tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt    3900
tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc    3960
aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag    4020
ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc    4080
taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat    4140
agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa    4200
ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc    4260
taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac    4320
ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc    4380
tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg    4440
cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc caccgctcct    4500
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc    4560
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc    4620
ggcacctccg cttcaaggta cgccgctcgt cctccccccc ccccctctct accttctcta    4680
gatcggcgtt ccggtccatg catggttagg gcccggtagt tctacttctg ttcatgtttg    4740
tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg    4800
tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat    4860
ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg    4920
gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc    4980
ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag    5040
atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt    5100
gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg    5160
ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc    5220
ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa    5280
tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca    5340
tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt    5400
gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct    5460
aaccttgagt acctatctat tataataaac aagtatgttt tataattatt ttgatcttga    5520
tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat    5580
acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt    5640
acttctgcag gtcgacttta acttagccta ggatccacac gacaccatgt cccccgagcg    5700
ccgccccgtc gagatccgcc cggccaccgc cgccgacatg gccgccgtgt gcgacatcgt    5760
gaaccactac atcgagacct ccaccgtgaa cttccgcacc gagccgcaga ccccgcagga    5820
gtggatcgac gacctggagc gcctccagga ccgctacccg tggctcgtgg ccgaggtgga    5880
gggcgtggtg gccggcatcg cctacgccgg cccgtggaag gcccgcaacg cctacgactg    5940
gaccgtggag tccaccgtgt acgtgtccca ccgccaccag cgcctcggcc tcggctccac    6000
cctctacacc cacctcctca agagcatgga ggcccagggc ttcaagtccg tggtggccgt    6060
gatcggcctc ccgaacgacc cgtccgtgcg cctccacgag gccctcggct acaccgcccg    6120
cggcaccctc cgcgccgccg gctacaagca cggcggctgg cacgacgtcg gcttctggca    6180
gcgcgacttc gagctgccgg ccccgccgcg cccggtgcgc ccggtgacgc agatctgagt    6240
cgaaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    6300
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    6360
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    6420
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    6480
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    6540
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt cattccgatt    6600
aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa gcgctactag    6660
acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag cgtcaatttg    6720
tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg gcagctcggc    6780
acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag cgggagagcc    6840
gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac ggcaactaag    6900
ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg taacgatgac    6960
agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa ttatcagcct    7020
tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta tgccgacata    7080
ataggaaatc gctggataaa gccgctgagg aagctgagtg gcgctatttc tttagaagtg    7140
aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt tctgaacaca    7200
gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc gtttgtgtaa    7260
ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac tagatgttga    7320
ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt caggccgtta    7380
tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca gaagctccca    7440
tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct tttgccagat    7500
gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc gaaagtgcga    7560
gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc gtaattggat    7620
gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt gtcgtaattg    7680
cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga gtagtcatag    7740
ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg ccccgatgcc    7800
atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt ccccagctct    7860
ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat tgttagacat    7920
tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc ttccaactga    7980
tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc ttcaagtatg    8040
acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac atccttcggc    8100
gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac tacatttcgc    8160
tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt tagcgcctca    8220
aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc taccaaggca    8280
acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat cgtggctggc    8340
tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag ttcgcgctta    8400
gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc tacagcgcgg    8460
agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat caaagctcgc    8520
cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc actgtgtggc    8580
ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt cggttcgaga    8640
tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc gatcaccgct    8700
tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc ggcttgaatg    8760
aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc tgtttcgttc    8820
gagacttgag gtctagtttt atacgtgaac aggtcaatgc cgccgagagt aaagccacat    8880
tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg tatgccaagg    8940
agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc gactcctttg    9000
cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt ccatgttgag    9060
ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca agcagagtct    9120
tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact tctggtagat    9180
agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat gaaatggttc    9240
tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat atgacgccta    9300
acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg cgtgacaggt    9360
ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac tataatttat    9420
gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt caggaaagta    9480
aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta cttgatcggg    9540
ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc    9600
cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg    9660
cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg    9720
gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat    9780
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc    9840
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca    9900
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg    9960
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca   10020
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa   10080
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc   10140
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc   10200
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct   10260
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg   10320
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag   10380
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta   10440
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg   10500
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt   10560
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt   10620
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag   10680
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat   10740
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc   10800
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat   10860
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc   10920
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag   10980
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag   11040
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg cagggggggg   11100
gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga   11160
ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg gtattttaaa   11220
taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa aattttcata   11280
aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg aaaggacccg  11340
taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat caaaccacgt  11400
caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact taacgtaaaa  11460
acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat gtcccccccc  11520
cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct  11580
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta  11640
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg  11700
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga  11760
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt  11820
gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca  11880
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt  11940
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt  12000
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga  12060
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt  12120
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc  12180
gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa  12240
cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc gacgatcttg  12300
ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg cgagatccag  12360
caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg ccaggacgtc  12420
ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc gatcgaggat  12480
ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag cagcccactc  12540
gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct ccgtcgtcag  12600
gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc caagcactcc  12660
cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac  12720
gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt acccgccaat  12780
atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag  12840
cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac  12900
gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg tacgattgta  12960
atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact ggaagagcg   13019
<210>9
<211>2991
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>9
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga    60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga   120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca   180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc   240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta   300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc   360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa   420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg   480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa   540
aacgacggcc agtcttaagc tcgggccctg cagctctaga gctcgaattc tacaggtcac   600
taataccatc taagtagttg gttcatagtg actgcatatg ttgtgtttta cagtattatg   660
tagtctgttt tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt   720
ctcgttcaac tttcttgtac aaagtggccg ttaacggatc cagacttgtc catcttctgg   780
attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca   840
ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga   900
gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg   960
atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa  1020
ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggca  1080
agcttgcggc cgccccgggc aactttatta tacaaagttg gcattataaa aaagcattgc  1140
ttatcaattt gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttggagc  1200
tccatggtag cgttaacgcg gccgcgatat cccctatagt gagtcgtatt acatggtcat  1260
agctgtttcc tggcagctct ggcccgtgtc tcaaaatctc tgatgttaca ttgcacaaga  1320
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg  1380
tgttatgagc catattcaac gggaaacgtc gaggccgcga ttaaattcca acatggatgc  1440
tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta  1500
tcgcttgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt  1560
tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct  1620
tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat  1680
ccccggaaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt  1740
tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt  1800
taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt  1860
tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga  1920
aatgcataaa cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact  1980
tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg  2040
aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc  2100
ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt  2160
gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca  2220
ctggcagagc attacgctga cttgacggga cggcgcaagc tcatgaccaa aatcccttaa  2280
cgtgagttac gcgtcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc  2340
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc  2400
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt  2460
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt  2520
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc  2580
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa  2640
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac  2700
ctacaccgaa ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg  2760
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga  2820
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact  2880
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa  2940
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt t           2991
 
<210>10
<211>13807
<212>DNA
<213>人工序列
<220>
<223>载体
 
<400>10
aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc    60
ttcaactgga agagcggtta ccagagctgg tcacctttgt ccaccaagat ggaactgcgg   120
ccgctcatta attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta   180
agaagacact cagtagtctt cggccagaat ggccgtaggt gaattaagag gagagaggag   240
gtaaacattt tcttctattt tttcatattt tcaggataaa ttattgtaaa agtttacaag   300
atttccattt gactagtgta aatgaggaat attctctagt aagatcatta tttcatctac   360
ttcttttatc ttctaccagt agaggaataa acaatattta gctcctttgt aaatacaaat   420
taattttcgt tcttgacatc attcaatttt aattttacgt ataaaataaa agatcatacc   480
tattagaacg attaaggaga aatacaattc gaatgagaag gatgtgccgt ttgttataat   540
aaacagccac acgacgtaaa cgtaaaatga ccacatgatg ggccaataga catggaccga   600
ctactaataa tagtaagtta cattttagga tggaataaat atcataccga catcagtttg   660
aaagaaaagg gaaaaaaaga aaaaataaat aaaagatata ctaccgacat gagttccaaa   720
aagcaaaaaa aaagatcaag ccgacacaga cacgcgtaga gagcaaaatg actttgacgt   780
cacaccacga aaacagacgc ttcatacgtg tccctttatc tctctcagtc tctctataaa   840
cttagtgaga ccctcctctg ttttactcag gatccccggg taccgagctc gaattcaccg   900
gtcgccacca tggcccacag caagcacggc ctgaaggagg agatgaccat gaagtaccac   960
atggagggct gcgtgaacgg ccacaagttc gtgatcaccg gcgagggcat cggctacccc  1020
ttcaagggca agcagaccat caacctgtgc gtgatcgagg gcggccccct gcccttcagc  1080
gaggacatcc tgagcgccgg cttcaagtac ggcgaccgga tcttcaccga gtacccccag  1140
gacatcgtgg actacttcaa gaacagctgc cccgccggct acacctgggg ccggagcttc  1200
ctgttcgagg acggcgccgt gtgcatctgt aacgtggaca tcaccgtgag cgtgaaggag  1260
aactgcatct accacaagag catcttcaac ggcgtgaact tccccgccga cggccccgtg  1320
atgaagaaga tgaccaccaa ctgggaggcc agctgcgaga agatcatgcc cgtgcctaag  1380
cagggcatcc tgaagggcga cgtgagcatg tacctgctgc tgaaggacgg cggccggtac  1440
cggtgccagt tcgacaccgt gtacaaggcc aagagcgtgc ccagcaagat gcccgagtgg  1500
cacttcatcc agcacaagct gctgcgggag gaccggagcg acgccaagaa ccagaagtgg  1560
cagctgaccg agcacgccat cgccttcccc agcgccctgg cctgaagcgg cccatggata  1620
ttcgaacgcg taggtaccac atggttaacc tagacttgtc catcttctgg attggccaac    1680
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    1740
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    1800
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    1860
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    1920
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aatgcggcca ttggcctaga    1980
aggccattta aatcctgagg atctggtctt cctaaggacc cgggatatcg ctatcaactt    2040
tgtatagaaa agttgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga    2100
ttttgcataa aaaacagact acataatact gtaaaacaca acatatccag tcactatggt    2160
cgacctgcag actggctgtg tataagggag cctgacattt atattcccca gaacatcagg    2220
ttaatggcgt ttttgatgtc attttcgcgg tggctgagat cagccacttc ttccccgata    2280
acggagaccg gcacactggc catatcggtg gtcatcatgc gccagctttc atccccgata    2340
tgcaccaccg ggtaaagttc acgggggact ttatctgaca gcagacgtgc actggccagg    2400
gggatcacca tccgtcgccc gggcgtgtca ataatatcac tctgtacatc cacaaacaga    2460
cgataacggc tctctctttt ataggtgtaa accttaaact gcatttcacc agcccctgtt    2520
ctcgtcggca aaagagccgt tcatttcaat aaaccgggcg acctcagcca tcccttcctg    2580
attttccgct ttccagcgtt cggcacgcag acgacgggct tcattctgca tggttgtgct    2640
taccgaaccg gagatattga catcatatat gccttgagca actgatagct gtcgctgtca    2700
actgtcactg taatacgctg cttcatagca tacctctttt tgacatactt cgggtataca    2760
tatcagtata tattcttata ccgcaaaaat cagcgcgcaa atacgcatac tgttatctgg    2820
cttttagtaa gccggatcct ctagattacg ccccgcctgc cactcatcgc agtactgttg    2880
taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat gaacctgaat    2940
cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg tgaaaacggg    3000
ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg    3060
attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg ccaggttttc    3120
accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta    3180
ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg    3240
aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaatt ccggatgagc    3300
attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt    3360
tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc    3420
aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt    3480
atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc tcgacggatc    3540
ctaactcaaa atccacacat tatacgagcc ggaagcataa agtgtaaagc ctggggtgcc    3600
ctaatgcggc cgccatagtg actggatatg ttgtgtttta cagtattatg tagtctgttt    3660
tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt ctcgttcaac    3720
tttattatac aaagttgata gatatcggac cgattaaact ttaattcggt ccgaagcttg    3780
catgcctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat    3840
gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt    3900
atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac    3960
aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca    4020
attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc    4080
tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat    4140
ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct    4200
attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt    4260
agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt    4320
aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc    4380
gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa    4440
gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc    4500
gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc    4560
ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc    4620
ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac    4680
cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa    4740
atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc    4800
taccttctct agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct    4860
gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg    4920
gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg    4980
aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt    5040
cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt    5100
gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc    5160
ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg    5220
gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat    5280
atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc    5340
tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga    5400
tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg    5460
tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag    5520
gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat    5580
tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat    5640
tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc    5700
cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt    5760
tgtttggtgt tacttctgca ggtcgacttt aacttagcct aggatccaca cgacaccatg    5820
tcccccgagc gccgccccgt cgagatccgc ccggccaccg ccgccgacat ggccgccgtg    5880
tgcgacatcg tgaaccacta catcgagacc tccaccgtga acttccgcac cgagccgcag    5940
accccgcagg agtggatcga cgacctggag cgcctccagg accgctaccc gtggctcgtg    6000
gccgaggtgg agggcgtggt ggccggcatc gcctacgccg gcccgtggaa ggcccgcaac    6060
gcctacgact ggaccgtgga gtccaccgtg tacgtgtccc accgccacca gcgcctcggc    6120
ctcggctcca ccctctacac ccacctcctc aagagcatgg aggcccaggg cttcaagtcc    6180
gtggtggccg tgatcggcct cccgaacgac ccgtccgtgc gcctccacga ggccctcggc    6240
tacaccgccc gcggcaccct ccgcgccgcc ggctacaagc acggcggctg gcacgacgtc    6300
ggcttctggc agcgcgactt cgagctgccg gccccgccgc gcccggtgcg cccggtgacg    6360
cagatctccg gtggaggcgg cagcggtggc ggaggctccg gaggcggtgg ctccatggcc    6420
tcctccgagg acgtcatcaa ggagttcatg cgcttcaagg tgcgcatgga gggctccgtg    6480
aacggccacg agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag    6540
accgccaagc tgaaggtgac caagggcggc cccctgccct tcgcctggga catcctgtcc    6600
ccccagttcc agtacggctc caaggtgtac gtgaagcacc ccgccgacat ccccgactac    6660
aagaagctgt ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc    6720
ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg gctccttcat ctacaaggtg    6780
aagttcatcg gcgtgaactt cccctccgac ggccccgtaa tgcagaagaa gactatgggc    6840
tgggaggcct ccaccgagcg cctgtacccc cgcgacggcg tgctgaaggg cgagatccac    6900
aaggccctga agctgaagga cggcggccac tacctggtgg agttcaagtc catctacatg    6960
gccaagaagc ccgtgcagct gcccggctac tactacgtgg actccaagct ggacatcacc    7020
tcccacaacg aggactacac catcgtggag cagtacgagc gcgccgaggg ccgccaccac    7080
ctgttcctgt agtcaggatc tgagtcgaaa cctagacttg tccatcttct ggattggcca    7140
acttaattaa tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg    7200
tgggcatcaa agttgtgtgt tatgtgtaat tactagttat ctgaataaaa gagaaagaga    7260
tcatccatat ttcttatcct aaatgaatgt cacgtgtctt tataattctt tgatgaacca    7320
gatgcatttc attaaccaaa tccatataca tataaatatt aatcatatat aattaatatc    7380
aattgggtta gcaaaacaaa tctagtctag gtgtgttttg cgaatgcggc cgccaccgcg    7440
gtggagctcg aattcattcc gattaatcgt ggcctcttgc tcttcaggat gaagagctat    7500
gtttaaacgt gcaagcgcta ctagacaatt cagtacatta aaaacgtccg caatgtgtta    7560
ttaagttgtc taagcgtcaa tttgtttaca ccacaatata tcctgccacc agccagccaa    7620
cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc    7680
cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg    7740
ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg    7800
tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct    7860
cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc    7920
gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg    7980
agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta    8040
attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca    8100
tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc    8160
cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt    8220
agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg    8280
accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg    8340
gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg    8400
acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg    8460
ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa    8520
tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg    8580
tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg   8640
tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga   8700
tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt   8760
cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg   8820
tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga   8880
taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc   8940
cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg   9000
gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc   9060
gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc   9120
tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc   9180
agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat   9240
tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca   9300
acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc   9360
aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc   9420
agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt   9480
acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga   9540
gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc   9600
cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag   9660
taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca   9720
atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt   9780
tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg   9840
atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata   9900
gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg   9960
aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg  10020
taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac  10080
acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc  10140
accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct  10200
tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg  10260
ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa  10320
attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat  10380
atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg  10440
aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg  10500
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca  10560
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca  10620
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa  10680
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg  10740
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg  10800
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa  10860
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg  10920
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc  10980
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc  11040
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc  11100
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  11160
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  11220
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  11280
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc  11340
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  11400
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  11460
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  11520
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa  11580
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta  11640
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt  11700
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag  11760
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca  11820
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc  11880
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt  11940
tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca  12000
aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc  12060
tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac  12120
gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc  12180
tgtcggatca ccggaaagga cccgtaaagt gataatgatt atcatctaca tatcacaacg  12240
tgcgtggagg ccatcaaacc acgtcaaata atcaattatg acgcaggtat cgtattaatt  12300
gatctgcatc aacttaacgt aaaaacaact tcagacaata caaatcagcg acactgaata  12360
cggggcaacc tcatgtcccc cccccccccc cccctgcagg catcgtggtg tcacgctcgt  12420
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc  12480
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt  12540
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc  12600
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt  12660
gtatgcggcg accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata  12720
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga  12780
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag  12840
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa  12900
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt  12960
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga  13020
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag  13080
aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc  13140
ttcaagaatt ggtcgacgat cttgctgcgt tcggatattt tcgtggagtt cccgccacag  13200
acccggattg aaggcgagat ccagcaactc gcgccagatc atcctgtgac ggaactttgg  13260
cgcgtgatga ctggccagga cgtcggccga aagagcgaca agcagatcac gcttttcgac  13320
agcgtcggat ttgcgatcga ggatttttcg gcgctgcgct acgtccgcga ccgcgttgag  13380
ggatcaagcc acagcagccc actcgacctt ctagccgacc cagacgagcc aagggatctt  13440
tttggaatgc tgctccgtcg tcaggctttc cgacgtttgg gtggttgaac agaagtcatt  13500
atcgtacgga atgccaagca ctcccgaggg gaaccctgtg gttggcatgc acatacaaat  13560
ggacgaacgg ataaaccttt tcacgccctt ttaaatatcc gttattctaa taaacgctct  13620
tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta aactgaaggc  13680
gggaaacgac aatctgatca tgagcggaga attaagggag tcacgttatg acccccgccg  13740
atgacgcggg acaagccgtt ttacgtttgg aactgacaga accgcaacgt tgaaggagcc  13800
actcagc                                                            13807
 
<210>11
<211>4678
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>11
gaaaggccca gtcttccgac tgagcctttc gttttatttg atgcctggca gttccctact    60
ctcgcgttaa cgctagcatg gatgttttcc cagtcacgac gttgtaaaac gacggccagt   120
cttaagctcg ggcccgcgtt aacgctacca tggagctcca aataatgatt ttattttgac   180
tgatagtgac ctgttcgttg caacaaattg ataagcaatg cttttttata atgccaactt   240
tgtatagaaa agttgggccg aattcgagct cggtacggcc agaatggccc ggaccgggtt   300
accgaattcg agctcggtac cctgggatcc ctggtaatta ttggctgtag gattctaaac   360
agagcctaaa tagctggaat agctctagcc ctcaatccaa actaatgata tctatactta   420
tgcaactcta aatttttatt ctaaaagtaa tatttcattt ttgtcaacga gattctctac   480
tctattccac aatcttttga agcaatattt accttaaatc tgtactctat accaataatc   540
atatattcta ttatttattt ttatctctct cctaaggagc atccccctat gtctgcatgg   600
cccccgcctc gggtcccaat ctcttgctct gctagtagca cagaagaaaa cactagaaat   660
gacttgcttg acttagagta tcagataaac atcatgttta cttaacttta atttgtatcg   720
gtttctacta tttttataat atttttgtct ctatagatac tacgtgcaac agtataatca   780
acctagttta atccagagcg aaggattttt tactaagtac gtgactccat atgcacagcg   840
ttccttttat ggttcctcac tgggcacagc ataaacgaac cctgtccaat gttttcagcg   900
cgaacaaaca gaaattccat cagcgaacaa acaacataca tgcgagatga aaataaataa   960
taaaaaaagc tccgtctcga taggccggca cgaatcgaga gcctccatag ccagtttttt  1020
ccatcggaac ggcggttcgc gcacctaatt atatgcacca cacgcctata aagccaacca  1080
acccgtcgga ggggcgcaag ccagacagaa gacagcccgt cagcccctct cgtttttcat  1140
ccgccttcgc ctccaaccgc gtgcgctcca cgcctcctcc aggaaagcga ggatctcccc  1200
caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc  1260
tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag ttctacttct  1320
gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg  1380
gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg    1440
aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt    1500
cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt    1560
gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc    1620
ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg    1680
gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat    1740
atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc    1800
tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga    1860
tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg    1920
tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag    1980
gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat    2040
tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat    2100
tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc    2160
cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt    2220
tgtttggtgt tacttctgca ggtcgactct agaagcttgg tcacccggtc cgggcctaga    2280
aggccagctt caagtttgta caaaaaagtt gaacgagaaa cgtaaaatga tataaatatc    2340
aatatattaa attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat    2400
atgcagtcac tatgaatcaa ctacttagat ggtattagtg acctgtagaa ttcgagctct    2460
agagctgcag ggcggccgcg atatccccta tagtgagtcg tattacatgg tcatagctgt    2520
ttcctggcag ctctggcccg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa    2580
tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat    2640
gagccatatt caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt    2700
atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt    2760
gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa    2820
tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac    2880
catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg    2940
aaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc    3000
gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag    3060
cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc    3120
gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca  3180
taaacttttg ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa  3240
ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc  3300
agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt  3360
acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt  3420
tcatttgatg ctcgatgagt ttttctaatc agaattggtt aattggttgt aacactggca  3480
gagcattacg ctgacttgac gggacggcgc aagctcatga ccaaaatccc ttaacgtgag  3540
ttacgcgtcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga  3600
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt  3660
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag  3720
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa  3780
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag  3840
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca  3900
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac  3960
cgaactgaga tacctacagc gtgagcattg agaaagcgcc acgcttcccg aagggagaaa  4020
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc  4080
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg  4140
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc  4200
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc  4260
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag  4320
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa  4380
accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga  4440
ctggaaagcg ggcagtgagc gcaacgcaat taatacgcgt accgctagcc aggaagagtt  4500
tgtagaaacg caaaaaggcc atccgtcagg atggccttct gcttagtttg atgcctggca  4560
gtttatggcg ggcgtcctgc ccgccaccct ccgggccgtt gcttcacaac gttcaaatcc  4620
gctcccggcg gatttgtcct actcaggaga gcgttcaccg acaaacaaca gataaaac    4678
 
<210>12
<211>3505
<212>DNA
<213>人工序列
<220>
<223>载体
 
<400>12
gatccccggg taccgagctc gaattcggcc caagtttgta caaaaaagtt gaacgagaaa    60
cgtaaaatga tataaatatc aatatattaa attagatttt gcataaaaaa cagactacat   120
aatactgtaa aacacaacat atgcagtcac tatgaatcaa ctacttagat ggtattagtg   180
acctgtagaa ttcgagctct agagctgcag ggcggccgcg atatccccta tagtgagtcg   240
tattacatgg tcatagctgt ttcctggcag ctctggcccg tgtctcaaaa tctctgatgt   300
tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac   360
agtaatacaa ggggtgttat gagccatatt caacgggaaa cgtcgaggcc gcgattaaat   420
tccaacatgg atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca   480
ggtgcgacaa tctatcgctt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat   540
ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg   600
gaatttatgc ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta   660
ctcaccactg cgatccccgg aaaaacagca ttccaggtat tagaagaata tcctgattca   720
ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt   780
tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg   840
aataacggtt tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa   900
caagtctgga aagaaatgca taaacttttg ccattctcac cggattcagt cgtcactcat   960
ggtgatttct cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat  1020
gttggacgag tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc  1080
ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct  1140
gatatgaata aattgcagtt tcatttgatg ctcgatgagt ttttctaatc agaattggtt  1200
aattggttgt aacactggca gagcattacg ctgacttgac gggacggcgc aagctcatga  1260
ccaaaatccc ttaacgtgag ttacgcgtcg ttccactgag cgtcagaccc cgtagaaaag  1320
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa  1380
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg  1440
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag  1500
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg  1560
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga  1620
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc    1680
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagcattg agaaagcgcc    1740
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga    1800
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt    1860
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg    1920
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac    1980
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga    2040
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg    2100
gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc    2160
tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatacgcgt    2220
accgctagcc aggaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct    2280
gcttagtttg atgcctggca gtttatggcg ggcgtcctgc ccgccaccct ccgggccgtt    2340
gcttcacaac gttcaaatcc gctcccggcg gatttgtcct actcaggaga gcgttcaccg    2400
acaaacaaca gataaaacga aaggcccagt cttccgactg agcctttcgt tttatttgat    2460
gcctggcagt tccctactct cgcgttaacg ctagcatgga tgttttccca gtcacgacgt    2520
tgtaaaacga cggccagtct taagctcggg cccgcgttaa cgctaccatg gagctccaaa    2580
taatgatttt attttgactg atagtgacct gttcgttgca acaaattgat aagcaatgct    2640
tttttataat gccaactttg tatagaaaag ttgaagctta aatccttaca gaattgctgt    2700
agtttcatag tgctagatgt ggacagcaaa gcgccgctgt atgcttctgc ttttcttttt    2760
tggtgtgtgt agccacatcc tttgttcctg cccggcgcca tcccacttgg ttgttttttt    2820
ttatgattga aagccttcat gcttcctcgg tcaatcaccg gtgcgcactg ggagcatcgc    2880
cggaaaaaaa attcttcggc taagagtaac ttctttctcc ttttcttctc tgatctcgcg    2940
agcagtgctg ataacgtgtt gtaatctact tagcggtaac gagattgaga gagacaaaat    3000
gacagaacta ttgtctttat tgcagagtgt catgtattta tacaggggat acaaagtctc    3060
ccaaggggtg tgtcccttgg gagtaactgc cagttgatca caggacaata ttttgtaaca    3120
aaacgtacac atcgtcaaaa tagcgaggca tgaaactggc cttggccatg gacgcgtgaa    3180
gcgcgccatg cgttggatat gtggtcaata agtatataca atacaatgtt taacagagct    3240
gatagtactg ctttggcaca tttttgtcca cgcttcatga gagataaaac acctgcacgt    3300
aaattcacat gctgcactga aggcccgatc actgaggagc gaactgccgt aactcccttc    3360
tatatatacc cccagtccct gtttcagttt tcgtcaagct agcagcacca agttgtcgat  3420
cacttgcctg ctcttgagct cgattaagct atcatcagct acagcatccg atcccaaact  3480
gcaactgtag cagcgacaac tgccg                                        3505
 
<210>13
<211>49765
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>13
gggggggggg ggggggggtt ccattgttca ttccacggac aaaaacagag aaaggaaacg    60
acagaggcca aaaagctcgc tttcagcacc tgtcgtttcc tttcttttca gagggtattt   120
taaataaaaa cattaagtta tgacgaagaa gaacggaaac gccttaaacc ggaaaatttt   180
cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc tgtcggatca ccggaaagga   240
cccgtaaagt gataatgatt atcatctaca tatcacaacg tgcgtggagg ccatcaaacc   300
acgtcaaata atcaattatg acgcaggtat cgtattaatt gatctgcatc aacttaacgt   360
aaaaacaact tcagacaata caaatcagcg acactgaata cggggcaacc tcatgtcccc   420
cccccccccc cccctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc   480
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg   540
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc   600
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct   660
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc   720
tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc   780
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc   840
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc   900
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca   960
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt  1020
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt  1080
ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca  1140
ttaacctata aaaataggcg tatcacgagg ccctttcgtc ttcaagaatt cggagctttt  1200
gccattctca ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt  1260
tgacgagggg aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata    1320
ccaggatctt gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg    1380
gctttttcaa aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat    1440
gctcgatgag tttttctaat cagaattggt taattggttg taacactggc agagcattac    1500
gctgacttga cgggacggcg gctttgttga ataaatcgaa cttttgctga gttgaaggat    1560
cagatcacgc atcttcccga caacgcagac cgttccgtgg caaagcaaaa gttcaaaatc    1620
accaactggt ccacctacaa caaagctctc atcaaccgtg gctccctcac tttctggctg    1680
gatgatgggg cgattcaggc ctggtatgag tcagcaacac cttcttcacg aggcagacct    1740
cagcgccaga aggccgccag agaggccgag cgcggccgtg aggcttggac gctagggcag    1800
ggcatgaaaa agcccgtagc gggctgctac gggcgtctga cgcggtggaa agggggaggg    1860
gatgttgtct acatggctct gctgtagtga gtgggttgcg ctccggcagc ggtcctgatc    1920
aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac gagcctcctt ttcgccaatc    1980
catcgacaat caccgcgagt ccctgctcga acgctgcgtc cggaccggct tcgtcgaagg    2040
cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg ttcaacggtg ccgccgcgct    2100
cgccggcatc gctgtcgccg gcctgctcct caagcacggc cccaacagtg aagtagctga    2160
ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc cgcctcgcag aggaagcgaa    2220
gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg cgtgccggca tggatgcgcg    2280
cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg ggcattcccg atcagaaatg    2340
agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg attctccgcc agcatggctt    2400
cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg ccagtaaagc gccggctgct    2460
gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc gtctacgccg acctcgttca    2520
acaggtccag ggcggcacgg atcactgtat tcggctgcaa ctttgtcatg cttgacactt    2580
tatcactgat aaacataata tgtccaccaa cttatcagtg ataaagaatc cgcgcgttca    2640
atcggaccag cggaggctgg tccggaggcc agacgtgaaa cccaacatac ccctgatcgt    2700
aattctgagc actgtcgcgc tcgacgctgt cggcatcggc ctgattatgc cggtgctgcc    2760
gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc gcccactatg gcattctgct    2820
ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg ctgggcgcgc tgtcggatcg    2880
tttcgggcgg cggccaatct tgctcgtctc gctggccggc gccactgtcg actacgccat    2940
catggcgaca gcgcctttcc tttgggttct ctatatcggg cggatcgtgg ccggcatcac    3000
cggggcgact ggggcggtag ccggcgctta tattgccgat atcactgatg gcgatgagcg    3060
cgcgcggcac ttcggcttca tgagcgcctg tttcgggttc gggatggtcg cgggacctgt    3120
gctcggtggg ctgatgggcg gtttctcccc ccacgctccg ttcttcgccg cggcagcctt    3180
gaacggcctc aatttcctga cgggctgttt ccttttgccg gagtcgcaca aaggcgaacg    3240
ccggccgtta cgccgggagg ctctcaaccc gctcgcttcg ttccggtggg cccggggcat    3300
gaccgtcgtc gccgccctga tggcggtctt cttcatcatg caacttgtcg gacaggtgcc    3360
ggccgcgctt tgggtcattt tcggcgagga tcgctttcac tgggacgcga ccacgatcgg    3420
catttcgctt gccgcatttg gcattctgca ttcactcgcc caggcaatga tcaccggccc    3480
tgtagccgcc cggctcggcg aaaggcgggc actcatgctc ggaatgattg ccgacggcac    3540
aggctacatc ctgcttgcct tcgcgacacg gggatggatg gcgttcccga tcatggtcct    3600
gcttgcttcg ggtggcatcg gaatgccggc gctgcaagca atgttgtcca ggcaggtgga    3660
tgaggaacgt caggggcagc tgcaaggctc actggcggcg ctcaccagcc tgacctcgat    3720
cgtcggaccc ctcctcttca cggcgatcta tgcggcttct ataacaacgt ggaacgggtg    3780
ggcatggatt gcaggcgctg ccctctactt gctctgcctg ccggcgctgc gtcgcgggct    3840
ttggagcggc gcagggcaac gagccgatcg ctgatcgtgg aaacgatagg cctatgccat    3900
gcgggtcaag gcgacttccg gcaagctata cgcgccctag gagtgcggtt ggaacgttgg    3960
cccagccaga tactcccgat cacgagcagg acgccgatga tttgaagcgc actcagcgtc    4020
tgatccaaga acaaccatcc tagcaacacg gcggtccccg ggctgagaaa gcccagtaag    4080
gaaacaactg taggttcgag tcgcgagatc ccccggaacc aaaggaagta ggttaaaccc    4140
gctccgatca ggccgagcca cgccaggccg agaacattgg ttcctgtagg catcgggatt    4200
ggcggatcaa acactaaagc tactggaacg agcagaagtc ctccggccgc cagttgccag    4260
gcggtaaagg tgagcagagg cacgggaggt tgccacttgc gggtcagcac ggttccgaac    4320
gccatggaaa ccgcccccgc caggcccgct gcgacgccga caggatctag cgctgcgttt    4380
ggtgtcaaca ccaacagcgc cacgcccgca gttccgcaaa tagcccccag gaccgccatc    4440
aatcgtatcg ggctacctag cagagcggca gagatgaaca cgaccatcag cggctgcaca    4500
gcgcctaccg tcgccgcgac cccgcccggc aggcggtaga ccgaaataaa caacaagctc    4560
cagaatagcg aaatattaag tgcgccgagg atgaagatgc gcatccacca gattcccgtt    4620
ggaatctgtc ggacgatcat cacgagcaat aaacccgccg gcaacgcccg cagcagcata    4680
ccggcgaccc ctcggcctcg ctgttcgggc tccacgaaaa cgccggacag atgcgccttg    4740
tgagcgtcct tggggccgtc ctcctgtttg aagaccgaca gcccaatgat ctcgccgtcg    4800
atgtaggcgc cgaatgccac ggcatctcgc aaccgttcag cgaacgcctc catgggcttt    4860
ttctcctcgt gctcgtaaac ggacccgaac atctctggag ctttcttcag ggccgacaat    4920
cggatctcgc ggaaatcctg cacgtcggcc gctccaagcc gtcgaatctg agccttaatc    4980
acaattgtca attttaatcc tctgtttatc ggcagttcgt agagcgcgcc gtgcgtcccg    5040
agcgatactg agcgaagcaa gtgcgtcgag cagtgcccgc ttgttcctga aatgccagta    5100
aagcgctggc tgctgaaccc ccagccggaa ctgaccccac aaggccctag cgtttgcaat    5160
gcaccaggtc atcattgacc caggcgtgtt ccaccaggcc gctgcctcgc aactcttcgc    5220
aggcttcgcc gacctgctcg cgccacttct tcacgcgggt ggaatccgat ccgcacatga    5280
ggcggaaggt ttccagcttg agcgggtacg gctcccggtg cgagctgaaa tagtcgaaca    5340
tccgtcgggc cgtcggcgac agcttgcggt acttctccca tatgaatttc gtgtagtggt    5400
cgccagcaaa cagcacgacg atttcctcgt cgatcaggac ctggcaacgg gacgttttct    5460
tgccacggtc caggacgcgg aagcggtgca gcagcgacac cgattccagg tgcccaacgc    5520
ggtcggacgt gaagcccatc gccgtcgcct gtaggcgcga caggcattcc tcggccttcg    5580
tgtaataccg gccattgatc gaccagccca ggtcctggca aagctcgtag aacgtgaagg    5640
tgatcggctc gccgataggg gtgcgcttcg cgtactccaa cacctgctgc cacaccagtt    5700
cgtcatcgtc ggcccgcagc tcgacgccgg tgtaggtgat cttcacgtcc ttgttgacgt    5760
ggaaaatgac cttgttttgc agcgcctcgc gcgggatttt cttgttgcgc gtggtgaaca    5820
gggcagagcg ggccgtgtcg tttggcatcg ctcgcatcgt gtccggccac ggcgcaatat    5880
cgaacaagga aagctgcatt tccttgatct gctgcttcgt gtgtttcagc aacgcggcct    5940
gcttggcctc gctgacctgt tttgccaggt cctcgccggc ggtttttcgc ttcttggtcg    6000
tcatagttcc tcgcgtgtcg atggtcatcg acttcgccaa acctgccgcc tcctgttcga    6060
gacgacgcga acgctccacg gcggccgatg gcgcgggcag ggcaggggga gccagttgca    6120
cgctgtcgcg ctcgatcttg gccgtagctt gctggaccat cgagccgacg gactggaagg    6180
tttcgcgggg cgcacgcatg acggtgcggc ttgcgatggt ttcggcatcc tcggcggaaa    6240
accccgcgtc gatcagttct tgcctgtatg ccttccggtc aaacgtccga ttcattcacc    6300
ctccttgcgg gattgccccg actcacgccg gggcaatgtg cccttattcc tgatttgacc    6360
cgcctggtgc cttggtgtcc agataatcca ccttatcggc aatgaagtcg gtcccgtaga    6420
ccgtctggcc gtccttctcg tacttggtat tccgaatctt gccctgcacg aataccagcg    6480
accccttgcc caaatacttg ccgtgggcct cggcctgaga gccaaaacac ttgatgcgga    6540
agaagtcggt gcgctcctgc ttgtcgccgg catcgttgcg ccactcttca ttaaccgcta    6600
tatcgaaaat tgcttgcggc ttgttagaat tgccatgacg tacctcggtg tcacgggtaa    6660
gattaccgat aaactggaac tgattatggc tcatatcgaa agtctccttg agaaaggaga    6720
ctctagttta gctaaacatt ggttccgctg tcaagaactt tagcggctaa aattttgcgg    6780
gccgcgacca aaggtgcgag gggcggcttc cgctgtgtac aaccagatat ttttcaccaa    6840
catccttcgt ctgctcgatg agcggggcat gacgaaacat gagctgtcgg agagggcagg    6900
ggtttcaatt tcgtttttat cagacttaac caacggtaag gccaacccct cgttgaaggt    6960
gatggaggcc attgccgacg ccctggaaac tcccctacct cttctcctgg agtccaccga    7020
ccttgaccgc gaggcactcg cggagattgc gggtcatcct ttcaagagca gcgtgccgcc    7080
cggatacgaa cgcatcagtg tggttttgcc gtcacataag gcgtttatcg taaagaaatg    7140
gggcgacgac acccgaaaaa agctgcgtgg aaggctctga cgccaagggt tagggcttgc    7200
acttccttct ttagccgcta aaacggcccc ttctctgcgg gccgtcggct cgcgcatcat    7260
atcgacatcc tcaacggaag ccgtgccgcg aatggcatcg ggcgggtgcg ctttgacagt    7320
tgttttctat cagaacccct acgtcgtgcg gttcgattag ctgtttgtct tgcaggctaa    7380
acactttcgg tatatcgttt gcctgtgcga taatgttgct aatgatttgt tgcgtagggg    7440
ttactgaaaa gtgagcggga aagaagagtt tcagaccatc aaggagcggg ccaagcgcaa    7500
gctggaacgc gacatgggtg cggacctgtt ggccgcgctc aacgacccga aaaccgttga    7560
agtcatgctc aacgcggacg gcaaggtgtg gcacgaacgc cttggcgagc cgatgcggta    7620
catctgcgac atgcggccca gccagtcgca ggcgattata gaaacggtgg ccggattcca    7680
cggcaaagag gtcacgcggc attcgcccat cctggaaggc gagttcccct tggatggcag    7740
ccgctttgcc ggccaattgc cgccggtcgt ggccgcgcca acctttgcga tccgcaagcg    7800
cgcggtcgcc atcttcacgc tggaacagta cgtcgaggcg ggcatcatga cccgcgagca    7860
atacgaggtc attaaaagcg ccgtcgcggc gcatcgaaac atcctcgtca ttggcggtac    7920
tggctcgggc aagaccacgc tcgtcaacgc gatcatcaat gaaatggtcg ccttcaaccc    7980
gtctgagcgc gtcgtcatca tcgaggacac cggcgaaatc cagtgcgccg cagagaacgc    8040
cgtccaatac cacaccagca tcgacgtctc gatgacgctg ctgctcaaga caacgctgcg    8100
tatgcgcccc gaccgcatcc tggtcggtga ggtacgtggc cccgaagccc ttgatctgtt    8160
gatggcctgg aacaccgggc atgaaggagg tgccgccacc ctgcacgcaa acaaccccaa    8220
agcgggcctg agccggctcg ccatgcttat cagcatgcac ccggattcac cgaaacccat    8280
tgagccgctg attggcgagg cggttcatgt ggtcgtccat atcgccagga cccctagcgg    8340
ccgtcgagtg caagaaattc tcgaagttct tggttacgag aacggccagt acatcaccaa    8400
aaccctgtaa ggagtatttc caatgacaac ggctgttccg ttccgtctga ccatgaatcg    8460
cggcattttg ttctaccttg ccgtgttctt cgttctcgct ctcgcgttat ccgcgcatcc    8520
ggcgatggcc tcggaaggca ccggcggcag cttgccatat gagagctggc tgacgaacct    8580
gcgcaactcc gtaaccggcc cggtggcctt cgcgctgtcc atcatcggca tcgtcgtcgc    8640
cggcggcgtg ctgatcttcg gcggcgaact caacgccttc ttccgaaccc tgatcttcct    8700
ggttctggtg atggcgctgc tggtcggcgc gcagaacgtg atgagcacct tcttcggtcg    8760
tggtgccgaa atcgcggccc tcggcaacgg ggcgctgcac caggtgcaag tcgcggcggc    8820
ggatgccgtg cgtgcggtag cggctggacg gctcgcctaa tcatggctct gcgcacgatc    8880
cccatccgtc gcgcaggcaa ccgagaaaac ctgttcatgg gtggtgatcg tgaactggtg    8940
atgttctcgg gcctgatggc gtttgcgctg attttcagcg cccaagagct gcgggccacc    9000
gtggtcggtc tgatcctgtg gttcggggcg ctctatgcgt tccgaatcat ggcgaaggcc    9060
gatccgaaga tgcggttcgt gtacctgcgt caccgccggt acaagccgta ttacccggcc    9120
cgctcgaccc cgttccgcga gaacaccaat agccaaggga agcaataccg atgatccaag    9180
caattgcgat tgcaatcgcg ggcctcggcg cgcttctgtt gttcatcctc tttgcccgca    9240
tccgcgcggt cgatgccgaa ctgaaactga aaaagcatcg ttccaaggac gccggcctgg    9300
ccgatctgct caactacgcc gctgtcgtcg atgacggcgt aatcgtgggc aagaacggca    9360
gctttatggc tgcctggctg tacaagggcg atgacaacgc aagcagcacc gaccagcagc    9420
gcgaagtagt gtccgcccgc atcaaccagg ccctcgcggg cctgggaagt gggtggatga    9480
tccatgtgga cgccgtgcgg cgtcctgctc cgaactacgc ggagcggggc ctgtcggcgt    9540
tccctgaccg tctgacggca gcgattgaag aagagcgctc ggtcttgcct tgctcgtcgg    9600
tgatgtactt caccagctcc gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct    9660
tggcaatcac gcgcaccccc cggccgtttt agcggctaaa aaagtcatgg ctctgccctc    9720
gggcggacca cgcccatcat gaccttgcca agctcgtcct gcttctcttc gatcttcgcc    9780
agcagggcga ggatcgtggc atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag    9840
agtttcagca ggccgcccag gcggcccagg tcgccattga tgcgggccag ctcgcggacg    9900
tgctcatagt ccacgacgcc cgtgattttg tagccctggc cgacggccag caggtaggcc    9960
gacaggctca tgccggccgc cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg  10020
cagtacacct tgataggtgg gctgcccttc ctggttggct tggtttcatc agccatccgc  10080
ttgccctcat ctgttacgcc ggcggtagcc ggccagcctc gcagagcagg attcccgttg  10140
agcaccgcca ggtgcgaata agggacagtg aagaaggaac acccgctcgc gggtgggcct  10200
acttcaccta tcctgcccgg ctgacgccgt tggatacacc aaggaaagtc tacacgaacc  10260
ctttggcaaa atcctgtata tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata  10320
atgaccccga agcagggtta tgcagcggaa aagcgctgct tccctgctgt tttgtggaat  10380
atctaccgac tggaaacagg caaatgcagg aaattactga actgagggga caggcgagag  10440
acgatgccaa agagctacac cgacgagctg gccgagtggg ttgaatcccg cgcggccaag  10500
aagcgccggc gtgatgaggc tgcggttgcg ttcctggcgg tgagggcgga tgtcgaggcg  10560
gcgttagcgt ccggctatgc gctcgtcacc atttgggagc acatgcggga aacggggaag  10620
gtcaagttct cctacgagac gttccgctcg cacgccaggc ggcacatcaa ggccaagccc  10680
gccgatgtgc ccgcaccgca ggccaaggct gcggaacccg cgccggcacc caagacgccg  10740
gagccacggc ggccgaagca ggggggcaag gctgaaaagc cggcccccgc tgcggccccg  10800
accggcttca ccttcaaccc aacaccggac aaaaaggatc tactgtaatg gcgaaaattc  10860
acatggtttt gcagggcaag ggcggggtcg gcaagtcggc catcgccgcg atcattgcgc  10920
agtacaagat ggacaagggg cagacaccct tgtgcatcga caccgacccg gtgaacgcga  10980
cgttcgaggg ctacaaggcc ctgaacgtcc gccggctgaa catcatggcc ggcgacgaaa  11040
ttaactcgcg caacttcgac accctggtcg agctgattgc gccgaccaag gatgacgtgg  11100
tgatcgacaa cggtgccagc tcgttcgtgc ctctgtcgca ttacctcatc agcaaccagg  11160
tgccggctct gctgcaagaa atggggcatg agctggtcat ccataccgtc gtcaccggcg  11220
gccaggctct cctggacacg gtgagcggct tcgcccagct cgccagccag ttcccggccg  11280
aagcgctttt cgtggtctgg ctgaacccgt attgggggcc tatcgagcat gagggcaaga  11340
gctttgagca gatgaaggcg tacacggcca acaaggcccg cgtgtcgtcc atcatccaga  11400
ttccggccct caaggaagaa acctacggcc gcgatttcag cgacatgctg caagagcggc  11460
tgacgttcga ccaggcgctg gccgatgaat cgctcacgat catgacgcgg caacgcctca  11520
agatcgtgcg gcgcggcctg tttgaacagc tcgacgcggc ggccgtgcta tgagcgacca  11580
gattgaagag ctgatccggg agattgcggc caagcacggc atcgccgtcg gccgcgacga  11640
cccggtgctg atcctgcata ccatcaacgc ccggctcatg gccgacagtg cggccaagca  11700
agaggaaatc cttgccgcgt tcaaggaaga gctggaaggg atcgcccatc gttggggcga  11760
ggacgccaag gccaaagcgg agcggatgct gaacgcggcc ctggcggcca gcaaggacgc  11820
aatggcgaag gtaatgaagg acagcgccgc gcaggcggcc gaagcgatcc gcagggaaat  11880
cgacgacggc cttggccgcc agctcgcggc caaggtcgcg gacgcgcggc gcgtggcgat  11940
gatgaacatg atcgccggcg gcatggtgtt gttcgcggcc gccctggtgg tgtgggcctc  12000
gttatgaatc gcagaggcgc agatgaaaaa gcccggcgtt gccgggcttt gtttttgcgt  12060
tagctgggct tgtttgacag gcccaagctc tgactgcgcc cgcgctcgcg ctcctgggcc  12120
tgtttcttct cctgctcctg cttgcgcatc agggcctggt gccgtcgggc tgcttcacgc  12180
atcgaatccc agtcgccggc cagctcggga tgctccgcgc gcatcttgcg cgtcgccagt  12240
tcctcgatct tgggcgcgtg aatgcccatg ccttccttga tttcgcgcac catgtccagc  12300
cgcgtgtgca gggtctgcaa gcgggcttgc tgttgggcct gctgctgctg ccaggcggcc  12360
tttgtacgcg gcagggacag caagccgggg gcattggact gtagctgctg caaacgcgcc  12420
tgctgacggt ctacgagctg ttctaggcgg tcctcgatgc gctccacctg gtcatgcttt  12480
gcctgcacgt agagcgcaag ggtctgctgg taggtctgct cgatgggcgc ggattctaag  12540
agggcctgct gttccgtctc ggcctcctgg gccgcctgta gcaaatcctc gccgctgttg  12600
ccgctggact gctttactgc cggggactgc tgttgccctg ctcgcgccgt cgtcgcagtt  12660
cggcttgccc ccactcgatt gactgcttca tttcgagccg cagcgatgcg atctcggatt  12720
gcgtcaacgg acggggcagc gcggaggtgt ccggcttctc cttgggtgag tcggtcgatg  12780
ccatagccaa aggtttcctt ccaaaatgcg tccattgctg gaccgtgttt ctcattgatg  12840
cccgcaagca tcttcggctt gaccgccagg tcaagcgcgc cttcatgggc ggtcatgacg  12900
gacgccgcca tgaccttgcc gccgttgttc tcgatgtagc cgcgtaatga ggcaatggtg  12960
ccgcccatcg tcagcgtgtc atcgacaacg atgtacttct ggccggggat cacctccccc  13020
tcgaaagtcg ggttgaacgc caggcgatga tctgaaccgg ctccggttcg ggcgaccttc  13080
tcccgctgca caatgtccgt ttcgacctca aggccaaggc ggtcggccag aacgaccgcc  13140
atcatggccg gaatcttgtt gttccccgcc gcctcgacgg cgaggactgg aacgatgcgg  13200
ggcttgtcgt cgccgatcag cgtcttgagc tgggcaacag tgtcgtccga aatcaggcgc  13260
tcgaccaaat taagcgccgc ttccgcgtcg ccctgcttcg cagcctggta ttcaggctcg  13320
ttggtcaaag aaccaaggtc gccgttgcga accaccttcg ggaagtctcc ccacggtgcg  13380
cgctcggctc tgctgtagct gctcaagacg cctccctttt tagccgctaa aactctaacg  13440
agtgcgcccg cgactcaact tgacgctttc ggcacttacc tgtgccttgc cacttgcgtc  13500
ataggtgatg cttttcgcac tcccgatttc aggtacttta tcgaaatctg accgggcgtg  13560
cattacaaag ttcttcccca cctgttggta aatgctgccg ctatctgcgt ggacgatgct  13620
gccgtcgtgg cgctgcgact tatcggcctt ttgggccata tagatgttgt aaatgccagg  13680
tttcagggcc ccggctttat ctaccttctg gttcgtccat gcgccttggt tctcggtctg  13740
gacaattctt tgcccattca tgaccaggag gcggtgtttc attgggtgac tcctgacggt  13800
tgcctctggt gttaaacgtg tcctggtcgc ttgccggcta aaaaaaagcc gacctcggca  13860
gttcgaggcc ggctttccct agagccgggc gcgtcaaggt tgttccatct attttagtga  13920
actgcgttcg atttatcagt tactttcctc ccgctttgtg tttcctccca ctcgtttccg  13980
cgtctagccg acccctcaac atagcggcct cttcttgggc tgcctttgcc tcttgccgcg  14040
cttcgtcacg ctcggcttgc accgtcgtaa agcgctcggc ctgcctggcc gcctcttgcg  14100
ccgccaactt cctttgctcc tggtgggcct cggcgtcggc ctgcgccttc gctttcaccg  14160
ctgccaactc cgtgcgcaaa ctctccgctt cgcgcctggt ggcgtcgcgc tcgccgcgaa  14220
gcgcctgcat ttcctggttg gccgcgtcca gggtcttgcg gctctcttct ttgaatgcgc  14280
gggcgtcctg gtgagcgtag tccagctcgg cgcgcagctc ctgcgctcga cgctccacct  14340
cgtcggcccg ctgcgtcgcc agcgcggccc gctgctcggc tcctgccagg gcggtgcgtg  14400
cttcggccag ggcttgccgc tggcgtgcgg ccagctcggc cgcctcggcg gcctgctgct  14460
ctagcaatgt aacgcgcgcc tgggcttctt ccagctcgcg ggcctgcgcc tcgaaggcgt  14520
cggccagctc cccgcgcacg gcttccaact cgttgcgctc acgatcccag ccggcttgcg  14580
ctgcctgcaa cgattcattg gcaagggcct gggcggcttg ccagagggcg gccacggcct  14640
ggttgccggc ctgctgcacc gcgtccggca cctggactgc cagcggggcg gcctgcgccg  14700
tgcgctggcg tcgccattcg cgcatgccgg cgctggcgtc gttcatgttg acgcgggcgg  14760
ccttacgcac tgcatccacg gtcgggaagt tctcccggtc gccttgctcg aacagctcgt  14820
ccgcagccgc aaaaatgcgg tcgcgcgtct ctttgttcag ttccatgttg gctccggtaa  14880
ttggtaagaa taataatact cttacctacc ttatcagcgc aagagtttag ctgaacagtt  14940
ctcgacttaa cggcaggttt tttagcggct gaagggcagg caaaaaaagc cccgcacggt  15000
cggcgggggc aaagggtcag cgggaagggg attagcgggc gtcgggcttc ttcatgcgtc  15060
ggggccgcgc ttcttgggat ggagcacgac gaagcgcgca cgcgcatcgt cctcggccct  15120
atcggcccgc gtcgcggtca ggaacttgtc gcgcgctagg tcctccctgg tgggcaccag  15180
gggcatgaac tcggcctgct cgatgtaggt ccactccatg accgcatcgc agtcgaggcc  15240
gcgttccttc accgtctctt gcaggtcgcg gtacgcccgc tcgttgagcg gctggtaacg  15300
ggccaattgg tcgtaaatgg ctgtcggcca tgagcggcct ttcctgttga gccagcagcc  15360
gacgacgaag ccggcaatgc aggcccctgg cacaaccagg ccgacgccgg gggcagggga  15420
tggcagcagc tcgccaacca ggaaccccgc cgcgatgatg ccgatgccgg tcaaccagcc  15480
cttgaaacta tccggccccg aaacacccct gcgcattgcc tggatgctgc gccggatagc  15540
ttgcaacatc aggagccgtt tcttttgttc gtcagtcatg gtccgccctc accagttgtt  15600
cgtatcggtg tcggacgaac tgaaatcgca agagctgccg gtatcggtcc agccgctgtc  15660
cgtgtcgctg ctgccgaagc acggcgaggg gtccgcgaac gccgcagacg gcgtatccgg  15720
ccgcagcgca tcgcccagca tggccccggt cagcgagccg ccggccaggt agcccagcat  15780
ggtgctgttg gtcgccccgg ccaccagggc cgacgtgacg aaatcgccgt cattccctct  15840
ggattgttcg ctgctcggcg gggcagtgcg ccgcgccggc ggcgtcgtgg atggctcggg  15900
ttggctggcc tgcgacggcc ggcgaaaggt gcgcagcagc tcgttatcga ccggctgcgg  15960
cgtcggggcc gccgccttgc gctgcggtcg gtgttccttc ttcggctcgc gcagcttgaa  16020
cagcatgatc gcggaaacca gcagcaacgc cgcgcctacg cctcccgcga tgtagaacag  16080
catcggattc attcttcggt cctccttgta gcggaaccgt tgtctgtgcg gcgcgggtgg  16140
cccgcgccgc tgtctttggg gatcagccct cgatgagcgc gaccagtttc acgtcggcaa  16200
ggttcgcctc gaactcctgg ccgtcgtcct cgtacttcaa ccaggcatag ccttccgccg  16260
gcggccgacg gttgaggata aggcgggcag ggcgctcgtc gtgctcgacc tggacgatgg  16320
cctttttcag cttgtccggg tccggctcct tcgcgccctt ttccttggcg tccttaccgt  16380
cctggtcgcc gtcctcgccg tcctggccgt cgccggcctc cgcgtcacgc tcggcatcag  16440
tctggccgtt gaaggcatcg acggtgttgg gatcgcggcc cttctcgtcc aggaactcgc  16500
gcagcagctt gaccgtgccg cgcgtgattt cctgggtgtc gtcgtcaagc cacgcctcga  16560
cttcctccgg gcgcttcttg aaggccgtca ccagctcgtt caccacggtc acgtcgcgca  16620
cgcggccggt gttgaacgca tcggcgatct tctccggcag gtccagcagc gtgacgtgct  16680
gggtgatgaa cgccggcgac ttgccgattt ccttggcgat atcgcctttc ttcttgccct  16740
tcgccagctc gcggccaatg aagtcggcaa tttcgcgcgg ggtcagctcg ttgcgttgca  16800
ggttctcgat aacctggtcg gcttcgttgt agtcgttgtc gatgaacgcc gggatggact  16860
tcttgccggc ccacttcgag ccacggtagc ggcgggcgcc gtgattgatg atatagcggc  16920
ccggctgctc ctggttctcg cgcaccgaaa tgggtgactt caccccgcgc tctttgatcg  16980
tggcaccgat ttccgcgatg ctctccgggg aaaagccggg gttgtcggcc gtccgcggct  17040
gatgcggatc ttcgtcgatc aggtccaggt ccagctcgat agggccggaa ccgccctgag  17100
acgccgcagg agcgtccagg aggctcgaca ggtcgccgat gctatccaac cccaggccgg  17160
acggctgcgc cgcgcctgcg gcttcctgag cggccgcagc ggtgtttttc ttggtggtct  17220
tggcttgagc cgcagtcatt gggaaatctc catcttcgtg aacacgtaat cagccagggc  17280
gcgaacctct ttcgatgcct tgcgcgcggc cgttttcttg atcttccaga ccggcacacc  17340
ggatgcgagg gcatcggcga tgctgctgcg caggccaacg gtggccggaa tcatcatctt  17400
ggggtacgcg gccagcagct cggcttggtg gcgcgcgtgg cgcggattcc gcgcatcgac  17460
cttgctgggc accatgccaa ggaattgcag cttggcgttc ttctggcgca cgttcgcaat  17520
ggtcgtgacc atcttcttga tgccctggat gctgtacgcc tcaagctcga tgggggacag  17580
cacatagtcg gccgcgaaga gggcggccgc caggccgacg ccaagggtcg gggccgtgtc  17640
gatcaggcac acgtcgaagc cttggttcgc cagggccttg atgttcgccc cgaacagctc  17700
gcgggcgtcg tccagcgaca gccgttcggc gttcgccagt accgggttgg actcgatgag  17760
ggcgaggcgc gcggcctggc cgtcgccggc tgcgggtgcg gtttcggtcc agccgccggc  17820
agggacagcg ccgaacagct tgcttgcatg caggccggta gcaaagtcct tgagcgtgta  17880
ggacgcattg ccctgggggt ccaggtcgat cacggcaacc cgcaagccgc gctcgaaaaa  17940
gtcgaaggca agatgcacaa gggtcgaagt cttgccgacg ccgcctttct ggttggccgt  18000
gaccaaagtt ttcatcgttt ggtttcctgt tttttcttgg cgtccgcttc ccacttccgg  18060
acgatgtacg cctgatgttc cggcagaacc gccgttaccc gcgcgtaccc ctcgggcaag  18120
ttcttgtcct cgaacgcggc ccacacgcga tgcaccgctt gcgacactgc gcccctggtc  18180
agtcccagcg acgttgcgaa cgtcgcctgt ggcttcccat cgactaagac gccccgcgct  18240
atctcgatgg tctgctgccc cacttccagc ccctggatcg cctcctggaa ctggctttcg  18300
gtaagccgtt tcttcatgga taacacccat aatttgctcc gcgccttggt tgaacatagc  18360
ggtgacagcc gccagcacat gagagaagtt tagctaaaca tttctcgcac gtcaacacct  18420
ttagccgcta aaactcgtcc ttggcgtaac aaaacaaaag cccggaaacc gggctttcgt  18480
ctcttgccgc ttatggctct gcacccggct ccatcaccaa caggtcgcgc acgcgcttca  18540
ctcggttgcg gatcgacact gccagcccaa caaagccggt tgccgccgcc gccaggatcg  18600
cgccgatgat gccggccaca ccggccatcg cccaccaggt cgccgccttc cggttccatt  18660
cctgctggta ctgcttcgca atgctggacc tcggctcacc ataggctgac cgctcgatgg  18720
cgtatgccgc ttctcccctt ggcgtaaaac ccagcgccgc aggcggcatt gccatgctgc  18780
ccgccgcttt cccgaccacg acgcgcgcac caggcttgcg gtccagacct tcggccacgg  18840
cgagctgcgc aaggacataa tcagccgccg acttggctcc acgcgcctcg atcagctctt  18900
gcactcgcgc gaaatccttg gcctccacgg ccgccatgaa tcgcgcacgc ggcgaaggct  18960
ccgcagggcc ggcgtcgtga tcgccgccga gaatgccctt caccaagttc gacgacacga  19020
aaatcatgct gacggctatc accatcatgc agacggatcg cacgaacccg ctgaattgaa  19080
cacgagcacg gcacccgcga ccactatgcc aagaatgccc aaggtaaaaa ttgccggccc  19140
cgccatgaag tccgtgaatg ccccgacggc cgaagtgaag ggcaggccgc cacccaggcc  19200
gccgccctca ctgcccggca cctggtcgct gaatgtcgat gccagcacct gcggcacgtc  19260
aatgcttccg ggcgtcgcgc tcgggctgat cgcccatccc gttactgccc cgatcccggc  19320
aatggcaagg actgccagcg ctgccatttt tggggtgagg ccgttcgcgg ccgaggggcg  19380
cagcccctgg ggggatggga ggcccgcgtt agcgggccgg gagggttcga gaaggggggg  19440
cacccccctt cggcgtgcgc ggtcacgcgc acagggcgca gccctggtta aaaacaaggt  19500
ttataaatat tggtttaaaa gcaggttaaa agacaggtta gcggtggccg aaaaacgggc  19560
ggaaaccctt gcaaatgctg gattttctgc ctgtggacag cccctcaaat gtcaataggt  19620
gcgcccctca tctgtcagca ctctgcccct caagtgtcaa ggatcgcgcc cctcatctgt  19680
cagtagtcgc gcccctcaag tgtcaatacc gcagggcact tatccccagg cttgtccaca  19740
tcatctgtgg gaaactcgcg taaaatcagg cgttttcgcc gatttgcgag gctggccagc  19800
tccacgtcgc cggccgaaat cgagcctgcc cctcatctgt caacgccgcg ccgggtgagt  19860
cggcccctca agtgtcaacg tccgcccctc atctgtcagt gagggccaag ttttccgcga  19920
ggtatccaca acgccggcgg ccgcggtgtc tcgcacacgg cttcgacggc gtttctggcg  19980
cgtttgcagg gccatagacg gccgccagcc cagcggcgag ggcaaccagc ccggtgagcg  20040
tcggaaaggc gctggaagcc ccgtagcgac gcggagaggg gcgagacaag ccaagggcgc  20100
aggctcgatg cgcagcacga catagccggt tctcgcaagg acgagaattt ccctgcggtg  20160
cccctcaagt gtcaatgaaa gtttccaacg cgagccattc gcgagagcct tgagtccacg  20220
ctagatgaga gctttgttgt aggtggacca gttggtgatt ttgaactttt gctttgccac  20280
ggaacggtct gcgttgtcgg gaagatgcgt gatctgatcc ttcaactcag caaaagttcg  20340
atttattcaa caaagccacg ttgtgtctca aaatctctga tgttacattg cacaagataa  20400
aaatatatca tcatgaacaa taaaactgtc tgcttacata aacagtaata caaggggtgt  20460
tatgagccat attcaacggg aaacgtcttg ctcgactcta gagctcgttc ctcgaggcct  20520
cgaggcctcg aggaacggta cctgcgggga agcttacaat aatgtgtgtt gttaagtctt  20580
gttgcctgtc atcgtctgac tgactttcgt cataaatccc ggcctccgta acccagcttt  20640
gggcaagctc acggatttga tccggcggaa cgggaatatc gagatgccgg gctgaacgct  20700
gcagttccag ctttcccttt cgggacaggt actccagctg attgattatc tgctgaaggg  20760
tcttggttcc acctcctggc acaatgcgaa tgattacttg agcgcgatcg ggcatccaat  20820
tttctcccgt caggtgcgtg gtcaagtgct acaaggcacc tttcagtaac gagcgaccgt  20880
cgatccgtcg ccgggatacg gacaaaatgg agcgcagtag tccatcgagg gcggcgaaag  20940
cctcgccaaa agcaatacgt tcatctcgca cagcctccag atccgatcga gggtcttcgg  21000
cgtaggcaga tagaagcatg gatacattgc ttgagagtat tccgatggac tgaagtatgg  21060
cttccatctt ttctcgtgtg tctgcatcta tttcgagaaa gcccccgatg cggcgcaccg  21120
caacgcgaat tgccatacta tccgaaagtc ccagcaggcg cgcttgatag gaaaaggttt  21180
catactcggc cgatcgcaga cgggcactca cgaccttgaa cccttcaact ttcagggatc  21240
gatgctggtt gatggtagtc tcactcgacg tggctctggt gtgttttgac atagcttcct  21300
ccaaagaaag cggaaggtct ggatactcca gcacgaaatg tgcccgggta gacggatgga  21360
agtctagccc tgctcaatat gaaatcaaca gtacatttac agtcaatact gaatatactt  21420
gctacatttg caattgtctt ataacgaatg tgaaataaaa atagtgtaac aacgctttta  21480
ctcatcgata atcacaaaaa catttatacg aacaaaaata caaatgcact ccggtttcac  21540
aggataggcg ggatcagaat atgcaacttt tgacgttttg ttctttcaaa gggggtgctg  21600
gcaaaaccac cgcactcatg ggcctttgcg ctgctttggc aaatgacggt aaacgagtgg  21660
ccctctttga tgccgacgaa aaccggcctc tgacgcgatg gagagaaaac gccttacaaa  21720
gcagtactgg gatcctcgct gtgaagtcta ttccgccgac gaaatgcccc ttcttgaagc  21780
agcctatgaa aatgccgagc tcgaaggatt tgattatgcg ttggccgata cgcgtggcgg  21840
ctcgagcgag ctcaacaaca caatcatcgc tagctcaaac ctgcttctga tccccaccat  21900
gctaacgccg ctcgacatcg atgaggcact atctacctac cgctacgtca tcgagctgct  21960
gttgagtgaa aatttggcaa ttcctacagc tgttttgcgc caacgcgtcc cggtcggccg  22020
attgacaaca tcgcaacgca ggatgtcaga gacgctagag agccttccag ttgtaccgtc  22080
tcccatgcat gaaagagatg catttgccgc gatgaaagaa cgcggcatgt tgcatcttac  22140
attactaaac acgggaactg atccgacgat gcgcctcata gagaggaatc ttcggattgc  22200
gatggaggaa gtcgtggtca tttcgaaact gatcagcaaa atcttggagg cttgaagatg  22260
gcaattcgca agcccgcatt gtcggtcggc gaagcacggc ggcttgctgg tgctcgaccc  22320
gagatccacc atcccaaccc gacacttgtt ccccagaagc tggacctcca gcacttgcct  22380
gaaaaagccg acgagaaaga ccagcaacgt gagcctctcg tcgccgatca catttacagt  22440
cccgatcgac aacttaagct aactgtggat gcccttagtc cacctccgtc cccgaaaaag  22500
ctccaggttt ttctttcagc gcgaccgccc gcgcctcaag tgtcgaaaac atatgacaac  22560
ctcgttcggc aatacagtcc ctcgaagtcg ctacaaatga ttttaaggcg cgcgttggac  22620
gatttcgaaa gcatgctggc agatggatca tttcgcgtgg ccccgaaaag ttatccgatc  22680
ccttcaacta cagaaaaatc cgttctcgtt cagacctcac gcatgttccc ggttgcgttg  22740
ctcgaggtcg ctcgaagtca ttttgatccg ttggggttgg agaccgctcg agctttcggc  22800
cacaagctgg ctaccgccgc gctcgcgtca ttctttgctg gagagaagcc atcgagcaat  22860
tggtgaagag ggacctatcg gaacccctca ccaaatattg agtgtaggtt tgaggccgct  22920
ggccgcgtcc tcagtcacct tttgagccag ataattaaga gccaaatgca attggctcag  22980
gctgccatcg tccccccgtg cgaaacctgc acgtccgcgt caaagaaata accggcacct  23040
cttgctgttt ttatcagttg agggcttgac ggatccgcct caagtttgcg gcgcagccgc  23100
aaaatgagaa catctatact cctgtcgtaa acctcctcgt cgcgtactcg actggcaatg  23160
agaagttgct cgcgcgatag aacgtcgcgg ggtttctcta aaaacgcgag gagaagattg  23220
aactcacctg ccgtaagttt cacctcaccg ccagcttcgg acatcaagcg acgttgcctg  23280
agattaagtg tccagtcagt aaaacaaaaa gaccgtcggt ctttggagcg gacaacgttg  23340
gggcgcacgc gcaaggcaac ccgaatgcgt gcaagaaact ctctcgtact aaacggctta  23400
gcgataaaat cacttgctcc tagctcgagt gcaacaactt tatccgtctc ctcaaggcgg  23460
tcgccactga taattatgat tggaatatca gactttgccg ccagatttcg aacgatctca  23520
agcccatctt cacgacctaa atttagatca acaaccacga catcgaccgt cgcggaagag  23580
agtactctag tgaactgggt gctgtcggct accgcggtca ctttgaaggc gtggatcgta  23640
aggtattcga taataagatg ccgcatagcg acatcgtcat cgataagaag aacgtgtttc  23700
aacggctcac ctttcaatct aaaatctgaa cccttgttca cagcgcttga gaaattttca  23760
cgtgaaggat gtacaatcat ctccagctaa atgggcagtt cgtcagaatt gcggctgacc  23820
gcggatgacg aaaatgcgaa ccaagtattt caattttatg acaaaagttc tcaatcgttg  23880
ttacaagtga aacgcttcga ggttacagct actattgatt aaggagatcg cctatggtct  23940
cgccccggcg tcgtgcgtcc gccgcgagcc agatctcgcc tacttcataa acgtcctcat  24000
aggcacggaa tggaatgatg acatcgatcg ccgtagagag catgtcaatc agtgtgcgat  24060
cttccaagct agcaccttgg gcgctacttt tgacaaggga aaacagtttc ttgaatcctt  24120
ggattggatt cgcgccgtgt attgttgaaa tcgatcccgg atgtcccgag acgacttcac  24180
tcagataagc ccatgctgca tcgtcgcgca tctcgccaag caatatccgg tccggccgca  24240
tacgcagact tgcttggagc aagtgctcgg cgctcacagc acccagccca gcaccgttct  24300
tggagtagag tagtctaaca tgattatcgt gtggaatgac gagttcgagc gtatcttcta  24360
tggtgattag cctttcctgg ggggggatgg cgctgatcaa ggtcttgctc attgttgtct  24420
tgccgcttcc ggtagggcca catagcaaca tcgtcagtcg gctgacgacg catgcgtgca  24480
gaaacgcttc caaatccccg ttgtcaaaat gctgaaggat agcttcatca tcctgatttt  24540
ggcgtttcct tcgtgtctgc cactggttcc acctcgaagc atcataacgg gaggagactt  24600
ctttaagacc agaaacacgc gagcttggcc gtcgaatggt caagctgacg gtgcccgagg  24660
gaacggtcgg cggcagacag atttgtagtc gttcaccacc aggaagttca gtggcgcaga  24720
gggggttacg tggtccgaca tcctgctttc tcagcgcgcc cgctaaaata gcgatatctt  24780
caagatcatc ataagagacg ggcaaaggca tcttggtaaa aatgccggct tggcgcacaa  24840
atgcctctcc aggtcgattg atcgcaattt cttcagtctt cgggtcatcg agccattcca  24900
aaatcggctt cagaagaaag cgtagttgcg gatccacttc catttacaat gtatcctatc  24960
tctaagcgga aatttgaatt cattaagagc ggcggttcct cccccgcgtg gcgccgccag  25020
tcaggcggag ctggtaaaca ccaaagaaat cgaggtcccg tgctacgaaa atggaaacgg  25080
tgtcaccctg attcttcttc agggttggcg gtatgttgat ggttgcctta agggctgtct  25140
cagttgtctg ctcaccgtta ttttgaaagc tgttgaagct catcccgcca cccgagctgc  25200
cggcgtaggt gctagctgcc tggaaggcgc cttgaacaac actcaagagc atagctccgc  25260
taaaacgctg ccagaagtgg ctgtcgaccg agcccggcaa tcctgagcga ccgagttcgt  25320
ccgcgcttgg cgatgttaac gagatcatcg catggtcagg tgtctcggcg cgatcccaca  25380
acacaaaaac gcgcccatct ccctgttgca agccacgctg tatttcgcca acaacggtgg  25440
tgccacgatc aagaagcacg atattgttcg ttgttccacg aatatcctga ggcaagacac  25500
actttacata gcctgccaaa tttgtgtcga ttgcggtttg caagatgcac ggaattattg  25560
tcccttgcgt taccataaaa tcggggtgcg gcaagagcgt ggcgctgctg ggctgcagct  25620
cggtgggttt catacgtatc gacaaatcgt tctcgccgga cacttcgcca ttcggcaagg  25680
agttgtcgtc acgcttgcct tcttgtcttc ggcccgtgtc gccctgaatg gcgcgtttgc  25740
tgaccccttg atcgccgctg ctatatgcaa aaatcggtgt ttcttccggc cgtggctcat  25800
gccgctccgg ttcgcccctc ggcggtagag gagcagcagg ctgaacagcc tcttgaaccg  25860
ctggaggatc cggcggcacc tcaatcggag ctggatgaaa tggcttggtg tttgttgcga  25920
tcaaagttga cggcgatgcg ttctcattca ccttcttttg gcgcccacct agccaaatga  25980
ggcttaatga taacgcgaga acgacacctc cgacgatcaa tttctgagac cccgaaagac  26040
gccggcgatg tttgtcggag accagggatc cagatgcatc aacctcatgt gccgcttgct  26100
gactatcgtt attcatccct tcgccccctt caggacgcgt ttcacatcgg gcctcaccgt  26160
gcccgtttgc ggcctttggc caacgggatc gtaagcggtg ttccagatac atagtactgt  26220
gtggccatcc ctcagacgcc aacctcggga aaccgaagaa atctcgacat cgctcccttt  26280
aactgaatag ttggcaacag cttccttgcc atcaggattg atggtgtaga tggagggtat  26340
gcgtacattg cccggaaagt ggaataccgt cgtaaatcca ttgtcgaaga cttcgagtgg  26400
caacagcgaa cgatcgcctt gggcgacgta gtgccaatta ctgtccgccg caccaagggc  26460
tgtgacaggc tgatccaata aattctcagc tttccgttga tattgtgctt ccgcgtgtag  26520
tctgtccaca acagccttct gttgtgcctc ccttcgccga gccgccgcat cgtcggcggg  26580
gtaggcgaat tggacgctgt aatagagatc gggctgctct ttatcgaggt gggacagagt  26640
cttggaactt atactgaaaa cataacggcg catcccggag tcgcttgcgg ttagcacgat  26700
tactggctga ggcgtgagga cctggcttgc cttgaaaaat agataatttc cccgcggtag  26760
ggctgctaga tctttgctat ttgaaacggc aaccgctgtc accgtttcgt tcgtggcgaa  26820
tgttacgacc aaagtagctc caaccgccgt cgagaggcgc accacttgat cgggattgta  26880
agccaaataa cgcatgcgcg gatctagctt gcccgccatt ggagtgtctt cagcctccgc  26940
accagtcgca gcggcaaata aacatgctaa aatgaaaagt gcttttctga tcatggttcg  27000
ctgtggccta cgtttgaaac ggtatcttcc gatgtctgat aggaggtgac aaccagacct  27060
gccgggttgg ttagtctcaa tctgccgggc aagctggtca ccttttcgta gcgaactgtc  27120
gcggtccacg tactcaccac aggcattttg ccgtcaacga cgagggtcct tttatagcga  27180
atttgctgcg tgcttggagt tacatcattt gaagcgatgt gctcgacctc caccctgccg  27240
cgtttgccaa gaatgacttg aggcgaactg ggattgggat agttgaagaa ttgctggtaa  27300
tcctggcgca ctgttggggc actgaagttc gataccaggt cgtaggcgta ctgagcggtg  27360
tcggcatcat aactctcgcg caggcgaacg tactcccaca atgaggcgtt aacgacggcc  27420
tcctcttgag ttgcaggcaa tcgcgagaca gacacctcgc tgtcaacggt gccgtccggc  27480
cgtatccata gatatacggg cacaagcctg ctcaacggca ccattgtggc tatagcgaac  27540
gcttgagcaa catttcccaa aatcgcgata gctgcgacag ctgcaatgag tttggagaga  27600
cgtcgcgccg atttcgctcg cgcggtttga aaggcttcta cttccttata gtgctcggca  27660
aggctttcgc gcgccactag catggcatat tcaggccccg tcatagcgtc cacccgaatt  27720
gccgagctga agatctgacg gagtaggctg ccatcgcccc acattcagcg ggaagatcgg  27780
gcctttgcag ctcgctaatg tgtcgtttgt ctggcagccg ctcaaagcga caactaggca  27840
cagcaggcaa tacttcatag aattctccat tgaggcgaat ttttgcgcga cctagcctcg  27900
ctcaacctga gcgaagcgac ggtacaagct gctggcagat tgggttgcgc cgctccagta  27960
actgcctcca atgttgccgg cgatcgccgg caaagcgaca atgagcgcat cccctgtcag  28020
aaaaaacata tcgagttcgt aaagaccaat gatcttggcc gcggtcgtac cggcgaaggt  28080
gattacacca agcataaggg tgagcgcagt cgcttcggtt aggatgacga tcgttgccac  28140
gaggtttaag aggagaagca agagaccgta ggtgataagt tgcccgatcc acttagctgc  28200
gatgtcccgc gtgcgatcaa aaatatatcc gacgaggatc agaggcccga tcgcgagaag  28260
cactttcgtg agaattccaa cggcgtcgta aactccgaag gcagaccaga gcgtgccgta  28320
aaggacccac tgtgcccctt ggaaagcaag gatgtcctgg tcgttcatcg gaccgatttc  28380
ggatgcgatt ttctgaaaaa cggcctgggt cacggcgaac attgtatcca actgtgccgg  28440
aacagtctgc agaggcaagc cggttacact aaactgctga acaaagtttg ggaccgtctt  28500
ttcgaagatg gaaaccacat agtcttggta gttagcctgc ccaacaatta gagcaacaac  28560
gatggtgacc gtgatcaccc gagtgatacc gctacgggta tcgacttcgc cgcgtatgac  28620
taaaataccc tgaacaataa tccaaagagt gacacaggcg atcaatggcg cactcaccgc  28680
ctcctggata gtctcaagca tcgagtccaa gcctgtcgtg aaggctacat cgaagatcgt  28740
atgaatggcc gtaaacggcg ccggaatcgt gaaattcatc gattggacct gaacttgact  28800
ggtttgtcgc ataatgttgg ataaaatgag ctcgcattcg gcgaggatgc gggcggatga  28860
acaaatcgcc cagccttagg ggagggcacc aaagatgaca gcggtctttt gatgctcctt  28920
gcgttgagcg gccgcctctt ccgcctcgtg aaggccggcc tgcgcggtag tcatcgttaa  28980
taggcttgtc gcctgtacat tttgaatcat tgcgtcatgg atctgcttga gaagcaaacc  29040
attggtcacg gttgcctgca tgatattgcg agatcgggaa agctgagcag acgtatcagc  29100
attcgccgtc aagcgtttgt ccatcgtttc cagattgtca gccgcaatgc cagcgctgtt  29160
tgcggaaccg gtgatctgcg atcgcaacag gtccgcttca gcatcactac ccacgactgc  29220
acgatctgta tcgctggtga tcgcacgtgc cgtggtcgac attggcattc gcggcgaaaa  29280
catttcattg tctaggtcct tcgtcgaagg atactgattt ttctggttga gcgaagtcag  29340
tagtccagta acgccgtagg ccgacgtcaa catcgtaacc atcgctatag tctgagtgag  29400
attctccgca gtcgcgagcg cagtcgcgag cgtctcagcc tccgttgccg ggtcgctaac  29460
aacaaactgc gcccgcgcgg gctgaatata tagaaagctg caggtcaaaa ctgttgcaat  29520
aagttgcgtc gtcttcatcg tttcctacct tatcaatctt ctgcctcgtg gtgacgggcc  29580
atgaattcgc tgagccagcc agatgagttg ccttcttgtg cctcgcgtag tcgagttgca  29640
aagcgcaccg tgttggcacg ccccgaaagc acggcgacat attcacgcat atcccgcaga  29700
tcaaattcgc agatgacgct tccactttct cgtttaagaa gaaacttacg gctgccgacc  29760
gtcatgtctt cacggatcgc ctgaaattcc ttttcggtac atttcagtcc atcgacataa  29820
gccgatcgat ctgcggttgg tgatggatag aaaatcttcg tcatacattg cgcaaccaag  29880
ctggctccta gcggcgattc cagaacatgc tctggttgct gcgttgccag tattagcatc  29940
ccgttgtttt ttcgaacggt caggaggaat ttgtcgacga cagtcgaaaa tttagggttt  30000
aacaaatagg cgcgaaactc atcgcagctc atcacaaaac ggcggccgtc gatcatggct  30060
ccaatccgat gcaggagata tgctgcagcg ggagcgcata cttcctcgta ttcgagaaga  30120
tgcgtcatgt cgaagccggt aatcgacgga tctaacttta cttcgtcaac ttcgccgtca  30180
aatgcccagc caagcgcatg gccccggcac cagcgttgga gccgcgctcc tgcgccttcg  30240
gcgggcccat gcaacaaaaa ttcacgtaac cccgcgattg aacgcatttg tggatcaaac  30300
gagagctgac gatggatacc acggaccaga cggcggttct cttccggaga aatcccaccc  30360
cgaccatcac tctcgatgag agccacgatc cattcgcgca gaaaatcgtg tgaggctgct  30420
gtgttttcta ggccacgcaa cggcgccaac ccgctgggtg tgcctctgtg aagtgccaaa  30480
tatgttcctc ctgtggcgcg aaccagcaat tcgccacccc ggtccttgtc aaagaacacg  30540
accgtacctg cacggtcgac catgctctgt tcgagcatgg ctagaacaaa catcatgagc  30600
gtcgtcttac ccctcccgat aggcccgaat attgccgtca tgccaacatc gtgctcatgc  30660
gggatatagt cgaaaggcgt tccgccattg gtacgaaatc gggcaatcgc gttgccccag  30720
tggcctgagc tggcgccctc tggaaagttt tcgaaagaga caaaccctgc gaaattgcgt  30780
gaagtgattg cgccagggcg tgtgcgccac ttaaaattcc ccggcaattg ggaccaatag  30840
gccgcttcca taccaatacc ttcttggaca accacggcac ctgcatccgc cattcgtgtc  30900
cgagcccgcg cgcccctgtc cccaagacta ttgagatcgt ctgcatagac gcaaaggctc  30960
aaatgatgtg agcccataac gaattcgttg ctcgcaagtg cgtcctcagc ctcggataat  31020
ttgccgattt gagtcacggc tttatcgccg gaactcagca tctggctcga tttgaggcta  31080
agtttcgcgt gcgcttgcgg gcgagtcagg aacgaaaaac tctgcgtgag aacaagtgga  31140
aaatcgaggg atagcagcgc gttgagcatg cccggccgtg tttttgcagg gtattcgcga  31200
aacgaataga tggatccaac gtaactgtct tttggcgttc tgatctcgag tcctcgcttg  31260
ccgcaaatga ctctgtcggt ataaatcgaa gcgccgagtg agccgctgac gaccggaacc  31320
ggtgtgaacc gaccagtcat gatcaaccgt agcgcttcgc caatttcggt gaagagcaca  31380
ccctgcttct cgcggatgcc aagacgatgc aggccatacg ctttaagaga gccagcgaca  31440
acatgccaaa gatcttccat gttcctgatc tggcccgtga gatcgttttc cctttttccg  31500
cttagcttgg tgaacctcct ctttaccttc cctaaagccg cctgtgggta gacaatcaac  31560
gtaaggaagt gttcattgcg gaggagttgg ccggagagca cgcgctgttc aaaagcttcg  31620
ttcaggctag cggcgaaaac actacggaag tgtcgcggcg ccgatgatgg cacgtcggca  31680
tgacgtacga ggtgagcata tattgacaca tgatcatcag cgatattgcg caacagcgtg  31740
ttgaacgcac gacaacgcgc attgcgcatt tcagtttcct caagctcgaa tgcaacgcca  31800
tcaattctcg caatggtcat gatcgatccg tcttcaagaa ggacgatatg gtcgctgagg  31860
tggccaatat aagggagata gatctcaccg gatctttcgg tcgttccact cgcgccgagc  31920
atcacaccat tcctctccct cgtgggggaa ccctaattgg atttgggcta acagtagcgc  31980
ccccccaaac tgcactatca atgcttcttc ccgcggtccg caaaaatagc aggacgacgc  32040
tcgccgcatt gtagtctcgc tccacgatga gccgggctgc aaaccataac ggcacgagaa  32100
cgacttcgta gagcgggttc tgaacgataa cgatgacaaa gccggcgaac atcatgaata  32160
accctgccaa tgtcagtggc accccaagaa acaatgcggg ccgtgtggct gcgaggtaaa  32220
gggtcgattc ttccaaacga tcagccatca actaccgcca gtgagcgttt ggccgaggaa  32280
gctcgcccca aacatgataa caatgccgcc gacgacgccg gcaaccagcc caagcgaagc  32340
ccgcccgaac atccaggaga tcccgatagc gacaatgccg agaacagcga gtgactggcc  32400
gaacggacca aggataaacg tgcatatatt gttaaccatt gtggcggggt cagtgccgcc  32460
acccgcagat tgcgctgcgg cgggtccgga tgaggaaatg ctccatgcaa ttgcaccgca  32520
caagcttggg gcgcagctcg atatcacgcg catcatcgca ttcgagagcg agaggcgatt  32580
tagatgtaaa cggtatctct caaagcatcg catcaatgcg cacctcctta gtataagtcg  32640
aataagactt gattgtcgtc tgcggatttg ccgttgtcct ggtgtggcgg tggcggagcg  32700
attaaaccgc cagcgccatc ctcctgcgag cggcgctgat atgaccccca aacatcccac  32760
gtctcttcgg attttagcgc ctcgtgatcg tcttttggag gctcgattaa cgcgggcacc  32820
agcgattgag cagctgtttc aacttttcgc acgtagccgt ttgcaaaacc gccgatgaaa  32880
ttaccggtgt tgtaagcgga gatcgcccga cgaagcgcaa attgcttctc gtcaatcgtt  32940
tcgccgcctg cataacgact tttcagcatg tttgcagcgg cagataatga tgtgcacgcc  33000
tggagcgcac cgtcaggtgt cagaccgagc atagaaaaat ttcgagagtt tatttgcatg  33060
aggccaacat ccagcgaatg ccgtgcatcg agacggtgcc tgacgacttg ggttgcttgg  33120
ctgtgatctt gccagtgaag cgtttcgccg gtcgtgttgt catgaatcgc taaaggatca  33180
aagcgactct ccaccttagc tatcgccgca agcgtagatg tcgcaactga tggggcacac  33240
ttgcgagcaa catggtcaaa ctcagcagat gagagtggcg tggcaaggct cgacgaacag  33300
aaggagacca tcaaggcaag agaaagcgac cccgatctct taagcatacc ttatctcctt  33360
agctcgcaac taacaccgcc tctcccgttg gaagaagtgc gttgttttat gttgaagatt  33420
atcgggaggg tcggttactc gaaaattttc aattgcttct ttatgatttc aattgaagcg  33480
agaaacctcg cccggcgtct tggaacgcaa catggaccga gaaccgcgca tccatgacta  33540
agcaaccgga tcgacctatt caggccgcag ttggtcaggt caggctcaga acgaaaatgc  33600
tcggcgaggt tacgctgtct gtaaacccat tcgatgaacg ggaagcttcc ttccgattgc  33660
tcttggcagg aatattggcc catgcctgct tgcgctttgc aaatgctctt atcgcgttgg  33720
tatcatatgc cttgtccgcc agcagaaacg cactctaagc gattatttgt aaaaatgttt  33780
cggtcatgcg gcggtcatgg gcttgacccg ctgtcagcgc aagacggatc ggtcaaccgt  33840
cggcatcgac aacagcgtga atcttggtgg tcaaaccgcc acgggaacgt cccatacagc  33900
catcgtcttg atcccgctgt ttcccgtcgc cgcatgttgg tggacgcgga cacaggaact  33960
gtcaatcatg acgacattct atcgaaagcc ttggaaatca cactcagaat atgatcccag  34020
acgtctgcct cacgccatcg tacaaagcga ttgtagcagg ttgtacagga accgtatcga  34080
tcaggaacgt ctgcccaggg cgggcccgtc cggaagcgcc acaagatgac attgatcacc  34140
cgcgtcaacg cgcggcacgc gacgcggctt atttgggaac aaaggactga acaacagtcc  34200
attcgaaatc ggtgacatca aagcggggac gggttatcag tggcctccaa gtcaagcctc  34260
aatgaatcaa aatcagaccg atttgcaaac ctgatttatg agtgtgcggc ctaaatgatg  34320
aaatcgtcct tctagatcgc ctccgtggtg tagcaacacc tcgcagtatc gccgtgctga  34380
ccttggccag ggaattgact ggcaagggtg ctttcacatg accgctcttt tggccgcgat  34440
agatgatttc gttgctgctt tgggcacgta gaaggagaga agtcatatcg gagaaattcc  34500
tcctggcgcg agagcctgct ctatcgcgac ggcatcccac tgtcgggaac agaccggatc  34560
attcacgagg cgaaagtcgt caacacatgc gttataggca tcttcccttg aaggatgatc  34620
ttgttgctgc caatctggag gtgcggcagc cgcaggcaga tgcgatctca gcgcaacttg  34680
cggcaaaaca tctcactcac ctgaaaacca ctagcgagtc tcgcgatcag acgaaggcct  34740
tttacttaac gacacaatat ccgatgtctg catcacaggc gtcgctatcc cagtcaatac  34800
taaagcggtg caggaactaa agattactga tgacttaggc gtgccacgag gcctgagacg  34860
acgcgcgtag acagtttttt gaaatcatta tcaaagtgat ggcctccgct gaagcctatc  34920
acctctgcgc cggtctgtcg gagagatggg caagcattat tacggtcttc gcgcccgtac  34980
atgcattgga cgattgcagg gtcaatggat ctgagatcat ccagaggatt gccgccctta  35040
ccttccgttt cgagttggag ccagccccta aatgagacga catagtcgac ttgatgtgac  35100
aatgccaaga gagagatttg cttaacccga tttttttgct caagcgtaag cctattgaag  35160
cttgccggca tgacgtccgc gccgaaagaa tatcctacaa gtaaaacatt ctgcacaccg  35220
aaatgcttgg tgtagacatc gattatgtga ccaagatcct tagcagtttc gcttggggac  35280
cgctccgacc agaaataccg aagtgaactg acgccaatga caggaatccc ttccgtctgc  35340
agataggtac catcgataga tctgctgcct cgcgcgtttc ggtgatgacg gtgaaaacct  35400
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag  35460
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca  35520
gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta  35580
ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc  35640
atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg  35700
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac  35760
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg  35820
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca  35880
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc  35940
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc  36000
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag  36060
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc  36120
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca  36180
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg  36240
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg  36300
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct  36360
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa  36420
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa  36480
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa  36540
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc  36600
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga  36660
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca  36720
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc  36780
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat  36840
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc  36900
attgctgcag gggggggggg ggggggggac ttccattgtt cattccacgg acaaaaacag  36960
agaaaggaaa cgacagaggc caaaaagcct cgctttcagc acctgtcgtt tcctttcttt  37020
tcagagggta ttttaaataa aaacattaag ttatgacgaa gaagaacgga aacgccttaa  37080
accggaaaat tttcataaat agcgaaaacc cgcgaggtcg ccgccccgta acctgtcgga  37140
tcaccggaaa ggacccgtaa agtgataatg attatcatct acatatcaca acgtgcgtgg  37200
aggccatcaa accacgtcaa ataatcaatt atgacgcagg tatcgtatta attgatctgc  37260
atcaacttaa cgtaaaaaca acttcagaca atacaaatca gcgacactga atacggggca  37320
acctcatgtc cccccccccc ccccccctgc aggcatcgtg gtgtcacgct cgtcgtttgg  37380
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt  37440
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc  37500
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt  37560
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg  37620
gcgaccgagt tgctcttgcc cggcgtcaac acgggataat accgcgccac atagcagaac  37680
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc  37740
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt  37800
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg  37860
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag  37920
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa  37980
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat  38040
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtcttcaaga  38100
attggtcgac gatcttgctg cgttcggata ttttcgtgga gttcccgcca cagacccgga  38160
ttgaaggcga gatccagcaa ctcgcgccag atcatcctgt gacggaactt tggcgcgtga  38220
tgactggcca ggacgtcggc cgaaagagcg acaagcagat cacgcttttc gacagcgtcg  38280
gatttgcgat cgaggatttt tcggcgctgc gctacgtccg cgaccgcgtt gagggatcaa  38340
gccacagcag cccactcgac cttctagccg acccagacga gccaagggat ctttttggaa  38400
tgctgctccg tcgtcaggct ttccgacgtt tgggtggttg aacagaagtc attatcgtac  38460
ggaatgccaa gcactcccga ggggaaccct gtggttggca tgcacataca aatggacgaa  38520
cggataaacc ttttcacgcc cttttaaata tccgttattc taataaacgc tcttttctct  38580
taggtttacc cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac  38640
gacaatctga tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc  38700
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc  38760
aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc  38820
ttcaactgga agagcggtta cccggaccga agcttgaagt tcctattccg aagttcctat  38880
tctctagaaa gtataggaac ttcagatctc gatgctcacc ctgttgtttg gtgttacttc  38940
tgcaggtcga ctctagagga tccaccatga gcccagaacg acgcccggcc gacatccgcc  39000
gtgccaccga ggcggacatg ccggcggtct gcaccatcgt caaccactac atcgagacaa  39060
gcacggtcaa cttccgtacc gagccgcagg aaccgcagga ctggacggac gacctcgtcc  39120
gtctgcggga gcgctatccc tggctcgtcg ccgaggtgga cggcgaggtc gccggcatcg  39180
cctacgcggg cccctggaag gcacgcaacg cctacgactg gacggccgag tcgaccgtgt  39240
acgtctcccc ccgccaccag cggacgggac tgggctccac gctctacacc cacctgctga  39300
agtccctgga ggcacagggc ttcaagagcg tggtcgctgt catcgggctg cccaacgacc  39360
cgagcgtgcg catgcacgag gcgctcggat atgccccccg cggcatgctg cgggcggccg  39420
gcttcaagca cgggaactgg catgacgtgg gtttctggca gctggacttc agcctgccgg  39480
taccgccccg tccggtcctg cccgtcaccg agatctgatc cgtcgaccaa cctagacttg  39540
tccatcttct ggattggcca acttaattaa tgtatgaaat aaaaggatgc acacatagtg  39600
acatgctaat cactataatg tgggcatcaa agttgtgtgt tatgtgtaat tactagttat  39660
ctgaataaaa gagaaagaga tcatccatat ttcttatcct aaatgaatgt cacgtgtctt  39720
tataattctt tgatgaacca gatgcatttc attaaccaaa tccatataca tataaatatt  39780
aatcatatat aattaatatc aattgggtta gcaaaacaaa tctagtctag gtgtgttttg  39840
cgaattgcgg ccgcgatctg gggaattccc atggacaccg gtaattccca tgatcttctc  39900
tccttcatca atggatgcca tgtttcataa caataacacc aaatgtttga tgagctacca  39960
acaattgcgc aaagactatg gctaagctcg agctcgctcg ctacaagttg ttgactttca  40020
aatacaagtt tgtttttgga acaccaaata ttctacatga tctttcacta agttgcgcac  40080
cactatcaaa agattatcta ggccattatt caagtaaaga gtgaacacgt ctaagaccca  40140
caaccacacc aaatagaata cgcatacatg caacatattg tgcaagaagt atccaactgg  40200
actcccatgt attctaaaac tattttcgta gagttaaagt tatgacaaac ttatcaaata  40260
aaaatttgaa cgctggacca aaactttcat ctttcaaatc caccatcgtc tatcctcata  40320
aattgttttg attataacac atctacgtaa atcatttgtt ttgaacaata ctaatttaat  40380
tttattaagt caaataacct gcttagaaaa taatccctcc acctcattta acaatttctt  40440
gtcaaacaca caccaagaaa aaaattaatg aaagagaaaa gaaatgaaaa ggacatggag  40500
ttgaatacta gcaaaattga ttgaaggaag attcacaatt gaaattgaaa ccatttaatt  40560
tattttcggg tccataataa taaattggta agaataaaaa cccgatcaag tccggtacag  40620
tacaattcca ctccaccaac tccttactta aacccctatt tatacccact ctcatcctca  40680
ctcttccttc acctctcaca ctctcttctc tctctcaaaa ccctcacaca aacgctgcgt  40740
ttagtgtaag aaattcaatc cggcgccttg gcgcgccgat catccacaag tttgtacaaa  40800
aaagctgaac gagaaacgta aaatgatata aatatcaata tattaaatta gattttgcat  40860
aaaaaacaga ctacataata ctgtaaaaca caacatatcc agtcactatg gcggccgcat  40920
taggcacccc aggctttaca ctttatgctt ccggctcgta taatgtgtgg attttgagtt  40980
aggatttaaa tacgcgttga tccggcttac taaaagccag ataacagtat gcgtatttgc  41040
gcgctgattt ttgcggtata agaatatata ctgatatgta tacccgaagt atgtcaaaaa  41100
gaggtatgct atgaagcagc gtattacagt gacagttgac agcgacagct atcagttgct  41160
caaggcatat atgatgtcaa tatctccggt ctggtaagca caaccatgca gaatgaagcc  41220
cgtcgtctgc gtgccgaacg ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc  41280
cggtttattg aaatgaacgg ctcttttgct gacgagaaca ggggctggtg aaatgcagtt  41340
taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg tacagagtga  41400
tatcattgac acgcccggtc gacggatggt gatccccctg gccagtgcac gtctgctgtc  41460
agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa gctggcgcat  41520
gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag tggctgatct  41580
cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg gaatataaat  41640
gtcaggctcc cttatacaca gccagtctgc aggtcgacca tagtgactgg atatgttgtg  41700
ttttacagta ttatgtagtc tgttttttat gcaaaatcta atttaatata ttgatattta  41760
tatcatttta cgtttctcgt tcagctttct tgtacaaagt ggtgttaacc tagacttgtc  41820
catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac  41880
atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct  41940
gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta  42000
taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa  42060
tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg  42120
aattgcggcc gccaccgcgg tggagctcga attccggtcc gggtcacctt tgtccaccaa  42180
gatggaactg cggccgctca ttaattaagt caggcgcgcc tctagttgaa gacacgttca  42240
tgtcttcatc gtaagaagac actcagtagt cttcggccag aatggccatc tggattcagc  42300
aggcctagaa ggccatttaa atcctgagga tctggtcttc ctaaggaccc gggatatcgg  42360
accgattaaa ctttaattcg gtccgaagct tgaagttcct attccgaagt tcctattctc  42420
cagaaagtat aggaacttcg catgcctgca gtgcagcgtg acccggtcgt gcccctctct  42480
agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt tttttgtcac  42540
acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta ctctacgaat  42600
aatataatct atagtactac aataatatca gtgttttaga gaatcatata aatgaacagt  42660
tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag ttttatcttt  42720
ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata atacttcatc  42780
cattttatta gtacatccat ttagggttta gggttaatgg tttttataga ctaatttttt  42840
tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa ctctatttta  42900
gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact aaaaattaaa  42960
caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt cgagtagata  43020
atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc  43080
gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct ctggacccct  43140
ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga aattgcgtgg  43200
cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcaccggc  43260
agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata  43320
aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag cgcacacaca  43380
cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg  43440
tcctcccccc cccccctctc taccttctct agatcggcgt tccggtccat gcatggttag  43500
ggcccggtag ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt  43560
gctgctagcg ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt  43620
gccagtgttt ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga  43680
tttcatgatt ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa  43740
tatatgccgt gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg  43800
atgatgtggt ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc  43860
tggtggattt attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat  43920
tgaagatgat ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac  43980
tgatgcatat acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc  44040
ggtcgttcat tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat  44100
taattttgga actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg  44160
gaaatatcga tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg  44220
atggcatatg cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa  44280
caagtatgtt ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc  44340
tatatgtgga tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct  44400
tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca ggtcgacttt aacttagcct  44460
aggatccaca cgacaccatg atagaggtga aaccgattaa cgcagaggat acctatgaac  44520
taaggcatag aatactcaga ccaaaccagc cgatagaagc gtgtatgttt gaaagcgatt  44580
tacttcgtgg tgcatttcac ttaggcggct attacggggg caaactgatt tccatagctt  44640
cattccacca ggccgagcac tcagaactcc aaggccagaa acagtaccag ctccgaggta  44700
tggctacctt ggaaggttat cgtgagcaga aggcgggatc gagtctaatt aaacacgctg  44760
aagaaattct tcgtaagagg ggggcggact tgctttggtg taatgcgcgg acatccgcct  44820
caggctacta caaaaagtta ggcttcagcg agcagggaga ggtattcgac acgccgccag  44880
taggacctca catcctgatg tataaaagga tcacataact agctagtcag ttaacctaga  44940
cttgtccatc ttctggattg gccaacttaa ttaatgtatg aaataaaagg atgcacacat  45000
agtgacatgc taatcactat aatgtgggca tcaaagttgt gtgttatgtg taattactag  45060
ttatctgaat aaaagagaaa gagatcatcc atatttctta tcctaaatga atgtcacgtg  45120
tctttataat tctttgatga accagatgca tttcattaac caaatccata tacatataaa  45180
tattaatcat atataattaa tatcaattgg gttagcaaaa caaatctagt ctaggtgtgt  45240
tttgcgaatt cagagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg  45300
aagagctatg tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccgc  45360
aatgtgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat cctgccacca  45420
gccagccaac agctccccga ccggcagctc ggcacaaaat caccactcga tacaggcagc  45480
ccatcagtcc gggacggcgt cagcgggaga gccgttgtaa ggcggcagac tttgctcatg  45540
ttaccgatgc tattcggaag aacggcaact aagctgccgg gtttgaaaca cggatgatct  45600
cgcggagggt agcatgttga ttgtaacgat gacagagcgt tgctgcctgt gatcaaatat  45660
catctccctc gcagagatcc gaattatcag ccttcttatt catttctcgc ttaaccgtga  45720
caggctgtcg atcttgagaa ctatgccgac ataataggaa atcgctggat aaagccgctg  45780
aggaagctga gtggcgctat ttctttagaa gtgaacgttg acgatcgtcg accgtacccc  45840
gatgaattaa ttcggacgta cgttctgaac acagctggat acttacttgg gcgattgtca  45900
tacatgacat caacaatgta cccgtttgtg taaccgtctc ttggaggttc gtatgacact  45960
agtggttccc ctcagcttgc gactagatgt tgaggcctaa cattttatta gagagcaggc  46020
tagttgctta gatacatgat cttcaggccg ttatctgtca gggcaagcga aaattggcca  46080
tttatgacga ccaatgcccc gcagaagctc ccatctttgc cgccatagac gccgcgcccc  46140
ccttttgggg tgtagaacat ccttttgcca gatgtggaaa agaagttcgt tgtcccattg  46200
ttggcaatga cgtagtagcc ggcgaaagtg cgagacccat ttgcgctata tataagccta  46260
cgatttccgt tgcgactatt gtcgtaattg gatgaactat tatcgtagtt gctctcagag  46320
ttgtcgtaat ttgatggact attgtcgtaa ttgcttatgg agttgtcgta gttgcttgga  46380
gaaatgtcgt agttggatgg ggagtagtca tagggaagac gagcttcatc cactaaaaca  46440
attggcaggt cagcaagtgc ctgccccgat gccatcgcaa gtacgaggct tagaaccacc  46500
ttcaacagat cgcgcatagt cttccccagc tctctaacgc ttgagttaag ccgcgccgcg  46560
aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg  46620
cctttcacgt agtgaacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct  46680
tgtccaagat aagcctgcct agcttcaagt atgacgggct gatactgggc cggcaggcgc  46740
tccattgccc agtcggcagc gacatccttc ggcgcgattt tgccggttac tgcgctgtac  46800
caaatgcggg acaacgtaag cactacattt cgctcatcgc cagcccagtc gggcggcgag  46860
ttccatagcg ttaaggtttc atttagcgcc tcaaatagat cctgttcagg aaccggatca  46920
aagagttcct ccgccgctgg acctaccaag gcaacgctat gttctcttgc ttttgtcagc  46980
aagatagcca gatcaatgtc gatcgtggct ggctcgaaga tacctgcaag aatgtcattg  47040
cgctgccatt ctccaaattg cagttcgcgc ttagctggat aacgccacgg aatgatgtcg  47100
tcgtgcacaa caatggtgac ttctacagcg cggagaatct cgctctctcc aggggaagcc  47160
gaagtttcca aaaggtcgtt gatcaaagct cgccgcgttg tttcatcaag ccttacagtc  47220
accgtaacca gcaaatcaat atcactgtgt ggcttcaggc cgccatccac tgcggagccg  47280
tacaaatgta cggccagcaa cgtcggttcg agatggcgct cgatgacgcc aactacctct  47340
gatagttgag tcgatacttc ggcgatcacc gcttccctca tgatgtttaa ctcctgaatt  47400
aagccgcgcc gcgaagcggt gtcggcttga atgaattgtt aggcgtcatc ctgtgctccc  47460
gagaaccagt accagtacat cgctgtttcg ttcgagactt gaggtctagt tttatacgtg  47520
aacaggtcaa tgccgccgag agtaaagcca cattttgcgt acaaattgca ggcaggtaca  47580
ttgttcgttt gtgtctctaa tcgtatgcca aggagctgtc tgcttagtgc ccactttttc  47640
gcaaattcga tgagactgtg cgcgactcct ttgcctcggt gcgtgtgcga cacaacaatg  47700
tgttcgatag aggctagatc gttccatgtt gagttgagtt caatcttccc gacaagctct  47760
tggtcgatga atgcgccata gcaagcagag tcttcatcag agtcatcatc cgagatgtaa  47820
tccttccggt aggggctcac acttctggta gatagttcaa agccttggtc ggataggtgc  47880
acatcgaaca cttcacgaac aatgaaatgg ttctcagcat ccaatgtttc cgccacctgc  47940
tcagggatca ccgaaatctt catatgacgc ctaacgcctg gcacagcgga tcgcaaacct  48000
ggcgcggctt ttggcacaaa aggcgtgaca ggtttgcgaa tccgttgctg ccacttgtta  48060
acccttttgc cagatttggt aactataatt tatgttagag gcgaagtctt gggtaaaaac  48120
tggcctaaaa ttgctgggga tttcaggaaa gtaaacatca ccttccggct cgatgtctat  48180
tgtagatata tgtagtgtat ctacttgatc gggggatctg ctgcctcgcg cgtttcggtg  48240
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag  48300
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg  48360
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc  48420
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt  48480
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc  48540
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac  48600
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa  48660
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca  48720
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc  48780
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata  48840
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta  48900
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca  48960
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga  49020
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg  49080
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg  49140
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg  49200
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag  49260
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa  49320
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat  49380
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc  49440
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc  49500
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc  49560
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc  49620
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc  49680
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt  49740
gcgcaacgtt gttgccattg ctgca                                        49765
 
<210>14
<211>1100
<212>DNA
<213>玉米
<400>14
catcgcatcg catcgcatcg cgcgctttgc ctgccgcagc ggctaacgaa cgcgtggatc    60
atcccttcta ttattaatta attgggagga gtgggagtga tagctgcagc acccagcgcc   120
catcactgag cccatccgga accctagcct cctcgtcgtt gaatccacca caccatgagc   180
gggagcgcct ccaggaagct cttccaggcc gccaggtcca tcgtcctctc cgcttctcaa   240
cgctcctcct tctccgtcct cgccgccgag ggccgcaccg ccgcgctcgc caactttggc   300
aggaagatcc tccccagcgc ctgctcctac cacaggcagg gatcccacgc cgcgtcggga   360
tggggagcca tcgctgccgc agtccccgcc gcagtttaca tgctccagga ccaggaggct   420
catgctgcag agatggagcg cactttcatc gccatcaagc ccgacggcgt ccaaagaggc   480
ctgatttctg agattgtgaa ccgattcgag agaaaaggct acaagcttgt tgccatcaag   540
ctgattgtcc catccaaagg attcgctgag aagcactacc atgatctcaa ggaaaggcct   600
ttcttcaacg ggttgtgtga cttcctcagc tctggccctg tacttgcaat ggtttgggaa   660
ggagagggtg tcatcaagta tgggagaaaa ctaattggtg ccacagaccc acagaaatct   720
gaaccaggaa ccatcagggg cgatcttggt gttgttgtgg gaagaaacat cattcatgga   780
agtgatggcc cggagacagc aaaggatgag atcgccttgt ggtttgaacc caaggagctg   840
gtctcttata ccagcaatgc ggagaagtgg gtctatgggg tgaattaacc agcgactaaa   900
tctcttgagg tttgcttttt tcttttcagt tttcacataa ttgccgacag accaaggcag   960
gatgtaataa agtagctacc gtcacctatt acttttgagt tggattgatt gtggtgcagt  1020
aaggcacaag gaaaggaagg aatacaccgt gaaatttgtt aaaaaaaaaa aaaaaaaaaa  1080
aaaaaaaaaa aaaaaaaaaa                                              1100
 
<210>15
<211>237
<212>PRT
<213>玉米
 
<400>15
 
Met Ser Gly Ser Ala Ser Arg Lys Leu Phe Gln Ala Ala Arg Ser Ile
1               5                   10                  15
Val Leu Ser Ala Ser Gln Arg Ser Ser Phe Ser Val Leu Ala Ala Glu
            20                  25                  30
Gly Arg Thr Ala Ala Leu Ala Asn Phe Gly Arg Lys Ile Leu Pro Ser
        35                  40                  45
Ala Cys Ser Tyr His Arg Gln Gly Ser His Ala Ala Ser Gly Trp Gly
    50                  55                  60
Ala Ile Ala Ala Ala Val Pro Ala Ala Val Tyr Met Leu Gln Asp Gln
65                  70                  75                  80
Glu Ala His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Val Asn Arg Phe Glu
            100                 105                 110
Arg Lys Gly Tyr Lys Leu Val Ala Ile Lys Leu Ile Val Pro Ser Lys
        115                 120                 125
Gly Phe Ala Glu Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Asn Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala
                165                 170                 175
Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Gly
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys Asp Glu Ile Ala Leu Trp Phe Glu Pro Lys Glu Leu Val Ser
    210                 215                 220
Tyr Thr Ser Asn Ala Glu Lys Trp Val Tyr Gly Val Asn
225                 230                 235
 
<210>16
<211>1242
<212>DNA
<213>玉米
 
<400>16
ggaaaccttt gcgtttttta agcgagccac gccaataacg gagaggcatg caccgacgat    60
cggcatttcc ttccagtggc ggtgagaagg gaaagggagg acagcagagc agaggtcgag    120
catcgcatcg catcgcatcg cgcgctttgc ctgccgcagc ggctaacgaa cgcgtggatc    180
atcccttcta ttattaatta attgggagga gtgggagtga tagctgcagc acccagcgcc    240
catcactgag cccatccgga accctagcct cctcgtcgtt gaatccacca caccatgagc    300
gggagcgcct ccaggaagct cttccaggcc gccaggtcca tcgtcctctc cgcttctcaa    360
cgctcctcct tctccgtcct cgccgccgag ggccgcaccg ccgcgctcgc caactttggc    420
aggaagatcc tccccagcgc ctgctcctac cacaggcagg gatcccacgc cgcgtcggga    480
tggggagcca tcgctgccgc agtccccgcc gcagtttaca tgctccagga ccaggaggct    540
catgctgcag agatggagcg cactttcatc gccatcaagc ccgacggcgt ccaaagaggc    600
ctgatttctg agattgtgaa ccgattcgag agaaaaggct acaagcttgt tgccatcaag    660
ctcattgtcc catccaaagg attcgctgag aagcactacc atgatctcaa ggaaaggcct    720
ttcttcaacg ggttgtgtga cttcctcagc tctggccctg tacttgcaat ggtttgggaa    780
ggagagggtg tcatcaagta tgggagaaaa ctaattggtg ccacagaccc acagaaatct    840
gaaccaggaa ccatcagggg cgatcttggt gttgttgtgg gaagaaacat cattcatgga    900
agtgatggcc cggagacagc aaaggatgag atcgccttgt ggtttgaacc caaggagctg    960
gtctcttata ccagcaatgc ggagaagtgg gtctatgggg tgaattaacc agcgactaaa   1020
tctcttgagg tttgcttttt tcttttcagt tttcacataa ttgccgacag accaaggcag   1080
gatgtaataa agtagctacc gtcacctatt acttttgagt tggattgatt gtggtgcagt   1140
aaggcacaag gaaaggaagg aatacaccgt gaaatttgtt aaaaaaaaaa aaaaaaaaaa   1200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa                      1242
 
<210>17
<211>237
<212>PRT
<213>玉米
 
<400>17
 
Met Ser Gly Ser Ala Ser Arg Lys Leu Phe Gln Ala Ala Arg Ser Ile
1               5                   10                  15
Val Leu Ser Ala Ser Gln Arg Ser Ser Phe Ser Val Leu Ala Ala Glu
            20                  25                  30
Gly Arg Thr Ala Ala Leu Ala Asn Phe Gly Arg Lys Ile Leu Pro Ser
        35                  40                  45
Ala Cys Ser Tyr His Arg Gln Gly Ser His Ala Ala Ser Gly Trp Gly
    50                  55                  60
Ala Ile Ala Ala Ala Val Pro Ala Ala Val Tyr Met Leu Gln Asp Gln
65                  70                  75                  80
Glu Ala His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Val Asn Arg Phe Glu
            100                 105                 110
Arg Lys Gly Tyr Lys Leu Val Ala Ile Lys Leu Ile Val Pro Ser Lys
        115                 120                 125
Gly Phe Ala Glu Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Asn Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala
                165                 170                 175
Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Gly
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys Asp Glu Ile Ala Leu Trp Phe Glu Pro Lys Glu Leu Val Ser
    210                 215                 220
Tyr Thr Ser Asn Ala Glu Lys Trp Val Tyr Gly Val Asn
225                 230                 235
 
<210>18
<211>1102
<212>DNA
<213>玉米
 
<400>18
agcgaccgca ccggcacggc gcccatccat ccatcgccat cctctagccc agtccaaagg    60
aaccctagcc atgagcgccg cctccaagaa gctcttccag gccgccaggt ccctcgtcct    120
ctccgcttct caccgctccg tcctcgccgc cgagggccgc accgccgcgc tcgccacgct    180
caccaacttt ggcaggaaga ccctccccac cgcctactta tcctaccaca agcagggatc    240
ccaccatgcc gcgtcggggt ggggagccat cgccgccgca gtcccagctg cagtttacat    300
gctccaggac caggaggctc atgctgcaga gatggagcgc accttcattg ccatcaagcc    360
tgatggcgtc caaagaggcc tgatttctga gattatgagc cgatttgaga gaaaaggcta    420
taagcttgtt gccatcaagc tgattgttcc atccaaagaa tttgctgaga agcactacca    480
tgatctcaag gaaaggcctt tcttcagtgg gttgtgtgat tttctcagct ctggccctgt    540
gcttgcaatg gtttgggaag gagagggtgt catcaagtat gggagaaaac taattggtgc    600
cacagaccca cagaaatctg aaccaggaac catcaggggc gatcttgcca ttgttgttgg    660
aagaaacatt attcatggaa gtgatggccc agagacagcg aaggatgaga tcgctttatg    720
gtttgaaccc aaggagctgg tctcttacac cagcaatgcg gagaagtgga tctatggggt    780
gaattaacga gagagtcaat ctgttttttt tcccttcttt tgatctcggt tttcacataa    840
ttgccgacag acctaggcac aaggatgtaa taaagtcgct accgtcactt cgagttggat    900
tgtgaccttc aggtgtagta aggcacaagg aaggatggaa aggaaaggaa tataccgtga    960
aatatagagc gtgcactgag tagtcgcgat gttcaaatca aactatatat caccgtcact   1020
ggagtcatgt aatccaagat ggcgatgcag atgtttcttt ggatctaaaa aaaaaaaaaa   1080
aaaaaaaaaa aaaacctcgt gc                                            1102
 
<210>19
<211>238
<212>PRT
<213>玉米
 
<400>19
 
Met Ser Ala Ala Ser Lys Lys Leu Phe Gln Ala Ala Arg Ser Leu Val
1               5                   10                  15
Leu Ser Ala Ser His Arg Ser Val Leu Ala Ala Glu Gly Arg Thr Ala
            20                  25                  30
Ala Leu Ala Thr Leu Thr Asn Phe Gly Arg Lys Thr Leu Pro Thr Ala
        35                  40                  45
Tyr Leu Ser Tyr His Lys Gln Gly Ser His His Ala Ala Ser Gly Trp
    50                  55                  60
Gly Ala Ile Ala Ala Ala Val Pro Ala Ala Val Tyr Met Leu Gln Asp
65                  70                  75                  80
Gln Glu Ala His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys
                85                  90                  95
Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Met Ser Arg Phe
            100                 105                 110
Glu Arg Lys Gly Tyr Lys Leu Val Ala Ile Lys Leu Ile Val Pro Ser
        115                 120                 125
Lys Glu Phe Ala Glu Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe
    130                 135                 140
Phe Ser Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met
145                 150                 155                 160
Val Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly
                165                 170                 175
Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu
            180                 185                 190
Ala Ile Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu
        195                 200                 205
Thr Ala Lys Asp Glu Ile Ala Leu Trp Phe Glu Pro Lys Glu Leu Val
    210                 215                 220
Ser Tyr Thr Ser Asn Ala Glu Lys Trp Ile Tyr Gly Val Asn
225                 230                 235
 
<210>20
<211>1066
<212>DNA
<213>瓜儿豆
 
<400>20
gcttctctgt agacgaagaa gatggcctca caggtttgca aatctgcttc cagagccgcg    60
aggtctcttc tctctgcttc caaggcctct cgtttctact cacaaggaag cgccgctgcg   120
gctgttacat taggccgtaa agtgcctttt tatgcttcca actatggaag gagcggttct   180
agaagtggat ccgccgcatg gattccagga gctctcgctc ttcctgctgc agcttacatg   240
ttccaagatc aggaagtgca cgctgctgag ctggagcgca ctttcattgc cattaagcct   300
gacggagttc agagagggct gattgcagag attctatcac gttttgagcg caaagggtac   360
aagcttgtgg ggattaaagt agtgattcct acaaaggagt ttgcccaaca acattatcat   420
gacctgaaag agagaccctt cttcaacggg ctttgtgaat tccttagctc tggccctgtc   480
attgcaatgg tgtgggaagg acaaggagtt attacttacg gacggaaact aattggagcc   540
acagatccac agaaatcaga gcctggaacc attaggggtg acctggctgt tgttgttgga   600
agaaatatca tccatgggag tgatggtcca gagactgcca aggaggagat taagttgtgg   660
tttaagccag aggagctggt tagtttcact agcaatgcag agaagtggat ttatggcgaa   720
aactgattct ttccctcacc tattcgattt tcagaataaa taaattattt gttagtaaag   780
ggtaatgctg aactctagaa gccacaaata agcgggattg agaatagtac cgtgagcact   840
atctatttag ccttttaggt gttaccgatg agtcaaaaat aggtcaacag tctttcttct   900
tcttcttctt ctttttttta atagccaaaa aggattatgc atctatctat ctattctatt   960
ctctgaagtt agagaacaaa tggttaattt aagtggtaaa tgtttcattt ctcttaaata  1020
aataaagttg tggaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa                 1066
 
<210>21
<211>234
<212>PRT
<213>瓜儿豆
 
<400>21
 
Met Ala Ser Gln Val Cys Lys Ser Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Lys Ala Ser Arg Phe Tyr Ser Gln Gly Ser Ala Ala
            20                  25                  30
Ala Ala Val Thr Leu Gly Arg Lys Val Pro Phe Tyr Ala Ser Asn Tyr
        35                  40                  45
Gly Arg Ser Gly Ser Arg Ser Gly Ser Ala Ala Trp Ile Pro Gly Ala
    50                  55                  60
Leu Ala Leu Pro Ala Ala Ala Tyr Met Phe Gln Asp Gln Glu Val His
65                  70                  75                  80
Ala Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
                85                  90                  95
Gln Arg Gly Leu Ile Ala Glu Ile Leu Ser Arg Phe Glu Arg Lys Gly
            100                 105                 110
Tyr Lys Leu Val Gly Ile Lys Val Val Ile Pro Thr Lys Glu Phe Ala
        115                 120                 125
Gln Gln His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asn Gly Leu
    130                 135                 140
Cys Glu Phe Leu Ser Ser Gly Pro Val Ile Ala Met Val Trp Glu Gly
145                 150                 155                 160
Gln Gly Val Ile Thr Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp Pro
                165                 170                 175
Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val Val
            180                 185                 190
Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys Glu
        195                 200                 205
Glu Ile Lys Leu Trp Phe Lys Pro Glu Glu Leu Val Ser Phe Thr Ser
    210                 215                 220
Asn Ala Glu Lys Trp Ile Tyr Gly Glu Asn
225                 230
 
<210>22
<211>1014
<212>DNA
<213>车前子
 
<400>22
gggggcactt tgtcacaact aacgctctca ctcatcaatc tcagtaaatc tattcttcca    60
aaatgaggtc tcagatttgc agatccgcca ggtctcttct ctctgctgct tccaagcaat   120
cttctcgctc cttctcctcc ggagggcgag cagctgcagc ggctgcagtt tcaggtagag   180
gaagatggtc ttctctagct tcatatgctg catccggaaa tgcaaatagt ggctggatga   240
ctggactcct tgccctaccc acagcagctt tcatgcttca ggaacaagaa gcacatgctg   300
ccgagatgga gagaactttc attgctatca agccagatgg cgtgcaaagg ggattgatct   360
cagaaatcat ctctcgcttt gaacggaaag gattcaagct tgtggggatc aaggtcgtga  420
ttccttccaa ggactttgcc cagaggcatt accatgacct caaggaaaga cctttcttca  480
atgggttgtg caatttcctt agctctggac cagttattgc catggtatgg gaaggcaaag  540
gagtgatcaa gtatggccat aagctcattg gagcaacaga tccccagaaa tcagagcctg  600
gaaccatcag gggagactta gctgttgttg taggaagaaa cattattcat ggtagtgacg  660
gacctgaaac tgccaaggat gaaatcagct tatggtttaa acctgaggaa ttggtcagtt  720
acacaagcaa tactgagaag tggttgtacg gtgacaattg atgacatacc tttttgttat  780
ttattcacac attgccggcg aactttgatc gtgaactaaa gaaagagtag ttatgagctc  840
aatgctcaga ataatatcca cctttcagct ggtggatacg agtaataatt tagttgcgta  900
tcaccaaatg aacttcattg gtacactgat gtattactga aatgtgagtt tgatcaattc  960
ttgcgcatct tttttatgga cttctctttg aaaaaaaaaa aaaaaaaaaa aaaa       1014
 
<210>23
<211>232
<212>PRT
<213>车前子
 
<400>23
 
Met Arg Ser Gln Ile Cys Arg Ser Ala Arg Ser Leu Leu Ser Ala Ala
1               5                   10                  15
Ser Lys Gln Ser Ser Arg Ser Phe Ser Ser Gly Gly Arg Ala Ala Ala
            20                  25                  30
Ala Ala Ala Val Ser Gly Arg Gly Arg Trp Ser Ser Leu Ala Ser Tyr
        35                  40                  45
Ala Ala Ser Gly Asn Ala Asn Ser Gly Trp Met Thr Gly Leu Leu Ala
    50                  55                  60
Leu Pro Thr Ala Ala Phe Met Leu Gln Glu Gln Glu Ala His Ala Ala
65                  70                  75                  80
Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg
                85                  90                  95
Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu Arg Lys Gly Phe Lys
            100                 105                 110
Leu Val Gly Ile Lys Val Val Ile Pro Ser Lys Asp Phe Ala Gln Arg
        115                 120                 125
His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asn Gly Leu Cys Asn
    130                 135                 140
Phe Leu Ser Ser Gly Pro Val Ile Ala Met Val Trp Glu Gly Lys Gly
145                 150                 155                 160
Val Ile Lys Tyr Gly His Lys Leu Ile Gly Ala Thr Asp Pro Gln Lys
                165                 170                 175
Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val Val Gly Arg
            180                 185                 190
Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys Asp Glu Ile
        195                 200                 205
Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Ser Tyr Thr Ser Asn Thr
    210                 215                 220
Glu Lys Trp Leu Tyr Gly Asp Asn
225                 230
 
<210>24
<211>1147
<212>DNA
<213>黑燕麦
 
<400>24
ggcacgagtc tactagtact ccatacagac cactcgctga ggcaggctca cggccattcc   60
tcctcctcct cctcctcctc cttgaagaaa ctgaaccaga cccacatctc gccctccctc  120
cacatctcgc cgccggccgc catgagctcc tccaagatgt accagtccgc gtgcaaggcc  180
gccaggtccc tcatcgcatc ctcctccgcc cgctccgccg tcctcgcaga cgggaggaac  240
gccgcgctcg ccacgctcac caacctcggc aggaccagga tccccgccgc ctactcctca  300
taccacacca acgccggcgc cgcccgcgga tacggctgga tcgcaggcat ccccgccgct  360
gcctacatgc tccaggatca ggaggtgcac gccgcagagc tggagcgcac cttcatcgcc  420
atcaagcccg acggcgtcca gagaggcctc atttctgaga tagtttcccg atttgagagg  480
aaaggattca agcttgttgc catcaagctg gtggttccat ccaaggagtt cgcccagaag  540
cactaccatg atctgaagga aagacctttc ttcagtggat tgtgcgactt ccttagctcc  600
gggcctgtcc ttgccatggt ctgggaagga gagggtgtca tcaagtacgg gaggaagatg  660
attggtgcca cggacccagc gaagtctgaa ccaggaacca tcaggggtga ccttgctgtt  720
gttgttggaa gaaacatcat tcacgggagc gacggcccag agacagccaa ggacgagatt  780
gctctctggt ttacgcccaa ggagctggtc tcttacacca gcaacgagga gaagtgggtc  840
tacggcgtga actaaccggc ggatcatctt ctctttgaaa agaaaaaagt caacatcatt  900
ttccataatt gccttgtaga agagcatggc agagtgtaat aacgctgggt gcaataaggc  960
ctgacgaaaa gagaagtgta actagcttgg aatgtagagc gtgcaccgag caattcgtga 1020
tgtttacatc gaactatcgc ggcctccagc cagcttgatc tggatggatg ctctttattt 1080
tgatctattc tccatttttg accaaacatt aattctatgc acttttgcta aaaaaaaaaa 1140
aaaaaaa                                                           1147
 
<210>25
<211>237
<212>PRT
<213>黑燕麦
 
<400>25
 
Met Ser Ser Ser Lys Met Tyr Gln Ser Ala Cys Lys Ala Ala Arg Ser
1               5                   10                  15
Leu Ile Ala Ser Ser Ser Ala Arg Ser Ala Val Leu Ala Asp Gly Arg
            20                  25                  30
Asn Ala Ala Leu Ala Thr Leu Thr Asn Leu Gly Arg Thr Arg Ile Pro
        35                  40                  45
Ala Ala Tyr Ser Ser Tyr His Thr Asn Ala Gly Ala Ala Arg Gly Tyr
    50                  55                  60
Gly Trp Ile Ala Gly Ile Pro Ala Ala Ala Tyr Met Leu Gln Asp Gln
65                  70                  75                  80
Glu Val His Ala Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Val Ser Arg Phe Glu
            100                 105                 110
Arg Lys Gly Phe Lys Leu Val Ala Ile Lys Leu Val Val Pro Ser Lys
        115                 120                 125
Glu Phe Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Ser Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Met Ile Gly Ala
                165                 170                 175
Thr Asp Pro Ala Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys Asp Glu Ile Ala Leu Trp Phe Thr Pro Lys Glu Leu Val Ser
    210                 215                 220
Tyr Thr Ser Asn Glu Glu Lys Trp Val Tyr Gly Val Asn
225                 230                 235
 
<210>26
<211>1035
<212>DNA
<213>向日葵
 
<400>26
cccaaactca ccattttcag taattttttc acaaatttgg agaatgagtt cacagatttt   60
cagatctgct tcacgagccg ctaggtcgat cgtctcatct gcttctaagc agaagcgtct  120
cttctccgaa ggacgatctg ttgctgctgc tacagctgtt tcggtcaaag gagtcttgcc  180
agctctagct tcttttgggc gtgatcattc tggaaactca tccagcacat ggattgccgg  240
agcactcgct ctccctgctg cagcatacat gcttcaagac caagaggcac atgcagcaca  300
gatggagcgc actttcattg ctatcaagcc agatggtgtg caaagaggac tgatttcaga  360
gatcatagct cggtttgaac gtaaaggctt taaactcgta gccattaaac ttgtgacccc  420
tactaagtcc tttgctcaga agcattacca tgatcttaag gaaagaccat tttttgatgg  480
gctgtgtgac ttccttagct ctggtcccgt tcttgccatg gtttgggaag gtgaaggtgt  540
tatcaagtat gggcgtaaac tcattggagc cacagatcca caaaaatcag aaccgggaac  600
tatcaggggt gatttggctg ttgttgtggg aaggaacatc atccatggaa gtgacggtcc  660
agaaaccgcc aaggatgaaa tcaacttatg gttcaaacca gaggagttga cgaattacac   720
aagcaaccaa gaaaagtggg tctatggagt caactaatgg catctgtttt ttgctttgtc   780
gactgcctag gcaaattagt tcttcggctg caagaataaa aaccaaagaa taaaatgtcc   840
tttttttcct tgaaaatgag caaaacagta tcagttttgt aacttaaaag atactcaaag   900
accatcttta tagttgttaa agactagtat ttggttaatg cagggctgtt ttaattttac   960
ttattttgat tttgcacttt atttagttgt tgaaaacaaa attggttagt tttttttaaa  1020
aaaaaaaaaa aaaaa                                                   1035
 
<210>27
<211>237
<212>PRT
<213>向日葵
 
<400>27
 
Met Ser Ser Gln Ile Phe Arg Ser Ala Ser Arg Ala Ala Arg Ser Ile
1               5                   10                  15
Val Ser Ser Ala Ser Lys Gln Lys Arg Leu Phe Ser Glu Gly Arg Ser
            20                  25                  30
Val Ala Ala Ala Thr Ala Val Ser Val Lys Gly Val Leu Pro Ala Leu
        35                  40                  45
Ala Ser Phe Gly Arg Asp His Ser Gly Asn Ser Ser Ser Thr Trp Ile
    50                  55                  60
Ala Gly Ala Leu Ala Leu Pro Ala Ala Ala Tyr Met Leu Gln Asp Gln
65                  70                  75                  80
Glu Ala His Ala Ala Gln Met Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ala Arg Phe Glu
            100                 105                 110
Arg Lys Gly Phe Lys Leu Val Ala Ile Lys Leu Val Thr Pro Thr Lys
        115                 120                 125
Ser Phe Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Asp Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala
                165                 170                 175
Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys Asp Glu Ile Asn Leu Trp Phe Lys Pro Glu Glu Leu Thr Asn
    210                 215                 220
Tyr Thr Ser Asn Gln Glu Lys Trp Val Tyr Gly Val Asn
225                 230                 235
 
<210>28
<211>901
<212>DNA
<213>大豆
 
<400>28
gcctcacagg tttgcaaatc tgcttccaga gccgcgaggt cccttctatc ctctcgtttt   60
cactctcaag gacgtgcgct tggggctgct gcggctgttt cattgagcag caaagtgcct  120
cttttttacg gaaagaacgg ttctggaaat ggatccgctt cttcatcatc atcatcatca  180
tggatttcag gagctcttgc tcttcctgcc gcagcttaca tgttccaaga tcaggaggtg  240
caggcagctg agctggagcg cactttcatt gccattaagc ctgatggagt gcagagaggc  300
ctgatttctg agattatatc tcgttttgag cggaaagggt acaagcttgt gggaattaaa  360
gtagtgattc ctaaaaagga atttgcccaa aggcactatc acgacctgaa agaaagaccc  420
ttcttcgatg ggctgtgtga ttttctaagc tctggccctg ttattgcaat ggtgtgggaa  480
ggacagggag ttatttccta tggccgaaag ctaattggag ccacagatcc acagaaatca  540
gaacctggaa ccattagggg tgatcttgct gttgttgttg gaagaaacat catccatggg  600
agtgatggtc cagaaactgc caaggatgag attaagttgt ggtttaagcc agaggagttg  660
gttagtttca ctagcaatgc agagaagtgg atttatggtg ccaactgatt ctttccctca  720
tgccttgggt tttctataac aactgctcag tgagtttttg gaataaatta tttgtcagaa  780
tgaactctag aagccataaa taagcgcgat tgagaatttg agattggtac ggttaatata  840
ttttaatagg aattgcattg tttttatctt ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa  900
a                                                                  901
 
<210>29
<211>235
<212>PRT
<213>大豆
 
<400>29
 
Ala Ser Gln Val Cys Lys Ser Ala Ser Arg Ala Ala Arg Ser Leu Leu
1               5                   10                  15
Ser Ser Arg Phe His Ser Gln Gly Arg Ala Leu Gly Ala Ala Ala Ala
            20                  25                  30
Val Ser Leu Ser Ser Lys Val Pro Leu Phe Tyr Gly Lys Asn Gly Ser
        35                  40                  45
Gly Asn Gly Ser Ala Ser Ser Ser Ser Ser Ser Ser Trp Ile Ser Gly
    50                  55                  60
Ala Leu Ala Leu Pro Ala Ala Ala Tyr Met Phe Gln Asp Gln Glu Val
65                  70                  75                  80
Gln Ala Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly
                85                  90                  95
Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu Arg Lys
            100                 105                 110
Gly Tyr Lys Leu Val Gly Ile Lys Val Val Ile Pro Lys Lys Glu Phe
        115                 120                 125
Ala Gln Arg His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asp Gly
    130                 135                 140
Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met Val Trp Glu
145                 150                 155                 160
Gly Gln Gly Val Ile Ser Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp
                165                 170                 175
Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val
            180                 185                 190
Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys
        195                 200                 205
Asp Glu Ile Lys Leu Trp Phe Lys Pro Glu Glu Leu Val Ser Phe Thr
    210                 215                 220
Ser Asn Ala Glu Lys Trp Ile Tyr Gly Ala Asn
225                 230                 235
 
<210>30
<211>1105
<212>DNA
<213>陆地棉
 
<400>30
gaaaacacat cactgccctt gcactcggct cataccaatc aatcaaaatc cccaaaaaaa   60
tattaaaaaa aatgagctct cagattttca gatctgcttc tagagccgcc aggtctctcc  120
tttcagcatc caaggcttct cgcttttact ctgaagggcg agctgtagct gccgctgcag  180
cagtttcact tggcggtaaa gtgcctcttt tggcttcagc ttatggaagt actgcttctg  240
ccaatgcatc tagagcatgg ctttcaggag tttttgctct tccagtggca gcttacatgc  300
ttcaggagca ggaggttcat gctgcagaga tggagcgcac cttcattgct atcaagccag  360
atggagtgca aagagggctg atttcggaga tcatctctcg ttttgagcgc aaagggttca  420
agcttgtggc tatcaagttg gtagttcctt caaaggagtt tgcccagaaa cattatgatg  480
acttgaagga aagacccttt ttcaatggcc tgtgtgaatt cctcagctct ggccctgttc  540
ttgccatggt ctgggaagga gagggagtga tcaaatacgg ccggaaactc attggagcaa  600
cagatcctca aaaatcagag cctggaacca tcagaggtga tctagccgtg gttgtcggaa  660
ggaatataat tcatgggagt gatggtcctg agactgccaa gcatgaaatc aacttgtggt  720
tcaagccaca agagttggtt aactatacaa gcaacgctga gaaatgggtc tatggaaaca  780
actgatgagg gcatgttttt tcaagttaat cagtagtagt tcaggaaaat ttagtcccat  840
atcaggtgtg ggttagaggc ataatttttt agaataaatg cgttttatgg atgtgaggag  900
cattgagcca aaagctttga tttttgttat agttaaacta gtgctcaaaa aataatatct  960
ttttcttttc ttcagactca aaataataat ccctttcacc tgtttaatat agggtggaaa 1020
taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080
aaaaaaaaaa aaaaaaaaaa aaaaa                                       1105
<210>31
<211>237
<212>PRT
<213>陆地棉
 
<400>31
 
Met Ser Ser Gln Ile Phe Arg Ser Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Lys Ala Ser Arg Phe Tyr Ser Glu Gly Arg AlaVal
            20                  25                  30
Ala Ala Ala Ala Ala Val Ser Leu Gly Gly Lys Val Pro Leu Leu Ala
        35                  40                  45
Ser Ala Tyr Gly Ser Thr Ala Ser Ala Asn Ala Ser Arg Ala Trp Leu
    50                  55                  60
Ser Gly Val Phe Ala Leu Pro Val Ala Ala Tyr Met Leu Gln Glu Gln
65                  70                  75                  80
Glu Val His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu
            100                 105                 110
Arg Lys Gly Phe Lys Leu Val Ala Ile Lys Leu Val Val Pro Ser Lys
        115                 120                 125
Glu Phe Ala Gln Lys His Tyr Asp Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Asn Gly Leu Cys Glu Phe Leu Ser Ser Gly Pro Val Leu Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala
                165                 170                 175
Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys His Glu Ile Asn Leu Trp Phe Lys Pro Gln Glu Leu Val Asn
    210                 215                 220
Tyr Thr Ser Asn Ala Glu Lys Trp Val Tyr Gly Asn Asn
225                 230                 235
 
<210>32
<211>1007
<212>DNA
<213>大豆
 
<400>32
tatttctgtg ccaacaaaag aagatggcct cacaggtttg caaagctgct tccagagccg   60
cgaggtccct tctctccgct tccagagcct cccatggacg tgcggttggg gctgctacgg  120
ctgtttcatt gagctgcaaa gtgcctcttt tctacggaaa gaacggttct ggaagtggtt  180
ccgcttcatc atcatcatca tcatggattt caggagcact tgctcttcct gccgcagctt  240
acatgttcca agatcaggag gtgcgcgcag ctgagctgga gcgcactttc attgccatta  300
agcctgatgg agtgcagaga gggctgattt ctgagattat atctcgtttt gagcggaaag  360
ggtacaagct tgtggggatt aaagtagtga ttccttcaaa ggaatttgcc caaaagcact  420
atcacgacct gaaagaaaga cccttcttcg atgggctgtg tgatttcctt agctctggcc  480
ctgttattgc aatggtgtgg gaaggacagg gagttatttc ctatggccga aagctaattg  540
gagccacaga tcctcagaaa tcagaacctg gaaccattag gggtgatctt gctgttgttg  600
ttggaagaaa tatcattcat gggagtgatg gtcctgagac tgccaaggat gagattaagt  660
tgtggtttaa gccagaggag ttggttagtt tcactagcaa tgcagaaaag tgggtttatg  720
gtgtcaactg attctttccc tcatgccttg ggttttctat aacaactgct cagtgagttt  780
ttgaaataaa ttatttgtca gcggcaatac taatgaactc tggaagccac aaataagcgc  840
gattgagaat agtaccaata ggaattgcat tatttttata ttttattagc cgggtgaaga  900
caatgtgtga catttattat gccaatactt caaaatgggt taattggcct tttgaaagga  960
gttgaggatg atttgttcat cctataataa aaaaaaaaaa aaaaaaa               1007
 
<210>33
<211>235
<212>PRT
<213>大豆
 
<400>33
Met Ala Ser Gln Val Cys Lys Ala Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Arg Ala Ser His Gly Arg Ala ValGly Ala Ala Thr
            20                  25                  30
Ala Val Ser Leu Ser Cys Lys Val Pro Leu Phe Tyr Gly Lys Asn Gly
        35                  40                  45
Ser Gly Ser Gly Ser Ala Ser Ser Ser Ser Ser Ser Trp Ile Ser Gly
    50                  55                  60
Ala Leu Ala Leu Pro Ala Ala Ala Tyr Met Phe Gln Asp Gln Glu Val
65                  70                  75                  80
Arg Ala Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly
                85                  90                  95
Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu Arg Lys
            100                 105                 110
Gly Tyr Lys Leu Val Gly Ile Lys Val Val Ile Pro Ser Lys Glu Phe
        115                 120                 125
Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asp Gly
    130                 135                 140
Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met Val Trp Glu
145                 150                 155                 160
Gly Gln Gly Val Ile Ser Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp
                165                 170                 175
Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val
            180                 185                 190
Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys
        195                 200                 205
Asp Glu Ile Lys Leu Trp Phe Lys Pro Glu Glu Leu Val Ser Phe Thr
    210                 215                 220
Ser Asn Ala Glu Lys Trp Val Tyr Gly Val Asn
225                 230                 235
<210>34
<211>1089
<212>DNA
<213>玉米
 
<400>34
cgagcgaccg caccggcacg gcgcccatcc atccatcgcc atcctctagc ccagtccaaa    60
ggaaccctag ccatgagcgc cgcctccaag aagctcttcc aggccgccag gtccctcgtc   120
ctctccgctt ctaaccgctc cgtcctcgcc gccgagggcc gcaccgccgc gctcgccacg   180
ctcaccaact ttggcaggaa gaccctcccc accgcctact tatcctacca caagcaggga   240
tcccaccatg ccgcgtcggg gtggggagcc atcgccgccg cagtcccagc tgcagtttac   300
atgctccagg accaggaggc tcatgctgca gagatggagc gcaccttcat tgccatcaag   360
cctgatggtg tccaaagagg cctgatttct gagattatga gccgatttga gagaaaaggc   420
tataagcttg ttgccatcaa gctgattgtt ccatccaaag aatttgctga gaagcactac   480
catgatctca aggaaaggcc tttcttcagt gggttgtgtg attttctcag ctctggccct   540
gtgcttgcaa tggtttggga aggagagggt gtcatcaagt atgggagaaa actaattggt   600
gccacagacc cacagaaatc tgaaccagga accatcaggg gtgatcttgc cattgttgtt   660
ggaagaaaca tcattcatgg aagtgatggc ccagagacag cgaaggatga gatcgcttta   720
tggtttgaac ccaaggagct ggtctcttac accagcaatg cggagaagtg gatctatggg   780
gtgaattaac gagagagtca atctgttttt tttccttctt ttgatctcgg ttttcacata   840
attgccgaca gacctaggca caaggatgta ataaagtcgc taccgtcact tctgagttgg   900
attgtgacct tcaggtgtag taaggcacaa ggaaggatgg aaaggaaagg aatataccgt   960
gaaatataga gcgtgcactg agtagtcgcg atgttcaaat caaactatat atcaccgtca  1020
ctggagtcat gtaatccaag atggtgatgc agatgtttct ttggatctat ttctctagat  1080
atccctacc                                                          1089
 
<210>35
<211>238
<212>PRT
<213>玉米
 
<400>35
 
Met Ser Ala Ala Ser Lys Lys Leu Phe Gln Ala Ala Arg Ser Leu Val
1               5                   10                  15
Leu Ser Ala Ser Asn Arg SerVal Leu Ala Ala Glu Gly Arg Thr Ala
            20                  25                  30
Ala Leu Ala Thr Leu Thr Asn Phe Gly Arg Lys Thr Leu Pro Thr Ala
        35                  40                  45
Tyr Leu Ser Tyr His Lys Gln Gly Ser His His Ala Ala Ser Gly Trp
    50                  55                  60
Gly AlaIle Ala Ala Ala Val Pro Ala Ala Val Tyr Met Leu Gln Asp
65                  70                  75                  80
Gln Glu Ala His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys
                85                  90                  95
Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Met Ser Arg Phe
            100                 105                 110
Glu Arg Lys Gly Tyr Lys Leu Val Ala Ile Lys Leu Ile Val Pro Ser
        115                 120                 125
Lys Glu Phe Ala Glu Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe
    130                 135                 140
Phe Ser Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala Met
145                 150                 155                 160
Val Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly
                165                 170                 175
Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu
            180                 185                 190
Ala Ile Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu
        195                 200                 205
Thr Ala Lys Asp Glu Ile Ala Leu Trp Phe Glu Pro Lys Glu Leu Val
    210                 215                 220
Ser Tyr Thr Ser Asn Ala Glu Lys Trp Ile Tyr Gly Val Asn
225                 230                 235
 
<210>36
<211>480
<212>DNA
<213>玉米
 
<400>36
ctgcagagat ggagcgcact ttcatcgcca tcaagcccga cggcgtccaa agaggcctga   60
tttctgagat tgtgaaccga ttcgagagaa aaggctacaa gcttgttgcc atcaagctga  120
ttgtcccatc caaaggattc gctgagaagc actaccatga tctcaaggaa aggcctttct  180
tcaacgggtt gtgtgacttc ctcagctctg gccctgtact tgcaatggtt tgggaaggag  240
agggtgtcat caagtatggg agaaaactaa ttggtgccac agacccacag aaatctgaac  300
caggaaccat caggggcgat cttggtgttg ttgtgggaag aaacatcatt catggaagtg  360
atggcccgga gacagcaaag gatgagatcg ccttgtggtt tgaacccaag gagctggtct  420
cttataccag caatgcggag aagtgggtct atggggtgaa ttaaccagcg actaaatctc  480
 
<210>37
<211>151
<212>PRT
<213>玉米
 
<400>37
 
Met Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly
1               5                   10                  15
Leu Ile Ser Glu Ile Val Asn Arg Phe Glu Arg Lys Gly Tyr Lys Leu
            20                  25                  30
Val Ala Ile Lys Leu Ile Val Pro Ser Lys Gly Phe Ala Glu Lys His
        35                  40                  45
Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asn Gly Leu Cys Asp Phe
    50                  55                  60
Leu Ser Ser Gly Pro Val Leu Ala Met Val Trp Glu Gly Glu Gly Val
65                  70                  75                  80
Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp Pro Gln Lys Ser
                85                  90                  95
Glu Pro Gly Thr Ile Arg Gly Asp Leu Gly Val Val Val Gly Arg Asn
            100                 105                 110
Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys Asp Glu Ile Ala
        115                 120                 125
Leu Trp Phe Glu Pro Lys Glu Leu Val Ser Tyr Thr Ser Asn Ala Glu
    130                 135                 140
Lys Trp Val Tyr Gly Val Asn
145                 150
 
<210>38
<211>606
<212>DNA
<213>大豆
 
<400>38
atattggagc tccaccgcgg tggcggacgc tctagaacta gtggatcccc cgggctgcag    60
gaattcggca cgagcaacaa aagaagatgg cctcacaggt ttgcaaagct gcttccagag   120
ccgcgaggtc ccttctctcc gcttccagag cctcccatgg acgtgcggtt ggggctgcta   180
cggctgtttc attgagctgc aaagtgcctc ttttctacgg aaagaacggt tctggaagtg   240
gttccgcttc atcatcatca tcatcatgga tttcaggagc acttgctctt cctgccgcag   300
cttacatgtt ccaagatcag gaggtgcgcg cagctgagct ggagcgcact ttcattgcca   360
ttaagcctga tggagtgcag agagggctga tttctgagat tatatctcgt tttgagcgga   420
aagggtacaa gcttgtgggg attaaagtag tgattccttc aaaggaattt gcccaaaagc   480
actatcacga cctgaaagaa agacccttct tcgatgggct gtgtgatttc cttagctctg   540
gccctgttat tgcaatgggt gtgggaagga caagggagtt atttcctatg gccgaaagct   600
aattgg                                                              606
 
<210>39
<211>171
<212>PRT
<213>大豆
 
<400>39
 
Met Ala Ser Gln Val Cys Lys Ala Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Arg Ala Ser His Gly Arg Ala Val Gly Ala Ala Thr
            20                  25                  30
Ala Val Ser Leu Ser Cys Lys Val Pro Leu Phe Tyr Gly Lys Asn Gly
        35                  40                  45
Ser Gly Ser Gly Ser Ala Ser Ser Ser Ser Ser Ser Trp Ile Ser Gly
    50                  55                  60
Ala Leu Ala Leu Pro Ala Ala Ala Tyr Met Phe Gln Asp Gln Glu Val
65                  70                  75                  80
Arg Ala Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly
                85                  90                  95
Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu Arg Lys
            100                 105                 110
Gly Tyr Lys Leu Val Gly Ile Lys Val Val Ile Pro Ser Lys Glu Phe
        115                 120                 125
Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asp Gly
    130                 135                 140
Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met Gly Val Gly
145                 150                 155                 160
Arg Thr Arg Glu Leu Phe Pro Met Ala Glu Ser
                165                 170
 
<210>40
<211>552
<212>DNA
<213>水稻
 
<220>
<221>misc_feature
<222>(436)..(436)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(492)..(492)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(516)..(516)
<223>n为a,c,g,或t
<220>
<221>misc_feature
<222>(551)..(551)
<223>n为a,c,g,或t
 
<400>40
gccactgaga aggagaagag gtcctccgga tcaaagcggc accgacgacg ccggcgaggc     60
cactactacc atatcatagt acatactagt acaagactgg agggctagtg gggtgggggt    120
acaatccaat ccaatccaat caaatcacat cgatcgacgc cgcaacccag cagcagcagc    180
ggaaccctag ccaagccacc atgagcaagc tctgccagtc ggcgtgcaag gccgccaagt    240
ctctcctctc cgccaccgcc gccgcctcct ccccgcgcac ctccctccta gccgagggga    300
ggaacgcggc gctggccacc ctcaccaacc tggggaggaa gacctcccca cagcttacgc    360
ctactcctac caccacaact cctccgccgc cgccgccgga tggctcgctg ccatcccgcc    420
gctgttaatg ctacangatc aggagcgcat gctgcagaga tggagcgcac tttatcgcat    480
caagcctgac gngtcaaagg ggctgattct gaatangtcc gattgaagaa aagatcaagc    540
tgttgcatca nc                                                        552
 
<210>41
<211>75
<212>PRT
<213>水稻
 
<400>41
 
Met Ser Lys Leu Cys Gln Ser Ala Cys Lys Ala Ala Lys Ser Leu Leu
1               5                   10                  15
Ser Ala Thr Ala Ala Ala Ser Ser Pro Arg Thr Ser Leu Leu Ala Glu
            20                  25                  30
Gly Arg Asn Ala Ala Leu Ala Thr Leu Thr Asn Leu Gly Arg Lys Thr
        35                  40                  45
Ser Pro Gln Leu Thr Pro Thr Pro Thr Thr Thr Thr Pro Pro Pro Pro
    50                  55                  60
Pro Pro Asp Gly Ser Leu Pro Ser Arg Arg Cys
65                  70                  75
 
<210>42
<211>719
<212>DNA
<213>玉米
 
<220>
<221>misc_feature
<222>(1)..(11)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(13)..(19)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(22)..(22)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(24)..(27)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(80)..(80)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(494)..(494)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(578)..(578)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(602)..(602)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(606)..(607)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(609)..(609)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(674)..(676)
<223>n为a,c,g,或t
<220>
<221>misc_feature
<222>(691)..(691)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(703)..(703)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(711)..(712)
<223>n为a,c,g,或t
 
<220>
<221>misc_feature
<222>(719)..(719)
<223>n为a,c,g,或t
 
<400>42
nnnnnnnnnn ngnnnnnnnt anannnnttt gtacaaaaaa gcaggctggt accggtccgg    60
aattcccggg atcgcagcgn ctaacgcgtg gccacgccat ccctccgcgt gcctaattaa   120
ttggaagcac ccagcgcaca tcatcagtcg aagtgagcgt cagcgagcga ccgcaccggc   180
acggcgccca tccatccatc gccatcctct agcccagtcc aaaggaaccc tagccatgag   240
cgccgcctcc aagaagctct tccaggccgc caggtccctc gtcctctccg cttctcaccg   300
ctccgtcctc gccgccgagg gccgcaccgc cgcgctcgcc acgctcacca actttggcag   360
gaagaccctc cccaccgcct acttatccta ccacaagcag ggatcccacc atgccgcgtc   420
ggggtgggga gccatcgccg ccgcagtccc agctgcagtt tacatgctcc aggaccagga   480
ggctcatgct gcanagatgg agcgcacctt cattgccatc aagcctgatg gcgtccaaag   540
aggcctgatt tctgagatta tgagccgatt tgagaganaa ggctataagc ttgttgccat   600
cnagcnnant gttccatcca aagaatttgc tgagaagcac taccatgatc tcaaggaaag   660
gcctttcttc agtnnnttgt gtgattttct nggctctggc ccngtgcttg nnatggttn    719
 
<210>43
<211>161
<212>PRT
<213>玉米
 
<220>
<221>misc_feature
<222>(87)..(87)
<223>Xaa可以是任何天然存在的氨基酸
 
<220>
<221>misc_feature
<222>(115)..(115)
<223>Xaa可以是任何天然存在的氨基酸
 
<220>
<221>misc_feature
<222>(123)..(125)
<223>Xaa可以是任何天然存在的氨基酸
 
<220>
<221>misc_feature
<222>(147)..(147)
<223>Xaa可以是任何天然存在的氨基酸
 
<220>
<221>misc_feature
<222>(159)..(159)
<223>Xaa可以是任何天然存在的氨基酸
 
<400>43
 
Met Ser Ala Ala Ser Lys Lys Leu Phe Gln Ala Ala Arg Ser Leu Val
1               5                   10                  15
Leu Ser Ala Ser His Arg Ser Val Leu Ala Ala Glu Gly Arg Thr Ala
            20                  25                  30
Ala Leu Ala Thr Leu Thr Asn Phe Gly Arg Lys Thr Leu Pro Thr Ala
        35                  40                  45
Tyr Leu Ser Tyr His Lys Gln Gly Ser His His Ala Ala Ser Gly Trp
    50                  55                  60
Gly Ala Ile Ala Ala Ala Val Pro Ala Ala Val Tyr Met Leu Gln Asp
65                  70                  75                  80
Gln Glu Ala His Ala Ala Xaa Met Glu Arg Thr Phe Ile Ala Ile Lys
                85                  90                  95
Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Met Ser Arg Phe
            100                 105                 110
Glu Arg Xaa Gly Tyr Lys Leu Val Ala Ile Xaa Xaa Xaa Val Pro Ser
        115                 120                 125
Lys Glu Phe Ala Glu Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe
    130                 135                 140
Phe Ser Xaa Leu Cys Asp Phe Leu Gly Ser Gly Pro Val Leu Xaa Met
145                 150                 155                 160
Val
 
<210>44
<211>239
<212>PRT
<213>水稻
 
<400>44
 
Met Ser Lys Leu Cys Gln Ser Ala Cys Lys Ala Ala Lys Ser Leu Leu
1               5                   10                  15
Ser Ala Thr Ala Ala Ala Ser Ser Pro Arg Thr Ser Leu Leu Ala Glu
            20                  25                  30
Gly Arg Asn Ala Ala Leu Ala Thr Leu Thr Asn Leu Gly Arg Lys Thr
        35                  40                  45
Leu Pro Thr Ala Tyr Ala Tyr Ser Tyr His His Asn Ser Ser Ala Ala
    50                  55                  60
Ala Ala Gly Trp Leu Ala Ala Ile Pro Ala Ala Val Tyr Met Leu Gln
65                  70                  75                  80
Asp Gln Glu Ala His Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile
                85                  90                  95
Lys Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Leu Ser Arg
            100                 105                 110
Phe Glu Arg Lys Gly Phe Lys Leu Val Ala Ile Lys Leu Val Val Pro
        115                 120                 125
Ser Lys Glu Phe Ala Gln Lys His Tyr His Asp Leu Lys Asp Arg Pro
    130                 135                 140
Phe Phe Asn Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Leu Ala
145                 150                 155                 160
Met Val Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile
                165                 170                 175
Gly Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp
            180                 185                 190
Leu Ala Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro
        195                 200                 205
Glu Thr Ala Lys Ala Glu Ile Gly Leu Trp Phe Glu Pro Arg Glu Leu
    210                 215                 220
Val Ser Tyr Thr Ser Asn Glu Glu Lys Trp Ile Tyr Gly Val Asn
225                 230                 235
 
<210>45
<211>233
<212>PRT
<213>豌豆
 
<400>45
 
Met Ala Ser His Leu Cys Lys Ser Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Phe His Ser Gln Gly Arg Ala Val Ala Ala Ala Ala
            20                  25                  30
Ala Val Ala Ser Ile Arg Lys Val Pro Val Phe Ala Pro Asn Tyr Arg
        35                  40                  45
Arg Thr Gly Ser Gly Asn Gly Pro Ser Ser Trp Ile Ala Gly Ala Leu
    50                  55                  60
Ala Leu Pro Ala Ala Ala Tyr Met Leu Gln Asp Gln Glu Val His Ala
65                  70                  75                  80
Ala Glu Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val Gln
                85                  90                  95
Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe Glu Arg Lys Gly Phe
            100                 105                 110
Lys Leu Val Gly Ile Lys Val Leu Ile Pro Thr Lys Gln Phe Ala Gln
        115                 120                 125
Gln His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asn Gly Leu Cys
    130                 135                 140
Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met Val Trp Glu Gly Glu
145                 150                 155                 160
Gly Val Ile Thr Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp Pro Gln
                165                 170                 175
Lys Ser Ala Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val Val Gly
            180                 185                 190
Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys Asp Glu
        195                 200                 205
Ile Lys Leu Trp Phe Lys Pro Glu Glu Leu Val Ser Phe Thr Ser Asn
    210                 215                 220
Ser Glu Lys Trp Ile Tyr Gly Asp Asn
225                 230
 
<210>46
<211>238
<212>PRT
<213>拟南芥
 
<400>46
 
Met Ser Ser Gln Ile Cys Arg Ser Ala Ser Lys Ala Ala Lys Ser Leu
1               5                   10                  15
Leu Ser Ser Ala Lys Asn Ala Arg Phe Phe Ser Glu Gly Arg Ala Ile
            20                  25                  30
Gly Ala Ala Ala Ala Val Ser Ala Ser Gly Lys Ile Pro Leu Tyr Ala
        35                  40                  45
Ser Asn Phe Ala Arg Ser Ser Gly Ser Gly Val Ala Ser Lys Ser Trp
    50                  55                  60
Ile Thr Gly Leu Leu Ala Leu Pro Ala Ala Ala Tyr Met Ile Gln Asp
65                  70                  75                  80
Gln Glu Val Leu Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys
                85                  90                  95
Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Ser Arg Phe
            100                 105                 110
Glu Arg Lys Gly Phe Lys Leu Val Gly Ile Lys Val Ile Val Pro Ser
        115                 120                 125
Lys Asp Phe Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe
    130                 135                 140
Phe Asn Gly Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met
145                 150                 155                 160
Val Trp Glu Gly Asp Gly Val Ile Arg Tyr Gly Arg Lys Leu Ile Gly
                165                 170                 175
Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu
            180                 185                 190
Ala Val Thr Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu
        195                 200                 205
Thr Ala Lys Asp Glu Ile Ser Leu Trp Phe Lys Pro Gln Glu Leu Val
    210                 215                 220
Ser Tyr Thr Ser Asn Ser Glu Lys Trp Leu Tyr Gly Asp Asn
225                 230                 235
 
<210>47
<211>235
<212>PRT
<213>葡萄藤
 
<400>47
 
Met Ser Ser Gln Ile Cys Arg Ser Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ala Ser Lys Ser Ser Asn Leu Leu Ala Glu Gly Arg Ala Val
            20                  25                  30
Ala Ala Val Ala Ala Leu Ser Ser Arg Gly Lys Pro Phe Leu Ser Ser
        35                  40                  45
Phe Gly Asn Ala Gly Ser Gly Asn Ala Tyr Arg Gly Trp Leu Ser Ser
    50                  55                  60
Val Leu Ala Leu Pro Ala Ala Ala Tyr Met Met Gln Glu Gln Glu Leu
65                  70                  75                  80
His Ala Thr Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly
                85                  90                  95
Val Gln Arg Gly Leu Ile Ala Glu Ile Leu Ser Arg Phe Glu Arg Lys
            100                 105                 110
Gly Phe Lys Leu Val Ala Ile Lys Ile Val Val Pro Ser Lys Asp Phe
        115                 120                 125
Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe Asn Gly
    130                 135                 140
Leu Cys Asp Phe Leu Ser Ser Gly Pro Val Val Ala Met Val Trp Glu
145                 150                 155                 160
Gly Glu Gly Val Ile Lys Tyr Gly Arg Lys Leu Ile Gly Ala Thr Asp
                165                 170                 175
Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala Val Val
            180                 185                 190
Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr Ala Lys
        195                 200                 205
Asp Glu Ile Asn Leu Trp Phe Lys Pro Glu Glu Leu Val Asn Tyr Ser
    210                 215                 220
Ser Asn Ala Glu Lys Trp Ile Tyr Gly Val Asn
225                 230                 235
 
<210>48
<211>238
<212>PRT
<213>菥蓂
 
<400>48
 
Met Ser Ser Gln Ile Cys Arg Ser Ala Ser Lys Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ser Ala Arg Asn Val Arg Phe Phe Ser Glu Gly Arg Ala Ile
            20                  25                  30
Gly Ala Ala Ala Ala Val Ser Ala Ser Gly Lys Ile Pro Leu Tyr Ala
        35                  40                  45
Ser Asn Phe Ala Arg Ser Ser Gly Ser Gly Ala Ala Ser Lys Asn Trp
    50                  55                  60
Leu Thr Gly Leu Ile Ala Leu Pro Ala Ala Ala Leu Met Leu Gln Asp
65                  70                  75                  80
Gln Glu Val Leu Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys
                85                  90                  95
Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Val Ser Arg Phe
            100                 105                 110
Glu Arg Lys Gly Phe Lys Leu Val Gly Ile Lys Val Val Val Pro Ser
        115                 120                 125
Lys Asp Phe Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Thr Phe
    130                 135                 140
Phe Asn GlyLeu Cys Asp Phe Leu Ser Ser Gly Pro Val Ile Ala Met
145                 150                 155                 160
Val Trp Glu Gly Glu Gly Val Ile Arg Tyr Gly Arg Lys Leu Ile Gly
                165                 170                 175
Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu
            180                 185                 190
Ala Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu
        195                 200                 205
Thr Ala Lys Asp Glu Ile Asn Leu Trp Phe Lys Pro Gln Glu Leu Val
    210                 215                 220
Ser Tyr Thr Asn Asn Ala Glu Lys Trp Ile Tyr Gly Asp Asn
225                 230                 235
 
<210>49
<211>195
<212>PRT
<213>水稻
 
<400>49
Met Ser Lys Leu Cys Gln Ser Ala Cys Lys Ala Ala Lys Ser Leu Leu
1               5                   10                  15
Ser Ala Thr Ala Ala Ala Ser Ser Gln Arg Thr Ser Leu Leu Ala Val
            20                  25                  30
Tyr Met Leu Gln Asp Gln Glu Ala His Ala Ala Glu Met Glu Arg Thr
        35                  40                  45
Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly Leu Ile Ser Glu
    50                  55                  60
Ile Leu Ser Arg Phe Glu Arg Lys Gly Phe Lys Leu Val Ala Ile Lys
65                  70                  75                  80
Leu Val Val Pro Ser Lys Glu Phe Ala Gln Lys His Tyr His Asp Leu
                85                  90                  95
Lys Asp Arg Pro Phe Phe Asn Gly Leu Cys Asp Phe Leu Ser Ser Gly
            100                 105                 110
Pro Val Leu Ala Met Val Trp Glu Gly Glu Gly Val Ile Lys Tyr Gly
        115                 120                 125
Arg Lys Leu Ile Gly Ala Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr
    130                 135                 140
Ile Arg Gly Asp Leu Ala Val Val Val Gly Arg Asn Ile Ile His Gly
145                 150                 155                 160
Ser Asp Gly Pro Glu Thr Ala Lys Ala Glu Ile Gly Leu Trp Phe Glu
                165                 170                 175
Pro Arg Glu Leu Val Ser Tyr Thr Ser Asn Glu Glu Lys Trp Ile Tyr
            180                 185                 190
Gly Val Asn
        195
 
<210>50
<211>972
<212>DNA
<213>拟南芥
<400>50
ccctgtttgc acatcactct tctcagtcct cacgcatcgt atcagagaaa atgagctccc    60
aaatctgcag atctgcttct agagcagcca ggtctcttct ttcttcagcc aagaatgctc   120
gtttcttctc cgaaggccga gccattggtg cagcaagtgt ggtgcatgcg actggaaaag   180
tccctcagta tgcatccaac tttggaaaat cgggttctgg cttcgtctct aatagctgga   240
tcaccggact ccttgctctt cctgctgcag ccttcatgct ccaagatcag gaagcacttg   300
ctgcagagat ggaacgcact ttcatcgcta tcaaacctga tggagtgcag cgaggactga   360
tatcagaaat cattacacgg ttcgaacgca aaggatacaa gcttgttggc attaaagtca   420
tggttccttc aaagggtttc gcgcagaagc attaccatga tctaaaggag agacctttct   480
tcaacggctt gtgtaacttc cttagctcag gccctgttgt tgccatggta tgggaaggtg   540
aaggagtgat tagatacgga cgtaaactga ttggagccac tgatcctcag aaatcagaac   600
ctggaactat ccgaggcgat ctcgctgttg ttgttggaag gaacattata catggaagcg   660
atggaccaga gacagctaaa gacgagatca gcttgtggtt taagcctgaa gaactcgttt   720
cttacactag taacgctgag aagtggatct acggccagaa ctgaactatt ccctctttct   780
cccttatttt caaccgttag atcagacata aataattact tcttttgttt tttcttttac   840
ccaaacactg aaaacgtacc gggaataaca aatttactgc atttgttatc aagtttgttc   900
taatagaccc aatgaaatta ggccacgtgt gcgatcatgt aaccggttta ccgtaatgtg   960
gacttgaaat cc                                                       972
 
<210>51
<211>237
<212>PRT
<213>拟南芥
 
<400>51
Met Ser Ser Gln Ile Cys Arg Ser Ala Ser Arg Ala Ala Arg Ser Leu
1               5                   10                  15
Leu Ser Ser Ala Lys Asn Ala Arg Phe Phe Ser Glu Gly Arg Ala Ile
            20                  25                  30
Gly Ala Ala Ser Val Val His Ala Thr Gly Lys Val Pro Gln Tyr Ala
        35                  40                  45
Ser Asn Phe Gly Lys Ser Gly Ser Gly Phe Val Ser Asn Ser Trp Ile
    50                  55                  60
Thr Gly Leu Leu Ala Leu Pro Ala Ala Ala Phe Met Leu Gln Asp Gln
65                  70                  75                  80
Glu Ala Leu Ala Ala Glu Met Glu Arg Thr Phe Ile Ala Ile Lys Pro
                85                  90                  95
Asp Gly Val Gln Arg Gly Leu Ile Ser Glu Ile Ile Thr Arg Phe Glu
            100                 105                 110
Arg Lys Gly Tyr Lys Leu Val Gly Ile Lys Val Met Val Pro Ser Lys
        115                 120                 125
Gly Phe Ala Gln Lys His Tyr His Asp Leu Lys Glu Arg Pro Phe Phe
    130                 135                 140
Asn Gly Leu Cys Asn Phe Leu Ser Ser Gly Pro Val Val Ala Met Val
145                 150                 155                 160
Trp Glu Gly Glu Gly Val Ile Arg Tyr Gly Arg Lys Leu Ile Gly Ala
                165                 170                 175
Thr Asp Pro Gln Lys Ser Glu Pro Gly Thr Ile Arg Gly Asp Leu Ala
            180                 185                 190
Val Val Val Gly Arg Asn Ile Ile His Gly Ser Asp Gly Pro Glu Thr
        195                 200                 205
Ala Lys Asp Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Ser
    210                 215                 220
Tyr Thr Ser Asn Ala Glu Lys Trp Ile Tyr Gly Gln Asn
225                 230                 235
 
<210>52
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>52
ggggacaagt ttgtacaaaa aagcaggct                                      29
 
<210>53
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>53
ggggaccact ttgtacaaga aagctgggt                                      29
 
<210>54
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>54
ttaaacaagt ttgtacaaaa aagcaggctg caattaaccc tcactaaagg gaac          54
 
<210>55
<211>53
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>55
ttaaaccact ttgtacaaga aagctgggtg cgtaatacga ctcactatag ggc           53
 
<210>56
<211>12856
<212>DNA
<213>人工序列
 
<220>
<223>载体
 
<400>56
cgccttggcg cgccgatcat ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa    60
tgatataaat atcaatatat taaattagat tttgcataaa aaacagacta cataatactg   120
taaaacacaa catatccagt cactatggcg gccgcattag gcaccccagg ctttacactt   180
tatgcttccg gctcgtataa tgtgtggatt ttgagttagg atttaaatac gcgttgatcc   240
ggcttactaa aagccagata acagtatgcg tatttgcgcg ctgatttttg cggtataaga   300
atatatactg atatgtatac ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta   360
ttacagtgac agttgacagc gacagctatc agttgctcaa ggcatatatg atgtcaatat   420
ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg    480
gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg tttattgaaa tgaacggctc    540
ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa ggtttacacc tataaaagag    600
agagccgtta tcgtctgttt gtggatgtac agagtgatat cattgacacg cccggtcgac    660
ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt    720
acccggtggt gcatatcggg gatgaaagct ggcgcatgat gaccaccgat atggccagtg    780
tgccggtctc cgttatcggg gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca    840
aaaacgccat taacctgatg ttctggggaa tataaatgtc aggctccctt atacacagcc    900
agtctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta tgtagtctgt    960
tttttatgca aaatctaatt taatatattg atatttatat cattttacgt ttctcgttca   1020
gctttcttgt acaaagtggt gttaacctag acttgtccat cttctggatt ggccaactta   1080
attaatgtat gaaataaaag gatgcacaca tagtgacatg ctaatcacta taatgtgggc   1140
atcaaagttg tgtgttatgt gtaattacta gttatctgaa taaaagagaa agagatcatc   1200
catatttctt atcctaaatg aatgtcacgt gtctttataa ttctttgatg aaccagatgc   1260
atttcattaa ccaaatccat atacatataa atattaatca tatataatta atatcaattg   1320
ggttagcaaa acaaatctag tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg   1380
agctcgaatt ccggtccggg tcacctttgt ccaccaagat ggaactgcgg ccgctcatta   1440
attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta agaagacact   1500
cagtagtctt cggccagaat ggccatctgg attcagcagg cctagaaggc catttaaatc   1560
ctgaggatct ggtcttccta aggacccggg atatcggacc gattaaactt taattcggtc   1620
cgaagcttga agttcctatt ccgaagttcc tattctccag aaagtatagg aacttcgcat   1680
gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc   1740
taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc   1800
tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat   1860
aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt   1920
gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt   1980
ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta   2040
gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt   2100
ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga   2160
tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa    2220
aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc    2280
gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca    2340
gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt    2400
ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc    2460
acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca    2520
ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct    2580
ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc    2640
cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc ccctctctac    2700
cttctctaga tcggcgttcc ggtccatgca tggttagggc ccggtagttc tacttctgtt    2760
catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat    2820
gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat    2880
cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt    2940
tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc    3000
gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt    3060
cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat    3120
ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc    3180
gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt    3240
ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg    3300
gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt    3360
gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta    3420
tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca    3480
tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt    3540
gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct    3600
gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt    3660
ttggtgttac ttctgcaggt cgactttaac ttagcctagg atccacacga caccatgata    3720
gaggtgaaac cgattaacgc agaggatacc tatgaactaa ggcatagaat actcagacca    3780
aaccagccga tagaagcgtg tatgtttgaa agcgatttac ttcgtggtgc atttcactta    3840
ggcggctatt acgggggcaa actgatttcc atagcttcat tccaccaggc cgagcactca    3900
gaactccaag gccagaaaca gtaccagctc cgaggtatgg ctaccttgga aggttatcgt    3960
gagcagaagg cgggatcgag tctaattaaa cacgctgaag aaattcttcg taagaggggg    4020
gcggacttgc tttggtgtaa tgcgcggaca tccgcctcag gctactacaa aaagttaggc    4080
ttcagcgagc agggagaggt attcgacacg ccgccagtag gacctcacat cctgatgtat    4140
aaaaggatca cataactagc tagtcagtta acctagactt gtccatcttc tggattggcc    4200
aacttaatta atgtatgaaa taaaaggatg cacacatagt gacatgctaa tcactataat    4260
gtgggcatca aagttgtgtg ttatgtgtaa ttactagtta tctgaataaa agagaaagag    4320
atcatccata tttcttatcc taaatgaatg tcacgtgtct ttataattct ttgatgaacc    4380
agatgcattt cattaaccaa atccatatac atataaatat taatcatata taattaatat    4440
caattgggtt agcaaaacaa atctagtcta ggtgtgtttt gcgaattcag agctcgaatt    4500
cattccgatt aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa    4560
gcgctactag acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag    4620
cgtcaatttg tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg    4680
gcagctcggc acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag    4740
cgggagagcc gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac    4800
ggcaactaag ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg    4860
taacgatgac agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa    4920
ttatcagcct tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta    4980
tgccgacata ataggaaatc gctggataaa gccgctgagg aagctgagtg gcgctatttc    5040
tttagaagtg aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt    5100
tctgaacaca gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc    5160
gtttgtgtaa ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac    5220
tagatgttga ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt    5280
caggccgtta tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca    5340
gaagctccca tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct    5400
tttgccagat gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc    5460
gaaagtgcga gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc    5520
gtaattggat gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt    5580
gtcgtaattg cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga    5640
gtagtcatag ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg    5700
ccccgatgcc atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt    5760
ccccagctct ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat    5820
tgttagacat tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc    5880
ttccaactga tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc    5940
ttcaagtatg acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac    6000
atccttcggc gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac    6060
tacatttcgc tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt    6120
tagcgcctca aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc    6180
taccaaggca acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat    6240
cgtggctggc tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag    6300
ttcgcgctta gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc    6360
tacagcgcgg agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat    6420
caaagctcgc cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc    6480
actgtgtggc ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt    6540
cggttcgaga tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc    6600
gatcaccgct tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc    6660
ggcttgaatg aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc    6720
tgtttcgttc gagacttgag gtctagtttt atacgtgaac aggtcaatgc cgccgagagt    6780
aaagccacat tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg    6840
tatgccaagg agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc    6900
gactcctttg cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt    6960
ccatgttgag ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca    7020
agcagagtct tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact    7080
tctggtagat agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat    7140
gaaatggttc tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat    7200
atgacgccta acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg    7260
cgtgacaggt ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac    7320
tataatttat gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt    7380
caggaaagta aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta    7440
cttgatcggg ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac    7500
atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc    7560
cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt    7620
agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag    7680
tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc    7740
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg    7800
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa    7860
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg    7920
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga    7980
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg    8040
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg    8100
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc    8160
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg    8220
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca    8280
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt    8340
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag    8400
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg    8460
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc    8520
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt    8580
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt    8640
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca    8700
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg    8760
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac    8820
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg    8880
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc    8940
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg    9000
cagggggggg gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg    9060
aaacgacaga ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg    9120
gtattttaaa taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa   9180
aattttcata aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg   9240
aaaggacccg taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat   9300
caaaccacgt caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact   9360
taacgtaaaa acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat   9420
gtcccccccc cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct   9480
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa   9540
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta   9600
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc   9660
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg   9720
agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa   9780
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg   9840
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc   9900
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg   9960
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat  10020
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata  10080
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc  10140
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc  10200
gacgatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg  10260
cgagatccag caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg  10320
ccaggacgtc ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc  10380
gatcgaggat ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag  10440
cagcccactc gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct  10500
ccgtcgtcag gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc  10560
caagcactcc cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa  10620
accttttcac gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt  10680
acccgccaat atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc  10740
tgatcatgag cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa  10800
gccgttttac gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg  10860
tacgattgta atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact  10920
ggaagagcgg ttacccggac cgaagcttga agttcctatt ccgaagttcc tattctctag  10980
aaagtatagg aacttcagat ctcgatgctc accctgttgt ttggtgttac ttctgcaggt  11040
cgactctaga ggatccacca tgagcccaga acgacgcccg gccgacatcc gccgtgccac  11100
cgaggcggac atgccggcgg tctgcaccat cgtcaaccac tacatcgaga caagcacggt  11160
caacttccgt accgagccgc aggaaccgca ggactggacg gacgacctcg tccgtctgcg  11220
ggagcgctat ccctggctcg tcgccgaggt ggacggcgag gtcgccggca tcgcctacgc  11280
gggcccctgg aaggcacgca acgcctacga ctggacggcc gagtcgaccg tgtacgtctc  11340
cccccgccac cagcggacgg gactgggctc cacgctctac acccacctgc tgaagtccct  11400
ggaggcacag ggcttcaaga gcgtggtcgc tgtcatcggg ctgcccaacg acccgagcgt  11460
gcgcatgcac gaggcgctcg gatatgcccc ccgcggcatg ctgcgggcgg ccggcttcaa  11520
gcacgggaac tggcatgacg tgggtttctg gcagctggac ttcagcctgc cggtaccgcc  11580
ccgtccggtc ctgcccgtca ccgagatctg atccgtcgac caacctagac ttgtccatct  11640
tctggattgg ccaacttaat taatgtatga aataaaagga tgcacacata gtgacatgct  11700
aatcactata atgtgggcat caaagttgtg tgttatgtgt aattactagt tatctgaata  11760
aaagagaaag agatcatcca tatttcttat cctaaatgaa tgtcacgtgt ctttataatt  11820
ctttgatgaa ccagatgcat ttcattaacc aaatccatat acatataaat attaatcata  11880
tataattaat atcaattggg ttagcaaaac aaatctagtc taggtgtgtt ttgcgaattg  11940
cggccgcgat ctggggaatt cccatggaca ccggtaattc ccatgatctt ctctccttca  12000
tcaatggatg ccatgtttca taacaataac accaaatgtt tgatgagcta ccaacaattg  12060
cgcaaagact atggctaagc tcgagctcgc tcgctacaag ttgttgactt tcaaatacaa  12120
gtttgttttt ggaacaccaa atattctaca tgatctttca ctaagttgcg caccactatc  12180
aaaagattat ctaggccatt attcaagtaa agagtgaaca cgtctaagac ccacaaccac  12240
accaaataga atacgcatac atgcaacata ttgtgcaaga agtatccaac tggactccca  12300
tgtattctaa aactattttc gtagagttaa agttatgaca aacttatcaa ataaaaattt  12360
gaacgctgga ccaaaacttt catctttcaa atccaccatc gtctatcctc ataaattgtt  12420
ttgattataa cacatctacg taaatcattt gttttgaaca atactaattt aattttatta  12480
agtcaaataa cctgcttaga aaataatccc tccacctcat ttaacaattt cttgtcaaac  12540
acacaccaag aaaaaaatta atgaaagaga aaagaaatga aaaggacatg gagttgaata  12600
ctagcaaaat tgattgaagg aagattcaca attgaaattg aaaccattta atttattttc  12660
gggtccataa taataaattg gtaagaataa aaacccgatc aagtccggta cagtacaatt  12720
ccactccacc aactccttac ttaaacccct atttataccc actctcatcc tcactcttcc  12780
ttcacctctc acactctctt ctctctctca aaaccctcac acaaacgctg cgtttagtgt  12840
aagaaattca atccgg                                                  12856
 
<210>57
<211>825
<212>DNA
<213>玉米
 
<400>57
aaatccttac agaattgctg tagtttcata gtgctagatg tggacagcaa agcgccgctg     60
tatgcttctg cttttctttt ttggtgtgtg tagccacatc ctttgttcct gcccggcgcc    120
atcccacttg gttgtttttt tttatgattg aaagccttca tgcttcctcg gtcaatcacc    180
ggtgcgcact gggagcatcg ccggaaaaaa aattcttcgg ctaagagtaa cttctttctc    240
cttttcttct ctgatctcgc gagcagtgct gataacgtgt tgtaatctac ttagcggtaa    300
cgagattgag agagacaaaa tgacagaact attgtcttta ttgcagagtg tcatgtattt    360
atacagggga tacaaagtct cccaaggggt gtgtcccttg ggagtaactg ccagttgatc    420
acaggacaat attttgtaac aaaacgtaca catcgtcaaa atagcgaggc atgaaactgg    480
ccttggccat ggacgcgtga agcgcgccat gcgttggata tgtggtcaat aagtatatac    540
aatacaatgt ttaacagagc tgatagtact gctttggcac atttttgtcc acgcttcatg    600
agagataaaa cacctgcacg taaattcaca tgctgcactg aaggcccgat cactgaggag    660
cgaactgccg taactccctt ctatatatac ccccagtccc tgtttcagtt ttcgtcaagc    720
tagcagcacc aagttgtcga tcacttgcct gctcttgagc tcgattaagc tatcatcagc    780
tacagcatcc gatcccaaac tgcaactgta gcagcgacaa ctgcc                    825
 
<210>58
<211>860
<212>DNA
<213>玉米
 
<400>58
ctggtaatta ttggctgtag gattctaaac agagcctaaa tagctggaat agctctagcc     60
ctcaatccaa actaatgata tctatactta tgcaactcta aatttttatt ctaaaagtaa    120
tatttcattt ttgtcaacga gattctctac tctattccac aatcttttga agcaatattt    180
accttaaatc tgtactctat accaataatc atatattcta ttatttattt ttatctctct    240
cctaaggagc atccccctat gtctgcatgg cccccgcctc gggtcccaat ctcttgctct    300
gctagtagca cagaagaaaa cactagaaat gacttgcttg acttagagta tcagataaac    360
atcatgttta cttaacttta atttgtatcg gtttctacta tttttataat atttttgtct    420
ctatagatac tacgtgcaac agtataatca acctagttta atccagagcg aaggattttt    480
tactaagtac gtgactccat atgcacagcg ttccttttat ggttcctcac tgggcacagc    540
ataaacgaac cctgtccaat gttttcagcg cgaacaaaca gaaattccat cagcgaacaa    600
acaacataca tgcgagatga aaataaataa taaaaaaagc tccgtctcga taggccggca    660
cgaatcgaga gcctccatag ccagtttttt ccatcggaac ggcggttcgc gcacctaatt    720
atatgcacca cacgcctata aagccaacca acccgtcgga ggggcgcaag ccagacagaa    780
gacagcccgt cagcccctct cgtttttcat ccgccttcgc ctccaaccgc gtgcgctcca    840
cgcctcctcc aggaaagcga                                                860
 
<210>59
<211>899
<212>DNA
<213>玉米
 
<400>59
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta     60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt    120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca    180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt    240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg    300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta    360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct    420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa    480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta    540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt    600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca    660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg    720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag    780
gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct    840
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttccc  899
 
<210>60
<211>879
<212>DNA
<213>紫花苜蓿
 
<400>60
aattcccatg atcttctctc cttcatcaat ggatgccatg tttcataaca ataacaccaa     60
atgtttgatg agctaccaac aattgcgcaa agactatggc taagctcgag ctcgctcgct    120
acaagttgtt gactttcaaa tacaagtttg tttttggaac accaaatatt ctacatgatc    180
tttcactaag ttgcgcacca ctatcaaaag attatctagg ccattattca agtaaagagt    240
gaacacgtct aagacccaca accacaccaa atagaatacg catacatgca acatattgtg    300
caagaagtat ccaactggac tcccatgtat tctaaaacta ttttcgtaga gttaaagtta    360
tgacaaactt atcaaataaa aatttgaacg ctggaccaaa actttcatct ttcaaatcca    420
ccatcgtcta tcctcataaa ttgttttgat tataacacat ctacgtaaat catttgtttt    480
gaacaatact aatttaattt tattaagtca aataacctgc ttagaaaata atccctccac    540
ctcatttaac aatttcttgt caaacacaca ccaagaaaaa aattaatgaa agagaaaaga    600
aatgaaaagg acatggagtt gaatactagc aaaattgatt gaaggaagat tcacaattga    660
aattgaaacc atttaattta ttttcgggtc cataataata aattggtaag aataaaaacc    720
cgatcaagtc cggtacagta caattccact ccaccaactc cttacttaaa cccctattta    780
tacccactct catcctcact cttccttcac ctctcacact ctcttctctc tctcaaaacc    840
ctcacacaaa cgctgcgttt agtgtaagaa attcaatcc                           879
 
<210>61
<211>318
<212>DNA
<213>马铃薯
 
<400>61
agacttgtcc atcttctgga ttggccaact taattaatgt atgaaataaa aggatgcaca     60
catagtgaca tgctaatcac tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac    120
tagttatctg aataaaagag aaagagatca tccatatttc ttatcctaaa tgaatgtcac    180
gtgtctttat aattctttga tgaaccagat gcatttcatt aaccaaatcc atatacatat    240
aaatattaat catatataat taatatcaat tgggttagca aaacaaatct agtctaggtg    300
tgttttgcga attgcggc                                                  318

Claims (45)

1.在基因组中包含重组DNA构建体的植物,所述重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出改变的根构造。
2.权利要求1的植物,其中所述植物是玉米植物或大豆植物。
3.植物,所述植物在其基因组中包含:
重组DNA构建体,所述重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或
(b)抑制DNA构建体,所述抑制DNA构建体包含至少一个调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽,
并且其中所述植物在与未包含所述重组DNA构建体的对照植物比较时表现出至少一种农学特性的改变。
4.权利要求3的植物,其中所述植物是玉米植物或大豆植物。
5.权利要求3的植物,其中在不同的环境条件下与未包含所述重组DNA构建体的所述对照植物比较时,所述植物表现出至少一种农学特性的所述改变。
6.权利要求5的植物,其中所述不同的环境条件为选自干旱、氮或病害中的至少一种。
7.权利要求5的植物,其中所述植物是玉米植物或大豆植物。
8.权利要求7的植物,其中所述植物是玉米植物或大豆植物。
9.权利要求3的植物,其中所述至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、氮胁迫耐受性、根倒伏、茎倒伏、植株高度、穗长和收获指数。
10.权利要求9的植物,其中所述植物是玉米植物或大豆植物。
11.权利要求3的植物,其中在与所述对照植物相比较时,所述植物表现出所述至少一种农学特性的增强。
12.权利要求11的植物,其中所述植物是玉米植物或大豆植物。
13.改变植物根构造的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;以及
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体,并且在与未包含所述重组DNA构建体的对照植物比较时表现出改变的根构造。
14.权利要求13的方法,所述方法还包括:
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体,并且在与未包含所述重组DNA构建体的对照植物比较时表现出改变的根构造。
15.评价植物根构造的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;以及
(c)评价与未包含所述重组DNA构建体的对照植物比较时所述转基因植物的根构造。
16.权利要求15的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)评价与未包含所述重组DNA构建体的对照植物比较时所述子代植物的根构造。
17.评价植物根构造的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)评价与未包含所述重组DNA构建体的对照植物比较时所述子代植物的根构造。
18.测定植物农学特性改变的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;以及
(c)测定所述转基因植物在与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
19.权利要求18的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)测定所述子代植物在与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
20.权利要求19的方法,其中所述测定步骤包括:测定所述转基因植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
21.权利要求19的方法,其中所述测定步骤(e)包括:测定所述子代植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
22.测定植物农学特性改变的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)测定所述子代植物在与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
23.权利要求22的方法,其中所述测定步骤包括:测定所述转基因植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
24.测定植物农学特性改变的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)测定所述转基因植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
25.权利要求24的方法,其中所述测定步骤包括:测定所述转基因植物在不同的环境条件下与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
26.权利要求24的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(e)测定所述子代植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
27.权利要求26的方法,其中所述测定步骤(e)包括:测定所述子代植物在不同的环境条件下与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
28.测定植物农学特性改变的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体,并且当与未包含所述抑制DNA构建体的对照植物比较时表现出改变的根构造;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(d)测定所述子代植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
29.权利要求28的方法,其中所述测定步骤包括:测定所述转基因植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
30.改变植物根构造的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;以及
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体,并且其中当与未包含所述抑制DNA构建体的对照植物比较时,所述转基因植物表现出改变的根构造。
31.权利要求30的方法,所述方法还包括:
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体,并且其中当与未包含所述抑制DNA构建体的对照植物比较时,所述子代植物表现出改变的根构造。
32.评价植物根构造的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)评价与未包含所述抑制DNA构建体的对照植物比较时所述转基因植物的根构造。
33.权利要求32的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(e)评价与未包含所述抑制DNA构建体的对照植物比较时所述子代植物的根构造。
34.评价植物根构造的方法,所述方法包括:
(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或51进行比较时具有至少50%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码NDK或NDK样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(d)评价与未包含所述抑制DNA构建体的对照植物比较时所述子代植物的根构造。
35.分离的多核苷酸,所述多核苷酸包含编码NDK或NDK样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:25比较时具有至少80%的序列同一性,或在与SEQ ID NO:23比较时具有至少85%的序列同一性,或在与SEQ ID NO:21比较时具有至少90%的序列同一性,或在与SEQ ID NO:33比较时具有至少95%的序列同一性。
36.权利要求35的多核苷酸,其中基于Clustal比对方法,所述多肽的氨基酸序列与SEQ ID NO:25的氨基酸序列具有至少85%的序列同一性,或者与SEQ ID NO:23的氨基酸序列具有至少90%的同一性,或者与SEQ ID NO:21的氨基酸序列具有至少95%的序列同一性。
37.权利要求35的多核苷酸,其中基于Clustal比对方法,所述多肽的氨基酸序列与SEQ ID NO:25的氨基酸序列具有至少90%的序列同一性,或者与SEQ ID NO:23的氨基酸序列具有至少95%的同一性。
38.权利要求35的多核苷酸,其中基于Clustal比对方法,所述多肽的氨基酸序列与SEQ ID NO:25的氨基酸序列具有至少95%的序列同一性。
39.权利要求35的多核苷酸,其中所述多肽的氨基酸序列包含SEQ ID NO:21、23、25或33。
40.权利要求35的多核苷酸,其中所述核酸序列包含SEQ IDNO:20、22、24或32。
41.包含权利要求35的多核苷酸的载体。
42.包含权利要求35的多核苷酸的重组DNA构建体,所述多核苷酸与至少一种调控序列可操作地连接。
43.转化细胞的方法,所述方法包括用权利要求35的多核苷酸来转化细胞。
44.包含权利要求42的重组DNA构建体的细胞。
45.用于生产植物的方法,所述方法包括用权利要求35的多核苷酸来转化植物细胞并从所述转化过的植物细胞中再生出植物。在其他实施方案中,载体和重组构建体包含任一前述的多核苷酸并且细胞包含所述重组构建体。
CN200880104809A 2007-08-29 2008-08-29 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 Pending CN101815432A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US96875407P 2007-08-29 2007-08-29
US60/968754 2007-08-29
PCT/US2008/074713 WO2009029739A2 (en) 2007-08-29 2008-08-29 Methods involving genes encoding nucleoside diphosphatase kinase (ndk) polypeptides and homologs thereof for modifying the plant's root architecture

Publications (1)

Publication Number Publication Date
CN101815432A true CN101815432A (zh) 2010-08-25

Family

ID=39944325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880104809A Pending CN101815432A (zh) 2007-08-29 2008-08-29 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法

Country Status (7)

Country Link
US (2) US20090064373A1 (zh)
EP (2) EP2180780A2 (zh)
CN (1) CN101815432A (zh)
BR (1) BRPI0818941A2 (zh)
CA (1) CA2695646A1 (zh)
MX (1) MX2010002327A (zh)
WO (1) WO2009029739A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103387999A (zh) * 2012-05-11 2013-11-13 河北农业大学 水稻OsNDPK1基因在提高植物抗病性方面的应用

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2902002C (en) 2013-03-14 2023-08-01 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
RU2015143825A (ru) 2013-03-15 2017-04-26 Пайонир Хай-Бред Интернэшнл, Инк. Полипептиды phi-4 и способы их применения
EA030896B1 (ru) 2013-08-16 2018-10-31 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
BR122021005579B1 (pt) 2013-09-13 2022-11-29 Pioneer Hi-Bred International, Inc Construto de dna, método de obtenção de planta transgênica, proteína de fusão, método para controlar uma população de praga de inseto, método para inibir o crescimento ou matar uma praga de inseto
EP3705489A1 (en) 2014-02-07 2020-09-09 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2016044092A1 (en) 2014-09-17 2016-03-24 Pioneer Hi Bred International Inc Compositions and methods to control insect pests
EP3207143B1 (en) 2014-10-16 2023-11-22 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CA2985198A1 (en) 2015-05-19 2016-11-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3310803A1 (en) 2015-06-16 2018-04-25 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
MX2018001523A (es) 2015-08-06 2018-03-15 Pioneer Hi Bred Int Proteinas insecticidas derivadas de plantas y metodos para su uso.
JP2018527931A (ja) 2015-08-28 2018-09-27 パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド 植物のオクロバクテリウム(ochrobactrum)媒介形質転換
US20180325119A1 (en) 2015-12-18 2018-11-15 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2017192560A1 (en) 2016-05-04 2017-11-09 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3472323A1 (en) 2016-06-16 2019-04-24 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP3478052B1 (en) 2016-07-01 2021-08-25 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
BR112019008800A2 (pt) 2016-11-01 2019-07-16 Pioneer Hi Bred Int polipeptídeo inseticida, composição inseticida, polinucleotídeo recombinante, construto de dna, célula de planta ou planta transgênica, método para inibir o crescimento ou exterminar uma população de praga de inseto agrícola, método para inibir o crescimento ou exterminar uma praga de inseto, método para controlar infestação de inseto lepidoptera e/ou coleoptera em uma planta transgênica e fornecer gerenciamento de resistência de inseto e uso de pelo menos um polipeptídeo inseticida
US20210400985A1 (en) 2018-10-10 2021-12-30 Pioneer Hi-Bred International, Inc. Plant growth-promoting microbes, compositions, and uses
CN115867564A (zh) 2020-07-14 2023-03-28 先锋国际良种公司 杀昆虫蛋白及其使用方法
CN114807181A (zh) * 2022-04-30 2022-07-29 浙江师范大学 水稻OsCKX3基因在调控水稻叶夹角中的应用

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
DE3765449D1 (de) 1986-03-11 1990-11-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5013659A (en) 1987-07-27 1991-05-07 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
ES2187497T3 (es) 1990-04-12 2003-06-16 Syngenta Participations Ag Promotores preferentemente en tejidos.
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
DE69230290T2 (de) 1991-08-27 2000-07-20 Novartis Ag Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz
US5518908A (en) 1991-09-23 1996-05-21 Monsanto Company Method of controlling insects
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5631152A (en) 1994-10-26 1997-05-20 Monsanto Company Rapid and efficient regeneration of transgenic plants
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
SG60056A1 (en) 1997-04-17 1999-02-22 Inst Of Molecular Agrobilogy Alteration of plant morphology by control of profilin expression
US7598361B2 (en) * 1997-11-24 2009-10-06 Monsanto Technology Llc Nucleic acid molecules and other molecules associated with the sucrose pathway
ES2273127T3 (es) 1998-02-26 2007-05-01 Pioneer Hi-Bred International, Inc. Promotor alfa-tubulin 3-18 del maiz.
EP1068311B2 (en) 1998-04-08 2020-12-09 Commonwealth Scientific and Industrial Research Organisation Methods and means for obtaining modified phenotypes
EP0959133A1 (en) 1998-05-22 1999-11-24 Centrum Voor Plantenveredelings- En Reproduktieonderzoek (Cpro-Dlo) A process for inhibiting expression of genes
US6504083B1 (en) 1998-10-06 2003-01-07 Pioneer Hi-Bred International, Inc. Maize Gos-2 promoters
US7217858B2 (en) 1998-12-21 2007-05-15 E. I. Du Pont De Nemours And Company S-adenosyl-L-methionine synthetase promoter and its use in expression of transgenic genes in plants
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
CA2353077C (en) 1999-09-30 2012-03-20 Japan Tobacco Inc. Plant transformation vectors
US20030036197A1 (en) 2000-06-23 2003-02-20 Glassman Kimberly F. Recombinant constructs and their use in reducing gene expression
AU2001291656A1 (en) 2000-06-30 2002-01-08 Willem Broekaert Gene silencing vector
US7619146B2 (en) * 2001-06-18 2009-11-17 Frankard Valerie Method for modifying plant morphology, biochemistry and physiology
WO2003025185A1 (en) * 2001-09-14 2003-03-27 Cropdesign N.V. A method to modify cell number, architecture and yield of plants by overexpressing the e2f transcription factor
US7928287B2 (en) 2002-02-19 2011-04-19 Pioneer Hi-Bred International, Inc. Methods for large scale functional evaluation of nucleotide sequences in plants
EP1551983A2 (en) * 2002-10-18 2005-07-13 CropDesign N.V. Identification of e2f target genes and uses thereof
US7403855B2 (en) 2002-12-19 2008-07-22 Pioneer Hi-Bred International, Inc. Method and apparatus for tracking individual plants while growing and/or after harvest
US20040216190A1 (en) * 2003-04-28 2004-10-28 Kovalic David K. Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
US7554007B2 (en) * 2003-05-22 2009-06-30 Evogene Ltd. Methods of increasing abiotic stress tolerance and/or biomass in plants
WO2004106531A1 (en) 2003-05-22 2004-12-09 E.I. Dupont De Nemours And Company Method for manipulating growth, yield, and architecture in plants
TWI285870B (en) * 2003-08-27 2007-08-21 Chi Mei Optoelectronics Corp Liquid crystal display and driving method
US7411112B2 (en) 2003-10-09 2008-08-12 Pioneer Hi-Bred International, Inc. Maize promoter named CRWAQ81
KR100775037B1 (ko) * 2003-11-17 2007-11-08 한국생명공학연구원 복합스트레스 내성 식물체 제조용 재조합 발현벡터 및이를 이용한 복합스트레스 내성 식물체의 제조방법
ATE443149T1 (de) 2003-12-22 2009-10-15 Pioneer Hi Bred Int Mais metallothionen promoter 2 und methoden zur verwendung
MX2007005799A (es) 2004-11-16 2007-10-03 Pioneer Hi Bred Int Promotor del gen cr1bio de maiz y su uso para dirigir la expresion transgenica con preferencia por las raices en plantas.
BRPI0606657A2 (pt) 2005-01-13 2009-07-07 Du Pont molécula de ácido nucléico isolada, construção de dna, vetor, célula vegetal, célula hospedeira, planta, semente, cassete de expressão, método para expressar uma seqüência nucleotìdica em plantas e células vegetais, método para expressar uma seqüência de nucleotìdeos em uma célula vegetal, método para expressar seletivamente uma seqüência de nucleotìdeos em raiz vegetal, ciclotìdeo isolado, método para combater uma praga de plantas
US20070136897A1 (en) * 2005-10-12 2007-06-14 Kim Jeong-Ii Nucleic acid molecules encoding hyperactive nucleoside di-phosphate kinase 2 and uses thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103387999A (zh) * 2012-05-11 2013-11-13 河北农业大学 水稻OsNDPK1基因在提高植物抗病性方面的应用

Also Published As

Publication number Publication date
BRPI0818941A2 (pt) 2014-10-07
EP2527449A3 (en) 2013-04-03
WO2009029739A2 (en) 2009-03-05
EP2180780A2 (en) 2010-05-05
CA2695646A1 (en) 2009-03-05
EP2527449A2 (en) 2012-11-28
WO2009029739A3 (en) 2009-06-04
US20090064373A1 (en) 2009-03-05
MX2010002327A (es) 2010-04-30
US20120124697A1 (en) 2012-05-17

Similar Documents

Publication Publication Date Title
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
KR101447300B1 (ko) 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
CN108026556A (zh) 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
KR20070085669A (ko) 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주
CN101918560B (zh) 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法
CN112204147A (zh) 基于Cpf1的植物转录调控系统
CA2856001A1 (en) Plant galactinol synthase homologs
CN101868545B (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法
US20140196178A1 (en) Plant self nitrogen fixation by mimicking prokaryotic pathways
CN113621642A (zh) 一种用于农作物杂交育种制种的遗传智能化育制种系统及其应用
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN101848931B (zh) 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法
BRPI0616533A2 (pt) polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100825