CN101918560A - 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 - Google Patents

在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 Download PDF

Info

Publication number
CN101918560A
CN101918560A CN2008801241949A CN200880124194A CN101918560A CN 101918560 A CN101918560 A CN 101918560A CN 2008801241949 A CN2008801241949 A CN 2008801241949A CN 200880124194 A CN200880124194 A CN 200880124194A CN 101918560 A CN101918560 A CN 101918560A
Authority
CN
China
Prior art keywords
plant
sequence
recombinant dna
construction body
dna construction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801241949A
Other languages
English (en)
Other versions
CN101918560B (zh
Inventor
M·奥克曼
S·M·艾伦
D·卢塞尔特
S·卢克
H·萨凯
S·V·廷盖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Publication of CN101918560A publication Critical patent/CN101918560A/zh
Application granted granted Critical
Publication of CN101918560B publication Critical patent/CN101918560B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

尤其可用于在氮限制条件下改变植物农学特性的分离的多核苷酸和多肽以及重组DNA构建体,包含这些重组DNA构建体的组合物(如植物或种子)、以及利用这些重组DNA构建体的方法。所述重组DNA构建体包含可操作地连接在植物中有功能的启动子的多核苷酸,其中所述多核苷酸编码LNT2多肽。

Description

在氮限制条件下具有改变的农学特性的植物以及涉及编码LNT2多肽及其同源物的基因的相关构建体和方法
发明领域
本发明领域涉及植物育种和遗传学,具体地讲涉及植物中可用的赋予氮利用效率和/或氮限制条件耐受性的重组DNA构建体。
发明背景
世界范围内非生物胁迫显著地限制了作物产量。据评估这些因素累积地造成平均70%的农业产量减少。植物是固着的,必须适应它们周边的主要环境条件。这已经导致它们发展出基因调控、形态发生、和代谢的高可塑性。适应和防御机制策略涉及激活编码对适应或防御不同胁迫重要的蛋白。
植物氮吸收在它们的生长中起到重要作用(Gallais等人,J.Exp.Bot.55(396):295-306(2004))。植物从环境中的无机氮合成氨基酸。因此,氮肥已经成为提高栽培植物如玉米和大豆的产量有力工具。为了避免硝酸盐污染并保持足够的利润率,如今农民期望减少氮肥的使用。如果能提高植物的氮同化能力,然后就能期望植物生长和产量的提高。概括地说,具有更好的氮利用效率(NUE)的植物品种是所期望的。
可利用激活标记来鉴定能影响性状的基因。已经在模型植物拟南芥属中使用该方法(Weigel等人,Plant Physiol.122:1003-1013(2000))。插入转录增强子元件能够显著激活和/或提高附近内源基因的表达。该方法能被用于鉴定某一性状(例如植物的氮利用效率)的受关注的基因,当所述基因经转基因进入生物中时能改变该性状。
发明概述
本发明包括:
在一个实施方案中,在其基因组中包含重组DNA构建体的植物,所述重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,并且其中所述植物在与不包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
在另一个实施方案中,在其基因组中包含重组DNA构建体的植物,该重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;或
(b)抑制DNA构建体,所述构建体包含至少一个调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,并且其中在与不包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
在另一个实施方案中,增加植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与不包含该DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性;并且任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体,并且在与不包含该DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
在另一个实施方案中,评估植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价该转基因植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)评价该子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
在另一个实施方案中,评估植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
在另一个实施方案中,测定植物农学特性改变的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)确定该转基因植物在与不包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)确定所述子代植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,测定植物农学特性改变的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)确定所述子代植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将包含至少一个调控元件的抑制DNA构建体引入到可再生的植物细胞中,该调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)确定该转基因植物在与不包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;
以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;
以及任选地,(e)确定所述子代植物任选地在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将包含至少一个调控元件的抑制DNA构建体引入到可再生的植物细胞中,该调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;
(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出至少一种农学性状的改变;
(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及
(d)确定该子代植物在与不包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
以及任选地,(e)确定所述转基因植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,本发明涉及分离的多核苷酸,所述多核苷酸包括:(a)编码多肽的核苷酸序列,其中所述多肽的氨基酸序列和SEQID NO:18、24、或26的氨基酸序列基于Clustal V比对方法具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(b)所述核苷酸序列的互补序列,其中所述核苷酸序列及其互补序列包含相同数目的核苷酸并且是100%互补的。在一个实施方案中,所述多肽包含SEQ ID NO:18、24、或26的氨基酸序列,并且该核苷酸序列包含SEQ ID NO:17、23、或25的核苷酸序列。
附图简述图表以及序列表
根据以下的详细描述和附图以及序列表,可更全面地理解本发明,以下的详细描述和附图以及序列表形成本申请的一部分。
图1示出pHSbarENDs2活化标记构建体的图谱,该构建体用于制备拟南芥属种群(SEQ ID NO:1)。
图2示出载体pDONRTM Zeo(SEQ ID NO:2),GATEWAY
Figure BPA00001178919600061
供体载体的图谱。attP1位点位于核苷酸570-801;attP2位点位于核苷酸2754-2985(互补链)。
图3示出载体pDONRTM 221(SEQ ID NO:3),GATEWAY
Figure BPA00001178919600062
供体载体的图谱。attP1位点位于核苷酸570-801;attP2位点位于核苷酸2754-2985(互补链)。
图4示出载体pBC-yellow(SEQ ID NO:4)的图谱,该载体是用于构建拟南芥属表达载体的目的载体。attR1位点位于核苷酸11276-11399(互补链);attR2位点位于核苷酸9695-9819(互补链)。
图5示出载体PHP27840(SEQ ID NO:5)的图谱,该载体是用于构建大豆表达载体的目的载体。attR1位点位于核苷酸7310-7434;attR2位点位于核苷酸8890-9014。
图6示出载体PHP23236(SEQ ID NO:6)的图谱,该载体是用于构建Gaspe Flint来源的玉米品系的表达载体的目的载体。attR1位点位于核苷酸2006-2130;attR2位点位于核苷酸2899-3023。
图7示出载体PHP10523(SEQ ID NO:7)的图谱,该载体是存在于农杆菌菌株LBA4404中的质粒DNA(Komari等人,Plant J.10:165-174(1996);NCBI通用标识符59797027)。
图8示出PHP23235(SEQ ID NO:8)的图谱,它是用于构建目的载体PHP23236的载体。
图9示出载体PHP20234(SEQ ID NO:9)的图谱。
图10示出目的载体PHP22655(SEQ ID NO:10)的图谱。
图11示出用于筛选的五个品系(标记为1至5,每个品系有-十一个个体),加上野生型对照品系C1(九个个体)的典型网格图案。
图12示出通过图像分析测定的若干个不同硝酸钾浓度对植物颜色的效应。绿色区(色调50至66)对氮剂量的响应证明该区能被用于指示氮同化作用。
图13为实施例18中用于半水栽玉米生长的培养基。
图14A和14B示出拟南芥LNT2多肽(SEQ ID NO:28)和LNT2同源物(SEQ ID NO:18、20、24、26、30、32、33、和34)的全长氨基酸序列的多重比对。
图15示出图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
图16示出在氮减少条件下(1mM KNO3)和最佳氮(6.5mM KNO3)条件下筛选Gaspe Flint来源的玉米品系的结果。评估四个包含PHP29689的事件的多个性状。事件平均值与分离无效植物的平均值比较。使用P值≤0.1作为临界值。
图17示出在氮减少条件下(1mM KNO3)和最佳氮(6.5mM KNO3)条件下筛选Gaspe Flint来源的玉米品系的结果。分析中考虑了所有包含PHP29689的事件。将每个变量的构建体平均值和无效构建体的平均值比较。使用P值0.1作为临界值。
图18示出包含PHP28840的植物在低氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图19示出包含PHP28841的植物在低氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图20示出包含PHP28840的植物在标准氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图21示出包含PHP28841的植物在标准氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图22示出包含PHP28840(表达盒=lnt2-3)或PHP28841(表达盒=lnt2-2)的植物的NUE幼苗测定结果。
序列描述以及相关联的序列表遵循如37 C.F.R.§1.821-1.825中所列出的管理专利申请中的核苷酸和/或氨基酸序列公开的规则。序列表包含核苷酸序列字符的单字母码以及氨基酸的三字母码,如遵照IUPAC-IUBMB标准所定义的,该标准在Nucleic Acids Res.13:3021-3030(1985)以及在Biochemical J.219(2):345-373(1984)中描述,将这两篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。
表1列出了本文所述的某些多肽、包含编码多肽全部或其主要部分的核酸片段的cDNA克隆的命名、以及在所附序列表中使用的对应标识符(SEQ ID NO:)。
                      表1
                耐低氮蛋白(LNT)
Figure BPA00001178919600081
SEQ ID NO:1是pHSbarENDs2激活标记载体(图1)的核苷酸序列。
SEQ ID NO:2是pDONRTMZeo构建体的核苷酸序列(图2)。
SEQ ID NO:3是pDONRTM221构建体的核苷酸序列(图3)。
SEQ ID NO:4是pBC-yellow载体(图4)的核苷酸序列。
SEQ ID NO:5是PHP27840载体(图5)的核苷酸序列。
SEQ ID NO:6是目的载体PHP23236的核苷酸序列(图6)。
SEQ ID NO:7是PHP10523载体(图7)的核苷酸序列。
SEQ ID NO:8是PHP23235载体的核苷酸序列(图8)。
SEQ ID NO:9是PHP20234载体的核苷酸序列(图9)。
SEQ ID NO:10是目的载体PHP22655的核苷酸序列(图10)。
SEQ ID NO:11是用于替代在pHSbarENDs2的位点5775处的PacI限制性位点的多接头核苷酸序列。
SEQ ID NO:12是attB1序列的核苷酸序列。
SEQ ID NO:13是attB2序列的核苷酸序列。
SEQ ID NO:14是入门克隆PHP23112的核苷酸序列。
SEQ ID NO:15是实施例5中的正向引物VC062。
SEQ ID NO:16是实施例5中的反向引物VC063。
SEQ ID NO:17-22(参见表1)。
SEQ ID NO:23是重叠群的共有核苷酸序列,本文称为PSO415619,它包含BI316280(NCBI通用标识号14990607)、CD401485(NCBI通用标识号31459457)和sfl1n1.pk002.j1(SEQ ID NO:21)。
SEQ ID NO:24是由PSO415619(SEQ ID NO:23)编码的多肽的核苷酸序列。
SEQ ID NO:25是重叠群的共有核苷酸序列,本文称为PSO415620,它包含CX548557(NCBI通用标识号57575582)和sds1f.pk001.k5(SEQID NO:22)。
SEQ ID NO:26是由PSO415620(SEQ ID NO:25)编码的多肽的核苷酸序列。
SEQ ID NO:27是编码拟南芥“unknown蛋白”(LNT2)(At5g50930;NCBI通用标识号145359102)的基因的核苷酸序列。
SEQ ID NO:28是拟南芥“unknown蛋白”(LNT2)(At5g50930;NCBI通用标识号15241317)的氨基酸序列。
SEQ ID NO:29是At5g50930的选择性剪接变体(本文称为“lnt2-2”)的核苷酸序列。
SEQ ID NO:30是由lnt2-2(SEQ ID NO:29)编码的多肽的氨基酸序列,本文称为“LNT2-2”。
SEQ ID NO:31是At5g50930的第二选择性剪接变体(本文称为“lnt2-3”)的核苷酸序列。
SEQ ID NO:32是由lnt2-3(SEQ ID NO:29)编码的多肽的氨基酸序列,本文称为“LNT2-3”。SEQ ID NO:32基于Clustal V比对方法,使用预设参数与EP1033405中的SEQ ID NO:52198进行比对,结果100%相同。
SEQ ID NO:33是水稻“unknown蛋白”(NCBI通用标识号38347162)的氨基酸序列。
SEQ ID NO:34是葡萄“假定蛋白”(NCBI通用标识号147791927)的氨基酸序列。
SEQ ID NO:35是At5g50930-5’attB正向引物的核苷酸序列。
SEQ ID NO:36是At5g50930-3’attB反向引物的核苷酸序列。
其它实施方案的具体描述
本文中所列出的每篇参考文献的公开内容的全文均以引用的方式并入本文。
如本文所用的并在所附权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如,“一株植物”的涵义包括多株该类植物。“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
如本文所用:
“氮限制条件”指其中可用氮总量(例如来自硝酸盐、氨、或其它已知氮源的氮)不足以维持植物的最佳生长和发育的条件。本领域的技术人员将会识别其中总可用氮足以维持植物最佳生长和发育的条件。本领域的技术人员将会识别什么组成足够量的总可用氮,什么组成用于向植物提供氮的土壤、培养基和肥料输入。取决于许多因素,氮限制条件将发生变化,包括但不限于特定的植物和环境条件。
“农学特性”是可测量的参数,包括但不限于绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、营养组织游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎倒伏、植株高度、穗高、和穗长。
“收获指数”指粒重除以总株重。
“lnt2”指拟南芥基因位点At5g50930(SEQ ID NO:27)。“LNT2”指由SEQ ID NO:27编码的蛋白(SEQ ID NO:28)。
“lnt2-2”(SEQ ID NO:29)和“lnt2-3”(SEQ ID NO:31)是天然存在的At5g50930基因的选择性剪接变体。“LNT2-2”(SEQ ID NO:30)和“LNT2-3”(SEQ ID NO:32)指分别由“lnt2-2”和“lnt2-3”编码的蛋白。
“lnt2样”指拟南芥“lnt2”位点At5g50930(SEQ ID NO:28)的来自不同物种的核苷酸同源物,如玉米和大豆,并且不受限制的包括任何以下核苷酸序列:SEQ ID NO:17、19、23、和25。
“LNT2样”指拟南芥“LNT2”(SEQ ID NO:28)的来自不同物种的蛋白同源物,如玉米和大豆,并且不受限制的包括任何以下氨基酸序列:SEQ ID NO:18、20、24、和26。
本文所用的“选择性剪接变体”指由基因转录的RNA的供选择的替代形式。剪接变体作为供选择的位点在单个转录RNA分子内或在分开转录的RNA分子之间被剪接的结果天然发生,并且可导致从相同基因转录的mRNA的若干个不同形式。因此,剪接不同可编码具有不同氨基酸序列的多肽,它们在生物体内可具有相似功能也可不具有相似功能。
“氮胁迫耐受性”是植物的性状,指植物在氮限制条件下存活的能力。
植物“提高的氮胁迫耐受性”相对于参照或对照植物进行测量,并意指植物的氮胁迫耐受性在与参照或对照植物进行比较时提高的任何量或量度。
“氮胁迫耐受性植物”是指表现出氮胁迫耐受性的植物。在一个实施方案中氮胁迫耐受性植物是在氮限制条件下相对于对照植物至少在一种农学特性上表现出提高的植物。
“环境条件”指植物生长的条件,例如水的可用性、营养物质(例如氮)的可用性或者昆虫或病害的存在。
“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
“基因组”在用于植物细胞时不仅涵盖存在于细胞核中的染色体DNA,而且还包括存在于细胞的亚细胞组分(如线粒体、质粒)中的细胞器DNA。
“植物”包括整个植株、植物器官、植物组织、种子和植物细胞以及同一植株的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。
“子代”包括植物的任何后续世代。
“转基因植物”包括在其基因组内包含异源多核苷酸的植物。在一个实施方案中,将异源多核苷酸稳定地整合进基因组内以便该多核苷酸连续传代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。
针对序列而言的″异源″意指来自外来物种的序列,或者如果来自相同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。
“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,并且指作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。-核苷酸(通常以它们的5′-单磷酸形式存在)通过如下它们的单个字母名称来指代:“A”为腺苷酸或脱氧腺苷酸(分别对应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。
“多肽”、“肽”、“氨基酸序列”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”还可包括修饰,包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。
“信使RNA(mRNA)”指无内含子并且可以通过细胞翻译成蛋白质的RNA。
“cDNA”指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。
“表达序列标签”(“EST”)是得自cDNA文库的DNA序列,并且因此是已经被转录的序列。EST通常通过cDNA插入序列单程测序获取。将完整的cDNA插入序列称为“全长插入序列”(“FIS”)。“重叠群”序列是由选自,但不限于EST、FIS和PCR序列的两个或更多个序列装配成的序列。将编码完整或功能性蛋白的序列称为“完全基因序列”(“CGS”),该序列能得自FIS或重叠群。
“成熟”蛋白质指经翻译后加工的多肽;即已经去除了存在于初级翻译产物中的任何前肽或原肽的多肽。
“前体”蛋白质指mRNA的翻译初级产物;即具有仍然存在的前肽和原肽。前肽和原肽可以是并且不限于细胞内定位信号。
“分离的”指物质,例如核酸和/或蛋白质,该物质基本上不含在天然存在的环境中通常伴随该物质或与其反应的组分,或者说是该物质被从所述组分移出。分离的多核苷酸可从它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。
“重组体”指(例如)通过化学合成或者通过用基因工程技术操纵分离的核酸片段来实现的两个原本分离的序列片段的人工组合。“重组体”也包括指已经通过引入异源核酸而进行了修饰的细胞或载体,或源于经这样修饰的细胞的细胞,但不涵盖由天然发生的事件(如自发突变、自然转化/转导/转座)对细胞或载体的改变,例如没有蓄意人为干扰而发生的那些。
“重组DNA构建体”指在自然界中通常不会一起存在的核酸片段的组合。因此,重组DNA构建体可包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于通常天然存在的方式排列的调控序列和编码序列。
术语“入门克隆”和“入门载体”本文可互换使用。
“调控序列”和“调控元件”可互换使用,并且指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”指能够控制另一核酸片段转录的核酸片段。
“在植物中有功能的启动子”指能够控制植物细胞中的转录的启动子,无论其是否来源于植物细胞。
“组织特异性启动子”和“组织优选启动子”可以互换使用,并且指主要但非必须专一地在一种组织或器官中表达,但是也可以在一种特定细胞中表达的启动子。
“发育调控启动子”指其活性由发育事件决定的启动子。
术语“可操作地连接”指核酸片段连接成单一片段,使得其中一个核酸片段的功能受到另一个核酸片段的调控。例如,在启动子能够调节核酸片段的转录时,该启动子与该核酸片段进行了可操作地连接。
“表达”指功能产物的产生。因此,核酸片段的表达可指核酸片段的转录(如生成mRNA或功能RNA的转录)和/或RNA翻译成前体或成熟蛋白质。
“表型”是指细胞或生物体的可检测的特征。
有关将核酸片段(例如重组DNA构建体)插入细胞内的“导入”是指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内,转变成自主的复制子或瞬时表达(如转染的mRNA)。
“转化细胞”是将核酸片段(如重组DNA构建体)引入其中的任何细胞。
本文所用的“转化”指稳定转化和瞬时转化两者。
“稳定转化”指将核酸片段引入宿主生物体的基因组中,导致基因稳定遗传。一旦稳定转化,核酸片段稳定地整合进宿主生物体和任何连续世代的基因组中。
“瞬时转化”指将核酸片段引入宿主生物体的核中或包含DNA的细胞器中,引起基因表达而没有基因稳定遗传。
“等位基因”是占据染色体上给定位点的基因的几种供选择形式的其中一种。当二倍体植物中一对同源染色体上给定基因座上存在的等位基因相同时,该植物在该基因座处是纯合的。如果二倍体植物中一对同源染色体上给定基因座上存在的等位基因不同,则该植物在该基因座处是杂合的。如果转基因存在于二倍体植物中一对同源染色体中的其中之一上,则该植物在该基因座处是半合子的。
序列比对和同一性百分比可用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE
Figure BPA00001178919600141
生物信息计算包(DNASTAR
Figure BPA00001178919600142
Inc.,Madison,WI)的Megalign
Figure BPA00001178919600143
程序。除非另外说明,本文提供的序列的多重比对用Clustal V比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)采用默认参数(空位罚分=10,空位长度罚分=10)执行。用Clustal V方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数为KTUPLE=1、空位罚分(GAP PENALTY)=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口=4和DIAGONALS SAVED=4。用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“同一性百分比”和“趋异度”值。除非另外说明,本文提供的和申明的同一性百分比和趋异度是以该方式计算。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold  Spring HarborLaboratory Press:Cold Spring Harbor,1989(下文称为“Sambrook”)。
现在转向若干个实施方案:
其它实施方案包括分离的多核苷酸和多肽、重组DNA构建体、包含这些重组DNA构建体的组合物(例如植株或种子)以及利用这些重组DNA构建体的方法。
其它的分离的多核苷酸和多肽
本发明包括如下其它分离的多核苷酸和多肽:
分离的多核苷酸,包括:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;其中(i)的核酸序列的全长互补序列由相同数目的核苷酸组成并且是100%互补的。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。多肽可以是LNT2或LNT2样蛋白。
分离的多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性。多肽可以能是LNT2或LNT2样蛋白。
分离的多核苷酸,包括:(i)基于Clustal V比对方法在与SEQ IDNO:17、19、23、25、27、29、或31进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性的核酸序列;或(ii)(i)的核酸序列的全长互补序列。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。所述分离的多核苷酸可以编码LNT2或LNT2样蛋白。
其它重组DNA构建体和抑制DNA构建体
在一个方面,本发明包括重组DNA构建体(包括抑制DNA构建体)。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包括(i)核酸序列,所述核酸序列编码的氨基酸序列基于ClustalV比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包括(i)核酸序列,所述核酸序列基于Clustal V比对方法在与SEQ ID NO:17、19、23、25、27、29、或31进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列。
图14A和14B示出以下氨基酸序列的多重比对:SEQ ID NO:18、20、24、26、28、30、32、33、和34。用LASERGENE生物信息计算包(DNASTARInc.,Madison,WI)的MEGALIGN
Figure BPA00001178919600173
程序进行序列多重比对;具体地讲,使用Clustal V比对方法(Higgins和Sharp(1989)CABIOS.5:151-153),多重比对预设参数为空位罚分=10,空位长度罚分=10,成对比对预设参数为KTUPLE=1,空位罚分=3,窗口=5以及DIAGONALS SAVED=5。
图15是图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样蛋白。
在另一方面,本发明包括抑制DNA构建体。
抑制DNA构建体能包含至少一个调控序列(在一个实施方案中是在植物中有功能的启动子),该调控序列可操作地连接至:(a)以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)核酸序列(a)(i)的全长互补序列。或者(b)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样蛋白;或(c)以下序列的全部或部分:(i)核酸序列,所述核酸序列基于ClustalV比对方法在与SEQ ID NO:17、19、23、25、27、29、或31进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%%、9、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(c)(i)核酸序列的全长互补序列。在一个实施方案中,该抑制DNA构建体包含共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制性构建体、茎环抑制性构建体、产生双链RNA的构建体、RNAi构建体或小RNA构建体(如,siRNA构建体或miRNA构建体)。
应当理解(正如本领域技术人员将会理解的),本发明不仅仅涵盖这些具体的示例性序列。导致给定位点处产生化学上等价的氨基酸但不影响所编码多肽的功能特性的核酸片段中的改变是本领域众所周知的。因此,氨基酸丙氨酸(一种疏水性氨基酸)的密码子可被编码另一个疏水性较弱的残基(例如甘氨酸)或疏水性较强的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,导致一个带负电荷的残基替换为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替换为另一个带正电荷的残基(例如,赖氨酸替换精氨酸)的改变也可预期产生功能上等价的产物。导致多肽分子的N-末端和C-末端部分改变的核苷酸变化也将预计不会改变多肽的活性。所提出的修饰中的每一种均完全在本领域常规技术内,如测定所编码的产物的生物活性的保留。
“抑制DNA构建体”是在转化或稳定整合进植物基因组时,导致该植物中的靶基因“沉默”的重组DNA构建体。对该植物来说,该靶基因可以是内源性的或是转基因的。如本文针对靶基因所使用的,“沉默”通常指在由靶基因表达的mRNA或蛋白质/酶的水平上的抑制,和/或在酶活性或蛋白质功能性的水平上的抑制。本文中可交换使用的术语“抑制”、“抑制性”以及“沉默”包括降低、减少、减退、减小、抑制、消除或防止。“沉默”或“基因沉默”不确定机理并且包括(并且不限于)反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于RNAi的方法以及基于小RNAi的方法。
抑制DNA构建体可以包含源自所关注的靶基因的区域并且可以包含所关注的靶基因的有义链(或反义链)的核酸序列的全部或部分。取决于所要利用的方法,该区域可与所关注基因的有义链(或反义链)的全部或部分100%相同或者具有少于100%同一性的同一性(如,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。
抑制DNA构建体是本领域所熟知的,一旦选定所关注的靶基因就很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒-抑制构建体、发夹抑制性构建体、茎-环抑制性构建体、产生双链RNA的构建体,以及更通常的是,RNAi(RNA干扰)构建体和小RNA构建体,例如siRNA(短干扰RNA)构建体和miRNA(微RNA)构建体。
“反义抑制”指产生能够抑制靶基因或基因产物表达的反义RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或部分互补,并阻断分离的靶核酸片段表达的RNA转录物(美国专利号:5,107,065)。反义RNA可以与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。
“共抑制”指产生能够抑制靶基因或基因产物表达的有义RNA转录物。“有义”RNA指包括mRNA和在细胞内或体外能被翻译成蛋白质的RNA在内的RNA转录物。此前,已通过着眼于以有义方向过表达与内源mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见Vaucheret等人,Plant J.,16:651-659(1998);以及Gura,Nature 404:804-808(2000))。
另一种变型描述了将植物病毒序列用于引导对近端mRNA编码序列的抑制(于1998年8月20日公开的PCT专利公开WO 98/36083)。
此前描述的是“发夹”结构的利用,该结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎-环”结构(于1999年10月21日公开的PCT专利公开WO99/53050)。在这种情况下,茎由对应相对于启动子以有义或反义方向插入的相关基因的多核苷酸形成,并且环由一些相关基因的多核苷酸形成,在构建体中该多核苷酸不具有互补序列。这增加了获得的转基因植物中的共抑制或沉默频率。关于发夹抑制的综述,参见Wesley,S.V.等人,2003,Methods inMolecular Biology,Plant Functional Genomics:Methods and Protocols236:273-286。
其中茎由至少30个来自待抑制基因的核苷酸形成而环由任意的核苷酸序列形成的构建体也已经有效地用于抑制(于1999年12月2日公开的PCT专利公开No.WO 99/61632)。
使用聚-T和聚-A序列产生茎-环结构中的茎已经有所描述(于2002年1月3日公开的PCT专利公开No.WO 02/00894)。
然而另一种变型涉及使用合成的重复序列来促进茎-环结构中的茎的形成。用这种重组DNA片段产生的转基因生物体已经显示由形成茎环结构的核苷酸片段编码的蛋白质的水平降低,如于2002年1月3日公开的PCT专利公开WO 02/00904中所述。
RNA干扰是指由短干扰性RNA(siRNA)介导的动物中序列特异性转录后基因沉默的过程(Fire等人,Nature 391:806 1998)。在植物中的对应过程通常称为转录后基因沉默(PTGS)或RNA沉默,并且在真菌中也称为阻抑作用(quelling)。据信转录后基因沉默过程是用于防止外来基因表达的进化保守性细胞防御机制,并且通常由不同植物区系和门所共有(Fire等人,Trends Genet.15:358(1999)).这种防止外来基因表达的保护作用可能是通过特异性破坏病毒基因组RNA的同源单链RNA的细胞反应,响应源自病毒感染或源自转座因子随机整合到宿主基因组内的双链RNA(dsRNA)的生成而进化而来。dsRNA在细胞中的存在通过还没有完全表征的机制引发了RNAi反应。
细胞中长dsRNA的存在刺激了称为dicer的核糖核酸酶III的活性。Dicer涉及使dsRNA加工成称为短干扰RNA(siRNA)的短dsRNA片段(Berstein等人,Nature 409:363 2001)。源自dicer活性的短干扰性RNA的长度通常是约21至约23个核苷酸,并且包含约19个碱基对双链体(Elbashir等人,Genes Dev.15:188(2001)).还有人提出Dicer参与从保守结构的前体RNA上切下21-和22-核苷酸小分子时序RNA(stRNA),所述小分子时序RNA参与翻译控制(Hutvagner等人,2001,Science 293:834)。RNAi响应还涉及内切核酸酶复合物,通常称为RNA诱导沉默复合物(RISC),其介导具有与siRNA双链体的反义链互补的序列的单链RNA的裂解。靶RNA的裂解在与siRNA双链体的反义链互补的区域中间发生。此外,RNA干扰还涉及小RNA(如miRNA)介导的基因沉默,可推定是通过调节染色质结构并由此防止靶基因序列转录的细胞机制(参见例如Allshire,Science 297:1818-1819(2002);Volpe等人,Science 297:1833-1837(2002);Jenuwein,Science 297:2215-2218(2002);以及Hall等人,Science 297:2232-2237(2002))。这样,本发明的miRNA分子可用于通过与RNA转录物相互作用或者作为另一种选择通过与特定基因序列相互作用来介导基因沉默,其中这样的相互作用导致在转录或转录后水平上的基因沉默。
已经在多种系统中研究了RNAi。Fire等人(Nature 391:806(1998))首次在秀丽隐杆线虫(Caenorhabditis elegans)中观察到RNAi。Wianny和Goetz(Nature Cell Biol.2:70(1999))描述了在小鼠胚胎中由dsRNA介导的RNAi。Hammond等人(Nature 404:293(2000))描述了在用dsRNA转染的果蝇(Drosophila)细胞中的RNAi。Elbashir等人,(Nature411:494 2001)描述了通过在包括人胚胎肾和HeLa细胞的培养的哺乳动物细胞中导入合成21-核苷酸RNA的双链体而诱导的RNAi。
小RNA在控制基因表达中起重要作用。很多发育过程(包括开花)的调节是由小RNA控制的。现在有可能通过使用在植物中产生小RNA的转基因构建体来以工程手段改变植物基因的基因表达。
小RNA似乎是通过与互补RNA或DNA靶序列碱基配对来行使功能的。当与RNA结合时,小RNA或者引发靶序列的RNA裂解或者引发翻译抑制。当与DNA靶序列结合时,据信小RNA可介导靶序列的DNA甲基化。无论具体机制是什么,这些事件的后果是基因表达受到抑制。
据认为,小RNA和它们的RNA靶标之间的序列互补性有助于确定采用了哪种机制(RNA裂解或翻译抑制)。据信,优选与它们的靶标互补的siRNA通过RNA裂解起作用。一些miRNA与它们的靶基因具有完全或几乎完全的互补性,并且对于至少一些这样的miRNA,已经证实了RNA裂解。其他miRNA与它们的靶标具有若干错配,并且在翻译水平上明显抑制了它们的靶标。同样,无需坚持特定的作用机理,出现了这样一种一般规律:完全或几乎完全的互补性引起RNA裂解,而当miRNA/靶标双链体含有许多错配时倾向于翻译抑制。对于此规律的一个明显例外是植物中微RNA 172(miR172)。miR172的其中一个靶标是APETALA2(AP2),尽管miR172与AP2具有几乎完全的互补性,但其表现出引起AP2的翻译抑制而不是引起RNA裂解。
微RNA(miRNA)是长度为约19至约24个核苷酸(nt)的已经在动物和植物中鉴定出的非编码RNA(Lagos-Quintana等人,Science294:853-858 2001,Lagos-Quintana等人,Curr.Biol.12:735-739(2002);Lau等人,Science 294:858-862(2001);Lee和Ambros,Science294:862-864(2001);Llave等人,Plant Cell 14:1605-1619(2002);Mourelatos等人,Genes.偏差(Dev.)16:720-728(2002);Park等人,Curr.Biol.12:1484-1495(2002);Reinhart等人,Genes.偏差(Dev.)16:1616-1626(2002))。它们是由大小为大约70至200nt的较长的前体转录物加工生成的,并且这些前体转录物能够形成稳定的发夹结构。在动物中,涉及加工miRNA前体的酶称为Dicer,这是一种核糖核酸酶III样蛋白(Grishok等人,Cell 106:23-34(2001);Hutvagner等人,Science293:834-838(2001);Ketting等人,Genes.偏差(Dev.)15:2654-2659(2001))。植物也具有Dicer-样酶,DCL1(以前称为CARPELFACTORY/SHORT INTEGUMENTS1/SUSPENSOR1),并且最近的证据表明,其象Dicer一样也涉及发夹前体的加工以产生成熟miRNA(Park等人,Curr.Biol.12:1484-1495(2002);Reinhart等人,Genes Dev.16:1616-1626(2002))。此外,最近的研究已经清楚地表明,至少某些miRNA发夹前体最初是作为较长的聚腺苷酸化转录物存在,并且在单个转录物中可存在几种不同的miRNA以及相关发夹(Lagos-Quintana等人,Science 294:853-858(2001);Lee等人,EMBO J.21:4663-4670(2002))。最近的研究还测定了从dsRNA产物的miRNA链选择,所述dsRNA产物是通过DICER加工发夹而产生的(Schwartz等人,Cell115:199-208(2003))。看起来,经加工的dsRNA的两端的稳定性(即G∶C对A∶U的含量比,和/或错配)影响链选择,具有低稳定性的末端更容易因解旋酶活性而解旋。低稳定性末端的5′末端链被整合至RISC复合物内,而另一条链被降解。
微RNA(miRNA)看起来通过与位于由这些基因产生的转录物中的互补序列结合来调节靶基因。就lin-4和let-7而言,靶位点位于靶mRNA的3′UTR中(Lee等人,Cell 75:843-854(1993);Wightman等人,Cell 75:855-862(1993);Reinhart等人,Nature 403:901-906(2000);Slack等人,Mol.Cell 5:659-669(2000)),并且在lin-4和let-7miRNA与其靶位点之间有几个错配。结合lin-4或let-7miRNA似乎引起由靶miRNA编码的蛋白的稳态水平的下调,而不影响自身的转录物(Olsen和Ambros,Dev.Biol.216:671-680(1999))。另一方面,最近有证据表明,在某些情况下,miRNA可以引起靶转录物在靶位点内特异性RNA裂解,并且该裂解步骤看起来需要miRNA与靶转录物之间具有100%的互补性(Hutvagner和Zamore,Science 297:2056-2060(2002);Llave等人,Plant Cell 14:1605-1619(2002))。看起来有可能miRNA可进入至少两条靶基因调控途径:(1)当靶互补性<100%时,蛋白下调;并且(2)当靶互补性是100%时,RNA裂解。进入RNA裂解途径的微RNA与在动物中RNA干扰(RNAi)期间以及在植物中转录后基因沉默(PTGS)期间产生的21-25nt短干扰RNA(siRNA)类似,并且可能整合进与在RNAi情况中观察到的复合物类似或相同的RNA-诱导的沉默复合物(RISC)内。
用生物信息学鉴定miRNA的靶标在动物中没有成功,这可能是因为动物miRNA与它们的靶标具有低水平的互补性。另一方面,生物信息学方法已经成功地用于预测植物miRNA的靶标(Llave等人,Plant Cell14:1605-1619(2002);Park等人,Curr.Biol.12:1484-1495(2002);Rhoades等人,Cell 110:513-520(2002)),因此,看起来植物miRNA与它们的推定靶标的整体互补性高于动物miRNA。植物miRNA的这些预测靶标中的大部分编码涉及植物发育模式或细胞分化的转录因子家族的成员。
调控序列
本发明的重组DNA构建体(包括抑制DNA构建体)可能包含至少一个调控序列。
调控序列是启动子。
多种启动子可用于本发明的重组DNA构建体(及抑制DNA构建体)中。可以根据所需结果来选择启动子,并且可以包括用于在宿主生物体中表达的组成型启动子、组织特异性启动子、诱导型启动子或其他启动子。
虽然候选基因当通过组成型启动子驱动表达时可预测其效应,但候选基因在35S或UBI启动子控制下的高水平、组成型表达可以(或可以不)具有多重效应。使用组织特异和/或胁迫特异启动子可消除不需要的效应但保留氮耐受性的能力。在拟南芥中已经观察到了对干旱和寒冷耐受性的这种类型的效应(Kasuga等人,Nature Biotechnol.17:287-91(1999))。
适用于植物宿主细胞的组成型启动子包括(例如)Rsyn7启动子的核心启动子和在WO 99/43838和美国专利6,072,050中公开的其他组成型启动子;CaMV 35S核心启动子(Odell等人,Nature 313:810-812(1985));稻肌动蛋白启动子(McElroy等人,Plant Cell 2:163-171(1990));泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689(1992));pEMU(Last等人,Theor.Appl.Genet.81:581-588(1991));MAS(Velten等人,EMBO J.3:2723-2730(1984));ALS启动子(美国专利5,659,026)等。其他组成型启动子包括例如在美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中公开的那些启动子。
在选择启动子用于本发明方法时,可能有利的是使用组织特异性启动子或发育调节启动子。
另一种组织特异性启动子或发育调节启动子是这样的DNA序列,该序列调节DNA序列选择性地在对雄穗发育、结籽或两者重要的植物细胞/组织中表达,并限制这种DNA序列只在植物的雄穗发育或种子成熟期间表达。任何引起所需时空表达的可鉴定启动子均可用于本发明的方法中。
可用于本发明的种子或胚芽特异性启动子包括大豆Kunitz胰蛋白酶抑制剂启动子(Kti3,Jofuku和Goldberg,Plant Cell 1:1079-1093(1989))、马铃薯块茎特异蛋白启动子(patatin启动子)(马铃薯块茎)(Rocha-Sosa,M.等人,EMBO J.8:23-29(1989))、convicilin启动子、豌豆球蛋白启动子、豆球蛋白启动子(豌豆子叶)(Rerie,W.G.等人,Mol.Gen.Genet.259:149-157(1991);Newbigin,E.J.等人,Planta 180:461-470(1990);Higgins,T.J.V.等人,Plant.Mol.Biol.11:683-695(1988))、玉米蛋白启动子(玉米胚乳)(Schemthaner,J.P.等人,EMBO J.7:1249-1255(1988))、菜豆蛋白启动子(菜豆子叶)(Segupta-Gopalan,C.等人,Proc.Natl.Acad.Sci.U.S.A.82:3320-3324(1995))、植物血球凝集素启动子(菜豆子叶)(Voelker,T.等人,EMBO J.6:3571-3577(1987))、B-伴球蛋白启动子和大豆球蛋白启动子(大豆子叶)(Chen,Z-L等人,EMBO J.7:297-302(1988))、谷蛋白启动子(大米胚乳)、大麦醇溶蛋白启动子(大麦胚乳)(Marris,C.等人,Plant Mol.Biol.10:359-366(1988))、麦谷蛋白启动子和麦醇溶蛋白启动子(小麦胚乳)(Colot,V.等人,EMBO J.6:3559-3564(1987))、和甘薯贮藏蛋白启动子(甘薯块根)(Hattori,T.等人,Plant Mol.Biol.14:595-604(1990))。可操作地连接至嵌合基因构建体异源编码区的种子特异性基因的启动子在转基因植物中保持它们的时空表达模式。这样的实施例包括在拟南芥属和甘蓝型油菜(Brassicanapus)种子中表达脑啡肽的拟南芥2S种子储藏蛋白基因启动子(Vanderkerckhove等人,Bio/Technology 7:L929-932(1989))、表达荧光素酶的菜豆凝集素和β-菜豆蛋白启动子(Riggs等人,Plant Sci.63:47-57(1989)),以及表达氯霉素乙酰转移酶的小麦谷蛋白启动子(Colot等人,EMBO J.6:3559-3564(1987))。
可诱导启动子响应内源性或外源性刺激的存在,例如,通过化合物(化学诱导剂),或响应环境、激素、化学信号和/或发育信号而选择性表达可操纵连接的DNA序列。可诱导的或受调控的启动子包括(例如)受光、热、胁迫、水涝或干旱、植物激素、创伤或诸如乙醇、茉莉酮酸酯、水杨酸或安全剂之类的化学品调控的启动子。
其它启动子包括如下启动子:1)胁迫诱导型RD29A启动子(Kasuga等人,Nature Biotechnol.17:287-91(1999));2)大麦启动子B22E;B22E的表达是发育中的玉米籽粒中的柄所特异性的(“Primary Structureof a Novel Barley Gene Differentially Expressed in Immature AleuroneLayers(在未成熟糊粉层中差异表达的新大麦基因的一级结构)”,Klemsdal等人,Mol.Gen.Genet.228(1/2):9-16(1991));以及3)玉米启动子Zag2(“Identification and molecular characterization of ZAG1,the maize homolog of the Arabidopsis floral homeotic gene AGAMOUS(ZAG1-拟南芥属花同源异形基因AGAMOUS的玉米同系物的鉴定和分子表征)”,Schmidt等人,Plant Cell 5(7):729-737(1993);“Structuralcharacterization,chromosomal localization and phylogenetic evaluation oftwo pairs of AGAMOUS-like MADS-box genes from maize”,Theissen等人,Gene 156(2):155-166(1995);NCBI GenBank Accession X80206))。Zag2转录物可在授粉前五天至授粉后(“DAP”)七至八天被检测到,并且引导Ciml在发育中的雌花序心皮中表达,Ciml对发育中的玉米籽粒的籽仁而言是特异性的。Ciml转录物在授粉前四至五天至授粉后六至八DAP被检测到。其他可用的启动子包括可源自其表达与发育中的雌小花母系相关的基因的任何启动子。
用于调控本发明的核苷酸序列在植物中表达的其它启动子是茎特异性启动子。这种茎特异性启动子包括苜蓿S2A启动子(GenBank登记号:EF030816;Abrahams等人,Plant Mol.Biol.27:513-528(1995))和S2B启动子(GenBank登录号:EF030817)等等,将这些文献以引用的方式并入本文。
启动子可以整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包括合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到,由于在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro,J.K.和Goldberg,R.B.,Biochem.Plants 15:1-82(1989)的汇编中可找到许多实例。
其它启动子可包括:RIP2、mLIP15、ZmCOR1、Rab17、CaMV 35S、RD29A、B22E、Zag2、SAM合成酶启动子、泛素启动子、CaMV 19S、nos、Adh、蔗糖合成酶启动子、R-等位基因启动子、维管组织其它启动子S2A(Genbank登录号EF030816)和S2B(Genbank登录号EF030817)及来自玉米的组成型启动子GOS2。其它启动子包括根启动子,例如玉米NAS2启动子、玉米Cyclo启动子(US公布2006/0156439,公开于2006年7月13日)、玉米ROOTMET2启动子(WO 2005/063998,公开于2005年7月14日)、CR1BIO启动子(WO 2006/055487,公开于2006年5月26日)、CRWAQ81(WO 2005/035770,公开于2005年4月21日)和玉米ZRP2.47启动子(NCBI登录号U38790;NCBI GI No.1063664)。
本发明的重组DNA构建体(及抑制DNA构建体)也可包括其他调控序列,包括但不限于翻译前导序列、内含子和多腺苷酸化识别序列。在本发明的另一个其它实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。
内含子序列可以加至5’非翻译区、蛋白编码区或3’非翻译区以增加积聚在胞浆中的成熟信息的量。已经显示,在植物和动物两者的表达构建体的转录单位中包含可剪接内含子可使基因表达在mRNA和蛋白质水平上均增强高达1000倍(Buchman和Berg,Mol.Cell Biol.8:4395-4405(1988);Callis等人,Genes Dev.1:1183-1200(1987))。这种内含子对基因表达的增强通常在将其设置接近转录单位的5’端时为最大。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的使用是本领域已知的。通常参见The Maize Handbook,第116章,Freeling和Walbot(编辑),Springer,纽约(1994)。
如果期望进行多肽表达,则通常希望在多核苷酸编码区的3′-端处包含有多腺苷酸化区。该多腺苷酸化区可源自天然基因,源自多种其他植物基因或源自T-DNA。要加入的3′端序列可源自(例如)胭脂碱合成酶或章鱼碱合成酶基因,或作为选择源自另外的植物基因,或在一个实施方案中是源自任何其他真核基因。
“翻译前导序列”指位于基因启动子序列和编码序列之间的DNA序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。翻译前导序列的实例已经有所描述(Turner,R.and Foster,G.D.,Mol.Biotech.3:225(1995)).
任何植物都可以选择用来鉴定将用于本发明重组DNA构建体的调控序列和基因。适用于分离基因和调控序列的靶植物的实例应该包括但不限于苜蓿、苹果、杏、拟南芥属植物、洋蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、卡诺拉、香瓜、胡萝卜、木薯、蓖麻、菜花、芹菜、樱桃、菊苣、芫荽、柑桔类、克莱门氏小柑橘类、三叶草、椰子、咖啡、玉米、棉、蔓越莓、黄瓜、花旗松、茄子、菊苣、茅菜、桉树、茴香、无花果、大蒜、葫芦、葡萄、柚子树、白兰瓜、豆薯、猕猴桃、生菜、韭葱、柠檬、酸橙、火炬松、亚麻子、玉米、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕、油菜、秋葵、橄榄树、洋葱、橙、观赏植物、棕榈、木瓜树、欧芹、欧洲防风草、豌豆、桃树、花生、梨树、胡椒、柿树、松树、菠萝、大蕉、李树、石榴树、白杨、马铃薯、南瓜、温柏、辐射松、红菊苣、萝卜、油菜、树莓、稻、黑麦、高粱、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、枫香树、柑橘、茶、烟草、蕃茄、黑小麦、草皮草、芜菁、葡萄树、西瓜、小麦、薯蓣和西葫芦。用于鉴定调控序列的特别其它植物是拟南芥属植物、玉米、小麦、大豆和棉。
其它组合物
本发明的其它组合物是其基因组中包含本发明的任何重组DNA构建体(包括任何抑制DNA构建体)(例如上面所讨论的任何一种其它构建体)的植物。其它组合物也包括任何植物的子代,以及获取自植物或其子代的任何种子,其中所述子代或种子在其基因组中包含重组DNA构建体(或抑制DNA构建体)。子代包括通过植物的自花授粉或异型杂交而获得的连续世代。子代也包括杂交种和自交系。
在一个实施方案中,在杂交种子繁殖的农作物中,成熟的转基因植物可以自花授粉而产生纯合的自交系植物。该自交系植物产生含有新引入的重组DNA构建体(或抑制DNA构建体)的种子。这些种子可以生长而产生将会表现出改变的农学特性(如,在氮限制条件下农学特性增加)的植物,或者可以用于育种程序以产生杂交种子,这些杂交种子可以生长而产生将会表现出如改变的农学特性的植物。在一个实施方案中,种子是玉米种子。
在一个实施方案中,植物是单子叶植物或双子叶植物,是玉米或大豆植物,是玉米植物,例如玉米杂种植物或玉米自交系植物。植物还可以是向日葵、高梁、卡诺拉、小麦、苜蓿、棉花、水稻、大麦或黍。
在一个实施方案中,重组DNA构建体稳定地整合进植物的基因组中。
其它实施方案尤其包括但不限于如下其它实施方案1-8:
1.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。在一个实施方案中,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。
2.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;或
(b)抑制DNA构建体,所述构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,
并且其中所述植物在与不包含所述重组DNA构建体的对照植物比较时表现出至少一种农学特性的改变。
3.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样多肽,并且其中在与未包含所述重组DNA构建体的对照植物比较时,所述植物表现出增加的氮胁迫耐受性。在一个实施方案中,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。在一个实施方案中,该LNT2多肽来自拟南芥(Arabidopsis thaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycine tabacina)、野大豆(Glycine soja)或短绒野大豆(Glycine tomentella)。
4.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样多肽,并且其中在与未包含所述重组DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。在一个实施方案中,该LNT2多肽来自拟南芥(Arabidopsis thaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycine tabacina)、野大豆(Glycine soja)或短绒野大豆(Glycine tomentella)。
5.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出在氮限制条件下至少一种农学特性的改变。
6.在其基因组中包含抑制DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域的调控元件,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,并且其中在与未包含所述抑制DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。
7.在其基因组中包含抑制DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至以下序列的全部或部分的调控元件:(a)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;或(b)(a)的核酸序列的全长互补序列,并且其中在与未包含所述抑制DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。
8.上述其它实施方案1-7中的植物的任何子代、上述其它实施方案1-7中的植物的任何种子、上述其它实施方案1-7中的植物的子代的任何种子以及来自上述其它实施方案1-7中的植物以及它们的子代的细胞。
在上述其它实施方案1-8或本发明的任意其他实施方案中的任意一项中,重组DNA构建体(或抑制DNA构建体)在一个实施方案中包含至少一个在植物中有功能的启动子作为其它调控序列。
在上述其它实施方案1-8或本发明的任意其他实施方案中的任意一项中,至少一种农学特性的改变是增加或减少,在一个实施方案中是增加。
在任一前述的其它实施方案1-8或本发明的任何其他实施方案中,至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织中的含氮量、总植物氨基酸含量、营养组织游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎倒伏、植株高度、穗高、和穗长。产量、绿度和生物量尤其是其它进行改变的农学特性(在一个实施方案中是增加)。
在任意上述其它实施方案1-8或本发明的任意其他实施方案中,在与不包含所述重组DNA构建体(或抑制DNA构建体)的对照植物在氮胁迫条件下进行比较时,在一个实施方案中植物表现出至少一种农学特性的改变。
本领域的普通技术人员熟悉模拟氮条件(限制性的或非限制性的)的规程,以及用于评估已经经受过模拟的或天然存在的氮条件(限制性的或非限制性的)的植物的规程。例如,技术人员能够通过向植物提供比正常需求更少的氮或在一定时期内不提供氮来模拟氮条件,并且技术人员能够通过寻找农学特性的差异来评估此类植物,例如在生理学和/或物理条件上的变化,包括(但不限于)活力、生长、大小、或根长、或具体地讲叶片颜色或叶片面积大小。用于评估此类植物的其它技术包括测量叶绿素荧光、光合作用速率、根生长或换气速率。
下面的实施例描述了一些用于模拟氮限制条件和/或在此类条件下评估植物的代表性规程和技术。
技术人员也能够通过植物在田间测试中,在模拟的或天然存在的低氮或高氮条件下保持足够产量的能力(例如通过测量在低氮或高氮条件下,与标准氮条件下相比基本上等同的产量,或通过测量在低氮或高氮条件下与对照或参照植物相比更少的产量损失)来评估氮胁迫耐受性(在一个实施方案中至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的产量)。
在评估或测量其中利用了对照或参照植物的本发明任何实施方案(如,如本文描述的组合物或方法)中的转基因植物的农学特性或表型时,本领域的普通技术人员将很容易认识到要利用的合适对照或优选植物。例如,通过如下非限制性示例来说明:
1.转化植物的子代,该植物对于重组DNA构建体(或抑制DNA构建体)来说是半合子的,使得该子代分离成包含或不包含该DNA构建体(或抑制DNA构建体)的植株:包含该重组DNA构建体(或抑制DNA构建体)的子代将通常相对于未包含该重组DNA构建体(或抑制DNA构建体)的子代来进行测量(即,未包含该重组DNA构建体(或抑制DNA构建体)的子代是对照或参照植株)。
2.重组DNA构建体(或抑制DNA构建体)基因渗入至自交系中,例如在玉米中,或基因渗入进变体中,例如在大豆中:基因渗入品系将通常相对于亲本自交系或变种品系进行测量(即,亲本自交系或变种品系是对照或参照植物)。
3.双杂交系,其中第一杂交系由两个亲本自交系产生,而第二杂交系由相同的两个亲本自交系产生,不同的是其中一个亲本自交系含有重组DNA构建体(或抑制DNA构建体):第二杂交系通常将相对于第一杂交系进行测量(即第一杂交系为对照植物或参照植物)。
4.包含重组DNA构建体(或抑制DNA构建体)的植株:该植株可以相对于这样的对照植株进行评估或测量,该对照植株不包含重组DNA构建体(或抑制DNA构建体),但具有与该植株相当的遗传背景(例如,与包含重组DNA构建体(或抑制DNA构建体)的植株相比较,核遗传物质具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性)。存在许多可用于分析、比较和表征植物遗传背景的基于实验室的技术;其中这些技术是同工酶电泳、限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、任何引物聚合成酶链反应(AP-PCR)、DNA扩增指纹(DAF)、序列特异扩增区域(SCAR)、扩增片段长度多态性(AFLP
Figure BPA00001178919600331
)和也称为微卫星的简单序列重复(SSR)。
此外,本领域的普通技术人员将容易认识到,评估或测量转基因植物的农学特性或表型时合适的对照或参照植物将不包括先前已经针对所需的农学特性或表型,通过诱变或转化而选择的植物。
其它方法
其它方法包括但不限于用于提高植物氮胁迫耐受性的方法、用于评估植物氮胁迫耐受性的方法、用于改变植物农学特性的方法、用于测定植物农学特性改变的方法、和用于制备种子的方法。在一个实施方案中,植物是单子叶植物或双子叶植物,是玉米或大豆植物,甚至在一个实施方案中是玉米植物。植物还可以是向日葵、高梁、卡诺拉、小麦、苜蓿、棉花、水稻、大麦或黍。种子可以是玉米或大豆种子,可以是玉米种子,并且甚至在一个实施方案中可以是是玉米杂交种种子或玉米自交系种子。
其它方法尤其包括但不限于如下方法:
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;和(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与不包含该重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将包含至少一个调控序列(在一个实施方案中是植物中有功能的启动子)的抑制DNA构建体引入到可再生的植物细胞,该调控序列可操作地连接至以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(a)(i)的核酸序列的全长互补序列;和(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;和(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价该转基因植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)评价该子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(a)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)评价该转基因植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性;该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至来源于所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)评价该转基因植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性;该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(a)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至来源于所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
确定植物农学特性改变的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
产生种子(在一个实施方案中可以作为提供氮胁迫耐受性的产品销售的种子)的方法,该方法包括任意上述的其它方法,并且还包括从所述子代植物获得种子,其中所述种子在它们的基因组中包含所述重组DNA构建体(或抑制DNA构建体)。
在任一前述的其它方法或本发明方法的任何其它实施方案中,测定转基因植物中农学特性改变的步骤(如果适用的话)在一个实施方案中可包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该转基因植物是否表现出至少一种农学特性的改变。
在任一前述的其它方法或本发明方法的任何其它实施方案中,测定子代植物中农学特性改变的步骤(如果适用的话)可包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该子代植物是否表现出至少一种农学特性的改变。
在任何前述的其它方法或本发明方法的任何其它实施方案中,在所述导入步骤中所述可再生的植物细胞可包括愈伤组织细胞(在一个实施方案中是胚胎)、配子细胞、分生细胞或未成熟胚芽细胞。可再生的植物细胞在一个实施方案中来自自交玉米植物。
在任意上述的其它方法或本发明方法的任意其他实施方案中,所述再生步骤在一个实施方案中包括:(i)在包含促进胚发生的激素的培养基中培育所述转化的植物细胞直至观察到愈伤组织;(ii)将所述步骤(i)的转化的植物细胞转移至包含促进组织机体形成的激素的第一培养基;以及(iii)在第二培养基上传代培养步骤(ii)后的所述转化的植物细胞,以允许嫩芽伸长、根发育或这两者同时发生。
在任意上述的其它方法或本发明方法的任意其它实施方案中,至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物氮含量、果实氮含量、种子氮含量、营养组织中的氮含量、总植物氨基酸含量、营养组织中的游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织中的蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎杆倒伏、植物高度、穗高、以及穗长。产量、绿度和生物量尤其是其它进行改变的农学特性(在一个实施方案中是增加)。
在任意上述其它方法或本发明的方法的任意其它实施方案中,在与不包含所述重组DNA构建体(或抑制DNA构建体)的对照植物在氮胁迫条件下进行比较时,在一个实施方案中植物表现出至少一种农学特性的改变。
在任一前述的其它方法或本发明方法的任何其它实施方案中,存在供选择的替代方案用于将包含可操作地连接至少一种调控序列上的多核苷酸的重组DNA构建体导入可再生的植物细胞。例如,可将调控序列(例如一种或多种增强子、在一个实施方案中作为转位因子的部件)导入可再生的植物细胞,然后筛选其中将所述调控序列可操作地连接至编码本发明多肽的内源基因的事件。
将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于DNA直接摄取、化学处理、电穿孔、微注射、细胞融合、感染、病毒介导的DNA转移、轰击或农杆菌介导的转化。
其它技术如下文实施例所示,用于转化玉米植物细胞和大豆植物细胞。
用于转化双子叶植物(主要通过利用根瘤农杆菌(Agrobacteriumtumefaciens))以及获得转基因植物的其它方法包括公开的用于棉花的那些(美国专利5,004,863、美国专利5,159,135、美国专利5,518,908);用于大豆的那些(美国专利5,569,834、美国专利5,416,011、McCabe等人,Bio/Technology 6:923(1988),Christou等人,Plant Physiol.87:671674(1988));用于芸苔属植物(Brassica)的那些(美国专利5,463,174);用于花生的那些(Cheng等人,Plant Cell Rep.15:653 657(1996),McKently等人,Plant Cell Rep.14:699 703(1995));用于番木瓜的那些;以及用于豌豆的那些(Grant等人,Plant Cell Rep.15:254-258(1995))。
用电穿孔、粒子轰击和农杆菌转化单子叶植物也已有报道并且作为其它方法包括(例如)如在天门冬属(asparagus)中实现的转化和植物再生(Bytebier等人,Proc.Natl.Acad.Sci.U.S.A.84:5354,(1987));在大麦中实现的转化和植物再生(Wan和Lemaux,Plant Physiol.104:37(1994));corn(Rhodes等人,Science 240:204(1988),Gordon-Kamm等人,Plant Cell 2:603 618(1990),Fromm等人,Bio/Technology 8:833(1990),Koziel等人,Bio/Technology 11:194(1993),Armstrong等人,Crop Science 35:550-557(1995));在燕麦中实现的转化和植物再生(Somers等人,Bio/Technology 10:1589(1992));在野茅(orchardgrass)中实现的转化和植物再生(Horn等人,Plant Cell Rep.7:469(1988));在稻中实现的转化和植物再生(Toriyama等人,Theor.Appl.Genet.205:34(1986);Part等人,Plant Mol.Biol.32:1135 1148,(1996);Abedinia等人,Aust.J.Plant Physiol.24:133 141(1997);Zhang和Wu,Theor.Appl.Genet.76:835(1988);Zhang等人,Plant Cell Rep.7:379,(1988);Battraw和Hall,Plant Sci.86:191 202(1992);Christou等人,Bio/Technology 9:957(1991));裸麦(De la Pena等人,Nature325:274(1987));在甘蔗中实现的转化和植物再生(Bower和Birch,Plant J.2:409(1992));高羊茅(Wang等人,Bio/Technology 10:691(1992));以及小麦(Vasil等人,Bio/Technology 10:667(1992);美国专利5,631,152)。
存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及待再生的具体植物物种。
从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的(Weissbach和Weissbach(编辑),载于:Methods for Plant Molecular Biology,Academic Press,Inc.San Diego,CA,(1988))。该再生和生长方法通常包括如下步骤:选择转化的细胞、培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植株阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。
含有编码所关注蛋白质的外来的外源性分离核酸片段的植物的发育或再生是本领域所熟知的。在一个实施方案中,将再生的植物进行自花授粉以产生纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员所熟知的方法培育含有所需多肽的本发明的转基因植物。
实施例
本发明将在下面的实施例中进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应该理解,尽管这些实施例说明了本发明的其它实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可以确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用法和条件。此外,除了那些本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在属于附加的权利要求书的范围内。
                     实施例1
         制备具有激活标记基因的拟南芥种群
构建18.49kb的T-DNA基二元构建体,pHSbarENDs2(SEQ ID NO:1;图1)包含四个来源于花椰菜花叶病毒35S启动子的四个多聚增强子元件(对应于序列-341至-64,如Odell等人Nature 313:810-812所述(1985))。该构建体也包含允许质粒救援的载体序列(pUC9)和多接头(SEQ ID NO:11)、再动员T-DNA的转座子序列(Ds)、以及允许草胺磷选择转基因植物的bar基因。原则上,仅将从右边界(RB)至左边界(LB)包含的10.8kb片段转移到寄主植物基因组中。因为增强子元件位于靠近RB处,它们可诱导T-DNA整合后的基因组位点顺式激活。
通过整个植株的农杆菌转化制备拟南芥激活标记种群。将pHSbarENDs2构建体转化到根癌农杆菌菌株C58中,在25℃下在溶菌肉汤培养基中培养至OD600~1.0。然后离心沉淀细胞,并重悬在相等体积的5%蔗糖/0.05%Silwet L-77(OSI Specialties,Inc)中。在早期抽薹时,培育拟南芥属生态型Col-0的土壤使用农杆菌悬浮液进行顶部灌溉。一周后,相同植株再次用在蔗糖/Silwet中的相同农杆菌菌株进行顶部灌溉。然后将该植物的种子设为标准。所得T1种子在土壤中播种,通过喷洒草胺磷(FINALE
Figure BPA00001178919600461
;AgrEvo;Bayer Environmental Science)选择转基因幼苗。选择了总计100,000个草胺磷抗性T1幼苗。分开保存来自每个品系的T2种子。
                      实施例2
           筛选以鉴定具有低氮耐受性的品系
来自每个100,000个分离T1激活标记品系的十一个T2植物可种植在方板(15mm×15mm)上,方板包含0.5xN-Free Hoagland’s,0.4mM硝酸钾,0.1%蔗糖,1mM MES和0.25%PhytagelTM(低氮培养基)。每个板种植五个品系,并且每个板包括9个野生型个体以使总计64个个体排列成8×8的网格图案(参见图11)。在暗处、4℃条件下保持平板三天以使种子分层,然后在22℃光照和20℃黑暗交替条件下水平放置九天。光周期为十六小时光照和八小时黑暗,平均光照强度为~200mmol/m2/s。每天旋转并振动每个架子中的平板。在第十二天(生长九天),对整个板拍照以评估幼苗状态。
在掩蔽该平板图像以移除背景颜色后,每个个体收集两个不同的测量数据:总罗赛塔面积和进入绿色区的颜色百分比。使用色调、饱和度和强度数据(HSI),绿色区由色调50至66组成。总罗赛塔面积用作植物生物量的量度,而绿色区通过剂量-响应研究已经显示指示氮同化作用(参见图12)。
将在与野生型对照植物进行比较时具有显著的总罗赛塔面积和/或绿色区增加的品系命名为Phase 1 hits。在相同分析条件下进行Phase 1hits的重复试样再筛选(Phase 2 筛选)。还通过Phase 3筛选以进一步验证通过Phases 1和2的突变体。在Phase 3中,将每个品系分开种植在低氮培养基中,使得32个T2个体紧邻着32个野生型个体生长,为分析提供更高的统计学严谨性。如果一个品系显示与Phase 3中对照的显著差异,然后可认为该品系是经验证的氮缺乏抗性品系。
                      实施例3
                鉴定激活标记基因
使用下述两个标准程序中的一个或两个鉴定侧接导致氮耐受性的T-DNA插入序列的基因:(1)热不对称交错(TAIL)PCR(Liu等人,Plant J.8:457-63(1995));以及(2)SAIFF PCR(Siebert等人,NucleicAcids Res.23:1087-1088(1995))。至于复杂的多聚T-DNA插入序列,TAIL PCR和SAIFF PCR可能均不足以鉴定候选基因。在这些情况下,可使用包括反式PCR、质粒拯救和/或基因组文库构建在内的其他程序。
成功的结果是其中单个TAIL或SAIFF PCR片段包含T-DNA边界序列和拟南芥属基因组序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与公开可用的拟南芥属基因组的序列比对来鉴定候选基因。具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是激活的基因的候选基因。
为了验证鉴定的基因真的靠近T-DNA并排除TAIL/SAIFF片段是嵌合伪克隆的可能性,用一个T-DNA中的寡核苷酸和一个候选基因特异性的寡核苷酸进行对基因组DNA的诊断PCR。将提供PCR产品的基因组DNA样本理解为表示T-DNA插入序列。该分析也验证了其中一种以上的插入事件发生在相同品系中的情况,例如,在TAIL和/或SAIFF PCR分析中鉴定是否有多个不同基因组片段。
                     实施例4
              鉴定激活标记LNT2基因
进一步分析显示氮缺乏耐受性的激活标记品系(品系111786)。提取来自该品系的DNA,并且在突变品系中侧接T-DNA插入序列的基因通过连接介导PCR(Siebert等人,Nucleic Acids Res.23:1087-1088(1995))进行鉴定。鉴定一个单独扩增的片段,它包含T-DNA边界序列和拟南芥基因组序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与完全拟南芥属基因组的序列比对鉴定候选基因。具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是品系中激活的基因的候选基因。就品系111786而言,最靠近35S增强子的基因是At5g50930(SEQ ID NO:27),它编码拟南芥“unknown蛋白”,本文称为LNT2(SEQ ID NO:28;NCBI GI 15241317)。
                   实施例5
    通过转化拟南芥验证候选拟南芥基因(At5g50930)
可将候选基因转化到拟南芥属中并在35S启动子作用下过表达。如果在转基因品系中观察到与亲本激活标记品系相同或相似的表型,则将该候选基因认为是拟南芥属中验证过的“前导基因”。
通过以下方法测试拟南芥At5g50930基因(SEQ ID NO:27)的赋予氮缺乏耐受性的能力。
通过RT-PCR扩增At5g50930cDNA,使用以下引物:
1.At5g50930-5’attB正向引物(SEQ ID NO:35)
正向引物包含attB1序列(ACAAGTTTGTACAAAAAAGCAGGCT;SEQ ID NO:12)和共有的Kozak序列(CAACA)的所述cDNA蛋白编码区上游的前21个核苷酸(以ATG起始密码子开头)。
2.At5g50930-3’attB反向引物(SEQ ID NO:36)
反向引物包含attB2序列(ACCACTTTGTACAAGAAAGCTGGGT;SEQ ID NO:13),该序列邻近所述cDNA蛋白编码区的反向互补序列的后21个核苷酸(以终止密码子的反向互补序列开头)。
RT-PCR反应生成两个产物,本文称为lnt2-2和lnt2-3(分别是SEQID NO:29和31)。将这些产物鉴定为At5g50930基因的剪接变体。
使用INVITROGENTM GATEWAYCLONASETM技术,用pDONRTMZeo(SEQ ID NO:2;图2)进行每个RT-PCR产物的BP重组反应。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTMZeo移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entry clone)。如下所述,将每个剪接变体序列的一个鉴定为阳性的入门克隆与一个目的载体一起用于随后的LR重组反应。
用紧接INVITROGENTM GATEWAY C1转化插入序列上游的1.3-kb35S启动子构建称为pBC-yellow(SEQ ID NO:4;图4)的16.8-kb T-DNA基的二元载体(目的载体),所述插入序列包含ccdB细菌致死基因以及侧接attR1和attR2序列的氯霉素抗性基因(CAM)。该载体也包含RD29a启动子,该启动子驱动基因表达ZS-Yellow(INVITROGENTM),它赋予转化过的种子黄色荧光。使用INVITROGENTM GATEWAY
Figure BPA00001178919600482
技术,使用包含lnt2-2和pBC-yellow载体的入门克隆进行LR重组反应。该扩增允许快速定向克隆lnt2-2(SEQ ID NO:29),克隆发生在pBC-yellow中的35S启动子之后。还使用包含lnt2-3和pBC-yellow载体的入门克隆进行LR重组反应。
申请人然后使用如实施例1所述的相同农杆菌介导转化程序,将35S启动子:At5g50930表达构建体导入野生型拟南芥生态型Col-0。转基因T1种子通过黄色荧光进行选择,并且将32个这些T1种子紧邻着32个野生型拟南芥生态型Col-0种子种植在低氮培养基上。所有随后的生长和拍照条件均如实施例1所述。发现来自激活标记的、对氮限制条件具有耐受性的初始表型能在用其中At5g50930基因通过35S启动子直接表达的构建体转化过的野生型拟南芥植物中重现。
                      实施例6
         cDNA文库的组成、cDNA克隆的分离和测序
cDNA文库可通过许多可用的方法中的任一种制备。例如,通过首先根据生产商的说明书(Stratagene Cloning Systems,La Jolla,CA)制备
Figure BPA00001178919600491
载体中的cDNA文库,可将cDNA引入质粒载体中。根据Stratagene提供的说明书,将
Figure BPA00001178919600492
文库转换成质粒文库。当转换的时候,将把cDNA插入序列包含于质粒载体rBLUESCRIPT
Figure BPA00001178919600493
中。此外,可使用T4连接酶(New England Biolabs)将cDNA直接导入预切过的Bluescript
Figure BPA00001178919600494
II SK(+)载体(Stratagene)中,随后按照制造商规程(GIBCO BRL Products)转染DH10B细胞。一旦cDNA插入序列处于质粒载体中,从随机选取的含重组pBLUESCRIPT
Figure BPA00001178919600495
质粒的细菌菌落制备质粒DNA,或者用对插入的cDNA序列旁侧的载体序列特异性的引物,通过聚合酶链式反应扩增插入的cDNA序列。将扩增的DNA插入序列或质粒DNA在引物标记法测序反应(dye-primer sequencingreaction)中进行测序,以产生部分cDNA序列(表达序列标记或“EST”;参见Adams等人,1991,Science 252:1651-1656)。用Perkin Elmer Model377荧光测序仪分析所得的EST。
用改进的转座规程产生全长插入序列(FIS)数据。从归档的甘油原种作为单一菌落回收确定了FIS的克隆,并通过碱性裂解分离质粒DNA。将分离的DNA模板在基于PCR的测序反应中与载体引物M13正向和反向寡核苷酸反应并上样至自动化的测序仪上。通过与对其进行FIS查询的初始EST序列进行序列比对来确认克隆鉴定。
将确认的模板通过基于酿酒酵母(Saccharomyces cerevisiae)Tyl转座因子(Devine和Boeke,1994,Nucleic Acids Res.22:3765-3772)的Primer Island转座试剂盒(PE Applied Biosystems,Foster City,CA)进行转座。该体外转座系统在整个一组大DNA分子中随机地放入独特的结合位点。随后将转座的DNA用于通过电穿孔转化DH10B电-感受态细胞(Gibco BRL/Life Technologies,Rockville,MD)。转座因子含有另外的可选标记(称为DHFR;Fling和Richards,1983,Nucleic AcidsRes.11:5147-5158),使得能在琼脂平板上仅双重筛选含有整合的转座子的那些亚克隆。从每次转座反应随机地选择多个亚克隆,通过碱性裂解制备质粒DNA,并用对转座子内的结合位点特异性的独特引物从转座事件位点向外进行测序(ABI Prism dye-terminator ReadyReaction mix)。
收集序列数据(ABI PRISM
Figure BPA00001178919600501
Collections)并用Phred和Phrap(Ewing等人,Genome Res.8:175-185(1998);Ewing等人,Genome Res.8:186-194(1998))进行装配。Phred是一种公用软件程序,该程序再次读取ABI序列数据,再次调出(recall)碱基,赋质量值,并将碱基序列(base call)和质量值写入可编辑的输出文件中。Phrap序列组装程序使用这些质量值来增加组装的序列重叠群的准确度。通过Consed序列编辑器(Gordon等人,1998,Genome Res.8:195-202)检查装配序列。
在一些克隆中,cDNA片段对应基因的3’-端的一部分并且不会涵盖整个开放阅读框。为了获得上游信息,使用两种不同规程中的一者。这两种方法中的第一种方法导致产生含有所需基因序列的部分的DNA片段,而第二种方法导致产生含有整个开放阅读框的片段。这两种方法均使用两轮PCR扩增以从一个或多个文库获得片段。有时基于以前的知识(特定的基因应该存在于某些组织中)选择文库,有时则进行随机地选择。获得相同基因的反应可平行地在若干文库中进行,或者在文库池中进行。文库池通常用3至5个不同的文库制备并且使其归一化而成为一致的稀释度。在第一轮扩增中,两种方法均使用载体特异性的(正向)引物,同时还使用基因特异性的(反向)引物,该正向引物对应位于克隆5’-端处的载体的一部分。-第一种方法使用与已知基因序列的一部分互补的序列,而第二种方法使用与3’-非翻译区(也称为UTR)的一部分互补的基因特异性引物。在第二轮扩增中,两种方法均使用套式引物组。按照生产商的说明书,用市售试剂盒将所得DNA片段连接进pBLUESCRIPT
Figure BPA00001178919600502
载体中。该试剂盒选自可得自包括InvitrogenTM(Carlsbad,CA)、Promega Biotech(Madison,WI)和Gibco-BRL(Gaithersburg,MD)在内的一些供应商的许多试剂盒。如上所述,将质粒DNA通过碱性裂解方法分离并进行测序和用Phred/Phrap进行装配。
                    实施例7
                cDNA克隆的鉴定
编码LNT2样多肽的cDNA克隆通过这样鉴定:进行BLAST(基本的局部比对搜索工具);Altschul等人,J.Biol.215:403-410,1993;还可参见国立卫生研究院国家医学图书馆的国家生物技术信息中心的万维网址上对BLAST算法的解释)进行鉴定,寻找与BLAST“nr”数据库中所包含氨基酸序列(包括所有非冗余GenBank CDS翻译序列、源自3-维结构Brookhaven蛋白质数据库(Protein Data Bank)、SWISS-PROT蛋白质序列数据库的最新的主要版本、EMBL和DDBJ数据库的序列)的相似性。在所有的阅读框中翻译来自克隆的DNA并用NCBI提供的BLASTX算法(Gish和States,Nat.Genet.3:266-272(1993))。采用国家生物技术信息中心(NCBI)提供的BLASTP算法,分析cDNA序列编码的多肽与包含在“nr”数据库中的所有可公开获得的氨基酸序列的相似性。为方便起见,通过BLAST计算仅仅偶然观察到cDNA序列与所搜索的数据库中所包含序列的匹配的P值(概率)或E值(期望值),在本文报导为“pLog”值,它代表所报导的P值或E值的负对数。-因此,pLog值越大,cDNA编码的序列和BLAST的“匹配”代表同源蛋白的可能性就越大。
EST序列能与如上所述的Genbank数据库进行比较。通过使用BLASTn算法(Altschul等人,Nucleic Acids Res.25:3389-3402(1997))对杜邦专利数据库比较具有序列同源共有区域或重叠区域的核苷酸序列,可找到含更5′端或3′端序列的EST。在两个或更多个核酸片段之间存在共有或重叠序列时,该序列可装配成单一的连续核苷酸序列,从而使最初的片段在5′或3′初始方向上延伸。一旦确定了最5′的EST后,可以通过全长插入序列来确定其完整的序列。
可用tBLASTn算法,通过将已知基因(来自专有来源或公开数据库的已知基因)的氨基酸序列对EST数据库进行比较,可找到属于不同物种的同源基因。tBLASTn算法对所有6个阅读框都翻译了的核苷酸数据库进行氨基酸查询的搜索。该搜索允许不同物种之间的核苷酸密码子使用的差异,并且允许密码子简并。
                         实施例8
              表征编码LNT2样多肽的cDNA克隆
制备提供来自玉米(Zea mays)、水稻(Oryza sativa)、和大豆(Glycinemax)不同组织的mRNA的cDNA文库。下面描述了该文库的特征。
                          表2
              来自玉米、大米、和大豆的cDNA文库
                                                                                     
文库     描述(组织)                                       克隆
                                                                                     
         玉米(Zea mays L.),用与RNA、DNA合成相关
cpg1c                                                     cpg1c.pk013.o6:fis
         的化学制品处理过的收集的BMS
         归一化的水稻(Oryza sativa L.,Nipponbare)愈伤
rca1n                                                     rca1n.pk001.f6:fis
         组织
sfl1n1   归一化的大豆(Glycine max L.,Wye)未成熟的花。    sfl1n1.pk002.j1
         大豆(Glycine max,Wye)11天龄幼苗的全长文
sds1f                                                     sds1f.pk001.k5
         库,使用海藻糖
如表3、图14A-14B、和图15所示,表2中鉴定的cDNA编码的多肽类似于来自拟南芥的LNT2多肽(At5g50930;NCBI通用标识号15241317;SEQ ID NO:28)和来自水稻(GI No.38347162,对应于SEQID NO:33)以及葡萄(GI No.147791927,对应于SEQ ID NO:34)的LNT2样多肽。
表3(非专利文献)和表4(专利文献)中所示的分别是单独的EST(“EST”)BLASTP结果、包含标明的cDNA克隆的整个cDNA插入物的序列(“FIS”)、由两个或更多个EST、FIS或PCR序列装配而成的重叠群序列(“Contig”)、或编码源自FIS或重叠群的完整蛋白或功能性蛋白的序列(“CGS”)。表3和表4也显示了使用Clustal V比对方法、使用默认参数计算的每对氨基酸序列的序列同一性百分比值(如下所述)。
                          表3
                   多肽的BLASTP结果
                  与LNT2多肽的同源性
                                                                             
序列                                      %同一性     BLAST
                       状况   NCBI GI
(SEQ ID NO:#)                                         pLOG打分
                                                                             
cpg1c.pk013.o6:fis           38347162
                       CGS                 77.4        17.8
(SEQ ID NO:18)               (SEQ ID:33.
rca1n.pk001.f6:fis            38347162
                       CGS                 100.0       15.8
(SEQ ID NO:20)               (SEQ ID:33.
PSO415619                     147791927
                       重叠群              58.7        13.0
(SEQ ID NO:24)               (SEQ ID:34.
PSO415620                     147791927
                       重叠群              57.1        11.8
(SEQ ID NO:26)               (SEQ ID:34.
                          表4
                   多肽的BLASTP结果
                  与LNT2多肽的同源性
                                                                        
序列                                                          BLAST
                      状况      参照序列           %同一性
(SEQ ID NO:#)                                                pLOG打分
                                                                        
cpg1c.pk013.o6:fis             SEQ ID NO:224380
                      CGS                           92.3      21.0
(SEQ ID NO:18)                在US2004214272-A1中
rca1n.pk001.f6:fis            SEQ ID NO:188525
                      CGS                           100.0     15.7
(SEQ ID NO:20)                在US2004123343-A1中
PSO415619                      SEQ ID NO:183694
                     重叠群                         92.1      21.4
(SEQ ID NO:24)                在US2004031072-A1中
PSO415620                      SEQ ID NO:183694
                     重叠群                         84.9      19.8
(SEQ ID NO:26)                在US2004031072-A1中
图14A和14B提供如SEQ ID NO:18、20、24、26所示的氨基酸序列和来自拟南芥(分别是SEQ ID NO:28、30、和32)的LNT2(At5g50930;NCBI通用标识号15241317)、LNT2-2、以及LNT2-3多肽的氨基酸序列的比对。也包括来自水稻(GI No.38347162,对应于SEQ ID NO:33)以及葡萄(GI No.147791927,对应于SEQ ID NO:34)的LNT2样多肽的比对。图15是图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
用LASERGENE
Figure BPA00001178919600541
生物信息计算包(DNASTAR
Figure BPA00001178919600542
Inc.,Madison,WI)的MEGALIGN
Figure BPA00001178919600543
程序进行序列比对和同一性百分比计算。用带默认参数(空位罚分=10,空位长度罚分=10)的Clustal比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)进行序列的多重比对。使用Clustal方法的成对比对的默认参数为KTUPLE 1,空位罚分=3,窗口=5,DIAGONALS SAVED=5。
                    实施例9
     制备含有拟南芥属前导基因的同源物的植物表达载体
可使用诸如BLAST(基本的局部比对搜索工具(Basic LocalAlignment Search Tool;Altschul等人,J.Mol.Biol.215:403-410,1993;也参见美国国家卫生研究院(National Institutes of Health)国立医学图书馆(National Library of Medicine)的国家生物技术信息中心(NationalCenter for Biotechnology Information)的万维网网址上对BLAST算法的解释)之类的序列比较算法,鉴定与前导LNT2基因同源的序列。同源LNT2样序列,如实施例8所述的序列,可通过任何一种以下方法进行PCR扩增。
方法1(基于RNA的方法):如果LNT2同源物的蛋白编码区域的5’和3’序列信息是可用的,可如实施例5A所述设计基因特异性引物。可将RT-PCR用于植物RNA来获得含有蛋白编码区的核酸片段,该EXST蛋白编码区旁侧为attB1(SEQ ID NO:12)和attB2(SEQ ID NO:13)序列。引物可含有起始密码子上游的共有Kozak序列(CAACA)。
方法2(基于DNA的方法):作为另外一种选择,如果LNT2同源物的cDNA克隆是可用的,可以PCR扩增完整cDNA插入序列(含有5′和3′非编码区)。可设计正向引物和反向引物,使它们分别或者含有attB1序列和在该cDNA插入序列前面的载体特异性序列或者含有attB2序列和在该cDNA插入序列后面的载体特异性序列。对于克隆进载体pBluescript SK+中的cDNA插入序列,可使用正向引物VC062(SEQ IDNO:15)和反向引物VC063(SEQ ID NO:16)。
方法1和方法2可根据本领域技术人员已知的步骤进行修改。例如,方法1的引物可含有限制性酶切位点而不是attB1和attB2位点,用于后来将PCR产物克隆进含有attB1和attB2位点的载体内。另外,方法2可涉及从cDNA克隆、λ克隆、BAC克隆或基因组DNA扩增。
可利用BP重组反应将通过任一种上述方法获得的PCR产物与GATEWAY
Figure BPA00001178919600551
供体载体(例如pDONRTM Zeo(SEQ ID NO:2;图2)或pDONRTM221(SEQ ID NO:3;图3)组合。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM Zeo或pDONRTM221移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entry clone)。使用INVITROGENTM GATEWAY
Figure BPA00001178919600552
CLONASETM技术,然后可将来自入门克隆的编码同源LNT2多肽的序列转移到合适的目的载体中(如pBC-Yellow(SEQ ID NO:4;图4)、PHP27840(SEQID NO:5;图5)、或PHP23236(SEQ ID NO:6;图6))以获得植物表达载体,所述载体分别用于拟南芥、大豆、和玉米。
图2和3中分别示出了供体载体pDONRTM/Zeo或pDONRTM 221的attP1和attP2位点。图4、5和6分别示出了目的载体pBC-Yellow、PHP27840、和PHP23236的attR1和attR2位点。
作为另外一种选择,可进行多个入门克隆和合适的目的载体之间的MultiSite Gateway
Figure BPA00001178919600553
LR重组反应以产生表达载体。
                      实施例10
     制备大豆表达载体并用验证过的拟南芥前导基因转化大豆
为了检查所得表型,可将大豆植株转化以过表达每个验证过的拟南芥属(Arabidopsis)基因或来自不同物种的对应同源物。
可将实施例5中所述的相同GATEWAY
Figure BPA00001178919600554
入门克隆用于将每个基因定向克隆进PHP27840载体(SEQ ID NO:5;图5)中,使得该基因的表达处于SCP1启动子的控制下。
然后可用包含编码本多肽的序列的表达载体转化大豆胚。
为了诱导体细胞胚,可将子叶(长度为3-5mm,从大豆品种A2872的表面灭菌的未成熟种子解剖出来)于26℃在光下或黑暗下培养六至十周。然后切取体细胞胚(其产生次生胚)并将其置于合适的液体培养基内。在重复选择增殖为早期球形阶段胚的体细胞胚的簇后,按下面的描述保持该悬浮液。
可将大豆胚发生悬浮培养物在26℃下在摇床(150rpm)上的35mL液体培养基中保持,荧光光照采用16∶8小时(白天/黑夜)的时间表。通过将大约35mg组织移植进35ml液体培养基中,每两周将培养物进行传代培养。
然后可通过基因枪轰击方法(Klein等人,Nature(London)327:70-73(1987),美国专利4,945,050)转化大豆胚发生悬浮培养物。杜邦公司的BIOLISTICTM PDS1000/HE仪器(氦气改进型)可用于这些转化。
可用于帮助大豆转化的可选标记基因是由来自花椰菜花叶病毒的35S启动子(Odell等人,Nature 313:810-812(1985))、来自质粒pJR225(来自大肠杆菌;Gritz等人,Gene 25:179-188,1983)的潮霉素磷酸转移酶基因以及胭脂碱合成酶基因的3′区构成的嵌合基因,该胭脂碱合成酶基因来自根癌农杆菌(Agrobacterium tumefaciens)Ti质粒的T-DNA。可用于帮助大豆转化的另一种可选标记基因是来自大豆或拟南芥属的除草剂抗性乙酰乳酸合成酶(ALS)基因。ALS是支链氨基酸缬氨酸、亮氨酸和异亮氨酸的生物合成中的第一共用酶。已经鉴定出ALS中的突变导致对三类ALS抑制剂中的某些或全部具有抗性(美国专利5,013,659;其全部内容以引用的方式并入本文)。除草剂抗性ALS基因的表达可处于SAM合成酶启动子(美国专利申请US-2003-0226166-A1;藉此将其全部内容以引用的方式并入本文)的控制下。
将如下物质(依次)加入50μL 60mg/mL的1μm金颗粒悬浮液:5μL DNA(1μg/μL)、20μL亚精胺(0.1M)和50μL CaCl2(2.5M)。然后搅拌该颗粒制备物三分钟,在微量离心机(microfuge)中离心10秒并移除上清液。然后将DNA包覆的颗粒在400μL 70%乙醇中洗涤一次并再悬浮于40μL无水乙醇中。可将DNA/颗粒悬浮液用超声波处理三次,每次一秒钟。然后将五μL该DNA-包覆的金颗粒装载至每个宏载体盘上。
将大约300-400mg两周大的悬浮培养物置于60×15mm的空培养皿中并用吸管将残留的液体从组织移除。对于每次转化实验,大约5-10板的组织受到正常轰击。膜破裂压力设定为1100psi并将腔室抽成28英寸汞柱的真空。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,可将组织分成两份并放回液体培养基中,如上所述进行培养。
轰击后五至七天,用新鲜培养基更换该液体培养基,并在轰击后七至十二天,用含有50mg/mL潮霉素的新鲜培养基更换。可每周更换这种选择培养基。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚芽发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新品系当成是独立的转化事件。然后可将这些悬浮培养物作为未成熟胚进行传代培养和维持,或者通过使单独体细胞胚成熟并萌发而再生成整株植株。
可分析用验证过的基因转化大豆植株以研究相对于对照或参照植株的农学特性。例如,能够分析在低氮和高氮条件(如氮限制条件和氮充分条件)下的产量增加和/或稳定性。
                       实施例11
       使用粒子轰击用验证过的拟南芥前导基因转化玉米
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。
可以将实施例5中所述的相同GATEWAY
Figure BPA00001178919600571
入门克隆用于将每种相应的基因定向克隆进玉米转化载体中。在玉米转化载体中的基因的表达可以处于组成型启动子的控制下,例如玉米泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689,1992)。
然后可通过下面的方法将上述重组DNA构建体引入玉米细胞中。可从源于自交玉米系H99和LH132杂交的发育中的颖果切取未成熟的玉米胚。在授粉后10至11天分离胚,这时它们长为1.0至1.5mm。然后将胚以轴线侧朝下放置并与琼脂糖硬化的N6培养基(Chu等人,Sci.Sin.Peking 18:659-668,1975)接触。将胚在27℃下保持在黑暗中。从这些未成熟胚的胚鳞增生出易脆的胚发生愈伤组织,该愈伤组织由未分化的细胞块构成,在胚柄结构上长有体细胞原胚状体和胚状体。可将从该原外植体分离的胚发生愈伤组织在N6培养基上培养,并每两至三周在这种培养基上进行传代培养。
可将质粒p35S/Ac(得自Peter Eckes博士,Hoechst Ag,Frankfurt,Germany)用于转化实验以便提供可选标记。该质粒含有pat基因(见欧洲专利公布0 242 236),该基因编码草胺膦乙酰转移酶(PAT)。酶PAT赋予对除草性谷氨酰胺合成酶抑制剂例如草胺膦的抗性。p35S/Ac的pat基因处于来自花椰菜花叶病毒的35S启动子(Odell等人,Nature313:810-812(1985))和胭脂碱合成酶基因的3′区的控制下,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T-DNA。
可将粒子轰击法(Klein等人,Nature 327:70-73(1987))用于将基因转移至愈伤组织培养细胞。根据该方法,利用下面的技术用DNA包覆金颗粒(直径1μm)。将十μg质粒DNA加到50μL金颗粒的悬浮液(60mg每mL)中。将氯化钙(50μL的2.5M溶液)和亚精胺游离碱(20μL的1.0M溶液)加入到该颗粒中。再加入这些溶液过程中涡旋该悬浮液。10分钟后,将试管粗略地离心(以15,000rpm进行5秒钟)并移除上清液。将该颗粒再悬浮于200mL的无水乙醇中,再次离心并移除上清液。再次进行乙醇冲洗并将颗粒再悬浮于终体积为30μL的乙醇中。可将DNA包覆的金颗粒等分试样(5μL)置于KAPTON飞行圆盘(Bio-Rad Labs)的中心。然后使用BIOLISTIC PDS-1000/He(Bio-Rad Instruments,Hercules CA),采用1000psi的氦气压、0.5cm的间隙距离以及1.0cm的飞行距离,将颗粒加速射入玉米组织中。
对于轰击,将胚发生组织置于琼脂糖硬化的N6培养基上的滤纸上。组织布置成薄薄一层,并覆盖直径为约5cm的圆形区域。然后可将包含组织的培养皿置于离阻挡网大约8cm的PDS-1000/He的腔室内。然后将该腔室中的空气抽出至28英寸汞柱的真空。利用在击波管中氦气压力达到1000psi时破裂的可破裂膜,宏载体被氦气冲击波加速。
轰击后七天,可将组织转移至N6培养基中,该培养基含有双丙氨磷(每升5mg)并缺少酪蛋白或脯氨酸。组织继续在这种培养基上缓慢生长。另外两周后,可将组织转移至含有bialaphos的新鲜N6培养基上。六周后,在某些装有补充了双丙氨磷的培养基的盘上,可辨别直径约1cm的区域上有活性生长的愈伤组织。当在选择培养基上传代培养时,这些愈伤组织可继续生长。
可以通过以下方法由愈伤组织再生出植物:首先将组织簇转移到N6培养基中,所述培养基补充了0.2mg 2,4-D/升。-两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。
可再生出转基因的T0植株并按照下面的HTP步骤确定它们的表型。可收集T1种子。
可在氮限制条件下(例如1mM硝酸盐)栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。超表达构建体与合适的对照植物比较导致绿度(绿色区)、产量、生长速率、生物量、成熟时的鲜重或干重、果实或种子产量、总植物氮含量、果实或种子氮含量、营养组织的氮含量、总植物游离氨基酸含量、营养组织中的游离氨基酸含量、果实或种子中的游离氨基酸含量、果实或种子中的蛋白质含量、营养组织中的蛋白质含量发生变化,可认为它是拟南芥前导基因在玉米中发挥功能提高对氮缺乏耐受性(增加的氮耐受性)的证据。此外,可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥基因的重组DNA构建体导入玉米自交系内。
                     实施例12
             电穿孔根癌农杆菌LBA4404
                     (概述)
将电穿孔感受态细胞(40μL),例如根癌农杆菌(Agrobacteriumtumefaciens)LBA4404(含有PHP10523)在冰上解冻(20-30分钟)。PHP10523含有用于T-DNA转移的VIR基因、农杆菌属的低拷贝数质粒复制起始区、四环素抗性基因以及用于体内DNA生物分子重组的cos位点。同时,将电穿孔管(electroporation cuvette)在冰上冷却。将该电穿孔仪的设置调节至2.1kV。将DNA等分试样(0.5μL亲代DNA,在低盐缓冲液或双蒸H2O中的浓度为0.2μg-1.0μg)与解冻的根癌农杆菌LBA4404细胞混合,同时仍然保持在冰上。将该混合物转移至电穿孔管的底部并静止保持在冰上1-2分钟。通过按下“pulse(脉冲)”键两次(理想的是获得4.0毫秒的脉冲)对细胞进行电穿孔(Eppendorf电穿孔仪2510)。随后,将0.5ml室温下的2xYT培养基(或SOC培养基)加入到电穿孔管并转移至15mL按压盖管(例如FALCONTM管)中。将细胞在28-30℃、200-250rpm下培养3小时。
将250μL的等分试样散布在包含YM培养基和50μg/mL奇放线菌素的板上并在28-30℃下培养三天。为了增加转化体的数目,可进行如下两个可选步骤中的其中一个:
选择1:用30μL 15mg/ml的利福平覆盖平板。LBA4404具有针对利福平的染色体抗性基因。这种附加的选择消除了在使用较差的LBA4404感受态细胞制备物时观察到的一些污染克隆。
选择2:进行两次重复的电穿孔以补偿较差的电感受态细胞。
转化体的鉴定
选取四个独立的克隆并划痕接种在包含AB基本培养基和50μg/mL奇放线菌素的平板上用于分离单个克隆。将平板在28℃下孵育二至三天。对于每个推定的共整合体选取单个克隆并将其接种在4ml的10g/L细菌蛋白胨,10g/L酵母提取物,5g/L氯化钠,和50mg/L奇放线菌素中。将该混合物在28℃下摇动培养24小时。采用QIAGEN Miniprep和可选的PB缓冲液洗涤,从4ml培养物分离出质粒DNA。DNA在30μL中洗提。如上所述,将2μL的等分试样用于电穿孔20μL DH10b+20μL双蒸H2O。可任选地,可将15μL等分试样用于转化75-100μL的INVITROGENTM Library Efficiency DH5α。将细胞散布在包含LB培养基和50μg/mL奇放线菌素的平板上并将其在37℃下培养过夜。
对于每个推定的共整合体选取三至四个独立克隆并将其接种在4ml的2xYT培养基(10g/L细菌蛋白胨,10g/L酵母提取物,5g/L氯化钠)和50μg/mL奇放线菌素中。将细胞在37℃下摇晃培养过夜。接下来,使用QIAprep
Figure BPA00001178919600601
Miniprep,用任选PB缓冲液洗涤液(稀释成50μL)从4mL培养物中分离质粒DNA。8μL质粒DNA用SalI(使用亲本DNA和PHP10523作对照物)进行消化。对于4个质粒利用限制性内切酶BamHI、EcoRI和HindIII再进行三次消化(使用亲代DNA和PHP10523作为对照),这4个质粒代表2种具有正确SalI消化模式的推定共整合体。推荐电凝胶(Electronic gel)用于比较。
作为另一种选择,对于高通量应用,例如针对Gaspe Flint衍生的玉米品系(实施例16)所描述的,代替通过限制性酶切分析来评价所得的共整合载体,可将三个克隆同时用于如实施例13(经由农杆菌转化)所述的感染步骤。
                     实施例13
      使用农杆菌属(Agrobacterium)细菌转化玉米
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。
农杆菌属细菌介导的玉米转化基本上按照以下文献中描述的方法进行:Zhao等人,in Meth.Mol.Biol.318:315-323(2006)中描述的方法进行(还可参见Zhao等人,Mol.Breed.8:323-333(2001)和1999年11月9日公布的美国专利5,981,840,以引用的方式将该文献并入本文)。该转化过程涉及细菌接种、共培养、静息、选择和植物再生。
1.未成熟胚芽制备
将未成熟胚芽从颖果上切下来,并且放置在含有2mL PHI-A培养基的2mL胃管中。
2.未成熟胚芽的农杆菌属细菌感染和共培养
2.1 感染步骤
用1mL微吸移管将(1)的PHI-A培养基取出,并且加入1mL农杆菌属细菌悬浮液。将该管轻轻地倒置以混合。将该混合物在室温下培养5分钟。
2.2 共培养步骤
用1mL微吸移管将农杆菌属细菌悬浮液从感染步骤中取出。使用无菌刮刀将胚从管中刮出并转移到100×15mm培养皿中的PHI-B培养基的平板中。确定胚的朝向,使得胚轴在培养基表面上朝下。将具有胚芽的平板在20℃于黑暗中培养3天。L-半胱氨酸可用于共培养阶段。采用标准二元载体,补充有100-400mg/L L-半胱氨酸的共培养培养基对于回收稳定的转基因事件是至关重要的。
3.选择推定的转基因事件
向在100×15mm培养皿中的PHI-D培养基的平板中转移10个胚芽,保持朝向,并且用parafilm将培养皿密封。将平板在黑暗中于28℃培养。预计在6-8周将看见作为黄色胚芽组织的主动生长推定事件。不产生事件的胚可能是棕色和坏死的,并且几乎看不见脆性组织生长。以2-3周的间隔将推定的转基因胚芽组织转移到新鲜的PHI-D平板上进行传代培养,时间间隔取决于生长速度。记录事件。
4.T0植株的再生
将在PHI-D培养基上繁殖的胚芽组织转移到在100×25mm培养皿中的PHI-E培养基(体细胞胚芽成熟培养基)中进行传代培养,在28℃于黑暗中培养直至体细胞胚芽成熟,培养大约10-18天。将具有良好限定的盾片和胚芽鞘的个体成熟体细胞胚芽转移到PHI-F胚芽发芽培养基中,并且在28℃于光中(约80μE,来自冷光灯或同等荧光灯)培养。在7-10天,将约10cm高的再生的植株置于盆中的园艺混合物中,并且使用标准园艺方法进行耐寒锻炼(hardened-off)。
用于植物转化的培养基
1.PHI-A:4g/L CHU基础盐,1.0mL/L 1000×Eriksson′s维生素混合物,0.5mg/L盐酸硫胺,1.5mg/L 2,4-D,0.69g/L L-脯氨酸,68.5g/L蔗糖,36g/L葡萄糖,pH5.2。加入100μM乙酰丁香酮(过滤灭菌的)。
2.PHI-B:PHI-A,不含有葡萄糖,将2,4-D增加至2mg/L,将蔗糖降低至30g/L,并且补充0.85mg/L硝酸银(过滤灭菌的),3.0g/LGELRITE
Figure BPA00001178919600621
,100μM乙酰丁香酮(过滤灭菌的),pH5.8。
3.PHI-C:PHI-B,不含GELRITE和乙酰丁香酮,将2,4-D降低至1.5mg/L,并且补充8.0g/L琼脂,0.5g/L 2-[N-吗啉代]乙烷-磺酸(MES)缓冲液,100mg/L羧苄西林(过滤灭菌的)。
4.PHI-D:PHI-C补充3mg/L bialaphos(过滤灭菌的)。
5.PHI-E:4.3g/L的Murashige and Skoog(MS)盐(Gibco,BRL11117-074)、0.5mg/L的烟酸、0.1mg/L的盐酸硫胺素、0.5mg/L的盐酸吡哆醇、2.0mg/L的甘氨酸、0.1g/L的肌醇、0.5mg/L的玉米素(Sigma,商品目录号:No.Z-0164),1mg/L吲哚乙酸(IAA),26.4μg/L脱落酸(ABA),60g/L蔗糖,3mg/L bialaphos(过滤灭菌的),100mg/L羧苄西林(过滤灭菌的),8g/L琼脂,pH5.6。
6.PHI-F:不含玉米素、IAA、ABA的PHI-E;将蔗糖降低至40g/L;用1.5g/L GELRITE
Figure BPA00001178919600623
替代琼脂;pH为5.6。
可以通过以下方法由愈伤组织再生出植物:首先将组织簇转移到N6培养基中,所述培养基补充了0.2mg 2,4-D/升。-两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。
转基因T0植株可以再生,并且可以确定其表型。可收集T1种子。
可在氮限制条件下(例如1mM硝酸盐)栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。超表达构建体与合适的对照植物比较导致绿度(绿色区)、产量、生长速率、生物量、成熟时的鲜重或干重、果实或种子产量、总植物氮含量、果实或种子氮含量、营养组织的氮含量、总植物游离氨基酸含量、营养组织中的游离氨基酸含量、果实或种子中的游离氨基酸含量、果实或种子中的蛋白质含量、营养组织中的蛋白质含量发生变化,可认为它是拟南芥前导基因在玉米中发挥功能提高对氮缺乏耐受性(增加的氮耐受性)的证据。
此外,可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥基因的重组DNA构建体导入玉米自交系内。
                     实施例14A
  制备表达载体用于用验证过的候选拟南芥基因(At5g50930)、
              使用农杆菌转化玉米品系
通过INVITROGENTM GATEWAY技术,使用GATEWAY
Figure BPA00001178919600632
入门克隆进行LR重组反应以生成前体质粒PHP28699,GATEWAY
Figure BPA00001178919600633
入门克隆包含拟南芥lnt2-2(如实施例5所述)、入门克隆PHP23112(SEQ IDNO:14)、入门克隆PHP20234(SEQ ID NO:9;图9)和目的载体PHP22655(SEQ ID NO:10)。同样地,使用GATEWAY
Figure BPA00001178919600634
入门克隆进行LR重组反应以生成前体质粒PHP28700,GATEWAY
Figure BPA00001178919600635
入门克隆包含拟南芥lnt2-2(如实施例5所述)、入门克隆PHP23112(SEQ ID NO:14)、入门克隆PHP20234(SEQ ID NO:9;图9)和目的载体PHP22655(SEQID NO:10)。PHP28699和PHP28700各包含以下表达盒:
1.表达PAT抗除草剂性基因的泛素启动子::moPAT::PinII终止子盒,该基因用于转化过程期间的选择。
2.表达DS-RED颜色标记的LTP2启动子::DS-RED2::PinII终止子盒,该标记用于分选种子。
此外,PHP28699包含泛素启动子::lnt2-2::PinII终止子盒,该表达盒过表达拟南芥LNT2-2,而PHP28700包含泛素启动子::lnt2-3::PinII终止子盒,该表达盒过表达拟南芥LNT2-3。
                     实施例14B
使用农杆菌用验证过的候选拟南芥基因(At5g50930)转化玉米品系
使用如实施例12和13所述的农杆菌介导转化,可将载体PHP28699(如实施例14A所述)中存在的LNT2-2表达盒导入玉米自交系或来源于优良玉米自交系的可转化玉米品系。也能使用相同程序将PHP28700中存在的LNT2-3表达盒导入玉米自交系或来源于优良玉米自交系的可转化玉米品系。
能把表达载体PHP28699通过电穿孔导入包含载体PHP10523(SEQID NO:7,图7)的LBA4404农杆菌菌株以制备共整合载体PHP28841,该载体包含lnt2-2表达盒。共整合载体通过每个载体上包含的COS重组位点重组两个质粒PHP28699和PHP10523形成,并且除了农杆菌菌株以及农杆菌介导转化需要的其它基因(TET、TET、TRFA、ORI终止子、CTL、ORI V、VIR C1、VIR C2、VIR G、VIR B)之外,还包含上述相同的三个表达盒(实施例14A)。同样地,能把表达载体PHP28700通过电穿孔导入包含载体PHP10523(SEQ ID NO:7,图7)的LBA4404农杆菌菌株以制备共整合载体PHP28840,该载体包含lnt2-3表达盒。可使用(但不限于)实施例12中的电穿孔规程。
                     实施例15
制备目的载体PHP23236用于转化到Gaspe Flint来源的玉米品系中
目的载体PHP23236(图6,SEQ ID NO:6)是通过用载体PHP23235(图8;SEQ ID NO:8)转化包含PHP10523(图7;SEQ ID NO:7)的农杆菌菌株LBA4404并分离所得的共整合产物而获得。
目的载体PHP23236可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化Gaspe Flint衍生的玉米品系的玉米表达载体。
                     实施例16
   制备表达构建体用于转化到Gaspe Flint来源的玉米品系中
使用INVITROGENTM GATEWAY
Figure BPA00001178919600641
LR重组技术,可使用如实施例5所述的相同入门克隆将表达盒定向克隆到GATEWAY
Figure BPA00001178919600642
目的载体PHP23236(SEQ ID NO:6;图6)中以制备相应的表达载体。表达载体PHP29694和PHP29689分别包含lnt2-2(SEQ ID NO:29)和lnt2-3(SEQID NO:31)。每个表达载体包含在UBI启动子控制下的受关注cDNA,并且是T-DNA二元载体,用于通过如本文所述实施例所述(但不限于)的农杆菌介导转化到玉米中。
                    实施例17A
       用验证过的候选拟南芥基因(At5g50930)转化
              Gaspe Flint来源的玉米品系
为了检查所得表型,可将玉米植株转化以过表达拟南芥属(Arabidopsis)At5g50930基因(和来自其它物种的对应同源物)。可使用如实施例16所述的表达构建体。
受体植株
受体植株细胞可来自具有短的生活周期(“快速循环”)、大小减少以及转化潜能高的单一玉米品系。对玉米典型的这些植株细胞是来自可公开获得的Gaspe Flint(GF)品系变种的植株细胞。一种可能的候选植株品系变种是GFxQTM(Quick Turnaround Maize(快速周转玉米),选择用于在温室条件下生长的Gaspe Flint的可公开获得形式)的F1杂交种,其在Tomes等人(美国专利申请10/367,416,提交于2003年2月13日;美国专利公开公布2003/0221212 A1,公布于2003年11月27日)中有所公开。从该品系获得的转基因植株具有如此小的大小使得它们可在4英寸的盆中生长(是正常大小的玉米植株所需空间的1/4)并且它们在少于2.5个月时间内成熟。(传统上,一旦转基因植株适应温室后需要3.5个月来获得转基因T0种子。)另一合适的品系包括但不限于GS3(高度可转化的品系)X Gaspe Flint的双单倍体品系。还有另一种合适的品系是携带引起较早开花、高度减小或这两者的转基因的可转化的优良玉米自交系。
转化规程
任何合适的方法可用于将转基因引入玉米细胞中,包括但不限于利用基于农杆菌载体的接种类型的步骤(参见例如实施例12和13)。转化可在受体(靶标)植株的未成熟胚上进行。
精确的生长和植株跟踪
将由转化的玉米胚产生的转基因(T0)植株的事件群体在受控的温室环境中栽培,该温室使用改良的随机分块(block)设计以降低或消除环境误差。随机分块设计是这样一种植株布局,在该布局中,实验植株被分成组(如,每组30株植株),称为块,而每株植株随块被随机分配一个位置。
对于一组30株植株,24株转化的实验植株和6株对照植株(具有设定好的表型的植株)(总起来说称为“重复组”)被置于盆中,这些盆在位于温室内的桌子上布置成阵列(也叫做重复组或块)。每株植株(对照植株或实验植株)随块被随机分配一个位置,所述的块映射一个唯一的、温室物理位置以及映射该重复组。在单次实验中多个30株植株的重复组中的每一个可栽培在相同的温室中。应该确定重复组的布局(布置方式)以使对空间的要求最小以及温室内的环境影响最小。这样一种布局可称为压缩的温室布局。
对于加入特定的对照组的一种替代方法是鉴定不表达所关注基因的那些转基因植株。可将诸如RT-PCR之类的多种技术应用于定量评估引入基因的表达水平。可将不表达转基因的T0植株与表达转基因的那些植株进行比较。
在整个评价过程中鉴定和跟踪事件群体中的每株植株,并且从那些植株收集的数据自动与那些植株相关联,使得所搜集的数据可与由该植株携带的转基因关联。例如,每个植株容器具有机器可读的标签(例如通用货单代码(UPC)条形码),该标签包含了关于植物身份的信息,身份信息继而又与温室位置相关,使得从植物获得的数据可自动与该植物相关联。
作为另外一种选择,可使用任何有效的、机器可读的植物识别系统,例如二维矩阵代码或甚至是射频识别标签(RFID),其中数据被接收并由射频接收器/处理器进行翻译。参见提交于2002年12月19日的美国专利申请10/324,288(美国专利公开公布2004/0122592 A1,公布于2004年6月24日),该文献以引用方式并入本文。
利用三维成像进行表型分析
对T0事件群体中的每株温室植株(包括任何对照植株)分析所关注的农学特性,并且以这样一种方式记录或存储每株植株的农学数据,该方式使得数据与该植株的辨识数据(见上面)相关联。可利用与上述类似的实验设计,可在T1代中完成对表型(基因效应)的确认。
在植物的整个温室生活周期中,利用定量的非破坏性成像技术在表型水平上来分析T0植株以评估所关注的性状。在一个实施方案中,将数字成像分析仪用于整株植物的自动多维分析。成像可在温室内进行。将两个摄像系统(位于顶部和侧面)和用于旋转植物的装置用于从所有侧面观察植物和成像。从每株植物的顶部、前面和侧面采集图像。所有的三个图像一起提供了足够的信息用于评价例如每株植物的生物量、大小和形态。
由于植物在第一片叶片从土壤显现出来时到植物处于它们发育的末期时大小的改变,在一个实施方案中是从顶部以较高的放大倍率记录植物发育的早期。这摄像可通过利用完全由成像软件控制的自动变焦镜头系统来完成。
在单次成像分析操纵中,进行如下事件:(1)将植株传送至分析仪区域内,旋转360度以便其机器可读标签可被读取,并且让其保持静止直至其叶片停止移动;(2)获取侧面图像并将其输入数据库;(3)将植株旋转90度并再次让其保持静止直至其叶片停止移动,以及(4)将该植株传送出分析仪。
每24小时的周期让植物至少6个小时处于黑暗以便具有正常的白天/黑夜周期。
成像仪器
可使用任何合适的成像仪器,包括但不限于可从LemnaTec GmbH(Wurselen,Germany)商购获得的光谱数字成像仪。获取图像并用具有1/2″IT Progressive Scan IEE CCD成像设备的LemnaTec ScanalyzerHTS LT-0001-2进行分析。该成像照相机可配备有自动变焦、自动调节光圈和自动聚焦。可利用LemnaTec软件设定所有的照相机设置。在一个实施方案中,对于主要组成成像分析仪的仪器差异小于约5%,对于次要组成成像分析仪的仪器差异小于约10%。
软件
成像分析系统包括用于颜色和构造分析的LemnaTec HTS Bonit软件程序和用于存储约500,000次分析的数据(包括分析数据)的服务器数据库。原始图像和分析过的图像储存在一起以允许用户根据需要进行再次分析。可将数据库连接至成像硬件用于自动的数据收集和存储。多种可商购获得的软件系统(例如Matlab,其它软件)可用于定量解释图像数据,并且可将这些软件体系中的任何一种应用于所述图像数据集。
传送系统
具有植物旋转装置的传送系统可用于将植物传送至成像区域并在成像过程中选择植物。例如,将最多4株植物(每株最高高度为1.5m)装上小车,该小车在循环的传送系统上行进并通过成像测量区域。在这种情况下,该单位(成像分析仪和传送环线)的总占有面积为约5m×5m。
可扩大传送系统以同时容纳更多植物。将植物沿传送环线传送至成像区域并对每株植物分析最多50秒。获取植物的三个视图。传送系统以及成像设备应该能够用于温室环境条件。
照明
任何合适的照明模式可用于图像采集。例如,可在暗背景上使用顶部照明。作为另外一种选择,可采用使用白色背景的顶部照明和背部照明的组合。应该将被照亮的区域围起来以确保恒定的照明条件。遮蔽物应该长于测量区域使得能保持恒定的光条件而不需要打开和关闭门。作为另一种选择,可以变化照明以引起转基因(如,绿色荧光蛋白(GFP)、红色荧光蛋白(RFP))的激发或者引起内源性(如叶绿素)荧光基团的激发。
基于三维成像的生物量估计
为了更好地估计生物量,应该从至少三个轴(在一个实施方案中是顶部视图和两个侧面(侧面1和侧面2)视图)获取植物图像。然后分析这些图像以将植物从背景(盆和花粉控制袋(如果适用的话))分离。可通过如下计算评价植物的体积:
Figure BPA00001178919600681
在上面的等式中,体积和面积的单位是“任意单位”。在该体系中,任意单位完全足以检测基因对植物大小和生长影响,因为所需的是检测与实验平均值或对照平均值的差值(正-较大和负-较小两者)。大小(如面积)的任意单位可通过将物理参照加入到成像过程而轻易地转化成物理量度。例如,可在顶部成像过程和侧面成像过程两者中均包括已知面积的物理参照。基于这些物理参照的面积,可测定转换因子以允许从像素转换为面积单位,例如平方厘米(cm2)。物理参照可以是或可以不是独立的样本。例如,具有已知直径和高度的盆足可用作物理参照。
颜色分类
成像技术还可以用于确定植物颜色以及用于将植物颜色归为各种衍生类型。将图像颜色归属于颜色类型是LemnaTec软件的固有特色。使用其他图像分析软件系统,可通过多种计算方法确定颜色分类。
对于植物大小和生长参数的测定,一种有用的分类方案是定义一种单一颜色方案,包括绿色的两种或三种色调(在一个实施方案中色调是50-66,参见图12),此外,还有关于缺绿病、坏死和漂白(在这些条件出现时)的颜色类型。还使用了背景颜色类型,其包括图像中的非植物颜色(例如盆和土壤颜色),并将这些像素特别地从测定大小中排除。在受控的恒定照明下分析植物,使得可以定量一株植物内随时间推移的任何改变,或者植物之间或植物不同分枝之间的任何改变(如季节差异)。
除了其在测定植物的大小、生长中的有效性外,颜色分类还可用于评估其他产量构成性状。对于这些其他产量构成性状,可使用另外的颜色分离方案。例如,称为“保绿度(staygreen)”的性状(已经将其与产量的提高相关联)可通过颜色分类来评估,该颜色分类将绿色色调与黄色和棕色色调(其指示老化的组织)相分离。通过将这种颜色分类应用于在T0或T1植物生活周期末获取的图像,可鉴定绿色的量相对于黄色和棕色(例如,可表示为绿色/黄色比率)增加的植物。这种绿色/黄色比率具有显著差异的植物可被鉴定为携带影响这种重要农学性状的转基因。
熟练的植物学家将认识到可以指示植物健康或应激反应的其他植物颜色(花青素)的出现,以及认识到其他颜色分类方案可以提供对基因在与这些响应相关的性状方面的作用的进一步度量。
植物结构分析
改变植物结构参数的转基因也可以用本发明鉴定,包括诸如最大高度和宽度、节间距离、叶与茎之间的角度、在节处开始的叶片数以及叶片长度。LemnaTec系统软件可如下用于确定植物构造。在第一成像步骤中将植物简化至其主要的几何构造,并且随后基于该图像可进行不同构造参数的参数化鉴定。或者是单独地或者是组合地修改任何这些构造参数的转基因可通过应用此前所述的统计方法来鉴定。
花粉脱落日期
花粉脱落日期是转基因植物中要分析的一个重要参数,并且可以通过活性雄花第一次出现在植物上来确定。为了找到雄花目标,通过颜色对茎的上端进行分类以检测黄色或紫色花药。然后将这种颜色分类分析用于定义活性花,活性花继而可用于计算花粉脱落日期。
作为另外一种选择,花粉脱落日期和其他易于在视觉上检测到的植物属性(如授粉日期、第一穗丝日期)可以由负责进行植物看护的工作任人员来记录。为了使数据完整性和过程效率最大化,通过利用相同的由LemnaTec光谱数字分析设备利用的条形码来跟踪该数据。可将具有条形码阅读器的电脑、掌上设备或笔记本电脑用于使记录观察时间、植物标识符的数据捕捉变得容易,以及使捕捉数据的操纵者变得舒适。
植物的取向
以接近商业栽培的密度种植的成熟玉米植物通常具有平面的结构。也就是说,植物具有一可清晰分辨的宽的侧面和窄的侧面。对来自植物宽侧的图像进行测定。对于每株植物,给其赋予一个明确界定的基本取向以获得宽侧图像与窄侧(edgewise)图像之间的最大差别。将顶部图像用于确定植物的主轴,而将额外的旋转装置用于在开始主图像采集前将植物转至合适的取向。
                      实施例17B
        用玉米同源物转化Gaspe Flint来源的玉米品系
使用INVITROGENTM GATEWAY
Figure BPA00001178919600701
LR重组技术,可制备入门克隆用于玉米同源物(SEQ ID NO:17)(参见关于入门克隆制备的实施例5),并且能够将入门克隆定向克隆到GATEWAY
Figure BPA00001178919600702
目的载体PHP23236(SEQID NO:6;图6)中以制备表达载体PHP30115。该表达载体目前包含在UBI启动子控制下的受关注cDNA,并且是T-DNA二元载体,用于通过如本文所述实施例所述(但不限于)的农杆菌介导转化到玉米中。
                       实施例18
    在最佳和减少氮条件下筛选Gaste Flint衍生的玉米品系
转基因植物将含有两个或三个剂量的Gaspe Flint-3与一个剂量的GS3(GS3/(Gaspe-3)2X或GS3/(Gaspe-3)3X),并且对于显性转基因会以1∶1分离。将包含PHP29689(表达盒=lnt2-3)的转基因植物种植在包含100%Turface的200个标准盆中。用1.0mM KNO3生长培养基(参见图13)浇洒植物直到分离确定。在8DAP(种植后天数),将幼苗随机均匀置于相应的处理组中。进行两种处理:最佳氮(6.5mMolKNO3)和减少氮(1.0mMol KNO3)处理,每日两次直至13DAP。在13和24DAP之间的每天灌溉时间是在9:00AM、12:00PM、和3:00PM用营养物质浇灌3分钟(156mL)。在25DAP,在5:00AM增加第四次浇灌,在31DAP,在5:00PM增加第五次浇灌。每个表每周监控pH至少三次,并且记录哪天出苗以及哪天脱落。每周对每个植株拍照三次(周一、周三、和周五)以评估表面积积聚、比生长速率(sgr)、和颜色变化。在8DAP对植物取样进行ELISA MOPAT,并且在35DAP进行表达和代谢表达谱分析。从在37DAP收获的组织中获取鲜重数据,并且然后将收获的组织烘干(70℃,120小时)以获取干重数据。
评估PHP29689的四个事件(图16)。计算更大的Student t检验的概率用于比较每个转基因平均值与合适的无效转基因平均值(分离无效转基因或构建体无效转基因)。使用最小值(P<t)0.1作为临界值。表5示出每个事件与分离无效转基因相比显著增加的变量。
                       表5
                PHP29689事件综述
  事件   减少氮   最佳氮
EA2391.314.1.5   %光照绿色末端指数%光照绿色收获天数总面积收获天数脱落天数最大总面积比生长速率鲜苗比率   %光照绿色末端指数穗直径穗干重穗鲜重
EA2391.314.1.6   总面积末端指数总面积收获天数最大总面积苗干重苗鲜重   %光照绿色末端指数%光照绿色收获天数总面积末端指数总面积收获天数最大总面积
  苗+穗干重苗+穗鲜重茎+穗直径   比生长速率苗干重苗鲜重苗+穗干重苗+穗鲜重
EA2391.314.1.8   脱落天数比生长速率苗鲜重苗+穗鲜重   %光照绿色末端指数%光照绿色收获天数脱落天数比生长速率
EA2391.314.1.9   %光照绿色末端指数%光照绿色收获天数总面积收获天数最大总面积比生长速率
当认为所有事件是相对于无效构建体(图17)时,该构建体与无效构建体相比多个变量平均显示出显著的增加(数据概述于表6中)。
               表6
       PHP29689构建体概述
  减少氮   最佳氮
  %光照绿色收获天数总面积收获天数脱落天数最大总面积比生长速率苗鲜重   %光照绿色末端指数%光照绿色收获天数总面积末端指数总面积收获天数脱落天数最大总面积比生长速率苗干重苗鲜重苗+穗干重苗+穗鲜重
                    实施例19
       具有拟南芥前导基因的玉米品系的产量分析
自交或顶交杂交体的转基因植物可通过更严谨的大田试验来研究在氮限制条件下和无氮限制条件下的产量增加和/或稳定性。例如,可进行产量分析以测定包含验证过的拟南芥lnt2-2或lnt2-3基因的植物在与对照植物(或参比植物)进行比较时是否具有产量改善(在氮限制条件下和无氮限制条件下),所述对照植物是构建体转化无效植物或野生型植物。氮限制条件通过以前的能育性实践组合提供,其中施加含量减少的氮一年或多年,玉米或替代作物在该条件下生长并且每季移除种子作物。在此类条件下,基于由Federal and State Extension服务对特定生长区域确定的土壤测试标准,低氮(LN)环境指氮量少于在早春或夏季施加的标准氮肥的量,而标准氮(NN)环境指加入正常产量所需的充足的氮。
包含验证过的拟南芥lnt2-2或lnt2-3基因的玉米杂交体测交以及它们的对照植物在Woodland,CA和Johnston,IA的LN和NN环境下生长,并且评估产量。在LN环境下观察到的产量减少与在NN环境下获得的产量比较。包含验证过的拟南芥lnt2-2或lnt2-3基因的玉米杂交体测交的产量与构建体无效转化植物的产量比较。这些产量试验的结果在图18-21中显示。
包含PHP28840(表达盒=lnt2-3)的植物的个体事件显示在LN条件下显著增加的产量(2007年在Woodland的事件E6919.105.1.11和E6919.105.1.21),而2007年在Johnston测试的E6919.105.1.21事件具有数字上更高的产量。2008年相似的测试揭示事件E6919.105.1.21在Woodland和Johnston以及事件E6919.105.1.2和E6919.105.1.24在Woodland和Johnston分别具有显著改善的产量。包含PHP28840的植物在低氮条件下的结果在图18中显示。
在标准氮(NN)处理条件下,2007年在Woodland和Johnston的事件E6919.105.1.11与无构建体植物的产量相似(无统计学意义上的差异),说明在更高的氮含量条件下,该事件保留了高产量的潜力。2008年在Woodland获得了相似的结果。与之相反,2008年在Johnston的事件E3919.105.1.11和2007年与2008年在Johnston的事件E6919.105.1.21以及E6919.105.1.24具有显著较低的产量。包含PHP28840的植物在标准氮条件下的结果在图20中显示。
包含PHP28841(表达盒=lnt2-2)的植物的个体事件(2007年,Woodland,在LN条件下的事件E6919.106.1.17和E6919.106.1.3)显示具有统计意义上的显著性的产量增加。然而,2007年,Johnston,在LN条件下的事件E6919.106.1.3显示显著较低的产量,并且未收集事件E6919.106.1.17的产量。图19示出包含PHP28841的植物在低氮(LN)条件下的结果。
在标准氮(NN)处理条件下,与构建体无效转化植物相比,2007年在Woodland和Johnston的E6919.106.1.17都具有数字上更高的产量,然而事件E6919.106.1.3在2007年、在Woodland显示显著增加的产量,而在2007年、在Johnston显示数字上增加的产量。事件E6919.106.1.22和E619.106.1.8在Woodland显示显著减少的产量。包含PHP28841的植物在标准氮(NN)条件下的结果在图21中显示。
                    实施例20
                 NUE玉米幼苗分析
使用种子颜色标记将转基因事件的种子(具有构建体PHP28841或PHP28840)分成转基因(杂合的)种子和无效转基因种子。进行两组不同的随机分配处理,使用所有处理的9个平行测定,使每个随机分块(block)有排列成6排9列的54个盆。在一个实例中,混合相同构建体的5个事件的4个无效转基因种子,将其用作批对照用于比较该分块的5个阳性事件,在每个分块中制备6个处理的组合。在第二个实例中,将3个转基因阳性处理以及它们对应的无效转基因随机分配到该分块的54个盆中,制备每个分块的6个处理组合(3个阳性处理以及对应的无效转基因),包含所有处理组合的9个平行测定。在第一个实例中,转基因参数与批量无效构建体比较;在第二个实例中,转基因参数与对应的无效转基因事件比较。在其中每个构建体有10、15、或20个事件的实例中,将事件分成5个事件一组,并且计算54个盆的每个分块的变量。然而,在进行转基因方法比较前收集分块的分块无效转基因方法。
就每个处理而言,将两个种子种植在4英寸的方盆中,盆中包含在8英寸交错中心上的Turface。盆每天用包含以下营养物质的溶液浇灌四次:1mM CaCl2,2mM MgSO4,0.5mM KH2PO4,83ppm Sprint330,3mMKCl,1mM KNO3,1μM ZnSO4,1μM MnCl2,3μM H3BO4,0.1μMCuSO4,和0.1μM NaMoO4
植物出苗后,将其减少到每盆一个种子。通常在周一种植处理种子,并且植物在周五后出苗。然后在种植后18天收获植物。在收获时从盆中移除植物,并且将Turface从根部洗脱。使根与苗分开,把根置于纸袋中并且在70℃干燥70小时。将干燥后的植物部分(根和苗)称重并置于50mL的圆锥管中,管中有大约20 5/32英寸的钢球,在涂料振荡器中进行振荡研磨。将大约30mg研磨组织(记录重量用于后续的调节)在2mL 20%H2O2和6M H2SO4中水解30分钟,水解温度为170℃。在冷却后,加水至20ml,充分混合该溶液。移除50μl的等分试样并加到950μl 1M Na2CO3中。通过将100μL该溶液置于96孔板的每个孔中,然后加入50μL OPA溶液,使用该溶液中的氨评估减少的总植物氮。测定荧光强度,激发(excitation)=360nM/发射(emission)=530nM,并且与溶解在相似溶液并用OPA溶液处理过的NH4Cl标准品进行比较。
以下溶液用于前述实验:
OPA溶液-5μl巯基乙醇+1ml OPA储备液(每天新鲜制备)
OPA储备液-50mg邻苯二醛(OPA-Sigma#P0657)溶解于1.5mL甲醇+4.4mL 1MBorate缓冲液pH9.5(3.09g H3BO4+1g NaOH,溶于50mL水中)+0.55mL 20%SDS(每周新鲜制备)
测量以下参数,并且使用Student t检验比较参数平均值与无效参数平均值:SPAD(绿度)、茎直径、根干重、苗干重、总干重、和植物氮浓度。在每个随机分块中使用最近邻计算以及使用完全随机设计(CRD)模型的方差分析(Analysis of Variance,ANOVA)计算差异。使用F统计,通过将总随机分块处理平均面积除以总随机分块误差平均面积计算每个随机分块的总处理效应。计算更大的Student t检验的概率用于比较每个转基因平均值与合适的无效转基因(或者批构建体或单个事件的无效转基因平均值)平均值。使用最小值(P<t)0.1作为临界值。
图22示出PHP28840(表达盒=lnt2-3)和PHP28841(表达盒=lnt2-2)构建体的NUE幼苗测定结果。包含UBI:lnt2-3表达盒的事件E6919.105.1.21显示以下变量具有统计意义上的显著性的增加:苗干重、氮浓度、和总氮。具有UBI:lnt2-3表达盒的另一个事件和具有UBI:lnt2-2表达盒的六个事件中的四个表现出植物氮浓度具有统计意义上的显著性的增加。此外,包含UBI:lnt2-2表达盒的六个事件中的两个显示具有统计意义上的显著性的总氮增加。
                      实施例21
      转化和评估具有验证过的前导基因的大豆同源物的大豆
基于同源性搜索,能鉴定验证过的拟南芥前导基因的一个或若干个候选大豆同源物,并且还能评估它们增加大豆氮限制条件耐受性的能力。载体构建、植物转化和表型分析将类似于上文实施例所述的规程。
                        实施例22
      转化和评估具有验证过的前导基因的玉米同源物的玉米
基于同源性搜索,能鉴定验证过的拟南芥前导基因的一个或若干个候选玉米同源物(例如SEQ ID NO:18和20),并且还能评估它们增加玉米氮限制条件耐受性的能力。载体构建、植物转化和表型分析可类似于上文实施例所述的规程。
                        实施例23
       用验证过的前导基因的玉米和大豆同源物转化拟南芥
可将验证过的拟南芥前导基因的大豆和玉米同源物在35S启动子的控制下转化到拟南芥中,并且当在低氮培养基中生长时分析其叶片面积和绿色区积聚。可如本文实施例所述进行载体构建和植物转化。检测分析的条件、数据采集和数据分析可类似于上文实施例所述的规程。
序列表
<110>E.I.du Pont de Nemours and Company and
     Pioneer Hi-Bred International
<120>在氮限制条件下具有改变的农学特性的植物
     以及涉及编码LNT2多肽及其同源物的基因的相关构建体和方法
<130>BB1577
<160>36
<170>PatentIn version 3.4
<210>1
<211>18491
<212>DNA
<213>人工序列
<220>
<223>pHSbarEND2s激活标签载体
<400>1
catgaatcaa acaaacatac acagcgactt attcacacga gctcaaatta caacggtata    60
tatcctgccg tcgacaacca tggtctagac aggatccccg ggtaccgagc tcgaatttgc   120
aggtcgactg cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa   180
gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg   240
ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat   300
ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa   360
tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat tgccctttgg   420
tcttctgaga ctgttgcgtc atcccttacg tcagtggaga tatcacatca atccacttgc   480
tttgaagacg tggttggaac gtcttctttt tccacgatgc tcctcgtggg tgggggtcca   540
tctttgggac cactgtcggc agaggcatct tgaacgatag cctttccttt atcgcaatga   600
tggcatttgt aggtgccacc ttccttttct actgtccttt tgatgaagtg acagatagct   660
gggcaatgga atccgaggag gtttcccgat attacccttt gttgaaaagt ctcagttaac   720
ccgcgatcct gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga   780
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt   840
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca   900
tttgtaggtg ccaccttcct tttctactgt ccttttgatg aagtgacaga tagctgggca   960
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa ttgccctttg  1020
gtcttctgag actgttgcgt catcccttac gtcagtggag atatcacatc aatccacttg    1080
ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg gtgggggtcc    1140
atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt tatcgcaatg    1200
atggcatttg taggtgccac cttccttttc tactgtcctt ttgatgaagt gacagatagc    1260
tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag tctcagttaa    1320
cccgcaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc    1380
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc    1440
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggatc gatccgtcga    1500
tcgaccaaag cggccatcgt gcctccccac tcctgcagtt cgggggcatg gatgcgcgga    1560
tagccgctgc tggtttcctg gatgccgacg gatttgcact gccggtagaa ctccgcgagg    1620
tcgtccagcc tcaggcagca gctgaaccaa ctcgcgaggg gatcgagccc ctgctgagcc    1680
tcgacatgtt gtcgcaaaat tcgccctgga cccgcccaac gatttgtcgt cactgtcaag    1740
gtttgacctg cacttcattt ggggcccaca tacaccaaaa aaatgctgca taattctcgg    1800
ggcagcaagt cggttacccg gccgccgtgc tggaccgggt tgaatggtgc ccgtaacttt    1860
cggtagagcg gacggccaat actcaacttc aaggaatctc acccatgcgc gccggcgggg    1920
aaccggagtt cccttcagtg aacgttatta gttcgccgct cggtgtgtcg tagatactag    1980
cccctggggc cttttgaaat ttgaataaga tttatgtaat cagtctttta ggtttgaccg    2040
gttctgccgc tttttttaaa attggatttg taataataaa acgcaattgt ttgttattgt    2100
ggcgctctat catagatgtc gctataaacc tattcagcac aatatattgt tttcatttta    2160
atattgtaca tataagtagt agggtacaat cagtaaattg aacggagaat attattcata    2220
aaaatacgat agtaacgggt gatatattcat tagaatgaa ccgaaaccgg cggtaaggat    2280
ctgagctaca catgctcagg ttttttacaa cgtgcacaac agaattgaaa gcaaatatca    2340
tgcgatcata ggcgtctcgc atatctcatt aaagcagggg gtgggcgaag aactccagca    2400
tgagatcccc gcgctggagg atcatccagc cggcgtcccg gaaaacgatt ccgaagccca    2460
acctttcata gaaggcggcg gtggaatcga aatctcgtga tggcaggttg ggcgtcgctt    2520
ggtcggtcat ttcgaacccc agagtcccgc tcagaagaac tcgtcaagaa ggcgatagaa    2580
ggcgatgcgc tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca    2640
ttcgccgcca agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc    2700
cgccacaccc agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat    2760
attcggcaag caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgccccc    2820
caattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact    2880
taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac    2940
cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt    3000
tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg    3060
ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg    3120
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg    3180
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat    3240
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac    3300
ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat    3360
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag    3420
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc    3480
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc    3540
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc    3600
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc    3660
ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt    3720
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt    3780
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat    3840
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct    3900
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat    3960
gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc    4020
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg    4080
ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc    4140
tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta    4200
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc    4260
ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga    4320
tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat    4380
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat    4440
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa    4500
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa    4560
ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt    4620
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt    4680
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata    4740
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt    4800
ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag aaagcgccac    4860
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga    4920
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg    4980
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa    5040
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat    5100
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc    5160
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga    5220
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg    5280
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta    5340
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg    5400
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct    5460
ttctaggggg ggggtaccga tctgagatcg gtaacgaaaa cgaacgggta gggatgaaaa    5520
cggtcggtaa cggtcggtaa aatacctcta ccgttttcat tttcatattt aacttgcggg    5580
acggaaacga aaacgggata taccggtaac gaaaacgaac gggataaata cggtaatcga    5640
aaaccgatac gatccggtcg ggttaaagtc gaaatcggac gggaaccggt atttttgttc    5700
ggtaaaatca cacatgaaaa catatattca aaacttaaaa acaaatataa aaaattgtaa    5760
acacaagtct taatgatcac tagtggcgcg cctaggagat ctcgagtagg gataacaggg    5820
taatacatag ataaaatcca tataaatctg gagcacacat agtttaatgt agcacataag    5880
tgataagtct tgggctcttg gctaacataa gaagccatat aagtctacta gcacacatga    5940
cacaatataa agtttaaaac acatattcat aatcacttgc tcacatctgg atcacttagc    6000
atgctacagc tagtgcaata ttagacactt tccaatattt ctcaaacttt tcactcattg    6060
caacggccat tctcctaatg acaaattttt catgaacaca ccattggtca atcaaatcct    6120
ttatctcaca gaaacctttg taaaataaat ttgcagtgga atattgagta ccagatagga    6180
gttcagtgag atcaaaaaac ttcttcaaac acttaaaaag agttaatgcc atcttccact    6240
cctcggcttt aggacaaatt gcatcgtacc tacaataatt gacatttgat taattgagaa    6300
tttataatga tgacatgtac aacaattgag acaaacatac ctgcgaggat cacttgtttt    6360
aagccgtgtt agtgcaggct tataatataa ggcatccctc aacatcaaat aggttgaatt    6420
ccatctagtt gagacatcat atgagatccc tttagattta tccaagtcac attcactagc    6480
acacttcatt agttcttccc actgcaaagg agaagatttt acagcaagaa caatcgcttt    6540
gattttctca attgttcctg caattacagc caagccatcc tttgcaacca agttcagtat    6600
gtgacaagca cacctcacat gaaagaaagc accatcacaa actagatttg aatcagtgtc    6660
ctgcaaatcc tcaattatat cgtgcacagc tacttcattt gcactagcat tatccaaaga    6720
caaggcaaac aattttttct caatgttcca cttaaccatg attgcagtga aggtttgtga    6780
taacctttgg ccagtgtggc gcccttcaac atgaaaaaag ccaacaattc ttttttggag    6840
acaccaatca tcatcaatcc aatggatggt gacacacatg tatgacttat tttgacaaga    6900
tgtccacata tccatagttg tactgaagcg agactgaaca tcttttagtt ttccatacaa    6960
cttttctttt tcttccaaat acaaatccat gatatatttt ctagcagtga cacgggactt    7020
tattggaaag tgagggcgca gagacttaac aaactcaaca aagtactcat gttctacaat    7080
attgaaagga tattcatgca tgattattgc caaatgaagc ttctttaggc taaccacttc    7140
atcgtactta taaggctcaa tgagatttat gtctttgcca tgatcctttt cactttttag    7200
acacaactga cctttaacta aactatgtga tgttctcaag tgatttcgaa atccgcttgt    7260
tccatgatga ccctcagccc tatacttagc cttgcaatta ggaaagttgc aatgtcccca    7320
tacctgaacg tatttctttc catcgacctc cacttcaatt tccttcttgg tgaaatgctg    7380
ccatacatcc gatgtgcact tctttgccct cttctgtggt gcttcttctt cgggttcagg    7440
ttgtggctgt ggttgtggtt ctggttgtgg ttgtggttgt ggttgtggtt catgaacaat    7500
agccatatca tcttgactcg gatctgtagc tgtaccattt gcattactac tgcttacact    7560
ctgaataaaa tgcctctcgg cctcagctgt tgatgatgat ggtgatgtgc ggccacatcc    7620
atgcccacgc gcacgtgcac gtacattctg aatccgacta gaagaggctt cagcttttct    7680
tttcaaccct gttataaaca gatttttcgt attattctac agtcaatatg atgcttccca    7740
atctacaacc aattagtaat gctaatgcta ttgctactgt ttttctaata tataccttga    7800
gcatatgcag agaatacgga atttgttttg cgagtagaag gcgctcttgt ggtagacatc    7860
aacttggccaatcttatggc tgagcctgag ggaggattat  ttccaaccgg aggcgtcatc    7920
tgaggaatgg agtcgtagcc ggctagccga agtggagagc agagccctgg acagcaggtg    7980
ttcagcaatc agcttggtgc tgtactgctg tgacttgtga gcacctggac ggctggacag    8040
caatcagcag gtgttgcaga gcccctggac agcacacaaa tgacacaaca gcttggtgca    8100
atggtgctga cgtgctgtac tgctaagtgc tgtgagcctg tgagcagccg tggagacagg    8160
gagaccgcgg atggccggat gggcgagcgc cgagcagtgg aggtctggag gaccgctgac    8220
cgcagatggc ggatggcgga tgggcggacc gcggatgggc gagcagtgga gtggaggtct    8280
gggcggatgg gcggaccgcg gcgcggatgg gcgagtcgcg agcagtggag tggagggcgg    8340
accgtggatg gcggcgtctg cgtccggcgt gccgcgtcac ggccgtcacc gcgtgtggtg    8400
cctggtgcag cccagcggcc ggccggctgg gagacaggga gagtcggaga gagcaggcga    8460
gagcgagacg cgtcgccggc gtcggcgtgc ggctggcggc gtccggactc cggcgtgggc    8520
gcgtggcggc gtgtgaatgt gtgatgctgt tactcgtgtg gtgcctggcc gcctgggaga    8580
gaggcagagc agcgttcgct aggtatttct tacatgggct gggcctcagt ggttatggat    8640
gggagttgga gctggccata ttgcagtcat cccgaattag aaaatacggt aacgaaacgg    8700
gatcatcccg attaaaaacg ggatcccggt gaaacggtcg ggaaactagc tctaccgttt    8760
ccgtttccgt ttaccgtttt gtatatcccg tttccgttcc gttttcgttt tttacctcgg    8820
gttcgaaatc gatcgggata aaactaacaa aatcggttat acgataacgg tcggtacggg    8880
attttcccat cctactttca tccctgagat tattgtcgtt tctttcgcag atcggtaccc    8940
cccccctaga gtcgacatcg atctagtaac atagatgacaccgcgcgcga taat ttatcc    9000
tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta    9060
atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta    9120
acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt    9180
aagaaacttt attgccaaat gtttgaacga tctgcttcga cgcactcctt ctttaggtac    9240
ggactagatc tcggtgacgg gcaggaccgg acggggcggt accggcaggc tgaagtccag    9300
ctgccagaaa cccacgtcat gccagttccc gtgcttgaag ccggccgccc gcagcatgcc    9360
gcggggggca tatccgagcg cctcgtgcat gcgcacgctc gggtcgttgg gcagcccgat    9420
gacagcgacc acgctcttga agccctgtgc ctccagggac ttcagcaggt gggtgtagag    9480
cgtggagccc agtcccgtcc gctggtggcg gggggagacg tacacggtcg actcggccgt    9540
ccagtcgtag gcgttgcgtg ccttccaggg gcccgcgtag gcgatgccgg cgacctcgcc    9600
gtccacctcg gcgacgagcc agggatagcg ctcccgcaga cggacgaggt cgtccgtcca    9660
ctcctgcggt tcctgcggct cggtacggaa gttgaccgtg cttgtctcga tgtagtggtt    9720
gacgatggtg cagaccgccg gcatgtccgc ctcggtggca cggcggatgt cggccgggcg   9780
tcgttctggg ctcatggatc tggattgaga gtgaatatga gactctaatt ggataccgag   9840
gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg   9900
accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa   9960
actccagaaa cccgcggctg agtggctcct tcaatcgttg cggttctgtc agttccaaac  10020
gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg  10080
ctcatgatcc ccgggtaccg agctcgaatt gcggctgagt ggctccttca atcgttgcgg  10140
ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg tcataacgtg  10200
actcccttaa ttctccgctc atgatcttga tcccctgcgc catcagatcc ttggcggcaa  10260
gaaagccatc cagtttactt tgcagggctt cccaacctta ccagagggcg ccccagctgg  10320
caattccggt tcgcttgctg tatcgatatg gtggatttat cacaaatggg acccgccgcc  10380
gacagaggtg tgatgttagg ccaggacttt gaaaatttgc gcaactatcg tatagtggcc  10440
gacaaattga cgccgagttg acagactgcc tagcatttga gtgaattatg tgaggtaatg  10500
ggctacactg aattggtagc tcaaactgtc agtatttatg tatatgagtg tatattttcg  10560
cataatctca gaccaatctg aagatgaaat gggtatctgg gaatggcgaa atcaaggcat  10620
cgatcgtgaa gtttctcatc taagccccca tttggacgtg aatgtagaca cgtcgaaata  10680
aagatttccg aattagaata atttgtttat tgctttcgcc tataaatacg acggatcgta  10740
atttgtcgtt ttatcaaaat gtactttcat tttataataa cgctgcggac atctacattt  10800
ttgaattgaa aaaaaattgg taattactct ttctttttct ccatattgac catcatactc  10860
attgctgatc catgtagatt tcccggacat gaagccattt acaattgaat atatcctgcc  10920
gccgctgccg ctttgcaccc ggtggagctt gcatgttggt ttctacgcag aactgagccg  10980
gttaggcaga taatttccat tgagaactga gccatgtgca ccttcccccc aacacggtga  11040
gcgacggggc aacggagtga tccacatggg acttttaaac atcatccgtc ggatggcgtt  11100
gcgagagaag cagtcgatcc gtgagatcag ccgacgcacc gggcaggcgc gcaacacgat  11160
cgcaaagtat ttgaacgcag gtacaatcga gccgacgttc accgtcaccc tggatgctgt  11220
aggcataggc ttggttatgc cggtactgcc gggcctcttg cgggatatcg tccattccga  11280
cagcatcgcc agtcactatg gcgtgctgct agcgctatat gcgttgatgc aatttctatg  11340
cgcacccgtt ctcggagcac tgtccgaccg ctttggccgc cgcccagtcc tgctcgcttc  11400
gctacttgga gccactatcg actacgcgat catggcgacc acacccgtcc tgtggtccaa  11460
cccctccgct gctatagtgc agtcggcttc tgacgttcag tgcagccgtc ttctgaaaac    11520
gacatgtcgc acaagtccta agttacgcga caggctgccg ccctgccctt ttcctggcgt    11580
tttcttgtcg cgtgttttag tcgcataaag tagaatactt gcgactagaa ccggagacat    11640
tacgccatga acaagagcgc cgccgctggc ctgctgggct atgcccgcgt cagcaccgac    11700
gaccaggact tgaccaacca acgggccgaa ctgcacgcgg ccggctgcac caagctgttt    11760
tccgagaaga tcaccggcac caggcgcgac cgcccggagc tggccaggat gcttgaccac    11820
ctacgccctg gcgacgttgt gacagtgacc aggctagacc gcctggcccg cagcacccgc    11880
gacctactgg acattgccga gcgcatccag gaggccggcg cgggcctgcg tagcctggca    11940
gagccgtggg ccgacaccac cacgccggcc ggccgcatgg tgttgaccgt gttcgccggc    12000
attgccgagt tcgagcgttc cctaatcatc gaccgcaccc ggagcgggcg cgaggccgcc    12060
aaggcccgag gcgtgaagtt tggcccccgc cctaccctca ccccggcaca gatcgcgcac    12120
gcccgcgagc tgatcgacca ggaaggccgc accgtgaaag aggcggctgc actgcttggc    12180
gtgcatcgct cgaccctgta ccgcgcactt gagcgcagcg aggaagtgac gcccaccgag    12240
gccaggcggc gcggtgcctt ccgtgaggac gcattgaccg aggccgacgc cctggcggcc    12300
gccgagaatg aacgccaaga ggaacaagca tgaaaccgca ccaggacggc caggacgaac    12360
cgtttttcat taccgaagag atcgaggcgg agatgatcgc ggccgggtac gtgttcgagc    12420
cgcccgcgca cgtctcaacc gtgcggctgc atgaaatcct ggccggtttg tctgatgcca    12480
agctggcggc ctggccggcc agcttggccg ctgaagaaac cgagcgccgc cgtctaaaaa    12540
ggtgatgtgt atttgagtaa aacagcttgc gtcatgcggt cgctgcgtat atgatgcgat    12600
gagtaaataa acaaatacgc aagggaacgc atgaagttat cgctgtactt aaccagaaag    12660
gcgggtcagg caagacgacc atcgcaaccc atctagcccg cgccctgcaa ctcgccgggg    12720
ccgatgttct gttagtcgat tccgatcccc agggcagtgc ccgcgattgg gcggccgtgc    12780
gggaagatca accgctaacc gttgtcggca tcgaccgccc gacgattgac cgcgacgtga    12840
aggccatcgg ccggcgcgac ttcgtagtga tcgacggagc gccccaggcg gcggacttgg    12900
ctgtgtccgc gatcaaggca gccgacttcg tgctgattcc ggtgcagcca agcccttacg    12960
acatatgggc caccgccgac ctggtggagc tggttaagca gcgcattgag gtcacggatg    13020
gaaggctaca agcggccttt gtcgtgtcgc gggcgatcaa aggcacgcgc atcggcggtg    13080
aggttgccga ggcgctggcc gggtacgagc tgcccattct tgagtcccgt atcacgcagc    13140
gcgtgagcta cccaggcact gccgccgccg gcacaaccgt tcttgaatca gaacccgagg    13200
gcgacgctgc ccgcgaggtc caggcgctgg ccgctgaaat taaatcaaaa ctcatttgag  13260
ttaatgaggt aaagagaaaa tgagcaaaag cacaaacacg ctaagtgccg gccgtccgag  13320
cgcacgcagc agcaaggctg caacgttggc cagcctggca gacacgccag ccatgaagcg  13380
ggtcaacttt cagttgccgg cggaggatca caccaagctg aagatgtacg cggtacgcca  13440
aggcaagacc attaccgagc tgctatctga atacatcgcg cagctaccag agtaaatgag  13500
caaatgaata aatgagtaga tgaattttag cggctaaagg aggcggcatg gaaaatcaag  13560
aacaaccagg caccgacgcc gtggaatgcc ccatgtgtgg aggaacgggc ggttggccag  13620
gcgtaagcgg ctgggttgtc tgccggccct gcaatggcac tggaaccccc aagcccgagg  13680
aatcggcgtg agcggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga  13740
tgacctggtg gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga  13800
agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca  13860
accgccggca gccggtgcgc cgtcgat tag gaagccgccc aagggcgacg agcaaccaga 13920
ttttttcgtt ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt  13980
ggccgttttc cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct  14040
tccagacggg cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta  14100
cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg  14160
gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg  14220
ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa  14280
caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt  14340
atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc  14400
ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa  14460
cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt  14520
tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac  14580
gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa  14640
gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg  14700
cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta  14760
atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct  14820
ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc  14880
gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat  14940
aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa  15000
aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc  15060
gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc  15120
cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc  15180
cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg  15240
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt  15300
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc  15360
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc  15420
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg  15480
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg  15540
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc  15600
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag  15660
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca  15720
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca  15780
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg  15840
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag  15900
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt  15960
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca  16020
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg  16080
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt  16140
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc  16200
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg  16260
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg  16320
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta  16380
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg  16440
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg  16500
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc  16560
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc  16620
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc  16680
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag  16740
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat  16800
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg  16860
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt  16920
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag  16980
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg  17040
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt  17100
aaaagtgctc atcattggaa aagacctgca gggggggggg ggaaagccac gttgtgtctc  17160
aaaatctctg atgttacatt gcacaagata aaaatatatc atcatgaaca ataaaactgt  17220
ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg gaaacgtctt  17280
gctcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc  17340
gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc  17400
cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg  17460
tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat tttatccgta  17520
ctcctgatga tgcatggtta ctcaccactg cgatccccgg gaaaacagca ttccaggtat  17580
tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc  17640
ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg  17700
ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc  17760
gtaatggctg gcctgttgaa caagtctgga aagaaatgca taagcttttg ccattctcac  17820
cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga  17880
aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg  17940
ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa  18000
aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt  18060
ttttctaatc agaattggtt aattggttgt aacactggca gagcattacg ctgacttgac  18120
gggacggcgg ctttgttgaa taaatcgaac ttttgctgag ttgaaggatc agatcacgca  18180
tcttcccgac aacgcagacc gttccgtggc aaagcaaaag ttcaaaatca ccaactggtc  18240
cacctacaac aaagctctca tcaaccgtgg ctccctcact ttctggctgg atgatggggc  18300
gattcaggcc tggtatgagt cagcaacacc ttcttcacga ggcagacctc agcgcccccc  18360
cccccctgca ggtcaattcg gtcgatatgg ctattacgaa gaaggctcgt gcgcggagtc  18420
ccgtgaactt tcccacgcaa caagtgaacc gcaccgggtt tgccggaggc catttcgtta  18480
aaatgcgcag c                                                       18491
<210>2
<211>4291
<212>DNA
<213>人工序列
<220>
<223>pDONRZeo构建体
<400>2
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga     60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga    120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca    180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc    240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta    300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc    360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa    420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg    480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa    540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac    600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa    660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa    720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt    780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct    840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca    900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg    960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt   1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta   1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt   1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat   1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca   1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc   1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc    1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc    1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc    1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac    1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc    1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac    1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct  tcatagcatacctctttttg    1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt    2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata    3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt    3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga tcagtcctgc  3120
tcctcggcca cgaagtgcac gcagttgccg gccgggtcgc gcagggcgaa ctcccgcccc  3180
cacggctgct cgccgatctc ggtcatggcc ggcccggagg cgtcccggaa gttcgtggac  3240
acgacctccg accactcggc gtacagctcg tccaggccgc gcacccacac ccaggccagg  3300
gtgttgtccg gcaccacctg gtcctggacc gcgctgatga acagggtcac gtcgtcccgg  3360
accacaccgg cgaagtcgtc ctccacgaag tcccgggaga acccgagccg gtcggtccag  3420
aactcgaccg ctccggcgac gtcgcgcgcg gtgagcaccg gaacggcact ggtcaacttg  3480
gccatggttt agttcctcac cttgtcgtat tatactatgc cgatatacta tgccgatgat  3540
taattgtcaa cacgtgctga tcatgaccaa aatcccttaa cgtgagttac gcgtcgttcc  3600
actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc  3660
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg  3720
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa  3780
atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc  3840
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt  3900
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa  3960
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc  4020
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc  4080
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct  4140
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat  4200
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc  4260
tggccttttg ctggcctttt gctcacatgt t                                 4291
<210>3
<211>4762
<212>DNA
<213>人工序列
<220>
<223>pDONR221
<400>3
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga     60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga    120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca    180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc     240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta     300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc     360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa     420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg     480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa     540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac     600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa     660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa     720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt     780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct     840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca     900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg     960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt    1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta    1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt    1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat    1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca    1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc    1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc    1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc    1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc    1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac    1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc    1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac    1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg    1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt    2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata    3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt    3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga acaataaaac    3120
tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt    3180
cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg    3240
ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc gatgcgccag    3300
agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca    3360
gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc    3420
ctgatgatgc atggttactc accactgcga tccccggaaa aacagcattc caggtattag    3480
aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt    3540
tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc    3600
aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta    3660
atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca ttctcaccgg 3720
attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat 3780
taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca 3840
tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat 3900
atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt 3960
tctaatcaga attggttaat tggttgtaac actggcagag cattacgctg acttgacggg 4020
acggcgcaag ctcatgacca aaatccctta acgtgagtta cgcgtcgttc cactgagcgt 4080
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 4140
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 4200
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 4260
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 4320
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 4380
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 4440
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 4500
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 4560
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 4620
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 4680
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 4740
gctggccttt tgctcacatg tt                                          4762
<210>4
<211>16843
<212>DNA
<213>人工序列
<220>
<223>pBC-yellow构建体
<400>4
ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag    60
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg   120
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac   180
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc   240
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga   300
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat     360
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat     420
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt     480
ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg     540
tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc     600
cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc     660
tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg     720
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg     780
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg     840
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg     900
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg     960
ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa    1020
acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag    1080
acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata    1140
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc    1200
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga    1260
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta    1320
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc    1380
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc    1440
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt    1500
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag    1560
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc    1620
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta    1680
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc    1740
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga    1800
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa    1860
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt    1920
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca    1980
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc    2040
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca    2100
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg    2160
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat    2220
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc    2280
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga    2340
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata    2400
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga    2460
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca    2520
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta    2580
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt    2640
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga    2700
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga    2760
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga    2820
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa    2880
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc    2940
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt    3000
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga    3060
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact    3120
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg    3180
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga    3240
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag    3300
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag    3360
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg    3420
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg    3480
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca    3540
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc    3600
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta    3660
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca    3720
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt    3780
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg    3840
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt    3900
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg    3960
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga    4020
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt    4080
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg    4140
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg    4200
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg    4260
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac    4320
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc    4380
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag    4440
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg    4500
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg    4560
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc    4620
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat    4680
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat    4740
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga    4800
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta    4860
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc    4920
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc    4980
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat    5040
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt    5100
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg    5160
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg    5220
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac    5280
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat    5340
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac    5400
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc    5460
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg    5520
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt    5580
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc    5640
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt    5700
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta    5760
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag    5820
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca    5880
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt    5940
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag    6000
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat    6060
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga    6120
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt    6180
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc    6240
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga    6300
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc    6360
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg    6420
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cctgtatggc    6480
cgcattcgca aaacacacct agactagatt tgttttgcta acccaattga tattaattat    6540
atatgattaa tatttatatg tatatggatt tggttaatga aatgcatctg gttcatcaaa    6600
gaattataaa gacacgtgac attcatttag gataagaaat atggatgatc tctttctctt    6660
ttattcagat aactagtaat tacacataac acacaacttt gatgcccaca ttatagtgat    6720
tagcatgtca ctatgtgtgc atccttttat ttcatacatt aattaagttg gccaatccag    6780
aagatggaca agtctaggtt aaccatgtgg tacctacgcg ttcgaatatc catgggccgc    6840
ttcaggccag ggcgctgggg aaggcgatgg cgtgctcggt cagctgccac ttctggttct    6900
tggcgtcgct ccggtcctcc cgcagcagct tgtgctggat gaagtgccac tcgggcatct    6960
tgctgggcac gctcttggcc ttgtacacgg tgtcgaactg gcaccggtac cggccgccgt    7020
ccttcagcag caggtacatg ctcacgtcgc ccttcaggat gccctgctta ggcacgggca    7080
tgatcttctc gcagctggcc tcccagttgg tggtcatctt cttcatcacg gggccgtcgg    7140
cggggaagtt cacgccgttg aagatgctct tgtggtagat gcagttctcc ttcacgctca    7200
cggtgatgtc cacgttacag atgcacacgg cgccgtcctc gaacaggaag ctccggcccc    7260
aggtgtagcc ggcggggcag ctgttcttga agtagtccac gatgtcctgg gggtactcgg    7320
tgaagatccg gtcgccgtac ttgaagccgg cgctcaggat gtcctcgctg aagggcaggg    7380
ggccgccctc gatcacgcac aggttgatgg tctgcttgcc cttgaagggg tagccgatgc    7440
cctcgccggt gatcacgaac ttgtggccgt tcacgcagcc ctccatgtgg tacttcatgg    7500
tcatctcctc cttcaggccg tgcttgctgt gggccatggt ggcgaccggt gaattcgagc    7560
tcggtacccg gggatcctga gtaaaacaga ggagggtctc actaagttta tagagagact    7620
gagagagata aagggacacg tatgaagcgt ctgttttcgt ggtgtgacgt caaagtcatt    7680
ttgctctcta cgcgtgtctg tgtcggcttg atcttttttt ttgctttttg gaactcatgt    7740
cggtagtata tcttttattt attttttctt tttttccctt ttctttcaaa ctgatgtcgg    7800
tatgatattt attccatcct aaaatgtaac ttactattat tagtagtcgg tccatgtcta    7860
ttggcccatc atgtggtcat tttacgttta cgtcgtgtgg ctgtttatta taacaaacgg    7920
cacatccttc tcattcgaat tgtatttctc cttaatcgtt ctaataggta tgatctttta    7980
ttttatacgt aaaattaaaa ttgaatgatg tcaagaacga aaattaattt gtatttacaa    8040
aggagctaaa tattgtttat tcctctactg gtagaagata aaagaagtag atgaaataat    8100
gatcttacta gagaatattc ctcatttaca ctagtcaaat ggaaatcttg taaactttta    8160
caataattta tcctgaaaat atgaaaaaat agaagaaaat gtttacctcc tctctcctct    8220
taattcacct acgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat    8280
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa    8340
cgacggccag tgaattcgag ctcggtaccc ggggatcctc tagagtcgac ctgcaggcat    8400
gcaagcttgt tgaaacatcc ctgaagtgtc tcattttatt ttatttattc tttgctgata    8460
aaaaaataaa ataaaagaag ctaagcacac ggtcaaccat tgctctactg ctaaaagggt    8520
tatgtgtagt gttttactgc ataaattatg cagcaaacaa gacaactcaa attaaaaaat    8580
ttcctttgct tgtttttttg ttgtctctga cttgactttc ttgtggaagt tggttgtata    8640
aggattggga cacaccattg tccttcttaa tttaatttta tttctttgct gataaaaaaa    8700
aaaaatttca tatagtgtta aataataatt tgttaaataa ccaaaaagtc aaatatgttt    8760
actctcgttt aaataattga gagtcgtcca gcaaggctaa acgattgtat agatttatga    8820
caatatttac ttttttatag ataaatgtta tattataata aatttatata catatattat    8880
atgttattta ttatttatta ttattttaaa tccttcaata ttttatcaaa ccaactcata    8940
attttttttt tatctgtaag aagcaataaa attaaataga cccactttaa ggatgatcca    9000
acctttatac agagtaagag agttcaaata gtaccctttc atatacatat caactaaaat    9060
attagaaata tcatggatca aaccttataa agacattaaa taagtggata agtataatat    9120
ataaatgggt agtatataat atataaatgg atacaaactt ctctctttat aattgttatg    9180
tctccttaac atcctaatat aatacataag tgggtaatat ataatatata aatggagaca    9240
aacttcttcc attataattg ttatgtcttc ttaacactta tgtctcgttc acaatgctaa    9300
agttagaatt gtttagaaag tcttatagta cacatttgtt tttgtactat ttgaagcatt    9360
ccataagccg tcacgattca gatgatttat aataataaga ggaaatttat catagaacaa    9420
taaggtgcat agatagagtg ttaatatatc ataacatcct ttgtttattc atagaagaag    9480
tgagatggag ctcagttatt atactgttac atggtcggat acaatattcc atgctctcca    9540
tgagctctta cacctacatg cattttagtt catacttcat gcacgtggcc atcacagcta    9600
gctgcagcta catatttaca ttttacaaca ccaggagaac tgccctgtta gtgcataaca    9660
atcagaagat ggccgtggct actcgagtta tcgaaccact ttgtacaaga aagctgaacg    9720
agaaacgtaa aatgatataa atatcaatat attaaattag attttgcata aaaaacagac    9780
tacataatac tgtaaaacac aacatatcca gtcactatgg tcgacctgca gactggctgt    9840
gtataaggga gcctgacatt tatattcccc agaacatcag gttaatggcg tttttgatgt    9900
cattttcgcg gtggctgaga tcagccactt cttccccgat aacggagacc ggcacactgg    9960
ccatatcggt ggtcatcatg cgccagcttt catccccgat atgcaccacc gggtaaagtt   10020
cacgggagac tttatctgac agcagacgtg cactggccag ggggatcacc atccgtcgcc   10080
cgggcgtgtc aataatatca ctctgtacat ccacaaacag acgataacgg ctctctcttt   10140
tataggtgta aaccttaaac tgcatttcac cagtccctgt tctcgtcagc aaaagagccg   10200
ttcatttcaa taaaccgggc gacctcagcc atcccttcct gattttccgc tttccagcgt   10260
tcggcacgca gacgacgggc ttcattctgc atggttgtgc ttaccagacc ggagatattg   10320
acatcatata tgccttgagc aactgatagc tgtcgctgtc aactgtcact gtaatacgct   10380
gcttcatagc acacctcttt ttgacatact tcgggtatac atatcagtat atattcttat   10440
accgcaaaaa tcagcgcgca aatacgcata ctgttatctg gcttttagta agccggatcc   10500
tctagattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct   10560
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac   10620
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat   10680
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa   10740
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc  10800
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga  10860
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac  10920
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag  10980
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc  11040
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc  11100
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt  11160
ctccatttta gcttccttag ctcctgaaaa tctcgccgga tcctaactca aaatccacac  11220
attatacgag ccggaagcat aaagtgtaaagcctggggtg cctaatgcgg ccgccatagt   11280
gactggatat gttgtgtttt acagtattat gtagtctgtt ttttatgcaa aatctaattt  11340
aatatattga tatttatatc attttacgtt tctcgttcag cttttttgta caaacttgtt  11400
tgataaccgg tactagtgtg cacgtcgagc gtgtcctctc caaatgaaat gaacttcctt  11460
atatagagga agggtcttgc gaaggatagt gggattgtgc gtcatccctt acgtcagtgg  11520
agatgtcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga  11580
tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaatga  11640
tagcctttcc tttatcgcaa tgatggcatt tgtaggagcc accttccttt tctactgtcc  11700
tttcgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc gaaattatcc  11760
tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg acatttttgg  11820
agtagaccag agtgtcgtgc tccaccatgt tgacgaagat tttcttcttg tcattgagtc  11880
gtaaaagact ctgtatgaac tgttcgccag tcttcacggc gagttctgtt agatcctcga  11940
tttgaatctt agactccatg catggcctta gattcagtag gaactacctt tttagagact  12000
ccaatctcta ttacttgcct tggtttatga agcaagcctt gaatcgtcca tactggaata  12060
gtacttctga tcttgagaaa tatgtctttc tctgtgttct tgatgcaatt agtcctgaat  12120
cttttgactg catctttaac cttcttggga aggtatttga tctcctggag attgttactc  12180
gggtagatcg tcttgatgag acctgctgcg taggcctctc taaccatctg tgggtcagca  12240
ttctttctga aattgaagag gctaaccttc tcattatcag tggtgaacat agtgtcgtca  12300
ccttcacctt cgaacttcct tcctagatcg taaagataga ggaaatcgtc cattgtaatc  12360
tccggggcaa aggagatctc ttttggggct ggatcactgc tgggcctttt ggttcctagc  12420
gtgagccagt gggctttttg ctttggtggg cttgttaggg ccttagcaaa gctcttgggc  12480
ttgagttgag cttctccttt ggggatgaag ttcaacctgt ctgtttgctg acttgttgtg  12540
tacgcgtcag ctgctgctct tgcctctgta atagtggcaa atttcttgtg tgcaactccg  12600
ggaacgccgt ttgttgccgc ctttgtacaa ccccagtcat cgtatatacc ggcatgtgga  12660
ccgttataca caacgtagta gttgatatga gggtgttgaa tacccgattc tgctctgaga  12720
ggagcaactg tgctgttaag ctcagatttt tgtgggattg gaattggatc ctctagagca  12780
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat  12840
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag  12900
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg  12960
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggccaaa  13020
gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac ggaaattatt  13080
cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag agccagcaaa  13140
atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga aaccatcatc  13200
tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt  13260
ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa  13320
taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat  13380
gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt  13440
tgaacgatct gcttcgacgc actccttctt taggtacgga ctagatctcg gtgacgggca  13500
ggaccggacg gggcggtacc ggcaggctga agtccagctg ccagaaaccc acgtcatgcc  13560
agttcccgtg cttgaagccg gccgcccgca gcatgccgcg gggggcatat ccgagcgcct  13620
cgtgcatgcg cacgctcggg tcgttgggca gcccgatgac agcgaccacg ctcttgaagc  13680
cctgtgcctc cagggacttc agcaggtggg tgtagagcgt ggagcccagt cccgtccgct  13740
ggtggcgggg ggagacgtac acggtcgact cggccgtcca gtcgtaggcg ttgcgtgcct  13800
tccaggggcc cgcgtaggcg atgccggcga cctcgccgtc cacctcggcg acgagccagg  13860
gatagcgctc ccgcagacgg acgaggtcgt ccgtccactc ctgcggttcc tgcggctcgg  13920
tacggaagtt gaccgtgctt gtctcgatgt agtggttgac gatggtgcag accgccggca  13980
tgtccgcctc ggtggcacgg cggatgtcgg ccgggcgtcg ttctgggctc atggatctgg  14040
attgagagtg aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg  14100
agcatttttg acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg  14160
caataatggt ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt  14220
ggctccttca acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat  14280
cggcgggggt cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc  14340
gccttcagtt taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa  14400
agagcgttta ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc  14460
catttgtatg tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga  14520
gcaagattgg ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa  14580
attgcaccaa cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt  14640
gaaccagatc gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt  14700
cgagcgcgac agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc  14760
ggaccagcct ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg  14820
acatattatg tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt  14880
gatccgtgcc gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa  14940
actggcggaa cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg  15000
ggcgctgctc gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc  15060
gagagccgac gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc  15120
gctgctcgcc taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca  15180
gatggaaacg gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga  15240
cgccgtcaat gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca  15300
ggccggcgac agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc  15360
gctgttgcgg gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca  15420
gggactcgcg gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga  15480
aggaccgaga aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac  15540
agcagagcca tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag  15600
cccgctacgg gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc  15660
tctctggcgg ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc  15720
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa  15780
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt  15840
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa  15900
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt  15960
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg  16020
tccgcctttc tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt  16080
cattatagcg attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca  16140
aagggttcgt gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga  16200
agtaggccca cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt  16260
gctcaacggg aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg  16320
caagcggatg gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta  16380
ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct  16440
gtcggcctac ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga  16500
gcacgtccgc gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa  16560
actctggctc accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct  16620
gctggcgaag atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg  16680
cccgagggca gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg  16740
ccaagcacgt ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca  16800
tcaccgacga gcaaggcaag accgagcgcc tttgcgacgc tca                    16843
<210>5
<211>9142
<212>DNA
<213>人工序列
<220>
<223>PHP27840构建体
<400>5
ctagttatct gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca     60
cgtgtcttta taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata    120
taaatattaa tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt    180
gtgttttgcg aattcgatat caagcttgat gggtaccggc gcgcccgatc atccggatat    240
agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa ggggttatgc    300
tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt tgttagcagc    360
cggatcgatc caagctgtac ctcactattc ctttgccctc ggacgagtgc tggggcgtcg    420
gtttccacta tcggcgagta cttctacaca gccatcggtc cagacggccg cgcttctgcg    480
ggcgatttgt gtacgcccga cagtcccggc tccggatcgg acgattgcgt cgcatcgacc    540
ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag ctctgataga gttggtcaag     600
accaatgcgg agcatatacg cccggagccg cggcgatcct gcaagctccg gatgcctccg     660
ctcgaagtag cgcgtctgct gctccataca agccaaccac ggcctccaga agaagatgtt     720
ggcgacctcg tattgggaat ccccgaacat cgcctcgctc cagtcaatga ccgctgttat     780
gcggccattg tccgtcagga cattgttgga gccgaaatcc gcgtgcacga ggtgccggac     840
ttcggggcag tcctcggccc aaagcatcag ctcatcgaga gcctgcgcga cggacgcact     900
gacggtgtcg tccatcacag tttgccagtg atacacatgg ggatcagcaa tcgcgcatat     960
gaaatcacgc catgtagtgt attgaccgat tccttgcggt ccgaatgggc cgaacccgct    1020
cgtctggcta agatcggccg cagcgatcgc atccatagcc tccgcgaccg gctgcagaac    1080
agcgggcagt tcggtttcag gcaggtcttg caacgtgaca ccctgtgcac ggcgggagat    1140
gcaataggtc aggctctcgc tgaattcccc aatgtcaagc acttccggaa tcgggagcgc    1200
ggccgatgca aagtgccgat aaacataacg atctttgtag aaaccatcgg cgcagctatt    1260
tacccgcagg acatatccac gccctcctac atcgaagctg aaagcacgag attcttcgcc    1320
ctccgagagc tgcatcaggt cggagacgct gtcgaacttt tcgatcagaa acttctcgac    1380
agacgtcgcg gtgagttcag gcttttccat gggtatatct ccttcttaaa gttaaacaaa    1440
attatttcta gagggaaacc gttgtggtct ccctatagtg agtcgtatta atttcgcggg    1500
atcgagatct gatcaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc    1560
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc    1620
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    1680
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    1740
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    1800
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    1860
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    1920
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt    1980
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2040
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2100
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    2160
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    2220
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    2280
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    2340
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    2400
aagggatttt ggtcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc    2460
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca    2520
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    2580
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    2640
accatatgga catattgtcg ttagaacgcg gctacaatta atacataacc ttatgtatca    2700
tacacatacg atttaggtga cactatagaa cggcgcgcca agctgggtct agaactagaa    2760
acgtgatgcc acttgttatt gaagtcgatt acagcatcta ttctgtttta ctatttataa    2820
ctttgccatt tctgactttt gaaaactatc tctggatttc ggtatcgctt tgtgaagatc    2880
gagcaaaaga gacgttttgt ggacgcaatg gtccaaatcc gttctacatg aacaaattgg    2940
tcacaatttc cactaaaagt aaataaatgg caagttaaaa aaggaatatg cattttactg    3000
attgcctagg tgagctccaa gagaagttga atctacacgt ctaccaaccg ctaaaaaaag    3060
aaaaacattg aatatgtaac ctgattccat tagcttttga cttcttcaac agattctcta    3120
cttagatttc taacagaaat attattacta gcacatcatt ttcagtctca ctacagcaaa    3180
aaatccaacg gcacaataca gacaacagga gatatcagac tacagagata gatagatgct    3240
actgcatgta gtaagttaaa taaaaggaaa ataaaatgtc ttgctaccaa aactactaca    3300
gactatgatg ctcaccacag gccaaatcct gcaactagga cagcattatc ttatatatat    3360
tgtacaaaac aagcatcaag gaacatttgg tctaggcaat cagtacctcg ttctaccatc    3420
accctcagtt atcacatcct tgaaggatcc attactggga atcatcggca acacatgctc    3480
ctgatggggc acaatgacat caagaaggta ggggccaggg gtgtccaaca ttctctgaat    3540
tgccgctcta agctcttcct tcttcgtcac tcgcgctgcc ggtatcccac aagcatcagc    3600
aaacttgagc atgtttggga atatctcgct ctcgctagac ggatctccaa gataggtgtg    3660
agctctattg gacttgtaga acctatcctc caactgaacc accataccca aatgctgatt    3720
gttcaacaac aatatcttaa ctgggagatt ctccactctt atagtggcca actcctgaac    3780
attcatgatg aaactaccat ccccatcaat gtcaaccaca acagccccag ggttagcaac    3840
agcagcacca atagccgcag gcaatccaaa acccatggct ccaagacccc ctgaggtcaa    3900
ccactgcctc ggtctcttgt acttgtaaaa ctgcgcagcc cacatttgat gctgcccaac    3960
cccagtacta acaatagcat ctccattagt caactcatca agaacctcga tagcatgctg    4020
cggagaaatc gcgtcctgga atgtcttgta acccaatgga aacttgtgtt tctgcacatt    4080
aatctcttct ctccaacctc caagatcaaa cttaccctcc actcctttct cctccaaaat    4140
catattaatt cccttcaagg ccaacttcaa atccgcgcaa accgacacgt gcgcctgctt    4200
gttcttccca atctcggcag aatcaatatc aatgtgaaca atcttagccc tactagcaaa    4260
agcctcaagc ttcccagtaa cacggtcatc aaaccttacc ccaaaggcaa gcaacaaatc    4320
actattgtcaacagcatagt  tagcataaac agtaccatgc atacccagca tctgaaggga    4380
atattcatca ccaataggaa aagttccaag acccattaaa gtgctagcaa cgggaatacc    4440
agtgagttca acaaagcgcc tcaattcagc actggaattc aaactgccac cgccgacgta    4500
gagaacgggc ttttgggcct ccatgatgag tctgacaatg tgttccaatt gggcctcggc    4560
ggggggcctg ggcagcctgg cgaggtaacc ggggaggtta acgggctcgt cccaattagg    4620
cacggcgagt tgctgctgaa cgtctttggg aatgtcgatg aggaccggac cggggcggcc    4680
ggaggtggcg acgaagaaag cctcggcgac gacgcggggg atgtcgtcga cgtcgaggat    4740
gaggtagttg tgcttcgtga tggatctgct cacctccacg atcggggttt cttggaaggc    4800
gtcggtgccg atcatccggc gggcgacctg gccggtgatg gcgacgactg ggacgctgtc    4860
cattaaagcg tcggcgaggc cgctcacgag gttggtggcg ccggggccgg aggtggcaat    4920
gcagacgccg gggaggccgg aggaacgcgc gtagccttcg gcggcgaaga cgccgccctg    4980
ctcgtggcgc gggagcacgt tgcggatggc ggcggagcgc gtgagcgcct ggtggatctc    5040
catcgacgca ccgccggggt acgcgaacac cgtcgtcacg ccctgcctct ccagcgcctc    5100
cacaaggatg tccgcgccct tgcgaggttc gccggaggcg aaccgtgaca cgaagggctc    5160
cgtggtcggc gcttccttgg tgaagggcgc cgccgtgggg ggtttggaga tggaacattt    5220
gattttgaga gcgtggttgg gtttggtgag ggtttgatga gagagaggga gggtggatct    5280
agtaatgcgt ttggggaagg tggggtgtga agaggaagaa gagaatcggg tggttctgga    5340
agcggtggcc gccattgtgt tgtgtggcat ggttatactt caaaaactgc acaacaagcc    5400
tagagttagt acctaaacag taaatttaca acagagagca aagacacatg caaaaatttc    5460
agccataaaa aaagttataa tagaatttaa agcaaaagtt tcatttttta aacatatata    5520
caaacaaact ggatttgaag gaagggatta attcccctgc tcaaagtttg aattcctatt    5580
gtgacctata ctcgaataaa attgaagcct aaggaatgta tgagaaacaa gaaaacaaaa    5640
caaaactaca gacaaacaag tacaattaca aaattcgcta aaattctgta atcaccaaac    5700
cccatctcag tcagcacaag gcccaaggtt tattttgaaa taaaaaaaaa gtgattttat    5760
ttctcataag ctaaaagaaa gaaaggcaat tatgaaatga tttcgactag atctgaaagt    5820
caaacgcgta ttccgcagat attaaagaaa gagtagagtt tcacatggat cctagatgga    5880
cccagttgag gaaaaagcaa ggcaaagcaa accagaagtg caagatccga aattgaacca    5940
cggaatctag gatttggtag agggagaaga aaagtacctt gagaggtaga agagaagaga    6000
agagcagaga gatatatgaa cgagtgtgtc ttggtctcaa ctctgaagcg atacgagttt    6060
agaggggagc attgagttcc aatttatagg gaaaccgggt ggcaggggtg agttaatgac    6120
ggaaaagccc ctaagtaacg agattggatt gtgggttaga ttcaaccgtt tgcatccgcg    6180
gcttagattg gggaagtcag agtgaatctc aaccgttgac tgagttgaaa attgaatgta    6240
gcaaccaatt gagccaaccc cagcctttgc cctttgattt tgatttgttt gttgcatact    6300
ttttatttgt cttctggttc tgactctctt tctctcgttt caatgccagg ttgcctactc    6360
ccacaccact cacaagaaga ttctactgtt agtattaaat attttttaat gtattaaatg    6420
atgaatgctt ttgtaaacag aacaagacta tgtctaataa gtgtcttgca acatttttta    6480
agaaattaaa aaaaatatat ttattatcaa aatcaaatgt atgaaaaatc atgaataata    6540
taattttata cattttttta aaaaatcttt taatttctta attaatatct taaaaataat    6600
gattaatatt taacccaaaa taattagtat gattggtaag gaagatatcc atgttatgtt    6660
tggatgtgag tttgatctag agcaaagctt actagagtcg acctgcagcc cctccaccgc    6720
ggtggcggcc gctctagaga tccgtcaaca tggtggagca cgacactctc gtctactcca    6780
agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg    6840
taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc atcaaaagga    6900
cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga aaggctatcg    6960
ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg    7020
tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt gatgatccta    7080
tgcgtatggt atgacgtgtg ttcaagatga tgacttcaaa cctacctatg acgtatggta    7140
tgacgtgtgt cgactgatga cttagatcca ctcgagcggc tataaatacg tacctacgca    7200
ccctgcgcta ccatccctag agctgcagct tatttttaca acaattacca acaacaacaa    7260
acaacaaaca acattacaat tactatttac aattacagtc gacccatcaa caagtttgta    7320
caaaaaagct gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt    7380
gcataaaaaa cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc    7440
gcattaggca ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg    7500
agttaggatc cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact    7560
ggatatacca ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag    7620
tcagttgctc aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag    7680
accgtaaaga aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg    7740
atgaatgctc atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat    7800
agtgttcacc cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg    7860
agtgaatacc acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt    7920
tacggtgaaa acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca    7980
gccaatccct gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc    8040
ttcgcccccg ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg    8100
ctggcgattc aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat    8160
gaattacaac agtactgcga tgagtggcag ggcggggcgt aaagatctgg atccggctta    8220
ctaaaagcca gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat    8280
actgatatgt atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag    8340
tgacagttga cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg    8400
tctggtaagc acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc    8460
ggaaaatcag gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc    8520
tgacgagaac aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc    8580
gttatcgtct gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg    8640
tgatccccct ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg    8700
tggtgcatat cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg    8760
tctccgttat cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg    8820
ccattaacct gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg    8880
caggtcgacc atagtgactg gatatgttgt gttttacagt attatgtagt ctgtttttta    8940
tgcaaaatct aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc    9000
ttgtacaaag tggttgataa cctagacttg tccatcttct ggattggcca acttaattaa    9060
tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg tgggcatcaa    9120
agt tgtgtgt tatgtgtaat ta                                            9142
<210>6
<211>49911
<212>DNA
<213>人工序列
<220>
<223>PHP23236构建体
<400>6
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta    60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt   120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca   180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt   240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg   300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta   360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct   420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa   480
tagaataaaa taaagtgact aaaaattaaa caaataccctt taagaaatt aaaaaaacta   540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt   600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca   660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg   720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag   780
gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct   840
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc   900
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc   960
ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct  1020
agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt  1080
tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac  1140
gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc  1200
tctagccgtt ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt  1260
tggtttgccc ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt  1320
tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc  1380
ggagtagaat tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg  1440
tgccatacat attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata  1500
ggtatacatg ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg    1560
gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac    1620
tgtttcaaac tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct    1680
tcatagttac gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat    1740
gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac    1800
cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat    1860
acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg    1920
ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact    1980
tctgcaggtc gactctagag gatccacaag tttgtacaaa aaagctgaac gagaaacgta    2040
aaatgatata aatatcaata tattaaatta gattttgcat aaaaaacaga ctacataata    2100
ctgtaaaaca caacatatcc agtcactatg gcggccgcat taggcacccc aggctttaca    2160
ctttatgctt ccggctcgta taatgtgtgg attttgagtt aggatttaaa tacgcgttga    2220
tccggcttac taaaagccag ataacagtat gcgtatttgc gcgctgattt ttgcggtata    2280
agaatatata ctgatatgta tacccgaagt atgtcaaaaa gaggtatgct atgaagcagc    2340
gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat atgatgtcaa    2400
tatctccggt ctggtaagca caaccatgca gaatgaagcc cgtcgtctgc gtgccgaacg    2460
ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc cggtttattg aaatgaacgg    2520
ctcttttgct gacgagaaca ggggctggtg aaatgcagtt taaggtttac acctataaaa    2580
gagagagccg ttatcgtctg tttgtggatg tacagagtga tatcattgac acgcccggtc    2640
gacggatggt gatccccctg gccagtgcac gtctgctgtc agataaagtc tcccgtgaac    2700
tttacccggt ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc gatatggcca    2760
gtgtgccggt ctccgttatc ggggaagaag tggctgatct cagccaccgc gaaaatgaca    2820
tcaaaaacgc cattaacctg atgttctggg gaatataaat gtcaggctcc cttatacaca    2880
gccagtctgc aggtcgacca tagtgactgg atatgttgtg ttttacagta ttatgtagtc    2940
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt    3000
tcagctttct tgtacaaagt ggtgttaacc tagacttgtc catcttctgg attggccaac    3060
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    3120
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    3180
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    3240
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    3300
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    3360
tggagctcga attccggtcc gggtcacctt tgtccaccaa gatggaactg cggccgctca    3420
ttaattaagt caggcgcgcc tctagttgaa gacacgttca tgtcttcatc gtaagaagac    3480
actcagtagt cttcggccag aatggccatc tggattcagc aggcctagaa ggccatttaa    3540
atcctgagga tctggtcttc ctaaggaccc gggatatcgg accgattaaa ctttaattcg    3600
gtccgaagct tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa    3660
tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt    3720
gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga ataatataat    3780
ctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg    3840
gtctaaagga caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg    3900
catgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat    3960
tagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat    4020
ctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt    4080
atttaataat ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc    4140
ctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc    4200
ctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc    4260
gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag    4320
ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg    4380
cagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgg    4440
gggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagaca    4500
ccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaacca    4560
gatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc    4620
cccccccctc tctaccttct ctagatcggc gttccggtcc atgcatggtt agggcccggt    4680
agttctactt ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag    4740
cgttcgtaca cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt    4800
ttctctttgg ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga    4860
ttttttttgt ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc    4920
gtgcacttgt ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg    4980
gtctggttgg gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat    5040
ttattaattt tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg    5100
atggatggaa atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat    5160
atacagagat gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc    5220
attcgttcta gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg    5280
gaactgtatg tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc    5340
gatctaggat aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata    5400
tgcagcatct attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg    5460
ttttataatt attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg    5520
gattttttta gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga    5580
tgctcaccct gttgtttggt gttacttctg caggtcgact ttaacttagc ctaggatcca    5640
cacgacacca tgtcccccga gcgccgcccc gtcgagatcc gcccggccac cgccgccgac    5700
atggccgccg tgtgcgacat cgtgaaccac tacatcgaga cctccaccgt gaacttccgc    5760
accgagccgc agaccccgca ggagtggatc gacgacctgg agcgcctcca ggaccgctac    5820
ccgtggctcg tggccgaggt ggagggcgtg gtggccggca tcgcctacgc cggcccgtgg    5880
aaggcccgca acgcctacga ctggaccgtg gagtccaccg tgtacgtgtc ccaccgccac    5940
cagcgcctcg gcctcggctc caccctctac acccacctcc tcaagagcat ggaggcccag    6000
ggcttcaagt ccgtggtggc cgtgatcggc ctcccgaacg acccgtccgt gcgcctccac    6060
gaggccctcg gctacaccgc ccgcggcacc ctccgcgccg ccggctacaa gcacggcggc    6120
tggcacgacg tcggcttctg gcagcgcgac ttcgagctgc cggccccgcc gcgcccggtg    6180
cgcccggtga cgcagatctg agtcgaaacc tagacttgtc catcttctgg attggccaac    6240
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    6300
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    6360
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    6420
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    6480
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    6540
tggagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg aagagctatg    6600
tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccgc aatgtgttat    6660
taagttgtct aagcgtcaat ttggtttaca ccacaatata tcctgccacc agccagccaa    6720
cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc    6780
cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg    6840
ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg    6900
tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct    6960
cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc    7020
gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg    7080
agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta    7140
attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca    7200
tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc    7260
cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt    7320
agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg    7380
accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg    7440
gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg    7500
acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg    7560
ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa    7620
tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg    7680
tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg    7740
tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga    7800
tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt    7860
cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg    7920
tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga    7980
taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc    8040
cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg    8100
gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc    8160
gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc    8220
tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc    8280
agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat    8340
tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca    8400
acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc    8460
aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc    8520
agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt    8580
acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga    8640
gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc    8700
cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag    8760
taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca    8820
atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt    8880
tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg    8940
atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata    9000
gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg    9060
aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg    9120
taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac    9180
acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc    9240
accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct    9300
tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg    9360
ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa    9420
attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat    9480
atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg    9540
aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg    9600
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca    9660
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca    9720
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa    9780
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    9840
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    9900
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    9960
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg   10020
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc   10080
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc   10140
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc   10200
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  10260
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  10320
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  10380
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc  10440
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  10500
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  10560
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  10620
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa  10680
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta  10740
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt  10800
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag  10860
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca  10920
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc  10980
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt  11040
tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca  11100
aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc  11160
tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac  11220
gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc  11280
tacctgtcgg atcaccggaa aggacccgta aagtgataat gattatcatc tacatatcac  11340
aacgtgcgtg gaggccatca aaccacgtca aataatcaat tatgacgcag gtatcgtatt  11400
aattgatctg catcaactta acgtaaaaac aacttcagac aatacaaatc agcgacactg  11460
aatacggggc aacctcatgt cccccccccc cccccccctg caggcatcgt ggtgtcacgc  11520
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga  11580
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt  11640
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc  11700
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa  11760
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca  11820
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca  11880
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct  11940
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc  12000
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa  12060
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt  12120
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc  12180
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt  12240
cgtcttcaag aattcggagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga  12300
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg  12360
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga  12420
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat  12480
gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg  12540
gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat  12600
cgaacttttg ctgagttgaa ggatcagatc acgcatcttc ccgacaacgc agaccgttcc  12660
gtggcaaagc aaaagttcaa aatcaccaac tggtccacct acaacaaagc tctcatcaac  12720
cgtggctccc tcactttctg gctggatgat ggggcgattc aggcctggta tgagtcagca  12780
acaccttctt cacgaggcag acctcagcgc cagaaggccg ccagagaggc cgagcgcggc  12840
cgtgaggctt ggacgctagg gcagggcatg aaaaagcccg tagcgggctg ctacgggcgt  12900
ctgacgcggt ggaaaggggg aggggatgtt gtctacatgg ctctgctgta gtgagtgggt  12960
tgcgctccgg cagcggtcct gatcaatcgt caccctttct cggtccttca acgttcctga  13020
caacgagcct ccttttcgcc aatccatcga caatcaccgc gagtccctgc tcgaacgctg  13080
cgtccggacc ggcttcgtcg aaggcgtcta tcgcggcccg caacagcggc gagagcggag  13140
cctgttcaac ggtgccgccg cgctcgccgg catcgctgtc gccggcctgc tcctcaagca  13200
cggccccaac agtgaagtag ctgattgtca tcagcgcatt gacggcgtcc ccggccgaaa  13260
aacccgcctc gcagaggaag cgaagctgcg cgtcggccgt ttccatctgc ggtgcgcccg  13320
gtcgcgtgcc ggcatggatg cgcgcgccat cgcggtaggc gagcagcgcc tgcctgaagc  13380
tgcgggcatt cccgatcaga aatgagcgcc agtcgtcgtc ggctctcggc accgaatgcg  13440
tatgattctc cgccagcatg gcttcggcca gtgcgtcgag cagcgcccgc ttgttcctga  13500
agtgccagta aagcgccggc tgctgaaccc ccaaccgttc cgccagtttg cgtgtcgtca  13560
gaccgtctac gccgacctcg ttcaacaggt ccagggcggc acggatcact gtattcggct  13620
gcaactttgt catgcttgac actttatcac tgataaacat aatatgtcca ccaacttatc  13680
agtgataaag aatccgcgcg ttcaatcgga ccagcggagg ctggtccgga ggccagacgt  13740
gaaacccaac atacccctga tcgtaattct gagcactgtc gcgctcgacg ctgtcggcat  13800
cggcctgatt atgccggtgc tgccgggcct cctgcgcgat ctggttcact cgaacgacgt  13860
caccgcccac tatggcattc tgctggcgct gtatgcgttg gtgcaatttg cctgcgcacc  13920
tgtgctgggc gcgctgtcgg atcgtttcgg gcggcggcca atcttgctcg tctcgctggc  13980
cggcgccact gtcgactacg ccatcatggc gacagcgcct ttcctttggg ttctctatat  14040
cgggcggatc gtggccggca tcaccggggc gactggggcg gtagccggcg cttatattgc  14100
cgatatcact gatggcgatg agcgcgcgcg gcacttcggc ttcatgagcg cctgtttcgg  14160
gttcgggatg gtcgcgggac ctgtgctcgg tgggctgatg ggcggtttct ccccccacgc  14220
tccgttcttc gccgcggcag ccttgaacgg cctcaatttc ctgacgggct gtttcctttt  14280
gccggagtcg cacaaaggcg aacgccggcc gttacgccgg gaggctctca acccgctcgc  14340
ttcgttccgg tgggcccggg gcatgaccgt cgtcgccgcc ctgatggcgg tcttcttcat  14400
catgcaactt gtcggacagg tgccggccgc gctttgggtc attttcggcg aggatcgctt  14460
tcactgggac gcgaccacga tcggcatttc gcttgccgca tttggcattc tgcattcact  14520
cgcccaggca atgatcaccg gccctgtagc cgcccggctc ggcgaaaggc gggcactcat  14580
gctcggaatg attgccgacg gcacaggcta catcctgctt gccttcgcga cacggggatg  14640
gatggcgttc ccgatcatgg tcctgcttgc ttcgggtggc atcggaatgc cggcgctgca  14700
agcaatgttg tccaggcagg tggatgagga acgtcagggg cagctgcaag gctcactggc  14760
ggcgctcacc agcctgacct cgatcgtcgg acccctcctc ttcacggcga tctatgcggc  14820
ttctataaca acgtggaacg ggtgggcatg gattgcaggc gctgccctct acttgctctg  14880
cctgccggcg ctgcgtcgcg ggctttggag cggcgcaggg caacgagccg atcgctgatc  14940
gtggaaacga taggcctatg ccatgcgggt caaggcgact tccggcaagc tatacgcgcc  15000
ctaggagtgc ggttggaacg ttggcccagc cagatactcc cgatcacgag caggacgccg  15060
atgatttgaa gcgcactcag cgtctgatcc aagaacaacc atcctagcaa cacggcggtc  15120
cccgggctga gaaagcccag taaggaaaca actgtaggtt cgagtcgcga gatcccccgg  15180
aaccaaagga agtaggttaa acccgctccg atcaggccga gccacgccag gccgagaaca  15240
ttggttcctg taggcatcgg gattggcgga tcaaacacta aagctactgg aacgagcaga  15300
agtcctccgg ccgccagttg ccaggcggta aaggtgagca gaggcacggg aggttgccac  15360
ttgcgggtca gcacggttcc gaacgccatg gaaaccgccc ccgccaggcc cgctgcgacg  15420
ccgacaggat ctagcgctgc gtttggtgtc aacaccaaca gcgccacgcc cgcagttccg  15480
caaatagccc ccaggaccgc catcaatcgt atcgggctac ctagcagagc ggcagagatg  15540
aacacgacca tcagcggctg cacagcgcct accgtcgccg cgaccccgcc cggcaggcgg  15600
tagaccgaaataaacaacaa gctccagaat agcgaaatat  taagtgcgcc gaggatgaag  15660
atgcgcatcc accagattcc cgttggaatc tgtcggacga tcatcacgag caataaaccc  15720
gccggcaacg cccgcagcag cataccggcg acccctcggc ctcgctgttc gggctccacg  15780
aaaacgccgg acagatgcgc cttgtgagcg tccttggggc cgtcctcctg tttgaagacc  15840
gacagcccaa tgatctcgcc gtcgatgtag gcgccgaatg ccacggcatc tcgcaaccgt  15900
tcagcgaacg cctccatggg ctttttctcc tcgtgctcgt aaacggaccc gaacatctct  15960
ggagctttct tcagggccga caatcggatc tcgcggaaat cctgcacgtc ggccgctcca  16020
agccgtcgaa tctgagcctt aatcacaatt gtcaatttta atcctctgtt tatcggcagt  16080
tcgtagagcg cgccgtgcgt cccgagcgat actgagcgaa gcaagtgcgt cgagcagtgc  16140
ccgcttgttc ctgaaatgcc agtaaagcgc tggctgctga acccccagcc ggaactgacc  16200
ccacaaggcc ctagcgtttg caatgcacca ggtcatcatt gacccaggcg tgttccacca  16260
ggccgctgcc tcgcaactct tcgcaggctt cgccgacctg ctcgcgccac ttcttcacgc  16320
gggtggaatc cgatccgcac atgaggcgga aggtttccag cttgagcggg tacggctccc  16380
ggtgcgagct gaaatagtcg aacatccgtc gggccgtcgg cgacagcttg cggtacttct  16440
cccatatgaa tttcgtgtag tggtcgccag caaacagcac gacgatttcc tcgtcgatca  16500
ggacctggca acgggacgtt ttcttgccac ggtccaggac gcggaagcgg tgcagcagcg  16560
acaccgattc caggtgccca acgcggtcgg acgtgaagcc catcgccgtc gcctgtaggc  16620
gcgacaggca ttcctcggcc ttcgtgtaat accggccatt gatcgaccag cccaggtcct  16680
ggcaaagctc gtagaacgtg aaggtgatcg gctcgccgat aggggtgcgc ttcgcgtact  16740
ccaacacctg ctgccacacc agttcgtcat cgtcggcccg cagctcgacg ccggtgtagg  16800
tgatcttcac gtccttgttg acgtggaaaa tgaccttgtt ttgcagcgcc tcgcgcggga  16860
ttttcttgtt gcgcgtggtg aacagggcag agcgggccgt gtcgtttggc atcgctcgca  16920
tcgtgtccgg ccacggcgca atatcgaaca aggaaagctg catttccttg atctgctgct  16980
tcgtgtgttt cagcaacgcg gcctgcttgg cctcgctgac ctgttttgcc aggtcctcgc  17040
cggcggtttt tcgcttcttg gtcgtcatag ttcctcgcgt gtcgatggtc atcgacttcg  17100
ccaaacctgc cgcctcctgt tcgagacgac gcgaacgctc cacggcggcc gatggcgcgg  17160
gcagggcagg gggagccagt tgcacgctgt cgcgctcgat cttggccgta gcttgctgga  17220
ccatcgagcc gacggactgg aaggtttcgc ggggcgcacg catgacggtg cggcttgcga  17280
tggtttcggc atcctcggcg gaaaaccccg cgtcgatcag ttcttgcctg tatgccttcc  17340
ggtcaaacgt ccgattcatt caccctcctt gcgggattgc cccgactcac gccggggcaa  17400
tgtgccctta ttcctgattt gacccgcctg gtgccttggt gtccagataa tccaccttat  17460
cggcaatgaa gtcggtcccg tagaccgtct ggccgtcctt ctcgtacttg gtattccgaa  17520
tcttgccctg cacgaatacc agcgacccct tgcccaaata cttgccgtgg gcctcggcct  17580
gagagccaaa acacttgatg cggaagaagt cggtgcgctc ctgcttgtcg ccggcatcgt  17640
tgcgccactc ttcattaacc gctatatcga aaattgcttg cggcttgtta gaattgccat  17700
gacgtacctc ggtgtcacgg gtaagattac cgataaactg gaactgatta tggctcatat  17760
cgaaagtctc cttgagaaag gagactctag tttagctaaa cattggttcc gctgtcaaga  17820
actttagcgg ctaaaatttt gcgggccgcg accaaaggtg cgaggggcgg cttccgctgt  17880
gtacaaccag atatttttca ccaacatcct tcgtctgctc gatgagcggg gcatgacgaa  17940
acatgagctg tcggagaggg caggggtttc aatttcgttt ttatcagact taaccaacgg  18000
taaggccaac ccctcgttga aggtgatgga ggccattgcc gacgccctgg aaactcccct  18060
acctcttctc ctggagtcca ccgaccttga ccgcgaggca ctcgcggaga ttgcgggtca  18120
tcctttcaag agcagcgtgc cgcccggata cgaacgcatc agtgtggttt tgccgtcaca  18180
taaggcgttt atcgtaaaga aatggggcga cgacacccga aaaaagctgc gtggaaggct  18240
ctgacgccaa gggttagggc ttgcacttcc ttctttagcc gctaaaacgg ccccttctct  18300
gcgggccgtc ggctcgcgca tcatatcgac atcctcaacg gaagccgtgc cgcgaatggc  18360
atcgggcggg tgcgctttga cagttgtttt ctatcagaac ccctacgtcg tgcggttcga  18420
ttagctgttt gtcttgcagg ctaaacactt tcggtatatc gtttgcctgt gcgataatgt  18480
tgctaatgat ttgttgcgta ggggttactg aaaagtgagc gggaaagaag agtttcagac  18540
catcaaggag cgggccaagc gcaagctgga acgcgacatg ggtgcggacc tgttggccgc  18600
gctcaacgac ccgaaaaccg ttgaagtcat gctcaacgcg gacggcaagg tgtggcacga  18660
acgccttggc gagccgatgc ggtacatctg cgacatgcgg cccagccagt cgcaggcgat  18720
tatagaaacg gtggccggat tccacggcaa agaggtcacg cggcattcgc ccatcctgga  18780
aggcgagttc cccttggatg gcagccgctt tgccggccaa ttgccgccgg tcgtggccgc  18840
gccaaccttt gcgatccgca agcgcgcggt cgccatcttc acgctggaac agtacgtcga  18900
ggcgggcatc atgacccgcg agcaatacga ggtcattaaa agcgccgtcg cggcgcatcg  18960
aaacatcctc gtcattggcg gtactggctc gggcaagacc acgctcgtca acgcgatcat  19020
caatgaaatg gtcgccttca acccgtctga gcgcgtcgtc atcatcgagg acaccggcga  19080
aatccagtgc gccgcagaga acgccgtcca ataccacacc agcatcgacg tctcgatgac  19140
gctgctgctc aagacaacgc tgcgtatgcg ccccgaccgc atcctggtcg gtgaggtacg  19200
tggccccgaa gcccttgatc tgttgatggc ctggaacacc gggcatgaag gaggtgccgc  19260
caccctgcac gcaaacaacc ccaaagcggg cctgagccgg ctcgccatgc ttatcagcat  19320
gcacccggat tcaccgaaac ccattgagcc gctgattggc gaggcggttc atgtggtcgt  19380
ccatatcgcc aggaccccta gcggccgtcg agtgcaagaa attctcgaag ttcttggtta  19440
cgagaacggc cagtacatca ccaaaaccct gtaaggagta tttccaatga caacggctgt  19500
tccgttccgt ctgaccatga atcgcggcat tttgttctac cttgccgtgt tcttcgttct  19560
cgctctcgcg ttatccgcgc atccggcgat ggcctcggaa ggcaccggcg gcagcttgcc  19620
atatgagagc tggctgacga acctgcgcaa ctccgtaacc ggcccggtgg ccttcgcgct  19680
gtccatcatc ggcatcgtcg tcgccggcgg cgtgctgatc ttcggcggcg aactcaacgc  19740
cttcttccga accctgatct tcctggttct ggtgatggcg ctgctggtcg gcgcgcagaa  19800
cgtgatgagc accttcttcg gtcgtggtgc cgaaatcgcg gccctcggca acggggcgct  19860
gcaccaggtg caagtcgcgg cggcggatgc cgtgcgtgcg gtagcggctg gacggctcgc  19920
ctaatcatgg ctctgcgcac gatccccatc cgtcgcgcag gcaaccgaga aaacctgttc  19980
atgggtggtg atcgtgaact ggtgatgttc tcgggcctga tggcgtttgc gctgattttc  20040
agcgcccaag agctgcgggc caccgtggtc ggtctgatcc tgtggttcgg ggcgctctat  20100
gcgttccgaa tcatggcgaa ggccgatccg aagatgcggt tcgtgtacct gcgtcaccgc  20160
cggtacaagc cgtattaccc ggcccgctcg accccgttcc gcgagaacac caatagccaa  20220
gggaagcaat accgatgatc caagcaattg cgattgcaat cgcgggcctc ggcgcgcttc  20280
tgttgttcat cctctttgcc cgcatccgcg cggtcgatgc cgaactgaaa ctgaaaaagc  20340
atcgttccaa ggacgccggc ctggccgatc tgctcaacta cgccgctgtc gtcgatgacg  20400
gcgtaatcgt gggcaagaac ggcagcttta tggctgcctg gctgtacaag ggcgatgaca  20460
acgcaagcag caccgaccag cagcgcgaag tagtgtccgc ccgcatcaac caggccctcg  20520
cgggcc tgggaagtgggtgg atgatccatg tggacgccgt gcggcgtcct gctccgaact  20580
acgcggagcg gggcctgtcg gcgttccctg accgtctgac ggcagcgatt gaagaagagc  20640
gctcggtctt gccttgctcg tcggtgatgt acttcaccag ctccgcgaag tcgctcttct  20700
tgatggagcg catggggacg tgcttggcaa tcacgcgcac cccccggccg ttttagcggc  20760
taaaaaagtc atggctctgc cctcgggcgg accacgccca tcatgacctt gccaagctcg  20820
tcctgcttct cttcgatctt cgccagcagg gcgaggatcg tggcatcacc gaaccgcgcc  20880
gtgcgcgggt cgtcggtgag ccagagtttc agcaggccgc ccaggcggcc caggtcgcca  20940
ttgatgcggg ccagctcgcg gacgtgctca tagtccacga cgcccgtgat tttgtagccc  21000
tggccgacgg ccagcaggta ggccgacagg ctcatgccgg ccgccgccgc cttttcctca  21060
atcgctcttc gttcgtctgg aaggcagtac accttgatag gtgggctgcc cttcctggtt  21120
ggcttggttt catcagccat ccgcttgccc tcatctgtta cgccggcggt agccggccag  21180
cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac agtgaagaag  21240
gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggctgacg ccgttggata  21300
caccaaggaa agtctacacg aaccctttgg caaaatcctg tatatcgtgc gaaaaaggat  21360
ggatataccg aaaaaatcgc tataatgacc ccgaagcagg gttatgcagc ggaaaagcgc  21420
tgcttccctg ctgttttgtg gaatatctac cgactggaaa caggcaaatg caggaaatta  21480
ctgaactgag gggacaggcg agagacgatg ccaaagagct acaccgacga gctggccgag  21540
tgggttgaat cccgcgcggc caagaagcgc cggcgtgatg aggctgcggt tgcgttcctg  21600
gcggtgaggg cggatgtcga ggcggcgtta gcgtccggct atgcgctcgt caccatttgg  21660
gagcacatgc gggaaacggg gaaggtcaag ttctcctacg agacgttccg ctcgcacgcc  21720
aggcggcaca tcaaggccaa gcccgccgat gtgcccgcac cgcaggccaa ggctgcggaa  21780
cccgcgccgg cacccaagac gccggagcca cggcggccga agcagggggg caaggctgaa  21840
aagccggccc ccgctgcggc cccgaccggc ttcaccttca acccaacacc ggacaaaaag  21900
gatctactgt aatggcgaaa attcacatgg ttttgcaggg caagggcggg gtcggcaagt  21960
cggccatcgc cgcgatcatt gcgcagtaca agatggacaa ggggcagaca cccttgtgca  22020
tcgacaccga cccggtgaac gcgacgttcg agggctacaa ggccctgaac gtccgccggc  22080
tgaacatcat ggccggcgac gaaattaact cgcgcaactt cgacaccctg gtcgagctga  22140
ttgcgccgac caaggatgac gtggtgatcg acaacggtgc cagctcgttc gtgcctctgt  22200
cgcattacct catcagcaac caggtgccgg ctctgctgca agaaatgggg catgagctgg  22260
tcatccatac cgtcgtcacc ggcggccagg ctctcctgga cacggtgagc ggcttcgccc  22320
agctcgccag ccagttcccg gccgaagcgc ttttcgtggt ctggctgaac ccgtattggg  22380
ggcctatcga gcatgagggc aagagctttg agcagatgaa ggcgtacacg gccaacaagg  22440
cccgcgtgtc gtccatcatc cagattccgg ccctcaagga agaaacctac ggccgcgatt  22500
tcagcgacat gctgcaagag cggctgacgt tcgaccaggc gctggccgat gaatcgctca  22560
cgatcatgac gcggcaacgc ctcaagatcg tgcggcgcgg cctgtttgaa cagctcgacg  22620
cggcggccgt gctatgagcg accagattga agagctgatc cgggagattg cggccaagca  22680
cggcatcgcc gtcggccgcg acgacccggt gctgatcctg cataccatca acgcccggct  22740
catggccgac agtgcggcca agcaagagga aatccttgcc gcgttcaagg aagagctgga  22800
agggatcgcc catcgttggg gcgaggacgc caaggccaaa gcggagcgga tgctgaacgc  22860
ggccctggcg gccagcaagg acgcaatggc gaaggtaatg aaggacagcg ccgcgcaggc  22920
ggccgaagcg atccgcaggg aaatcgacga cggccttggc cgccagctcg cggccaaggt  22980
cgcggacgcg cggcgcgtgg cgatgatgaa catgatcgcc ggcggcatgg tgttgttcgc  23040
ggccgccctg gtggtgtggg cctcgttatg aatcgcagag gcgcagatga aaaagcccgg  23100
cgttgccggg ctttgttttt gcgttagctg ggcttgtttg acaggcccaa gctctgactg  23160
cgcccgcgct cgcgctcctg ggcctgtttc ttctcctgct cctgcttgcg catcagggcc  23220
tggtgccgtc gggctgcttc acgcatcgaa tcccagtcgc cggccagctc gggatgctcc  23280
gcgcgcatct tgcgcgtcgc cagttcctcg atcttgggcg cgtgaatgcc catgccttcc  23340
ttgatttcgc gcaccatgtc cagccgcgtg tgcagggtct gcaagcgggc ttgctgttgg  23400
gcctgctgct gctgccaggc ggcctttgta cgcggcaggg acagcaagcc gggggcattg  23460
gactgtagct gctgcaaacg cgcctgctga cggtctacga gctgttctag gcggtcctcg  23520
atgcgctcca cctggtcatg ctttgcctgc acgtagagcg caagggtctg ctggtaggtc  23580
tgctcgatgg gcgcggattc taagagggcc tgctgttccg tctcggcctc ctgggccgcc  23640
tgtagcaaat cctcgccgct gttgccgctg gactgcttta ctgccgggga ctgctgttgc  23700
cctgctcgcg ccgtcgtcgc agttcggctt gcccccactc gattgactgc ttcatttcga  23760
gccgcagcga tgcgatctcg gattgcgtca acggacgggg cagcgcggag gtgtccggct  23820
tctccttggg tgagtcggtc gatgccatag ccaaaggttt ccttccaaaa tgcgtccatt  23880
gctggaccgt gtttctcatt gatgcccgca agcatcttcg gcttgaccgc caggtcaagc  23940
gcgccttcat gggcggtcat gacggacgcc gccatgacct tgccgccgtt gttctcgatg  24000
tagccgcgtaatgaggcaat  ggtgccgccc atcgtcagcg tgtcatcgac aacgatgtac  24060
ttctggccgg ggatcacctc cccctcgaaa gtcgggttga acgccaggcg atgatctgaa  24120
ccggctccgg ttcgggcgac cttctcccgc tgcacaatgt ccgtttcgac ctcaaggcca  24180
aggcggtcgg ccagaacgac cgccatcatg gccggaatct tgttgttccc cgccgcctcg  24240
acggcgagga ctggaacgat gcggggcttg tcgtcgccga tcagcgtctt gagctgggca  24300
acagtgtcgt ccgaaatcag gcgctcgacc aaattaagcg ccgcttccgc gtcgccctgc  24360
ttcgcagcct ggtattcagg ctcgttggtc aaagaaccaa ggtcgccgtt gcgaaccacc  24420
ttcgggaagt ctccccacgg tgcgcgctcg gctctgctgt agctgctcaa gacgcctccc  24480
tttttagccg ctaaaactct aacgagtgcg cccgcgactc aacttgacgc tttcggcact  24540
tacctgtgcc ttgccacttg cgtcataggt gatgcttttc gcactcccga tttcaggtac  24600
tttatcgaaa tctgaccggg cgtgcattac aaagttcttc cccacctgtt ggtaaatgct  24660
gccgctatct gcgtggacga tgctgccgtc gtggcgctgc gacttatcgg ccttttgggc  24720
catatagatg ttgtaaatgc caggtttcag ggccccggct ttatctacct tctggttcgt  24780
ccatgcgcct tggttctcgg tctggacaat tctttgccca ttcatgacca ggaggcggtg  24840
tttcattggg tgactcctga cggttgcctc tggtgttaaa cgtgtcctgg tcgcttgccg  24900
gctaaaaaaa agccgacctc ggcagttcga ggccggcttt ccctagagcc gggcgcgtca  24960
aggttgttcc atctatttta gtgaactgcg ttcgatttat cagttacttt cctcccgctt  25020
tgtgtttcct cccactcgtt tccgcgtcta gccgacccct caacatagcg gcctcttctt  25080
gggctgcctt tgcctcttgc cgcgcttcgt cacgctcggc ttgcaccgtc gtaaagcgct  25140
cggcctgcct ggccgcctct tgcgccgcca acttcctttg ctcctggtgg gcctcggcgt  25200
cggcctgcgc cttcgctttc accgctgcca actccgtgcg caaactctcc gcttcgcgcc  25260
tggtggcgtc gcgctcgccg cgaagcgcct gcatttcctg gttggccgcg tccagggtct  25320
tgcggctctc ttctttgaat gcgcgggcgt cctggtgagc gtagtccagc tcggcgcgca  25380
gctcctgcgc tcgacgctcc acctcgtcgg cccgctgcgt cgccagcgcg gcccgctgct  25440
cggctcctgc cagggcggtg cgtgcttcgg ccagggcttg ccgctggcgt gcggccagct  25500
cggccgcctc ggcggcctgc tgctctagca atgtaacgcg cgcctgggct tcttccagct  25560
cgcgggcctg cgcctcgaag gcgtcggcca gctccccgcg cacggcttcc aactcgttgc  25620
gctcacgatc ccagccggct tgcgctgcct gcaacgattc attggcaagg gcctgggcgg  25680
cttgccagag ggcggccacg gcctggttgc cggcctgctg caccgcgtcc ggcacctgga  25740
ctgccagcgg ggcggcctgc gccgtgcgct ggcgtcgcca ttcgcgcatg ccggcgctgg  25800
cgtcgttcat gttgacgcgg gcggccttac gcactgcatc cacggtcggg aagttctccc  25860
ggtcgccttg ctcgaacagc tcgtccgcag ccgcaaaaat gcggtcgcgc gtctctttgt  25920
tcagttccat gttggctccg gtaattggta agaataataa tactcttacc taccttatca  25980
gcgcaagagt ttagctgaac agttctcgac ttaacggcag gttttttagc ggctgaaggg  26040
caggcaaaaa aagccccgca cggtcggcgg gggcaaaggg tcagcgggaa ggggattagc  26100
gggcgtcggg cttcttcatg cgtcggggcc gcgcttcttg ggatggagca cgacgaagcg  26160
cgcacgcgca tcgtcctcgg ccctatcggc ccgcgtcgcg gtcaggaact tgtcgcgcgc  26220
taggtcctcc ctggtgggca ccaggggcat gaactcggcc tgctcgatgt aggtccactc  26280
catgaccgca tcgcagtcga ggccgcgttc cttcaccgtc tcttgcaggt cgcggtacgc  26340
ccgctcgttg agcggctggt aacgggccaa ttggtcgtaa atggctgtcg gccatgagcg  26400
gcctttcctg ttgagccagc agccgacgac gaagccggca atgcaggccc ctggcacaac  26460
caggccgacg ccgggggcag gggatggcag cagctcgcca accaggaacc ccgccgcgat  26520
gatgccgatg ccggtcaacc agcccttgaa actatccggc cccgaaacac ccctgcgcat  26580
tgcctggatg ctgcgccgga tagcttgcaa catcaggagc cgtttctttt gttcgtcagt  26640
catggtccgc cctcaccagt tgttcgtatc ggtgtcggac gaactgaaat cgcaagagct  26700
gccggtatcg gtccagccgc tgtccgtgtc gctgctgccg aagcacggcg aggggtccgc  26760
gaacgccgca gacggcgtat ccggccgcag cgcatcgccc agcatggccc cggtcagcga  26820
gccgccggcc aggtagccca gcatggtgct gttggtcgcc ccggccacca gggccgacgt  26880
gacgaaatcg ccgtcattcc ctctggattg ttcgctgctc ggcggggcag tgcgccgcgc  26940
cggcggcgtc gtggatggct cgggttggct ggcctgcgac ggccggcgaa aggtgcgcag  27000
cagctcgtta tcgaccggct gcggcgtcgg ggccgccgcc ttgcgctgcg gtcggtgttc  27060
cttcttcggc tcgcgcagct tgaacagcat gatcgcggaa accagcagca acgccgcgcc  27120
tacgcctccc gcgatgtaga acagcatcgg attcattctt cggtcctcct tgtagcggaa  27180
ccgttgtctg tgcggcgcgg gtggcccgcg ccgctgtctt tggggatcag ccctcgatga  27240
gcgcgaccag tttcacgtcg gcaaggttcg cctcgaactc ctggccgtcg tcctcgtact  27300
tcaaccaggc atagccttcc gccggcggcc gacggttgag gataaggcgg gcagggcgct  27360
cgtcgtgctc gacctggacg atggcctttt tcagcttgtc cgggtccggc tccttcgcgc  27420
ccttttcctt ggcgtcctta ccgtcctggt cgccgtcctc gccgtcctgg ccgtcgccgg  27480
cctccgcgtc acgctcggca tcagtctggc cgttgaaggc atcgacggtg ttgggatcgc  27540
ggcccttctc gtccaggaac tcgcgcagca gcttgaccgt gccgcgcgtg atttcctggg  27600
tgtcgtcgtc aagccacgcc tcgacttcct ccgggcgctt cttgaaggcc gtcaccagct  27660
cgttcaccac ggtcacgtcg cgcacgcggc cggtgttgaa cgcatcggcg atcttctccg  27720
gcaggtccag cagcgtgacg tgctgggtga tgaacgccgg cgacttgccg atttccttgg  27780
cgatatcgcc tttcttcttg cccttcgcca gctcgcggcc aatgaagtcg gcaatttcgc  27840
gcggggtcag ctcgttgcgt tgcaggttct cgataacctg gtcggcttcg ttgtagtcgt  27900
tgtcgatgaa cgccgggatg gacttcttgc cggcccactt cgagccacgg tagcggcggg  27960
cgccgtgatt gatgatatag cggcccggct gctcctggtt ctcgcgcacc gaaatgggtg  28020
acttcacccc gcgctctttg atcgtggcac cgatttccgc gatgctctcc ggggaaaagc  28080
cggggttgtc ggccgtccgc ggctgatgcg gatcttcgtc gatcaggtcc aggtccagct  28140
cgatagggcc ggaaccgccc tgagacgccg caggagcgtc caggaggctc gacaggtcgc  28200
cgatgctatc caaccccagg ccggacggct gcgccgcgcc tgcggcttcc tgagcggccg  28260
cagcggtgtt tttcttggtg gtcttggctt gagccgcagt cattgggaaa tctccatctt  28320
cgtgaacacg taatcagcca gggcgcgaac ctctttcgat gccttgcgcg cggccgtttt  28380
cttgatcttc cagaccggca caccggatgc gagggcatcg gcgatgctgc tgcgcaggcc  28440
aacggtggcc ggaatcatca tcttggggta cgcggccagc agctcggctt ggtggcgcgc  28500
gtggcgcgga ttccgcgcat cgaccttgct gggcaccatg ccaaggaatt gcagcttggc  28560
gttcttctgg cgcacgttcg caatggtcgt gaccatcttc ttgatgccct ggatgctgta  28620
cgcctcaagc tcgatggggg acagcacata gtcggccgcg aagagggcgg ccgccaggcc  28680
gacgccaagg gtcggggccg tgtcgatcag gcacacgtcg aagccttggt tcgccagggc  28740
cttgatgttc gccccgaaca gctcgcgggc gtcgtccagc gacagccgtt cggcgttcgc  28800
cagtaccggg ttggactcga tgagggcgag gcgcgcggcc tggccgtcgc cggctgcggg  28860
tgcggtttcg gtccagccgc cggcagggac agcgccgaac agcttgcttg catgcaggcc  28920
ggtagcaaag tccttgagcg tgtaggacgc attgccctgg gggtccaggt cgatcacggc  28980
aacccgcaag ccgcgctcga aaaagtcgaa ggcaagatgc acaagggtcg aagtcttgcc  29040
gacgccgcct ttctggttgg ccgtgaccaa agttttcatc gtttggtttc ctgttttttc  29100
ttggcgtccg cttcccactt ccggacgatg tacgcctgat gttccggcag aaccgccgtt  29160
acccgcgcgt acccctcggg caagttcttg tcctcgaacg cggcccacac gcgatgcacc  29220
gcttgcgaca ctgcgcccct ggtcagtccc agcgacgttg cgaacgtcgc ctgtggcttc  29280
ccatcgacta agacgccccg cgctatctcg atggtctgct gccccacttc cagcccctgg  29340
atcgcctcct ggaactggct ttcggtaagc cgtttcttca tggataacac ccataatttg  29400
ctccgcgcct tggttgaaca tagcggtgac agccgccagc acatgagaga agtttagcta  29460
aacatttctc gcacgtcaac acctttagcc gctaaaactc gtccttggcg taacaaaaca  29520
aaagcccgga aaccgggctt tcgtctcttg ccgcttatgg ctctgcaccc ggctccatca  29580
ccaacaggtc gcgcacgcgc ttcactcggt tgcggatcga cactgccagc ccaacaaagc  29640
cggttgccgc cgccgccagg atcgcgccga tgatgccggc cacaccggcc atcgcccacc  29700
aggtcgccgc cttccggttc cattcctgct ggtactgctt cgcaatgctg gacctcggct  29760
caccataggc tgaccgctcg atggcgtatg ccgcttctcc ccttggcgta aaacccagcg  29820
ccgcaggcgg cattgccatg ctgcccgccg ctttcccgac cacgacgcgc gcaccaggct  29880
tgcggtccag accttcggcc acggcgagct gcgcaaggac ataatcagcc gccgacttgg  29940
ctccacgcgc ctcgatcagc tcttgcactc gcgcgaaatc cttggcctcc acggccgcca  30000
tgaatcgcgc acgcggcgaa ggctccgcag ggccggcgtc gtgatcgccg ccgagaatgc  30060
ccttcaccaa gttcgacgac acgaaaatca tgctgacggc tatcaccatc atgcagacgg  30120
atcgcacgaa cccgctgaat tgaacacgag cacggcaccc gcgaccacta tgccaagaat  30180
gcccaaggta aaaattgccg gccccgccat gaagtccgtg aatgccccga cggccgaagt  30240
gaagggcagg ccgccaccca ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt  30300
cgatgccagc acctgcggca cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca  30360
tcccgttact gccccgatcc cggcaatggc aaggactgcc agcgctgcca tttttggggt  30420
gaggccgttc gcggccgagg ggcgcagccc ctggggggat gggaggcccg cgttagcggg  30480
ccgggagggt tcgagaaggg ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg  30540
cgcagccctg gttaaaaaca aggtttataa atattggttt aaaagcaggt taaaagacag  30600
gttagcggtg gccgaaaaac gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg  30660
acagcccctc aaatgtcaat aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg  30720
tcaaggatcg cgcccctcat ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg  30780
cacttatccc caggcttgtc cacatcatct gtgggaaact cgcgtaaaat caggcgtttt  30840
cgccgatttg cgaggctggc cagctccacg tcgccggccg aaatcgagcc tgcccctcat  30900
ctgtcaacgc cgcgccgggt gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt  30960
cagtgagggc caagttttcc gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac  31020
acggcttcga cggcgtttct ggcgcgtttg cagggccata gacggccgcc agcccagcgg  31080
cgagggcaac cagcccggtg agcgtcggaa aggcgctgga agccccgtag cgacgcggag  31140
aggggcgaga caagccaagg gcgcaggctc gatgcgcagc acgacatagc cggttctcgc  31200
aaggacgaga atttccctgc ggtgcccctc aagtgtcaat gaaagtttcc aacgcgagcc  31260
attcgcgaga gccttgagtc cacgctagat gagagctttg ttgtaggtgg accagttggt  31320
gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg  31380
atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct  31440
ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta  31500
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgac  31560
tctagagctc gttcctcgag gaacggtacc tgcggggaag cttacaataa tgtgtgttgt  31620
taagtcttgt tgcctgtcat cgtctgactg actttcgtca taaatcccgg cctccgtaac  31680
ccagctttgg gcaagctcac ggatttgatc cggcggaacg ggaatatcga gatgccgggc  31740
tgaacgctgc agttccagct ttccctttcg ggacaggtac tccagctgat tgattatctg  31800
ctgaagggtc ttggttccac ctcctggcac aatgcgaatg attacttgag cgcgatcggg  31860
catccaattt tctcccgtca ggtgcgtggt caagtgctac aaggcacctt tcagtaacga  31920
gcgaccgtcg atccgtcgcc gggatacgga caaaatggag cgcagtagtc catcgagggc  31980
ggcgaaagcc tcgccaaaag caatacgttc atctcgcaca gcctccagat ccgatcgagg  32040
gtcttcggcg taggcagata gaagcatgga tacattgctt gagagtattc cgatggactg  32100
aagtatggct tccatctttt ctcgtgtgtc tgcatctatt tcgagaaagc ccccgatgcg  32160
gcgcaccgca acgcgaattg ccatactatc cgaaagtccc agcaggcgcg cttgatagga  32220
aaaggtttca tactcggccg atcgcagacg ggcactcacg accttgaacc cttcaacttt  32280
cagggatcga tgctggttga tggtagtctc actcgacgtg gctctggtgt gttttgacat  32340
agcttcctcc aaagaaagcg gaaggtctgg atactccagc acgaaatgtg cccgggtaga  32400
cggatggaag tctagccctg ctcaatatga aatcaacagt acatttacag tcaatactga  32460
atatacttgc tacatttgca attgtcttat aacgaatgtg aaataaaaat agtgtaacaa  32520
cgcttttact catcgataat cacaaaaaca tttatacgaa caaaaataca aatgcactcc  32580
ggtttcacag gataggcggg atcagaatat gcaacttttg acgttttgtt ctttcaaagg  32640
gggtgctggc aaaaccaccg cactcatggg cctttgcgct gctttggcaa atgacggtaa  32700
acgagtggcc ctctttgatg ccgacgaaaa ccggcctctg acgcgatgga gagaaaacgc  32760
cttacaaagc agtactggga tcctcgctgt gaagtctatt ccgccgacga aatgcccctt  32820
cttgaagcag cctatgaaaa tgccgagctc gaaggatttg attatgcgtt ggccgatacg  32880
cgtggcggct cgagcgagct caacaacaca atcatcgcta gctcaaacct gcttctgatc  32940
cccaccatgc taacgccgct cgacatcgat gaggcactat ctacctaccg ctacgtcatc  33000
gagctgctgt tgagtgaaaa tttggcaatt cctacagctg ttttgcgcca acgcgtcccg  33060
gtcggccgat tgacaacatc gcaacgcagg atgtcagaga cgctagagag ccttccagtt  33120
gtaccgtctc ccatgcatga aagagatgca tttgccgcga tgaaagaacg cggcatgttg  33180
catcttacat tactaaacac gggaactgat ccgacgatgc gcctcataga gaggaatctt  33240
cggattgcga tggaggaagt cgtggtcatt tcgaaactga tcagcaaaat cttggaggct  33300
tgaagatggc aattcgcaag cccgcattgt cggtcggcga agcacggcgg cttgctggtg  33360
ctcgacccga gatccaccat cccaacccga cacttgttcc ccagaagctg gacctccagc  33420
acttgcctga aaaagccgac gagaaagacc agcaacgtga gcctctcgtc gccgatcaca  33480
tttacagtcc cgatcgacaa cttaagctaa ctgtggatgc ccttagtcca cctccgtccc  33540
cgaaaaagct ccaggttttt ctttcagcgc gaccgcccgc gcctcaagtg tcgaaaacat  33600
atgacaacct cgttcggcaa tacagtccct cgaagtcgct acaaatgatt ttaaggcgcg  33660
cgttggacga tttcgaaagc atgctggcag atggatcatt tcgcgtggcc ccgaaaagtt  33720
atccgatccc ttcaactaca gaaaaatccg ttctcgttca gacctcacgc atgttcccgg  33780
ttgcgttgct cgaggtcgct cgaagtcatt ttgatccgtt ggggttggag accgctcgag  33840
ctttcggcca caagctggct accgccgcgc tcgcgtcatt ctttgctgga gagaagccat  33900
cgagcaattg gtgaagaggg acctatcgga acccctcacc aaatattgag tgtaggtttg  33960
aggccgctgg ccgcgtcctc agtcaccttt tgagccagat aattaagagc caaatgcaat  34020
tggctcaggc tgccatcgtc cccccgtgcg aaacctgcac gtccgcgtca aagaaataac  34080
cggcacctct tgctgttttt atcagttgag ggcttgacgg atccgcctca agtttgcggc  34140
gcagccgcaa aatgagaaca tctatactcc tgtcgtaaac ctcctcgtcg cgtactcgac  34200
tggcaatgag aagttgctcg cgcgatagaa cgtcgcgggg tttctctaaa aacgcgagga  34260
gaagattgaa ctcacctgcc gtaagtttca cctcaccgcc agcttcggac atcaagcgac  34320
gttgcctgag attaagtgtc cagtcagtaa aacaaaaaga ccgtcggtct ttggagcgga  34380
caacgttggg gcgcacgcgc aaggcaaccc gaatgcgtgc aagaaactct ctcgtactaa  34440
acggcttagc gataaaatca cttgctccta gctcgagtgc aacaacttta tccgtctcct  34500
caaggcggtc gccactgata attatgattg gaatatcaga ctttgccgcc agatttcgaa  34560
cgatctcaag cccatcttca cgacctaaat ttagatcaac aaccacgaca tcgaccgtcg  34620
cggaagagag tactctagtg aactgggtgc tgtcggctac cgcggtcact ttgaaggcgt  34680
ggatcgtaag gtattcgata ataagatgcc gcatagcgac atcgtcatcg ataagaagaa  34740
cgtgtttcaa cggctcacct ttcaatctaa aatctgaacc cttgttcaca gcgcttgaga  34800
aattttcacg tgaaggatgt acaatcatct ccagctaaat gggcagttcg tcagaattgc  34860
ggctgaccgc ggatgacgaa aatgcgaacc aagtatttca attttatgac aaaagttctc  34920
aatcgttgtt acaagtgaaa cgcttcgagg ttacagctac tattgattaa ggagatcgcc  34980
tatggtctcg ccccggcgtc gtgcgtccgc cgcgagccag atctcgccta cttcataaac  35040
gtcctcatag gcacggaatg gaatgatgac atcgatcgcc gtagagagca tgtcaatcag  35100
tgtgcgatct tccaagctag caccttgggc gctacttttg acaagggaaa acagtttctt  35160
gaatccttgg attggattcg cgccgtgtat tgttgaaatc gatcccggat gtcccgagac  35220
gacttcactc agataagccc atgctgcatc gtcgcgcatc tcgccaagca atatccggtc  35280
cggccgcata cgcagacttg cttggagcaa gtgctcggcg ctcacagcac ccagcccagc  35340
accgttcttg gagtagagta gtctaacatg attatcgtgt ggaatgacga gttcgagcgt  35400
atcttctatg gtgattagcc tttcctgggg ggggatggcg ctgatcaagg tcttgctcat  35460
tgttgtcttg ccgcttccgg tagggccaca tagcaacatc gtcagtcggc tgacgacgca  35520
tgcgtgcaga aacgcttcca aatccccgtt gtcaaaatgc tgaaggatag cttcatcatc  35580
ctgattttgg cgtttccttc gtgtctgcca ctggttccac ctcgaagcat cataacggga  35640
ggagacttct ttaagaccag aaacacgcga gcttggccgt cgaatggtca agctgacggt  35700
gcccgaggga acggtcggcg gcagacagat ttgtagtcgt tcaccaccag gaagttcagt  35760
ggcgcagagg gggttacgtg gtccgacatc ctgctttctc agcgcgcccg ctaaaatagc  35820
gatatcttca agatcatcat aagagacggg caaaggcatc ttggtaaaaa tgccggcttg  35880
gcgcacaaat gcctctccag gtcgattgat cgcaatttct tcagtcttcg ggtcatcgag  35940
ccattccaaa atcggcttca gaagaaagcg tagttgcgga tccacttcca tttacaatgt  36000
atcctatctc taagcggaaa tttgaattca ttaagagcgg cggttcctcc cccgcgtggc  36060
gccgccagtc aggcggagct ggtaaacacc aaagaaatcg aggtcccgtg ctacgaaaat  36120
ggaaacggtg tcaccctgat tcttcttcag ggttggcggt atgttgatgg ttgccttaag  36180
ggctgtctca gttgtctgct caccgttatt ttgaaagctg ttgaagctca tcccgccacc  36240
cgagctgccg gcgtaggtgc tagctgcctg gaaggcgcct tgaacaacac tcaagagcat  36300
agctccgcta aaacgctgcc agaagtggct gtcgaccgag cccggcaatc ctgagcgacc  36360
gagttcgtcc gcgcttggcg atgttaacga gatcatcgca tggtcaggtg tctcggcgcg  36420
atcccacaac acaaaaacgc gcccatctcc ctgttgcaag ccacgctgta tttcgccaac  36480
aacggtggtg ccacgatcaa gaagcacgat attgttcgtt gttccacgaa tatcctgagg  36540
caagacacac tttacatagc ctgccaaatt tgtgtcgatt gcggtttgca agatgcacgg  36600
aattattgtc ccttgcgtta ccataaaatc ggggtgcggc aagagcgtgg cgctgctggg  36660
ctgcagctcg gtgggtttca tacgtatcga caaatcgttc tcgccggaca cttcgccatt  36720
cggcaaggag ttgtcgtcac gcttgccttc ttgtcttcgg cccgtgtcgc cctgaatggc  36780
gcgtttgctg accccttgat cgccgctgct atatgcaaaa atcggtgttt cttccggccg  36840
tggctcatgc cgctccggtt cgcccctcgg cggtagagga gcagcaggct gaacagcctc  36900
ttgaaccgct ggaggatccg gcggcacctc aatcggagct ggatgaaatg gcttggtgtt  36960
tgttgcgatc aaagttgacg gcgatgcgtt ctcattcacc ttcttttggc gcccacctag  37020
ccaaatgagg cttaatgata acgcgagaac gacacctccg acgatcaatt tctgagaccc  37080
cgaaagacgc cggcgatgtt tgtcggagac cagggatcca gatgcatcaa cctcatgtgc  37140
cgcttgctga ctatcgttat tcatcccttc gcccccttca ggacgcgttt cacatcgggc  37200
ctcaccgtgc ccgtttgcgg cctttggcca acgggatcgt aagcggtgtt ccagatacat  37260
agtactgtgt ggccatccct cagacgccaa cctcgggaaa ccgaagaaat ctcgacatcg  37320
ctccctttaa ctgaatagtt ggcaacagct tccttgccat caggattgat ggtgtagatg  37380
gagggtatgc gtacattgcc cggaaagtgg aataccgtcg taaatccatt gtcgaagact  37440
tcgagtggca acagcgaacg atcgccttgg gcgacgtagt gccaattact gtccgccgca  37500
ccaagggctg tgacaggctg atccaataaa ttctcagctt tccgttgata ttgtgcttcc  37560
gcgtgtagtc tgtccacaac agccttctgt tgtgcctccc ttcgccgagc cgccgcatcg  37620
tcggcggggt aggcgaattg gacgctgtaa tagagatcgg gctgctcttt atcgaggtgg  37680
gacagagtct tggaacttat actgaaaaca taacggcgca tcccggagtc gcttgcggtt  37740
agcacgatta ctggctgagg cgtgaggacc tggcttgcct tgaaaaatag ataatttccc  37800
cgcggtaggg ctgctagatc tttgctattt gaaacggcaa ccgctgtcac cgtttcgttc  37860
gtggcgaatg ttacgaccaa agtagctcca accgccgtcg agaggcgcac cacttgatcg  37920
ggattgtaag ccaaataacg catgcgcgga tctagcttgc ccgccattgg agtgtcttca  37980
gcctccgcac cagtcgcagc ggcaaataaa catgctaaaa tgaaaagtgc ttttctgatc  38040
atggttcgct gtggcctacg tttgaaacgg tatcttccga tgtctgatag gaggtgacaa  38100
ccagacctgc cgggttggtt agtctcaatc tgccgggcaa gctggtcacc ttttcgtagc  38160
gaactgtcgc ggtccacgta ctcaccacag gcattttgcc gtcaacgacg agggtccttt  38220
tatagcgaat ttgctgcgtg cttggagtta catcatttga agcgatgtgc tcgacctcca  38280
ccctgccgcg tttgccaaga atgacttgag gcgaactggg attgggatag ttgaagaatt  38340
gctggtaatc ctggcgcact gttggggcac tgaagttcga taccaggtcg taggcgtact  38400
gagcggtgtc ggcatcataa ctctcgcgca ggcgaacgta ctcccacaat gaggcgttaa  38460
cgacggcctc ctcttgagtt gcaggcaatc gcgagacaga cacctcgctg tcaacggtgc  38520
cgtccggccg tatccataga tatacgggca caagcctgct caacggcacc attgtggcta  38580
tagcgaacgc ttgagcaaca tttcccaaaa tcgcgatagc tgcgacagct gcaatgagtt  38640
tggagagacg tcgcgccgat ttcgctcgcg cggtttgaaa ggcttctact tccttatagt  38700
gctcggcaag gctttcgcgc gccactagca tggcatattc aggccccgtc atagcgtcca  38760
cccgaattgc cgagctgaag atctgacgga gtaggctgcc atcgccccac attcagcggg  38820
aagatcgggc ctttgcagct cgctaatgtg tcgtttgtct ggcagccgct caaagcgaca  38880
actaggcaca gcaggcaata cttcatagaa ttctccattg aggcgaattt ttgcgcgacc  38940
tagcctcgct caacctgagc gaagcgacgg tacaagctgc tggcagattg ggttgcgccg  39000
ctccagtaac tgcctccaat gttgccggcg atcgccggca aagcgacaat gagcgcatcc  39060
cctgtcagaa aaaacatatc gagttcgtaa agaccaatga tcttggccgc ggtcgtaccg  39120
gcgaaggtga ttacaccaag cataagggtg agcgcagtcg cttcggttag gatgacgatc  39180
gttgccacga ggtttaagag gagaagcaag agaccgtagg tgataagttg cccgatccac  39240
ttagctgcga tgtcccgcgt gcgatcaaaa atatatccga cgaggatcag aggcccgatc  39300
gcgagaagca ctttcgtgag aattccaacg gcgtcgtaaa ctccgaaggc agaccagagc  39360
gtgccgtaaa ggacccactg tgccccttgg aaagcaagga tgtcctggtc gttcatcgga  39420
ccgatttcgg atgcgatttt ctgaaaaacg gcctgggtca cggcgaacat tgtatccaac  39480
tgtgccggaa cagtctgcag aggcaagccg gttacactaa actgctgaac aaagtttggg  39540
accgtctttt cgaagatgga aaccacatag tcttggtagt tagcctgccc aacaattaga  39600
gcaacaacga tggtgaccgt gatcacccga gtgataccgc tacgggtatc gacttcgccg  39660
cgtatgacta aaataccctg aacaataatc caaagagtga cacaggcgat caatggcgca  39720
ctcaccgcct cctggatagt ctcaagcatc gagtccaagc ctgtcgtgaa ggctacatcg  39780
aagatcgtat gaatggccgt aaacggcgcc ggaatcgtga aattcatcga ttggacctga  39840
acttgactgg tttgtcgcat aatgttggat aaaatgagct cgcattcggc gaggatgcgg  39900
gcggatgaac aaatcgccca gccttagggg agggcaccaa agatgacagc ggtcttttga  39960
tgctccttgc gttgagcggc cgcctcttcc gcctcgtgaa ggccggcctg cgcggtagtc  40020
atcgttaata ggcttgtcgc ctgtacattt tgaatcattg cgtcatggat ctgcttgaga  40080
agcaaaccat tggtcacggt tgcctgcatg atattgcgag atcgggaaag ctgagcagac  40140
gtatcagcat tcgccgtcaa gcgtttgtcc atcgtttcca gattgtcagc cgcaatgcca  40200
gcgctgtttg cggaaccggt gatctgcgat cgcaacaggt ccgcttcagc atcactaccc  40260
acgactgcac gatctgtatc gctggtgatc gcacgtgccg tggtcgacat tggcattcgc  40320
ggcgaaaaca tttcattgtc taggtccttc gtcgaaggat actgattttt ctggttgagc  40380
gaagtcagta gtccagtaac gccgtaggcc gacgtcaaca tcgtaaccat cgctatagtc  40440
tgagtgagat tctccgcagt cgcgagcgca gtcgcgagcg tctcagcctc cgttgccggg  40500
tcgctaacaa caaactgcgc ccgcgcgggc tgaatatata gaaagctgca ggtcaaaact  40560
gttgcaataa gttgcgtcgt cttcatcgtt tcctacctta tcaatcttct gcctcgtggt  40620
gacgggccat gaattcgctg agccagccag atgagttgcc ttcttgtgcc tcgcgtagtc  40680
gagttgcaaa gcgcaccgtg ttggcacgcc ccgaaagcac ggcgacatat tcacgcatat  40740
cccgcagatc aaattcgcag atgacgcttc cactttctcg tttaagaaga aacttacggc  40800
tgccgaccgt catgtcttca cggatcgcct gaaattcctt ttcggtacat ttcagtccat  40860
cgacataagc cgatcgatct gcggttggtg atggatagaa aatcttcgtc atacattgcg  40920
caaccaagct ggctcctagc ggcgattcca gaacatgctc tggttgctgc gttgccagta  40980
ttagcatccc gttgtttttt cgaacggtca ggaggaattt gtcgacgaca gtcgaaaatt  41040
tagggtttaa caaataggcg cgaaactcat cgcagctcat cacaaaacgg cggccgtcga  41100
tcatggctcc aatccgatgc aggagatatg ctgcagcggg agcgcatact tcctcgtatt  41160
cgagaagatg cgtcatgtcg aagccggtaa tcgacggatc taactttact tcgtcaactt  41220
cgccgtcaaa tgcccagcca agcgcatggc cccggcacca gcgttggagc cgcgctcctg  41280
cgccttcggc gggcccatgc aacaaaaatt cacgtaaccc cgcgattgaa cgcatttgtg  41340
gatcaaacga gagctgacga tggataccac ggaccagacg gcggttctct tccggagaaa  41400
tcccaccccg accatcactc tcgatgagag ccacgatcca ttcgcgcaga aaatcgtgtg  41460
aggctgctgt gttttctagg ccacgcaacg gcgccaaccc gctgggtgtg cctctgtgaa  41520
gtgccaaata tgttcctcct gtggcgcgaa ccagcaattc gccaccccgg tccttgtcaa  41580
agaacacgac cgtacctgca cggtcgacca tgctctgttc gagcatggct agaacaaaca  41640
tcatgagcgt cgtcttaccc ctcccgatag gcccgaatat tgccgtcatg ccaacatcgt  41700
gctcatgcgg gatatagtcg aaaggcgttc cgccattggt acgaaatcgg gcaatcgcgt  41760
tgccccagtg gcctgagctg gcgccctctg gaaagttttc gaaagagaca aaccctgcga  41820
aattgcgtga agtgattgcg ccagggcgtg tgcgccactt aaaattcccc ggcaattggg  41880
accaataggc cgcttccata ccaatacctt cttggacaac cacggcacct gcatccgcca  41940
ttcgtgtccg agcccgcgcg cccctgtccc caagactatt gagatcgtct gcatagacgc  42000
aaaggctcaa atgatgtgag cccataacga attcgttgct cgcaagtgcg tcctcagcct  42060
cggataattt gccgatttga gtcacggctt tatcgccgga actcagcatc tggctcgatt  42120
tgaggctaag tttcgcgtgc gcttgcgggc gagtcaggaa cgaaaaactc tgcgtgagaa  42180
caagtggaaa atcgagggat agcagcgcgt tgagcatgcc cggccgtgtt tttgcagggt  42240
attcgcgaaa cgaatagatg gatccaacgt aactgtcttt tggcgttctg atctcgagtc  42300
ctcgcttgcc gcaaatgact ctgtcggtat aaatcgaagc gccgagtgag ccgctgacga  42360
ccggaaccgg tgtgaaccga ccagtcatga tcaaccgtag cgcttcgcca atttcggtga  42420
agagcacacc ctgcttctcg cggatgccaa gacgatgcag gccatacgct ttaagagagc  42480
cagcgacaac atgccaaaga tcttccatgt tcctgatctg gcccgtgaga tcgttttccc  42540
tttttccgct tagcttggtg aacctcctct ttaccttccc taaagccgcc tgtgggtaga  42600
caatcaacgt aaggaagtgt tcattgcgga ggagttggcc ggagagcacg cgctgttcaa  42660
aagcttcgtt caggctagcg gcgaaaacac tacggaagtg tcgcggcgcc gatgatggca  42720
cgtcggcatg acgtacgagg tgagcatata ttgacacatg atcatcagcg atattgcgca  42780
acagcgtgtt gaacgcacga caacgcgcat tgcgcatttc agtttcctca agctcgaatg  42840
caacgccatc aattctcgca atggtcatga tcgatccgtc ttcaagaagg acgatatggt  42900
cgctgaggtg gccaatataa gggagataga tctcaccgga tctttcggtc gttccactcg  42960
cgccgagcat cacaccattc ctctccctcg tgggggaacc ctaattggat ttgggctaac  43020
agtagcgccc ccccaaactg cactatcaat gcttcttccc gcggtccgca aaaatagcag  43080
gacgacgctc gccgcattgt agtctcgctc cacgatgagc cgggctgcaa accataacgg  43140
cacgagaacg acttcgtaga gcgggttctg aacgataacg atgacaaagc cggcgaacat  43200
catgaataac cctgccaatg tcagtggcac cccaagaaac aatgcgggcc gtgtggctgc  43260
gaggtaaagg gtcgattctt ccaaacgatc agccatcaac taccgccagt gagcgtttgg  43320
ccgaggaagc tcgccccaaa catgataaca atgccgccga cgacgccggc aaccagccca  43380
agcgaagccc gcccgaacat ccaggagatc ccgatagcga caatgccgag aacagcgagt  43440
gactggccga acggaccaag gataaacgtg catatattgt taaccattgt ggcggggtca  43500
gtgccgccac ccgcagattg cgctgcggcg ggtccggatg aggaaatgct ccatgcaatt  43560
gcaccgcaca agcttggggc gcagctcgat atcacgcgca tcatcgcatt cgagagcgag  43620
aggcgattta gatgtaaacg gtatctctca aagcatcgca tcaatgcgca cctccttagt  43680
ataagtcgaa taagacttga ttgtcgtctg cggatttgcc gttgtcctgg tgtggcggtg  43740
gcggagcgat taaaccgcca gcgccatcct cctgcgagcg gcgctgatat gacccccaaa  43800
catcccacgt ctcttcggat tttagcgcct cgtgatcgtc ttttggaggc tcgattaacg  43860
cgggcaccag cgattgagca gctgtttcaa cttttcgcac gtagccgttt gcaaaaccgc  43920
cgatgaaatt accggtgttg taagcggaga tcgcccgacg aagcgcaaat tgcttctcgt  43980
caatcgtttc gccgcctgca taacgacttt tcagcatgtt tgcagcggca gataatgatg  44040
tgcacgcctg gagcgcaccg tcaggtgtca gaccgagcat agaaaaattt cgagagttta  44100
tttgcatgag gccaacatcc agcgaatgcc gtgcatcgag acggtgcctg acgacttggg  44160
ttgcttggct gtgatcttgc cagtgaagcg tttcgccggt cgtgttgtca tgaatcgcta  44220
aaggatcaaa gcgactctcc accttagcta tcgccgcaag cgtagatgtc gcaactgatg  44280
gggcacactt gcgagcaaca tggtcaaact cagcagatga gagtggcgtg gcaaggctcg  44340
acgaacagaa ggagaccatc aaggcaagag aaagcgaccc cgatctctta agcatacctt  44400
atctccttag ctcgcaacta acaccgcctc tcccgttgga agaagtgcgt tgttttatgt  44460
tgaagattat cgggagggtc ggttactcga aaattttcaa ttgcttcttt atgatttcaa  44520
ttgaagcgag aaacctcgcc cggcgtcttg gaacgcaaca tggaccgaga accgcgcatc  44580
catgactaag caaccggatc gacctattca ggccgcagtt ggtcaggtca ggctcagaac  44640
gaaaatgctc ggcgaggtta cgctgtctgt aaacccattc gatgaacggg aagcttcctt  44700
ccgattgctc ttggcaggaa tattggccca tgcctgcttg cgctttgcaa atgctcttat  44760
cgcgttggta tcatatgcct tgtccgccag cagaaacgca ctctaagcga ttatttgtaa  44820
aaatgtttcg gtcatgcggc ggtcatgggc ttgacccgct gtcagcgcaa gacggatcgg  44880
tcaaccgtcg gcatcgacaa cagcgtgaat cttggtggtc aaaccgccac gggaacgtcc  44940
catacagcca tcgtcttgat cccgctgttt cccgtcgccg catgttggtg gacgcggaca  45000
caggaactgt caatcatgac gacattctat cgaaagcctt ggaaatcaca ctcagaatat  45060
gatcccagac gtctgcctca cgccatcgta caaagcgatt gtagcaggtt gtacaggaac  45120
cgtatcgatc aggaacgtct gcccagggcg ggcccgtccg gaagcgccac aagatgacat  45180
tgatcacccg cgtcaacgcg cggcacgcga cgcggcttat ttgggaacaa aggactgaac  45240
aacagtccat tcgaaatcgg tgacatcaaa gcggggacgg gttatcagtg gcctccaagt  45300
caagcctcaa tgaatcaaaa tcagaccgat ttgcaaacct gatttatgag tgtgcggcct  45360
aaatgatgaa atcgtccttc tagatcgcct ccgtggtgta gcaacacctc gcagtatcgc  45420
cgtgctgacc ttggccaggg aattgactgg caagggtgct ttcacatgac cgctcttttg  45480
gccgcgatag atgatttcgt tgctgctttg ggcacgtaga aggagagaag tcatatcgga  45540
gaaattcctc ctggcgcgag agcctgctct atcgcgacgg catcccactg tcgggaacag  45600
accggatcat tcacgaggcg aaagtcgtca acacatgcgt tataggcatc ttcccttgaa  45660
ggatgatctt gttgctgcca atctggaggt gcggcagccg caggcagatg cgatctcagc  45720
gcaacttgcg gcaaaacatc tcactcacct gaaaaccact agcgagtctc gcgatcagac  45780
gaaggccttt tacttaacga cacaatatcc gatgtctgca tcacaggcgt cgctatccca  45840
gtcaatacta aagcggtgca ggaactaaag attactgatg acttaggcgt gccacgaggc  45900
ctgagacgac gcgcgtagac agttttttga aatcattatc aaagtgatgg cctccgctga  45960
agcctatcac ctctgcgccg gtctgtcgga gagatgggca agcattatta cggtcttcgc  46020
gcccgtacat gcattggacg attgcagggt caatggatct gagatcatcc agaggattgc  46080
cgcccttacc ttccgtttcg agttggagcc agcccctaaa tgagacgaca tagtcgactt  46140
gatgtgacaa tgccaagaga gagatttgct taacccgatt tttttgctca agcgtaagcc  46200
tattgaagct tgccggcatg acgtccgcgc cgaaagaata tcctacaagt aaaacattct  46260
gcacaccgaa atgcttggtg tagacatcga ttatgtgacc aagatcctta gcagtttcgc  46320
ttggggaccg ctccgaccag aaataccgaa gtgaactgac gccaatgaca ggaatccctt  46380
ccgtctgcag ataggtacca tcgatagatc tgctgcctcg cgcgtttcgg tgatgacggt  46440
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc  46500
gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc  46560
atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg gcatcagagc  46620
agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa  46680
aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc  46740
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag  46800
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa  46860
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc  46920
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc  46980
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg  47040
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt  47100
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc  47160
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc  47220
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag  47280
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg  47340
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa  47400
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag  47460
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact  47520
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa  47580
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt  47640
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag  47700
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca  47760
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc  47820
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt  47880
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg  47940
ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca ttccacggac  48000
aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac ctgtcgtttc  48060
ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga agaacggaaa  48120
cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc gccccgtagt  48180
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc  48240
gtggaggcca tcaaaccacg tcaaataatc aattatgacg caggtatcgt attaattgat  48300
ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa atcagcgaca ctgaatacgg  48360
ggcaacctca tgtccccccc cccccccccc ctgcaggcat cgtggtgtca cgctcgtcgt  48420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca  48480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 48540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 48600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 48660
tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg ccacatagca 48720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 48780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 48840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 48900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 48960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 49020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 49080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtcttc 49140
aagaattggt cgacgatctt gctgcgttcg gatattttcg tggagttccc gccacagacc 49200
cggattgaag gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc 49260
gtgatgactg gccaggacgt cggccgaaag agcgacaagc agatcacgct tttcgacagc 49320
gtcggatttg cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga 49380
tcaagccaca gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt 49440
ggaatgctgc tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc 49500
gtacggaatg ccaagcactc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga 49560
cgaacggata aaccttttca cgccctttta aatatccgtt attctaataa acgctctttt 49620
ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg 49680
aaacgacaat ctgatcatga gcggagaatt aagggagtca cgttatgacc cccgccgatg 49740
acgcgggaca agccgtttta cgtttggaac tgacagaacc gcaacgttga aggagccact 49800
cagcaagctg gtacgattgt aatacgactc actatagggc gaattgagcg ctgtttaaac 49860
gctcttcaac tggaagagcg gttacccgga ccgaagcttg catgcctgca g          49911
<210>7
<211>36909
<212>DNA
<213>人工序列
<220>
<223>PHP10523构建体
<400>7
tctagagctc gttcctcgag gcctcgaggc ctcgaggaac ggtacctgcg gggaagctta     60
caataatgtg tgttgttaag tcttgttgcc tgtcatcgtc tgactgactt tcgtcataaa    120
tcccggcctc cgtaacccag ctttgggcaa gctcacggat ttgatccggc ggaacgggaa    180
tatcgagatg ccgggctgaa cgctgcagtt ccagctttcc ctttcgggac aggtactcca    240
gctgattgat tatctgctga agggtcttgg ttccacctcc tggcacaatg cgaatgatta    300
cttgagcgcg atcgggcatc caattttctc ccgtcaggtg cgtggtcaag tgctacaagg    360
cacctttcag taacgagcga ccgtcgatcc gtcgccggga tacggacaaa atggagcgca    420
gtagtccatc gagggcggcg aaagcctcgc caaaagcaat acgttcatct cgcacagcct    480
ccagatccga tcgagggtct tcggcgtagg cagatagaag catggataca ttgcttgaga    540
gtattccgat ggactgaagt atggcttcca tcttttctcg tgtgtctgca tctatttcga    600
gaaagccccc gatgcggcgc accgcaacgc gaattgccat actatccgaa agtcccagca    660
ggcgcgcttg ataggaaaag gtttcatact cggccgatcg cagacgggca ctcacgacct    720
tgaacccttc aactttcagg gatcgatgct ggttgatggt agtctcactc gacgtggctc    780
tggtgtgttt tgacatagct tcctccaaag aaagcggaag gtctggatac tccagcacga    840
aatgtgcccg ggtagacgga tggaagtcta gccctgctca atatgaaatc aacagtacat    900
ttacagtcaa tactgaatat acttgctaca tttgcaattg tcttataacg aatgtgaaat    960
aaaaatagtg taacaacgct tttactcatc gataatcaca aaaacattta tacgaacaaa   1020
aatacaaatg cactccggtt tcacaggata ggcgggatca gaatatgcaa cttttgacgt   1080
tttgttcttt caaagggggt gctggcaaaa ccaccgcact catgggcctt tgcgctgctt   1140
tggcaaatga cggtaaacga gtggccctct ttgatgccga cgaaaaccgg cctctgacgc   1200
gatggagaga aaacgcctta caaagcagta ctgggatcct cgctgtgaag tctattccgc   1260
cgacgaaatg ccccttcttg aagcagccta tgaaaatgcc gagctcgaag gatttgatta   1320
tgcgttggcc gatacgcgtg gcggctcgag cgagctcaac aacacaatca tcgctagctc   1380
aaacctgctt ctgatcccca ccatgctaac gccgctcgac atcgatgagg cactatctac   1440
ctaccgctac gtcatcgagc tgctgttgag tgaaaatttg gcaattccta cagctgtttt   1500
gcgccaacgc gtcccggtcg gccgattgac aacatcgcaa cgcaggatgt cagagacgct   1560
agagagcctt ccagttgtac cgtctcccat gcatgaaaga gatgcatttg ccgcgatgaa   1620
agaacgcggc atgttgcatc ttacattact aaacacggga actgatccga cgatgcgcct   1680
catagagagg aatcttcgga ttgcgatgga ggaagtcgtg gtcatttcga aactgatcag   1740
caaaatcttg gaggcttgaa gatggcaatt cgcaagcccg cattgtcggt cggcgaagca    1800
cggcggcttg ctggtgctcg acccgagatc caccatccca acccgacact tgttccccag    1860
aagctggacc tccagcactt gcctgaaaaa gccgacgaga aagaccagca acgtgagcct    1920
ctcgtcgccg atcacattta cagtcccgat cgacaactta agctaactgt ggatgccctt    1980
agtccacctc cgtccccgaa aaagctccag gtttttcttt cagcgcgacc gcccgcgcct    2040
caagtgtcga aaacatatga caacctcgtt cggcaataca gtccctcgaa gtcgctacaa    2100
atgattttaa ggcgcgcgtt ggacgatttc gaaagcatgc tggcagatgg atcatttcgc    2160
gtggccccga aaagttatcc gatcccttca actacagaaa aatccgttct cgttcagacc    2220
tcacgcatgt tcccggttgc gttgctcgag gtcgctcgaa gtcattttga tccgttgggg    2280
ttggagaccg ctcgagcttt cggccacaag ctggctaccg ccgcgctcgc gtcattcttt    2340
gctggagaga agccatcgag caattggtga agagggacct atcggaaccc ctcaccaaat    2400
attgagtgta ggtttgaggc cgctggccgc gtcctcagtc accttttgag ccagataatt    2460
aagagccaaa tgcaattggc tcaggctgcc atcgtccccc cgtgcgaaac ctgcacgtcc    2520
gcgtcaaaga aataaccggc acctcttgct gtttttatca gttgagggct tgacggatcc    2580
gcctcaagtt tgcggcgcag ccgcaaaatg agaacatcta tactcctgtc gtaaacctcc    2640
tcgtcgcgta ctcgactggc aatgagaagt tgctcgcgcg atagaacgtc gcggggtttc    2700
tctaaaaacg cgaggagaag attgaactca cctgccgtaa gtttcacctc accgccagct    2760
tcggacatca agcgacgttg cctgagatta agtgtccagt cagtaaaaca aaaagaccgt    2820
cggtctttgg agcggacaac gttggggcgc acgcgcaagg caacccgaat gcgtgcaaga    2880
aactctctcg tactaaacgg cttagcgata aaatcacttg ctcctagctc gagtgcaaca    2940
actttatccg tctcctcaag gcggtcgcca ctgataatta tgattggaat atcagacttt    3000
gccgccagat ttcgaacgat ctcaagccca tcttcacgac ctaaatttag atcaacaacc    3060
acgacatcga ccgtcgcgga agagagtact ctagtgaact gggtgctgtc ggctaccgcg    3120
gtcactttga aggcgtggat cgtaaggtat tcgataataa gatgccgcat agcgacatcg    3180
tcatcgataa gaagaacgtg tttcaacggc tcacctttca atctaaaatc tgaacccttg    3240
ttcacagcgc ttgagaaatt ttcacgtgaa ggatgtacaa tcatctccag ctaaatgggc    3300
agttcgtcag aattgcggct gaccgcggat gacgaaaatg cgaaccaagt atttcaattt    3360
tatgacaaaa gttctcaatc gttgttacaa gtgaaacgct tcgaggttac agctactatt    3420
gattaaggag atcgcctatg gtctcgcccc ggcgtcgtgc gtccgccgcg agccagatct    3480
cgcctacttc ataaacgtcc tcataggcac ggaatggaat gatgacatcg atcgccgtag    3540
agagcatgtc aatcagtgtg cgatcttcca agctagcacc ttgggcgcta cttttgacaa    3600
gggaaaacag tttcttgaat ccttggattg gattcgcgcc gtgtattgtt gaaatcgatc    3660
ccggatgtcc cgagacgact tcactcagat aagcccatgc tgcatcgtcg cgcatctcgc    3720
caagcaatat ccggtccggc cgcatacgca gacttgcttg gagcaagtgc tcggcgctca    3780
cagcacccag cccagcaccg ttcttggagt agagtagtct aacatgatta tcgtgtggaa    3840
tgacgagttc gagcgtatct tctatggtga ttagcctttc ctgggggggg atggcgctga    3900
tcaaggtctt gctcattgtt gtcttgccgc ttccggtagg gccacatagc aacatcgtca    3960
gtcggctgac gacgcatgcg tgcagaaacg cttccaaatc cccgttgtca aaatgctgaa    4020
ggatagcttc atcatcctga ttttggcgtt tccttcgtgt ctgccactgg ttccacctcg    4080
aagcatcata acgggaggag acttctttaa gaccagaaac acgcgagctt ggccgtcgaa    4140
tggtcaagct gacggtgccc gagggaacgg tcggcggcag acagatttgt agtcgttcac    4200
caccaggaag ttcagtggcg cagagggggt tacgtggtcc gacatcctgc tttctcagcg    4260
cgcccgctaa aatagcgata tcttcaagat catcataaga gacgggcaaa ggcatcttgg    4320
taaaaatgcc ggcttggcgc acaaatgcct ctccaggtcg attgatcgca atttcttcag    4380
tcttcgggtc atcgagccat tccaaaatcg gcttcagaag aaagcgtagt tgcggatcca    4440
cttccattta caatgtatcc tatctctaag cggaaatttg aattcattaa gagcggcggt    4500
tcctcccccg cgtggcgccg ccagtcaggc ggagctggta aacaccaaag aaatcgaggt    4560
cccgtgctac gaaaatggaa acggtgtcac cctgattctt cttcagggtt ggcggtatgt    4620
tgatggttgc cttaagggct gtctcagttg tctgctcacc gttattttga aagctgttga    4680
agctcatccc gccacccgag ctgccggcgt aggtgctagc tgcctggaag gcgccttgaa    4740
caacactcaa gagcatagct ccgctaaaac gctgccagaa gtggctgtcg accgagcccg    4800
gcaatcctga gcgaccgagt tcgtccgcgc ttggcgatgt taacgagatc atcgcatggt    4860
caggtgtctc ggcgcgatcc cacaacacaa aaacgcgccc atctccctgt tgcaagccac    4920
gctgtatttc gccaacaacg gtggtgccac gatcaagaag cacgatattg ttcgttgttc    4980
cacgaatatc ctgaggcaag acacacttta catagcctgc caaatttgtg tcgattgcgg    5040
tttgcaagat gcacggaatt attgtccctt gcgttaccat aaaatcgggg tgcggcaaga    5100
gcgtggcgct gctgggctgc agctcggtgg gtttcatacg tatcgacaaa tcgttctcgc    5160
cggacacttc gccattcggc aaggagttgt cgtcacgctt gccttcttgt cttcggcccg    5220
tgtcgccctg aatggcgcgt ttgctgaccc cttgatcgcc gctgctatat gcaaaaatcg    5280
gtgtttcttc cggccgtggc tcatgccgct ccggttcgcc cctcggcggt agaggagcag    5340
caggctgaac agcctcttga accgctggag gatccggcgg cacctcaatc ggagctggat    5400
gaaatggctt ggtgtttgtt gcgatcaaag ttgacggcga tgcgttctca ttcaccttct    5460
tttggcgccc acctagccaa atgaggctta atgataacgc gagaacgaca cctccgacga    5520
tcaatttctg agaccccgaa agacgccggc gatgtttgtc ggagaccagg gatccagatg    5580
catcaacctc atgtgccgct tgctgactat cgttattcat cccttcgccc ccttcaggac    5640
gcgtttcaca tcgggcctca ccgtgcccgt ttgcggcctt tggccaacgg gatcgtaagc    5700
ggtgttccag atacatagta ctgtgtggcc atccctcaga cgccaacctc gggaaaccga    5760
agaaatctcg acatcgctcc ctttaactga atagttggca acagcttcct tgccatcagg    5820
attgatggtg tagatggagg gtatgcgtac attgcccgga aagtggaata ccgtcgtaaa    5880
tccattgtcg aagacttcga gtggcaacag cgaacgatcg ccttgggcga cgtagtgcca    5940
attactgtcc gccgcaccaa gggctgtgac aggctgatcc aataaattct cagctttccg    6000
ttgatattgt gcttccgcgt gtagtctgtc cacaacagcc ttctgttgtg cctcccttcg    6060
ccgagccgcc gcatcgtcgg cggggtaggc gaattggacg ctgtaataga gatcgggctg    6120
ctctttatcg aggtgggaca gagtcttgga acttatactg aaaacataac ggcgcatccc    6180
ggagtcgctt gcggttagca cgattactgg ctgaggcgtg aggacctggc ttgccttgaa    6240
aaatagataa tttccccgcg gtagggctgc tagatctttg ctatttgaaa cggcaaccgc    6300
tgtcaccgtt tcgttcgtgg cgaatgttac gaccaaagta gctccaaccg ccgtcgagag    6360
gcgcaccact tgatcgggat tgtaagccaa ataacgcatg cgcggatcta gcttgcccgc    6420
cattggagtg tcttcagcct ccgcaccagt cgcagcggca aataaacatg ctaaaatgaa    6480
aagtgctttt ctgatcatgg ttcgctgtgg cctacgtttg aaacggtatc ttccgatgtc    6540
tgataggagg tgacaaccag acctgccggg ttggttagtc tcaatctgcc gggcaagctg    6600
gtcacctttt cgtagcgaac tgtcgcggtc cacgtactca ccacaggcat tttgccgtca    6660
acgacgaggg tccttttata gcgaatttgc tgcgtgcttg gagttacatc atttgaagcg    6720
atgtgctcga cctccaccct gccgcgtttg ccaagaatga cttgaggcga actgggattg    6780
ggatagttga agaattgctg gtaatcctgg cgcactgttg gggcactgaa gttcgatacc    6840
aggtcgtagg cgtactgagc ggtgtcggca tcataactct cgcgcaggcg aacgtactcc    6900
cacaatgagg cgttaacgac ggcctcctct tgagttgcag gcaatcgcga gacagacacc    6960
tcgctgtcaa cggtgccgtc cggccgtatc catagatata cgggcacaag cctgctcaac    7020
ggcaccattg tggctatagc gaacgcttga gcaacatttc ccaaaatcgc gatagctgcg    7080
acagctgcaa tgagtttgga gagacgtcgc gccgatttcg ctcgcgcggt ttgaaaggct    7140
tctacttcct tatagtgctc ggcaaggctt tcgcgcgcca ctagcatggc atattcaggc    7200
cccgtcatag cgtccacccg aattgccgag ctgaagatct gacggagtag gctgccatcg    7260
ccccacattc agcgggaaga tcgggccttt gcagctcgct aatgtgtcgt ttgtctggca    7320
gccgctcaaa gcgacaacta ggcacagcag gcaatacttc atagaattct ccattgaggc    7380
gaatttttgc gcgacctagc ctcgctcaac ctgagcgaag cgacggtaca agctgctggc    7440
agattgggtt gcgccgctcc agtaactgcc tccaatgttg ccggcgatcg ccggcaaagc    7500
gacaatgagc gcatcccctg tcagaaaaaa catatcgagt tcgtaaagac caatgatctt    7560
ggccgcggtc gtaccggcga aggtgattac accaagcata agggtgagcg cagtcgcttc    7620
ggttaggatg acgatcgttg ccacgaggtt taagaggaga agcaagagac cgtaggtgat    7680
aagttgcccg atccacttag ctgcgatgtc ccgcgtgcga tcaaaaatat atccgacgag    7740
gatcagaggc ccgatcgcga gaagcacttt cgtgagaatt ccaacggcgt cgtaaactcc    7800
gaaggcagac cagagcgtgc cgtaaaggac ccactgtgcc ccttggaaag caaggatgtc    7860
ctggtcgttc atcggaccga tttcggatgc gattttctga aaaacggcct gggtcacggc    7920
gaacattgta tccaactgtg ccggaacagt ctgcagaggc aagccggtta cactaaactg    7980
ctgaacaaag tttgggaccg tcttttcgaa gatggaaacc acatagtctt ggtagttagc    8040
ctgcccaaca attagagcaa caacgatggt gaccgtgatc acccgagtga taccgctacg    8100
ggtatcgact tcgccgcgta tgactaaaat accctgaaca ataatccaaa gagtgacaca    8160
ggcgatcaat ggcgcactca ccgcctcctg gatagtctca agcatcgagt ccaagcctgt    8220
cgtgaaggct acatcgaaga tcgtatgaat ggccgtaaac ggcgccggaa tcgtgaaatt    8280
catcgattgg acctgaactt gactggtttg tcgcataatg ttggataaaa tgagctcgca    8340
ttcggcgagg atgcgggcgg atgaacaaat cgcccagcct taggggaggg caccaaagat    8400
gacagcggtc ttttgatgct ccttgcgttg agcggccgcc tcttccgcct cgtgaaggcc    8460
ggcctgcgcg gtagtcatcg ttaataggct tgtcgcctgt acattttgaa tcattgcgtc    8520
atggatctgc ttgagaagca aaccattggt cacggttgcc tgcatgatat tgcgagatcg    8580
ggaaagctga gcagacgtat cagcattcgc cgtcaagcgt ttgtccatcg tttccagatt    8640
gtcagccgca atgccagcgc tgtttgcgga accggtgatc tgcgatcgca acaggtccgc    8700
ttcagcatca ctacccacga ctgcacgatc tgtatcgctg gtgatcgcac gtgccgtggt    8760
cgacattggc attcgcggcg aaaacatttc attgtctagg tccttcgtcg aaggatactg    8820
atttttctgg ttgagcgaag tcagtagtcc agtaacgccg taggccgacg tcaacatcgt    8880
aaccatcgct atagtctgag tgagattctc cgcagtcgcg agcgcagtcg cgagcgtctc    8940
agcctccgtt gccgggtcgc taacaacaaa ctgcgcccgc gcgggctgaa tatatagaaa    9000
gctgcaggtc aaaactgttg caataagttg cgtcgtcttc atcgtttcct accttatcaa    9060
tcttctgcct cgtggtgacg ggccatgaat tcgctgagcc agccagatga gttgccttct    9120
tgtgcctcgc gtagtcgagt tgcaaagcgc accgtgttgg cacgccccga aagcacggcg    9180
acatattcac gcatatcccg cagatcaaat tcgcagatga cgcttccact ttctcgttta    9240
agaagaaact tacggctgcc gaccgtcatg tcttcacgga tcgcctgaaa ttccttttcg    9300
gtacatttca gtccatcgac ataagccgat cgatctgcgg ttggtgatgg atagaaaatc    9360
ttcgtcatac attgcgcaac caagctggct cctagcggcg attccagaac atgctctggt    9420
tgctgcgttg ccagtattag catcccgttg ttttttcgaa cggtcaggag gaatttgtcg    9480
acgacagtcg aaaatttagg gtttaacaaa taggcgcgaa actcatcgca gctcatcaca    9540
aaacggcggc cgtcgatcat ggctccaatc cgatgcagga gatatgctgc agcgggagcg    9600
catacttcct cgtattcgag aagatgcgtc atgtcgaagc cggtaatcga cggatctaac    9660
tttacttcgt caacttcgcc gtcaaatgcc cagccaagcg catggccccg gcaccagcgt    9720
tggagccgcg ctcctgcgcc ttcggcgggc ccatgcaaca aaaattcacg taaccccgcg    9780
attgaacgca tttgtggatc aaacgagagc tgacgatgga taccacggac cagacggcgg    9840
ttctcttccg gagaaatccc accccgacca tcactctcga tgagagccac gatccattcg    9900
cgcagaaaat cgtgtgaggc tgctgtgttt tctaggccac gcaacggcgc caacccgctg    9960
ggtgtgcctc tgtgaagtgc caaatatgtt cctcctgtgg cgcgaaccag caattcgcca   10020
ccccggtcct tgtcaaagaa cacgaccgta cctgcacggt cgaccatgct ctgttcgagc   10080
atggctagaa caaacatcat gagcgtcgtc ttacccctcc cgataggccc gaatattgcc   10140
gtcatgccaa catcgtgctc atgcgggata tagtcgaaag gcgttccgcc attggtacga   10200
aatcgggcaa tcgcgttgcc ccagtggcct gagctggcgc cctctggaaa gttttcgaaa   10260
gagacaaacc ctgcgaaatt gcgtgaagtg attgcgccag ggcgtgtgcg ccacttaaaa   10320
ttccccggca attgggacca ataggccgct tccataccaa taccttcttg gacaaccacg   10380
gcacctgcat ccgccattcg tgtccgagcc cgcgcgcccc tgtccccaag actattgaga   10440
tcgtctgcat agacgcaaag gctcaaatga tgtgagccca taacgaattc gttgctcgca  10500
agtgcgtcct cagcctcgga taatttgccg atttgagtca cggctttatc gccggaactc  10560
agcatctggc tcgatttgag gctaagtttc gcgtgcgctt gcgggcgagt caggaacgaa  10620
aaactctgcg tgagaacaag tggaaaatcg agggatagca gcgcgttgag catgcccggc  10680
cgtgtttttg cagggtattc gcgaaacgaa tagatggatc caacgtaact gtcttttggc  10740
gttctgatct cgagtcctcg cttgccgcaa atgactctgt cggtataaat cgaagcgccg  10800
agtgagccgc tgacgaccgg aaccggtgtg aaccgaccag tcatgatcaa ccgtagcgct  10860
tcgccaattt cggtgaagag cacaccctgc ttctcgcgga tgccaagacg atgcaggcca  10920
tacgctttaa gagagccagc gacaacatgc caaagatctt ccatgttcct gatctggccc  10980
gtgagatcgt tttccctttt tccgcttagc ttggtgaacc tcctctttac cttccctaaa  11040
gccgcctgtg ggtagacaat caacgtaagg aagtgttcat tgcggaggag ttggccggag  11100
agcacgcgct gttcaaaagc ttcgttcagg ctagcggcga aaacactacg gaagtgtcgc  11160
ggcgccgatg atggcacgtc ggcatgacgt acgaggtgag catatattga cacatgatca  11220
tcagcgatat tgcgcaacag cgtgttgaac gcacgacaac gcgcattgcg catttcagtt  11280
tcctcaagct cgaatgcaac gccatcaatt ctcgcaatgg tcatgatcga tccgtcttca  11340
agaaggacga tatggtcgct gaggtggcca atataaggga gatagatctc accggatctt  11400
tcggtcgttc cactcgcgcc gagcatcaca ccattcctct ccctcgtggg ggaaccctaa  11460
ttggatttgg gctaacagta gcgccccccc aaactgcact atcaatgctt cttcccgcgg  11520
tccgcaaaaa tagcaggacg acgctcgccg cattgtagtc tcgctccacg atgagccggg  11580
ctgcaaacca taacggcacg agaacgactt cgtagagcgg gttctgaacg ataacgatga  11640
caaagccggc gaacatcatg aataaccctg ccaatgtcag tggcacccca agaaacaatg  11700
cgggccgtgt ggctgcgagg taaagggtcg attcttccaa acgatcagcc atcaactacc  11760
gccagtgagc gtttggccga ggaagctcgc cccaaacatg ataacaatgc cgccgacgac  11820
gccggcaacc agcccaagcg aagcccgccc gaacatccag gagatcccga tagcgacaat  11880
gccgagaaca gcgagtgact ggccgaacgg accaaggata aacgtgcata tattgttaac  11940
cattgtggcg gggtcagtgc cgccacccgc agattgcgct gcggcgggtc cggatgagga  12000
aatgctccat gcaattgcac cgcacaagct tggggcgcag ctcgatatca cgcgcatcat  12060
cgcattcgag agcgagaggc gatttagatg taaacggtat ctctcaaagc atcgcatcaa  12120
tgcgcacctc cttagtataa gtcgaataag acttgattgt cgtctgcgga tttgccgttg  12180
tcctggtgtg gcggtggcgg agcgattaaa ccgccagcgc catcctcctg cgagcggcgc  12240
tgatatgacc cccaaacatc ccacgtctct tcggatttta gcgcctcgtg atcgtctttt  12300
ggaggctcga ttaacgcggg caccagcgat tgagcagctg tttcaacttt tcgcacgtag  12360
ccgtttgcaa aaccgccgat gaaattaccg gtgttgtaag cggagatcgc ccgacgaagc  12420
gcaaattgct tctcgtcaat cgtttcgccg cctgcataac gacttttcag catgtttgca  12480
gcggcagata atgatgtgca cgcctggagc gcaccgtcag gtgtcagacc gagcatagaa  12540
aaatttcgag agtttatttg catgaggcca acatccagcg aatgccgtgc atcgagacgg  12600
tgcctgacga cttgggttgc ttggctgtga tcttgccagt gaagcgtttc gccggtcgtg  12660
ttgtcatgaa tcgctaaagg atcaaagcga ctctccacct tagctatcgc cgcaagcgta  12720
gatgtcgcaa ctgatggggc acacttgcga gcaacatggt caaactcagc agatgagagt  12780
ggcgtggcaa ggctcgacga acagaaggag accatcaagg caagagaaag cgaccccgat  12840
ctcttaagca taccttatct ccttagctcg caactaacac cgcctctccc gttggaagaa  12900
gtgcgttgtt ttatgttgaa gattatcggg agggtcggtt actcgaaaat tttcaattgc  12960
ttctttatga tttcaattga agcgagaaac ctcgcccggc gtcttggaac gcaacatgga  13020
ccgagaaccg cgcatccatg actaagcaac cggatcgacc tattcaggcc gcagttggtc  13080
aggtcaggct cagaacgaaa atgctcggcg aggttacgct gtctgtaaac ccattcgatg  13140
aacgggaagc ttccttccga ttgctcttgg caggaatatt ggcccatgcc tgcttgcgct  13200
ttgcaaatgc tcttatcgcg ttggtatcat atgccttgtc cgccagcaga aacgcactct  13260
aagcgattat ttgtaaaaat gtttcggtca tgcggcggtc atgggcttga cccgctgtca  13320
gcgcaagacg gatcggtcaa ccgtcggcat cgacaacagc gtgaatcttg gtggtcaaac  13380
cgccacggga acgtcccata cagccatcgt cttgatcccg ctgtttcccg tcgccgcatg  13440
ttggtggacg cggacacagg aactgtcaat catgacgaca ttctatcgaa agccttggaa  13500
atcacactca gaatatgatc ccagacgtct gcctcacgcc atcgtacaaa gcgattgtag  13560
caggttgtac aggaaccgta tcgatcagga acgtctgccc agggcgggcc cgtccggaag  13620
cgccacaaga tgacattgat cacccgcgtc aacgcgcggc acgcgacgcg gcttatttgg  13680
gaacaaagga ctgaacaaca gtccattcga aatcggtgac atcaaagcgg ggacgggtta  13740
tcagtggcct ccaagtcaag cctcaatgaa tcaaaatcag accgatttgc aaacctgatt  13800
tatgagtgtg cggcctaaat gatgaaatcg tccttctaga tcgcctccgt ggtgtagcaa  13860
cacctcgcag tatcgccgtg ctgaccttgg ccagggaatt gactggcaag ggtgctttca  13920
catgaccgct cttttggccg cgatagatga tttcgttgct gctttgggca cgtagaagga  13980
gagaagtcat atcggagaaa ttcctcctgg cgcgagagcc tgctctatcg cgacggcatc  14040
ccactgtcgg gaacagaccg gatcattcac gaggcgaaag tcgtcaacac atgcgttata  14100
ggcatcttcc cttgaaggat gatcttgttg ctgccaatct ggaggtgcgg cagccgcagg  14160
cagatgcgat ctcagcgcaa cttgcggcaa aacatctcac tcacctgaaa accactagcg  14220
agtctcgcga tcagacgaag gccttttact taacgacaca atatccgatg tctgcatcac  14280
aggcgtcgct atcccagtca atactaaagc ggtgcaggaa ctaaagatta ctgatgactt  14340
aggcgtgcca cgaggcctga gacgacgcgc gtagacagtt ttttgaaatc attatcaaag  14400
tgatggcctc cgctgaagcc tatcacctct gcgccggtct gtcggagaga tgggcaagca  14460
ttattacggt cttcgcgccc gtacatgcat tggacgattg cagggtcaat ggatctgaga  14520
tcatccagag gattgccgcc cttaccttcc gtttcgagtt ggagccagcc cctaaatgag  14580
acgacatagt cgacttgatg tgacaatgcc aagagagaga tttgcttaac ccgatttttt  14640
tgctcaagcg taagcctatt gaagcttgcc ggcatgacgt ccgcgccgaa agaatatcct  14700
acaagtaaaa cattctgcac accgaaatgc ttggtgtaga catcgattat gtgaccaaga  14760
tccttagcag tttcgcttgg ggaccgctcc gaccagaaat accgaagtga actgacgcca  14820
atgacaggaa tcccttccgt ctgcagatag gtaccatcga tagatctgct gcctcgcgcg  14880
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg  14940
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg  15000
gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac  15060
tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac  15120
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg  15180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg  15240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag  15300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac  15360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga  15420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt  15480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc  15540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc  15600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta  15660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat  15720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca  15780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct  15840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt  15900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct  15960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc  16020
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa  16080
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta  16140
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc  16200
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat  16260
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta  16320
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt  16380
aatagtttgc gcaacgttgt tgccattgct gcaggggggg gggggggggg gttccattgt  16440
tcattccacg gacaaaaaca gagaaaggaa acgacagagg ccaaaaagct cgctttcagc  16500
acctgtcgtt tcctttcttt tcagagggta ttttaaataa aaacattaag ttatgacgaa  16560
gaagaacgga aacgccttaa accggaaaat tttcataaat agcgaaaacc cgcgaggtcg  16620
ccgccccgta acctgtcgga tcaccggaaa ggacccgtaa agtgataatg attatcatct  16680
acatatcaca acgtgcgtgg aggccatcaa accacgtcaa ataatcaatt atgacgcagg  16740
tatcgtatta attgatctgc atcaacttaa cgtaaaaaca acttcagaca atacaaatca  16800
gcgacactga atacggggca acctcatgtc cccccccccc ccccccctgc aggcatcgtg  16860
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga  16920
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt  16980
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct  17040
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca  17100
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat  17160
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga  17220
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc  17280
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg  17340
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc  17400
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt  17460
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca  17520
cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg  17580
aggccctttc gtcttcaaga attcggagct tttgccattc tcaccggatt cagtcgtcac  17640
tcatggtgat ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat  17700
tgatgttgga cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg  17760
cctcggtgag ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa  17820
tcctgatatg aataaattgc agtttcattt gatgctcgat gagtttttct aatcagaatt  17880
ggttaattgg ttgtaacact ggcagagcat tacgctgact tgacgggacg gcggctttgt  17940
tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcttcc cgacaacgca  18000
gaccgttccg tggcaaagca aaagttcaaa atcaccaact ggtccaccta caacaaagct  18060
ctcatcaacc gtggctccct cactttctgg ctggatgatg gggcgattca ggcctggtat  18120
gagtcagcaa caccttcttc acgaggcaga cctcagcgcc agaaggccgc cagagaggcc  18180
gagcgcggcc gtgaggcttg gacgctaggg cagggcatga aaaagcccgt agcgggctgc  18240
tacgggcgtc tgacgcggtg gaaaggggga ggggatgttg tctacatggc tctgctgtag  18300
tgagtgggtt gcgctccggc agcggtcctg atcaatcgtc accctttctc ggtccttcaa  18360
cgttcctgac aacgagcctc cttttcgcca atccatcgac aatcaccgcg agtccctgct  18420
cgaacgctgc gtccggaccg gcttcgtcga aggcgtctat cgcggcccgc aacagcggcg  18480
agagcggagc ctgttcaacg gtgccgccgc gctcgccggc atcgctgtcg ccggcctgct  18540
cctcaagcac ggccccaaca gtgaagtagc tgattgtcat cagcgcattg acggcgtccc  18600
cggccgaaaa acccgcctcg cagaggaagc gaagctgcgc gtcggccgtt tccatctgcg  18660
gtgcgcccgg tcgcgtgccg gcatggatgc gcgcgccatc gcggtaggcg agcagcgcct  18720
gcctgaagct gcgggcattc ccgatcagaa atgagcgcca gtcgtcgtcg gctctcggca  18780
ccgaatgcgt atgattctcc gccagcatgg cttcggccag tgcgtcgagc agcgcccgct  18840
tgttcctgaa gtgccagtaa agcgccggct gctgaacccc caaccgttcc gccagtttgc  18900
gtgtcgtcag accgtctacg ccgacctcgt tcaacaggtc cagggcggca cggatcactg  18960
tattcggctg caactttgtc atgcttgaca ctttatcact gataaacata atatgtccac  19020
caacttatca gtgataaaga atccgcgcgt tcaatcggac cagcggaggc tggtccggag  19080
gccagacgtg aaacccaaca tacccctgat cgtaattctg agcactgtcg cgctcgacgc  19140
tgtcggcatc ggcctgatta tgccggtgct gccgggcctc ctgcgcgatc tggttcactc  19200
gaacgacgtc accgcccact atggcattct gctggcgctg tatgcgttgg tgcaatttgc  19260
ctgcgcacct gtgctgggcg cgctgtcgga tcgtttcggg cggcggccaa tcttgctcgt  19320
ctcgctggcc ggcgccactg tcgactacgc catcatggcg acagcgcctt tcctttgggt  19380
tctctatatc gggcggatcg tggccggcat caccggggcg actggggcgg tagccggcgc  19440
ttatattgcc gatatcactg atggcgatga gcgcgcgcgg cacttcggct tcatgagcgc  19500
ctgtttcggg ttcgggatgg tcgcgggacc tgtgctcggt gggctgatgg gcggtttctc  19560
cccccacgct ccgttcttcg ccgcggcagc cttgaacggc ctcaatttcc tgacgggctg  19620
tttccttttg ccggagtcgc acaaaggcga acgccggccg ttacgccggg aggctctcaa  19680
cccgctcgct tcgttccggt gggcccgggg catgaccgtc gtcgccgccc tgatggcggt  19740
cttcttcatc atgcaacttg tcggacaggt gccggccgcg ctttgggtca ttttcggcga  19800
ggatcgcttt cactgggacg cgaccacgat cggcatttcg cttgccgcat ttggcattct  19860
gcattcactc gcccaggcaa tgatcaccgg ccctgtagcc gcccggctcg gcgaaaggcg  19920
ggcactcatg ctcggaatga ttgccgacgg cacaggctac atcctgcttg ccttcgcgac  19980
acggggatgg atggcgttcc cgatcatggt cctgcttgct tcgggtggca tcggaatgcc  20040
ggcgctgcaa gcaatgttgt ccaggcaggt ggatgaggaa cgtcaggggc agctgcaagg  20100
ctcactggcg gcgctcacca gcctgacctc gatcgtcgga cccctcctct tcacggcgat  20160
ctatgcggct tctataacaa cgtggaacgg gtgggcatgg attgcaggcg ctgccctcta  20220
cttgctctgc ctgccggcgc tgcgtcgcgg gctttggagc ggcgcagggc aacgagccga  20280
tcgctgatcg tggaaacgat aggcctatgc catgcgggtc aaggcgactt ccggcaagct  20340
atacgcgccc taggagtgcg gttggaacgt tggcccagcc agatactccc gatcacgagc  20400
aggacgccga tgatttgaag cgcactcagc gtctgatcca agaacaacca tcctagcaac  20460
acggcggtcc ccgggctgag aaagcccagt aaggaaacaa ctgtaggttc gagtcgcgag  20520
atcccccgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag ccacgccagg  20580
ccgagaacat tggttcctgt aggcatcggg attggcggat caaacactaa agctactgga  20640
acgagcagaa gtcctccggc cgccagttgc caggcggtaa aggtgagcag aggcacggga  20700
ggttgccact tgcgggtcag cacggttccg aacgccatgg aaaccgcccc cgccaggccc  20760
gctgcgacgc cgacaggatc tagcgctgcg tttggtgtca acaccaacag cgccacgccc  20820
gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc tagcagagcg  20880
gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc gaccccgccc  20940
ggcaggcggt agaccgaaat aaacaacaag ctccagaata gcgaaatatt aagtgcgccg  21000
aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat catcacgagc  21060
aataaacccg ccggcaacgc ccgcagcagc ataccggcga cccctcggcc tcgctgttcg  21120
ggctccacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc gtcctcctgt  21180
ttgaagaccg acagcccaat gatctcgccg tcgatgtagg cgccgaatgc cacggcatct  21240
cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta aacggacccg  21300
aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc ctgcacgtcg  21360
gccgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa tcctctgttt  21420
atcggcagtt cgtagagcgc gccgtgcgtc ccgagcgata ctgagcgaag caagtgcgtc  21480
gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa cccccagccg  21540
gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg acccaggcgt  21600
gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc tcgcgccact  21660
tcttcacgcg ggtggaatcc gatccgcaca tgaggcggaa ggtttccagc ttgagcgggt  21720
acggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc gacagcttgc  21780
ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg acgatttcct  21840
cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg cggaagcggt  21900
gcagcagcga caccgattcc aggtgcccaa cgcggtcgga cgtgaagccc atcgccgtcg  21960
cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg atcgaccagc  22020
ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata ggggtgcgct  22080
tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc agctcgacgc  22140
cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt tgcagcgcct  22200
cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg tcgtttggca  22260
tcgctcgcat cgtgtccggc cacggcgcaa tatcgaacaa ggaaagctgc atttccttga  22320
tctgctgctt cgtgtgtttc agcaacgcgg cctgcttggc ctcgctgacc tgttttgcca  22380
ggtcctcgcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg tcgatggtca  22440
tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc acggcggccg  22500
atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc ttggccgtag  22560
cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc atgacggtgc  22620
ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt tcttgcctgt  22680
atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc ccgactcacg  22740
ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg tccagataat  22800
ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc tcgtacttgg  22860
tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac ttgccgtggg  22920
cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc tgcttgtcgc  22980
cggcatcgtt gcgccactct tcattaaccg ctatatcgaa aattgcttgc ggcttgttag  23040
aattgccatg acgtacctcg gtgtcacggg taagattacc gataaactgg aactgattat  23100
ggctcatatc gaaagtctcc ttgagaaagg agactctagt ttagctaaac attggttccg  23160
ctgtcaagaa ctttagcggc taaaattttg cgggccgcga ccaaaggtgc gaggggcggc  23220
ttccgctgtg tacaaccaga tatttttcac caacatcctt cgtctgctcg atgagcgggg  23280
catgacgaaa catgagctgt cggagagggc aggggtttca atttcgtttt tatcagactt  23340
aaccaacggt aaggccaacc cctcgttgaa ggtgatggag gccattgccg acgccctgga  23400
aactccccta cctcttctcc tggagtccac cgaccttgac cgcgaggcac tcgcggagat  23460
tgcgggtcat cctttcaaga gcagcgtgcc gcccggatac gaacgcatca gtgtggtttt  23520
gccgtcacat aaggcgttta tcgtaaagaa atggggcgac gacacccgaa aaaagctgcg  23580
tggaaggctc tgacgccaag ggttagggct tgcacttcct tctttagccg ctaaaacggc  23640
cccttctctg cgggccgtcg gctcgcgcat catatcgaca tcctcaacgg aagccgtgcc  23700
gcgaatggca tcgggcgggt gcgctttgac agttgttttc tatcagaacc cctacgtcgt  23760
gcggttcgat tagctgtttg tcttgcaggc taaacacttt cggtatatcg tttgcctgtg  23820
cgataatgtt gctaatgatt tgttgcgtag gggttactga aaagtgagcg ggaaagaaga  23880
gtttcagacc atcaaggagc gggccaagcg caagctggaa cgcgacatgg gtgcggacct  23940
gttggccgcg ctcaacgacc cgaaaaccgt tgaagtcatg ctcaacgcgg acggcaaggt  24000
gtggcacgaa cgccttggcg agccgatgcg gtacatctgc gacatgcggc ccagccagtc  24060
gcaggcgatt atagaaacgg tggccggatt ccacggcaaa gaggtcacgc ggcattcgcc  24120
catcctggaa ggcgagttcc ccttggatgg cagccgcttt gccggccaat tgccgccggt  24180
cgtggccgcg ccaacctttg cgatccgcaa gcgcgcggtc gccatcttca cgctggaaca  24240
gtacgtcgag gcgggcatca tgacccgcga gcaatacgag gtcattaaaa gcgccgtcgc  24300
ggcgcatcga aacatcctcg tcattggcgg tactggctcg ggcaagacca cgctcgtcaa  24360
cgcgatcatc aatgaaatgg tcgccttcaa cccgtctgag cgcgtcgtca tcatcgagga  24420
caccggcgaa atccagtgcg ccgcagagaa cgccgtccaa taccacacca gcatcgacgt  24480
ctcgatgacg ctgctgctca agacaacgct gcgtatgcgc cccgaccgca tcctggtcgg  24540
tgaggtacgt ggccccgaag cccttgatct gttgatggcc tggaacaccg ggcatgaagg  24600
aggtgccgcc accctgcacg caaacaaccc caaagcgggc ctgagccggc tcgccatgct  24660
tatcagcatg cacccggatt caccgaaacc cattgagccg ctgattggcg aggcggttca  24720
tgtggtcgtc catatcgcca ggacccctag cggccgtcga gtgcaagaaa ttctcgaagt  24780
tcttggttac gagaacggcc agtacatcac caaaaccctg taaggagtat ttccaatgac  24840
aacggctgtt ccgttccgtc tgaccatgaa tcgcggcatt ttgttctacc ttgccgtgtt  24900
cttcgttctc gctctcgcgt tatccgcgca tccggcgatg gcctcggaag gcaccggcgg  24960
cagcttgcca tatgagagct ggctgacgaa cctgcgcaac tccgtaaccg gcccggtggc  25020
cttcgcgctg tccatcatcg gcatcgtcgt cgccggcggc gtgctgatct tcggcggcga  25080
actcaacgcc ttcttccgaa ccctgatctt cctggttctg gtgatggcgc tgctggtcgg  25140
cgcgcagaac gtgatgagca ccttcttcgg tcgtggtgcc gaaatcgcgg ccctcggcaa  25200
cggggcgctg caccaggtgc aagtcgcggc ggcggatgcc gtgcgtgcgg tagcggctgg  25260
acggctcgcc taatcatggc tctgcgcacg atccccatcc gtcgcgcagg caaccgagaa  25320
aacctgttca tgggtggtga tcgtgaactg gtgatgttct cgggcctgat ggcgtttgcg  25380
ctgattttca gcgcccaaga gctgcgggcc accgtggtcg gtctgatcct gtggttcggg  25440
gcgctctatg cgttccgaat catggcgaag gccgatccga agatgcggtt cgtgtacctg  25500
cgtcaccgcc ggtacaagcc gtattacccg gcccgctcga ccccgttccg cgagaacacc  25560
aatagccaag ggaagcaata ccgatgatcc aagcaattgc gattgcaatc gcgggcctcg  25620
gcgcgcttct gttgttcatc ctctttgccc gcatccgcgc ggtcgatgcc gaactgaaac  25680
tgaaaaagca tcgttccaag gacgccggcc tggccgatct gctcaactac gccgctgtcg  25740
tcgatgacgg cgtaatcgtg ggcaagaacg gcagctttat ggctgcctgg ctgtacaagg  25800
gcgatgacaa cgcaagcagc accgaccagc agcgcgaagt agtgtccgcc cgcatcaacc  25860
aggccctcgc gggcctggga agtgggtgga tgatccatgt ggacgccgtg cggcgtcctg  25920
ctccgaacta cgcggagcgg ggcctgtcgg cgttccctga ccgtctgacg gcagcgattg  25980
aagaagagcg ctcggtcttg ccttgctcgt cggtgatgta cttcaccagc tccgcgaagt  26040
cgctcttctt gatggagcgc atggggacgt gcttggcaat cacgcgcacc ccccggccgt  26100
tttagcggct aaaaaagtca tggctctgcc ctcgggcgga ccacgcccat catgaccttg  26160
ccaagctcgt cctgcttctc ttcgatcttc gccagcaggg cgaggatcgt ggcatcaccg  26220
aaccgcgccg tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc  26280
aggtcgccat tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt  26340
ttgtagccct ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc  26400
ttttcctcaa tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc  26460
ttcctggttg gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta  26520
gccggccagc ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca  26580
gtgaagaagg aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc  26640
cgttggatac accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg  26700
aaaaaggatg gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg  26760
gaaaagcgct gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc  26820
aggaaattac tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag  26880
ctggccgagt gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt  26940
gcgttcctgg cggtgagggc ggatgtcgag gcggcgttag cgtccggcta tgcgctcgtc  27000
accatttggg agcacatgcg ggaaacgggg aaggtcaagt tctcctacga gacgttccgc  27060
tcgcacgcca ggcggcacat caaggccaag cccgccgatg tgcccgcacc gcaggccaag  27120
gctgcggaac ccgcgccggc acccaagacg ccggagccac ggcggccgaa gcaggggggc  27180
aaggctgaaa agccggcccc cgctgcggcc ccgaccggct tcaccttcaa cccaacaccg  27240
gacaaaaagg atctactgta atggcgaaaa ttcacatggt tttgcagggc aagggcgggg  27300
tcggcaagtc ggccatcgcc gcgatcattg cgcagtacaa gatggacaag gggcagacac  27360
ccttgtgcat cgacaccgac ccggtgaacg cgacgttcga gggctacaag gccctgaacg  27420
tccgccggct gaacatcatg gccggcgacg aaattaactc gcgcaacttc gacaccctgg  27480
tcgagctgat tgcgccgacc aaggatgacg tggtgatcga caacggtgcc agctcgttcg  27540
tgcctctgtc gcattacctc atcagcaacc aggtgccggc tctgctgcaa gaaatggggc  27600
atgagctggt catccatacc gtcgtcaccg gcggccaggc tctcctggac acggtgagcg  27660
gcttcgccca gctcgccagc cagttcccgg ccgaagcgct tttcgtggtc tggctgaacc  27720
cgtattgggg gcctatcgag catgagggca agagctttga gcagatgaag gcgtacacgg  27780
ccaacaaggc ccgcgtgtcg tccatcatcc agattccggc cctcaaggaa gaaacctacg  27840
gccgcgattt cagcgacatg ctgcaagagc ggctgacgtt cgaccaggcg ctggccgatg  27900
aatcgctcac gatcatgacg cggcaacgcc tcaagatcgt gcggcgcggc ctgtttgaac  27960
agctcgacgc ggcggccgtg ctatgagcga ccagattgaa gagctgatcc gggagattgc  28020
ggccaagcac ggcatcgccg tcggccgcga cgacccggtg ctgatcctgc ataccatcaa  28080
cgcccggctc atggccgaca gtgcggccaa gcaagaggaa atccttgccg cgttcaagga  28140
agagctggaa gggatcgccc atcgttgggg cgaggacgcc aaggccaaag cggagcggat  28200
gctgaacgcg gccctggcgg ccagcaagga cgcaatggcg aaggtaatga aggacagcgc  28260
cgcgcaggcg gccgaagcga tccgcaggga aatcgacgac ggccttggcc gccagctcgc  28320
ggccaaggtc gcggacgcgc ggcgcgtggc gatgatgaac atgatcgccg gcggcatggt  28380
gttgttcgcg gccgccctgg tggtgtgggc ctcgttatga atcgcagagg cgcagatgaa  28440
aaagcccggc gttgccgggc tttgtttttg cgttagctgg gcttgtttga caggcccaag  28500
ctctgactgc gcccgcgctc gcgctcctgg gcctgtttct tctcctgctc ctgcttgcgc  28560
atcagggcct ggtgccgtcg ggctgcttca cgcatcgaat cccagtcgcc ggccagctcg  28620
ggatgctccg cgcgcatctt gcgcgtcgcc agttcctcga tcttgggcgc gtgaatgccc  28680
atgccttcct tgatttcgcg caccatgtcc agccgcgtgt gcagggtctg caagcgggct  28740
tgctgttggg cctgctgctg ctgccaggcg gcctttgtac gcggcaggga cagcaagccg  28800
ggggcattgg actgtagctg ctgcaaacgc gcctgctgac ggtctacgag ctgttctagg  28860
cggtcctcga tgcgctccac ctggtcatgc tttgcctgca cgtagagcgc aagggtctgc  28920
tggtaggtct gctcgatggg cgcggattct aagagggcct gctgttccgt ctcggcctcc  28980
tgggccgcct gtagcaaatc ctcgccgctg ttgccgctgg actgctttac tgccggggac  29040
tgctgttgcc ctgctcgcgc cgtcgtcgca gttcggcttg cccccactcg attgactgct  29100
tcatttcgag ccgcagcgat gcgatctcgg attgcgtcaa cggacggggc agcgcggagg  29160
tgtccggctt ctccttgggt gagtcggtcg atgccatagc caaaggtttc cttccaaaat  29220
gcgtccattg ctggaccgtg tttctcattg atgcccgcaa gcatcttcgg cttgaccgcc  29280
aggtcaagcg cgccttcatg ggcggtcatg acggacgccg ccatgacctt gccgccgttg  29340
ttctcgatgt agccgcgtaa tgaggcaatg gtgccgccca tcgtcagcgt gtcatcgaca  29400
acgatgtact tctggccggg gatcacctcc ccctcgaaag tcgggttgaa cgccaggcga  29460
tgatctgaac cggctccggt tcgggcgacc ttctcccgct gcacaatgtc cgtttcgacc  29520
tcaaggccaa ggcggtcggc cagaacgacc gccatcatgg ccggaatctt gttgttcccc  29580
gccgcctcga cggcgaggac tggaacgatg cggggcttgt cgtcgccgat cagcgtcttg  29640
agctgggcaa cagtgtcgtc cgaaatcagg cgctcgacca aattaagcgc cgcttccgcg  29700
tcgccctgct tcgcagcctg gtattcaggc tcgttggtca aagaaccaag gtcgccgttg  29760
cgaaccacct tcgggaagtc tccccacggt gcgcgctcgg ctctgctgta gctgctcaag  29820
acgcctccct ttttagccgc taaaactcta acgagtgcgc ccgcgactca acttgacgct  29880
ttcggcactt acctgtgcct tgccacttgc gtcataggtg atgcttttcg cactcccgat  29940
ttcaggtact ttatcgaaat ctgaccgggc gtgcattaca aagttcttcc ccacctgttg  30000
gtaaatgctg ccgctatctg cgtggacgat gctgccgtcg tggcgctgcg acttatcggc  30060
cttttgggcc atatagatgt tgtaaatgcc aggtttcagg gccccggctt tatctacctt  30120
ctggttcgtc catgcgcctt ggttctcggt ctggacaatt ctttgcccat tcatgaccag  30180
gaggcggtgt ttcattgggt gactcctgac ggttgcctct ggtgttaaac gtgtcctggt  30240
cgcttgccgg ctaaaaaaaa gccgacctcg gcagttcgag gccggctttc cctagagccg  30300
ggcgcgtcaa ggttgttcca tctattttag tgaactgcgt tcgatttatc agttactttc  30360
ctcccgcttt gtgtttcctc ccactcgttt ccgcgtctag ccgacccctc aacatagcgg  30420
cctcttcttg ggctgccttt gcctcttgcc gcgcttcgtc acgctcggct tgcaccgtcg  30480
taaagcgctc ggcctgcctg gccgcctctt gcgccgccaa cttcctttgc tcctggtggg  30540
cctcggcgtc ggcctgcgcc ttcgctttca ccgctgccaa ctccgtgcgc aaactctccg  30600
cttcgcgcct ggtggcgtcg cgctcgccgc gaagcgcctg catttcctgg ttggccgcgt  30660
ccagggtctt gcggctctct tctttgaatg cgcgggcgtc ctggtgagcg tagtccagct  30720
cggcgcgcag ctcctgcgct cgacgctcca cctcgtcggc ccgctgcgtc gccagcgcgg  30780
cccgctgctc ggctcctgcc agggcggtgc gtgcttcggc cagggcttgc cgctggcgtg  30840
cggccagctc ggccgcctcg gcggcctgct gctctagcaa tgtaacgcgc gcctgggctt  30900
cttccagctc gcgggcctgc gcctcgaagg cgtcggccag ctccccgcgc acggcttcca  30960
actcgttgcg ctcacgatcc cagccggctt gcgctgcctg caacgattca ttggcaaggg  31020
cctgggcggc ttgccagagg gcggccacgg cctggttgcc ggcctgctgc accgcgtccg  31080
gcacctggac tgccagcggg gcggcctgcg ccgtgcgctg gcgtcgccat tcgcgcatgc  31140
cggcgctggc gtcgttcatg ttgacgcggg cggccttacg cactgcatcc acggtcggga  31200
agttctcccg gtcgccttgc tcgaacagct cgtccgcagc cgcaaaaatg cggtcgcgcg  31260
tctctttgtt cagttccatg ttggctccgg taattggtaa gaataataat actcttacct  31320
accttatcag cgcaagagtt tagctgaaca gttctcgact taacggcagg ttttttagcg  31380
gctgaagggc aggcaaaaaa agccccgcac ggtcggcggg ggcaaagggt cagcgggaag  31440
gggattagcg ggcgtcgggc ttcttcatgc gtcggggccg cgcttcttgg gatggagcac  31500
gacgaagcgc gcacgcgcat cgtcctcggc cctatcggcc cgcgtcgcgg tcaggaactt  31560
gtcgcgcgct aggtcctccc tggtgggcac caggggcatg aactcggcct gctcgatgta  31620
ggtccactcc atgaccgcat cgcagtcgag gccgcgttcc ttcaccgtct cttgcaggtc  31680
gcggtacgcc cgctcgttga gcggctggta acgggccaat tggtcgtaaa tggctgtcgg  31740
ccatgagcgg cctttcctgt tgagccagca gccgacgacg aagccggcaa tgcaggcccc  31800
tggcacaacc aggccgacgc cgggggcagg ggatggcagc agctcgccaa ccaggaaccc  31860
cgccgcgatg atgccgatgc cggtcaacca gcccttgaaa ctatccggcc ccgaaacacc  31920
cctgcgcatt gcctggatgc tgcgccggat agcttgcaac atcaggagcc gtttcttttg  31980
ttcgtcagtc atggtccgcc ctcaccagtt gttcgtatcg gtgtcggacg aactgaaatc  32040
gcaagagctg ccggtatcgg tccagccgct gtccgtgtcg ctgctgccga agcacggcga  32100
ggggtccgcg aacgccgcag acggcgtatc cggccgcagc gcatcgccca gcatggcccc  32160
ggtcagcgag ccgccggcca ggtagcccag catggtgctg ttggtcgccc cggccaccag  32220
ggccgacgtg acgaaatcgc cgtcattccc tctggattgt tcgctgctcg gcggggcagt  32280
gcgccgcgcc ggcggcgtcg tggatggctc gggttggctg gcctgcgacg gccggcgaaa  32340
ggtgcgcagc agctcgttat cgaccggctg cggcgtcggg gccgccgcct tgcgctgcgg  32400
tcggtgttcc ttcttcggct cgcgcagctt gaacagcatg atcgcggaaa ccagcagcaa  32460
cgccgcgcct acgcctcccg cgatgtagaa cagcatcgga ttcattcttc ggtcctcctt  32520
gtagcggaac cgttgtctgt gcggcgcggg tggcccgcgc cgctgtcttt ggggatcagc  32580
cctcgatgag cgcgaccagt ttcacgtcgg caaggttcgc ctcgaactcc tggccgtcgt  32640
cctcgtactt caaccaggca tagccttccg ccggcggccg acggttgagg ataaggcggg  32700
cagggcgctc gtcgtgctcg acctggacga tggccttttt cagcttgtcc gggtccggct  32760
ccttcgcgcc cttttccttg gcgtccttac cgtcctggtc gccgtcctcg ccgtcctggc  32820
cgtcgccggc ctccgcgtca cgctcggcat cagtctggcc gttgaaggca tcgacggtgt  32880
tgggatcgcg gcccttctcg tccaggaact cgcgcagcag cttgaccgtg ccgcgcgtga  32940
tttcctgggt gtcgtcgtca agccacgcct cgacttcctc cgggcgcttc ttgaaggccg  33000
tcaccagctc gttcaccacg gtcacgtcgc gcacgcggcc ggtgttgaac gcatcggcga  33060
tcttctccgg caggtccagc agcgtgacgt gctgggtgat gaacgccggc gacttgccga  33120
tttccttggc gatatcgcct ttcttcttgc ccttcgccag ctcgcggcca atgaagtcgg  33180
caatttcgcg cggggtcagc tcgttgcgtt gcaggttctc gataacctgg tcggcttcgt  33240
tgtagtcgtt gtcgatgaac gccgggatgg acttcttgcc ggcccacttc gagccacggt  33300
agcggcgggc gccgtgattg atgatatagc ggcccggctg ctcctggttc tcgcgcaccg  33360
aaatgggtga cttcaccccg cgctctttga tcgtggcacc gatttccgcg atgctctccg  33420
gggaaaagcc ggggttgtcg gccgtccgcg gctgatgcgg atcttcgtcg atcaggtcca  33480
ggtccagctc gatagggccg gaaccgccct gagacgccgc aggagcgtcc aggaggctcg  33540
acaggtcgcc gatgctatcc aaccccaggc cggacggctg cgccgcgcct gcggcttcct  33600
gagcggccgc agcggtgttt ttcttggtgg tcttggcttg agccgcagtc attgggaaat  33660
ctccatcttc gtgaacacgt aatcagccag ggcgcgaacc tctttcgatg ccttgcgcgc  33720
ggccgttttc ttgatcttcc agaccggcac accggatgcg agggcatcgg cgatgctgct  33780
gcgcaggcca acggtggccg gaatcatcat cttggggtac gcggccagca gctcggcttg  33840
gtggcgcgcg tggcgcggat tccgcgcatc gaccttgctg ggcaccatgc caaggaattg  33900
cagcttggcg ttcttctggc gcacgttcgc aatggtcgtg accatcttct tgatgccctg  33960
gatgctgtac gcctcaagct cgatggggga cagcacatag tcggccgcga agagggcggc  34020
cgccaggccg acgccaaggg tcggggccgt gtcgatcagg cacacgtcga agccttggtt  34080
cgccagggcc ttgatgttcg ccccgaacag ctcgcgggcg tcgtccagcg acagccgttc  34140
ggcgttcgcc agtaccgggt tggactcgat gagggcgagg cgcgcggcct ggccgtcgcc  34200
ggctgcgggt gcggtttcgg tccagccgcc ggcagggaca gcgccgaaca gcttgcttgc  34260
atgcaggccg gtagcaaagt ccttgagcgt gtaggacgca ttgccctggg ggtccaggtc  34320
gatcacggca acccgcaagc cgcgctcgaa aaagtcgaag gcaagatgca caagggtcga  34380
agtcttgccg acgccgcctt tctggttggc cgtgaccaaa gttttcatcg tttggtttcc  34440
tgttttttct tggcgtccgc ttcccacttc cggacgatgt acgcctgatg ttccggcaga  34500
accgccgtta cccgcgcgta cccctcgggc aagttcttgt cctcgaacgc ggcccacacg  34560
cgatgcaccg cttgcgacac tgcgcccctg gtcagtccca gcgacgttgc gaacgtcgcc  34620
tgtggcttcc catcgactaa gacgccccgc gctatctcga tggtctgctg ccccacttcc  34680
agcccctgga tcgcctcctg gaactggctt tcggtaagcc gtttcttcat ggataacacc  34740
cataatttgc tccgcgcctt ggttgaacat agcggtgaca gccgccagca catgagagaa  34800
gtttagctaa acatttctcg cacgtcaaca cctttagccg ctaaaactcg tccttggcgt  34860
aacaaaacaa aagcccggaa accgggcttt cgtctcttgc cgcttatggc tctgcacccg  34920
gctccatcac caacaggtcg cgcacgcgct tcactcggtt gcggatcgac actgccagcc  34980
caacaaagcc ggttgccgcc gccgccagga tcgcgccgat gatgccggcc acaccggcca  35040
tcgcccacca ggtcgccgcc ttccggttcc attcctgctg gtactgcttc gcaatgctgg  35100
acctcggctc accataggct gaccgctcga tggcgtatgc cgcttctccc cttggcgtaa  35160
aacccagcgc cgcaggcggc attgccatgc tgcccgccgc tttcccgacc acgacgcgcg  35220
caccaggctt gcggtccaga ccttcggcca cggcgagctg cgcaaggaca taatcagccg  35280
ccgacttggc tccacgcgcc tcgatcagct cttgcactcg cgcgaaatcc ttggcctcca  35340
cggccgccat gaatcgcgca cgcggcgaag gctccgcagg gccggcgtcg tgatcgccgc  35400
cgagaatgcc cttcaccaag ttcgacgaca cgaaaatcat gctgacggct atcaccatca  35460
tgcagacgga tcgcacgaac ccgctgaatt gaacacgagc acggcacccg cgaccactat  35520
gccaagaatg cccaaggtaa aaattgccgg ccccgccatg aagtccgtga atgccccgac  35580
ggccgaagtg aagggcaggc cgccacccag gccgccgccc tcactgcccg gcacctggtc  35640
gctgaatgtc gatgccagca cctgcggcac gtcaatgctt ccgggcgtcg cgctcgggct  35700
gatcgcccat cccgttactg ccccgatccc ggcaatggca aggactgcca gcgctgccat  35760
ttttggggtg aggccgttcg cggccgaggg gcgcagcccc tggggggatg ggaggcccgc  35820
gttagcgggc cgggagggtt cgagaagggg gggcaccccc cttcggcgtg cgcggtcacg  35880
cgcacagggc gcagccctgg ttaaaaacaa ggtttataaa tattggttta aaagcaggtt  35940
aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc  36000
tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc tcatctgtca gcactctgcc  36060
cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat  36120
accgcagggc acttatcccc aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc  36180
aggcgttttc gccgatttgc gaggctggcc agctccacgt cgccggccga aatcgagcct  36240
gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc  36300
ctcatctgtc agtgagggcc aagttttccg cgaggtatcc acaacgccgg cggccgcggt  36360
gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc agggccatag acggccgcca  36420
gcccagcggc gagggcaacc agcccggtga gcgtcggaaa ggcgctggaa gccccgtagc  36480
gacgcggaga ggggcgagac aagccaaggg cgcaggctcg atgcgcagca cgacatagcc  36540
ggttctcgca aggacgagaa tttccctgcg gtgcccctca agtgtcaatg aaagtttcca 36600
acgcgagcca ttcgcgagag ccttgagtcc acgctagatg agagctttgt tgtaggtgga 36660
ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt cgggaagatg 36720
cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc acgttgtgtc 36780
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 36840
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc 36900
ttgctcgac                                                         36909
<210>8
<211>13019
<212>DNA
<213>人工序列
<220>
<223>PHP23235构建体
<400>8
gttacccgga ccgaagctta gcccgggcat gcctgcagtg cagcgtgacc cggtcgtgcc     60
cctctctaga gataatgagc attgcatgtc taagttataa aaaattacca catatttttt    120
ttgtcacact tgtttgaagt gcagtttatc tatctttata catatattta aactttactc    180
tacgaataat ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat    240
gaacagttag acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt    300
tatcttttta gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata    360
cttcatccat tttattagta catccattta gggtttaggg ttaatggttt ttatagacta    420
atttttttag tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc    480
tattttagtt tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa    540
aattaaacaa atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga    600
gtagataatg ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac    660
cagcagcgtc gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg    720
gacccctctc gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat    780
tgcgtggcgg agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg    840
cacggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc    900
gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca    960
cacacacaca accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc   1020
cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt    1080
tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc    1140
cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa    1200
cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat    1260
cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt    1320
caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt    1380
gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact    1440
acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg    1500
aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt    1560
tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg    1620
ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt    1680
tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg    1740
atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac    1800
atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat    1860
aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc    1920
agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt    1980
tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat    2040
ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa tgatataaat atcaatatat    2100
taaattagat tttgcataaa aaacagacta cataatactg taaaacacaa catatccagt    2160
cactatggcg gccgcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa    2220
tgtgtggatt ttgagttagg atttaaatac gcgttgatcc ggcttactaa aagccagata    2280
acagtatgcg tatttgcgcg ctgatttttg cggtataaga atatatactg atatgtatac    2340
ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta ttacagtgac agttgacagc    2400
gacagctatc agttgctcaa ggcatatatg atgtcaatat ctccggtctg gtaagcacaa    2460
ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag    2520
ggatggctga ggtcgcccgg tttattgaaa tgaacggctc ttttgctgac gagaacaggg    2580
gctggtgaaa tgcagtttaa ggtttacacc tataaaagag agagccgtta tcgtctgttt    2640
gtggatgtac agagtgatat cattgacacg cccggtcgac ggatggtgat ccccctggcc    2700
agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt acccggtggt gcatatcggg    2760
gatgaaagct ggcgcatgat gaccaccgat atggccagtg tgccggtctc cgttatcggg    2820
gaagaagtgg ctgatctcag ccaccgcgaa aatgacatcaaaaacgccat  taacctgatg    2880
ttctggggaa tataaatgtc aggctccctt atacacagcc agtctgcagg tcgaccatag    2940
tgactggata tgttgtgttt tacagtatta tgtagtctgt tttttatgca aaatctaatt    3000
taatatattg atatttatat cattttacgt ttctcgttca gctttcttgt acaaagtggt    3060
gttaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    3120
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    3180
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    3240
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    3300
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    3360
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt ccggtccggg    3420
tcacctttgt ccaccaagat ggaactgcgg ccgctcatta attaagtcag gcgcgcctct    3480
agttgaagac acgttcatgt cttcatcgta agaagacact cagtagtctt cggccagaat    3540
ggccatctgg attcagcagg cctagaaggc catttaaatc ctgaggatct ggtcttccta    3600
aggacccggg atatcggacc gattaaactt taattcggtc cgaagcttgc atgcctgcag    3660
tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat    3720
aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta    3780
tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag    3840
tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt    3900
tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc    3960
aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag    4020
ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc    4080
taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat    4140
agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa    4200
ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc    4260
taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac    4320
ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc    4380
tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg    4440
cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc caccgctcct    4500
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc    4560
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc    4620
ggcacctccg cttcaaggta cgccgctcgt cctccccccc ccccctctct accttctcta    4680
gatcggcgtt ccggtccatg catggttagg gcccggtagt tctacttctg ttcatgtttg    4740
tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg    4800
tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat    4860
ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg    4920
gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc    4980
ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag    5040
atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt    5100
gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg    5160
ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc    5220
ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa    5280
tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca    5340
tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt    5400
gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct    5460
aaccttgagt acctatctat tataataaac aagtatgttt tataattatt ttgatcttga    5520
tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat    5580
acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt    5640
acttctgcag gtcgacttta acttagccta ggatccacac gacaccatgt cccccgagcg    5700
ccgccccgtc gagatccgcc cggccaccgc cgccgacatg gccgccgtgt gcgacatcgt    5760
gaaccactac atcgagacct ccaccgtgaa cttccgcacc gagccgcaga ccccgcagga    5820
gtggatcgac gacctggagc gcctccagga ccgctacccg tggctcgtgg ccgaggtgga    5880
gggcgtggtg gccggcatcg cctacgccgg cccgtggaag gcccgcaacg cctacgactg    5940
gaccgtggag tccaccgtgt acgtgtccca ccgccaccag cgcctcggcc tcggctccac    6000
cctctacacc cacctcctca agagcatgga ggcccagggc ttcaagtccg tggtggccgt    6060
gatcggcctc ccgaacgacc cgtccgtgcg cctccacgag gccctcggct acaccgcccg    6120
cggcaccctc cgcgccgccg gctacaagca cggcggctgg cacgacgtcg gcttctggca    6180
gcgcgacttc gagctgccgg ccccgccgcg cccggtgcgc ccggtgacgc agatctgagt    6240
cgaaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    6300
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    6360
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    6420
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    6480
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    6540
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt cattccgatt    6600
aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa gcgctactag    6660
acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag cgtcaatttg    6720
tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg gcagctcggc    6780
acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag cgggagagcc    6840
gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac ggcaactaag    6900
ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg taacgatgac    6960
agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa ttatcagcct    7020
tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta tgccgacata    7080
ataggaaatc gctggataaa gccgctgagg aagctgagtg gcgctatttc tttagaagtg    7140
aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt tctgaacaca    7200
gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc gtttgtgtaa    7260
ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac tagatgttga    7320
ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt caggccgtta    7380
tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca gaagctccca    7440
tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct tttgccagat    7500
gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc gaaagtgcga    7560
gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc gtaattggat    7620
gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt gtcgtaattg    7680
cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga gtagtcatag    7740
ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg ccccgatgcc    7800
atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt ccccagctct    7860
ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat tgttagacat    7920
tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc ttccaactga    7980
tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc ttcaagtatg    8040
acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac atccttcggc    8100
gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac tacatttcgc    8160
tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt tagcgcctca    8220
aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc taccaaggca    8280
acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat cgtggctggc    8340
tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag ttcgcgctta    8400
gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc tacagcgcgg    8460
agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat caaagctcgc    8520
cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc actgtgtggc    8580
ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt cggttcgaga    8640
tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc gatcaccgct    8700
tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc ggcttgaatg    8760
aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc tgtttcgttc    8820
gagacttgag gtctagtttt atacgtgaac aggtcaatgc cgccgagagt aaagccacat    8880
tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg tatgccaagg    8940
agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc gactcctttg    9000
cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt ccatgttgag    9060
ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca agcagagtct    9120
tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact tctggtagat    9180
agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat gaaatggttc    9240
tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat atgacgccta    9300
acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg cgtgacaggt    9360
ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac tataatttat    9420
gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt caggaaagta    9480
aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta cttgatcggg    9540
ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc    9600
cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg    9660
cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg    9720
gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat    9780
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc    9840
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca    9900
ctcaaaggcg gtaatacggt  tatccacagaatcaggggat aacgcaggaa agaacatgtg    9960
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca   10020
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa   10080
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc   10140
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc   10200
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct   10260
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg   10320
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag   10380
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta   10440
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg   10500
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt   10560
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt   10620
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag   10680
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat   10740
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc   10800
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat   10860
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc   10920
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag   10980
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag   11040
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg cagggggggg   11100
gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga   11160
ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg gtattttaaa   11220
taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa aattttcata   11280
aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg aaaggacccg   11340
taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat caaaccacgt   11400
caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact taacgtaaaa   11460
acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat gtcccccccc  11520
cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct  11580
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta  11640
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg  11700
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga  11760
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt  11820
gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca  11880
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt  11940
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt  12000
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga  12060
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt  12120
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc  12180
gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa  12240
cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc gacgatcttg  12300
ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg cgagatccag  12360
caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg ccaggacgtc  12420
ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc gatcgaggat  12480
ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag cagcccactc  12540
gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct ccgtcgtcag  12600
gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc caagcactcc  12660
cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac  12720
gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt acccgccaat  12780
atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag  12840
cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac  12900
gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg tacgattgta  12960
atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact ggaagagcg   13019
<210>9
<211>2991
<212>DNA
<213>人工序列
<220>
<223>PHP20234构建体
<400>9
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga    60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga   120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca   180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc   240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta   300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc   360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa   420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg   480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa   540
aacgacggcc agtcttaagc tcgggccctg cagctctaga gctcgaattc tacaggtcac   600
taataccatc taagtagttg gttcatagtg actgcatatg ttgtgtttta cagtattatg   660
tagtctgttt tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt   720
ctcgttcaac tttcttgtac aaagtggccg ttaacggatc cagacttgtc catcttctgg   780
attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca   840
ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga   900
gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg   960
atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa  1020
ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggca  1080
agcttgcggc cgccccgggc aactttatta tacaaagttg gcattataaa aaagcattgc  1140
ttatcaattt gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttggagc  1200
tccatggtag cgttaacgcg gccgcgatat cccctatagt gagtcgtatt acatggtcat  1260
agctgtttcc tggcagctct ggcccgtgtc tcaaaatctc tgatgttaca ttgcacaaga  1320
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg  1380
tgttatgagc catattcaac gggaaacgtc gaggccgcga ttaaattcca acatggatgc  1440
tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta  1500
tcgcttgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt  1560
tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct  1620
tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat  1680
ccccggaaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt  1740
tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt  1800
taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt  1860
tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga  1920
aatgcataaa cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact  1980
tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg  2040
aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc  2100
ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt  2160
gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca  2220
ctggcagagc attacgctga cttgacggga cggcgcaagc tcatgaccaa aatcccttaa  2280
cgtgagttac gcgtcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc  2340
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc  2400
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt  2460
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt  2520
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc  2580
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa  2640
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac  2700
ctacaccgaa ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg  2760
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga  2820
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact  2880
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa  2940
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt t           2991
<210>10
<211>13278
<212>DNA
<213>人工序列
<220>
<223>PHP22655构建体(目的载体)
<400>10
aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc    60
ttcaactgga agagcggtta ccagagctgg tcacctttgt ccaccaagat ggaactgcgg     120
ccgctcatta attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta     180
agaagacact cagtagtctt cggccagaat ggcccggacc gaagctggcc gctctagaac     240
tagtggatct cgatgtgtag tctacgagaa gggttaaccg tctcttcgtg agaataaccg     300
tggcctaaaa ataagccgat gaggataaat aaaatgtggt ggtacagtac ttcaagaggt     360
ttactcatca agaggatgct tttccgatga gctctagtag tacatcggac ctcacatacc     420
tccattgtgg tgaaatattt tgtgctcatt tagtgatggg taaattttgt ttatgtcact     480
ctaggttttg acatttcagt tttgccactc ttaggttttg acaaataatt tccattccgc     540
ggcaaaagca aaacaatttt attttacttt taccactctt agctttcaca atgtatcaca     600
aatgccactc tagaaattct gtttatgcca cagaatgtga aaaaaaacac tcacttattt     660
gaagccaagg tgttcatggc atggaaatgt gacataaagt aacgttcgtg tataagaaaa     720
aattgtactc ctcgtaacaa gagacggaaa catcatgaga caatcgcgtt tggaaggctt     780
tgcatcacct ttggatgatg cgcatgaatg gagtcgtctg cttgctagcc ttcgcctacc     840
gcccactgag tccgggcggc aactaccatc ggcgaacgac ccagctgacc tctaccgacc     900
ggacttgaat gcgctacctt cgtcagcgac gatggccgcg tacgctggcg acgtgccccc     960
gcatgcatgg cggcacatgg cgagctcaga ccgtgcgtgg ctggctacaa atacgtaccc    1020
cgtgagtgcc ctagctagaa acttacacct gcaactgcga gagcgagcgt gtgagtgtag    1080
ccgagtagat cccccggtcg ccaccatggc ctcctccgag aacgtcatca ccgagttcat    1140
gcgcttcaag gtgcgcatgg agggcaccgt gaacggccac gagttcgaga tcgagggcga    1200
gggcgagggc cgcccctacg agggccacaa caccgtgaag ctgaaggtga ccaagggcgg    1260
ccccctgccc ttcgcctggg acatcctgtc cccccagttc cagtacggct ccaaggtgta    1320
cgtgaagcac cccgccgaca tccccgacta caagaagctg tccttccccg agggcttcaa    1380
gtgggagcgc gtgatgaact tcgaggacgg cggcgtggcg accgtgaccc aggactcctc    1440
cctgcaggac ggctgcttca tctacaaggt gaagttcatc ggcgtgaact tcccctccga    1500
cggccccgtg atgcagaaga agaccatggg ctgggaggcc tccaccgagc gcctgtaccc    1560
ccgcgacggc gtgctgaagg gcgagaccca caaggccctg aagctgaagg acggcggcca    1620
ctacctggtg gagttcaagt ccatctacat ggccaagaag cccgtgcagc tgcccggcta    1680
ctactacgtg gacgccaagc tggacatcac ctcccacaac gaggactaca ccatcgtgga    1740
gcagtacgag cgcaccgagg gccgccacca cctgttcctg tagcggccca tggatattcg    1800
aacgcgtagg taccacatgg ttaacctaga cttgtccatc ttctggattg gccaacttaa    1860
ttaatgtatg aaataaaagg atgcacacat agtgacatgc taatcactat aatgtgggca    1920
tcaaagttgt gtgttatgtg taattactag ttatctgaat aaaagagaaa gagatcatcc    1980
atatttctta tcctaaatga atgtcacgtg tctttataat tctttgatga accagatgca    2040
tttcattaac caaatccata tacatataaa tattaatcat atataattaa tatcaattgg    2100
gttagcaaaa caaatctagt ctaggtgtgt tttgcgaatg cggccgccac cgcggtggag    2160
ctcgaattcc ggtccgggcc tagaaggcca tttaaatcct gaggatctgg tcttcctaag    2220
gacccgggat atcgctatca actttgtata gaaaagttga acgagaaacg taaaatgata    2280
taaatatcaa tatattaaat tagattttgc ataaaaaaca gactacataa tactgtaaaa    2340
cacaacatat ccagtcacta tggtcgacct gcagactggc tgtgtataag ggagcctgac    2400
atttatattc cccagaacat caggttaatg gcgtttttga tgtcattttc gcggtggctg    2460
agatcagcca cttcttcccc gataacggag accggcacac tggccatatc ggtggtcatc    2520
atgcgccagc tttcatcccc gatatgcacc accgggtaaa gttcacgggg gactttatct    2580
gacagcagac gtgcactggc cagggggatc accatccgtc gcccgggcgt gtcaataata    2640
tcactctgta catccacaaa cagacgataa cggctctctc ttttataggt gtaaacctta    2700
aactgcattt caccagcccc tgttctcgtc ggcaaaagag ccgttcattt caataaaccg    2760
ggcgacctca gccatccctt cctgattttc cgctttccag cgttcggcac gcagacgacg    2820
ggcttcattc tgcatggttg tgcttaccga accggagata ttgacatcat atatgccttg    2880
agcaactgat agctgtcgct gtcaactgtc actgtaatac gctgcttcat agcatacctc    2940
tttttgacat acttcgggta tacatatcag tatatattct tataccgcaa aaatcagcgc    3000
gcaaatacgc atactgttat ctggctttta gtaagccgga tcctctagat tacgccccgc    3060
ctgccactca tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc    3120
acaaacggca tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata    3180
atatttgccc atggtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc    3240
aaaactggtg aaactcaccc agggattggc tgagacgaaa aacatattct caataaaccc    3300
tttagggaaa taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag    3360
aaactgccgg aaatcgtcgt ggtattcact ccagagcgat gaaaacgttt cagtttgctc    3420
atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac cgtctttcat    3480
tgccatacgg aattccggat gagcattcat caggcgggca agaatgtgaa taaaggccgg    3540
ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat ccagctgaac    3600
ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt ctttacgatg    3660
ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt tagcttcctt    3720
agctcctgaa aatctcgacg gatcctaact caaaatccac acattatacg agccggaagc    3780
ataaagtgta aagcctgggg tgccctaatg cggccgccat agtgactgga tatgttgtgt    3840
tttacagtat tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat    3900
atcattttac gtttctcgtt caactttatt atacaaagtt gatagatatc ggaccgatta    3960
aactttaatt cggtccgaag cttgcatgcc tgcagtgcag cgtgacccgg tcgtgcccct    4020
ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg    4080
tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttactctac    4140
gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa    4200
cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat    4260
ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt    4320
catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt    4380
tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat    4440
tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat    4500
taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta    4560
gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag    4620
cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac    4680
ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc    4740
gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac    4800
cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt    4860
aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca    4920
cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg    4980
ctcgtcctcc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatgcatgg    5040
ttagggcccg gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat    5100
ccgtgctgct agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta    5160
acttgccagt gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga    5220
tcgatttcat gatttttttt gtttcgttgc atagggtttg gtttgccctt ttcctttatt    5280
tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc atgctttttt ttgtcttggt    5340
tgtgatgatg tggtctggtt gggcggtcgt tctagatcgg agtagaattc tgtttcaaac    5400
tacctggtgg atttattaat tttggatctg tatgtgtgtg ccatacatat tcatagttac    5460
gaattgaaga tgatggatgg aaatatcgat ctaggatagg tatacatgtt gatgcgggtt    5520
ttactgatgc atatacagag atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt    5580
gggcggtcgt tcattcgttc tagatcggag tagaatactg tttcaaacta cctggtgtat    5640
ttattaattt tggaactgta tgtgtgtgtc atacatcttc atagttacga gtttaagatg    5700
gatggaaatatcgatctagg ataggta tac atgttgatgt gggttttact gatgcatata    5760
catgatggca tatgcagcat ctattcatat gctctaacct tgagtaccta tctattataa    5820
taaacaagta tgttttataa ttattttgat cttgatatac ttggatgatg gcatatgcag    5880
cagctatatg tggatttttt tagccctgcc ttcatacgct atttatttgc ttggtactgt    5940
ttcttttgtc gatgctcacc ctgttgtttg gtgttacttc tgcaggtcga ctttaactta    6000
gcctaggatc cacacgacac catgtccccc gagcgccgcc ccgtcgagat ccgcccggcc    6060
accgccgccg acatggccgc cgtgtgcgac atcgtgaacc actacatcga gacctccacc    6120
gtgaacttcc gcaccgagcc gcagaccccg caggagtgga tcgacgacct ggagcgcctc    6180
caggaccgct acccgtggct cgtggccgag gtggagggcg tggtggccgg catcgcctac    6240
gccggcccgt ggaaggcccg caacgcctac gactggaccg tggagtccac cgtgtacgtg    6300
tcccaccgcc accagcgcct cggcctcggc tccaccctct acacccacct cctcaagagc    6360
atggaggccc agggcttcaa gtccgtggtg gccgtgatcg gcctcccgaa cgacccgtcc    6420
gtgcgcctcc acgaggccct cggctacacc gcccgcggca ccctccgcgc cgccggctac    6480
aagcacggcg gctggcacga cgtcggcttc tggcagcgcg acttcgagct gccggccccg    6540
ccgcgcccgg tgcgcccggt gacgcagatc tgagtcgaaa cctagacttg tccatcttct    6600
ggattggcca acttaattaa tgtatgaaat aaaaggatgc acacatagtg acatgctaat    6660
cactataatg tgggcatcaa agttgtgtgt tatgtgtaat tactagttat ctgaataaaa    6720
gagaaagaga tcatccatat ttcttatcct aaatgaatgt cacgtgtctt tataattctt    6780
tgatgaacca gatgcatttc attaaccaaa tccatataca tataaatatt aatcatatat    6840
aattaatatc aattgggtta gcaaaacaaa tctagtctag gtgtgttttg cgaattgcgg    6900
ccgccaccgc ggtggagctc gaattcattc cgattaatcg tggcctcttg ctcttcagga    6960
tgaagagcta tgtttaaacg tgcaagcgct actagacaat tcagtacatt aaaaacgtcc    7020
gcaatgtgtt attaagttgt ctaagcgtca atttgtttac accacaatat atcctgccac    7080
cagccagcca acagctcccc gaccggcagc  tcggcacaaaatcaccactc gatacaggca    7140
gcccatcagt ccgggacggc gtcagcggga gagccgttgt aaggcggcag actttgctca    7200
tgttaccgat gctattcgga agaacggcaa ctaagctgcc gggtttgaaa cacggatgat    7260
ctcgcggagg gtagcatgtt gattgtaacg atgacagagc gttgctgcct gtgatcaaat    7320
atcatctccc tcgcagagat ccgaattatc agccttctta ttcatttctc gcttaaccgt    7380
gacaggctgt cgatcttgag aactatgccg acataatagg aaatcgctgg ataaagccgc    7440
tgaggaagct gagtggcgct atttctttag aagtgaacgt tgacgatcgt cgaccgtacc    7500
ccgatgaatt aattcggacg tacgttctga acacagctgg atacttactt gggcgattgt    7560
catacatgac atcaacaatg tacccgtttg tgtaaccgtc tcttggaggt tcgtatgaca    7620
ctagtggttc ccctcagctt gcgactagat gttgaggcct aacattttat tagagagcag    7680
gctagttgct tagatacatg atcttcaggc cgttatctgt cagggcaagc gaaaattggc    7740
catttatgac gaccaatgcc ccgcagaagc tcccatcttt gccgccatag acgccgcgcc    7800
ccccttttgg ggtgtagaac atccttttgc cagatgtgga aaagaagttc gttgtcccat    7860
tgttggcaat gacgtagtag ccggcgaaag tgcgagaccc atttgcgcta tatataagcc    7920
tacgatttcc gttgcgacta ttgtcgtaat tggatgaact attatcgtag ttgctctcag    7980
agttgtcgta atttgatgga ctattgtcgt aattgcttat ggagttgtcg tagttgcttg    8040
gagaaatgtc gtagttggat ggggagtagt catagggaag acgagcttca tccactaaaa    8100
caattggcag gtcagcaagt gcctgccccg atgccatcgc aagtacgagg cttagaacca    8160
ccttcaacag atcgcgcata gtcttcccca gctctctaac gcttgagtta agccgcgccg    8220
cgaagcggcg tcggcttgaa cgaattgtta gacattattt gccgactacc ttggtgatct    8280
cgcctttcac gtagtgaaca aattcttcca actgatctgc gcgcgaggcc aagcgatctt    8340
cttgtccaag ataagcctgc ctagcttcaa gtatgacggg ctgatactgg gccggcaggc    8400
gctccattgc ccagtcggca gcgacatcct tcggcgcgat tttgccggtt actgcgctgt    8460
accaaatgcg ggacaacgta agcactacat ttcgctcatc gccagcccag tcgggcggcg    8520
agttccatag cgttaaggtt tcatttagcg cctcaaatag atcctgttca ggaaccggat    8580
caaagagttc ctccgccgct ggacctacca aggcaacgct atgttctctt gcttttgtca    8640
gcaagatagc cagatcaatg tcgatcgtgg ctggctcgaa gatacctgca agaatgtcat    8700
tgcgctgcca ttctccaaat tgcagttcgc gcttagctgg ataacgccac ggaatgatgt    8760
cgtcgtgcac aacaatggtg acttctacag cgcggagaat ctcgctctct ccaggggaag    8820
ccgaagtttc caaaaggtcg ttgatcaaag ctcgccgcgt tgtttcatca agccttacag    8880
tcaccgtaac cagcaaatcaa tatcactgt gtggcttcag gccgccatcc actgcggagc    8940
cgtacaaatg tacggccagc aacgtcggtt cgagatggcg ctcgatgacg ccaactacct    9000
ctgatagttg agtcgatact tcggcgatca ccgcttccct catgatgttt aactcctgaa    9060
ttaagccgcg ccgcgaagcg gtgtcggctt gaatgaattg ttaggcgtca tcctgtgctc    9120
ccgagaacca gtaccagtac atcgctgttt cgttcgagac ttgaggtcta gttttatacg    9180
tgaacaggtc aatgccgccg agagtaaagc cacattttgc gtacaaattg caggcaggta    9240
cattgttcgt ttgtgtctct aatcgtatgc caaggagctg tctgcttagt gcccactttt    9300
tcgcaaattc gatgagactg tgcgcgactc ctttgcctcg gtgcgtgtgc gacacaacaa    9360
tgtgttcgat agaggctaga tcgttccatg ttgagttgag ttcaatcttc ccgacaagct    9420
cttggtcgat gaatgcgcca tagcaagcag agtcttcatc agagtcatca tccgagatgt    9480
aatccttccg gtaggggctc acacttctgg tagatagttc aaagccttgg tcggataggt    9540
gcacatcgaa cacttcacga acaatgaaat ggttctcagc atccaatgtt tccgccacct    9600
gctcagggat caccgaaatc ttcatatgac gcctaacgcc tggcacagcg gatcgcaaac    9660
ctggcgcggc ttttggcaca aaaggcgtga caggtttgcg aatccgttgc tgccacttgt    9720
taaccctttt gccagatttg gtaactataa tttatgttag aggcgaagtc ttgggtaaaa    9780
actggcctaa aattgctggg gatttcagga aagtaaacat caccttccgg ctcgatgtct    9840
attgtagata tatgtagtgt atctacttga tcgggggatc tgctgcctcg cgcgtttcgg    9900
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta    9960
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg   10020
gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg   10080
gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc   10140
gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc   10200
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc   10260
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg   10320
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat   10380
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag   10440
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga   10500
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg  10560
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt  10620
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac  10680
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc  10740
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt  10800
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc  10860
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc  10920
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg  10980
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag  11040
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg  11100
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt  11160
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca  11220
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca  11280
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc  11340
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt  11400
ttgcgcaacg ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca  11460
ttccacggac aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac  11520
ctgtcgtttc ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga  11580
agaacggaaa cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc  11640
gccccgtaac ctgtcggatc accggaaagg acccgtaaag tgataatgat tatcatctac  11700
atatcacaac gtgcgtggag gccatcaaac cacgtcaaat aatcaattat gacgcaggta  11760
tcgtattaat tgatctgcat caacttaacg taaaaacaac ttcagacaat acaaatcagc  11820
gacactgaat acggggcaac ctcatgtccc cccccccccc ccccctgcag gcatcgtggt  11880
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt  11940
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt  12000
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct  12060
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt  12120
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac  12180
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa  12240
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 12300
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 12360
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 12420
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 12480
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 12540
tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 12600
gccctttcgt cttcaagaat tggtcgacga tcttgctgcg ttcggatatt ttcgtggagt 12660
tcccgccaca gacccggatt gaaggcgaga tccagcaact cgcgccagat catcctgtga 12720
cggaactttg gcgcgtgatg actggccagg acgtcggccg aaagagcgac aagcagatca 12780
cgcttttcga cagcgtcgga tttgcgatcg aggatttttc ggcgctgcgc tacgtccgcg 12840
accgcgttga gggatcaagc cacagcagcc cactcgacct tctagccgac ccagacgagc 12900
caagggatct ttttggaatg ctgctccgtc gtcaggcttt ccgacgtttg ggtggttgaa 12960
cagaagtcat tatcgtacgg aatgccaagc actcccgagg ggaaccctgt ggttggcatg 13020
cacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc cgttattcta 13080
ataaacgctc ttttctctta ggtttacccg ccaatatatc ctgtcaaaca ctgatagttt 13140
aaactgaagg cgggaaacga caatctgatc atgagcggag aattaaggga gtcacgttat 13200
gacccccgcc gatgacgcgg gacaagccgt tttacgtttg gaactgacag aaccgcaacg 13260
ttgaaggagc cactcagc                                               13278
<210>11
<211>50
<212>DNA
<213>人工序列
<220>
<223>多接头
<400>11
gatcactagt ggcgcgccta ggagatctcg agtagggata acagggtaat               50
<210>12
<211>25
<212>DNA
<213>人工序列
<220>
<223>attB1序列
<400>12
acaagtttgt acaaaaaagc aggct                                           25
<210>13
<211>25
<212>DNA
<213>人工序列
<220>
<223>attB2 sequence
<400>13
accactttgt acaagaaagc tgggt                                           25
<210>14
<211>4778
<212>DNA
<213>人工序列
<220>
<223>PHP23112构建体
<400>14
gaaaggccca gtcttccgac tgagcctttc gttttatttg atgcctggca gttccctact     60
ctcgcgttaa cgctagcatg gatgttttcc cagtcacgac gttgtaaaac gacggccagt    120
cttaagctcg ggcccgcgtt aacgctacca tggagctcca aataatgatt ttattttgac    180
tgatagtgac ctgttcgttg caacaaattg ataagcaatg cttttttata atgccaactt    240
tgtatagaaa agttgggccg aattcgagct cggtacggcc agaatggccc ggaccgggtt    300
accgaattcg agctcggtac cctgggatca gcttgcatgc ctgcagtgca gcgtgacccg    360
gtcgtgcccc tctctagaga taatgagcat tgcatgtcta agttataaaa aattaccaca    420
tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca tatatttaaa    480
ctttactcta cgaataatat aatctatagt actacaataa tatcagtgtt ttagagaatc    540
atataaatga acagttagac atggtctaaa ggacaattga gtattttgac aacaggactc    600
tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat agcttcacct    660
atataatact tcatccattt tattagtaca tccatttagg gtttagggtt aatggttttt    720
atagactaat ttttttagta catctatttt attctatttt agcctctaaa ttaagaaaac    780
taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa taaaataaag    840
tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa acatttttct    900
tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac ggacaccaac    960
cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca tctctgtcgc   1020
tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg ctgtcggcat    1080
ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc ctcctcctcc    1140
tctcacggca ccggcagcta cgggggattc ctttcccacc gctccttcgc tttcccttcc    1200
tcgcccgccg taataaatag acaccccctc cacaccctct ttccccaacc tcgtgttgtt    1260
cggagcgcac acacacacaa ccagatctcc cccaaatcca cccgtcggca cctccgcttc    1320
aaggtacgcc gctcgtcctc cccccccccc ctctctacct tctctagatc ggcgttccgg    1380
tccatgcatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt agatccgtgt    1440
ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg tcagacacgt    1500
tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct ctagccgttc    1560
cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt ggtttgccct    1620
tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt catgcttttt    1680
tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg gagtagaatt    1740
ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt gccatacata    1800
ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag gtatacatgt    1860
tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg ttgtgatgat    1920
gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact gtttcaaact    1980
acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt catagttacg    2040
agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg tgggttttac    2100
tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc ttgagtacct    2160
atctattata ataaacaagt atgttttata attattttga tcttgatata cttggatgat    2220
ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc tatttatttg    2280
cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt ctgcaggtcg    2340
actctagagg atcagcttgg tcacccggtc cgggcctaga aggccagctt caagtttgta    2400
caaaaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt    2460
gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac tatgaatcaa    2520
ctacttagat ggtattagtg acctgtagaa ttcgagctct agagctgcag ggcggccgcg    2580
atatccccta tagtgagtcg tattacatgg tcatagctgt ttcctggcag ctctggcccg    2640
tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatca tgaacaataa    2700
aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa    2760
cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc    2820
gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag cccgatgcgc    2880
cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg    2940
tcagactaaactggctgacg gaatttatgc ctcttccgac catcaagcat  tttatccgta    3000
ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca ttccaggtat    3060
tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc    3120
ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg    3180
ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc    3240
gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg ccattctcac    3300
cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga    3360
aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg    3420
ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa    3480
aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt    3540
ttttctaatc agaattggtt aattggttgt aacactggca gagcattacg ctgacttgac    3600
gggacggcgc aagctcatga ccaaaatccc ttaacgtgag ttacgcgtcg ttccactgag    3660
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa    3720
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag    3780
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg    3840
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat    3900
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta    3960
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg    4020
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc    4080
gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa    4140
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc    4200
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt    4260
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct    4320
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc    4380
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg    4440
agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt    4500
ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc  4560
gcaacgcaat taatacgcgt accgctagcc aggaagagtt tgtagaaacg caaaaaggcc  4620
atccgtcagg atggccttct gcttagtttg atgcctggca gtttatggcg ggcgtcctgc  4680
ccgccaccct ccgggccgtt gcttcacaac gttcaaatcc gctcccggcg gatttgtcct  4740
actcaggaga gcgttcaccg acaaacaaca gataaaac                          4778
<210>15
<211>54
<212>DNA
<213>人工序列
<220>
<223>forward primer VC062
<400>15
ttaaacaagt ttgtacaaaa aagcaggctg caattaaccc tcactaaagg gaac           54
<210>16
<211>53
<212>DNA
<213>人工序列
<220>
<223>反向引物VC063
<400>16
ttaaaccact ttgtacaaga aagctgggtg cgtaatacga ctcactatag ggc            53
<210>17
<211>788
<212>DNA   
<213>玉米
<400>17
gcaaacaccg ctccagccgc cttcgctgct gctcgtgtgt ctcgtggaag ctccgcggct     60
ggaccatgga cccggacctg gacctcgacc tagacatgga tatggagacg ctcgccggcg    120
acagcggcgg cgaggccgag cgcaacgaag ccgccgaggc cgaggctgag gtggagcggt    180
acgaggccgc cgaagccgag gccgacatcc tccgcgaccg attccgcctc gccgtcatca    240
gcatcgccac cgccgaagga aagaaggccg gaatgacggt cgccgacccc gttgtttcct    300
gcatcgccga cttggcgttc aagagcgcag agcagctagc aaaggatgca gagttgtttg    360
cacagcatgc cggtcgcaaa tccgtcagga tggatgatgt catactcaca gctcacagga    420
acgagcatct tatgggcctg ctgcggacct tctctcagga gctgaaggga aaggagcctg    480
ccagtgagag gaagagaaag aaatcgtcca agaaggatga gacggtgatc gaggtctgat    540
ttcagatctg tcctcttttt ttttagagag gaaggcatgc atttttatct cgcgaggtcc  600
tcccggcttg tacagcttcc ttgtgtcgat actatcttcc atgtcatttc gcagaacttt  660
tcttctacga accctttcat cctagtcagt ttttctagtc agttattgat ggtacttgag  720
ttgagcttgc tttctcaact gcacatagca ttagtactga gtccaaaaaa aaaaaaaaaa  780
aaaaaaaa                                                           788
<210>18
<211>157
<212>PRT
<213>玉米
<400>18
Met Asp Pro Asp Leu Asp Leu Asp Leu Asp Met Asp Met Glu Thr Leu
1               5                   10                  15
Ala Gly Asp Ser Gly Gly Glu Ala Glu Arg Asn Glu Ala Ala Glu Ala
            20                  25                  30
Glu Ala Glu Val Glu Arg Tyr Glu Ala Ala Glu Ala Glu Ala Asp Ile
        35                  40                  45
Leu Arg Asp Arg Phe Arg Leu Ala Val Ile Ser Ile Ala Thr Ala Glu
    50                  55                  60
Gly Lys Lys Ala Gly Met Thr Val Ala Asp Pro Val Val Ser Cys Ile
65                  70                  75                  80
Ala Asp Leu Ala Phe Lys Ser Ala Glu Gln Leu Ala Lys Asp Ala Glu
                85                  90                  95
Leu Phe Ala Gln His Ala Gly Arg Lys Ser Val Arg Met Asp Asp Val
            100                 105                 110
Ile Leu Thr Ala His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr
        115                 120                 125
Phe Ser Gln Glu Leu Lys Gly Lys Glu Pro Ala Ser Glu Arg Lys Arg
    130                 135                 140
Lys Lys Ser Ser Lys Lys Asp Glu Thr Val Ile Glu Val
145                 150                 155
<210>19
<211>676
<212>DNA
<213>水稻
<400>19
aaatcccatc tcagtccgcc atggacgcgg agatggacct cctcgccgac gacgacggcg     60
gcgaggccga gaggctggag gccgcggagg cgcaggccga cctcctccgc gatcgcctcc    120
gcctcgccgt catcagcatc gccacctccg aaggaaagaa ggcggggatg gaggtctccg    180
accccgtcgt cgcctgcatc gccgatctgg cctacaagac cgtagagcag ctggctaagg    240
atgttgagtt gtttgcacag catgctggtc gtaaatccat caagatggaa gatgttatac    300
tcacagcaca tagaaatgag catctgatgg gcctcctgcg gacattttct caagaactga    360
agggtaagga gccttccagc gagaggaaga gaaagaaatc ttcgaagaag gacgacaacg    420
tgatgcaaat ctgatttaag tcatgagata aatcttcttc ccatagaaca aagtggtagg    480
ttcaagcagg aaactctgca agtaactcag gctacccact gatcctgtat ttcacacatt    540
tagatgtggt atgacacaat gttgtctgtg gaaagtggag atccttcaca cctgtaaatt    600
cactgaggct gttgtgtcaa gtagtaaatg gcaaaattca gagtttggtt cttaaaaaaa    660
aaaaaaaaaa aaaaaa                                                    676
<210>20
<211>137
<212>PRT
<213>水稻
<400>20
Met Asp Ala Glu Met Asp Leu Leu Ala Asp Asp Asp Gly Gly Glu Ala
1               5                   10                  15
Glu Arg Leu Glu Ala Ala Glu Ala Gln Ala Asp Leu Leu Arg Asp Arg
            20                  25                  30
Leu Arg Leu Ala Val Ile Ser Ile Ala Thr Ser Glu Gly Lys Lys Ala
        35                  40                  45
Gly Met Glu Val Ser Asp Pro Val Val Ala Cys Ile Ala Asp Leu Ala
    50                  55                  60
Tyr Lys Thr Val Glu Gln Leu Ala Lys Asp Val Glu Leu Phe Ala Gln
65                  70                  75                  80
His Ala Gly Arg Lys Ser Ile Lys Met Glu Asp Val Ile Leu Thr Ala
                85                  90                  95
His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr Phe Ser Gln Glu
            100                 105                 110
Leu Lys Gly Lys Glu Pro Ser Ser Glu Arg Lys Arg Lys Lys Ser Ser
        115                 120                 125
Lys Lys Asp Asp Asn Val Met Gln Ile
    130                 135
<210>21
<211>513
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(356)..(356)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(364)..(364)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(367)..(367)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(413)..(413)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(437)..(437)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(474)..(474)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(493)..(494)
<223>n是a、c、g、t、或u
<400>21
cgcgaacagc gaagtcgaaa acgacgcgga aatgaagctc ttgagagata aattcaggct   60
ctccgcaatc tccatcatcg aatctcaagc aaaacaaaac ggcatggaag tatcaaaagt  120
cgtagtcact tgcgttgcgg atttggcctt caagtatacg gagcgcctgg ctagggatct  180
tcatctattt gcgcagcatg cgaatcgtaa atctgtaaat atggaagatg tgatactttg  240
tggacatagg aatgaacatg tatctggcat gttgaggagc ttctccaatg atttaaaagc  300
caaggatcct caatctgaaa ggaagcgaaa gaaagaaccc aaaaagaacg acaaangaac  360
cgcntancgc atatgcctga tgcatatata tgggcctaag aacatatttt ggnacgggta  420
ggtaatttta tgtatanttt tccccccctt aaaatgtttt tgggtttggg aagntagtgc  480
tgggatccat tannccaact taatcaattt atg                               513
<210>22
<211>428
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(415)..(415)
<223>n是a、c、g、t、或u
<400>22
aaaatcgtag tcacttgcat tgcggatttg gccttcaaat atacagagtg cgtggctagg     60
gatcttcatc tatttgcgca gcatgcgaat cgtaaatctg taaatatgga agatgtgata    120
ctttgtggac ataggaatga acatgtatct ggcatgttga ggagcttctc caatgtttta    180
aaagccaacg atcctcaatc tgaaaggaag cgaaagaaag aaaccaaaaa gaacgacaaa    240
ggaaccgctt agaacatatt ttggtatgat taagtaaaat cttatatata tattatttcc    300
ttacttttat tggacttgtt agctattgct ggaatctatt agtccatctt aatcatttat    360
gggtgccttt aaacttaata cctatgatgt gtgtaattga atcaatttaa tttangagca    420
ttttctat                                                             428
<210>23
<211>612
<212>DNA
<213>大豆
<400>23
aaactcgacg atggaaagcg tggacgcgaa cagcgaagtc gaaaacgacg cggaaatgaa     60
gctcttgaga gataaattca ggctctccgc aatctccatc atcgaatctc aagcaaaaca    120
aaacggcatg gaagtatcaa aagtcgtagt cacttgcgtt gcggatttgg ccttcaagta  180
tacggagcgc ctggctaggg atcttcatct atttgcgcag catgcgaatc gtaaatctgt  240
aaatatggaa gatgtgatac tttgtggaca taggaatgaa catgtatctg gcatgttgag  300
gagcttctcc aatgatttaa aagccaagga tcctcaatct gaaaggaagc gaaagaaaga  360
acccaaaaag aacgacaaag gaaccgctta gcgcatatgc ctgatgcata tatatggtcc  420
taggaacata ttttggtacg gttagttaat tttatgtata tttttctctc ctttatatgt  480
ttttggattt ggtagctagt gctggaatct attagtccat cttaatcatttatgcatgcc   540
tttaaactta attccagtaa ggcagtaact atgagtgcgt gattgaagta attaatttag  600
aagcattttt tt                                                      612
<210>24
<211>126
<212>PRT
<213>大豆
<400>24
Met Glu Ser Val Asp Ala Asn Ser Glu Val Glu Asn Asp Ala Glu Met
1               5                   10                  15
Lys Leu Leu Arg Asp Lys Phe Arg Leu Ser Ala Ile Ser Ile Ile Glu
            20                  25                  30
Ser Gln Ala Lys Gln Asn Gly Met Glu Val Ser Lys Val Val Val Thr
        35                  40                  45
Cys Val Ala Asp Leu Ala Phe Lys Tyr Thr Glu Arg Leu Ala Arg Asp
    50                  55                  60
Leu His Leu Phe Ala Gln His Ala Asn Arg Lys Ser Val Asn Met Glu
65                  70                  75                  80
Asp Val Ile Leu Cys Gly His Arg Asn Glu His Val Ser Gly Met Leu
                85                  90                  95
Arg Ser Phe Ser Asn Asp Leu Lys Ala Lys Asp Pro Gln Ser Glu Arg
            100                 105                 110
Lys Arg Lys Lys Glu Pro Lys Lys Asn Asp Lys Gly Thr Ala
        115                 120                 125
<210>25
<211>578
<212>DNA
<213>大豆
<400>25
gttgctgtcg aaaaatctcg acgatggaaa acgcggacgc gaacagcgaa gtcgaaaacg   60
acgcggaaat gaagctcttg agagataaat tcaggctctc cgcaatctcc ataatcgaat  120
ctcaagcaaa acaaaatggc atggaagtag caaaaatcgt agtcacttgc attgcggatt  180
tggccttcaa atatacagag tgcgtggcta gggatcttca tctatttgcg cagcatgcga  240
atcgtaaatc tgtaaatatg gaagatgtga tactttgtgg acataggaat gaacatgtat  300
ctggcatgtt gaggagcttc tccaatgttt taaaagccaa cgatcctcaa tctgaaagga  360
agcgaaagaa agaaaccaaa aagaacgaca aaggaaccgc ttagaacata ttttggtatg  420
attagtaaaa tcttatatat atattatttc cttactttta ttggacttgt tagctattgc  480
tggaatctat tagtccatct taatcattta tgggtgcctt taaacttaat accactcact  540
gtatgatgtg tgtaattgaa tcattttaat ttaggagc                          578
<210>26
<211>126
<212>PRT
<213>大豆
<400>26
Met Glu Asn Ala Asp Ala Asn Ser Glu Val Glu Asn Asp Ala Glu Met
1               5                   10                  15
Lys Leu Leu Arg Asp Lys Phe Arg Leu Ser Ala Ile Ser Ile Ile Glu
            20                  25                  30
Ser Gln Ala Lys Gln Asn Gly Met Glu Val Ala Lys Ile Val Val Thr
        35                  40                  45
Cys Ile Ala Asp Leu Ala Phe Lys Tyr Thr Glu Cys Val Ala Arg Asp
    50                  55                  60
Leu His Leu Phe Ala Gln His Ala Asn Arg Lys Ser Val Asn Met Glu
65                  70                  75                  80
Asp Val Ile Leu Cys Gly His Arg Asn Glu His Val Ser Gly Met Leu
                85                  90                  95
Arg Ser Phe Ser Asn Val Leu Lys Ala Asn Asp Pro Gln Ser Glu Arg
            100                 105                 110
Lys Arg Lys Lys Glu Thr Lys Lys Asn Asp Lys Gly Thr Ala
        115                 120                 125
<210>27
<211>847
<212>DNA
<213>拟南芥
<400>27
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg     60
tgtatgatga tcgaggaagc tggacctaac atcggtaaca agcaaaaagt agttctccaa    120
cttagcaaaa tgctaataat gtatatcatt ctccatataa acgctgcgtt ttggacatgg    180
aggggatact taaaacgctg cgttttacac tttgttttcc cgcgtatatt tctcccttta    240
ttatcggata gcccaacaat cacacaggcg aagaaaccta gctattgctt cgccatggac    300
gtcggaggag aagacataag cgatctccag gtagaccaaa tcgttgaaga atattctatg    360
gacgatctca ttagagaccg attcagactc tccgcgatct ctatcgccga agccgaggcg    420
aagaaaaatg gaatggaaat aggtggacct gttgtggcat gtgtggcaga tttagccttc    480
aaatatgcag aaaacgttgc aaaggatctt gaactattcg ctcatcatgc tggacgcaaa    540
gttgtgaaca tggacgatgt tgttctctcc gcgcatagaa acgataactt agcagcatct    600
ttgaggtcac tatgcaatga gctaaaggca aaggagccac aatctgagag gaaacgcaag    660
aaaggatcag ccaagaaaga agacaaagcc agtagtagca atgccgttcg catcacgacc    720
gatctgtaac tcttcaagca gagtgtaaat acacgcactc ctctatatat atatataaac    780
attaactttg atggagaagc tgttattaaa tttttgtgga aaattttata tagaagactt    840
ttgcatt                                                              847
<210>28
<211>242
<212>PRT
<213>拟南芥
<400>28
Met Phe Asn Ile Ser Tyr Ala Lys Arg Asn Ala Lys Tyr Leu Phe Lys
1               5                   10                  15
Leu Leu Ala Trp Cys Met Met Ile Glu Glu Ala Gly Pro Asn Ile Gly
            20                  25                  30
Asn Lys Gln Lys Val Val Leu Gln Leu Ser Lys Met Leu Ile Met Tyr
        35                  40                  45
Ile Ile Leu His Ile Asn Ala Ala Phe Trp Thr Trp Arg Gly Tyr Leu
    50                  55                  60
Lys Arg Cys Val Leu His Phe Val Phe Pro Arg Ile Phe Leu Pro Leu
65                  70                  75                  80
Leu Ser Asp Ser Pro Thr Ile Thr Gln Ala Lys Lys Pro Ser Tyr Cys
                85                  90                  95
Phe Ala Met Asp Val Gly Gly Glu Asp Ile Ser Asp Leu Gln Val Asp
            100                 105                 110
Gln Ile Val Glu Glu Tyr Ser Met Asp Asp Leu Ile Arg Asp Arg Phe
        115                 120                 125
Arg Leu Ser Ala Ile Ser Ile Ala Glu Ala Glu Ala Lys Lys Asn Gly
    130                 135                 140
Met Glu Ile Gly Gly Pro Val Val Ala Cys Val Ala Asp Leu Ala Phe
145                 150                 155                 160
Lys Tyr Ala Glu Asn Val Ala Lys Asp Leu Glu Leu Phe Ala His His
                165                 170                 175
Ala Gly Arg Lys Val Val Asn Met Asp Asp Val Val Leu Ser Ala His
            180                 185                 190
Arg Asn Asp Asn Leu Ala Ala Ser Leu Arg Ser Leu Cys Asn Glu Leu
        195                 200                 205
Lys Ala Lys Glu Pro Gln Ser Glu Arg Lys Arg Lys Lys Gly Ser Ala
    210                 215                 220
Lys Lys Glu Asp Lys Ala Ser Ser Ser Asn Ala Val Arg Ile Thr Thr
225                 230                 235                 240
Asp Leu
<210>29
<211>665
<212>DNA
<213>拟南芥
<400>29
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg   60
taggcgcgta atagagagtg ctatgtttcc ttaaatcaaa gcaaaacata gatgttgttg  120
ccggcaacga ggatggtaat cgataaagcc acaggtgtat gatgatcgag gaagctggac  180
ctaacatcgg taacaagcaa aaagcgaaga aacctagcta ttgcttcgcc atggacgtcg  240
gaggagaaga cataagcgat ctccaggtag accaaatcgt tgaagaatat tctatggacg  300
atctcattag agaccgattc agactctccg cgatctctat cgccgaagcc gaggcgaaga  360
aaaatggaat ggaaataggt ggacctgttg tggcatgtgt ggcagattta gccttcaaat  420
atgcagaaaa cgttgcaaag gatcttgaac tattcgctca tcatgctgga cgcaaagttg  480
tgaacatgga cgatgttgtt ctctccgcgc atagaaacga taacttagca gcatctttga  540
ggtcactatg caatgagcta aaggcaaagg agccacaatc tgagaggaaa cgcaagaaag  600
gatcagccaa gaaagaagac aaagccagta gtagcaatgc cgttcgcatc acgaccgatc  660
tgtaa                                                              665
<210>30
<211>168
<212>PRT
<213>拟南芥
<400>30
Met Met Ile Glu Glu Ala Gly Pro Asn Ile Gly Asn Lys Gln Lys Ala
1               5                   10                  15
Lys Lys Pro Ser Tyr Cys Phe Ala Met Asp Val Gly Gly Glu Asp Ile
            20                  25                  30
Ser Asp Leu Gln Val Asp Gln Ile Val Glu Glu Tyr Ser Met Asp Asp
        35                  40                  45
Leu Ile Arg Asp Arg Phe Arg Leu Ser Ala Ile Ser Ile Ala Glu Ala
    50                  55                  60
Glu Ala Lys Lys Asn Gly Met Glu Ile Gly Gly Pro Val Val Ala Cys
65                  70                  75                  80
Val Ala Asp Leu Ala Phe Lys Tyr Ala Glu Asn Val Ala Lys Asp Leu
                85                  90                  95
Glu Leu Phe Ala His His Ala Gly Arg Lys Val Val Asn Met Asp Asp
            100                 105                 110
Val Val Leu Ser Ala His Arg Asn Asp Asn Leu Ala Ala Ser Leu Arg
        115                 120                 125
Ser Leu Cys Asn Glu Leu Lys Ala Lys Glu Pro Gln Ser Glu Arg Lys
    130                 135                 140
Arg Lys Lys Gly Ser Ala Lys Lys Glu Asp Lys Ala Ser Ser Ser Asn
145                 150                 155                 160
Ala Val Arg Ile Thr Thr Asp Leu
                165
<210>31
<211>669
<212>DNA
<213>拟南芥
<400>31
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg     60
taggcgcgta atagagagtg ctatgtttcc ttaaatcaaa gcaaaacata gatgttgttg    120
ccggcaacga ggatggtaat cgataaagcc acaggtgtat gatgatcgag gaagctggac    180
ctaacatcgg taacaagcaa aaagtaggcg aagaaaccta gctattgctt cgccatggac    240
gtcggaggag aagacataag cgatctccag gtagaccaaa tcgttgaaga atattctatg    300
gacgatctca ttagagaccg attcagactc tccgcgatct ctatcgccga agccgaggcg    360
aagaaaaatg gaatggaaat aggtggacct gttgtggcat gtgtggcaga tttagccttc    420
aaatatgcag aaaacgttgc aaaggatctt gaactattcg ctcatcatgc tggacgcaaa    480
gttgtgaaca tggacgatgt tgttctctcc gcgcatagaa acgataactt agcagcatct    540
ttgaggtcac tatgcaatga gctaaaggca aaggagccac aatctgagag gaaacgcaag    600
aaaggatcag ccaagaaaga agacaaagcc agtagtagca atgccgttcg catcacgacc    660
gatctgtaa                                                            669
<210>32
<211>144
<212>PRT
<213>拟南芥
<400>32
Met Asp Val Gly Gly Glu Asp Ile Ser Asp Leu Gln Val Asp Gln Ile
1               5                   10                  15
Val Glu Glu Tyr Ser Met Asp Asp Leu Ile Arg Asp Arg Phe Arg Leu
            20                  25                  30
Ser Ala Ile Ser Ile Ala Glu Ala Glu Ala Lys Lys Asn Gly Met Glu
        35                  40                  45
Ile Gly Gly Pro Val Val Ala Cys Val Ala Asp Leu Ala Phe Lys Tyr
    50                  55                  60
Ala Glu Asn Val Ala Lys Asp Leu Glu Leu Phe Ala His His Ala Gly
65                  70                  75                  80
Arg Lys Val Val Asn Met Asp Asp Val Val Leu Ser Ala His Arg Asn
                85                  90                  95
Asp Asn Leu Ala Ala Ser Leu Arg Ser Leu Cys Asn Glu Leu Lys Ala
            100                 105                 110
Lys Glu Pro Gln Ser Glu Arg Lys Arg Lys Lys Gly Ser Ala Lys Lys
        115                 120                 125
Glu Asp Lys Ala Ser Ser Ser Asn Ala Val Arg Ile Thr Thr Asp Leu
    130                 135                 140
<210>33
<211>137
<212>PRT
<213>水稻
<400>33
Met Asp Ala Glu Met Asp Leu Leu Ala Asp Asp Asp Gly Gly Glu Ala
1               5                   10                  15
Glu Arg Leu Glu Ala Ala Glu Ala Gln Ala Asp Leu Leu Arg Asp Arg
            20                  25                  30
Leu Arg Leu Ala Val Ile Ser Ile Ala Thr Ser Glu Gly Lys Lys Ala
        35                  40                  45
Gly Met Glu Val Ser Asp Pro Val Val Ala Cys Ile Ala Asp Leu Ala
    50                  55                  60
Tyr Lys Thr Val Glu Gln Leu Ala Lys Asp Val Glu Leu Phe Ala Gln
65                  70                  75                  80
His Ala Gly Arg Lys Ser Ile Lys Met Glu Asp Val Ile Leu Thr Ala
                85                  90                  95
His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr Phe Ser Gln Glu
            100                 105                 110
Leu Lys Gly Lys Glu Pro Ser Ser Glu Arg Lys Arg Lys Lys Ser Ser
        115                 120                 125
Lys Lys Asp Asp Asn Val Met Gln Ile
    130                 135
<210>34
<211>135
<212>PRT
<213>Vitis vinifera
<400>34
Met Glu Glu Ala Arg Ser Glu Leu Glu Arg Glu Glu Asp Glu Glu Ala
1               5                   10                  15
Thr Glu Leu Leu Arg Asp Arg Phe Arg Leu Ser Thr Ile Ser Ile Val
            20                  25                  30
Glu Ala Gln Ala Lys Lys Ser Asp Met Glu Ile Ser Glu Pro Ile Val
        35                  40                  45
Ala Cys Ile Ser Asp Leu Ala Phe Lys Tyr Thr Glu Gln Leu Ala Lys
    50                  55                  60
Asp Leu Glu Leu Phe Ser Gln His Ala Gly Arg Lys Thr Val Asn Met
65                  70                  75                  80
Glu Asp Val Ile Leu Ser Ala His Arg Asn Lys His Leu Ala Ser Ser
                85                  90                  95
Leu Arg Ser Phe Cys Asn Asp Leu Lys Ala Lys Glu Ile Pro Ser Glu
            100                 105                 110
Arg Lys Arg Lys Lys Ala Ser Arg Lys Glu Asp Lys Ala Ser Thr Ser
        115                 120                 125
Val Val His Ile Pro Asp Leu
    130                 135
<210>35
<211>55
<212>DNA
<213>Artificial
<220>
<223>At5g50930-5’attB正向引物的核苷酸序列。
<400>35
ttaaacaagt ttgtacaaaa aagcaggctc aacaatgttt aacatttctt acgcc          55
<210>36
<211>50
<212>DNA
<213>Artificial
<220>
<223>At5g50930-3′attB反向引物的核苷酸序列。
<400>36
ttaaaccact ttgtacaaga aagctgggtt tacagatcgg tcgtgatgcg                50

Claims (32)

1.在基因组中包含重组DNA构建体的植物,所述重组DNA构建体包含可操作地连接至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,并且其中所述植物在与不包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
2.权利要求1的植物,其中所述植物是玉米植物或大豆植物。
3.在基因组中包含重组DNA构建体的植物,所述重组DNA构建体包含:
(a)可操作地连接至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;或
(b)抑制DNA构建体,所述构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的完全互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的所述全部或部分进行比较时,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2多肽,
并且其中所述植物在与不包含所述重组DNA构建体的对照植物比较时表现出至少一种农学特性的改变。
4.权利要求3的植物,其中所述植物是玉米植物或大豆植物。
5.权利要求3的植物,其中当在氮限制条件下与未包含所述重组DNA构建体的所述对照植物比较时,所述植物表现出所述至少一种农学特性的所述改变。
6.权利要求5的植物,其中所述植物是玉米植物或大豆植物。
7.权利要求3的植物,其中所述至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物氨基酸含量、营养组织游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎倒伏、植株高度、穗高度和穗长度。
8.权利要求7的植物,其中所述植物是玉米植物或大豆植物。
9.权利要求3的植物,其中在与所述对照植物相比较时,所述植物表现出所述至少一种农学特性的增加。
10.权利要求9的植物,其中所述植物是玉米植物或大豆植物。
11.增加植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;和
(b)在步骤(a)之后从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体并且在与未包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
12.权利要求11的方法,所述方法还包括:
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体并且在与不包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
13.评估植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在基因组中包含所述重组DNA构建体;以及
(c)评价所述转基因植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
14.权利要求13的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)评价所述子代植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
15.评估植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)评价所述转子代植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
16.测定植物农学特性改变的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;以及
(c)测定所述转基因植物在与不包含所述重组DNA构建体的对照植物进行比较时是否表现出至少一种农学特性的改变。
17.权利要求16的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)测定所述子代植物在与不包含所述重组DNA构建体的对照植物进行比较时是否表现出至少一种农学特性的改变。
18.权利要求16的方法,其中所述测定步骤(c)包括:测定所述转基因植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
19.权利要求17的方法,其中所述测定步骤(e)包括:测定所述子代植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
20.测定植物农学特性改变的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)测定所述子代植物在与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
21.权利要求20的方法,其中所述测定步骤(d)包括:测定所述转基因植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
22.测定植物农学特性改变的方法,所述方法包括:
(a)将包含至少一种调控元件的抑制DNA构建体引入到可再生的植物细胞中,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,在与所述区域所来源的有义链或反义链的所述全部或部分进行比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)测定所述转基因植物在与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
23.权利要求22的方法,其中所述测定步骤(c)包括:测定所述转基因植物在氮限制条件下与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
24.权利要求22的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及
(e)测定所述子代植物在与不包含所述抑制DNA构建体的对照植物进行比较时是否表现出至少一种农学特性的改变。
25.权利要求24的方法,其中所述测定步骤(e)包括:测定所述子代植物在氮限制条件下与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
26.测定植物中的农学特性改变的方法,所述方法包括:
(a)将包含至少一种调控元件的抑制DNA构建体引入到可再生的植物细胞中,该调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的完全互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,在与所述区域所来源的有义链或反义链的所述全部或部分进行比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2多肽;
(b)在步骤(a)之后从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出至少一种农学性状的改变;
(c)获得源自该转基因植物的子代植物,其中该子代植物在基因组中包含该抑制DNA构建体;以及
(d)测定该子代植物在与不包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
27.权利要求26的方法,其中所述测定步骤(d)包括:测定所述转基因植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
28.分离的多核苷酸,所述多核苷酸包含:
(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、24、或26进行比较时具有至少85%的序列同一性;或
(ii)所述(i)的核酸序列的全长互补序列。
29.权利要求28的分离的多核苷酸,其中所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、24、或26进行比较时具有至少90%的序列同一性。
30.权利要求28的分离的多核苷酸,其中所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、24、或26进行比较时具有至少95%的序列同一性。
31.权利要求28的分离的多核苷酸,其中所述多肽的序列包括SEQID NO:18、24、或26。
32.权利要求28的分离的多核苷酸,其中所述核酸序列包括SEQ IDNO:17、23、或25。
CN200880124194.9A 2007-11-07 2008-11-05 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 Expired - Fee Related CN101918560B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US98608807P 2007-11-07 2007-11-07
US60/986088 2007-11-07
US60/986,088 2007-11-07
PCT/US2008/082421 WO2009061776A1 (en) 2007-11-07 2008-11-05 Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving genes encoding lnt2 polypeptides and homologs thereof

Publications (2)

Publication Number Publication Date
CN101918560A true CN101918560A (zh) 2010-12-15
CN101918560B CN101918560B (zh) 2014-02-26

Family

ID=40233305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880124194.9A Expired - Fee Related CN101918560B (zh) 2007-11-07 2008-11-05 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法

Country Status (9)

Country Link
US (4) US8394634B2 (zh)
EP (1) EP2220236A1 (zh)
CN (1) CN101918560B (zh)
AR (1) AR069240A1 (zh)
BR (1) BRPI0817356A2 (zh)
CA (1) CA2703243A1 (zh)
MX (1) MX2010005106A (zh)
RU (1) RU2010122899A (zh)
WO (1) WO2009061776A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016000646A1 (en) * 2014-07-03 2016-01-07 Pioneer Overseas Corporation Plants having altered agronomic characteristics under abiotic stress conditions and related constructs and methods involving abiotic stresstolerancegenes

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011085062A1 (en) 2010-01-06 2011-07-14 Pioneer Hi-Bred International, Inc. Identification of diurnal rhythms in photosynthetic and non-photosynthetic tissues from zea mays and use in improving crop plants
RS55986B1 (sr) 2010-01-22 2017-09-29 Bayer Ip Gmbh Akaricidne i/ili insekticidne kombinacije aktivnih supstanci
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
CA2995572A1 (en) 2015-08-17 2017-02-23 Dow Agrosciences Llc Plant promoter and 3' utr for transgene expression
CN110402760A (zh) * 2019-09-10 2019-11-05 广西民族师范学院 一种香蕉林下间作种植食用菌的生态种植方法
CN112946239B (zh) * 2021-02-01 2023-04-07 中国农业科学院农业资源与农业区划研究所 一种基于土壤磷环境阈值测算土壤允许施用的最大粪肥量的方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag, Basel Gewebe-spezifische Promotoren
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
ES2140416T3 (es) 1991-08-27 2000-03-01 Novartis Ag Proteinas con propiedades insecticidas contra insectos homopteros y su uso en la proteccion de plantas.
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
ATE336580T1 (de) 1998-02-26 2006-09-15 Pioneer Hi Bred Int Mais met-1 promoter
EP1033405A3 (en) 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
EP1586645A3 (en) * 1999-02-25 2006-02-22 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US20090087878A9 (en) 1999-05-06 2009-04-02 La Rosa Thomas J Nucleic acid molecules associated with plants
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US7834146B2 (en) 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
EP1586654A1 (en) 2004-04-15 2005-10-19 Vereniging voor christelijk hoger onderwijs, wetenschappelijk onderzoek en patiëntenzorg Replication competent viruses capable of silencing virus inhibitory factor expression
CN1328385C (zh) * 2005-07-15 2007-07-25 南开大学 高亲和铵转运因子融合基因及其在转基因植物中的应用
BRPI0616533A2 (pt) * 2005-08-15 2011-06-21 Pioneer Hi Bred Int polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016000646A1 (en) * 2014-07-03 2016-01-07 Pioneer Overseas Corporation Plants having altered agronomic characteristics under abiotic stress conditions and related constructs and methods involving abiotic stresstolerancegenes
US10233459B2 (en) 2014-07-03 2019-03-19 Pioneer Overseas Corporation Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving low nitrogen tolerance genes
US10626410B2 (en) 2014-07-03 2020-04-21 Pioneer Overseas Corporation Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving low nitrogen tolerance genes

Also Published As

Publication number Publication date
AR069240A1 (es) 2010-01-06
US8394634B2 (en) 2013-03-12
MX2010005106A (es) 2010-06-25
RU2010122899A (ru) 2011-12-20
BRPI0817356A2 (pt) 2014-10-07
US20110039263A1 (en) 2011-02-17
US20090119804A1 (en) 2009-05-07
CN101918560B (zh) 2014-02-26
WO2009061776A1 (en) 2009-05-14
EP2220236A1 (en) 2010-08-25
US20100269218A1 (en) 2010-10-21
US20140059716A1 (en) 2014-02-27
CA2703243A1 (en) 2009-05-14
US8338181B2 (en) 2012-12-25

Similar Documents

Publication Publication Date Title
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
KR101447300B1 (ko) 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR102681113B1 (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
CN108026556A (zh) 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
CN101918560B (zh) 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
CN112204147A (zh) 基于Cpf1的植物转录调控系统
CN109563505A (zh) 用于真核细胞的组装系统
KR20070085669A (ko) 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
CN101679990A (zh) △8去饱和酶及其在制备多不饱和脂肪酸中的用途
CN111836825A (zh) 优化的植物crispr/cpf1系统
CN101868545B (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法
KR20150093721A (ko) 원핵생물 경로를 모방함에 의한 식물 자기 질소 고정
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
CN101208433A (zh) 用于植物中表皮特异性病原体可诱导的转基因表达的启动子
US20240150795A1 (en) Targeted insertion via transportation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140226

Termination date: 20151105

EXPY Termination of patent right or utility model