CN1678745A - 水稻bt型细胞质雄性不育的水稻恢复基因 - Google Patents

水稻bt型细胞质雄性不育的水稻恢复基因 Download PDF

Info

Publication number
CN1678745A
CN1678745A CNA038209101A CN03820910A CN1678745A CN 1678745 A CN1678745 A CN 1678745A CN A038209101 A CNA038209101 A CN A038209101A CN 03820910 A CN03820910 A CN 03820910A CN 1678745 A CN1678745 A CN 1678745A
Authority
CN
China
Prior art keywords
seq
nucleic acid
base
bit base
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038209101A
Other languages
English (en)
Other versions
CN1678745B (zh
Inventor
小森俊之
高仓由光
樋江井佑弘
铃木庄一
仓屋芳树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Tobacco Inc
Original Assignee
Syngenta Ltd
Japan Tobacco Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Ltd, Japan Tobacco Inc filed Critical Syngenta Ltd
Publication of CN1678745A publication Critical patent/CN1678745A/zh
Application granted granted Critical
Publication of CN1678745B publication Critical patent/CN1678745B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明的目的是提供水稻BT型细胞质雄性不育的不育恢复基因。本发明的基因包括编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸。优选地,本发明的基因具有SEQ ID NO:69-74、80-85的碱基序列或SEQ ID NO:27的第43907-46279位的碱基。

Description

水稻BT型细胞质雄性不育的水稻恢复基因
发明领域
本发明涉及水稻BT型细胞质雄性不育的水稻恢复基因。
本申请要求基于2002年7月5日提交的日本专利申请No.2002-107560的优先权。该专利申请的全部公开内容在此并入本文。
背景技术
水稻是自花授粉植物,所以为了在品种之间进行杂交,首先必须在开花前将颖花内的全部雄蕊除去以避免自花授粉,然后用来自亲本品种的花粉使将与之杂交的品种获得育性。然而,这种人工杂交的方法完全不适合商业规模地来生产大量的杂交种子。
因此,通过利用细胞质雄性不育的三系法来生产杂交水稻。在三系法中,使用了下列三个品系,即具有雄性不育细胞质的不育系、具有Rf-1基因的恢复系和与不育系具同样核基因但不具有任何不育细胞质的保持系。利用这三个品系,(i)用恢复系的花粉对不育系进行授粉而获得杂交种子;同时(ii)用保持系的花粉对不育系进行授粉而使不育系得以保存下去。
当在三系法中使用BT型雄性不育细胞质时,繁殖恢复系水稻是非常重要的,为此,必需在育种的各个阶段中确保水稻中保持有Rf-1基因,并且确保在最后阶段中Rf-1基因是纯合的。在三系法中还需要验证以确保用作恢复系的品种具有Rf-1基因,或验证Rf-1基因的存在以确保所得到的杂交种子已恢复了育性。
为了确定植物体中的Rf-1基因位点的基因型,首先需要将待确定其基因型的植物与标准系杂交获得杂交种子,以形成F1代植株,然后进行自花授粉,继而研究能以超过某一水平(例如,70-80%或更高)的频率来产生种子的个体的出现机率。所述标准系指保持系、不育系或这两个品系的一组品系,并且根据待测个体的细胞质是否属于BT型、正常型还是未知的来作出合适的选择。如果标准系为不育系,则以待测个体作为母本来杂交,而如果标准系是保持系,则作为父本来杂交。
但是,实施这些技术需要花费大量的劳动力和时间。进一步的问题是,为生产种子而进行的授粉易受环境因素的影响,并且如果在恶劣的环境,如低温或日照不足下进行研究,不育的造成可能与基因型构成无关,导致不能准确地确定Rf-1基因位点的基因型。
为了解决这些问题,最近已经提出用分子生物学的技术来验证Rf-1基因的存在。该技术基于检测与Rf-1基因连锁的碱基序列(这些序列以下称作DNA标记)来验证Rf-1基因的存在或缺失。值得注意的是由于目前还没弄清Rf-1基因的DNA序列,所以不可能直接检测Rf-1基因。
例如已有报道,水稻中Rf-1基因的位点位于第10号染色体上,并且定位于DNA标记(RFLP标记)位点G291和G127位点之间,其可用于限制性片段长度多态性分析(RFLP)(Fukuta等人,1992,Jpn J.Breed.42(supl.1)164-165)。已知的方法是通过研究与Rf-1基因连锁的DNA标记位点G291和G127的基因型可鉴定Rf-1基因位置的基因型。
但是传统的分子生物学技术存在几个问题。首先,利用RFLP标记需要通过Southern印迹分析来进行检测。为了进行Southern印迹分析,必需从待测个体中纯化微克级的DNA,此外还需要包括限制性内切酶处理、电泳、印迹、与探针杂交以及信号检测等一系列的步骤;这不仅包括了相当量的劳动,还需花费约1周的时间才能获得检测结果。
第二个问题是,由于RFLP标记位点G291和G127之间的基因图距长约30cM(在水稻DNA中相当于约9000kbp),在该区域中发生双重重组的机率达到百分之几,因而不能完全保证通过这些标记来正确评估Rf-1基因位置的基因型。
第三,当通过检测RFLP标记位点G291和G127来评估Rf-1基因的存在,不仅Rf-1基因而且这些位点之间的基因区域被引入到育种所筛选出的育性恢复系中。结果是:从RF-1基因供体亲本中引入的DNA序列将具有30cM或更长的染色体区域,这表示存在着引入可能潜在于该区域内的有害基因的风险。
为了解决这些问题,已经开发出与Rf-1基因的位点连锁的显性DNA标记(日本专利公开No.222588/1995)和共显性DNA标记(日本专利公开No.313187/1997)。这些标记与Rf-1基因的位点连锁,与Rf-1基因的遗传距离分别为1.6±0.7cM(相当于水稻DNA中约480kbp)和3.7±1.1cM(相当于水稻DNA中约1110kbp),它们的位点位于Rf-1基因位点的相对两侧。因此,可通过检测显性PCR标记和共显性PCR标记的位点的存在来评估Rf-1基因的存在。利用共显性PCR标记也可以评估Rf-1基因的位点是纯合还是杂合的。
但是,即使使用这些PCR标记,仍然存在着几个问题。共显性标记与Rf-1基因的位点具有3.7±1.1cM的遗传距离,所以还没有完全解决与Rf-1基因位点之间重组频率可能很高的问题。其结果是,就共显性标记本身来说,是能够准确地检测出是纯合型还是杂合型。但如果共显性标记和Rf-1基因的位点之间发生重组,就不能准确确定Rf-1基因位点的基因型,尤其不能确定其是纯合型还是杂合型的。另一方面,如果用显性标记确定Rf-1基因位点的基因型,则不管个体是Rf-1基因纯合体(Rf-1/Rf-1)还是杂合体(Rf-1/rf-1),该标记不能区分检测个体。因此,即使结合使用共显性标记和显性标记来确定Rf-1基因位点的基因型,也不可能正确地鉴别植株个体是Rf-1基因纯合型还是杂合型。此外,如果用显性标记进行PCR没有得到扩增产物,也不能排除可能是由于实验程序的一些问题所导致的可能性。进一步的问题是,由于共显性标记和显性标记之间的遗传距离长达约5.3cM(约1590kbp),从Rf-1基因供体亲本引入的染色体区域的大小不能限定在足够小的数值,也就不能防止该区域中可能含有的有害基因的伴随引入。
日本专利公开No.139465/2000描述了根据位于水稻第10号染色体上Rf-1基因附近的RFLP标记的碱基序列而开发的共显性标记。然而,这些PCR标记大多数与Rf-1基因之间的遗传距离都大于约1cM。
发明公开
本发明的一个目的是提供恢复水稻育性的方法。本发明的方法包括将核酸导入到水稻中,其中该核酸编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列。本发明的一个优选实施方案中,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%同一性的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
优选地,本发明的方法中,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列,并具有恢复育性功能的核酸,符合下列1)-12)中的至少一个条件:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
本发明的另一个目的是提供一种鉴定受试水稻个体或其种子是否具有水稻恢复基因(Rf-1基因)的方法,其中利用编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列,并具有恢复育性功能的核酸。优选地,本发明方法的实施方案中,当编码SEQID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸,符合下列1)-12)中的至少一个条件时,可确定受试水稻个体或其种子具有Rf-1基因:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
本发明的另一个目的是提供一种抑制Rf-1基因的功能以恢复育性的方法。本发明的抑制方法包括,在一个实施方案中,导入长度至少为100个碱基的反义序列,并且其选自互补于编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸的碱基序列。
本发明的另一个目的是提供编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸。本发明提供,在一个实施方案中,该核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
附图简述
图1显示从RFLP标记位点S12564开始的染色体步行实验结果。
图2显示与BAC克隆AC068923相关的λ克隆重叠区(contig)的序列对比。
图3显示重组体花粉(全部有育性)的Rf-1位点附近的染色体组织结构,是根据从该花粉产生的10个个体(RS1,RS2,RC1-8)标记位点的基因型,在最靠近Rf-1位点进行作图的结果。白条代表粳稻(iaponica)区域,而黑条代表籼稻(indica)区域。
图4是基因图谱,其中水稻第10号染色体上的Rf-1基因位点以与各种标记的关系而定位在连锁图谱上;图距值是从1042个F1代个体的分离数据计算出来的。
图5显示用于通过互补分析鉴定Rf-1区域的10个基因组克隆的片段。使用通过染色体步行(细线)获得的λ克隆对以粗线表示的染色体区域进行互补分析。发现XSF18存在缺失,其用点线表示。
图6显示利用来自XSG16的15.7kb片段(实施例10)和来自XSF18的16.2kb片段(实施例8)进行互补分析的结果。通过抽穗证明用XSG16的15.7kb片段转化的植株恢复了育性。
图7是显示Rf-1基因结构的示意图。白条和黑条分别表示外显子和内显子。显示外显子部分的碱基对数目。
图8是显示经互补分析的IR24基因组片段之间位置关系,用于cDNA文库筛选的探针,和从分离的cDNAs推导的Rf-1基因的示意图。Rf-1基因中的白条和黑条分别表示外显子和内显子。显示外显子部分的碱基对数目。
实施本发明的最佳方式
开始我们将Rf-1位点限定在第10号染色体上极小的区域内。以此为基础,我们开发了Rf-1位点附近的PCR标记,并找到一种利用这些与Rf-1位点连锁的PCR标记来检测Rf-1基因的方法。具体地,通过确定与Rf-1位点接近的新PCR标记位点的基因型来检测Rf-1基因的存在并选择Rf-1基因纯合的个体,其中该新标记是根据Rf-1位点作图定位于水稻第10号染色体上的PCR标记位点S12564 Tsp509I和C1361 MwoI之间而建立的。我们先前于2000年8月17日提交了关于检测Rf-1基因的方法的专利申请,其为日本专利申请No.2000-247204。该专利申请的全部公开内容在此引入作为参考。
1.日本专利申请No.2000-247204描述的用于评估Rf-1位点的基因型 的方法
日本专利申请No.2000-247204描述的方法是,根据Rf-1位点作图定位于水稻第10号染色体上的PCR标记位点S12564和C1361之间,进而确定待测水稻个体或其种子是否具有Rf-1基因。
标记
设计特异于Rf-1基因位点附近特定区域的引物对用于PCR,并且扩增产物用特定的限制性内切酶消化;经电泳,在籼稻系中,有些呈现与粳稻系大小不同的可观察条带。在籼稻系中呈现的特有条带在此称为Rf-1连锁带。目前本发明人已证实Rf-1基因位点定位于水稻第10号染色体上的PCR标记S12564 Tsp509I和C1361 MwoI之间,本领域的技术人员可以适当开发和利用Rf-1基因附近存在的PCR标记。
例如,根据本发明,检测待测水稻个体基因组中是否含有下列PCR标记中的至少一个,进而确定被测个体是否具有与这些PCR标记连锁的Rf-1基因:
(1)标记1:PCR标记R1877 EcoRI:当水稻基因组DNA用具有SEQ IDNO:1和SEQ ID NO:2所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶EcoRI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(2)标记2:PCR标记G4003 HindIII(SEQ ID NO:19):当水稻基因组DNA用具有SEQ ID NO:3和SEQ ID NO:4所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶HindIII的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(3)标记3:PCR标记C1361 MwoI(SEQ ID NO:20):当水稻基因组DNA用具有SEQ ID NO:5和SEQ ID NO:6所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MwoI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(4)标记4:PCR标记G2155 MwoI(SEQ ID NO:21):当水稻基因组DNA用具有SEQ ID NO:7和SEQ ID NO:8所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MwoI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(5)标记5:PCR标记G291 MspI(SEQ ID NO:22):当水稻基因组DNA用具有SEQ ID NO:9和SEQ ID NO:10所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MspI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(6)标记6:PCR标记R2303 BslI(SEQ ID NO:23):当水稻基因组DNA用具有SEQ ID NO:11和SEQ ID NO:12所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶BslI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(7)标记7:PCR标记S10019 BstUI(SEQ ID NO:24):当水稻基因组DNA用具有SEQ ID NO:13和SEQ ID NO:14所示序列的DNA引物进行PCR反应,可根据扩增产物中是否具有限制酶BstUI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(8)标记8:PCR标记S10602 KpnI(SEQ ID NO:25):当水稻基因组DNA用具有SEQ ID NO:15和SEQ ID NO:16所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶KpnI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;以及
(9)标记9:PCR标记S12564 Tsp509I(SEQ ID NO:26):当水稻基因组DNA用具有SEQ ID NO:17和SEQ ID NO:18所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶Tsp509I的识别位点,来检测粳稻和籼稻品系个体之间的多态性。
假定Rf-1基因位点最可能定位于水稻(rice)第10号染色体上9个RFLP的标记区域R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G2155的附近(参见Fukuta等人,1992,Jpn.J.Breed.42(supl.1)164-165所描述的RFLP连锁分析的结果,以及Harushima等人,1998,遗传学Genetics148,479-494所描述的水稻RFLP连锁图谱),本发明人将那些RFLP标记转变为共显性PCR标记,如CAPS标记或dCAPS标记,正如下文参考实施例1所描述的(Michaels和Amasino,1998,植物杂志The Plant Journal,14(3),381-385;Neff等人,1998,植物杂志The Plant Journal,14(3),387-392)。通过这种转变得到了上述PCR标记。
在这些PCR标记中,由PCR标记R1877 EcoRI、G291 MspI(SEQ IDNO:22)、R2303 BslI(SEQ ID NO:23)和S12564 Tsp509I(SEQ ID NO:26)组成的一组,以及由C1361 MwoI(SEQ ID NO:20)、S10019 BstUI(SEQ ID NO:24)、G4003 HindIII(SEQ ID NO:19)、S10602 KpnI(SEQ ID NO:25)和G2155MwoI(SEQ ID NO:21)组成的另一组,是分别位于稻第10号染色体上Rf-1基因位点的相对两侧。
因此,在一个实施方案中,通过(a)从PCR标记R1877 EcoRI、G291MspI、R2303 BslI和S12564 Tsp509I组中选择至少一个PCR标记,以及(b)从C1361 MwoI、S10019 BstUI、G4003 HindIII、S10602 KpnI和G2155 MwoI组中至少选择一个PCR标记来检测出Rf-1连锁带,进而确定Rf-1基因的存在。在这种情况下,优选(a)组的至少S12564 Tsp509I和(b)组的至少C1361 MwoI用作最接近Rf-1基因的PCR标记。如果被测水稻的基因组中,用(a)和(b)的PCR标记检测出Rf-1连锁带,则可以评估该水稻很可能包含Rf-1基因。
在另一个实施方案中,通过上述(a)组的至少2个PCR标记和(b)组的至少2个PCR标记来检测Rf-1连锁带。例如,从如图1所示的基因图谱上的Rf-1基因,通过用更接近Rf-1基因的(a)和(b)组的标记可检测到,而用离Rf-1基因较远的(a)和(b)组的标记不能检测到Rf-1连锁带而挑选个体,从而筛选出携带不需要基因区域最小的Rf-1基因的水稻个体。同样优选的,(a)组的至少一个PCR标记是S12564 Tsp509I,而(b)组的至少一个PCR标记是C1361 MwoI。因而,两个PCR标记位点S12564 Tsp509I和C1361 MwoI之间的遗传距离为0.3cM。利用这种特性,从Rf-1基因供体亲本引入的染色体区域可以缩小至大约1cM大小。这有助于将供体亲本中Rf-1基因附近可能存在的有害基因被引入恢复系的可能性降至最小。
Rf-1基因的检测
为了检测待测试水稻的基因组中的Rf-1基因,利用上述SEQ IDNO:1-18的引物进行PCR从水稻基因组扩增上述任何一个PCR标记,然后用聚合酶链式反应-限制性片段长度多态方法(PCR-RFLP)进行检测。PCR-RFLP是一种适用于下述情形的方法,其中不同品种之间,PCR扩增的DNA片段中限制性酶的识别位点存在多态性,并且可根据那些限制性酶的切割模式而方便地鉴定出特异的多态性(D.E.Harry等人,Theor.Appl.Genet.(1998),97:327-336)。
限制性内切酶的切割模式根据所使用的引物对在可观察的凝胶上,如下述表1所示显示条带。
                        表1
                                                                               检测条带的大致大小(bp)
    使用引物对1检测标记1(R1877 EcoRI)当待测水稻的基因组纯合的具有Rf-1基因时:  1500和1700当待测水稻的基因组杂合的具有Rf-1基因时:  1500、1700和3200当待测水稻的基因组不具有Rf-1基因时:      3200
    使用引物对2检测标记2(G4003 HindIII)当待测水稻的基因组纯合的具有Rf-1基因时:  362当待测水稻的基因组杂合的具有Rf-1基因时:  95、267和362当待测水稻的基因组不具有Rf-1基因时:      95和267
    使用引物对3检测标记3(C1361 MwoI)当待测水稻的基因组纯合的具有Rf-1基因时:  50和107当待测水稻的基因组杂合的具有Rf-1基因时:  25、50、79和107当待测水稻的基因组不具有Rf-1基因时:      25、50和79
    使用引物对4检测标记4(G2155 MwoI)当待测水稻的基因组纯合的具有Rf-1基因时:  25、27和78当待测水稻的基因组杂合的具有Rf-1基因时:  25、27、78和105当待测水稻的基因组不具有Rf-1基因时:      25和105
    使用引物对5检测标记5(G291 MspI)当待测水稻的基因组纯合的具有Rf-1基因时:  25、49和55当待测水稻的基因组杂合的具有Rf-1基因时:  25、49、55和104当待测水稻的基因组不具有Rf-1基因时:      25和104
    使用引物对6检测标记6(R2303 BslI)当待测水稻的基因组纯合的具有Rf-1基因时:  238、655和679当待测水稻的基因组杂合的具有Rf-1基因时:  238、655、679和1334当待测水稻的基因组不具有Rf-1基因时:      238和1334
    使用引物对7检测标记7(S10019 BstUI)当待测水稻的基因组纯合的具有Rf-1基因时:  130、218和244当待测水稻的基因组杂合的具有Rf-1基因时:  130、218、244和462当待测水稻的基因组不具有Rf-1基因时:      130和462
    使用引物对8检测标记8(S10602 KpnI)当待测水稻的基因组纯合的具有Rf-1基因时:  724当待测水稻的基因组杂合的具有Rf-1基因时:  117、607和724当待测水稻的基因组不具有Rf-1基因时:      117和607
    使用引物对9检测标记9(S12564 Tsp509I)当待测水稻的基因组纯合的具有Rf-1基因时:  41和117当待测水稻的基因组杂合的具有Rf-1基因时:  26、41、91和117当待测水稻的基因组不具有Rf-1基因时:      26、41和91
II.Rf-1位点的鉴定
如上所述,日本专利申请No.2000-247204所公开的RFLP-PCR标记,是基于我们发现Rf-1位点作图定位于DNA标记位点S12564 Tsp509I和C1361 MwoI之间。通过将Rf-1基因回交引入不含有Rf-1基因的正常粳稻品种中而建立育性恢复的品系。如果在这个过程中使用日本专利申请No.2000-247204所描述的鉴定Rf-1位点的方法,不仅可以有效建立恢复系(2-3年内),而且可以控制插入片段的长度。
然而,经杂交的引入不可避免的将Rf-1附近的区域也同时引入。日本专利申请No.2000-247204表明Rf-1位点作图定位于DNA标记位点S12564Tsp509I和C1361 MwoI之间,但这两个位点的距离为约0.3cM,即约90kbp。如果在Rf-1附近存在有害基因,不可否认该有害基因将可能与Rf-1基因一起被插入。
因此,基于Rf-1位点和DNA标记位点S12564 Tsp509I之间的紧密连锁,我们通过染色体步行和遗传分析在DNA标记位点S12564 Tsp509I和C1361 MwoI之间搜寻与Rf-1基因连锁的区域。结果,我们成功的鉴定出包括Rf-1基因,多达约76kb的区域,并确定了所述区域的全部碱基序列。根据本发明,将有可能通过遗传工程将育性恢复基因的功能导入到BT型雄性不育细胞质中。
具体地,在日本专利申请No.2000-247204中,对通过用MS-FRKoshihikari(在Rf-1位点是杂合的)对MS Koshihikari进行授粉而制备的1042个个体的群体进行连锁分析,发现1个Rf-1和S12564 Tsp509I位点之间发生重组的重组体和2个在Rf-1和C1361 MwoI位点之间发生重组的重组体(在此参考实施例1-2)。在本发明中,向群体中增加了4103个个体从而总共分析了5145个个体。结果,新发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组体和6个在Rf-1和C1361 MwoI位点之间发生重组的重组体,总数分别为2和8个重组体。通过本发明的高精度分离分析检测这10个个体是邻近Rf-1位点发生重组的重组体(实施例1)。
比较在Rf-1和C1361 MwoI位点之间的8个重组体和在Rf-1和S12564Tsp509I位点之间的2个重组体的频率,表明S12564 Tsp509I位点与Rf-1位点的遗传距离比C1361 MwoI位点的更近。遗传距离(以重组频率表示:cM)和物理距离(以碱基对数目表示:bp)并不总是成比例的,但通常可认为遗传距离减小,其物理距离也减小。
因此,我们试图从S12564 Tsp509I位点开始进行染色体步行来分离Rf-1位点(实施例2)。利用籼稻品种IR24和粳稻品种Asominori的基因组DNA,从λDASH II载体制备基因组文库来进行染色体步行。IR24是携带Rf-1的品种,而Asominori是不携带Rf-1的品种。染色体步行的结果是,从IR24的基因组克隆中制备了覆盖约76kp的染色体区域的重叠群(染色体上的重叠克隆的按序排列的组(odered set)),进而确定了其整个碱基序列(76363bp)。
然后,根据所获得的碱基序列数据等新开发了12个标记,并对上述接近Rf-1位点的10个重组体进行高精度分离分析(实施例3)。结果是,包括在上述约76kb的染色体区域中的65kb序列显示包含确定Rf-1基因功能存在的序列。这个区域被由8个基因组克隆组成的重叠区所覆盖。每个克隆长度为约12-22kb,并且具有至少为4.7kb的重叠结构域。已知水稻基因的长度范围很广(从短到长),但看来大部分基因的长度为几个kb或更短。因此,这8个基因组克隆中至少有一个预期包含全长的Rf-1基因。
我们进一步在上述约76kb的染色体区域中限定Rf-1基因区域,并进行互补分析以直接证明育性恢复能力的存在。
具体而言,通过遗传工程技术将上述76kb区域中的10个部分片段(每个10-21kb)分别导入雄性不育系MS Koshihikari的未成熟种子中(图5)。在所利用的10个部分片段中,8个片段来自于先前通过染色体步行所获得的8个基因组克隆(图1中所示的XSE1、XSE7、XSF4、XSF20、XSG22、XSG16、XSG8和XSH18,并在实施例3中描述)。此外,来自于两个克隆XSF18和XSX1的片段也进行了互补分析。XSF18在5′和3′末端与XSF20是相同的(分别是SEQ ID NO:27的第20328位和41921位碱基),但缺乏中间的第33947-38591位碱基。这是因为克隆XSF18是最初分离的,但在分离后的扩增中发现包含上述缺失,因此重新进行扩增步骤来分离标为XSF20的完整克隆(实施例8)。XSX1是从克隆XSG8和XSH18,通过限制性内切酶处理并连接以包含足够的重叠结构域而重新制备的,因为两克隆的重叠结构域相对较小(约7kb)(实施例13)。
由于Rf-1是显性基因,如果插入片段完全包含Rf-1基因,转化的个体在当代即恢复育性。在互补分析中,评估用每个片段转化的植株的种子育性,以发现用来源于λ噬菌体克隆XSG16的15.6kb片段(包括SEQ ID NO:27的第38538-54123位的碱基)转化的恢复种子育性的植株(实施例10)。用其它片段转化的植株全都是不育的。这些结果表明上述15.6kb片段完全包含Rf-1基因。而且,本发明提供的通过遗传工程技术导入Rf-1基因的方法证明是有效的。
为了进一步详细说明λ噬菌体克隆XSG16中包含Rf-1基因的区域,我们通过互补分析评估比15.6kb片段(包括SEQ ID NO:27的第38538-54123位碱基)更短的片段的种子育性。结果是,用来自XSG16的11.4kb片段(包括SEQ ID NO:27的第42357-53743位碱基)转化的植株显示恢复种子育性(实施例10(2))。用更短的6.8kb片段(包括SEQ ID NO:27的第42132-48883位碱基)转化的植株也恢复种子育性(实施例10(3))。这些结果表明上述6.8kb片段包含Rf-1基因。
本发明进一步继续研究和鉴定具有恢复育性功能的核酸。已经证实了由核酸编码的氨基酸序列。具体地,首先利用如实施例14-15所描述的PCR制备相应于SEQ ID NO:27的第43733-44038位和48306-50226位碱基的DNA片段。利用上述的两个DNA片段作为探针(探针P和Q)筛选从导入Rf-1基因的Koshihikari品系制备的cDNA文库。结果是,6个克隆的末端碱基序列与XSG16的序列相同,分离这6个含有Rf-1基因的克隆,并且分析其碱基序列(SEQ ID NOS:69-74)。
所有的序列,SEQ ID NOS:69-74编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每个SEQ ID NO:69的第215-2587位,SEQ ID NO:70的第213-2585位的碱基,SEQ ID NO:71的第218-2590位的碱基,SEQ ID NO:72的第208-2580位的碱基,SEQ ID NO:73的第149-2521位的碱基和SEQ ID NO:74的第225-2597位的碱基编码具有SEQID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ ID NO:27的第43907-46279位的碱基。
将SEQ ID NO:75的氨基酸序列与推测的玉米育性恢复基因(Rf2)的氨基酸序列比较,两个氨基酸序列中N-末端的7个氨基酸残基(Met-A1a-Arg-Arg-Ala-Ala-Ser)都同时存在。这7个氨基酸残基被认为是线粒体的靶信号部分(Liu等人,2001)。根据上述事实,认为这种情形下分离的cDNAs包含Rf-1基因的全部编码区域。除了上述区域外,没有发现水稻Rf-1和玉米Rf-2的氨基酸序列之间的同源性。
此外,将这种情形下分离的cDNAs序列与IR24(SEQ ID NO:27)的基因组序列比较,证明了Rf-1基因外显子和内含子的结构(图7)。结果是,在植株体内显示多种转录产物中剪接模式和poly A的加入位置是不同的。Rf-1基因的编码区域中没有内含子。
对于在实施例10(3)的互补分析中恢复种子育性的6.8kb片段,本发明者进一步继续互补分析。具体地,在实施例16中,对包含启动子区域的4.2kb片段(SEQ ID NO:27的第42132-46318位的碱基)和上述6.8kb片段内Rf-1基因的假定翻译区域进行互补分析,4.2kb片段恢复种子育性。
进一步地,在实施例17中,获得6个包含具有育性恢复功能的核酸的新克隆。具体地,利用相应于SEQ ID NO:27的第45522-45545和45955-45932位碱基的引物,以及IR24的基因组克隆XSG16作为模板进行PCR以获得DNA片段。利用DNA片段作为探针R和上述提到的探针P进行噬菌斑杂交分析。从对探针P和探针R为阳性的噬菌斑新获得6个克隆(#7-#12)。结果显示在SEQ ID NOS:80-85中。
推测所有的序列,SEQ ID NOS:80-85编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每个SEQ ID NO:80的第229-2601位,SEQ ID NO:81的第175-2547位的碱基,SEQ ID NO:82的第227-2599位的碱基,SEQ ID NO:83的第220-2592位的碱基,SEQ ID NO:84的第174-2546位的碱基和SEQ ID NO:85的第90-2462位的碱基编码具有SEQ ID NO:75的1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将这种情形下分离的cDNAs序列与IR24(日本专利公开No.2001-285247,SEQ ID NO:27)的基因组序列比较,证明了外显子和内含子的结构(图8)。这种情况下分离的cDNAs之间,3个cDNAs没有任何与推测的翻译区域不相关的外显子,并且由单个的外显子组成(#10-#12,SEQ ID NOS:83-85)。
III.包含Rf-1位点的核酸
本发明提供包含育性恢复基因位点(Rf-1)的核酸。本发明所述包含育性恢复基因位点(Rf-1)的核酸包括具有SEQ ID NO:27的碱基序列或具有与SEQ ID NO:27的碱基序列至少70%相同,并有恢复育性功能的的碱基序列。进一步如实施例10中所描述的,证实Rf-1基因尤其完全包含于SEQ IDNO:27的第38538-54123位的碱基序列中。更进一步的,确定包含Rf-1基因的区域优选是SEQ ID NO:27的第38538-54123位碱基,更优选是第42357-53743位碱基,更加优选是第42132-48883位碱基,以及还优选第42132-46318位碱基。
本发明人进一步继续研究,确定下列区域是含有Rf-1基因的核酸。
a)SEQ ID NO:69的第215-2587位的碱基;
b)SEQ ID NO:70的第213-2585位的碱基;
c)SEQ ID NO:71的第218-2590位的碱基;
d)SEQ ID NO:72的第208-2580位的碱基;
e)SEQ ID NO:73的第149-2521位的碱基;
f)SEQ ID NO:74的第225-2597位的碱基;
h)SEQ ID NO:80的第229-2601位的碱基;
i)SEQ ID NO:81的第175-2547位的碱基;
j)SEQ ID NO:82的第227-2599位的碱基;
k)SEQ ID NO:83的第220-2592位的碱基;
l)SEQ ID NO:84的第174-2546位的碱基;和
m)SEQ ID NO:85的第90-2462位的碱基。
上述碱基序列相应于g)SEQ ID NO:27的第43907-46279位的碱基;并且所有的碱基编码SEQ ID NO:75的第1-791位的氨基酸序列。
在此后的本说明书中,术语“SEQ ID NO:27的碱基序列”指SEQ IDNO:27的全部碱基序列或其对育性恢复功能起作用的部分序列,特别是第38538-54123位的碱基。该术语更优选的指第42357-53743位的碱基,还优选指第42132-48883位的碱基,还更优选指第42132-46318位的碱基。以及最优选,它指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQID NO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQ ID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ IDNO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQ ID NO:85的第90-2462位的碱基。
在下面的实施例中,从含有Rf-1基因的籼稻水稻IR24基因组文库中分离了包含育性恢复基因(Rf-1)的核酸,并且确定其具有SEQ ID NO:27的碱基序列。然而,本发明的包含育性恢复基因(Rf-1)的核酸可来源于任何携带RF-1基因的籼稻品种。携带Rf-1基因的籼稻品种包括,但不特异地限于,例如IR24、IR8、IR36、IR64、Chinsurah和BoroII。已知的不携带Rf-1基因的粳稻品种包括,但不限于,例如Asominori、Koshihikari、Kirara 397、Akihikari、Akitakomachi、Sasanishiki、Kinuhikari、Nipponbare、Hatsuboshi、Koganebare、Hinohikari、Mineasahi、Aichinokaori、Hatsushimo、Akebono、Fujihikari、Minenoyukimochi、Kokonoemochi、Fukuhibiki、Dontokoi、Gohyakumangoku、Hanaechizen、Todorokiwase、Haenuki、Domannaka、Yamakikari等。“籼稻”和“粳稻”品种对本领域的技术人员来说是众所周知的,并且本发明所包括的水稻品种对本领域的技术人员而言也是容易确定的。
本发明的核酸包括单链和双链形式的DNA,及其互补的RNA。DNA包括,例如,基因组DNA(包括相应的cDNA)、化学合成的DNA、由PCR扩增的DNA,及其组合。
本发明的包含Rf-1基因的核酸优选具有SEQ ID NO:27的碱基序列。不只一个密码子可编码相同的氨基酸,这称为遗传密码的简并性。因此,与SEQ ID NO:27不完全相同的DNA序列可能与具有SEQ ID NO:27编码完全相同的氨基酸序列的蛋白质。这种变体DNA序列可能是由于沉默突变导致的(例如在PCR扩增过程中产生),或也可能是天然序列的故意(deliberate)诱变的产物。
优选的,本发明的Rf-1基因编码SEQ ID NO:75中所描述的氨基酸序列。然而,其不只限于此,并且可编码其中缺失、添加或取代一个或多个氨基酸残基的氨基酸序列。
本发明的蛋白质包括任何同源的蛋白质,只要其具有育性恢复功能。“氨基酸变异”发生在一个或多个氨基酸残基,优选1-20,更优选1-10,最优选1-5个氨基酸残基。由Rf-1基因编码的氨基酸序列与SEQ ID NO:75的氨基酸序列具有至少约70%,优选约80%或更大,更优选约90%或更大,还优选约95%或更大,以及最优选约98%或更大的同一性。
氨基酸的同一性百分数可通过目测和数学计算来确定。两个蛋白质序列之间的同一性百分数可通过基于Needleman,S.B.和Wunsch,C.D.(J.Mol.Biol.,48:443-453,1970)算法比较序列信息,并利用可从威斯康星(Wisconsin)大学遗传计算机组(UWGCG)获得的GAP计算机程序来确定。“GAP”计算机程序优选的默认参数包括:(1)如Henikoff,S和Henikoff,J.G.(Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)所描述的积分矩阵,blosum62;(2)对于每个缺口(gap)罚分(penalty)为12;(3)对于每个缺口的每个长度罚分为4;以及(4)对于末端缺口不罚分。
也可使用本领域的技术人员用于序列比较的其他程序。例如,同一性百分数可通过利用如Altschul等人(核酸研究Nucl.Acids.Res.25.,第3389-3402页,1997)所描述的BLAST程序比较序列信息来确定。该程序可从国家生物技术信息中心(NCBI)的网点,或国际互联网上的日本DNA数据库(DDBJ)的网点获得。关于经BLAST程序的同源性搜索的各种因素(参数)在该网点上有详细描述。通常利用默认参数进行搜索,也可适当改变一些设置。
本领域的技术人员众所周知,即使具有相同功能的蛋白质,根据其来自不同的品种而具有不同的氨基酸序列。本发明的Rf-1基因包括SEQ IDNO:27所示碱基序列的同系物和变体,只要它们具有恢复育性的功能。术语“具有恢复育性的功能”指当这种DNA片段导入后可使水稻植株个体或其种子获得育性。育性恢复可能是由于经Rf-1基因的蛋白表达或可赋予育性的Rf-1基因核酸(DNA或RNA)本身的一些功能所导致。
Rf-1基因同系物或变体是否具有育性恢复功能可通过下面列举的方法来检验,但并不限于此。将待测核酸片段导入到根据Hiei等人(植物杂志Plant Journal(1994),6(2),第272-282页)的方法,用MS-FR Koshihikari对MS Koshihikari(不育系)进行授粉而获得的未成熟种子中。所获得的转化体在正常条件下进行培养,只有被测核酸片段具有育性恢复功能时,种子才能成熟。
来源于不携带Rf-1基因的粳稻Asominori相应区域的核酸具有如SEQID NO:28所示的碱基序列。SEQ ID NO:28和SEQ ID NO:27的相应部分大体上有约98%的同一性。因此,本发明的包含育性恢复基因(Rf-1)位点的核酸与SEQ ID NO:27至少约70%,优选约80%或更大,更优选90%或更大,还更优选95%或更大,最优选98%或更大%的同一性。特别的,术语“SEQ IDNO:27”指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQ IDNO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQ ID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ IDNO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQ ID NO:85的第90-2462位的碱基中的任何一项。
核酸的同一性百分数可通过目测和数学计算来确定。备选地,两个核酸序列之间的同一性百分数可利用如Devereux等人,核酸研究Nucl.AcidsRes.,12:387(1984)所描述的,并可从威斯康星大学遗传计算机组(UWGCG)获得的GAP计算机程序,6.0版本来比较序列信息而确定。GAP程序优选的默认参数包括:(1)碱基的一元比较矩阵(包含相同时值为1,不同时值为0),以及Gribskov和Burgess,核酸研究Nucl.Acids Res.,14:6745(1986)的加权(weighted)比较矩阵,如Schwartz和Dayhoff编辑的蛋白质序列和结构的图集Atlas of Protein Sequence and Structure,国家生物医学研究基金会National Biomedical Research Foundation,第353-358页所描述的;(2)对于每个缺口罚分为3.0,对于每个缺口中的每个记号(symbol)额外罚分为0.10;以及(3)对于末端缺口不罚分。也可以采用本领域技术人员用于序列比较的其它程序。
本发明的核酸也包括在中等严谨条件下能与SEQ ID NO:27的碱基序列进行杂交并具有育性恢复功能的核酸,以及在高度严谨条件下能与SEQID NO:27的碱基序列进行杂交并具有育性恢复功能的核酸。
如在此所使用的,本领域技术人员可根据例如,DNA的长度容易地确定中等严谨的条件。基本条件如Sambrook等人,分子克隆:实验室指南Molecular Cloning:A Laboratory Manual,第二版,Vol1,第1.101-104页,冷泉港实验室出版社,(1989)所阐述的,并包括利用硝化纤维素滤膜的预洗溶液,5×SSC,0.5%SDS,1.0mM EDTA(pH8.0),杂交条件为约1×SSC-6×SSC,于约40℃-60℃(或其它类似的杂交溶液,如Stark’s溶液,约50%甲酰胺中,于约42℃),以及洗涤条件为在约60℃,0.5×SSC,0.1%SDS。当杂交溶液包含约50%甲酰胺时,杂交温度可降低约15-20℃。本领域技术人员也可根据例如DNA的长度容易地确定高度严谨的条件。通常,高度严谨的条件包括相对于上述中等严谨的条件而言,其杂交和/或洗涤条件为在更高温度和/或更低的盐浓度下进行。例如,这些条件包括,杂交条件为0.1×SSC-0.2×SSC,在约60-65℃和/或洗涤条件为0.2×SSC,0.1%SDS在约65-68℃。本领域技术人员认识到可根据例如探针长度的因素来必要的调节温度和洗涤溶液的盐浓度。
特别优选的,“SEQ ID NO:27”指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQ ID NO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ ID NO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQID NO:85的第90-2462位的碱基中的任何一项。
本发明的DNA也包括由于缺失、插入或取代一个或多个碱基而不同于SEQ ID NO:27的碱基序列,但仍保持育性恢复功能的核酸。只要保持育性恢复功能,缺失、插入或取代碱基的数目没有特别的限制,但优选为1至数千个,更优选1-1000,还更优选1-500,甚至更优选1-200,最优选1-100个碱基。
根据本说明书在此的描述,Rf-1基因已经进一步得到说明,并且本领域技术人员可以在除去例如除Rf-1基因之外的区域或Rf-1基因中内含子区域的核酸后而加以利用。可例如通过用具有相似理化特性的残基替换给定的氨基酸(特别的,SEQ ID NO:75的氨基酸序列)。这种保守取代的实例包括将一个脂肪族残基变化为另一个,例如将Ile、Val、Leu或Ala中的一个变化为另一个;将一个极性残基变化为另一个,例如在Lys和Arg、Glu和Asp、或Gln和Asn之间的变化;或一个芳香族残基变化为另一个,例如将Phe、Trp或Tyr中的一个变化为另一个。其它已知的保守取代包括,例如在具有相似疏水特性的整个区域之间的变化。本领域技术人员可利用如Sambrook等人分子克隆:实验室指南Molecular Cloning:A LaboratoryManual,第二版,冷泉港实验室出版社,(1989)所描述的,已知的遗传工程技术,利用例如位点特异性突变引入所需要的缺失、插入或取代。
我们将携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24与不携带Rf-1基因,如Asominori(SEQ ID NO:28)和GenBank保藏的Nipponbare BAC克隆(登录号AC068923)的粳稻品种进行比较。结果,我们发现含有Rf-1基因的籼稻品种的Rf-1区域至少具有下述的单个碱基多态性(SNP)。
1)与SEQ ID NO:27的第1239位碱基相应的碱基是A;
2)与SEQ ID NO:27的第6227位碱基相应的碱基是A;
3)与SEQ ID NO:27的第20680位碱基相应的碱基是G;
4)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
5)与SEQ ID NO:27的第49609位碱基相应的碱基是A;
6)与SEQ ID NO:27的第56368位碱基相应的碱基是T;
7)与SEQ ID NO:27的第57629位碱基相应的碱基是C;以及
8)与SEQ ID NO:27的第66267位碱基相应的碱基是G。
因此,本发明包含Rf-1区域的核酸优选地符合上述1)-8)中一个至全部的条件。
在下面的实施例3中,在Rf-1区域中检测最接近Rf-1基因的重组体(RS1-RS2,RC1-RC8)的染色体组织结构。结果显示确定Rf-1基因功能存在的序列包含于SEQ ID NO:27的第1239-66267位的碱基序列,即在最大可能估计的P4497 MboI-B56691 XbaI位点之间的区域(约65kb)(图3)。然而,可能对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,而不管其余区域是粳稻还是籼稻基因型,其遗传功能可能没有显著的变化。可能还有一个极端的情况,在粳稻与籼稻之间,编码区域是完全相同的而只有启动子区域不同;并且启动子区域和编码区域只部分的包含在P4497 MboI-B56691 XbaI位点之间(约65kb)的区域内。因此,不能得出结论认为上述的普通籼稻区域(SEQ ID NO:27的第1239-66267位碱基)完全包含了完整的Rf-1基因。然而,认为至少SEQ ID NO:27完全包含了完整的Rf-1基因,原因如下:
1)基因的大小通常为几千个碱基而很少超过10kb;
2)由本发明确定的IR24基因组碱基序列(SEQ ID NO:27)完全包含上述的普通籼稻区域;
3)SEQ ID NO:27的5′末端位于上述普通籼稻区域5′末端的上游1238bp处,并形成另一个基因的一部分(S12564);以及
4)SEQ ID NO:27的3′末端位于上述普通籼稻区域3′末端的下游10096bp处。
如此,我们第一次成功的将Rf-1基因的区域限定到76kb内。因此,相对于现有技术,例如日本专利公开No.2000-139465中所描述的,用与Rf-1基因的遗传距离为约1cM(约300kb)的共显性标记所选择出来的核酸,本发明包含Rf-1基因区域的核酸含有与Rf-1基因接近的其它基因的可能性大大减少。而且,相对于我们现有的日本专利申请No.2000-247204中所描述的,用DNA标记位点S12564 Tsp509I和C1361 MwoI(其间的距离为约0.3cM)所选择出来的核酸,本发明上述的核酸含有其它基因的可能性也减少了。
我们进而通过互补分析证实Rf-1基因完全包含在特别为SEQ IDNO:27碱基序列的第38538-54123位碱基中。因而,在本发明的一个实施方案中,与SEQ ID NO:27的碱基序列或与SEQ ID NO:27第38538-54123位碱基的碱基序列至少70%相同的碱基序列至少符合下面条件1)和2)中的至少一个:
1)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
2)与SEQ ID NO:27的第49609位碱基相应的碱基是A。
本发明人进一步确定下列区域为含有Rf-1基因的核酸。
a)SEQ ID NO:69的第215-2587位的碱基;
b)SEQ ID NO:70的第213-2585位的碱基;
c)SEQ ID NO:71的第21 8-2590位的碱基;
d)SEQ ID NO:72的第208-2580位的碱基;
e)SEQ ID NO:73的第149-2521位的碱基;
f)SEQ ID NO:74的第225-2597位的碱基;
h)SEQ ID NO:80的第229-2601位的碱基;
i)SEQ ID NO:81的第175-2547位的碱基;
j)SEQ ID NO:82的第227-2599位的碱基;
k)SEQ ID NO:83的第220-2592位的碱基;
l)SEQ ID NO:84的第174-2546位的碱基;和
m)SEQ ID NO:85的第90-2462位的碱基。
上述碱基序列相应于g)SEQ ID NO:27的第43907-46279位的碱基。本发明的核酸进一步包括
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
SEQ ID NO:27的第45461位碱基相应于1)SEQ ID NO:69的第1769位碱基;2)SEQ ID NO:70的第1767位碱基;3)SEQ ID NO:71的第1772位碱基;4)SEQ ID NO:72的第1762位碱基;5)SEQ ID NO:73的第1703位碱基;6)SEQ ID NO:74的第1779位碱基;7)SEQ ID NO:80的第1783位碱基;8)SEQ ID NO:81的第1729位碱基;9)SEQ ID NO:82的第1781位碱基;10)SEQ ID NO:83的第1774位碱基;11)SEQ ID NO:84的第1728位碱基;以及12)SEQ ID NO:85的第1644位碱基。因此,特别优选的,用于本发明方法的的核酸符合下列条件1)-12)中的至少一个:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
IV.恢复水稻育性的方法
本发明提供用于恢复水稻育性的方法,包括将核酸导入到水稻中,其中所述核酸具有SEQ ID NO:27所示的碱基序列或具有与SEQ ID NO:27的碱基序列至少70%相同,并具有恢复育性功能的碱基序列。本发明的方法可包将核酸导入到水稻中,其中所述核酸具有SEQ ID NO:27的部分,尤其是SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选42132-48883位碱基,或具有与SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基至少70%相同,并具有恢复育性功能的碱基序列。
在本发明特别优选的实施方案中,将编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,并具有恢复育性功能的核酸导入水稻。最优选的,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,并具有恢复育性功能的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
在本发明中,可导入水稻的包含育性恢复基因(Rf-1)位点的核酸,可以是上述在“III.包含Rf-1位点的核酸”中描述的任何一个核酸。用于将核酸导入水稻的方法可以是任何已知的方法,而没有特别的限制。本发明的核酸可通过已知的遗传工程技术或杂交而导入。遗传工程技术是优选使用的,因为可以防止包含其它邻近基因,并能缩短建立品系的周期。
可以使用遗传工程技术中任何用于转导的合适的表达系统。重组表达载体包括可被导入水稻的,含有本发明育性恢复基因(Rf-1)的核酸,该核酸可操作的连接于例如来源于哺乳动物、微生物、病毒或昆虫基因的合适的转录或翻译调节序列。
调节序列的实例包括转录启动子、操纵子或增强子、mRNA核糖体结合位点以及调控转录和翻译起始和终止的合适序列。当调节序列功能性地与DNA序列关联时,将碱基序列可操作地连接于调控序列。因此,如果启动子碱基序列控制DNA序列的转录,则将启动子碱基序列可操作连接于该DNA序列。通常将使DNA在水稻中能够复制的复制原点,和用于鉴定转化体的选择基因整合到表达载体中。对于可选择的标记,常规使用的可选择标记都可通过标准方法来使用。实例是针对抗生素,如四环素、氨苄青霉素、卡那霉素、新霉素、潮霉素或壮观霉素的抗性基因。
此外,可将编码合适信号肽(水稻本身或异源的)的序列整合到表达载体中。可将信号肽的DNA序列(分泌前导区)与本发明的核酸序列以读框内的方式融合,以便DNA开始转录,并且mRNA翻译成为含有信号肽的融合蛋白。
本发明也提供包含本发明基因的重组载体。用于将本发明基因的DNA片段整合到例如质粒的载体中的方法,在例如Sambrook,J.等人,分子克隆,实验室指南Molecular Cloning,A Laboratory Manual,(第二版),冷泉港实验室,1.53(1989)中有描述。商业上可获得的连接试剂盒(例如,购自TAKARA)使用非常方便。进而将获得的重组载体(如重组质粒)转化到宿主水稻细胞中。
通过标准方法将所需要的基因与本领域中可获得的重组载体(如质粒DNA)连接而方便的制备得到载体。植物转化载体尤其适合于利用本发明的核酸片段来赋予水稻育性。对用于植物的载体没有特别的限制,只要它们在植物细胞中能够表达令人感兴趣的基因而产生蛋白质,但优选地包括pBI221、pBI121(Clontech)、和其衍生的载体。尤其是,用于转化属于单子叶植物的水稻的载体包括pIG121Hm和pTOK233(Hiei等人,Plant J.,6,271-282(1994)),和pSB424(Komari等人,Plant J.,10,165-174(1996))。
通过用本发明的核酸片段替换上述载体中的β-葡糖苷酸酶(GUS)基因而构建植物转化载体,并转染到植物中来制备转基因植物。植物转化载体优选至少包括启动子、起始密码子、所需要的基因(本发明的核酸序列或其部分)、终止密码子和终止子。如果需要也可以包含编码信号肽的DNA、增强子序列、所需要基因的5′和3′非翻译区、可选择的标记区域等。只要能在植物细胞中发挥作用,对启动子和终止子没有特别的限制,其中组成型表达启动子包括最初已包含在上述载体中的35S启动子,以及肌动蛋白和遍在蛋白(ubiquitin)基因的启动子。
用于将质粒导入宿主细胞的合适方法包括利用磷酸钙或氯化钙/氯化铷、电穿孔、电注射、用PEG等化学处理,使用基因枪等,其在Sambrook,J.等人,分子克隆,实验室指南Molecular Cloning,A Laboratory Manual,(第二版),冷泉港实验室,1.74(1989)中有描述。可通过例如叶盘法[科学Science,227,129(1985)]或电穿孔法[自然Nature,319,791(1986)]来转化植物细胞。
将基因转导入植物的方法包括利用农杆菌(Agrobacterium)介导(Horsch等人,科学Science,227,129(1985);Hiei等人,Plant J.,6,271-282(1994))、电穿孔(Fromm等人,自然Nature,319,791(1986))、PEG(Pazkowski等人,EMBOJ.,3,2717(1984))、微注射(Crossway等人,Mol.Gen.Genet.,202,179(1986))、粒子轰击(McCabe等人,Bio/Technology,6,923(1988))。对这些方法没有特别的限制,只要它们适合于将核酸转导入所需要的植物中。
经杂交的转导可如下举例进行。首先,将Rf-1供体亲本与粳稻品种杂交获得的F1,与粳稻品种回交。在所得到的植株个体中筛选在S12564Tsp509I位点纯合的粳稻和在P4497 MboI和B53627 BstZ17I位点杂合的个体,并进一步进行回交。在所得到的植株个体中筛选在P4497 MboI和B56691 XbaI位点杂合的个体和在B53627 BstZ17I位点杂合的粳稻,并进一步进行回交。随后,对在P4497 MboI和B56691 XbaI位点杂合的个体的每个回交后代进行筛选并用于后继的回交,重复进行约10个循环。最终,将在P4497 MboI和B56691 XbaI杂合的个体进行自交,并在所得到的个体中筛选在两个位点都是纯合的籼稻,由此就获得遗传来自Rf-1供体亲本的,P4497 MboI-B56691 XbaI之间有限的染色体区域的恢复系。
根据本发明,分离包含育性恢复基因(Rf-1)的核酸,由此利用遗传工程方法将Rf-1基因导入到水稻品种中以建立恢复系。本发明首次成功地将Rf-1区域限定在76kb或更窄的区域内。因此,本发明的包含Rf-1位点的核酸,相对现有技术而言,极大的减少了含有与Rf-1基因邻近的其它基因的可能性。而且,通过本发明确定了包含Rf-1基因区域的全部碱基序列。根据在此的说明书,本领域技术人员可对Rf-1基因本身进行进一步的分析。因而,可以只导入Rf-1基因,而不包括任何邻近基因。当邻近基因带来有害性状时,这是尤其重要的。此外,可以比通过杂交所获得的,在更短的时间内,如1-2年内建立恢复系。
在实施例4-13和17在此所描述的互补分析中,通过农杆菌介导法,用来自图5中所描述的10个克隆的片段实际转化MS Koshihikari(具有BT型细胞质且核心基因基本上与Koshihikari相同)。结果证明,可从包含SEQID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基的碱基序列的核酸建立育性恢复系。
用于建立水稻恢复系的农杆菌介导法在Hiei等人,Plant J.,6,第271-282页(1994)、Komari等人,Plant J.,10,第165-174页(1996)、Ditta等人,Proc.Natl.Acad.Sci.USA 77:第7347-7351(1980)中有描述,但不限于此。
首先,制备含有待插入的令人感兴趣的核酸片段的质粒载体。合适的质粒载体包括例如具有如Komari等人,Plant J.,10,第165-174(1996),同上所描述的质粒图谱的pSB11、pSB22等。备选的,本领域技术人员自己也可根据如上所述的pSB11、pSB22的质粒载体来构建适合的载体。在下面的实施例中,以pSB11为基础制备具有潮霉素抗性基因盒的中间载体pSB200并加以利用。具体地,首先将胭脂碱合酶终止子(Tnos)与遍在蛋白启动子和遍在蛋白内含子融合(Pubi-ubiI)。将潮霉素抗性基因(HYG(R))插入到所得到的Pubi-ubiI-Tnos复合体的ubiI和Tnos之间,以产生Pubi-ubiI-HYG(R)-Tnos组合件。将该组合件与pSB11(Komari等人,如上)的HindIII/EcoRI片段融合以产生pKY205。将用于添加限制性内切酶位点NotI、NspV、EcoRV、KpnI、SacI、EcoRI的接头序列插入到该pKY205的Pubi的上游HindIII位点,以产生具有潮霉素抗性基因盒的pSB200。
然后,用包含插入核酸的重组载体转化大肠杆菌细胞(例如DH5α、JM109、MV1184,均可从例如TAKARA商业购买得到)。
因此,根据例如Ditta等人(1980)的方法将转化的大肠杆菌细胞用于与农杆菌菌株,优选同时与辅助大肠杆菌菌株组合)进行三亲杂配。合适的农杆菌菌株包括根瘤农杆菌(Agrobacterium tumefaciens)菌株,如LBA4404/pSB1、LBA4404/pNB1、LBA4404/pSB3等。它们均具有Komari等人,Plant J.,10,第165-174页(1996),同上中所描述的质粒图谱,且本领域技术人员也可利用它们来构建载体。合适的辅助大肠杆菌菌株包括但不限于,例如HB101/pRK2013(可从Clontech获得)。有报道显示携带pRK2073的大肠杆菌细胞也可用作辅助大肠杆菌,虽然它们并不常用(Lemas等人,质粒Plasmid 1992,27,第161-163页)。
然后,根据例如Hiei等人(1994)的方法将欲交配的农杆菌细胞转化到雄性不育的水稻中。通过例如用粳稻品种对雄性不育水稻进行授粉来制备为转化所需的未成熟水稻种子。
可通过例如评估直立(standing)植株中抽穗后约1个月的种子育性来评估转化植物中育性的恢复。对直立植株的评估指观察田间生长的植株等。备选的方法是对穗中谷粒成熟的百分率进行实验室研究。
V.鉴定Rf-1基因存在的方法
根据本发明,表明确定Rf-1基因功能存在的序列定位于水稻第10号染色体上多态性检测标记位点P4497 MboI和B56691 XabI之间。而且,互补分析证实Rf-1基因完全包含于尤其是SEQ ID NO:27碱基序列的第38538-54123位碱基中。
将携带Rf-1(SEQ ID NO:27)基因的籼稻品种IR24与不携带所述基因(Asominori(SEQ ID NO:28)和Nipponbare BAC克隆AC068923)的粳稻品种进行比较,表明两品种之间存在多态性。结果是,根据在Rf-1基因附近区域中碱基序列的多态性,就能够方便、快速和准确地鉴定待测水稻植株或种子是否携带Rf-1基因。
因此,本发明也提供用于鉴定待测水稻个体或其种子是否具有Rf-1基因的方法,其中该方法利用可确定Rf-1基因功能存在的序列定位于水稻第10号染色体上多态性检测标记位点P4497 MboI和B56691 XabI之间这一事实。
可通过任何已知的方法检测多态性。例如,已知的方法包括分析限制性片段长度多态性(RFLPs)、通过测序直接确定、用识别8个碱基的限制性内切酶切割基因组DNA,然后放射性标记末端,并进一步用识别6个碱基或4个碱基的限制性内切酶切割标记的消化物,继而通过双向电泳研究消化产物(RLGS,限制性界标基因组扫描(restriction landmark genomescanning));等。也已经开发AFLP分析(扩增的片段长度多态性,P.Vos等人,核酸研究Nucleic Acids Res.Vol.23,第4407-4414页(1995)),其中通过聚合酶链式反应(PCR)来扩增/检测RFLP。
例如,涉及通过PCR扩增来检测RFLP(将RFLP标记转化为PCR标记)或通过PCR扩增来检测微卫星中的多态性(微卫星标记)的常规方法将在下面例证说明。
将RFLP标记转化为PCR标记
A.基于相应于RFLP探针的基因组区域中多态性的PCR标记(D.E.Harry,B.Temesgen,D.B.Neale;Codominant PCR-based marker for pinus taedadeveloped from maped cDNA clones,Theor. Appl.Genet.(1998)97:第327-336页)。在利用针对RFLP标记探针序列设计的引物进行基因组PCR后(“RFLP”是用DNA片段作为探针通过Southern分析而观察到的多态性。用作探针的DNA片段的碱基序列称为“RFLP标记探针序列”),可通过下列两个方法中的任一个制备PCR标记。第一种方法涉及用一系列的限制性内切酶处理产物以搜寻产生片段长度多态的限制酶,而第二种方法涉及通过比较品种间产物的碱基序列而搜寻多态性,并根据该多态性制备PCR标记。
B.基于产生RFLP位点鉴定的PCR标记。通过鉴定存在于RFLP标记探针序列中或接近RFLP标记探针序列(通常在几个kb内)的产生RFLP位点(只由两个比较品种中的一个携带的限制性内切酶识别位点)来获得PCR标记。
微卫星标记
微卫星是基因组中大量存在的约2-4个碱基,如(CA)n的重复序列。如果品种间多态性以重复的数目发生,则可利用邻近区域中设计的引物通过PCR扩增,在PCR产物的长度中观察多态性,由此可以检测到DNA多态性。利用微卫星检测多态性的标记称为微卫星标记(O.Parnaud,X.Chen,S.R.McCouch,Mol.Gen.Genet.(1996)252:第597-607页)。
本发明中用于检测多态性的方法也没有特别限制。从效率和方便角度考虑,PCR-RFLP是优选的,其将PCR和RFLP结合来由其限制性内切酶切割模式鉴定多态性,其中该多态性存在于由PCR扩增的DNA片段的序列中不同品系间内切酶的识别位点。PCR-RFLP也称为CAPS(切割扩增的多态性序列)。如果在显示多态性的区域中不存在任何适合的限制性内切酶识别位点时,也可利用称为dCAPS(衍生的切割扩增的多态性序列)的改进的CAPS,其中在PCR期间引入限制性内切酶位点(Michaels,S.D.和Amasino,R.M.(1998),植物杂志The Plant Journal 14(3)381-385;A.Konieczny等人,(1993),Plant J.4(2)第403-410页;Neff,M.M.,Neff,J.D.,Chory,J.和Pepper,A.E.(1998),植物杂志The Plant Journal 14(3)387-392)。这些方法在下面详细说明。
CAPS,dCAPS
本发明的鉴定方法包括,但不限于:
i)根据在籼稻和粳稻品种间,在Rf-1位点和其邻近区域的碱基序列中显示多态性的位点的碱基序列来制备引物对以扩增所述的碱基序列;
ii)利用被测水稻个体或其种子的基因组DNA作为模板进行核酸扩增反应;以及
iii)根据在核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子是否具有Rf-1基因。
制备第i)中引物对优选包括下述任何一种方式:
a)在核酸扩增产物的多态性中存在缺失区的变化时,则根据缺失区的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;
b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化时,则根据碱基改变位点的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;或
c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基变化时,制备引物对以引入错配碱基,其中引物对中包含碱基改变位点并且将包含碱基改变位点的区域改变成可导致在核酸扩增产物中限制性内切酶识别差异的碱基序列,以形成可检测多态性的标记。
在本发明中,可合理的选择鉴定Rf-1基因存在的合适多态性位点,以便可如下所述,根据将携带Rf-1基因籼稻品种(IR24)的碱基序列(SEQ IDNO:27)与不携带所述基因粳稻品种的相应序列(Asominori(SEQ ID NO:28)和NipponbareBAC克隆AC068923)之间进行比较来制备多态性的检测标记,但不只限于此。
如果发现多态性导致了限制性酶识别的差异,举例来说,针对多态性位点的侧翼序列来制备用于核酸扩增的引物对,并用于检测该多态性。优选的,不将引物设计成特异于高度重复的序列,以避免产生不需要的产物。如果发现多态性没有引起限制性内切酶识别的差异,可通过应用上述的dCAPS方法来制备标记。优选不将用于dCAPS标记的引物设计成特异于重复的序列,并使产物长度优选为50-300个碱基,更优选为约100个碱基,以便于检测多态性。
如果发现多态性涉及微卫星,可针对微卫星的侧翼序列来制备核酸扩增引物,并用于检测该多态性。同样,优选不将引物设计成特异于重复序列。
1)核酸扩增
在本发明中,根据在被测水稻个体或种子的Rf-1位点确定的碱基序列来制备引物对,优选用于扩增包含多态性的邻近区域。使用引物对进行核酸扩增反应,其中以被测水稻个体或种子的基因组DNA作为模板。核酸扩增反应优选为聚合酶链式反应(PCR)(Saiki等人,1985,科学Science 230,第1350-1354页)。
用于核酸扩增的引物对,可根据多态性位点及其邻近区域的碱基序列,通过任何已知的方法来制备。具体地,根据多态性位点及其邻近区域的碱基序列来制备引物对的方法包括,产生与多态性位点及其邻近区域的碱基序列具有相同的碱基序列,或与所述区域互补的碱基序列的单链DNA,如果需要,产生的单链DNA含有不影响对多态性位点及其邻近区域碱基序列的结合特异性的修饰,其满足下列条件:
1)每个引物的长度应为15-30个碱基;
2)每个引物的碱基序列中G+C的比例应为30-70%;
3)每个引物的碱基序列中A、T、G和C的分布不应有局部的严重不平衡。
4)由引物对所扩增的核酸扩增产物的长度应为50-3000个碱基,优选为50-300个碱基;以及
5)在每个引物或引物的碱基序列之间不应存在任何互补的序列片段。
如在此所使用的,多态性位点的“邻近区域”指包含多态性位点及其邻近区的区域是在适于核酸扩增,优选适于PCR的距离之内。所扩增的邻近区域优选具有约50个碱基-约3000个碱基,更优选约50个碱基-约2000个碱基范围内的长度,但不只限于此。为了便于鉴定多态性,产物长度优选为50-300个碱基,更优选为约100个碱基。邻近区域优选在多态性位点的5′和3′侧,具有约0-约3000个碱基,更优选约0-约2000个碱基,还优选约0-约1000个碱基范围内的长度,但不只限于此。
核酸扩增反应的程序和条件没有特别的限制,对于本领域的技术人员而言是众所周知的。本领域技术人员可根据各种因素,如多态性位点及其邻近区域的碱基序列、引物对的碱基序列和长度等来应用合适的条件。通常,当引物对越长或G+C的比例越高或A、T、G和C的分布更均衡,则可在更严谨的条件下进行核酸扩增反应(以更高的温度和更少的循环数进行退火反应和核酸延伸反应)。采用更严谨的条件可使扩增反应具有更高的特异性。
扩增反应可在如下条件下进行,但不只限于此:94℃2分钟1个循环,94℃1分钟、58℃1分钟和72℃2分钟进行30个循环,以及最后是72℃2分钟1个循环,其中用50ng的基因组DNA作为模板,并使用200μm的每种dNTP和5U的ExTaqTM(TAKARA)。反应也可在如下条件下进行:94℃2分钟1个循环,94℃1分钟、58℃1分钟和72℃1分钟进行30个循环,以及最后是72℃2分钟1个循环。在另一个实施方案中,反应可在如下条件下进行:94℃2分钟1个循环,94℃30秒、58℃30秒和72℃30秒进行35个循环,以及最后是72℃2分钟1个循环。
用作PCR模板的受试水稻(待测水稻)基因组DNA可通过Edwards等人(核酸研究Nucleic Acids Res.8(6):1349,1991)的方法而容易的从植株个体或种子中提取出来。更优选的,使用经标准技术纯化的DNA。特别优选的提取方法是CATB法(Murray,M.G.等人,核酸研究Nucleic Acids Res.8(19):4321-4325,1980)。优选用作PCR模板的DNA的终浓度为0.5ng/μL。
2) 检测多态性的标记的制备
通过用引物对进行核酸扩增反应而检验在扩增产物中是否检测到存在多态性后,可根据发现的多态性来制备检测该多态性的标记。下面提供可在扩增产物中检测多态性的非限制性的实施例。
a)在核酸扩增产物的多态性中存在包含缺失区域的变化。
在这种情况下,针对缺失区域的侧翼序列来制备用于核酸扩增的引物对,以形成检测多态性的标记。如果缺失区域达到足够的大小,可通过例如琼脂糖凝胶或丙烯酰胺凝胶上电泳扩增产物,从迁移率的差异来检测多态性。举例来说,当碱基对数目的差别是约5%或更大时,在用琼脂糖凝胶电泳的情况下就可检测多态性,或当长度差别约为1个碱基或更多时,在用测序级的丙烯酰胺凝胶电泳的情况下才可检测多态性。备选地,也可利用寡核苷酸(oligobase)或DNA片段作为分析探针与核酸扩增产物进行杂交来检测多态性,其中所述的寡核苷酸或DNA片段具有与除缺失区域以外的碱基序列互补的序列。备选地,如果需要,可通过确定扩增产物的碱基序列来确证多态性。本领域技术人员可适当采用用于核酸电泳、杂交、测序等已知的技术。在这种情况下,扩增产物长度的差异直接反映多态性,以此为基础的用于检测多态性的标记被称为ALP(扩增子长度多态性)标记。
b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化。
在这种情况下,针对碱基变化位点的侧翼序列来制备核酸扩增的引物对,以形成检测多态性的标记。此时,在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化,即核酸扩增产物可能受到或不受到一种或多种特定的限制性内切酶的切割。因此,扩增产物可用限制性内切酶处理,并在例如琼脂糖凝胶上进行电泳,而从迁移率的差异来检测多态性。如果需要,可通过确定扩增产物的碱基序列来确证多态性。
在这种情况下,通过PCR等的扩增产物的限制性片段长度的差异反应出多态性,并且基于此而用于检测多态性的标记被称为CAPS标记或PCR-RFLP标记(A.Konieczny等人,如上)。
这通过下文实施例1中的引物对P4497 MboI、P23945 MboI、P41030TaqI、P45177 BstUI、B59066 BsaJI和B56691 XbaI来例证说明。如果可通过如上文a)所描述的通过核酸扩增产物的长度来检测多态性,也可通过与限制性内切酶处理相结合而更容易的检测多态性。
c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基变化。
在这种情况下,制备用于引入错配的引物对,其包含碱基变化位点并且将包含碱基变化位点的区域改变成可导致核酸扩增产物中的限制性内切酶识别差异的碱基序列,以形成检测多态性的标记。
具体地,基于天然靠近Rf-1基因区域的碱基序列的引物对,可在核酸扩增产物中产生多态性,但没有导致限制性内切酶识别的差异,因此,在一个或两个引物中引入错配,以将包含碱基变化位点(多态性)的区域改变成在核酸扩增产物中导致限制性内切酶识别差异的碱基序列。例如,可使用Mikaelian等人,核酸研究Nucl.Acids.Res.20:376.1992中所描述的方法作为通过PCR介导的位点特异性突变来取代、缺失或增加特定碱基的标准方法。利用引入错配引物的扩增产物作为检测多态性的标记,可受到或不受到一种或多种特定限制性内切酶的切割,因为在引入错配的位点存在限制性内切酶识别的差异。因此,可用限制性内切酶处理扩增产物,并在例如琼脂糖凝胶上电泳,如上文b)中所描述的从迁移率的差别来检测多态性。
错配的引入必须既不影响引物与靶植物基因组的结合,也不影响多态性碱基的变化。多态性碱基的变化用于在其附近引入错配,以通过碱基变化和错配的相结合来产生限制性内切酶识别的差异。引入这种错配的方法是本领域技术人员已知的,并在例如Michaels,S.D.和Amasino,R.M.(1998),Neff,M.M.,Neff,J.D.,Chory,J.和Pepper,A.E.(1998)中有详细描述。
这种情况下的标记是上述b)中所描述的CAPS标记的改进,并称为dCAPS(来源于CAPS)标记。这通过下文实施例3中的P9493 BslI来例证说明。
如果在上述b)或c)的情况下,存在与品种多态性无关的许多额外限制性酶切位点,则很难鉴定基于多态性的任何限制性内切酶识别差异。在这种情况下,可将错配适当的引入到引物中,以消除不必要的限制性酶切位点。例如,在实施例3中将错配引入到R-引物中来消除在B60304 MspI中与多态性无关的MspI位点。
虽然本发明并不只限于任何特定的方法,CAPS或dCAPS方法相对于其它RFLP方法具有几个优点。具体地,例如比RFLP可用更小量的样品作出分析。另一个优点是可大大减少分析所需要的时间和人力。用PCR标记检测的多态性可通过琼脂糖凝胶电泳来观察,这比用微卫星标记的丙烯酰胺凝胶电泳要更容易。
本发明鉴定方法的优选实施方案
为了例证性说明的目的,如下描述鉴定被测水稻是否具有Rf-1基因的方法的优选实施方案。在此的实施例中,发现携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24的碱基序列,与粳稻品种的相应区域相比,至少具有下列1)-8)的多态性:
1)与SEQ ID NO:27的第1239位碱基相应的碱基是A;
2)与SEQ ID NO:27的第6227位碱基相应的碱基是A;
3)与SEQ ID NO:27的第20680位碱基相应的碱基是G;
4)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
5)与SEQ ID NO:27的第49609位碱基相应的碱基是A;
6)与SEQ ID NO:27的第56368位碱基相应的碱基是T;
7)与SEQ ID NO:27的第57629位碱基相应的碱基是C;以及
8)与SEQ ID NO:27的第66267位碱基相应的碱基(是G)。
因此在本发明的优选实施方案中,当被测水稻个体或种子符合上述1)-8)的一个至全部条件时,可以判断其携带Rf-1基因。
我们进一步核实为Rf-1基因功能的表达所必需的区域包含于尤其是SEQ ID NO:27的碱基序列的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位的碱基中。因此在本发明的实施方案中,当具有与SEQ ID NO:27的碱基序列或SEQID NO:27的第38538-54123位碱基的碱基序列至少70%相同的碱基序列的核酸至少符合下列1)和2)中的一个条件,则确定被测水稻个体或种子具有Rf-1基因:
1)与SEQ ID NO:27的第45461位碱基相应的碱基是A;以及
2)与SEQ ID NO:27的第49609位碱基相应的碱基是A。
可利用多态性检测的已知方法确定是否符合上述条件。也可以直接确定包含所述序列的邻近区域的碱基序列。然而,上述的CAPS或dCAPS方法,由于其是快速和方便的而是优选使用的。可通过下列步骤来进行CAPS或dCAPS方法,包括例如:
i)根据包括下列任何一个碱基的邻近区域的碱基序列来制备引物对;
1)相应于SEQ ID NO:27的第1239位碱基的碱基;
2)相应于SEQ ID NO:27的第6227位碱基的碱基;
3)相应于SEQ ID NO:27的第20680位碱基的碱基;
4)相应于SEQ ID NO:27的第45461位碱基的碱基;
5)相应于SEQ ID NO:27的第49609位碱基的碱基;
6)相应于SEQ ID NO:27的第56368位碱基的碱基;
7)相应于SEQ ID NO:27的第57629位碱基的碱基;和
8)相应于SEQ ID NO:27的第66267位碱基的碱基是G。
以扩增上述碱基及其邻近区域的碱基。
ii)利用被测水稻个体或其种子的基因组DNA作为模板来进行核酸扩增反应;以及
iii)根据在所述核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子中Rf-1的存在。
检测核酸扩增产物中的多态性可如下进行,但不只限于此,当符合下列1)-8)的一个至全部的要求时,鉴定被测水稻个体或其种子具有Rf-1基因:
1)包括与SEQ ID NO:27的第1239位碱基相应的碱基的区域不具有任何MboI识别序列;
2)包括与SEQ ID NO:27的第6227位碱基相应的碱基的区域不具有任何BslI识别序列;
3)包括与SEQ ID NO:27的第20680位碱基相应的碱基的区域不具有任何MboI识别序列;
4)包括与SEQ ID NO:27的第45461位碱基相应的碱基的区域不具有任何TaqI识别序列;
5)包括与SEQ ID NO:27的第49609位碱基相应的碱基的区域不具有任何BstUI识别序列;
6)包括与SEQ ID NO:27的第56368位碱基相应的碱基的区域不具有任何MspI识别序列;
7)包括与SEQ ID NO:27的第57629位碱基相应的碱基的区域不具有任何BsaJI识别序列;以及
8)包括与SEQ ID NO:27的第66267位碱基相应的碱基的区域不具有任何XbaI识别序列。
然而,只要可检测出上述1)-8)的特异区域中的每种多态性,本发明不只限于上述的限制性内切酶。
优选地,本发明的鉴定方法包括:
i)以包括下列任一碱基的邻近区域的碱基序列为基础来制备引物对;
1)与第45461位碱基相应的碱基;或
2)与第49609位碱基相应的碱基;
以扩增上述的碱基及其邻近区域的碱基;
ii)利用被测水稻个体或其种子的基因组DNA作为模板来进行核酸扩增反应;以及
iii)根据在所述核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子中Rf-1的存在。在步骤iii)中,当符合下列1)和2)中的至少一个条件,但不限于此时,可确定被测水稻个体或其种子具有Rf-1基因:
1)包括与SEQ ID NO:27的第45461位碱基相应的碱基的区域不具有任何TaqI识别序列;
2)包括与SEQ ID NO:27的第49609位碱基相应的碱基的区域不具有任何BstUI识别序列。
上述讨论的SEQ ID NO:27的第45461位碱基相应于1)SEQ ID NO:69的第1769位碱基;2)SEQ ID NO:70的第1767位碱基;3)SEQ ID NO:71的第1772位碱基;4)SEQ ID NO:72的第1762位碱基;5)SEQ ID NO:73的第1703位碱基;6)SEQ ID NO:74的第1779位碱基;7)SEQ ID NO:80的第1783位碱基;8)SEQ ID NO:81的第1729位碱基;9)SEQ ID NO:82的第1781位碱基;10)SEQ ID NO:83的第1774位碱基;11)SEQ ID NO:84的第1728位碱基;以及12)SEQ ID NO:85的第1644位碱基。
本领域的技术人员可根据SEQ ID NO:27的碱基序列适当选择用于扩增反应的引物对,以优选满足上述的条件。优选地,使用具有选自SEQ IDNOS:39和40、SEQ ID NOS:41和42、SEQ ID NOS:43和44、SEQ ID NOS:45和46、SEQ ID NOS:47和48、SEQ ID NOS:49和50、SEQ ID NOS:51和52、SEQ ID NOS:53和54的碱基序列的任何引物对。更优选地,引物对选自SEQID NOS:45和46、SEQ ID NOS:47和48。如果需要,也可使用含有取代、缺失或添加,同时仍保持与多态性位点及其邻近区域的碱基序列的特异结合性的上述引物对的序列用作引物。
为了检验所得到的PCR产物的限制性片段长度的多态性,将其用相应于PCR标记中识别位点的限制性内切酶进行切割。可在针对所使用的限制性内切酶所推荐的反应温度下,孵育数小时至1天来实现这种切割。通过在约0.7%-2%的琼脂糖凝胶或约3%的MetaPhorTM琼脂糖凝胶上电泳来分析用限制性酶切割后的PCR扩增样品。例如经溴化乙啶在紫外光下观察凝胶。
在本发明最优选的实施方案中,根据所使用的引物对,限制性内切酶切割模式显示如下列表2中所示的凝胶上观察到的条带。
                    表2
                            所检测出条带的大致大小(bp)
    用P4497 MobI(SEQ IDNO:39和40)扩增限制性酶MboI被测水稻基因组具有Rf-1基因(纯合):    730没有:                                385,345
    用P9493 BslI(SEQ IDNO:41和42)扩增限制性酶BslI被测水稻基因组具有Rf-1基因(纯合):    126没有:                                100,26
    用P23945 MobI(SEQ ID NO:43和44)扩增限制性酶MboI被测水稻基因组具有Rf-1基因(纯合):    160,100没有:                                260
    用P41030 TaqI(SEQ IDNO:45和46)扩增限制性酶TaqI被测水稻基因组具有Rf-1基因(纯合):    280没有:                                90,190
    用P45177 BstUI(SEQ ID NO:47和48)扩增限制性酶BstUI被测水稻基因组具有Rf-1基因(纯合):    20,65,730
    没有:                      20,65,175,555
    B60304 MspI(SEQ ID NO:49和50)扩增限制性酶MspI被测水稻基因组具有Rf-1基因(纯合):  330没有:                              220,110
    B59066 BsaJI(SEQ ID NO:51和52)扩增限制性酶BsaJI被测水稻基因组具有Rf-1基因(纯合):  420没有:                              65,355
    用B56691 XbaI(SEQ ID NO:53和54)扩增限制性酶XbaI被测水稻基因组具有Rf-1基因(纯合):  670没有:                              140,530
在下文的实施例3中,利用包括上述8个引物对的14个多态性标记检测具有花粉育性的接近于Rf-1基因的重组体(RS1-RS2,RC1-RC8)的Rf-1区域的染色体组织结构。结果是,证实所有植株中均携带了来源于籼稻品种P9493 BslI和59066 BsaJI之间的Rf-1基因。该结果表明具有如图3所示的染色体组织结构的重组体花粉具备花粉育性,即Rf-1基因在这些花粉中是有功能的。这意味着确定Rf-1基因功能存在的序列包括在这些重组花粉共有的籼稻区域中,即根据最大可能性来估计,包括在P4497 MboI-B56691XbaI位点之间的区域(约65kb)中。
在本发明中,根据假设S12564 Tsp509I位点应与Rf-1位点非常靠近而开始染色体步行,这可从经杂交的个体的出现频率来判断。事实上,根据本发明的高精度分离分析的结果表明,计算这两个位点的遗传距离约为0.04cM。如在日本专利公开No.2000-139465中所描述的,已知即使与Rf-1位点最紧密连锁的一个标记,据报道与Rf-1位点的遗传距离为约1cM。考虑到在水稻中,估计1cM相当于平均约300kb,如果从日本专利公开No.2000-139465中所描述的标记开始染色体步行,应需要相当长的时间来定位Rf-1基因的区域。
VI.抑制Rf-1基因的功能以恢复育性的方法
根据本发明,分离含有育性恢复基因(Rf-1)位点的核酸,包括具有恢复育性功能的核酸。确定其全部碱基序列,由此可通过遗传工程技术来控制Rf-1基因的育性恢复功能。因此,本发明进一步提供一种抑制Rf-1基因的功能以恢复育性的方法。
根据本发明的一个实施方案,抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个连续碱基的反义序列,其具有与SEQ ID NO:27的碱基序列的核酸互补,或与SEQ ID NO:27的碱基序列至少70%相同,且具有恢复育性功能的碱基序列的核酸互补的碱基序列。
在一个实施方案中,本发明所述的抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个连续碱基的反义序列,且其选自与具有SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基的碱基序列的核酸互补,或与具有与SEQ IDNO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基的碱基序列至少70%相同,且具有恢复育性功能的碱基序列的核酸互补的碱基序列。
在特别优选的实施方案中,本发明所述的抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个碱基的反义序列,且其选自与编码SEQ ID NO:75的氨基酸序列,或编码与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸互补的碱基序列。
最优选地,编码SEQ ID NO:75的氨基酸序列,或编码与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
反义序列的长度为至少100个碱基或更长,更优选为500个碱基或更长,最优选为1000个碱基或更长。从导入的技术方便性来考虑,优选长度为10000个碱基或更短,更优选为5000个碱基或更短。可用已知的方法来合成反义序列。可利用例如Terada等人(植物细胞生理学Plant Cell Physiol.2000 Jul,41(7),第881-888页)所描述的已知方法将反义序列导入到水稻中。
也可以预期,可通过在包含转座元件,例如但不限于,Tos17(HirochikaH.等人,1996,Proc.Natl.Acad.Sci.USA93,第7783-7788页))的突变系中筛选在SEQ ID NO:27的碱基序列中包含转座元件的品系来建立Rf-1断裂(disrupted)系。在植物中,已经研究了经同源重组的基因断裂。也可能通过建立这样的品系来抑制育性恢复功能,在该品系中利用具有SEQ ID NO:27的碱基序列的核酸,或具有与SEQ ID NO:27的碱基序列至少70%相同的碱基序列的核酸,而已经通过Rf-1基因变体取代Rf-1基因。
参考文献
1.Fukuta et al.1992,Jpn J.Breed.42(supl.1)p.164-165.
2.Japanese Patent Public Disclosure No.HEI7(1995)-222588.
3.Japanese Patent Public Disclosure No.HEI9(1997)-313187.
4.Japanese Patent Public Disclosure No.2000-139465.
5.Harushima et al.1998,Genetics 148 p.479-494.
6.Michaels and Amasino 1998,The Plant Journal 14(3)p.381-385.
7.Neff et al.1998,The Plant Journal 14(3)p.387-392.
8.D.E.Harry,et al.,Theor Appl Genet(1998)97:p.327-336.
9.Hiei et al.,Plant Journal(1994),6(2),p.272-282.
10.Komari et al.,(1996)10,p.165-174.
11.Ditta et al.,Proc.Natl.Acad.Sci.USA(1980),77:p.7347-7351.
12.P.Vos et al.,Nucleic Acids Res.Vol.23,p.4407-4414(1995).
13.O.Parnaud,X.et al,Mol.Gen.Genet.(1996)252:p.597-607.
14.A.Konieczny et al.,(1993),Plant J.4(2)p.403-410.
15.Edwards et al.,Nucleic Acids Res.8(6):1349,1991.
16.Murray M.G.et al.,Nucleic Acids Res.8(19):4321-4325,1980.
17.Terada et al.,Plant Cell Physiol.2000 Jul,41(7),p.881-888.
18.Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA,p.7783-7788.
19.Cui,X.,Wise,R.P.and Schanble,P.S.(1996)The rf2 nuclearrestorer gene ofmale-sterile T-cytoplasm maize.Science,272,1334-1336
20.Liu,F.,Cui,X.,Horner,H.T.,Weiner,H.and Schnable,P.S.(2001)Mitochondrial aldehyde dehydrogenase activity is required for male fertility inmaize.The Plant Cell,13,1063-1078
实施例
下面通过实施例来进一步阐明本发明,但并不限制本发明的技术范围。本领域技术人员可根据说明书的描述容易地对本发明进行改进/变化,并且这些改进/变化包括在本发明技术范围内。
参考实施例
下面的参考实施例是以我们先前的申请(2000年8月17日提交的日本专利申请No.2000-247204)中所描述的实施例为基础的。
参考实施例1:将Rf-1基因周围的RFLP标记转换为PCR标记
在该参考的实施例中,将Rf-1基因位点周围的9个RFLP标记(即R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G1255)转换为PCR标记。
(1)材料和方法
下列9个RFLP标记,R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G1255,购自于日本农林渔水产省,国家农业生物资源研究所(the National Institute of Agrobiological Sciences,the Ministry ofAgriculture,Forestry and Fisheries oaJapan)。确定载体中插入的碱基序列后,按照下列步骤进行实验。在此的水稻品种中,Asominori属于粳稻,而IR24属于籼稻。
(2)Asominori基因组文库的制备
通过CTAB法从Asominori的绿色叶片中提取总DNA。用MboI部分消化后,用NaCl密度梯度离心(6-20%线性梯度、20℃、37000rpm、4小时、总体积=12mL)根据大小对DNA进行分级。将每个级分的部分(约0.5mL)进行电泳,并收集和纯化含有15-20kb DNA的级分。利用λDASH II(Stratagene)作为载体,按照所附的方案来构建文库。用Giga Pack IIIGold(Stratagene)包裹。包装后,加入500μl的SM缓冲液和20μl氯仿。离心后,向上清液加入20μl氯仿以产生文库溶液。
用5μl的稀释50倍的文库溶液感染XL-1 Blue MRA(P2),由此形成83个噬菌斑。这相当于每个文库为4.15×105pfu,自此,假定插入片段的平均长度为20kb,计算该噬菌斑覆盖了8.3×109bp。因此认为该文库具有足够大小的水稻基因组(4×108bp)。
(3)含有R1877-、C1361-和G4003-标记区域的基因组克隆的分离。
就C1361和G4003而言,分离含有RFLP标记探针的质粒,并进行限制性酶处理和电泳,以分离RFLP标记探针部分;在DNA回收滤器上(TakaraSUPERC-01)回收所需要的DNA。对于R1877,设计特异于标记探针两末端的引物,用Asominori的总DNA作为模板进行PCR反应;电泳所扩增的产物并用上述的方法回收。用Rediprime DNA标记系统(Amersham Pharmacia)标记回收的DNA,以制备用于筛选文库的探针。按常规方法进行PCR(这也可应用于下列的描述)。
将噬菌斑印迹到Hybond-N+(Amersham Pharmacia)上后,按常规方法进行文库的筛选。初级筛选后,分别打孔挑取阳性噬菌斑的区域,悬浮在SM缓冲液中,并用于第二轮筛选。次级筛选后,打孔挑取阳性噬菌斑,并进行第三轮筛选以分离单个的噬菌斑。
将令人感兴趣的分离的噬菌斑悬浮在SM缓冲液中,并通过平板裂解法进行噬菌体的初级增殖。通过振荡培养物将所得到的富含噬菌体的液体进行次级增殖,并用λ起动试剂盒(QIAGEN)纯化噬菌体DNA。
对于每个标记,在8个平板上进行初筛。每个平板使用10μl等分的文库溶液。经过初级、次级和第三轮筛选后,分离出与R1877相关的4个基因组克隆,并分离出分别与C1361及G4003相关的3个基因组克隆。
(4)将R1877转化为PCR标记
分析分离的基因组克隆,以鉴定导致RFLP的位点,或存在于IR24(籼稻)而不存在于Asominori(粳稻)中的EcoRI位点,由此将其转化为PCR标记。
具体来说,将4个分离的克隆进行如下分析。首先,用T3和T7引物确定每个克隆中插入片段两末端的碱基序列。然后,设计从标记探针的两末端向外延伸的引物。用T3和T7引物与其组合而产生总共4个引物的组合,并以每个克隆为模板用于进行PCR。
在单独的步骤中,用NotI和EcoRI消化每个克隆,并进行电泳以评估插入物的大小和每个EcoRI片段的长度。
这些分析表明个别克隆的相对位置。在RFLP分析中,已报道标记探针R1877可在Nipponbare(粳稻)中检测出20kb的EcoRI片段,而在Kasalath(籼稻)中检测出6.4kb的EcoRI片段( ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthern/chr10/R1877.JPG)。将该事实与上述分析结果结合起来,可以给出存在于IR24而不存在于Asominori中的EcoRI位点的推定位置。因此,设计用于扩增邻近区域的引物组合(SEQID NO:1×SEQ ID NO:2),用于进行30个循环以上的基因组PCR,每个循环由94℃×1分钟,58℃×1分钟,和72℃×2分钟组成。用EcoRI处理所得到的PCR产物,并在0.7%的琼脂糖凝胶上进行电泳。
结果是,在Asominori和IR24之间观察到预期的多态性。通过用EcoRI处理,在IR24品种中,切割PCR产物(~3200bp)产生1500bp和1700bp的片段,而Asominori中没有这种切割。利用Asominori-IR24的RIL(重组体近交系)对标记进行作图,结果是PCR标记与RFLP标记位点R1877定位于相同的区域,由此证实将RFLP标记R1877转换为PCR标记,其在本发明中被命名为R1877 EcoRI。
(5)将G4003转化为PCR标记
分析分离的基因组克隆,以鉴定导致RFLP的位点,或存在于Asominori而不存在于IR24中的HindIII位点,由此将G4003转化为PCR标记。
通过进行与用于R1877的所相似的分析,表明3个分离克隆的相对位置。在RFLP分析中,已报道标记探针G4003可在Nipponbare(粳稻)中检测出3kb的HindIII片段,在Kasalath(籼稻水稻)中检测出10kb的片段
( ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthern/chr10/R1877.JPG)。将该报道与上述分析结合起来,可得到临时的结论,存在于Asominori而不存在于IR24中的HindIII位点将位于2个候选位点中的一个。因此,设计扩增每个HindIII邻近区域的引物组合(SEQ ID NO:3×SEQ ID NO:4),用于进行35个循环以上的基因组PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用HindIII处理所得到的PCR产物,并在2%的琼脂糖凝胶上进行电泳。结果发现标记探针内部的HindIII位点具有多态性。通过用HindIII处理,在Asominori中切割PCR产物(362bp)产生95bp片段和267bp片段,而IR24中没有这种切割。位点作图证明,将RFLP标记G4003转换为PCR标记,在本发明中将其命名为G4003 HindIII(SEQ ID NO:19)。
(6)将C1361转化为PCR标记
根据分离的基因组克隆的碱基序列信息来设计引物。用Asominori和IR24的总DNA作为模板进行PCR反应,并在电泳后,用已知的方法回收PCR产物。利用回收的DNA作为模板,本发明人用ABI Model 310分析各个水稻品种的碱基序列,搜寻可导致多态性的突变。
通过进行与R1877所使用的相同的分析,建立分离的3个克隆大致的相对位置。然而如所产生的,很难通过PCR扩增C1361标记周围的区域或确定其碱基序列,因而不容易鉴定导致RFLP的位点。因此,本发明人注意到能够产生相对较长的PCR产物(2.7kb)的区域,并尝试创建dCAPS标记。
具体来说,在利用Asominori和Koshihikari(均为粳稻)以及Kasalath和IR24(均为籼稻),比较所述区域的基因组PCR产物的碱基序列后,本发明人在粳稻品种和籼稻品种之间发现了6个多态性的位点。使用这6个位点中的一个创建dCAPS标记。为此,用SEQ ID NO:5和SEQ ID NO:6作为引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MwoI处理PCR产物并在3%的MetaPhorTM琼脂糖凝胶上进行电泳分析。在Asominori中,切割发生在2个位点,而产生约25bp、50bp和79bp的3个可观察到的条带,但在IR24中,切割只发生在1个位点,产生约50bp和107bp的2个可观察到的条带。作图证明,将RFLP标记C1361转换为PCR标记,在本发明中将其命名为C1361 MwoI(SEQ ID NO:20)。
(7)将G2155转化为PCR标记
设计特异于标记探针两末端的引物,并用Asominori、Koshihikari、IR24或IL216(该品系是通过回交将Rf-1基因引入到Koshihikari中而产生的;其基因型为Rf-1/Rf-1)的总DNA为模板进行PCR。根据上面已经描述的方法,纯化PCR产物并搜寻对提供限制性片段多态性有用的突变。
具体来说,比较被测品种之间相应区域的碱基序列,结果在具有Rf-1基因的品种/品系(IR24和IL216)和没有Rf-1基因的品种(Asominori和Koshihikari)之间发现3个位点的突变。利用3个位点中的1个来创建dCAPS标记。为此,用SEQ ID NO:7和SEQ ID NO:8作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MwoI处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在Asominori中,在1个位点发生切割,产生约25bp和105bp的两个可观察到的条带;但在IR24中,在2个位点发生切割,产生约25bp、27bp和78bp的三个可观察到的条带。作图证明,将RFLP标记G2155转换为PCR标记,在本发明中将其命名为G2155 MwoI(SEQ ID NO:21)。
(8)将G291转换为PCR标记
设计特异于标记探针内部序列的引物,并用于各种组合来进行PCR,以找到可产生预期大小的扩增产物的引物组合。利用所选择的引物组合,本发明人用Asominori、Koshihikari、IR24和IL216的总DNA作为模板进行PCR。通过上面已描述的方法纯化所得到的PCR产物并搜寻对提供限制性片段多态性有用的突变。
具体而言,利用设计特异于标记探针序列的引物,本发明人对每个被测品种进行基因组PCR,并比较产物的碱基序列。结果是,在具有Rf-1基因的品种/品系(IR24和IL216)和没有Rf-1基因的品种(Asominori和Koshihikari)之间发现4个位点的突变。使用4个位点中的1个创建dCAPS标记。为此,用SEQ ID NO:9和SEQ ID NO:10作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MspI处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在具有Rf-1基因的品种/品系中,在2个位点发生切割,产生约25bp、49bp和55bp的三个可观察到的条带;但在不具有Rf-1基因的品种中,只在1个位点发生切割,产生约25bp和104bp的两个可观察到的条带。作图证明,将RFLP标记G291转换为PCR标记,在本发明中将其命名为G291 MspI(SEQ IDNO:22)。
(9)将R2303转换为PCR标记
设计特异于标记探针内部序列的引物,并用Asominori(粳稻)和IR24及Kasalath(籼稻)的总DNA作为模板进行PCR。通过上面已描述的方法纯化所得到的PCR产物并搜寻可用于提供限制性片段多态性的突变。
结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。由于突变出现在BslI识别位点,直接将该位点用于产生CAPS标记。为此,用SEQ ID NO:11和SEQ ID NO:12作引物,进行30个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×2分钟组成。用BslI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约238bp和1334bp的2个可观察到的条带;而在籼稻品种中,在2个位点发生切割,产生约238bp、655bp、和679bp的3个可观察到的条带。作图证明,将RFLP标记R2303转换为PCR标记,在本发明中将其命名为R2303 BslI(SEQ ID NO:23)。
(10)将S10019转换为PCR标记
根据(9)中将R2303转换为PCR标记的方法将S10019转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。由于突变出现在BstUI识别位点,直接将该位点用于产生CAPS标记。为此,用SEQ ID NO:13和SEQ ID NO:14作引物,进行30个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×1分钟组成。用BstUI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约130bp和462bp的2个可观察到的条带;而在籼稻品种中,在2个位点发生切割,产生约130bp、218bp、和244bp的3个可观察到的条带。作图证明,将RFLP标记S10019转换为PCR标记,在本发明中将其命名为S10019 BstUI(SEQ ID NO:24)。
(11)将S10602转换为PCR标记
根据(9)中将R2303转换为PCR标记的方法将S10602转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。将该突变用于产生dCAPS标记。为此,用SEQ ID NO:15和SEQ ID NO:16作引物,进行33个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×1分钟组成。用KpnI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约117bp和607bp的2个可观察到的条带;而在籼稻品种中,没有发生切割,只产生724bp的可观察到的条带。作图证明,将RFLP标记S10602转换为PCR标记,在本发明中将其命名为S10602 KpnI(SEQ IDNO:25)。
(12)将S12564转换为PCR标记
根据将R2302转换为PCR标记的方法将S12564转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。将该突变用于产生CAPS标记。为此,用SEQ ID NO:17和SEQ ID NO:18作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用Tsp509I处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在粳稻品种中,在2个位点发生切割,产生约26bp、41bp和91bp的3个可观察到的条带;而在籼稻品种中,在1个位点发生切割,产生约41bp和117bp的2个可观察到的条带。作图证明,将RFLP标记S12564转换为PCR标记,在本发明中将其命名为S12564 Tsp509I(SEQ ID NO:26)。
参考实施例2Rf-1基因位点的作图图谱
从用MS-FR Koshihikari对MS Koshihikari授粉而产生的F1代群体的1042个幼苗提取DNA,并将该DNA提取物用于分析。MS Koshihikari(BC10F1代)是通过用BT型雄性不育细胞质替换Koshihikari的细胞质而建立的。MS-FR Koshihikari是通过将源于IR8的Rf-1基因(由国家农业生物资源研究所National Institute of Agrobiological Sciences提供)导入到MSKoshihikari中(Rf-1基因位点是杂合的)而创建的品系。
首先,研究每一个体中在参考实施例1中所述2个标记位点R1877EcoRI和G2155 MwoI之间的基因型,推测其位于Rf-1位点的相对侧。认为关于位点R1877 EcoRI或G2155 MwoI的粳稻型纯合体在这两个标记位点之间是重组体。然后,研究每个这种重组体G291 MspI、R2303 BslI、S12564Tsp509I、C1361 MwoI、S10019 BstUI、G4003 HindIII和S10602 KpnI位点的基因型,并鉴定重组的位置。
对R1877 EcoRI和G2155 MwoI位点的基因型研究表明,46个个体是Rf-1基因位点附近的重组体。研究在Rf-1基因位点附近的标记位点的基因型,结果如表3所示。
表3.Rf-1位点附近的重组体个体中标记位点的基因型
 位点  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16 17  18   19   20   21   22   23
 R1877 EcoRIG291 MspIR2303 BsIIS12564 Tsp5091C1361 MwolS10019 BstUIG4003 HindIIIS10602 KpnIG2155 MwoI  JHHHHHHHH  JJHHHHHHH  JJJHHHHHH  JJJHHHHHH  JJJHHHHHH  JJJHHHHHH  JJJHHHHHH  JJJJHHHHH  HHHHJJJJJ  HHHHJJJJJ  HHHHHJJJJ  HHHHHJJJJ  HHHHHJJJJ  HHHHHJJJJ  HHHHHJJJJ  HHHHHJJJJ  HHHHHHJJJ  HHHHHHJJJ   HHHHHHJJJ   HHHHHHJJJ   HHHHHHJJJ   HHHHHHJJJ   HHHHHHJJJ
 24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46
 HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHJJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHJJ  HHHHHHHHJ   HHHHHHHHJ
J:纯合的Koshihikari型
H:杂合的Koshihikari型/MS-FR Koshihikari型
如表3中所示,获得在S12564 Tsp509I标记位点纯合的粳稻重组体8和在C1361 MwoI标记位点纯合的粳稻重组体9和10。所有这些重组体均恢复了育性,认为前者是Rf-1和S12564 Tsp509I位点之间的重组体,而认为后者是Rf-1和C1361 MwoI位点之间的重组体,表明Rf-1基因定位于S12564 Tsp509I知C1361 MwoI位点之间。根据报道,在上述杂交中具有BT型雄性不育细胞质的个体中,只有携带Rf-1基因的花粉具有育性(C.Shinjyo,JAPAN.J.GENETICS Vol.44,No.3:149-156(1969)),Rf-1基因位点可在更详细的连锁图谱上进行定位(图4)。
实施例1:获得靠近Rf-1位点的重组个体
(材料和方法)
用MS-FR Koshihikari(BC9F1代,在Rf-1基因位点是杂合的)对MSKoshihikari(BC10F1代)进行授粉产生了由4103个个体的BC10F1群体,从其中每一个体提取DNA,在S12564 Tsp509I和C1361 MwoI位点的基因型与上述参考实施例2中描述的方式相同。在S12564 Tsp509I位点具有纯合基因型的Koshihikari个体,被认为是由于在Rf-1和S12564 Tsp509I位点之间发生重组所产生的,而在C1361 MwoI位点具有纯合基因型的Koshihikari个体,被认为是由于在Rf-1和C1361 MwoI位点之间发生重组所产生的。
(结果和讨论)
研究这4103个个体,发现了1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和6个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。在上述参考实施例2中,通过杂交先前所获得的对1042个个体的研究如表3所示,已经发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和2个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。
因此从5145个个体中总共能够获得了2个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和8个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。在下面的实施例中对这10个个体进行高精度分离测试。
实施例2染色体步行
(1)第一次染色体步行
(材料和方法)
按照参考实施例1中所述方法,用λDASHII载体从Asominori粳稻(不携带Rf-1)的基因组DNA构建基因组文库,并用染色体步行进行检测。
利用Asominori的总DNA为模板,结合下述引物对常规进行PCR:
5′-atcaggagccttcaaattgggaac-3′(SEQ ID NO:29)和
5′-ctcgcaaattgcttaattttgacc-3′(SEQ ID NO:30)
其中该引物对是针对RFLP探针S12564的部分碱基序列(登录号D47284)来设计的。将所得到的约1200bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)纯化。用rediprime DNA标记系统(AmershamPharmacia)标记纯化的DNA,以产生文库筛选探针(探针A,图1)。
在将噬菌斑印迹到Hybond-N+(Amersham Pharmacia)上后,对文库进行常规筛选。通过平板裂解法用λMidi试剂盒(QIAGEN)纯化噬菌体DNA后,分离单个的噬菌斑。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,筛选得到的4个克隆中的两个克隆(WSA1和WSA3)具有如图1所示的相对位置关系。通过引物步行(DNA测序仪377,ABI)确定与WSA1和WSA3相应的Asominori基因组碱基序列。
(2)第二次染色体步行
(材料和方法)
除了上述的Asominori基因组文库外,类似地从籼稻品种IR24(携带Rf-1)的基因组DNA构建IR24基因组文库,并用染色体步行进行测试。
利用WSA3的DNA为模板,结合下述引物对常规进行PCR:
5′-tgaaggagttatgggtgcgtgacg-3′(SEQ ID NO:31)和
5′-ttgccgagcacacttgccatgtgc-3′(SEQ ID NO:32)
其中该引物对是针对(1)中确定的Asominori基因组碱基序列来设计的。纯化所得到的524bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针E,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的15个克隆中的1个克隆(WSE8)具有如图1所示的相对位置关系。通过引物步行确定与WSE8相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的7个克隆中的2个克隆(XSE1和XSE7)具有如图1所示的相对位置关系。通过引物步行确定与XSE1和XSE7相应的IR24基因组碱基序列。
(3)第三次染色体步行
(材料和方法)
用染色体步行测试上述的Asominori基因组文库和IR24基因组文库。
利用WSE8的DNA为模板,结合下述引物对常规进行PCR:
5′-gcgacgcaatggacatagtgctcc-3′(SEQ ID NO:33)和
5′-ttacctgccaagcaatatccatcg-3′(SEQ ID NO:34)
其中该引物对是针对(2)中确定的Asominori基因组碱基序列来设计的。纯化所得到的约1159bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针F,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,筛选Asominori基因组文库所得到的8个克隆中的2个克隆(WSF5和WSF7)具有如图1所示的相对位置关系。通过引物步行确定与WSF5和WSF7相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的13个克隆中的2个克隆(XSF4和XSF20)具有如图1所示的相对位置关系。通过引物步行确定与XSF4和XSF20相应的IR24基因组碱基序列。
(4)第四次染色体步行
(材料和方法)
用染色体步行测试上述的Asominori基因组文库和IR24基因组文库。
利用WSF7的DNA为模板,结合下述引物对常规进行PCR:
5′-aaggcatactcagtggagggcaag-3′(SEQ ID NO:35)和
5′-ttaacctgaccgcaagcacctgtc-3′(SEQ ID NO:36)
其中该引物对是按照(3)中确定的Asominori基因组碱基序列来设计的。纯化所得到的约456bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针G,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的6个克隆中的2个克隆(WSG2和WSG6)具有如图1所示的相对位置关系。通过引物步行确定与WSG2和WSG6相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的14个克隆中的3个克隆(XSG8、XSG16和XSG22)具有如图1所示的相对位置关系。通过引物步行确定与XSG8、XSG16和XSG22相应的IR24基因组碱基序列。
(5)第五次染色体步行
(材料和方法)
用染色体步行测试上述的IR24基因组文库。
我们详细浏览了TIGR(The Institute for Genomic Research)的公共网址,发现在公共数据库(GenBank)中已经登记保藏了包含RFLP标记S12564的BAC(细菌人工染色体)克隆(登录号AC068923)。该BAC克隆包含Nipponbare粳稻的基因组DNA,经碱基序列比较显示其完全包括了在(1)-(4)中制备得到的Asominori和IR24的重叠区域。
因此,利用IR24的总DNA为模板,结合下述引物对常规进行PCR:
5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:37)和
5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:38)
其中设计该引物对用于扩增该BAC克隆的部分序列。纯化所得到的约600bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针H,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的15个克隆中的1个(XSH18)具有如图1所示的相对位置关系。通过引物步行确定与XSH18相应的IR24基因组碱基序列。
实施例3:高精度分离分析
(1)PCR标记P4497 MboI的开发
将实施例2中所确定的相应于IR24重叠群(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第1239位碱基是A,而相应于所述位置的SEQID NO:28的第12631位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置附近的区域,通过PCR扩增约730bp的片段:
P4497 MboI F:
5′-ccctccaacacataaatggttgag-3′(SEQ ID NO:39)
(相应于SEQ ID NO:27的第853-876位碱基)
(相应于SEQ ID NO:28的第12247-12270位碱基)和
P4497 MboI R:
5′-tttctgccaggaaactgttagatg-3′(SEQ ID NO:40)
(相应于SEQ ID NO:27的第1583-1560位碱基)
(相应于SEQ ID NO:28的第12975-12952位碱基)。
用MboI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,可通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物具有MboI识别序列(GATC),能被MboI切割,而来自IR24DNA的扩增产物缺乏MboI识别序列而不能用MboI切割,从而导致用MboI处理后,DNA片段的长度存在差异。
(2)PCR标记P9493 BslI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第6227位碱基是A,而相应于所述位置的SEQID NO:28的第17627位碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约126bp的片段:
P9493 BslI F:
5′-gcgatcttatacgcatactatgcg-3′(SEQ ID NO:41)
(相应于SEQ ID NO:27的第6129-6152位碱基)
(相应于SEQ ID NO:28的第17529-17552位碱基)和
P9493 BslI R:
5′-aaagtctttgttccttcaccaagg-3′(SEQ ID NO:42)
(相应于SEQ ID NO:27的第6254-6231位碱基)
(相应于SEQ ID NO:28的第17654-17631位碱基)。
用BslI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物中具有BslI识别序列(CCNNNNNNNGG),能被BslI所切割,而来自IR24 DNA的扩增产物缺乏BslI识别序列而不能用BslI切割,从而导致用BslI处理后,DNA片段的长度存在差异。
通过应用dCAPS方法(Michaels和Amasino 1998,Neff等人,1998)而发展该标记。具体地,通过利用上述的P9493 BslI R引物,在SEQ ID NO:27的第6236位碱基和SEQ ID NO:28的第17636位碱基处,用g取代a。因此,来自Asominori DNA的片段在SEQ ID NO:28的第17626-17636位具有CCtttccttG G的序列,而可以用BslI切割。
(3)PCR标记P23945 MboI的开发
将实施例2中所确定的相应于II24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第20680位碱基是G,而相应于所述位置的SEQID NO:28的第32079位碱基是A。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约260bp的片段:
P23945 MboI F:
5′-gaggatttatcaaaacaggatggacg-3′(SEQ ID NO:43)
(相应于SEQ ID NO:27的第20519-20544位碱基)
(相应于SEQ ID NO:28的第31918-31943位碱基)和
P23945 MboI R:
5′-tgggcggcagcagtggaggataga-3′(SEQ ID NO:44)
(相应于SEQ ID NO:27的第20778-20755位碱基)
(相应于SEQ ID NO:28的第32177-32154位碱基)。
用MboI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24 DNA的扩增产物中具有MboI识别序列(GATC),能被MboI所切割,而来自Asominori DNA的扩增产物缺乏MboI识别序列而不能用MboI切割,从而导致用MboI处理后,DNA片段的长度存在差异。
(4)PCR标记P41030 TaqI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第45461位碱基是A,而相应于所述位置的SEQID NO:28的第49164位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约280bp的片段:
P41030 TaqI F:
5′-aagaagggagggttatagaatctg-3′(SEQ ID NO:45)
(相应于SEQ ID NO:27的第45369-45392位碱基)
(相应于SEQ ID NO:28的第49072-49095位碱基)和
P41030 TaqI R:
5′-atatcaggactaacaccactgctc-3′(SEQ ID NO:46)
(相应于SEQ ID NO:27的第45468-45625位碱基)
(相应于SEQ ID NO:28的第49351-49328位碱基)。
用TaqI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物中具有TaqI识别序列(TCGA),能被TaqI所切割,而来自IR24 DNA的扩增产物缺乏TaqI识别序列而不能用TaqI切割,从而导致用TaqI处理后,DNA片段的长度存在差异。
(5)PCR标记P45177BstUI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第49609位碱基是A,而相应于所述位置的SEQID NO:28的第53311位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约812bp的片段:
P45177 BstUI F:
5′-acgagtagtagcgatcttccagcg-3′(SEQ ID NO:47)
(相应于SEQ ID NO:27的第49355-49378位碱基)
(相应于SEQ ID NO:28的第53057-53080位碱基)和
P45177 BstUI R:
5′-cagcgtgaaactaaaaacggaggc-3′(SEQ ID NO:48)
(相应于SEQ ID NO:27的第50166-50143位碱基)
(相应于SEQ ID NO:28的第53868-53845位碱基)。
用BstUI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24 DNA的扩增产物中在两个位置具有BstUI识别序列(CGCG),而被BstUI切割成3个片段,,而来自Asominori DNA的扩增产物在3个位置具有BstUI识别序列而而被BstUI切割成4个片段,从而导致用BstUI处理后,DNA片段的长度存在差异。
(6)PCR标记B60304 MspI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第56368位碱基是T,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约330bp的片段:
B60304 MspI F:
5′-atcccacatcatcataatccgacc-3′(SEQ ID NO:49)
(相应于SEQ ID NO:27的第56149-56172位碱基)和
B60304 MspI R:
5′-agcttctcccttggatacggtggcg-3′(SEQ ID NO:50)
(相应于SEQ ID NO:27的第56479-56455位碱基)。
用MspI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有MspI识别序列(CCGG),能被MspI所切割,而来自IR24 DNA的扩增产物缺乏MspI识别序列而不能用MspI切割,从而导致用MspI处理后,DNA片段的长度存在差异。
通过应用dCAPS方法而发展该标记。具体地,通过利用上述的B60304MspI R引物,在SEQ ID NO:27的第56463位碱基处,用t取代g。结果,SEQ ID NO:27的第56460-56463位的MspI识别序列从CCG G变为ccgt,而使得来自SEQ ID NO:27的序列不能用MspI切割。因此,来自IR24的片段没有MspI识别序列,而来自Nipponbare的DNA在相应于SEQ ID NO:27的第56367-56370位碱基的区域具有1个MspI识别序列的位置。
(7)PCR标记B59066 BsaJI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第57629位碱基是C,而AC068923中相应于所述位置的碱基是CC。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约420bp的片段:
B59066 BsaJI F:
5′-atttgttggttagttgcggctgag-3′(SEQ ID NO:51)
(相应于SEQ ID NO:27的第57563-57586位碱基)和
B59066 BsaJI R:
5′-gcccaaactcaaaaggagagaacc-3′(SEQ ID NO:52)
(相应于SEQ ID NO:27的第57983-57960位碱基)。
用BsaJI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有BsaJI识别序列(CCNNGG),能被BsaJI所切割,而来自IR24 DNA的扩增产物缺乏BsaJI识别序列而不能用BsaJI切割,从而导致用BsaJI处理后,DNA片段的长度存在差异。
(8)PCR标记B56691 XbaI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第66267位碱基是G,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约670bp的片段:
B56691 XbaI F:
5′-cctcaagtctcccctaaagccact-3′(SEQ ID NO:53)
(相应于SEQ ID NO:27的第66129-66152位碱基)和
B56691 XbaI R:
5′-gctctactgctgataaaccgtgag-3′(SEQ ID NO:54)
(相应于SEQ ID NO:27的第66799-66776位碱基)。
用XbaI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有XbaI识别序列(TCTAGA),能被XbaI所切割,而来自IR24 DNA的扩增产物缺乏XbaI识别序列而不能用XbaI切割,从而导致用XbaI处理后,DNA片段的长度存在差异。
(9)PCR标记B53627 BstZ17I的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第69331位碱基是T,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约620bp的片段:
B53627 BstZ17I F:
5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:55)
(相应于SEQ ID NO:27的第68965-68988位碱基)和
B53627 BstZ17I R:
5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:56)
(相应于SEQ ID NO:27的第69582-69559位碱基)。
用BstZ17I处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24DNA的扩增产物中具有BstZ17I识别序列(GTATAC),能被BstZ17I所切割,而来自Nipponbare DNA的扩增产物缺乏BstZ17I识别序列而不能用BstZ17I切割,从而导致用BstZ17I处理后,DNA片段的长度存在差异。
(10)PCR标记B40936 MseI的开发
下列所有PCR标记(10)-(12)的开发涉及研究进一步相应于在SEQ IDNO:27 3′末端第76363位碱基的下游区(3′)的碱基序列。
针对上述BAC克隆的碱基序列(登录号AC068923)设计下列引物对:
5′-tacgacgccatttcactccattgc-3′(SEQ ID NO:57)和
5′-catttctctatgggcgttgctctg-3′(SEQ ID NO:58)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1300bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B40936 MseI F:
5′-acctgtaggtatggcaccttcaacac-3′(SEQ ID NO:59)和
B40936 MseI R:
5′-ccaaggaacgaagttcaaatgtatgg-3′(SEQ ID NO:60)。
用MseI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自MS-FRKoshihikari(Rf-1 Rf-1)DNA的扩增产物中具有MseI识别序列(TTAA),能被MseI所切割,而来自Koshihikari DNA的扩增产物中缺乏MseI识别序列而不能用MseI切割,从而导致用MseI处理后,  DNA片段的长度存在差异。
可应用dCAPs方法发展该标记。
(11)PCR标记B19839 MwoI的开发
针对上述BAC克隆的碱基序列(登录号AC068923)来设计下列引物对:
5′-tgatgtgtttgggcatccctttcg-3′(SEQ ID NO:61)和
5′-gagataggggacgacagacacgac-3′(SEQ ID NO:62)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1200bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B19839 MwoI F:
5′-tcctaggctgtttagaaactgcaca-3′(SEQ ID NO:63)和
B19839 MwoI R:
5′-caagttcaaacataactggcgttg-3′(SEQ ID NO:64)。
用MwoI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自KoshihikariDNA的扩增产物中具有MwoI识别序列(GCNNNNNNNGC),能被MwoI所切割,而来自MS-FR Koshihikari(Rf-1 Rf-1)DNA的扩增产物中缺乏MwoI识别序列而不能用MwoI切割,从而导致用MwoI处理后,DNA片段的长度存在差异。
可应用dCAPs方法发展该标记。
(12)PCR标记B2387 BfaI的开发
针对上述BAC克隆的碱基序列(登录号AC068923)来设计下列引物对:
5′-cactgtcctgtaagtgtgctgtgc-3′(SEQ ID NO:65)和
5′-caagcgtgtgataaaatgtgacgc-3′(SEQ ID NO:66)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1300bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B2387 BfaI F:
5′-tgcctactgccattactatgtgac-3′(SEQ ID NO:67)和
B2387 BfaI R:
5′-acatactaccgtaaatggtctctg-3′(SEQ ID NO:68)。
用BfaI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自KoshihikariDNA的扩增产物中具有BfaI识别序列(CTAG),能被BfaI所切割,而来自MS-FR Koshihikari(Rf-1 Rf-1)DNA的扩增产物中缺乏BfaI识别序列而不能用BfaI切割,从而导致用BfaI处理后,DNA片段的长度存在差异。
(13)分离分析
对于在实施例1中获得的在Rf-1和S12564 Tap509I位点之间发生重组的2个重组体(RS1和RS2)和在Rf-1和C1361 MwoI位点之间发生重组的8个重组体(RC1到RC8),鉴定在上述(1)到(12)中开发的12个DNA标记位点的基因型。结果如表4所示,并显示了在S12564 Tsp509I和C1361 MwoI位点的每一重组体的基因型。
               表4在Rf-1位点附近的重组体中不同标记位点的基因型
位点     RS1    RS2    RC1    RC2    RC3    RC4    RC5  RC6  RC7  RC8
 S12564 Tsp509I     J     J     H     H     H     H     H  H  H  H
 P4497 MboIP9493 BsIIP23945 MboIP41030 TaqIP45177 BstUIB60304 MspIB59066 BsaJIB56691 XbaIB53627 BstZ17IB40936 MseIB19839 MwoIB2387 BfaIC1361 MwoI     JHHHHHHHHHHHH     JHHHHHHHHHHHH     HHHHHHHHHHHHJ     HHHHHHHHHHHHJ     HHHHHHHHHHHHJ     HHHHHHHHHHJJJ     HHHHHHHHHHHHJ     HHHHHHHJJJJJJ     HHHHHHHHHHHHJ     HHHHHHHHHHHJJ
J:纯合的Koshihikari
H:杂合的Koshihikari/MS-FR Koshihikari
表4显示所有的重组体具有籼稻来源的,在P9493 BslI和B59066 BsaJI之间的Rf-1染色体区域。这一结果表明,具有如图3所示的染色体组织结构的重组体花粉具有花粉育性,即Rf-1基因在这些花粉中是有功能的。这意味着决定Rf-1基因功能存在的序列被包括在这些重组体花粉共有的籼稻区域中,即按最大可能性来估计包括在位点P4497 MboI至B56691 XbaI位点之间(约65kb)的区域内。
然而,存在这种可能,对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,并且无论其余区域是粳稻还是籼稻基因型,其遗传功能可能没有明显的变化。因此,还不能得出结论认为上述的共有籼稻区域(SEQ ID NO:27的第1239-66267位碱基)完全包含了全部的Rf-1基因。然而,认为至少SEQ ID NO:27完全包含了全部的Rf-1基因,理由如下:
1)通常基因的大小为数千个碱基而很少超过10kb;
2)本发明确定的IR24的基因组碱基序列(SEQ ID NO:27)完全包含
上述的共同籼稻区域;
3)SEQ ID NO:27的5′末端位于上述共同籼稻区域5′端的上游1238bp处,且构成另一个基因的一部分(S12564);以及
4)SEQ ID NO:27的3′末端位于上述共同籼稻区域3′端的下游10096bp处。
实施例4:来自XSE1的9.7kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSE1(图1和图5),并在琼脂糖凝胶上进行电泳。用QIAEXII(QIANGEN)纯化分离出的9.7kb片段(包括SEQ IDNO:27的第1-9657位碱基)。
另一方面,以pSB 11(Komari等人,如上)为基础制备具有潮霉素抗性基因表达盒的中间载体pSB200。具体地,首先将胭脂碱合酶终止子(Tnos)与遍在蛋白启动子和遍在蛋白内含子(Pubi-ubiI)融合。将潮霉素抗性基因(HGY(R))插入所得到的Pubi-ubiI-Tnos复合体的ubiI和Tnos之间,而完成Pubi-ubiI-HYG(R)-Tnos的组装。再将其与pSB11的HindIII/EcoRI片段融合得到pKY205。将用于添加限制性内切酶位点,NotI、NspV、EcoRV、KpnI、SacI、EcoRI位点的接头序列插入到该pKY205中Pubi上游的HindIII位点中,获得具有潮霉素抗性基因表达盒的pSB200。
用NotI完全消化质粒载体pSB200后,用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)去磷酸化。将反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上纯化回收载体片段。
用DNA连接试剂盒Ver.1(TAKARA),将上述制备的两个片段,即来自XSE1的9.7kb片段和载体片段进行连接反应。反应后,用乙醇沉淀法回收DNA。将回收的DNA溶于纯水(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,对混合物进行电穿孔。电穿孔后,将该溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有壮观霉素的LB平板上,并温育(37℃,16hr)。从所得到的24个克隆分离质粒。分析质粒的限制性内切酶片段的长度模式及其边界碱基序列,以选择出用重组质粒转化的所需要的大肠杆菌细胞。
根据Ditta等人(1980)的方法,将上述选择出的大肠杆菌细胞用于与根瘤农杆菌菌株LBA4404/pSB1(Komari等人,1996)和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从在含有壮观霉素的AB平板上形成的6个克隆中分离出质粒,并分析其限制性内切酶片段的长度模式,以选择出所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,将上述选择出的农杆菌细胞用于转化MSKoshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉来制备为转化所需的MS Koshihikari未成熟种子。
适应性培养之后,将转化植株转移到长日照条件的温室中。将生长到适合移植阶段的48株个体移植到1/5000a Wagner罐中(4株/罐),并在移植3-4周后转移到短日照条件的温室中。抽穗后约1个月,检测直立植株的种子育性。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明9.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例5:来自XSE7的14.7kb片段的互补分析
(材料和方法)
用EcoRI完全消化λ噬菌体克隆XSE7(图1和图5),然后用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳,以分离14.7kb的片段(包括SEQ ID NO:27的第2618-17261位碱基),其用QIAEXII(QIAGEN)纯化回收。
另一方面,用SacI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化,并用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上纯化回收载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSE7的14.7kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明14.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例6:来自XSF4的21.3kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSF4(图1和图5),并在琼脂糖凝胶上进行电泳。用QIAEXII(QIANGEN)纯化分离出的21.3kb片段(包括SEQ IDNO:27的第12478-33750位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF4的21.3kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明21.3kb的插入片段至少没有包含全长的Rf-1基因。
实施例7:来自XSF20的13.2kb片段的互补分析
(材料和方法)
用SalI完全消化λ噬菌体克隆XSF20(图1和图5),将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳以分离13.2kb的片段(包含SEQ ID NO:27的第26809-40055位碱基),其用QIAEXII(QIAGEN)从凝胶上纯化回收。
另一方面,用EcoRV完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF20的13.2kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有44个转化植株个体都是不育的。这表明13.2kb的插入片段至少没有包含全长的Rf-1基因。
实施例8:来自XSF18的16.2kb片段的互补分析
(材料和方法)
λ噬菌体克隆XSF18与XSF20在5′和3′端(分别是SEQ ID NO:27的第20328位和第41921位碱基)是相同的,但缺乏内部第33947-38591位的碱基。因此,它包括SEQ ID NO:27的第20328-33946位碱基和第38592-41921位的碱基。这是因为克隆XSF18是最初被分离的,但分离后在扩增期间发现包含上述缺失,因此重新进行扩增步骤而分离到完整的克隆,称为XSF20。
用NotI完全消化λ噬菌体克隆XSF18(图5),在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的16.2kb片段(包括SEQ ID NO:27的第21065-33946位和第38592-41921位的碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF18的16.2kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的(图6)。这表明16.2kb的插入片段至少没有包含全长的Rf-1基因。
实施例9:来自XSG22的12.6kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSG22(图1和图5),并在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的12.6kb片段(包括SEQ IDNO:27的第31684-44109位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG22的12.6kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明12.6kb的插入片段至少没有包含全长的Rf-1基因。
实施例10:(1)来自XSG16的15.7kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSG16(图1和图5),并在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的15.7kb片段(包括SEQ IDNO:27的第38538-54123位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG16的15.7kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
在47个转化的植株个体中,至少有37株个体明显的恢复了育性(图6)。这表明在来自水稻(IR24)的15586个碱基(SEQ ID NO:27的第38538-54123位碱基)的15.7kb插入片段中包括了全长的Rf-1基因。
(2)XSG16中内部11.4kb片段的互补分析
(材料和方法)
用AlwNI和BsiWI完全消化λ噬菌体克隆XSG16,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳以分离11.4kb的片段,其用QIAEXII(QIAGEN)进行纯化。
用SmaI完全消化质粒载体pSB11(Komari等人,植物杂志Plant Journal,1996),再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段进行连接反应。反应后,用乙醇沉淀法回收DNA。将回收的DNA溶于纯水(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,将混合物进行电穿孔。电穿孔后,将该溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有壮观霉素的LB平板上,并温育(37℃,16hr)。从所得到的14个克隆中分离质粒,分析质粒的限制性内切酶片段的长度模式及其边界碱基序列,以选择出所需要的大肠杆菌细胞。
根据Ditta等人(1980)的方法,将上述选择出的大肠杆菌细胞用于与根瘤农杆菌菌株LBA4404/pSB4U(Takakura等人,日本专利申请号2001-269982(WO02/019803 A1))和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从在含有壮观霉素的AB平板上形成的12个克隆中分离出质粒,并分析其限制性内切酶片段的长度模式以选择出所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,将上述选择出的农杆菌细胞用于转化MSKoshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉来制备用于转化所需的MSKoshihikari未成熟种子。
适应性培养后,将转化植物转移到长日照条件的温室中。将生长到适合移植阶段的120株个体移植到1/5000a Wagner罐中(4株/罐),并在移植约1个月后,转移到短日照条件的温室中。抽穗后约1个月,从每一植株中取样一典型穗用于评价种子育性(总谷粒数中可育谷粒数的百分比)。
(结果和讨论)
在120个转化的植株个体中,有59株个体显示了10%或更高的种子育性,其中有19株个体显示了70%或更高的种子育性。这表明11.4kb的插入片段(SEQ ID NO:27的第42357-53743位碱基)包含了表达育性恢复功能所必需的Rf-1基因。
(3)XSG16中内部6.8kb片段的互补分析
(材料和方法)
用HpaI和AlwNI完全消化λ噬菌体克隆XSG16,并在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)纯化分离的6.8kb片段。
根据上述(2)中的方法进行包括制备质粒载体pSB11的后继步骤。
(结果和讨论)
在120个转化的植株个体中,有67株个体显示10%或更高的种子育性,其中有26株个体显示70%或更高的种子育性。这表明在6.8kb的插入片段(SEQ ID NO:27的第42132-48883位碱基)包含了表达育性恢复功能所必需的Rf-1基因区域。
实施例11:来自XSG8的16.9kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSG8(图1和图5),在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的16.9kb片段(包含SEQ ID NO:27的第46558-63364位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG8的16.9kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明16.9kb的插入片段至少没有包含全长的Rf-1基因。
实施例12:来自XSH18的20.0kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSH18(图1和图5),在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的20.0kb片段(包括SEQ ID NO:27的第56409-76363位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSH18的20.0kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化植物。
(结果和讨论)
所有44个转化植株个体都是不育的。这表明20.0kb的插入片段至少没有包含全长的Rf-1基因。
实施例13:来自XSG8和XSH18重叠区的19.7kb片段的互补分析
(材料和方法)
用SalI和StuI完全消化在实施例11中连接获得的,从所需要的大肠杆菌中分离的质粒(XSG8SB200F),并在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的12.8kb片段(包括SEQ ID NO:27的第50430-63197位碱基)。
另一方面,用SalI、StuI和XhoI完全消化在实施例12中连接获得的,从所需要的大肠杆菌中分离的质粒(XSH18SB200R),并在琼脂糖凝胶上电泳,以分离6.9kb的片段(包括SEQ ID NO:27的第63194-70116位碱基),再用QIAEXII(QIAGEN)回收纯化。
进一步,用EcoRV完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的三个片段,即来自XSG8的12.8kb片段、来自XSH18的6.9kb片段和载体片段进行连接反应。连接产物包含来自XSG8和XSH18的重叠区(包括SEQ ID NO:27的第50430-70116位碱基)(图5中的XSX1)的19.7kb片段。然后,根据实施例4中描述的方法制备和研究转化的植株个体。
(结果和讨论)
所有40个转化植株个体都是不育的。这表明19.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例14:cDNA文库的制备
首先,制备经回交而将Rf-1导入Koshihikari的IL216品系(基因型为,Rf-1/Rf-1)。IL216经常规方法生长在温室中,在叶耳(auricle)长度为-5~5cm之间的生长阶段期间,对幼穗进行取样。通过SDS-酚方法(Watanabe,A.和Price,C.A.(1982)Translation of mRNAs for subunits of chloriplast couplingfacor 1 in spinach.Proceedings of the National Academy of Sciences of theU.S.A.,79,6304-6308)提取总的RNA,并且利用QuickPrep mRNA纯化试剂盒(Amersham Phamacia Biotech)纯化poly(A)+RNA。
提供纯化的poly(A)+RNA,用ZAP-cDNA合成试剂盒(Stratagene)来制备cDNA文库。计算所制备的文库的滴度(1ml)为16,000,000pfu/ml,并且确定为是足够大的。
实施例15:cDNA文库的筛选
(1)筛选引物的制备
利用下列两种类型的引物进行PCR:
正义引物
5’-tctcattctctccacgccctgctc-3’(SEQ ID NO:76)
反义引物
5’-acggcggagcaattcgtcgaacac-3’(SEQ ID NO:77)
并且以XSG16,IR24的基因组克隆作为模板。SEQ ID NO:76和77分别相应于SEQ ID NO:27的第43733-43756位碱基和第44038-44015位碱基。
电泳后,用QIAEX II凝胶提取试剂盒(QIAGEN)从琼脂糖凝胶回收约300bp的扩增产物。用Rediprime II DNA标记系统(Amersham PharmaciaBiotech)32P-标记回收的片段(此后该片段称为“探针P”)。
此外,利用下列两种类型的引物进行PCR:
正义引物
5’-agtgtgtggcatggtgcatttccg-3’(SEQ ID NO:78)
反义引物
5’-ctctacaggatacacggtgtaagg-3’(SEQ ID NO:79)
并且以XSG16,IR24的基因组克隆作为模板。SEQ ID NO:78和79分别相应于SEQ ID NO:27的第48306-48329位碱基和第50226-50203位碱基。电泳后,从琼脂糖凝胶回收约1900bp的扩增产物。用上述的方法32P-标记回收的片段(此后该片段称为“探针Q”)。
(2)cDNA文库的筛选
提供实施例14中所制备的cDNA文库,来制备70个琼脂培养基,其中出现了约15000个噬菌斑。对于每个琼脂培养基进行两次噬菌斑挑取,将噬菌斑转移到Hybond-N+上(Amersham Pharmacia Biotech)。一张膜用于与探针P杂交,而另一张膜用于与探针Q杂交。根据制造商的指导说明进行全部步骤。
将探针加入含有250M Na2HPO4、1mM EDTA和7%SDS的杂交溶液,并且杂交在65℃下进行16小时。然后在65℃用含有0.1×SSC和0.1%SDS的溶液洗涤两次,每次15分钟。洗涤后,用FUJIX BAS 1000(Fuji Photo Films)分析膜。
结果是,鉴定出8个对探针P和探针Q都显示阳性的噬菌斑。因此,分离出这些噬菌斑,根据制造商(Stratagene)的指导说明亚克隆到pBluescript中。在8个克隆中,鉴定出6个克隆的末端碱基序列是XSG16的。确定了6个克隆的全部碱基序列,结果如序列表中SEQ ID NOS:69-74所示。
推测所有的序列,SEQ ID NOS:69-74编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每一个SEQ ID NO:69的第215-2587位碱基、SEQ ID NO:70的第213-2585位碱基、SEQ ID NO:71的第218-2590位碱基、SEQ ID NO:72的第208-2580位碱基、SEQ ID NO:73的第149-2521位碱基,以及SEQ ID NO:74的第225-2597位碱基编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将SEQ ID NO:75的氨基酸序列与推测的玉米育性恢复基因(Rf2)的氨基酸序列进行比较,N-末端的7个氨基酸残基(Met-Ala-Arg-Arg-Ala-Ala-Ser)在两个氨基酸序列中同时存在。认为这7个氨基酸残基是线粒体的靶信号部分(Liu等人,2001)。根据上述事实,认为在此情况下分离的cDNAs包含Rf-1基因的全部编码区域。除了上述区域外,在水稻Rf-1和玉米Rf2的氨基酸序列之间没有发现同源性。推测Rf-1和Rf2的基因产物在转移到线粒体后能够恢复育性的机制相互之间是截然不同的。
此外,将在此情况下分离的cDNAs序列与IR24的基因组序列(SEQ IDNO:27)比较,并且阐明了Rf-1基因的外显子和内含子结构(图7)。结果是,表明在植物体中存在拼接形式和polyA加入位置不同的多种转录产物。Rf-1基因的编码区域中没有内含子。
实施例16:互补分析
利用包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段进行互补分析。4.2kb的片段是在含有来源于IR24的6.8kb基因组的质粒中的,其在实施例10(3)中正式具有育性恢复功能。
首先,用EcoRI处理实施例(3)中描述的质粒,并用琼脂糖凝胶进行电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段(相应于SEQ ID NO:27的第42132-46318位碱基),利用QIAEXII(QIAGEN)从凝胶中回收该片段。利用DNA连接试剂盒Ver.1(TAKARA)将4.2kb的片段与用EcoRI和CIAP(TAKARA)处理的pBluescript II SK(-)一起进行连接反应。反应后,用乙醇沉淀法回收DNA。
将回收的DNA溶于纯水中(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,将该混合物进行电穿孔。电穿孔后,将溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有氨苄青霉素的LB平板上并温育(37℃,16hr)。从所得到的12个集落分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。然后,用BamHI和SalI处理从选择的大肠杆菌分离的质粒,在琼脂糖凝胶上电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。
另一方面,用BamHI和SalI处理TnosJH0072(包括nos终止子和氨苄青霉素抗性基因表达盒的中间载体),在琼脂糖凝胶上电泳。分离出包含nos终止子和氨苄青霉素抗性基因的3.0kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。
将包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段与来源于ThosJH0072的片段进行连接反应,并用上述的方法进行电穿孔。将反应物涂布在含有氨苄青霉素的LB平板上并温育(37℃,16hr)。从所得到的12个克隆分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。
进一步的,用SgfI处理从所选择的大肠杆菌分离的质粒,在琼脂糖凝胶上电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。将4.2kb片段与已经用PacI和CIAP(TAKARA)处理的pSB200Pac(包括潮霉素抗性基因表达盒的中间载体)进行连接反应,并用上述的方法进行电穿孔。将反应物涂布在含有壮观霉素的LB平板上并温育(37℃,16hr)。从所得到的16个克隆分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。
上述步骤的结果是,获得其中已经在中间载体内插入嵌合基因的大肠杆菌细胞,其中该嵌合基因是含有Rf-1基因的启动子区域和推测的Rf-1基因翻译区域的片段与nos终止子的结合。根据Ditta等人(1980)的方法,将大肠杆菌细胞与根瘤农杆菌菌株LBA4404/pSB1(Komari等人,1996)和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从含有壮观霉素的AB平板上形成的6个克隆中分离质粒,分析其限制性内切酶片段长度的模式,以选择所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,用上述选择出来的农杆菌细胞转化MS Koshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉而制备为转化所必需的MSKoshihikari未成熟种子。
适应性培养后,将转化植株转移到长日照条件的温室中。将生长到适合移植阶段的32株个体移植到1/5000a Wagner罐中(4株/罐),并在移植3-4周后转移到短日照条件的温室中。抽穗后约1个月,检测直立(standing)植株的种子育性。结果是在32个转化植株中有28个个体恢复了育性。
经过上述步骤,已经实验性证实通过表达推测的翻译区域可提供Rf-1基因的功能。
实施例17:cDNA的公离
在实施例15中,用探针P和探针Q筛选来源于IL216幼穗的cDNA文库。分离并分析对两个探针都为阳性的噬菌斑,并分离出6个cDNA。在这个实施例中,用下述的探针P和探针R进行相似的筛选,分离出另外的6个cDNAs。如下进行详细说明。
首先,利用下列两个类型的引物进行PCR:
正义(sense)引物
5’-cagttgggttgaaacctaatactg-3’(SEQ ID NO:86)
反义引物
5’-cactaaaccgttagacgagaaagc-3’(SEQ ID NO:87)
并且以IR24的基因组克隆,XSG16作为模板。SEQ ID NO:86和87分别相应于SEQ ID NO:27的第45522-45545位碱基和第45955-45932位碱基。
电泳后,用QIAEX II(QIAGEN)从琼脂糖凝胶回收约430bp的扩增产物。用Rediprime II DNA标记系统(Amersham Pharmacia Biotech)32P-标记回收的片段(此后该片段称为“探针R”,图8)。
提供来源于IL216幼穗的的cDNA文库,来制备20个琼脂培养基,其中出现了约15000个噬菌斑。对于每个琼脂培养基进行两次噬菌斑挑取,将噬菌斑转移到Hybond-N+上(Amersham Pharmacia Biotech)。一张膜用于与实施例15的探针P杂交,而另一张膜用于与探针R杂交。根据制造商的指导说明进行所有的步骤。结果是,鉴定出12个证明对探针P和探针R都为阳性的噬菌斑。
因此,分离出这些噬菌斑,根据制造商(Stratagene)的指导说明亚克隆到pBluescript中。确定克隆的末端碱基序列。在12个克隆中,鉴定出6个克隆的末端碱基序列是XSG16的,因此确定了6个克隆的全部碱基序列(#7-#12)。结果如SEQ ID NOS:80-85所示。
推测所有的序列,SEQ ID NOS:80-85编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每一个SEQ ID NO:80的第229-2601位碱基、SEQ ID NO:81的第175-2547位碱基、SEQ ID NO:82的第227-2599位碱基、SEQ ID NO:83的第220-2592位碱基、SEQ ID NO:84的第174-2546位碱基,以及SEQ ID NO:85的第90-2462位碱基编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将在这种情况下分离的cDNA序列与IR24(SEQ ID NO:27)的基因组序列进行比较,并且确定了外显子和内含子的结构(图8)。在这种情况下分离的cDNA中,有3个cDNA没有与推测的翻译区域无关的任何外显子,而由单个的外显子组成(#10-#12,SEQ ID NOS:83-85)。
                        序列表
<110>日本烟草产业株式会社(JAPAN TOBACCO INC.)
     欣根塔有限公司(Syngenta Limited)
<120>水稻BT型细胞质雄性不育的水稻恢复基因
<130>YCT811
<150>JP 2002-197560
<151>2002-07-05
<160>87
<210>1
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物
<400>1
cattcctgct tccatggaaa cgtc    24
<210>2
<211>33
<212>DNA
<213>人工序列
<220>
<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物
<400>2
ctctttctgt atacttgagc tttgacatct gac    33
<210>3
<211>20
<212>DNA
<213>人工序列
<220>
<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物
<400>3
gatcgacgag tacctgaacg    20
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物
<400>4
aatagttgga ttgtcctcaa aggg    24
<210>5
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物
<400>5
aaagcaaccg acttcagtgg catcacc    27
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物
<400>6
ctggacttca tttccctgca gagc    24
<210>7
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物
<400>7
gaccaccaat taactgatta agctggc    27
<210>8
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物
<400>8
tttctggctc caataatcag ctgtagc    27
<210>9
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G291 MspI标记序列的寡核苷酸引物
<400>9
ctgctgcagc aagctgcacc gaaccgg    27
<210>10
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增G291 MspI标记序列的寡核苷酸引物
<400>10
acattttttc ttccgaaact tccg    24
<210>11
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R2303 BslI标记序列的寡核苷酸引物
<400>11
atggaaagat acactagaat gagc    24
<210>12
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R2303 Bs1I标记序列的寡核苷酸引物
<400>12
atcttatata gtggcaggaa agcc    24
<210>13
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物
<400>13
aacaatctta tcctgcacag actg   24
<210>14
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物
<400>14
gtcacataga agcagatggg ttcc    24
<210>15
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物
<400>15
agctgttgag agttctatgc cacc    24
<210>16
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物
<400>16
tagccatgca acaagatgtc atac    24
<210>17
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物
<400>17
ctagttagac cgaataactg aggttc    26
<210>18
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物
<400>18
tttgtgggtt tgtggcattg agaaaat    27
<210>19
<211>2240
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G4003 HindIII
<400>19
gcggccgctc cgggaagtcg agcgagtaga cgcccctgac gccgtacgcg tcggcgagcc     60
gcagcggcgt ctctggcggt gtgaaggaca gcccgttcag cgtcgcgcgg cgccgcccgt    120
tgatcgtcac cggcgccgtg ctccgcagca ggtacgcctg cgtcacgttg atcgacgagt    180
acctgaacga tccctgtggg ttcggcctcg ccgctccggc actcaggttc cacctgccca    240
atgcaaaaaa ccaaaaccca aaagcttaat gcgaataata catcattcca cgtatttaaa    300
aaaataattt ataggtaaaa tttttataat gtattttagc gacgtaaatg tcaatgctga    360
gaaataaacg ataatacttt aaatgaagtt ctaaaattta aattttggca tcggttgatg    420
ttggataaag aaaacgatgg aggctagtaa tttttcttct tttttaagta tctagattgt    480
catatattga atttttcagt ttttcatccc tttgaggaca atccaactat tattttcctt    540
ttcttatgta aaaggttgaa caacatattc aaacataaaa aaataaaatt aaatgaaata    600
aatttacaat tcataaaatt tacagaattt atgttaagaa aatattcaaa cttagataat    660
aataaagcaa caaaatcgta ctaaaaagaa gtataattgt acattgtata ctactactcc    720
tacaatttta gacttagaat ttttaatttc ctgaaatcta gtaatgccat ttttttcttt    780
ctagttgaac cagacagtaa gtttaactcg aaacttataa gctaatgagc gaagtcgggc    840
aattcactcg tacctgacgg agcgagcttg gttcatggag aaggacttgt cgaactggtc    900
ctggggaggg tcggggagcg ggccggaggc ccgcccccgg gagttggagt agcggaggac    960
ggcgacgccg gcgacgcggc gccacacggt gtcgttcacc atgcgcgcgc tggcgacgac   1020
gtagtagtcg gagctcgcgt tctggtcggt ggtgacgagg aaggagtagg actggccgac   1080
gtggacgtcc aggttggtgt agttctgctg cgtcgtgtag gagccctccg tctccaccag   1140
caccatgttg tgcccctgga tcctgaagtt gaggctcgtc gacgtcccca cgttgtgcac   1200
tcggatcctg tacgtcttgc ctgtgtcccc acaccgacgt cgccgacaca cgcgcaaaag   1260
ataatagact cattgtaagt aggtagtaac cttctccgtt tcatattata aatcgtttga   1320
ttatattttt gttagttaaa cttctttaag ttttttttct ataaacttaa ttaaatctaa   1380
agaattttaa taaaaaaaat caaacgactt ataatataaa atggatggag tagttgcatc   1440
aatttgtgga tgaagcaaac aagattatat ccttttcatg agggtgaaag tattcagtga   1500
acaattcgtc agtttcaagt ttcatgaaat cggacagggt ctctgaaagt ctgtattttt   1560
ggtactgttg gattgactac tctggcttct gttgtcacat cttttgtatc ctagtttcgg   1620
taaaaaaaat tttggcattt ttactcctat cgttgatctg tttaactgaa accattgcat   1680
gatatactac tagcagacaa aactggtgaa aattcacgag aatgaacttt ttgtcagtta   1740
agcattagcg gacagcttca gtaagcagag caggctgcct taaggcttaa agcactatct   1800
tccacaacac tttgtcctac aatcaaattc caaatttact atcacaaaaa gcgaaggaac   1860
taactaaacc ttactcctac tagtactact gctatgacta tgaaacaaga ttccaatcca   1920
aagaaaacac agtgctcgat cagcatgata aaagcaacga aacctgctca tccagctgcc   1980
aaaatgccac cccactgact ctacgtacgt actacgtatt gacgctgtaa aaaactagcc   2040
gtagtacaga gaagaggacc caaagtttcg tcaaaaattt tattttaccc ggatccacat   2100
tgatggtctc gtactcgatg ccggccggga caaggctgtc gttgtacctg tacgggccct   2160
tgccgttaat cagcacgccg tccggcatcc cgaggtcctt gccactgtcc agcatcttcc   2220
tcagatcctg caacgaattc                                               2240
<210>20
<211>2601
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记C1361 MwoI
<400>20
tcttgctgag atccaagttg cggtaacttt gcccttttct ttttttcttc tcttctgaat     60
tttttcatgg tttttgggag agattttcgt aacttgatta cagttctagg aaaaggccac    120
cttgttcaaa cagggctttc ttgaaaggga tcaatttgct aggagtacat gattctaaaa    180
gcgatttcga aataaaacac agttctcgat ctcatacctg aaaacaaaag gcccatactg    240
tgtaaactgt gattatgctt ctgttaaatg ggatatttgt acaaaattga cgccaaccac    300
ctataaacag attgtgagct tttatcttag taaaataaaa tgtgacattc tactcagtgt    360
tcagtgatcc gatgtcgtct cttctgcgta caacttctaa cagccgtttt cggtagtaca    420
aactagcgaa acaccaaaaa cgcagcattt gagttctgga atacgctgaa attgttagaa    480
tcaaccacga aaccaaaatc attgttcaga aacgttgcaa cgagataaaa cacaagaact    540
tgttttaaca aagcatacgg acagtacata tacggttaca acacccagtc tttatacagt    600
tctgctggag ttccatctac tggctgtcat tgtatctcag gacagacagg ttaacatagg    660
tacaacacaa ttacaggcta aaccgaagcg aactacactg tcagcatctc taacagtatc    720
gtcaagcaag cttatttaca gctgctctag taaatttaca acgtccctgg cagaatccct    780
ctcgtttctg gcagcgacga ggcacggtcc atggccttag caggacatct cacccgtcag    840
ctgcatagaa agcaaccgac ttcagtggaa tcacctcctg ctcctgcaaa aaagttggtt    900
cgatcaatca cgcgtttaat ccaaaacaaa atgggtatta attatgctag cctatgaagc    960
tacctcagag ttctctattt gctctgcagg gaaatgaagt ccagtggaac agttctcaag   1020
cacctcaggg ctcttcatcc atgctttgtg tgcttcaatg gctttcagct tatagcgaaa   1080
catctgcgat acggatctaa aattaaggat gtcgacaatt acttaacaca acaaataatt   1140
gaagcaggtc cagttaaaga aaagtagcag cgaagaatag cactctgaag tctgaacctc   1200
agataaagaa atggttggtt tttccagttc atctccctca acatggattc cagtaccctg   1260
gcattctggg caaaggatgg atgttatttt cttaggtgca ttttttgcct ttcttcctcg   1320
attgcttttt cccttgcttg caattttgtc tgctagcatc tcatattggc ataaaatagt   1380
ccagtgcaca aggcaagaag tgtgaaacaa atgaaatgcc tgcaaaatta gccgtacaaa   1440
gtcattggag gttgcagcag aatactacaa atttttaaag aagaaactat acactgtcta   1500
tgttttgctt gaaatgaatt caaccacttt gcattatacg gtttggaatc cctggtttgt   1560
gagaactgta attccattac aacagtgaag aagttaccat aactaatgaa tggaaattag   1620
tcaaatgcct aattttttag gtttgcttta atttatttat ctgtgagaaa tgctaagcat   1680
gtcatgcgtt gctatcttca agaaatacta agaaactgca aaggcaaaga atgtttgaaa   1740
taacttaccc cgcttgagtt tctactgctg caggctagat ttcctgtctt gcagttgagc   1800
aaggtagcta catccttttc aagaagcatt ggtcgcccac aaatatcaca agctttctca   1860
gcagcaaggc gcttctgctt acgcaactcc ctcctcatag atttggtgga taagaggcca   1920
acttgaagat tgtgtgaagt acctgtcggg gaacctgtta tgatagcttg gctattgtca   1980
tgggcggagc tgctttgctc attcgactcc tctgaagatg cttcttgatc tgaaaatgac   2040
ttctttcttc tctttccacg gtgtccagca tcatcaatca cgaagaaaga tccagcagag   2100
ataggaaggt cctgatcatc agaagaccac ttcctgccca actcaattgt ataagagaag   2160
ttgacaatgg caaagtcaga ttgctcatag gtgtcacact catccaagcc atgggagcca   2220
tcctgtccta cccaagcaca ccagatcttg ctaatctttt tacttccttt gctagcttcc   2280
cataacctgt atgcaatatt tccatatccc aaaagatgca caggcaaatc cgaaacaaca   2340
tcctttagca atacactagg aataacgaga ggaccgtcag ttccactttg gtttgacagc   2400
acatgatctt cagatacaga agcagttcta ccattaccat gcgcatttgc accacggcgt   2460
gtgccttttg cgccattgcg agagctagaa tcatctctca acctcgaagt cacttcagtg   2520
tcgttcgctg gaaccagagc cagctctctg gtgttctgcg agctcgagtc cagcaagagc   2580
gggtccttct cgcgcgagtt g                                             2601
<210>21
<211>1333
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G2155 MwoI
<400>21
ccctctgctt gatccagtgt acatccatgg gttaggacag attagttact cagttaatta     60
agtgtgagac tggaaaaaaa tatctgacgg cagttttata agttgagtga ttgaactagt    120
gaaagttcag ttaactgtca acggctgtag atttgggatg gcagactgtt ctgagtcaaa    180
atgaagcttt tactgtgcgt ggttaccagg tgcagtaaaa taatttcaga tctaatcgca    240
gtaaaaaaat gtagtactat atgttaagac gagattggtc ggtcaaaatc tatctggccc    300
tttacatctc ccaaatgtta cctcagttgc aggtggtaaa aaaaaatcac tcgtttcacg    360
tgatgtcggc agatcatgga ccatgtctca aatgctgaaa ctctgaacaa tcaacaaaaa    420
aatccaacca gatgagctgt gcaactgata attgatcatc acactatttg caactcatct    480
ttcatgtaga tggaacttca atcccgaaga aataatgaca gcaaaatgct gcgatcctga    540
agaaaggatg gcggcaaaat ggcagcgata aaaaaaaaat ggttggttac tgaagaatta    600
tttgtgcagc agttgagaca gtagcaagat aagagctagc taagctagct aggtagagtt    660
ggatggaaga gtagtagtat gagatagagc atggagcgcg acaactcaag tggatgctaa    720
agtaaaaggc attctcttct cttgtttgga atcagaaaag aaaagaaaag acttgagctg    780
cttggctgga atgtttggtt ggatcatgcg cgctctcctt agcttagctc gccaagaaat    840
cctcgcttca tctctctcaa taattcaaag ccacgagctc tctgctcata tccagtgcga    900
cgattcccgt taatgcaaat gcattatatc cagttcgaaa tgttacaatt cttgcgtttg    960
cagcaagcca gcaagtggtg tgaattgttt aatccctcgt gcatttcaac gaaattctct   1020
cacaaattcg cattgacttc tttcttagca caattagtaa gcagtgacaa ataaagaatt   1080
tttgaacagg atgtctttcc aaggaaggtg agatttttta tgtggatagc aaggatcgcc   1140
tttccttagc atgaagagaa tgtgatcaac tttacacctt gcttacgatt atggccttaa   1200
tttttgatac cctaaacagg agcacatcac atgcatgtcg acctgagacc accaattaac   1260
tgattaagtt ggcatttcag atgcatccgt cagttacatg atcaggtgat cgatggatca   1320
actgtaggtt tca                                                      1333
<210>22
<211>863
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G291 MspI
<400>22
cgaacaggat caaaagtaga cgacgagggc atttagaagg agaggaattg tatttgttcc   60
cggtatttaa tttttaaatt tgtggtcgga agtttcggaa gaaaaaatgt gctcatgagt   120
gattattggc tctgaacacc aacctctctt ttcgttgatt ccttctgagg tgttgggtgt   180
tgggacacga tgctgccgcc gacacgacac cgggttccac aatacactaa tctactcgcg   240
acaccttcat tgaactgcat ataattattt agaaagtcca ttaacacatc ttataaaacc   300
ttgttgaatc atataatcat tctataaagt ctatttgaac atcttatgaa aaaataagat   360
ctgacctagt cgttacactc tcttacattt tccattagcc taactaattc cgtgcaggaa   420
acgcccaaaa ataatagtac caatagtcca ctaatcccgt gccagaggcc gccaatgatt   480
agtgattaac ccaaaaaaca taatcatcat cacacgccgc taatgaccag ctctcgctta   540
gctcatccca caggcggccc ccacacgcca ctcctgccat gtgggcccac ctttcacacc   600
ccccaccaac cagaaaaaaa actcccccaa aaaaaaaact tttaatgctt atctcgcggc   660
agtataaaag gcgaccccac cacccacaca caatcacagt cagcgaccca acccaacccg   720
agccgaggag tcgagtcgtg tgaaaattac gaaattgccc ttcgactcca ccaccaccac   780
ccaccggcga ggcgaggaga ggagaaaaat tgggaggaaa aaaaaaggga aaaagaaaaa   840
gggtggagga gatttttgcg aag                                           863
<210>23
<211>1510
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记R2303 BslI
<400>23
tgccatgaag acctatggaa agaatatctt cttctcactc tgtgaatggt gagtttactc    60
tctgtaacat ttagggctag gtcgaaggaa catgaagcat tgctgattca ctccactgtg   120
tttttttttt ctgtataggg ggaaagaaaa tcctgctaca tgggcaggcc gcatgggtaa   180
cagctggaga acaactggcg acatcgccga caactggggc aggttctact catcctctct   240
ttaaccctgt ttacatagtt cttgagtttt tcagtactga tcgtaattgc cctgttattt   300
cagtatgaca tctcgtgcag acgaaaatga ccaatgggct gcctatgctg gacctggtgg   360
atggaatggt aagaacttga gatgtatctg ttcctaggtt gcttaaccat ttgagagctt   420
caaaatgatc aacatatgtt tctgctgtgc aatatcagat cctgacatgc ttgaagtggg   480
aaatggtggg atgtctgaag ctgagtaccg gtcacacttc agtatctggg cactagcaaa   540
ggtaccatag catgttctat gtactaataa ttttgctgca atgttgaact tctttgcatt   600
tcctcactgc aagttttgct tgaattgttc aggctcctct tttgatcgga tgcgatgtgc   660
gctcaatgag ccagcagacg aagaacatac tcagcaactc ggaggtgatc gctgtcaacc   720
aaggcaagcc ttctcagttt cacatgctta gatttagcca tacctcttgg atatttcacc   780
atactcataa tgtaactctc tgaacagata gtctaggtgt ccaaggaaag aaagtacaat   840
ctgacaacgg attggaggta tcccttcaat ggcttccaaa tttgcagttt ctcattgtcc   900
cataagcctt ggcatgatca tgactaactc tgaagctgac aatactttgt gtaaatttgt   960
cggtaggttt gggccgggcc actcagcaac aacaggaagg ctgtggtgct ctggaacagg  1020
cagtcatacc aggcaaccat cactgcacat tggtcgaaca tcgggctcgc tggatcggtc  1080
gcggtcactg ctcgtgatct atgggcggta aagcctttgc tttcttcaga gctcaaagta  1140
gaacatcttc tcttcagaat tcagagttca taacaaattt ctgtcaattg tgcagcactc  1200
ttcgttcgcg gctcagggac agatatcagc atcggtggcg cctcatgact gcaagatgta  1260
tgtcttgaca ccaaactagt cagcaaagaa aagcagcaca ggttagtacg tgtccggcga  1320
atacagctaa attgatcagg attcaggaag aaggtttgca atttgcaagg attggtagag  1380
ctggaaatgg gatgccattt ggttatgtat gtagaaataa gctgtaagcc tgtaagcgta    1440
tatgtaatca gccgtcaaat gctggcgagt gtatttctga agtttgcaac gaaagttgca    1500
gcaataaaaa                                                           1510
<210>24
<211>1016
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记BstUI
<400>24
tggggattct tttctttaag caatttaaca ttattgtcct aacaatatac acaatattgg    60
tttttctttc agtatcaaat aattctttta cttttgaaaa cacatttgca atgtgttgga   120
aacacaatta tatcttgcac ttccttttgg aaatttaatc atttgaaaac tgattcgcgt   180
ttcatggctg taatcttctc ttgcgaacat cgctctttct ttgatggttc tctgttgaga   240
agaagagcaa ccaagtaaat tttcgaaatg tttttttgtt ctttctattc accattgcag   300
gttgtcaaag ccatcgagaa ggccataccg attccgagag cgcaacccat tgccttggat   360
ggcccagcaa gggaagagct gaaggccatg gaggcgcaga aggtcgagat cgaccgcacc   420
gcggcgctcc aggtgcgccg tgagctttgg ctggggctgg catacctcgt cgtccagact   480
gccggcttca tgaggctcac attctgggag ctctcatggg atgtcatgga acccatctgc   540
ttctatgtga cctccatgta cttcatggcc ggctacacct tcttcctccg gaccaagaag   600
gagccctcct tcgagggctt cttcgagagc cggttcgcgg cgaagcagaa gcggttgatg   660
cacgcccggg atttcgatct ccgccggtat gacgagctcc ggcgagcctg tggcctgccg   720
gtggttcgga ctccgacgag cccctgcaga ccgtcgtcgt cgtcgtcgtc gtcttcgacg   780
caggagagcc attgccattc ttactgccat tgccaatgat ctttgtgctg ttctgttctg   840
ttgtcagaat tttttcatgc ccagtttatg ggggttaagc tagcttctcc attgtaccgt   900
tctgatgtgc ggatgatgcg atgcaaagca tagtttgttg aagagatgac aaggcagatt   960
ttagcttgaa aacctggagg tgagaaaaaa aaatcctgat gtgtttgtgt gtgtga      1016
<210>25
<211>676
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记S10602 KpnI
<400>25
accaccttca tatgaagaaa ttaacggtgt tttcatgagg aatccaacag tcgctgaatt    60
ggtggaaact gtggaattct tcttggctga ggtaaccaat catcacttca ccacaatgca   120
caagtttgta gcttactact acagtacttc taataagttt tgtctgttga gattttattg   180
ctgatttcta tgcatggtca tctttttgac aggccatcca gtcttatcgt gctgagagtg   240
aaactgagct caacctggca gctggtgact atatagttgt ccggaaggta cggccctatc   300
ttcccattgg acatgtttct aaccataaac atatctttgc tggacttttg tgggcaaagt   360
tggctacact aaacttgtgt tcattaacct gctcaatcag gtgtcaaaca atggatgggc   420
agaaggtgaa tgcagaggga aagctggctg gttcccttac gactacatcg agaaaaggga   480
ccgtgtgctt gcaagtaaag tcgcccaggt cttctaggcg ttcaatgagc catacataca   540
taaccctggt gttgtacact gtattatgat cgttcgtgat cttcaaagac cctctgatca   600
gagaaatcac aaatattctt ttgttctatt attgtcatta tcactacccc ttttgtcaaa    660
accagtgcag cctttt                                                    676
<210>26
<211>1059
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记Tsp509I
<400>26
gcgagatcat gaacttgatt ttctggttgc catattgggc ttgcttgtta accttgtaga    60
gaaggatagc cttaataggt aagtccctca catgcttcct tccatttgct caattcatat   120
cagtgttact gttctggcag ttccttgggg tcaggactca gaaacatcca attaatgttc   180
atgttctctt aacgactcag aaatacttta taacctctcc acagggtacg gctttcatct   240
gcccgtgttc ctgttgatct atctcagaat ccacagagtg aagagacaca gagagatgtc   300
atagcactcc tctgttctgt attcttagca agtcaaggtg ctagtgaagc ttctggaact   360
atatcaccgg taattcaaaa ttcttcaagt tccttttgta tgtagattat atctttgtaa   420
aactcggcat ttattacctg ctctttgttt caaaaagcag tattttattt tgctccttag   480
cataggtcag cagaacagtt gatcttattc agaaaacaat attttgcatg taacatactg   540
ttatctatga gatgaaaatt aatgcatgtg taataatgtc aatgataaat atttgctatc   600
tgaatccagt ctaccaactc tagttagacc gaattactga ggttctattt caaagaataa   660
tttagtgcac catttgttca actactatga agtaaaatgg tattcccttc tattgacatc   720
gggttagaag tgaaaggcca tcttaatgcg atgttctcaa tgccacaaac ccacaaattt   780
cattaacaca tacagattat tattaacata gctataaatt ggatttccag aagcttgagt   840
tgaatttatt ttgttacaat tgaaagcact gggaacatta gcattttttt ttagttcttg   900
gttattgcaa tttataatgt tatacagaac tgtgtacctc acaatgcatt cattatgaca   960
ttctatgaac catttgattg actgttgctt gtaaacaaca ggatgatgag gagtctttga  1020
tgcaaggagc acgggaagct gaaatgatga tcgtagagg                         1059
<210>27
<211>76363
<212>DNA
<213>稻(Orza sativa)IR24
<400>27
gatcaactaa caacctcttt gcagcaaaaa agcatacaca caagtgtttg tcttggcctg    60
gggctctgca gatggactga tactctgacc tgcagtgggc ttgggagcta acaatggttt   120
cattcttttt ttttttatgt tttcccctgt tgtttttgct catgttttgt gtaatttttt   180
cttctcatct agcgatgtta tttttcttag catgatggga gtagccctcc tttttttttc   240
tctaattaag tgtaaagtag caacagcata gggatgaatg ttcagtgtag tgtgtggtgt   300
ttcagttatt cagagacgtc catacagttt gtaccttgtg accacacgtc ttaatctgat   360
gaagcttaga ataaatcaca tgttagcaat gcaatatcat ctgcgtcttc tctcactttg   420
gtggccatca aattctgtgt agaagtgtat ggttggtgtg ctgttgcaaa tgccgtattc   480
cgctctgttt tgtggaagtt aagaagtccc tagttgaaat accgattttt catgatctcg   540
gagattgatg caactctgat tgcagcattt ctttttatta gaatgtacac tccatgctat   600
catgatgttt attgtttagt actacaagat ttggttaacc attattttaa tatcataata   660
attttataaa atcttggagt aacaagttca taatacatga tagcataact ttttgaggct   720
agtctatgta tattgtctcc tttgttttta aactaagcac tcaataaatt attgatggct   780
gtaattttct gaaggtttca ccggtttcgg cccgtgcttt ataaatagct tcggcacaaa   840
agacaaaacg gtccctccaa cacataaatg gttgagttta cgttttcatt atctttggta   900
aaatcaagtc caccacgtag acactcataa caaaagtttg aatatcctca gaaattttga   960
cttgagtcta tcttaccttt gatatcggac atccaaccct ccctccctcc ctgaacttta  1020
tattattcat attacacctg aactttatat tattcatatt acaccctgaa gtggttttca  1080
tttaattgca tacatgctga aatagtttga caacgtgaga tgcactaaaa atctacacgt  1140
tcgtcttaag ttgcaattca ttttatccct tttctttttc tctcttacat aggaatatca  1200
atagtactaa ttcacattac aatatagtat aaattggtaa tcgattattg gcaatatact  1260
atattaaata ttcaaaacta gtcatttaag ctgccaaata agtaaaccac tatcgaaaac  1320
cacaatataa atggcattac aaaacttagg gggttgaata tccaatttta aagttcatga  1380
tgctagagga atttctatca aaagtttatg ggtacatatg gactttttcc tttttaaaag  1440
aagctattct tgtcgtaaac gttaaatatt ttttgtactt tattttttat gattgaaaaa  1500
aaaacttagt tttcaaaatg attggtctgt atacaagcat caattagact taataaattc  1560
atctaacagt ttcctggcag aaactgtaat ttgtttttgt tattagacta cgtttattat  1620
ttcaaatatg tgtacgtata tctgatgtga caaccaaacc caaaaatttt ccctaactcc  1680
atgaggcctt acagatatat ttgatgggtg taaagttttt taagttcttt gggtgcaaag  1740
tttttaaagt atacggacac acatttgaag tattaaatat agacaaataa caaaacatat  1800
tacatattct gcctgtaaac aacgagacaa atttattaag cctaattaat ctgtcattag  1860
caaacgttta ctgcagcatc acattgtcaa atcatagcgt aattaggctc aaaaatattc  1920
gtctcgtaat ttacatgcaa actgtgtaat tggttttttt ttcgtcaaca tttaatactc  1980
catgcatgtc caaatatttg atgcgatctt tttggccaaa ttttgttgga atctaaacaa  2040
ggatcaaatt tgctgaattt ttccagacgt cacggcttgt tcatccatcg ttcgcatcgc  2100
gattcgccac cgacgccttg gtttccaacg aattttatca tccgcttaaa tacatccaaa  2160
gctctccatc gccatcggcg gccaacggcg accgctccgc tctacccaat ccacccatcc  2220
actcgccgcc gccccctgat ccaaagcctc cgccgcgccg ccgtcgagag gaggaggagg  2280
aggaggagga ggaggcgtga gcccctatgg ggaccctcct ccggccgcgt ccgcttgccc  2340
acgccgccgg cgccggcgac gccacgccgt cgaccgcgca cggtagccac gcgcctctcg  2400
agaggccccc cccccccgcc gctcgctgat ctctcttctc atcctgtttg ggtttgggtt  2460
tgtgatttgg gtgttttttt tttttccgca gcggtggtgg tgagcggtgg ccgcggccgt  2520
ggcgtggagt gccagccgca tcgggtgcgc cgccgcccgg gtccgcaggt tgcggtggcg  2580
acggcgagct ggaggaggcg gagggagacc gtggtgagat cggatttcgc cgctggtggt  2640
gccgctacca tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct  2700
tctcgcaaaa tgtgttgcta tgttcctctc gctgggctgg cctcatagcc attaatgtag  2760
tttgctggaa cattacattc ggaacgttgt tggcaattgc ttgacaaaat gtggaattgt  2820
ggaggggaga aaaatcgttt gaacctgcag tgacaaaatt gccatctata attttaaaac  2880
tgaaggtgtg gaaatcaaac ataatcattg ccagcacatc attcttgtta accaccttga  2940
catattgttg gcttataaca gttagctcca caccaacttg gaaggtgtca atggaatgta  3000
agtataaatt gaggataact ggcagttgtt aagactttct acagaacttg tagcagctaa  3060
aactagctat tgtgcattta tgtttcatgg aatttgagcg gcaatggata tttcttacta  3120
agacgtataa tgcaaaaaaa aaaaaaaaac tatgtctatg cagtttacat gtaatgtgcg  3180
gatgcaaata aaatcatgtt catggacaaa ctaatgggat tcataccaaa ttccagaatt  3240
gcatttctta tgtggttact tttgtttgtt gatttggtta ccagacatcg atgtggtttc  3300
aagggtcaga ggggtttgct tctacgcggt gactgcagtt gcagcaatct ttttgtttgt    3360
cgccatggtt gtggttcatc cacttgtgct cctatttgac cgataccgga ggagagctca    3420
gcactacatt gcaaagattt gggcaactct gacaatttcc atgttctaca agcttgacgt    3480
cgagggaatg gagaacctgc caccgaatag tagccctgct gtctatgttg cgaaccatca    3540
gagtttcttg gatatctata cccttctaac tctaggaagg tgtttcaagt ttataagcaa    3600
gacaagtata tttatgttcc caattattgg atgggcaatg tatctcttag gagtaattcc    3660
tttgcggcgt atggacagca ggagccagct ggtatggctg tagtctcatc cctgctttct    3720
taagtagaca tatatacatt tacagtattt ggtaaataaa caagatttta tgaatcatat    3780
atgattttgg ggaaaacaca aaactctctt tgttggctgc cttgaacata gttctgttca    3840
cacagttata gcaccttctt taaaatgaag aactttgttg catacacata aggccaaacc    3900
acataatgaa ttttgtttat ttctatcttt gaatgttagc atcgtttttg tttaatgcat    3960
gatcgccttc ctatatattt gtagtatgtc aacattgtat tccatgctga gcataacaaa    4020
tggtttgtta aaattcagga ctgtcttaaa cggtgtgtgg atttggtgaa aaaaggagca    4080
tctgtatttt tctttccaga ggggactaga agcaaagatg gaaagctagg tgcatttaag    4140
gttcagtaac caaacttagg ttacattaca tctaatgaga tttttatatt cagtatataa    4200
tgttaacctt ctcatggtgt actgacgtgg ttataaatgt ccccagagag gtgcattcag    4260
tgtggctaca aagaccggtg ctcctgtgat acctattact cttctcggga cagggaaact    4320
gatgccttct ggaatggaag gcatccttaa ttcaggttca gtaaagctca ttattcacca    4380
tccaattgaa gggaatgatg ctgagaaatt atgttctgaa gcaaggaagg tgatagctga    4440
cactcttatt ctaaacggtt atggagtgca ctaaagaaag atggtgtttt tttttattat    4500
atggaaccta ttcaaaggca cagacaggct ttcaaggcta agcttgttac aggtactgat    4560
actagttact aattactttc gtaatcagta taaataagct tgtgtagtgt aatggcattg    4620
tacatttctg cacttggtaa atttacagaa gaggcaagta atattttaga ggattgagtt    4680
tattcaccca gtcatatagt tgaagaggca agtaacctgt aagagaggac tgaacattaa    4740
cacctcttgt tcgattaaaa atgaccaaag agcatcaaac atgtattcga ggctgttact    4800
ttagatatgg cccattaatt tgtttagttg tctatgtaca tcctagttgg tgtaaatgcc    4860
agttaccatt tctatgatct aaaacaatca actcttttag tatattttca aaaacgaaat    4920
tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc    4980
accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat    5040
tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt    5100
ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc    5160
tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag    5220
agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt    5280
ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta    5340
tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc    5400
tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg    5460
attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct    5520
acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac    5580
aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg    5640
ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa    5700
gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg    5760
cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg    5820
ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg    5880
ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta    5940
gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg   6000
attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg   6060
ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg   6120
cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga   6180
cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttcattt ccttgatgaa   6240
ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa   6300
tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac   6360
ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca   6420
ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc   6480
tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc   6540
gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag   6600
gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg   6660
aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct   6720
gagaagcgta ataccctact cctgtgtttt gggggatctg tgtatgaagg agctacaaag   6780
tatgagccag cctctccctt gttctgggtt ccgaatctgg aaaagtccag tccagtcccc   6840
ccctctaagt gggcaaggtc ctccttttat atcttaaggg gataccacat gcaccatctc   6900
cctcctttct gtggagactt accctacctt ttcataaatg gacggagatt tgtatagttg   6960
ccgtccgaat gaccttctga taggacggcc catacctacc tccacttccg ccgaaagcag   7020
gtgcgacgtg ggattatggc tgtctgctga cgacatgacc agtgtcagac tggtcacaaa   7080
ttgctcattc ctgtccacca cgcgtcagtt tagcaatcta catgttggcc cttcttcaca   7140
caacatcttg cctgtaatgg ttaggatgaa gcctggcata tatctaacca ggactaacgt   7200
gccatctcta ggaggtaaca cgctagctcc agctggggac gagcgcctag aagccctcgt   7260
cctgacggga tggggcgagg cgtgcgtcag atcgcctgtc gccacctaac ctgcgatctg   7320
accggtctgt gactggtcac agaccggata aacgagtgca ctgcacttcg ttacatgcag   7380
cgtgacacgc tcagccaaac cgcaataaat gtggttaggt gagccccgct gtgctcacct   7440
aacccataca cgcggagcaa aaacccacga ggggtcgggg cgcctcggcc ctcggggccg   7500
aggcgggtgc ggtccgaccc cctcgggggg actaagagga gggcgaacac atcaccctcg   7560
ggcccgacgt cccccgaggg tgccaggcca cgtgggcgat tgtgtctgcc tcaaacctct   7620
agtcatgata ctcctgatcc catgtcaccg acagtagccc ccggcgttat gccagggcga   7680
tcgccctctt taagggaagc ggtcgggcgt gacgccactc ctaaggcctg gtgacaggtg   7740
ggaccggtct ccacaattgg gcagaaaccc aacggtcaca aatcacgcac atcggcaatg   7800
gtaactctac tatcaataat gagcggtctc ttcaagactg ccacattact cgagtagcac   7860
acgaatctgg acatggcgat tcgtttcgtc tggagatatg gtaacgtcgc tttggtcggc   7920
gagcgtaatt aacgcgcgca cgatatgatc tatctcgact gccacaaccg catatccacc   7980
tcatgcgccg caagcgggcg aatgggatta gtggaagcgt gggcgcgaga aacgaggggg   8040
cgaaatagtg ggcgcgagaa gcgaggagcc gggcacagcg ttggcaagag tataaaggca   8100
ctgaggaaag gatctgtttc cttcctttcg ccatcatttc ccttgtcttc gccgcttgcg   8160
ccctaactcc ttctttcctg tgctctactt tcgccacacg cgctcgctct caatcttctc   8220
ttcctccggc gccatggcac ggggctccgc tctgctcgat ggtagcgtgc tgccgccttc   8280
ccgcatcgtg agcgagaggc aggctgggct gccgcgccgc ttcatgccgg aatctgccac   8340
cggccgggag atagtcacgc tgggcgaggg acgcccggcg ccagactacc cggggcggtc   8400
cgtcttcttt ctcccctttg caatggcagg gctggttccg ccattttctt ctttcttcat   8460
ggatgttctg aagttctacg atctccagat ggcgcacctc acccccaacg cggtgatgac   8520
attggccatc ttcgcgcatc tgtgcgagat gttcattgggg gtgcgcccat ctcttcggct  8580
gttccggtgg ttcttcaccg tgcagtcggt gtcgccgcca tcggtagttg gtggctgcta    8640
cttccagcca cgggggccgg tgctgaatcg ctacatcccc tgcgccctcc gcaagaagtg    8700
ggacgactgg aagagcgact ggttctacac ccccctcgcc gacgaagcgc gcctccgact    8760
tccgagccag cccccggcgc aggcctccag ctggcgggcg ccggtagatc tgggggatgg    8820
ctatgacgcc gtcctcgacc gcctggcggg cctacgatcc caggggctca cagggaccat    8880
ggtgtacggc gactacctcc gtcgtcggat tgcgccgctc cagcggcgcg ctcggggcgc    8940
ctgggagtac accgggtccg aagactacat gaggacccac cagggagtca gatgggactg    9000
ggctcctgag gatttcaaga tagtggtcca acgggtgctg aatctcaact ccatggaggc    9060
gtccctcatt ccccaaggaa tcctccctct ctgcagcgat ccagaccgcg cctccatcct    9120
gaccattatg acggcggtcg gggcctcaga ggagtgagct ccaaagggcc acgacggcgc    9180
aggcgggagc cgtagggggg atcaatctac ccggggaggg ggtcgtgctt ctgggtctcg    9240
cgacggaggc ccgaggagca gccgccctgc cgacgcccgg gggaagagga agcagggagg    9300
aacacctccc ccatctcctc cccgaggggg cggggcggtg cgtgccagca gcaggcgccc    9360
ggagggggcc gcgccgacat cgcagcccga gggggagcgc aagaagaagc ggctccgcaa    9420
gatgggggag acagaaccat ctcagggaaa ccttatttcc cctctaaagt ggtcgtttaa    9480
ccgaccccct cgcaggttcg tctctcaccc atcgtggctg tattcattct ctcaacgcga    9540
gttttcactc acccatcttg ttcgtcttct ggtcttttct tctgtttcag cgagatcccg    9600
tcgcgtccct cccgccattc caagtccggc cagtctgagg ccgaggatcc ggcggccgca    9660
gaggcccgga ggcgggaatc tgaccggcga gaggccgcgg atcgcctacg ggaagccgag    9720
gaggccgccc aggaggccgc ccgggctcgc caggtcgagg aaaccgctcg ggaggaggcc    9780
gcccgggccc gccaggccga ggaagccgct cgggaggagg ccgcccgagc ccaccaggcc    9840
gaggaagccg ctcgggagaa agccggattt cgccaggacg aggcaatggc gacttccgag    9900
gcagctcgcg atgaggtcgc gggcgcgtcg cttgagccca cttcctcggg cgacgctcag    9960
gcgacaactt ccggggcagc tggcgacgag gctgcgggcg cgtcgcttgg gcccactccc   10020
tcaggcgacg cccaggacca accaggtccg agggacatcc ctgagtccgg cacttccatc   10080
ggcggcccga gccgcgtggc atcctctcca aggcggctct tccccacgcc ttctatcgcc   10140
ccactgagcg cagagcccct tctgcaggcc ttggccgccg caaacaccgc ggtgttggac   10200
gggcttagtg cccaggtgga ggccctgcaa gcagagtggg cggagctcga cgccgcgtgg   10260
gcgcatgtcg aggaggggcg gcgctcagtg gaggccatgg tggaggtggg ccgcaaggca   10320
caccgccggc atgtctcgga gcttgaagcc cgtaagaagg tgttggcgga aatcgccaag   10380
gaagtggagg aggagcgggg ggctgccctc attgccacca gcgtgatgaa cgaggcgcag   10440
gacaccctcc gccttcaata cgggagctgg gaggcggagc tagggaaaaa gctcgacacc   10500
gcccaggggg tgcttgacgc tgccgctgcc cgagaacagc gggcggggga gaccgaagcg   10560
gcgtcccgac ggcgcgaaga gacccttgag gcgcgcgcca tggcgctgga agagcgcgcc   10620
tgcgtcgtgg agagggatct ggcggaccgc gaggccgccg tcactatccg ggaggcaaca   10680
ctggcggcgc acgagtccgc ctgtgccgaa gaggagtccg cactccgcct ccacgaggac   10740
gcgctcaccg agcgggagcg agctctcgag gaggccgagg ccgcggcgca acggctggcg   10800
gacagcctgt ccctccgcga ggcagcgcag gaggagcagg cgcgccgcac tctggaatgt   10860
gtccgcgccg agaggaccgc actgaaccag caggccgctg acctcgaggc gcgggagaag   10920
gagctggacg cgagggcgcg cagcgacggg gcggctgcgg gcgaaaacga cttagccgcc   10980
cgcctcgctg ctgccgaaca taccatcgcc gatctgcagg gcgcgctaaa ctcgtccgcc   11040
ggggaggtcg aggccctccg cttggcaggc gaggtagggc ccggcatgct ttgggacgcc   11100
gtctcccgcc tagatcgcgc cggtcggcag gtgggcctct ggagagggcg gaccgtaaag   11160
tacgccgcca accatggagg cctcgcccag cgcctctcga agatggccag ggctctccaa    11220
cggctccccg aggagctcga gaagacaatt aagtcatcct cgagggacct cgcccaagga    11280
gcggtggagc tcgtactggc gagttaccag gccagggacc ccaatttctc tccatggatg    11340
gcgctggatg agttccctcc tgggaccgag gacagcgcgc gcgcaggtcc gggatgccgc    11400
cgaccatatc gtccacagct tcgagggctc agcccctcgg ctcgcgttcg cccccaactc    11460
cgacgaggag gacaatgccg gtggtgcaga cgacagtgac gatgaggccg gcgacccggg    11520
cgtatcggat tgatccccca agcccccgcc attctttagt tttttcttct tttccttctt    11580
ctaaggcctt cgggcctctt ttttgtatag atcaacttaa tctgtaatca aaaatgaaga    11640
aatttttgtg tcaatttcat cttgctgtgt gtatgagatg aggatgatct gtgacgtggt    11700
ccttttgcgt cttagcttga ttaagggctc gtgcccaggt cccagtcctc aaaaggcgtg    11760
ggtcggggct agtgcctggg gagatccaca tgtcgagact ggccaggccg ggaacgtggt    11820
gaccgagggt tatgggtgac ccgattgtgg gtttttgccg attccccccc ggagttcacc    11880
acgccccggg gcacggctcg gttctgggcc ccgtttggcg attttagccg acccgagccc    11940
ccgagggcag gattgagcac gagtgaccta tttcaagtca agattcttca aaaggaaaaa    12000
aaaacacaga tacagccttt aggaaattga aactgctttt attgaaatac tgaaataaga    12060
gaaataagaa tgtgcatgtg tggcagcccc cggccaacgc tgcacgcccg agggggtgcg    12120
gggttggccc gagcccgaaa cctgacaccc gacccccccc tcaggggtag aagcgacgaa    12180
ggtgttcgat gttccacggg ttaggcagct caatgccgtc gcccgtggcc agccgtatgg    12240
agcccggccg ggggacgccg accactcgat acggaccctc ccacattggt gagagcttgc    12300
tcaatccagc acgcgtttgg acgcggcgta ggacgaggtc gtcgacgcag agtgatcggg    12360
cccggacgtg acgctgatgg tagcgccgca ggctctgctg gtagcgcgcg gctctgaggg    12420
ccgcgcgccg ccttcgctct tccaagtagt cgaggtcatc tctgcgaagt tgatcttgat    12480
cagcctcgca gtacatggtg gcccgaggag acctcagggt gagctcggat gggagaaccg    12540
cttccgcgcc gtagacgagg aagaaaggcg tttccccggt tgctcggctt ggtgtagttc    12600
ggtttgccca gagcaccgct agcaactcct cgatccatga atcgtcgtgc ttcttgagta    12660
tgttgaaggt cttggtttta aggcctttga ggatttctga attggcgcgc tccacttggc    12720
cattgcttct ggggtgggca ggtgaggcga agcagagctt gatgcccatg tcttcgcagt    12780
agtcgccgaa gagttcacta gtgaattggg tgccattatc cgtaataata cggttaggca    12840
ctccaaaccg ggccgtgatg cccttaatga atttaagtgc ggagtgctta tcgatcttga    12900
cgaccggata agcctcgggc cacttagtga acttgtcgat cgcgacatac agatactcaa    12960
acccgcccgg ggcccgccta aacggtccca ggatatcgag cccctagaca gcaaatggcc    13020
acgaaagtgg tatggtctgc agggcctggg ccggctgatg gatttgcttg gcgtggaatt    13080
gacacgctct acatcgccgg accaggtcga ccgcatcatt gagagctgtc ggccaataga    13140
aaccctggcg aaaagcttta ccaaccaagg tgcgcgaggc ggagtgggct ccgcattcgc    13200
cttcatggat atcggcaaga agcacaacgc cttgttcccg aggaatgcac ttcaggagga    13260
ttccattagc cgcgcgccga tagagggtcc cttctaccag cacgtagcgt ttggagatgc    13320
gatggacgcg ttcactccct tcgcggtcct cgggtaaagt cttatctgtg aggtatgctt    13380
ggatctcggc aatccaagca atcaatctaa gggagctggg agcgctcccc tcgggtcccg    13440
aggcctggac ttcgacgggc ctcgggggcc ggtcaggcgc gtccgtctcc cctaaggggt    13500
cgggtcgcgc cgacggctgg gcaagccttt cttcaaaggc gcccggtggg gtctgggctc    13560
gcgtggacgc gagccgtgag agttcgtcgg caatcatgtt atcccgtctg ggcacatgcc    13620
gaagctcaat cccgtcaaaa tggcgctcca tacgccgtac ttggcgcacg taggcgtcca    13680
tctgcgggtc agagcaccgg tactccttac agacttggtt aacgaccagc tgggagtcgc    13740
ctaacaccag gaggcggcgg atccccagtc cagctgccac tctgagtccg gcaaggagtc    13800
cctcgtactc tgccatattg ttagtcgctc gaaagtcgag gcggaccaag tatctgagga   13860
cgtctccgct cggagaggtc aacgtgaccc ccgcaccggc gccctgaaga gacagggagc   13920
cgtcgaactg cattacccag tgggcggtgt gaggcagctg cgaggggtcc gtgctggcct   13980
cggggattga gacgggctcg ggagccgggg tccactctgc cacaaaatcg gcgagagcct   14040
ggctcttgat agcgtgacgt ggttcaaagt gcaaatcgaa ctcagaaagt tcgattgccc   14100
atttcaccac ccgtcctgta ccctctcgat tatgcaagat ttgaccgagg gggtaagacg   14160
taaccacagt gacccgatgc gcctggaaat aatggcgcag tttcctcgag gccatcagaa   14220
tagcgtaaag catcttctgg gcctgagggt atcgggtttt ggcgtcccgg agggcctcac   14280
taacaaagta gacgggccgc tgcacctttc ggtggggccg atcctcttcg ctaggggccg   14340
catccctggg gcactcttcg tccaagcagc ctcgcggggc gcacttgtct tctgtgctga   14400
tgacctcggg gtcggaggat aacaggggcg gccttcccac agtggctttg gggccgtcct   14460
gggggtcagg ggctcctggc gtcgtcggac aagcgggcaa agggccaact ccggtcgtca   14520
ggggccttag gcctccgttc ggctcggggg cctcttctcc ctgctctttc ccgggtcgag   14580
tcagcacagg gttagcctcg gggtcaaagg gcgataggtg cggccttccc acagtggcct   14640
cagggccttc ctgggggtcg ggggctccta gcaccgtctg acaagcgggc agagggccaa   14700
ctccggtcgt cgggggcctc aggccaccgt tcggctcggg ggcctctcct ccctgctctc   14760
tcccgggcca agtcggcaca gggtggggaa gcgcgaaatg agaattatcc tcatcgcgct   14820
ccacaaccaa tgccgcacta actacttgcg gggtcgccgc taagtagagt agcaagggct   14880
cgtctggctc cggggcgacc ataactgggg gagagcttag atacgccttc aactgggtga   14940
gggcattttc agcttccttc gtccaggtaa acggtccgga gcgtttgaga agcttaaata   15000
agggtaacgc cttctctccc agcctcgata tgaaccgact tagggcggcc atgcaaccgg   15060
tgacgtattg cacatcccta agtttgctgg ggggcgcatc cgctctatag cccgtatctt   15120
ctcggggttg gcctcaatgc cccgggcaga gaccaagaac ccgagaagct tgcccgcagg   15180
tacaccgaac acacacttat cggggtttaa ttttatgcgg gcggagcgga gactctcaaa   15240
agtttccgct agatctatga gtaacgtttc ctggttgcgc gtctttacaa ccaagtcatc   15300
gacataagcc tcaatattac gtcctaattg gctaccgaaa gaaattcgag tagtacgttg   15360
aaaagtagga cctgcattct ttaacccgaa gggcattgtc gtataacaat aggttcctat   15420
gggggtaatg aacgcagttt tttcctcatc ctccctagcc atgcgaatct gatggtaacc   15480
agagtatgca tctagaaaac acaaaaggtc gcaccccgca gtggagtcga caatctgatc   15540
tatgcgaggc agggggtaag gatccttagg acatgccttg ttaaggtcgg tgtagtcgat   15600
gcacatccga agcttgccgt tcgccttggg aacgaccacc gggttcgcca gccactcggc   15660
ggggttgacg ctgccatcat atttttcggc gatggtgggc cggaaccttg ggggccaacg   15720
gacattccga agactcgcca caaaggctct acagccgaca ccaccaaccg ggggcacgga   15780
gggctgattc ccgcgtccgt gttgaggtga cactctggac gaggaagcgc cctccgttgc   15840
gtgggcagca cttcggtcat tacgccggcg ctcgatgctg gtgcgggcgt ccggcccccc   15900
acgcagatct ttctgggtcg aaggagtcga cgaaggagtg gcggccgaat ggcgaacagc   15960
ggctgccgct cgtcgtgccc tccgtcttga cgacgcggag ccggtggtag cagcaccaga   16020
ggccttggtg gcggaggacc gcccaccagc atctaggcgc tgccgtgccg tcatgactaa   16080
tttggccacg tcgtccagcc atcgttgggc tggagactcc gggtcaggga cgacaggcgg   16140
gtgacgtaag agcgcgcccg cagcttggag cgcgccctgg ggcgtgctgc cgtcgccgta   16200
gacgaggagg cgacgctccc catctcgccg ttcttctcca tcgcccgcga tcggtgaagt   16260
cgcggatctt tcgaccctct cgagcgcctc cccccgctta ggactttggc atggagggag   16320
cggtggagta cgagctcgac ggcgtgggtt cggctccccg tcgtcgccac tcacactcgg   16380
agagaggtcg tgcgcctttg cttgctcggc catcaggctg aacaggaaaa gcttggcgca   16440
cacggaagag tacgagagct cagaaaaaca cacactgagt cccctacctg gcgcgccaga   16500
tgacggagcg tggggctcct caccgggaga ccgcgcaggc ccccctttgc cggttcggcc   16560
ggggactcaa ggtgaaattc taagctctct gtatgtggaa ggtttgcgac cgtcgaaaga   16620
gcataagaca cgggcgatgt atacaggttc gggccgctga gaagcgtaat accctactcc   16680
tgtgttttgg gggatctgtg tatgaaggag ctacaaagta tgagccagcc tctcccttgt   16740
tctgggttcc gaatctggaa aagtccagtc cagtccagtc cccccctcta agtgggcaag   16800
gtcctccttt tatatcttaa ggggatacca catgcaccat ctccctcctt tctgtggaga   16860
cttaccctat cttttcataa atggacggag atttgtatag ttgccgtccg aatgaccttc   16920
tgataggacg gcccatacct acctccactt ccgccgaaag caggtgcgac gtgggattat   16980
ggctgtctgc tgacgacatg accagtgtca gactggtcac aaattgctca ttcctgtcca   17040
ccacgcgtca gtttagcaat ctacatgttg gcccttcttc acacaacatc ttgcctgtaa   17100
tggttaggat gaagcctggc atatatctaa ccaggactaa cgtgccatct ctaggaggta   17160
acacgctagc tccagctggg gacgagcgcc tagaaaccct cgtcctgacg ggatggggcg   17220
aggcgtgcgt cagatcgcct gtcgccacct aacccgcgat ctgaccggtc tgtgactggt   17280
cacagaccgg ataaacgagt gcactgcact tcgttacatg cggcgtgaca cgctcagcca   17340
aaccacaata aatgtggtta ggtgagcccc gctgtgctca cctaacccat acacgcggag   17400
caaaaaccca cgaggggtcg gggcgcctcg gccctcgggg ccgaggcggg tgcggtccga   17460
ccccctcggg gggactaaga ggagggcgaa cacatcaccc tcgggcccga cgtcccccga   17520
gggtgccagg ccacgtgggc gattgtgtct gcctcaaacc tctagtcatg atactcctga   17580
tcccatgtca ccgacaaggc catccgaatg tattaaggag taaaagttac aagaaaaaac   17640
accataatgc accaatgtgc atgaccacac accatacact acccccaagc acaaaccact   17700
gagggtgaag cctagcacca aacgaccgcc actaagtgtg accaaacgcc gctaggccta   17760
cggcagcaac acatagatga gacttcgaaa acgatgccac caaggtggtc acgacatcta   17820
ggatgctgcc atcgtccatc taaaaagatg tggttttcac ccagagaaac tcatcaagaa   17880
ggggagaggg taacccttga cagcgcccca aggaggttac gacgcccgaa ggcgtagccg   17940
ctgccggtcc ggtgaaccac cggactaggc ttccgcctag gaccctatag ccttgatcgc   18000
agatcaccgt ccaccactca gaaccaccac acagacaaaa ggtagcacgt agcttccacc   18060
acaccgcacc gacgcccctt cgtcggccga ctccatcgaa ccaccatccc tgagagctgg   18120
cccaggaccc ctccgttcca ccacccgccg gccgccttgc cagttttggc caaaggagaa   18180
cccgggactg ggtgacattg cttcggcagc ctgagcttcc cccgctggcg agctgctgtc   18240
tcaatccaac ctagaaactc cccgcaaaag aaggggatga gctctaggaa gggcgagggt   18300
gccgaccggc aacgaggaag acaacccatc gactccagct ccctttgcac taccatctgg   18360
ccctgcgcca atgccggata cgctgtcgct ccggctccgg cgccacccac ctgcaccccc   18420
tttgcctggt ctccgcgccc ctcctggctg cgtcgcgccg cccagctggc cgctaagggc   18480
accgcgacgg ccgcccggct accgaggcct ggccgcgcca tgggacagct cgcgctggca   18540
ccagcgagcc acggccgtcg cgctgttgcc ggcgccagcg agcacaaccg ccagctccaa   18600
gggccgagca tgccactgag ccgccgccgc tgccgcccgg gccggctgca cgtcaccggc   18660
gcacacgacc gcacgccgcc acgctccgcc tccgcgcccg aggcagcccc atgccattgc   18720
cgcgcacctc gcccgcccgc tgccgagccg ccaccgcgca ccttgctgag ccgccaccgc   18780
cgtccctagc cgcctcgtgc cgccgccacg ccagatccag gcgcgggatg gccggatccg   18840
gccttggggg cgccggatcc accgcctccc cacaccgcca cggcgtcacc acctccgacc   18900
gcagtgaggg cttcgtcgtt tgccccatcc tcatcgcgtc gaggaggaag acgccaagaa   18960
aaaagggcct cgccgctgcc ttccttgctc gctgccggct tcgccgccgg cgagctccgg   19020
cggcggcgag gtgggggaga agaagtgggg agtgggcagc tagggttttt tcgcccccca   19080
agccgcccgt gcgagagcga cggtgggggg gggggggact ttccaacctc ttccagtgtt   19140
ctagttctcc acgttatgta actcaatttg tttaaccata gaaagtaaga aacctaccag   19200
cgtgttaagc tctctttcat tccctttctt cttcctggtt ttgcttccat cacatgtcaa   19260
gtgaagggtt cttaactacc attactccta cacatctaat ttttttctca gatctttcgc   19320
aggtatatat tgatgctaca ttttatgatc ttaagataat ctccttcaca ttaccctctg   19380
ctgaaacttt agcttgaacc gtcatcttca ccacaatttg agcccaattt gcacagagca   19440
caacgagcaa tagcttgccc ttacgttcat tatttagcat gaactactac taactaccca   19500
agaatcaata caccggttta ataacgccat tttatcacgt taatatatgt ttcattcaac   19560
acaccggttt tggcacagtt gcaaacttgc aataaattct ttcctacttc tccatcccat   19620
aatataacaa attggtatgt ctcgtctggt actaagttac tatattatga gatggaggga   19680
gcacttcttt tcttccaaaa tataagaata tagtattgga ttagatatta tctagattca   19740
cgaattcgat taggttgtct agatttatag ttgtatgtaa tgtataattc ggtaataggt   19800
tattacctct caggatggag ggagtagttt tgactttttt tttcttataa atcgctttga   19860
tttttatatt agtcaaattt tatcgagttt aactaagttt atagaaaaaa attagcaaca   19920
tttaagcacc acactagttt cattaaattt agcatggaat atattttgat aatatatttg   19980
ttctgtgtta aaaatgctgc tatatttttc tataaacgta gtcaaattta aataagttag   20040
actaaaaaaa atcaaaacga cttataatat gaaatggagg aagtagtaga ctataacaaa   20100
tttaaaccgt gctttgattt tagagcatca ctaatatgtt agcaataatc tatccctaaa   20160
atttattttt tttcctaaac tgaaaatagg aagtggaaat actcctccat ctaagagaga   20220
gcctaaattc aataaaaaac taaaaaacta aaggtggatc cctctattaa actaccgcaa   20280
aaaatttatg ttttttttct cttccacgcg cgcagaacag atatctcgat caagttagca   20340
tgtaaaattt ttaaagagat accttatacg actccttccg tatttccaaa agcaaacgga   20400
tttaaaatct gactcaaata aagatctata tatccaattt acatgacaca tgtttcgccg   20460
aatttttata ttaataataa ttaatatttt taaaattaaa ttattagcaa tttgtttgga   20520
ggatttatca aaacaggatg gacgttgttt ataacagcgt ctagacctag acgcgcttgc   20580
aaactgcggc caccctttta tcacacaaat ttttgacaat ttgacacttt ccaaaaatta   20640
attttataaa ttaaccgtga ccaaaactta tttaaaaatg atctttttgt tgagcgcaaa   20700
atcgtatact tcagcgccaa atagcacggc gccgacctcc cccttcccct cccctctatc   20760
ctccactgct gccgcccacc tctccgtatc agctgcgtcg cgttggtttc cgccggcgct   20820
gctgctgctg caccagtccg ctagggcggg cgggcatggc gcgccgcgcc gcttcccgcg   20880
tccgcgccgg cgctgttggc gcccttcgct cggagggctc gacccaaggg cgagggggcc   20940
gcacgggggg cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccggcgtg   21000
gcaggggcgc ctcgatctac ggcttgaact gcgccctcgc cgacgtcgcg cgtcacagcc   21060
ccgcggccgc cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc   21120
ccaacttgtg cacctacggc attctcatcg gttcctgctg ctgcgcgggc cgcttggacc   21180
tcggtttcgc ggccttgggc aatgtcatta agaagggatt tagagtggat gccatcgcct   21240
tcactcctct gctcaagggc ctctgtgctg acaagaggac gagcgacgca atggacatag   21300
tgctccgcag aatgacccag cttggctgca taccaaatgt cttctcctac aatattcttc   21360
tcaaggggct gtgtgatgag aacagaagcc aagaagctct cgagctgctc caaatgatgc   21420
ctgatgatgg aggtgactgc ccacctgatg tggtgtcgta taccactgtc atcaatggct   21480
tcttcaagga gggggatctg gacaaagctt acggtacata ccatgaaatg ctggaccggg   21540
ggattttacc aaatgttgtt acctacaact ctattattgc tgcgttatgc aaggctcaag   21600
ctatggacaa agccatggag gtacttacca gcatggttaa gaatggtgtc atgcctaatt   21660
gcaggacgta taatagtatc gtgcatgggt attgctcttc agggcagccg aaagaggcta   21720
ttggatttct caaaaagatg cacagtgatg gtgtcgaacc agatgttgtt acttataact    21780
cgctcatgga ttatctttgc aagaacggaa gatgcacgga agctagaaag atgttcgatt    21840
ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt    21900
atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg    21960
gtatccaccc taatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga    22020
aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccggata    22080
cagtgaccta tggaacagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta    22140
tgcgttattt tgagcagatg atcgatgaaa gactaagccc tggcaacatt gtttataact    22200
ccctaattca tagtctctgt atctttgaca aatgggacaa ggctaaagag ttaattcttg    22260
aaatgttgga tcgaggcatc tgtctggaca ctattttctt taattcaata attgacagtc    22320
attgcaaaga agggagggtt atagaatctg aaaaactctt tgacctgatg gtacgtattg    22380
gtgtgaagcc caatatcatt acgtacagta ctctcatcga tggatattgc ttggcaggta    22440
agatggatga agcaacgaag ttacttgcca gcatggtctc agttggaatg aaacctgatt    22500
gtgttacata taatactttg attaatggct actgtaaaat tagcaggatg gaagatgcgt    22560
tagttctttt tagggagatg gagagcagtg gtgttagtcc tgatattatt acgtataata    22620
taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtcg    22680
ggattaccga aagtggaacg cagcttgaac ttagcacata caacataatc cttcatgggc    22740
tttgcaaaaa caatctcact gacgaggcac ttcgaatgtt tcagaaccta tgtttgacgg    22800
atttacagct ggagactagg acttttaaca ttatgattgg tgcattgctt aaagttggca    22860
gaaatgatga agccaaggat ttgtttgcag ctctctcggc taacggttta gtgccagatg    22920
ttaggaccta cagtttaatg gcagaaaatc ttatagagca ggggttgcta gaagaattgg    22980
atgatctatt tctttcaatg gaggagaatg gctgtactgc caactcccgc atgctaaatt    23040
ccattgttag gaaactgtta cagaggggtg atataaccag ggctggcact tacctgttca    23100
tgattgatga gaagcacttc tccctcgaag catccactgc ttccttgttt ttagatcttt    23160
tgtctggggg aaaatatcaa gaatatcata ggtttctccc tgaaaaatat aagtccttta    23220
tagaatcttt gagctgctga agccttttgc agctttgaaa ttctgtgttg gagttctttt    23280
ctcctacagt cgtattagag gagggatctt ctctttatgt gtaaatagcg aggtatgtat    23340
gtcacctctc cgaattattt ttactctggt tcctagacgg taaacaagca attatgttct    23400
gcctttgatg ccagaaaaaa cacaaaagtt tgtcgttatc tctactaacg gatcataaag    23460
gaatttgtaa ctggagtttc aaacttaatt tgtctaggca gtagttttgg cattagatcc    23520
aacattgtgt aggattcatt tgtgtgtatc aatctatagg gtttcattaa atttcgttta    23580
tgtgtactgt ttaggtgttg aatagtttga cttgtttttt aactgaacaa aagatactga    23640
aatcgttcca ttcaacaaac acatgttccg ttaatgaaat tattgtacgt taccttttgt    23700
tttcttactc acaagtgtcc tcttttctta tatcctatag attggtacaa caaattattg    23760
attcaatttt ggttttgaac attgatgatc ctccctgcac tattggtgca gctgctcttc    23820
tattcatttt gtgaagtgat gtgagtacct ctcaatccca tccttatgct tctgtgcatg    23880
cttcattcca attttttacg catatcgatt gttttctttt atataacagt ccataaagat    23940
aatcacatca tgacaaagtt atttatttct acagtatagt tatataagta ttcaccagtt    24000
ttccatgaat attttggcat gtgattacaa agaagattat ttgagaaaat ccatgctttt    24060
atttcatcat tttgtttgaa gttgaacttt aatttatggt gtaaatttca gttattattg    24120
ctagcagctc gtactcttta atggtataac ttcacttgtg cttattctcc aatatctccc    24180
ttcttgttgt tcaggttcaa gaaaatcatt tgttggattc agaatctggt gtccattttc    24240
ttcttaaatt attaaatcct ccagtgaatc ttgttgattc caaagcacca tcgataggtt    24300
ccaaacttct tggaatcagt aaagttcaaa tgcttaatgg atcaaataag gattctgact    24360
gcatttcaga ggaaatcctt tcaaaagttg aagagattct cttaagctgt caagtgatca    24420
agtcgctcga caaagatgac aagaaaacaa caaggccaga actgtgtcca aagtggcttg    24480
ctttgttgac aatggaaaat gcatgcttgt ctgctgtttc agtagagggt aagttttaat    24540
caaatttctt ggtcatgatt tccctttatg accattatat ttatttatat gagccaaata    24600
agcagttgtc aacttgtcat aagttacata gcacctattt gcaatattca tgggtggttt    24660
gcttagccct tttcttcacc tgcttttgat tgatgacttc catctgtgtt gcagaattga    24720
attggagtag tggactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc    24780
ccttatcaaa tatttgattg ttacagagac ttctgacaca gtgtccagag ttggaggaaa    24840
ttttaaagag acattaaggg agatgggagg tcttgatagt atttttgacg ttatggtgga    24900
ttttcattca acattggaga tgagatctcg ctaacatcgc atattttaca tttcctttgt    24960
tcaactctaa tagattgtgc aggcttgttc cttttcgcca ttttagcttt aatgcgcttg    25020
aagccacatg aaagtaatgc ttgtccagat acatagccaa aggttgttat attttggggc    25080
atggaaaatg cttgaggtag taactatttt catcaggaca tggaaaattg gctgcaacac    25140
aaattatgtt gttttatgtt gcaaaaatag ttttttaata cttttttatt ctgcatgtgg    25200
tgttagtatc ttacagttcc tctgatgatt atatccccca cgataataac acttgaaacg    25260
ataataacac ttgacatatc tacaccaagt gaacattatt catttggatg ttacttttcc    25320
agctatactt gctgttcttg catgtgtaag caagtttgga gtaaattgcg cattaattta    25380
aatgcttggt gttcctatct gtgtactttt tattccccaa ctaataatgc aatcatatta    25440
cgctgataaa ctgaataaat aaattaacaa tatacttctg gtggcaaacc ttgtgtatca    25500
gaatctcata aaggatacat ccacttcagc tttggaccga aatgaaggaa catctttgca    25560
aagtgctgct ctcctcttga aatgtttgaa aatattggaa aatgccatat ttctaagcga    25620
tgataacaag gtaatgctcc ttatatgttc tgtttcagtt tagtacccat ttccttcttc    25680
tgtactatct tctctcctga tttgttctgt gcaaaatgtg caaacagtgc gactttgtat    25740
gtctgcttaa caattttctt ttcttcctga aaaagcaata tgaactctta cattcatttt    25800
gcttcttgca gacccatttg cttaatatga gtagaaaatt gaacccgaaa cgctccttgc    25860
tttcttttgt tggtgtcatt atcaatacta ttgagttatt atcaggtatt tttcttaata    25920
atacaatgtg ttcgctaaca caataaaatg ttttaaacat ccagtatgtt aaagttgcag    25980
tctgacgcct attttgtttt gctgcagctc tttcaatact tcagaattct tctgttgttt    26040
ccagctctac atatccgaaa tcgtctaaag tctctcaaca gagttactct ggtaataaca    26100
aacaccaatt ttgtttgatc agttgatctc gttggctttt ctatgcactg tctcaatata    26160
gtttggtcgc cattcaagtc tcactacaga tgttgaactt ggcctgacac caaatattta    26220
taaaatgcta cctgatattt ttaatatttc atgtttcctg acccagatta tcttgttggt    26280
tcctcgtata agtttaatta gtgacattct tgaagctttg ttatgcagca gatgtcatgg    26340
ggggaacttc atttaatgat ggaaagagca agaactcgaa aaaaaaaaac ttttgtcgaa    26400
ccagacacgt cattgttgct tatcttcaaa atcagaagtt tctcatatta ctatatcttc    26460
tggtagtgat gctggtctgt cacagaaggc attcaattgt tctccattta tatcaagcaa    26520
tggggcatca agtggttcat taggcgagag gcacagcaat ggtagtggtt tgaagttgaa    26580
tataaaaaag gatcgtggca atgcaaatcc aattagaggc tcaactggat ggatttcaat    26640
aagagcgcac agttctgatg ggaactccag agaaatggca aaaagactcc gtctatctta    26700
aaatgtaatc accgacagtg gtggtggtga tgaccctttt gcatttgacc gccgcgtcgg    26760
cgtcgccacc acgtaatcgc ccacgtcgct gcccccgctg ccacgtcgtc gaccgcgcac    26820
ggtaatcaca cgcatctcga ggccgccgct agctgatatc ttctcatccg gttgatttgt    26880
gattttggcg tttttgcagt ggtgatggcg gggggcgacc gtggccgagg cgtggagtgc    26940
catccgcatc agggtgtatc ggccgcgctg ctccgccctg gtccgcaggc tttggcggcg    27000
agctggcggc ggagggagac tgtggtgaga tcggatttcg ccgctggtgg tgtcgctacc    27060
atgggggatt cgccgcaggc gctctcaggt ttgcagcctc ctccactctc ttcccttttt    27120
tatttttttt tctcgcaaaa tgtgttgtga tgttcgtctc gctgggctgg cctcatagcc    27180
attaatgtag tttgctggaa catttacatt tggaacgttg ttggcaattg ctttacaaaa    27240
tgtggaattg tggaggggag aaaaatcatt tgaacctgca gtgacaaaat tgccatctct    27300
aattttaaaa ctgaaggtgt ggaaatcaaa cataatcatt gccagcgcat cattcttgtt    27360
aaccaccatg atatattgtt ggttataaca gttagctcca caccaacctt gaaggtgtca    27420
atagaatgtt tagtataaat tgaggagaac aggcagttgt taagactttc taaagaactt    27480
gtagcagcta atactagcta ttgtgcattt gtgtttcatg gaatttgagc agcaatggat    27540
atttcttact aagatgtatg atgcaaaaca aaaaactatg tctatacagt ttacatgtaa    27600
tgtgcggatg caaataaaat catgtacatg gacaaactca tgggattcat accgaattcc    27660
agaattgcat ttcttatgtg gttacttttg ttgttgattt ggttaccaga catcgatgtg    27720
atttcaaggg tcagaggggt ttgcttctac gcggtggctg cagttgcagc aatctttttg    27780
tttgtcgcca tggttgtggt tcatccactt gtgctcctat ttgaccgata ccggaggaga    27840
gttcaggaaa aaaatttgaa aatacccatt ttttgaaaaa gatttacgtt tatatacact    27900
agtatgaaga atttgcgaaa atataactaa tccgcagatc ggttatgcgg gagcgcaaca    27960
aaagtatggc gtggcggcgc ggagtggacg gccgaggcgt tcgcgcggaa tggggctgcg    28020
ggaccgagcc agtctcgctt gccggtaacg cggaaccggt acgctcccgc agcgccagtg    28080
tgcggaaccg cggcgccaac atttttttac tgcatggcac tgtgtttaat actgtttgac    28140
actgtttctg gtactgtttt acacagttcc cgggtcagtt ccgcacaatg gaggcgcggc    28200
accgaccatg aacaatgtgt gaacagtgct gcacagggtt aaaacagtgt ataaactgcg    28260
ctgcacagtg ctggagtcgc tggccactgc ggttccgcgt tttggaaccg cgggaccgtc    28320
gcgattccgc gttttggagc tgccggacca tgacggttcc gcgcaggatc gtcggtcccg    28380
tattttgaat ctgcggaacc gtcgctgtcc cgcgtttcca tttcgcggga tgcgtatatt    28440
tttataaaac ctctccatgc atgtatataa acataaatta ttgaaaaaat aagtatattt    28500
gcaaattttt ttcgagagct cagcactaca ttgcaaagat ttgggcaact ctgacaattt    28560
ccatgttcta caagcttgac gtcgagggaa tggagaacct gccaccgaat agtagccctg    28620
ctatctatgt tgcgaaccat cagagttttt tggatatcta tacccttcta actctaggaa    28680
ggtgtttcaa gtttataagc aagacaagta tatttatgtt ccgaattatt tgatgggcaa    28740
tgtatctctt aggagtaatt cctttgcggc gtatggacag caggagccag ctggtatggc    28800
tgtagtctca tccctgcttt cttaagtaga catatatgca attacagaat ttggtaaaca    28860
aacaagattt tatgaatcat atatgatttt ggggaaaaca ccaaactctc tttggtggct    28920
gccttgaaca tagttctatt cacacagtta tagcaccttc tttaaaatga agaactttgt    28980
tgcatacaca tatggccaaa ccacataatg aattttgttt atttctatct ttgaatgtta    29040
gcaccttatt ttcatgcata tcatgctaat ttgcttgccc acgttgagtg ggaatttttt    29100
tccatgtttt ataatttata tatgttctag acttctagtc cacaatttat ctacttcatg    29160
ttcctgagcc tctagtatgg ctggtagcag actaggtgct gagtgctgtc catttttgca    29220
gactgaagag aggagaaata caggactgtc cgttgttagt cagatttgta aaaatagact    29280
ctgatgtagt ttattttagc ccctatttta tatttaacaa tacaaatata taacgtatcc    29340
taagaactta tcgtaattta ggagaagttg ctcgtttcat taaattaaac tgtgaagtaa    29400
aaatgtgtgc tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg    29460
gcaggctagg atcgaacact gaatggtaag actgcttctg ccttcatttg tgcacttggt    29520
gctgccacgc cgattaagca gtagaacaaa gtaattttgt cgtgcacaaa tgagttatat    29580
ttcattgaaa atcgaagtga aaatgaacca aaagatagaa gaaaagggga aacttggtaa    29640
ttatatactc cacaaattta ttggtaagat ttgatattag acgctcgatt acttggctta    29700
agttaaggat atcaaatttg gggaagcacc aaaggaatta ttgtgaagga gttgtgggtg    29760
cataacgtta tctactagtt caaatcctag tgactatgaa tattaatgag taaggtaagg    29820
gatttattgt taattttagt ttctttaaga ttgtgtccga gtacaccatt cggtaagtgt    29880
aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgcttttacc ttttcatttg    29940
tttctgcgtt ctgggtatga atttgacgag attccatggt cagctcaaca tatcagttac    30000
tgcgtgtcaa gcgatcttat atggtatgcg cacaagcgat tgtatacgga tatgacagta    30060
taatgtgtga tattgatacg atgttccttt cctttataaa ggaacaaaga ctttttttaa    30120
aaaaagaagg ggtattacta aaaaccaaaa tgtcaaaaac aaaatatcag tgcacatggc    30180
aagtgtgcac gagcaatagc ttgcccttac gttcattatt tagcatgtac tactactaac    30240
tacgcaaaaa tcaattcacc gattattaaa ctgttaacat cattttagca cgttaacata    30300
tgtttcattc aacacaccgg ttttggcaca tttacaaact tgcaaagttg caatactccc    30360
ttcgttacat agcataagag attttaggtg aatgtgacac atctatccaa attcattata    30420
ctagaatgta tcaccgcctc cacgccggga gggagagcgc cgccggtgga gaaaggggga    30480
gggagtggtc gaggggaacc agtagggtgc cctccccgtc gccgcctccc cgtggccgcg    30540
ccggcgagac aggaggaaga gggggagatg gagcggcgcc gccggtgagg gcgcgcgtgc    30600
gcgggggggg ggggggggga gcggcgacgc cggtgaggaa gggaagggga gtggtggctt    30660
tgagagagat aggggagagg gaaaatgatt ttagagttag ggtttgggct gctgagtttt    30720
tatatagatc gggatcaatc aggaccgtcc atcagatcgg acaactacgg tttctcccgc    30780
gttgggccgg gtgccactcc taggttgccc acactattgg gccacatgta cgctccgcgt    30840
gaaataagtt cactttaggt cctttaagtt gcctctgaat tgttcccagg ccggccgcac    30900
tattgggcca ccccataggc catgtgtacg ctccgcacag aataatttcg ctttagctcc    30960
cttaatttgt cccctcaaac ttctaaaacc agtgcaaatc tttaattttt agttcaccca    31020
ttgcaactca cgggcatatt tgctagtgac atataatatg aaacgaagga tgtagcagac    31080
tatagaattt aaactgtgct ttcattttag agcatcacta actgttattt agatttttat    31140
ttaaataaat gcagaaatga tgtttttatt atgaaaatta gcaataaagc tcccaaaatt    31200
tcaaaaaaaa attaaaagag atttattaat catggttaat ttaattaaaa attaaatcta    31260
accatatcat attatttcac ggtccgtgat gaggaaatgg cagctgctat cacttatggt    31320
gggagagaag gggcattgtt tatttttata actatctctt ataactccca tgaaactata    31380
aaataaatat aatcattatc ataacattag tttttttcca ttgcaacgca agggtaattt    31440
ttcagtacaa taaaaaaata aaagtgggcc attctgaacg gaaatttctg gttttttttc    31500
ccaagagcgc cgcacacaac tgcgcaagag atcgatcgcg atcaccctgc tcgtcgccga    31560
tctcctacac catccctgcc atctccttcc cctccactgg ctgctgctgc acctgtcagc    31620
tagggcgggc atggcgcgcc gcgccgcttc ccgcgctgct ggcgcccttc gctcggaggg    31680
ctcgatccaa gggcgagggg gccgcgcggg gggcagtggc ggtggcgcgg aggacgcacg    31740
ccacgtgttc gacgaattgc tccgtcgtgg cataccagat gtcttctcct acaatattct    31800
tctcaacggg ctgtgtgatg agaacagaag ccaagaagct ctcgagctac tgcacataat    31860
ggctgatgat ggaggtgact gcccacctga tgtggtgtcg tacagcaccg tcatcaatgg    31920
cttcttcaag gagggggatc tggacaaaac ttacagtaca tacaatgaaa tgcttgacca    31980
gaggatttcg ccaaatgttg tgacctacaa ctctattatt gctgcgctat gcaaggctca    32040
aactgtggac aaggccatgg aggtacttac caccatggtt aagagtggtg tcatgcctga    32100
ttgcatgaca tataatagta ttgtgcatgg gttttgctct tcagggcagc cgaaagaggc    32160
tattgtattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttataa    32220
ctcgctcatg gattatcttt gcaagaacgg aagatgcacg gaagcaagaa agatttttga    32280
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg    32340
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa    32400
cggtatccac cctaatcatt atgttttcag cattctagta tgtgcatacg ctaaacaaga    32460
gaaagtagaa gaggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa    32520
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc    32580
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa    32640
ctccctaatt catggtttgt gcacctgtaa caaatgggag agagctgaag agttaattct    32700
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag    32760
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgacctga tggtacgtat    32820
tggtgtgaag cccgatatca ttacgtacag tactctcatc gatggatatt gcttggcagg    32880
taagatggat gaagcaacga agttacttgc cagcatggtc tcagttggaa tgaaacctga    32940
ttgtgttaca tatagtactt tgattaatgg ctactgtaaa attagcagga tgaaagatgc    33000
gttagttctt tttagggaga tggagagcag tggtgttagt cctgatatta ttacgtataa    33060
tataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt    33120
cgggattacc aaaagtggaa ggcagcttga acttagcaca tacaacataa tccttcatgg    33180
actttgcaaa aacaaactca ctgatgatgc acttcggatg tttcagaacc tatgtttgat    33240
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg    33300
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa    33360
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt    33420
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa    33480
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc    33540
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct    33600
tttgtctggg ggaaaatatc aagaatatca tagatttctc cctgaaaaat acaagtcctt    33660
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt    33720
ttctcctaca gtccgattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt    33780
atgtcacctc tccgaattat tttgactgtg gttcctggac tgtaaacaag ctattatctt    33840
ctggtgttga tgccagaaaa aacacaaaag tttgtcgtta tctctactaa cggatcataa    33900
aggggtttgt aactggagtt tcaaacttaa ggtatctagg cagtaggtat atattgatcc    33960
tacatcttat gatcttaaga tgatatcctt ctcattatcc tctgctgaaa ctttagcttg    34020
aaccgtcatc tacaccacaa tttgagcccc ttagcacaga gcacaacgag caatagcttg    34080
cccttacgtt cattatttag catgcactac tactaactac ccaataatca atacatcggt    34140
tattaaactg tttgtacagt ttaataatgt cattttatca cgttaacata tgtttcattc    34200
aacaccacac cggttttggc acagttgcaa acttgcaata acatttttac tacttctccg    34260
ccccataata taacaatctc gttccatact atattgctat attacaggat ggatgaagta    34320
cttcttttct tccaaaatat aagaatctag tactagatta gatattattt ggattcacga    34380
atttgattag gctgtctaga tttgtagtcg tatgtaatgt ctaattcggt aataggttat    34440
tacctctttg gatggaggga gtagttttta tttcgtactc cctccgtttc atattataag    34500
ttgttttgac ttttttctta gtcaaatttt attgagtttg attaaattta tagaaaaaaa    34560
ttagcaacat ttaagcacca cattagtttc attaaatgta gcatggaata tatttttata    34620
atatgtttgt tttttattaa aatgctacta tatttttcta taaatgtagt caaatttaaa    34680
gaagtttgat tatgaaaaaa tcaaaatgac atataatatg aaactgagga tgtagcagac    34740
tatagcaaat ttaaactatg cttttatttt agagcatcac caaaagatta gcaataattt    34800
atccctaaaa ttcaagtttt gggtttctta aactgaaaat aggaagtgaa aaatcttttc    34860
cgtccaagag atagcctaaa tcttatctta actaattaaa atattcataa ttttcctttc   34920
gtcacattaa attttcgtcc gtaaatctga ttgaaatcca attggacaat ccaaaaaata   34980
gagaaaaaga acagaaaaaa taataaaaag cacacaaatc ttatctcaat cccgcgggaa   35040
gctgccgacg ccgccgaatc cgctcgagcg ccgccgccgc cgctcacggg gaacgatgtc   35100
gctgctgtcg cacgcggtat gggagggcgc cgctgccact gcttgggaga taggatatgg   35160
agagagaagg aaatgtgagg gttagggtta ggtttttccc cgtccgtatc ttcagcgaca   35220
cggaggcgat ccaagctgtc catcagatcg gacggctcag aatgcctcca tcgtcgggcc   35280
gcgcatgctt gatgggccga gggaaggccg gagggtcgaa caaacgcaat caaaggagga   35340
gttggaggag gtaaattaga atttatttgc gggctgagat agtaaatgga ctgaaaatgg   35400
cccatagaga aattgggaat tttatttaaa taaatgttga aaaggtgttt atattatcaa   35460
aattaaaaat taagctccga aaattctaaa aaatattcaa agagcattat taatcatggt   35520
taatttaata aaaattaaat ccaaccatat catattattt cacggcgcgc ggtaggaaaa   35580
tgcgcagctg ttgtcgttta cggtgggaga gaagggacat tgtttatttc cagaactatc   35640
ttttataact cccatggaac tttaaaataa atataatcat tattatagca ttagtttttt   35700
tctgtctttt ttttccccaa gagcgccgcg cagaagagat cgatcgcgat ctccctgccc   35760
cgacgtcgcc ggccgatctc tcattctctc cacgccctgc tcgtcgccga tctcctacac   35820
catccctgcc atctcctcct tcccctcccc tctatcctcc actggtgccg cccacctctc   35880
cgtataagac aaactgcgtt gcggcgttgg tttccgccgg cgctgctgct gcacctgtca   35940
gctagggcag gcatggcgcg ccgcgccgct tcccgcgctg ttggcgccct tcgctcggac   36000
ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg gcgccgagga cgcacgccac   36060
gtgttcgagg aattgctccg gcgtggcagg ggcgcctcga tctacggctt gaaccgcgcc   36120
ctcgccgacg tcgcgcgtca cagccccgcg gccgccgtgt cccgctacaa ccgcatggcc   36180
cgagccggcg ccggcaaggt aactcccacc gtgcacacct atggcattct catcggttgc   36240
tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct tgggcaatgt cgtcaagaag   36300
ggatttagag tggaagccat caccttcact cctctgctca agggcctctg tgccgacaag   36360
aggacgagcg acgcaatgga catagtgctc cgcagaatga ccgagctcag ctgcatgcca   36420
gatgttttct cctgcaccat tcttctcaag ggtctgtgtg atgagaacag aagccaagaa   36480
gctctcgagc tgctgcacat gatggctgat gatcgaggag gaggtagcgc acctgatgtg   36540
gtgtcgtata ccactgtcat caatggcttc ttcaaagagg gggattcaga caaagcttac   36600
agtacatacc atgaaatgct tgatcggagg atttcaccag atgttgtgac ttacagctct   36660
attattgctg cgttatgcaa gggtcaagct atggacaaag ccatggaggt acttaccacg   36720
atggttaaga atggtgtcat gcctaattgc atgacatata atagtattct gcatggatat   36780
tgctcttcag agcagccgaa agaggctatt ggatttctca aaaagatgcg cagtgatggt   36840
gtcgaaccag atgttgttac ttataactcg ctcatggatt atctttgcaa gaacggaaga   36900
tccaccgaag ctagaaagat ttttgattct atgaccaaga ggggcctaga gcctgatatt   36960
gctacctatt gtaccctgct tcaggggtat gctaccaaag gagcccttgt tgagatgcat   37020
gctctcttgg atttgatggt acgaaacggc atccaccctg atcatcatgt attcaacatt   37080
ctaatatgtg catacgctaa acaagagaaa gtagatgagg caatgcttgt attcagcaaa   37140
atgaggcagc atggattgaa tccgaatgta gtgacgtatg gagcagttat aggcatactt   37200
tgcaagtcag gcagtgtaga cgatgctatg ctttattttg agcagatgat cgatgaagga   37260
ctaaccccta acattattgt gtatacctcc ctaattcata gtctctgtat ctttgacaaa   37320
tgggacaagg ctgaagagtt aattcttgaa atgttggatc gaggcatctg tctgaacact   37380
attttcttta attcaataat tcacagtcat tgcaaagaag ggagggttat agaatctgaa   37440
aaactctttg acctgatggt acgtattggt gtgaagccca atgtcattac gtacagtact   37500
ctcatcgatg gatattgctt ggcaggtaag atggatgaag caacgaagtt actctccagc    37560
atgttctcag ttggaatgaa acctgattgt gttacatata atactttgat taatggctac    37620
tgtagagtta gcaggatgga tgacgcatta gctcttttca aagagatggt gagcagtggt    37680
gttagtccta atattattac gtataacata attctgcaag gtttatttca taccagaaga    37740
actgctgctg caaaagaact ctatgtcggg attaccaaaa gtggaacgca gcttgaactt    37800
agcacataca acataatcct tcatgggctt tgcaaaaaca atctcactga cgaggcactt    37860
cgaatgtttc agaacctatg tttgacggat ttacagctgg agactaggac ttttaacatt    37920
atgattggtg cattgcttaa agttggcaga aatgatgaag ccaaggattt gtttgcagct    37980
ctctcggcta acggtttagt gccagatgtt aggacctaca gtttaatggc agaaaatctt    38040
atagagcagg ggttgctaga agaattggat gatctatttc tttcaatgga ggagaatggc    38100
tgtactgcca actcccgcat gctaaattcc attgttagga aactgttaca gaggggtgat    38160
ataaccaggg ctggcactta cctttccatg attgatgaga agcacttttc cctcgaagca    38220
tccactgctt ccttgttata gatcttttgt ctgggggaaa atatcaagaa tatcatagat    38280
ttctccctga aaaatacaag tcctttatag aatctttgag ctgctgaagc attttgcagc    38340
tttgaaattc tgtgttggaa ttcttttctc ctacagtccg attagaggag ggatcttctc    38400
tgtatgtgta aatagcgagg tatgtatgtc acctctccga attattttga ctgtggttcc    38460
tggactgtaa acaagctatt atcttctggt gttgatgcca gaaaaaacac aaaagtttgt    38520
cgttatctct actaacggat cataaagggg tttgtaactg gagtttcaaa cttaaggtat    38580
ctaggcagta gttttgacat tagatccaac attgtgtagt attcatttgt gtgtatcaat    38640
ctatagggtt tcattaaatt tcatttgtgt actgtttagg tgttgaatat attgttttac    38700
ttgtttttta actgaacaaa agatagctga agctttgttc tttaccaaat gcagtagtga    38760
tcatcacaat atattttttt acggaacagg agattgtata aaatggtttc catcggcggc    38820
caacggcgac cgctctgctc tgacccacca cccaatccat ccatccactc gccgccgccc    38880
ctgatccaag cctccgccgc gcgacagcga cgcaccgccg tcgagaggag gaggcgtgag    38940
ccccatgggg accctcctcc ggccgcgtaa tgccgctgca cggtaaccac gcgcctctcg    39000
aggcctccgc cgctagctga tctcttctca tcctgtttgg gtttgggttt gtgatttggg    39060
tgttttttcc gcagcggtgg tggtggtggt ggttgcggcg ggagggggcg gtggccgcgg    39120
ccgtggcgtg gagtgccagc tgcatcgggt gcaccgccgc cggggtccgc aggttgtggt    39180
ggcgacggcg agctgaggag gcggagggag actggtgagg gacacaggca ggcaggctct    39240
caaggctaag cttgttacag gtactgagac tagttactaa ttactttgat aatcagtata    39300
aataagcttg tgtagtgtaa tggcattgtg catttctgca cttgtaaatt ttacagaaga    39360
tggtcattca atttgaacct gcatctaata ttttagtggt ttgagtttat tctcccagtc    39420
acagagttga agaggcaagt aacctgtaag agaggactga acattaacac ctcttgttcg    39480
attaaaaatg accaaagagc atcaaacatg tattcgaggc tgttacttta atatggccca    39540
ttaatttgtt tagttggcta tgtacatcct agttggtgca gtgttgtgga aaacggaata    39600
cgggtgtcgg atggacgagg tgccgtcaag cgattaatcg taatacggat gattaaacgg    39660
aattatatgg atttttggcg ttcgcactaa gatgtacata attgatgtta atggcaatgg    39720
tggagacaaa atgcatcatc ttaataaaaa atatttgtat aaatctctaa ctatattatg    39780
aaaatgccat ttattagttc aatagatatc aacactgatg gttagtagcg caatagcatt    39840
gggcttgtta gtcaaaatag tgcagctggg ctgcaagttg caagtttatg ttagtttcat    39900
aaacagacat ctgatttgtc gataaataac cgactaatcg tgccatacaa ctgtataatt    39960
actctgaaat agtaatgttg ctccgacttg atgatacggt acggtctggc taccgtttcc    40020
gttttgacag acgattaaac ggctgtgccg gtcgacttcc acaacactga gttggtgtaa    40080
atgccagtta ccatttctat gatctaaaat aatcaactct tttagtatat tttcaaaaac    40140
gaaaattcag tacacatgca tgaatcttaa tcttcatatc tagctcgtta caaaatcaac  40200
aaaggcaccg tgtcagctgg tgcacattag ctagttcgta cttagcatta tccactagca  40260
ccttattttc atgcatatca tgctaatttg cttgcccacg ttgagtggga atttttttcc  40320
atgttttata atttatatat gttctagact tctacttcat gttcctgagc ctctagtatg  40380
gctggtagca gactaggtgc tgaatgctgt ccttttttgc agactgaaga gaggagaaat  40440
acaagactgt ccgttgttag tcagatttgt aaaaatagac actgatgtag tttatttttg  40500
cccctatttt atatttaaca atacaaatat ataacgtatc ctaagaattt atcgtaattt  40560
aggagaagtt gctcgtttca ttaaattaaa ttgggaagta aaaatgtgtg ctcgagtatg  40620
tcaatgcaat cctgtgttct tgtttgaaga tatggtgtag ggcaggccag gattgaacac  40680
tgaatggtaa gactgcttct gctttcagac gttattgcta aatttttagc tagttgcaat  40740
tagtgctgtc acgccgatta agcagtagaa caaagtaatt ttgtcgtgac aaatgagtta  40800
tatttctttg aaaatcgaag cgaaaacgaa ccaaaagata gaagaaaagg gaaacttggt  40860
aattactcca caaagagaac aaatttattg gtaagatttg atatgagatg ctcgattact  40920
tggcttaagt taacaatatc aaatttgggg aagcaccaaa agaattattg tgacttaagt  40980
taaagatatc aaatttgggg aagcaccaaa ggaattattg tgatggagtt gtgggtgcat  41040
aacgttattt gctttgttca aatcctagtg actatgaata tgaatattaa tgcgtaaggt  41100
aaggaattta ttgttaattt taggttcttt acgattgtgt ccggggacgc cattcggtaa  41160
ctgtaataat gttttgtatt ggattcactt gtgttacatg cacgcactaa acatgtgctt  41220
taccttttca tttgtttgtg cgttctgcgt ttgaatttga cgagattcca tggtcagctc  41280
aacatgtcag ttactgcgtg tcaagcagtt actgcgtgtc aagcgatctt atatggtatg  41340
cgcacaagcg attgtatacg gatatgacag tataacgtgt gatattgatt tttttatata  41400
aaaaaatacg atgttacttt ccttcataaa ggaacaaaga cttttttttt aaaaaaaaga  41460
aggggtatta ctaaaaacaa aaatgtcaaa aacaaaatat cagtgcacat ggcaagtgtg  41520
ctcggcaatt ttttgtctgt actttaaaca aaaatatttc tatatggtat tttttacaag  41580
ggtgtcacaa atattttaaa ttagccaaac atctgcattt tattaaaaac tgtataaatt  41640
ataatttata ctctaaaagg ttgtgtacat ctctcttgga gaaaatgtat aagttgcgaa  41700
caaacattaa tccacgttat ataagtcaat ctgttattta accatagaaa gtaagaaacc  41760
tactagcgtg ttaagctaag ctctctttca ttctctttct tcttcctggt tttgcttcaa  41820
tcacttgtca agtgaagggt tcttaactac cattactcct actcaccaaa tttttttctc  41880
agatctttcg taggtatata ttgatcctac atcttatgat cttaagatga tatccttctc  41940
attatcctct gctgaaactt tagcttgaac cgtcatctac accacaattt gagcccctta  42000
gcacagagca caacgagcaa tagcttgccc ttacgttcat tatttagcat gcactactac  42060
taactaccca ataatcaata catcggttat taaactgttt gtacagttta ataatgtcat  42120
tttatcacgt taacatatgt ttcattcaac accacaccgg ttttggcaca gttgcaaact  42180
tgcaataaca tttttactac ttctccaccc cataatataa caatctcgtt ccatactaga  42240
ttgctatatt acgggacgga tgaagtactt ctttccttcc aaaatataag aatatagtac  42300
tagattagat attatttgga ttcacgaatt tgattaggct atctagattt gtagtcgtac  42360
gtaatgtcta attcggtaat aggttattac ctctttggat ggagggagta gtttttattt  42420
cgtactccct ccgtttcata ttataagttg ttttgacttt tttcttagtc aaattttatt  42480
gagtttgact aaatttatag aaaaaaatta gcaacattta agcaccacat tagtttcatt  42540
aaatgtagca tggaatatat ttttataata tgtttgtttt tttattaaaa tgctactata  42600
tttttctata aatgtagcca aatttaaaga agtttgatta cgaaaaaaaa tcaaaatgac  42660
atataatatg aaactgagga tgtagcagac tatagcaaat ttaaactatg cttttatttt  42720
agagcatcac caaaagatta gcaataattt atccctaaaa ttcaagtttt gggtttctta   42780
aactgaaaat aggaagtgaa aaatcttttc cgtccaagag atagcctaaa tcttatctta   42840
actaattaaa atattcataa ttttcctttc gtcacattaa attttcgtcc gtaaatccga   42900
ttgaaatcca attggacaat ccaaaaaata gagaaaaaga acagaaaaaa taataaaaag   42960
cacacaaatc ttatctcaat cccgcgggaa gctgccgacg ccgccgaatc cgctcgagcg   43020
ccgccgccgc cgccgccgct cacggggaac gatgtcgctg ctgtcgcacg cggtatggga   43080
gggcgccgcc gccgctgctt gggagatagg atatggagag agaaggaaat gtgagggagg   43140
gttaggtttt tccccatccg tatcttcagc gacacggagg cgatccaagc tgtccatcag   43200
atcggacggc tcagaacgcc tccatcgtca ggccgcgcat gcttgatggg ccgagggaag   43260
gccggagggt cgaacaaacg cagtcagagg aggagttgga ggaggtaaag tagaatttat   43320
ttgcgggctg agatagtaaa tggactgaaa atggcccata gagaaattgg gaattttatt   43380
taaataaatg ttgaaaaggt gtttatatta tcaaaattag aaattaagct ccgaaaattt   43440
taaaaaatat tcaaagagca ttattaatca tgattaattt aataaaaatt aaatccaacc   43500
atatcatatt atttcacggc gcacggtagg aaaatgcgca gctgttgtcg ctgacggtgg   43560
gagagaaggg acattgttta tttccagaac tatcttttat aactcccatg gaactttaaa   43620
ataaatataa tcattattat agcattagtt tttttctgtc ttttttttcc ccaagagcgc   43680
cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc   43740
tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct   43800
cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg   43860
ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc   43920
cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg   43980
cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg   44040
caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc   44100
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc   44160
cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct   44220
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt   44280
cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt   44340
gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct   44400
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc   44460
tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg   44520
cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg   44580
ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca   44640
agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga   44700
ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc   44760
tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag   44820
cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga   44880
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg   44940
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa   45000
cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg   45060
gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa   45120
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc   45180
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa   45240
ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct   45300
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag   45360
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat   45420
tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg   45480
taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa   45540
tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc   45600
gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa   45660
cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt   45720
taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg   45780
actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat   45840
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg   45900
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa   45960
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt   46020
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa   46080
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc   46140
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct   46200
tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt   46260
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt   46320
ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt   46380
atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt   46440
atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa   46500
agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat   46560
ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat   46620
agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat   46680
gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt   46740
tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc   46800
tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc   46860
acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa   46920
gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa   46980
agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata   47040
ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag   47100
atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg   47160
atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa   47220
tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt   47280
ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg   47340
gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc   47400
aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat   47460
ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc   47520
taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt   47580
taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata   47640
ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg   47700
ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat   47760
ggaaggatcc acagataaaa ttcaggttct actgcttctc tgcttgtaat tttcatgaag   47820
ctgcagtgaa taccttgttg accacttgat ctgttgcttt gaaggagaat atagtagtgg   47880
ccaaggttgg tgacggtgat ggtggcatgt gatcccccag atcttcagtg acccagagag   47940
gaggggacgg cgcgtggtga gctacaaggc atactcagtg gagggcaaga tcaaggcctc   48000
ccgtccgtag gggactccgc tgcatcaagg ccaactgctc cgaactgatc aatttctggt   48060
acggatcact tctcctttcc tttttttttt caccttaagc actctcttga ttcttcgctg   48120
ctacctccct taatttcttt caatatattg tggcacttga tcatggcgga gacccacctt   48180
ccagtgtgaa tggattttgt caaagaacta aatttattcc attagcttat tttccgatta   48240
catggaagac attcttttct ggaataaata cagaactaaa tcctgtttcc tgaataaaag   48300
ttgttagtgt gtggcatggt gcatttccgc gcttctaaat tttataaaac ctgttcattc   48360
aatttgaacc tgcatccaat ccaatatttt aggtgcagac aggtgcttgc ggtcaggtta   48420
aagaagttgg caaaaatgct tctgaagaaa ggttaattgt tgtttcatct caggaggtaa   48480
tatgcagatg attattccaa ttggcattgc cttgccattt ttatcacgag tctttacaat   48540
tttatatcct cctacatatt ctttccagat tccagatgat ccagtgtctc caacaattga   48600
ggcgcttatt ttgctccata gtaaagtaag tacacttgct gagaaccacc agttgacaac   48660
acggcttgtt gtaccatcaa acaaagttgg ttgtattctt ggggaaggtg gaaaggtaat   48720
tactgaaatg agaagacgga ctggggctga aatccgagtc tactcaaaag cagataaacc   48780
taagtacctg tcttttgatg aggagcttgt gcaggtaatt tatttggcca tacctacacc   48840
agagatccat atattacttt tataactgca gtttttactt gttaacattt cattgtgctt   48900
ttacatttgt tccaagcttt caggttgctg ggcttccagc tattgaaaga ggagccctga   48960
cagagattgc ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc   49020
cgacaccttt tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca   49080
tgctatatgg acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat   49140
atggaagacc tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct   49200
gccaatgatc caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat   49260
gatgggcctc gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc   49320
cccccgattc ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg   49380
caacgtgagg cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat   49440
aacgatcagc cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag   49500
catatcagcc ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa   49560
ctgctgactg ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag   49620
aacaaccacg gcactgctgc ctgctgggct ctagccgcca tcagtaagta cgctatactg   49680
cctatctaga tctagatcga gattacatag tggaattatc tgtttataac aaaattacaa   49740
ggtatcaatt gataatttaa ggttataacc gtacaaactt cagtgatttg ctggtttcac   49800
attggttaga tttgtttcaa ctaatttggt acttctgtag ccttgtaatt tacgaatcta   49860
gtattaatat tttcttaagt attagcctgt tccttgatat tatgctgttg agaaagtatg   49920
caatagataa caaaaacaag taggtgtgtt gaggatgctc aagagtaata caggcacttc   49980
aataattctg atattatcag gacatcatca ataattctgc gcctacaaat cttcaaagaa   50040
aattttaata taatgcgtat gattttttaa atacgaatat tgattgctat ttaaagatat   50100
ttatattata tggtaattat tatttgaagg tttataataa aggcctccgt ttttagtttc   50160
acgctgggcc ttcagaatct caggaccggc cctgctcatg atccttacac cgtgtatcct   50220
gtagagtact tctctaaaag agagtaccct agtggaagta gcaaagttgc accatctgct   50280
tcatacgaaa gatatgcagc aactactcgc ttgcctaata gagaactgcc ctcatctatt   50340
agtcctggtg ccgattatat gtcctgccgt tcttatcttg accaagtacc tactgatagg   50400
tactctaata gggttacact acaattaggc ctcttgagag ccgggaatag taatgtgcaa   50460
caattaggaa tcaccagagc tggaaattcc aatgcttatg attatactga ggtacatttc   50520
caatgcgtta gcttgcctct tctttgcaaa tggccctcgc ctgatatgtt tccattagaa   50580
acatgaaacc atatatttga ctgttgcatt atgtctattt tcttccatga tggttcagac   50640
gtctgaaaaa aggacaaaaa tattctagaa tatgtcatgg tgatccaaat atatccttct    50700
gtcttgtgcc cactctaata tctatcgttg gtaacactat tcaattgtta ccatgttgtt    50760
gcaaacccta gattcagtta ttcagctgtt ctctgctgct gttgcttacc agttttctta    50820
gttgggtgtt gatcttttct cattttttat ttccttgttt cctggttcac ctgctgcctc    50880
tctgatgcat ctgaatgtat atttttgttc tcttcagtgc ttaatagatt taaatttcat    50940
tcttttcagg ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc    51000
actgggtatg gcttacgcag actgaatttt tacaggacac aaacatgaat tttgtcctca    51060
taatcattga gtgatgatct ctttgcaggt atccaggtgg ctctgtcgaa ttgtggattc    51120
caaatagtta actggagtct gtcattggtg ttggtggtgt caatctagct gagatccgtc    51180
tggtatagcg taagagaaac atcatgcact atccccagtc ataaccatgc cccaatggcc    51240
accaatagtt ttcctcgtga aaatctcccc ttgatcccag atctctggtg cgagagtgaa    51300
gttgcacgaa gcccatcctg gttcttccga gtccattgtg gagatccagg gcattccgga    51360
tcaagtgaaa gccgcacaga gccttctgca aggcttcatc ggcgcaagca gcaacagcag    51420
gcaggcgccc cagtcctctc gcatggccca ttatttttag taagctggag gacattcgca    51480
acaggggggt cagtggtcac tgcaaagctg agtttgttct tcagttcaac tgcagaaaat    51540
tgcagatcgg ttgccgtagt tgctagaacg gtacatagtt gccacctaac tgtagcgagt    51600
ggcataactt attgtgtgtt actgcccaat gttgtctctc cttgtgttca tggattcaga    51660
cttgtgattg tagtatttct ggatcagact ggagtaaaag aaaaaaaaaa aggaagacat    51720
gggtttaaca gtaagctcaa aacgttgaca gtagtaaaat aaaaggggtt tgttcacttt    51780
atttccaata tcaaccttac caacatttgg cgttgaatca tttataccac atcgcttgtg    51840
cagctgaatt tggggctgtt taaaagatgg tctcttggat tgctaattgc ctcgcggcaa    51900
gcgtggtacc ttgtacaata taaatataat tataactatt taatttcata attaaacatg    51960
ttgttacaaa tctctactat tataaaaatt gaagatgttt tttgccggta ttttggtacg    52020
tcatctgtgt atgaatccgt ttttaagttc gtttgctttt ggaaatacat atctgtattt    52080
gattcagttt ataagatcgt tcacttttgg taatacagaa ggaatcatat aagaattctg    52140
tttaaaaaca ctcgtatagt aacttgagac gatcagacgc ctaactacag ctcatgattt    52200
tctaaatata tatatatata tatatatata tactagaaaa aatatatgtg tgttaaaagc    52260
tatcttaatc ttattattgt tatatatttt agttaacaag aaatctattg tgggaacttg    52320
tttggatata tattttttta aaaaaaatca tgagctgcaa ttaggaatcc aatcgtctca    52380
agttagcagg agggcgagtt tttttaaaga gatttcttat acgatttctt ctatatttct    52440
aaaagcaaac gaacttaaaa accgactcaa acatggatct gtatttccaa aaacgaataa    52500
acttaaaaac cgactcatgc acagatgatt aatttttata atagtagaga taaacgaact    52560
cccacagtga attttatttt aactgaacca tataacaata ataagattaa aatagacttc    52620
acccgttgca atgcacgggc attttttcta gttaaagaag aaataaaaaa acacaaaaat    52680
ttataaaatg taaaaaagaa aaatattata attttgttag aattattatt ataatataga    52740
aaaatagttg ccaaaatttc tcaacgaatg tcgaataaac tcagcaatgt catatattta    52800
aatatgatgg taatatttgt tcgcaaaact ttaatcttca atccttcaac aacatagata    52860
tacaacgtcg taatcgccaa caagcccgag tgaccataca ggatagccga gcggtggatc    52920
tgtactgttc ttgggtgaaa taaatctagt acattgtata tcttatctta atatctacta    52980
ttataaaaat tgaagatatt tcttcaaaga tttccatacg ttctctactc cgttacaata    53040
tcggttctac tccgttacaa tatcggtttt gtacaccccg cgcacgcgtt gtgtgttctc    53100
ccgttccaat acatgaagct agagtcttgc ttctccctgg tctggcaggc cctttttcca    53160
ccatccccac cagggccagc gggttacatt gaccgatcac ggcccacatt agtggatgca    53220
gccagccacg ctcttcacaa atcatgtgat gaacattagc tgagttaaaa tttatccttt    53280
gatgattgtt agaaatgttt ttttctccac atcttctctt tcaattttgg aaaaatagat    53340
ttcttgattt ttgtgctcgt acatcactaa taaatcagtt gttacccttc cacacattgt    53400
caatttacca tgtctatttc agctcttacc ttgtatagtc ttgactcttg agtcctcgct    53460
attgactaag ttgctacatg cctcctacaa atcaatagac tgccataaca atattttcta    53520
cgacatgatc catattagtc catgcaatgc aagtacacac acactactgc acgaaaaaac    53580
tatgcaccat aacttcaaaa ctaacatgtt agaatgacgt taatttttca ttacaattat    53640
attcatcgac cgttaattta ctaggcatcc tgtttaaaaa aaatattcac cgaccatacc    53700
cacatgttcc gtagttcatt aggtgatgga tcggtagtta cagcagctgg atttttatat    53760
tttggtcatt ttgaaaaatt tatttcgcaa atagactcct gaaaaaactt atcccagaaa    53820
tagtcccttt tggagcgtca gagtggctgg cgccgtggtc caacgggaca gcgccaacct    53880
ctctggcgcc gccccccgcc tctattcttg tttctctata tagagttgca aactttttat    53940
ttttgtttta tttttttgga tgttttttca ctcttagaat cacgatacaa ccaactacaa    54000
aaaaaattaa actcgaacgg aatatatcac ttagctagaa gtctgaaaat atagcatacc    54060
acttatctac tttgcacctt caccaaaatt agaccataac ttctttagta aaatcctttg    54120
atcagcatat taaacataat gcactctatc actaggtgaa attacttaat ctaattcaaa    54180
atataactac atgtagcctt gaaaaattct acatgccaca tatttcgtcc gtttgagttt    54240
attattttta tggttcgttc atgtgagttc ccaagtgtga aaaaaaaata aaataaaaat    54300
aaaaaagttg cacatcctct cctctgcatt agagaggaga ggagaggaaa aattctacag    54360
gtcacatatt tcgtccattt gagttcattt tttctatggt tggttcttgt gtgttcctaa    54420
gcgtgaaaaa aatatcaaaa aaataataat aaataaaaaa attcgggggg ggggggcgcc    54480
agccactctt aggggtgaaa acgatcggat aatatccgat ccaatctgct ccgaatccat    54540
ccgaaataag gatatggtat gggtttttag aaatctggcg gatatggatg cggatgagga    54600
tatggtatct ccgaaatacg acggattatc cgacattttt gtcggattat ccgataggcc    54660
ctttaccgga taatccgaaa ttatgaacac atgtaaccac tctatctatt gcatataaca    54720
taagttggtc catccaatga cctaattcat caattaccct agatttctta ctatgtggtt    54780
ttcaccattt catgtcacac ttgcgtagct gtatttttat aaaatggaca tcatgtattt    54840
atgttgttta gcacttaagc acataattat tacaatgggt cgtttattga cattgtgtta    54900
tttttacttg cattgctaac tcaatgttgt attgattgca tacacacgta acatctgata    54960
aaatttaatc cgtttctgaa ccgattccgc accatttccg acatctgcat ccgtacacta    55020
tccacaccca ctccgaatcc gcttaaaaat atggtttagg atatggtatg accactatcc    55080
gtccgaatcc gctttatttt cacccctagc cactctggcg cgcttcccct gccacctcag    55140
catcgtccca ccacgtcggc agaaggacgg cggctccagc cactctggcg ccacaaaaaa    55200
ggaccatttc tagcataagt ttttttaggg gtctatttac gaaataagtt tttaaaagga    55260
ccaaaatgtg aaaaatccag gttacagcag actgtgataa gcaatagcta tattgcctat    55320
atatacacgt atatgcattg ctaatccttc aattttgtcc aattctttta aattgtcttc    55380
acctgttgca acgcatgatt ttttttctag tcttaacctt aactaatctt aataactaac    55440
taaaagattc gtatctttcc gatcgtcacc ttgtccatac gctaattttt cgtccgtccc    55500
ccctccccct caaaaaaaaa gggaaaaatc cattttacac cctcgaactc ttatgcttgt    55560
ctaaaataca cccccgaact ataaaaccgg gtataataca ccctcgagct atcaataccg    55620
gacagttcaa gggtgtatta tacctggttt tgtagtttgg gggtgtattt tagataagca    55680
taagagttca agggcgtaaa tggacttttc cccaaaaaaa atcccagtcg ttactttcca    55740
tcctgagaat cggagacagg gaaaactgaa gcatacacgc aaatagaatc aaagataggg    55800
aaaactaagc atatacacac aaatatatcc aaaaattccc atgcagctag atcgggtgcc    55860
accgttgttg ccaaaccacc acattgcaat gtaaatctaa gactaaagcc taaatcctat    55920
gctaagtcat caaattagac tcggttctac caatttggta atatatcaaa ttagacttga    55980
tttttactga tttgaggttc tcgaggtgtc acactatgaa acggaagttt ttcccgttgc    56040
aacgcacggg cactatgcaa tatcttaact aattaaaaga ttcatatttt tcctttcgtc    56100
acaccgatct ttcgtccgtc tgtaacatca cgtgcacctc ctctccaaat cccacatcat    56160
cataatccga cccaaaaaca aaatctcaat ctcaatccaa tcagaatcat cacaaaatca    56220
tccaaaatat caagagatga ttataggaga tggaggggtg agcaggagca acatcatcat    56280
cgcataaaaa ccccaaaatc aatcacaaca acgacatcat tatcacataa gaaaaacaat    56340
acaaacaaca tacacaatca acaacactgg cggatccagc cgaggggaca acggcgtggc    56400
agcgggcaga tcctctcggt cagatccgcc cacgggtgcc actgacgtcg ccgccgccac    56460
cggatccaag ggagaagctt cggacagagg gagagggggg tagaggaccg ctaaatccgc    56520
ccaccggaaa tgccgccgcc accacctccg tcggatttgc ccgagggagc gccgatgccg    56580
ccaccgccat cgcgggagaa gcttgggcac ggagggtgag gaggaggggg ggtagagaat    56640
cgccggatcc atccgctgga aaagcctccg ccggatccgc ctgccggaaa caccggtgtc    56700
gccgcctccg ccggattcgg tagcgggagc cgccgatgcc accaccgccg ccggatccgg    56760
tcggtgggag ccactgacac catcgccgcc gcctcctctg ctaccgacaa gggagagacg    56820
agaggggcgg gggcgagggc gggggacgag agggttagag ggagggaccg agtgggagag    56880
agagggacga gtgagaggag ggggacgagt gaataaggat gcgtgacctt atccactcgc    56940
gcggtcgcac cccggctctt tctctcgctc agctgttgcg cttgtggaga ggatgcgaga    57000
tttttttttg agtaaaatgc acgggcggtc cttaaacttg tagcggtctg tcatctaggt    57060
tcccaaactc tcaaaatgca tatccaggtc ctagaatttg tcaaagtgta tcatctagat    57120
cccaaaccga cacatcctct cttggatcct acatggcgct aatgtgactt gtcacatgga    57180
cgtgacacgt cttttttttt cttcttttct ttttcttttc cgttttcttc tcattcttct    57240
ttttttccat cttctgctcg ggtcacatag aaaggaaaag aaaggaaaat acaagagaag    57300
aaaaaaagaa aaaagaaaat ttttaaatgg gtctcattcg tcagtcaaaa ttatgccaca    57360
tcatgtccct gcgacatgcc acatcagcac cacgtagcat cctgaagggg ttgtggcgat    57420
ttgggaccta aatgacacac tatgacaagt tctaggactt ggatatgtat tttgagagtt    57480
taaggattta tatgacacac tactataagt ttaaggaccg cccatgccct ttactttttt    57540
tttttacacg gagagaatgc gaatttgttg gttagttgcg gctgagggtt tctcgcacgg    57600
agaaatttgc ggtgggagaa ttttttttcg aggttctttc tattgggaga agacgggatt    57660
atagggatta ttactggtgt ggtggcccct gttttctttc tttttcgagc ttctttccgt    57720
taaattcact tttctctctt caaggagcgt aggacatgac tgaatgcagc tgctgtaaat    57780
tagaaataaa aaagaaacat attctgtttt tcattttttt caataggtaa atataaagat    57840
ttttaagtaa tatttaaaaa tatatagtgc tgatcaacga cattgttaag tgagattttg    57900
ctgttactat cacttttttt tccattgggc tcacgtacgg cattaaaagt tttagttttg    57960
gttctctcct tttgagtttg ggcatatacc aatattgaga taggtatact aaagttcatt    58020
tggattttat tcgattcaac ttttttgggt tttgttcagt tcttttttac atgtttctca    58080
tctgaaatta ggaaattagg tttggtaaag tcttgaatag ataacgctgt tgacgtttga    58140
acatatattt atctatttat ttatttaaaa atatatgaat aatttttatt ttgttatgac    58200
ttttgtcggt gacatgggac cgggagtatc atgactagag gcttgggcag gagcgatcac    58260
ccacgtggcc tgatgtaaca tcctgaaaat tcccaacaat aaaaatcact aaaattttga    58320
actttttaaa acttttgcat catgctggtt gttatgattg ctattgcttg ccaaaccgta    58380
aatgatcaca aagaaagtaa agtaaggatc taaaatttaa gtaatagata aatttacgag    58440
aatataatat ttaattgcta accctacaaa taattacgca caagaaaaca aagccagaca    58500
aacggaaggt taattactaa tttaaattat ggattaatta ttaaatactt gaaccatgtg   58560
ttgcgtgcca tggcatctaa atacacatga aataatggtc atataattaa attaagcttt   58620
ataaaattat gtgaggtttt aattaagcaa ttagcttaat gttgtaccga gtcttaatat   58680
actatttata gaataaataa attcaaccta tccgtgtaaa atatattgct ataagttcat   58740
tcaatgtact attgtaataa taatggccac attaggatat tttaattaat tttggaaccc   58800
tcaaagcctc caaaattatc taggttaatt ttgaaattat acctcattta agtaatgcaa   58860
tagaaaaata tacataaaaa taaaatatgg gtaatattag aaattgagta aattttcatc   58920
taaattaaaa catatattgg gtaaacctcc tttatgtaaa aattaagatt tatagaatga   58980
aatttgtaca agggataaac taaaatcggg ttaaatagaa aatggcactg ttcattgcac   59040
tctaggtgct cgacgtggtc cctggcccta ttttccccct cagccgcgcg cgcctggctg   59100
cctcgcgccc cgcgccacgc cacccgcgtc gcgtcgccgc tgccgcgccg tcgccgtcgg   59160
ccgttccgcg ccgctcgtcc gtcgctccgc cgcctcgcgc cccgcgccgc gtcgtcatcg   59220
cgtcgccgtc gccatcaccg cgcctggccg cccctgaccc cgcgccgcgc cgcgccgtcc   59280
cgtagccgcg tgcgcgttcc atcgccgctg ccgcgccgcg cgccgtcacc gcgcgccgct   59340
cgtccgccgc gcatagcccc gcgccgccgc gccatcgtgt cgccgcgccg tcgcgtcgct   59400
ctcgagcccc gcatccctct cgagccccgc acgtcgcgtc ttgtcgccgt tgctgccgcg   59460
tcgtcgtcgc cgatgctgtc gcgtcgccgc tgccgcccgt cgcgtcgcct tgcgccccgt   59520
gccgccgctg ccgcgttgtc gctgtcacct tcgcgtcccg cctcgtgccg cgcgccaccg   59580
ctgccgcccc gtcatcgccc gctcgtcgcg cgcgccgccg ccgctgccgc gccgtcaccg   59640
tcgtgtcgcc gtcggcctcg cgccttgagc cgccgcgcgc ccgtcccctc gcgcctgcgc   59700
cccgccgcac ggccgtcccc tcgccgtcgc cctgcgccac tgccgcgccg cccgtcccat   59760
cgcgccgagc cccgtgccgc cgcgcgcgtc gcgtcgcccc gcctgtcacg ccgctcgccg   59820
cctcgagcca cacgcgtcgc gccgtcgcgt cgccattagg gccggccacc cctttccccg   59880
cgccctataa aaccccccgg ccacccccct ttcaccccac accatcccca cccattcccc   59940
tcttcctctc ctccttcccc tcttcgtccc ctccaccgcg ccgcgccgcc gccttcgtgc   60000
cgccgcgccg tgcgccgtcg tcgcgccgcc ctcgcgccgc cgcaccgccg ccttcgtgcc   60060
gccgcgccgt gcgccgacgt cgtgccgccg tcgccgtcgc cgtcgtcgtg ccgccgtcgc   60120
cgtcgccgtc gtcggtaagc cgccgtccct tccctcgttc cgacgccgtc gccgcccggg   60180
tgggaaggag ccgagagaga gagggaggaa ggagccggga gtaggaagaa agaaaagaaa   60240
agagagagag agaaaagaaa agagaagaaa agagaaaaga gagaaaagaa aagaaaagag   60300
attagagaag ggagggaaga gtgggcccca cctgtcatta gccccatcca attcccctta   60360
gaaaaataat tctgtagaaa agaaaatcaa gatcttgacc ccacctgtca gtcactatag   60420
cgtgtggata aggttgtatt aaaaataaat gaattaggaa cagtactatt tcgcaactat   60480
tagaattaat tcaaatttga atctttacac tagcataact aattcatttt agctccgatt   60540
tgagtggaac ttgaacctaa attcatctaa attcataagc tttccaatgg tatataattt   60600
actattaaat aaaatatatt tataattatt aagtaattaa tatcatatga ttaggttatg   60660
gtcaacttaa aaatatgcta ataaataaaa ttagtattgt ggatgtaata atatttgtct   60720
ctaacatgtc ttgccactgt aacaaccaca caaactaata ttaagtgatg tctgaaatga   60780
atgaatgaat aggaaaatac tagtacttgt ttaatattcg atagccatat aattaaaccc   60840
atggcttata ggttatttaa atcaaatgta gccttgtgat tatgcaacta aaatataaac   60900
acatatagat gaatctttag cttgattagg aggaataata acagagctag tgtgactagt   60960
tatgatatag cttgttgtcg gttgcctata tttagtaaat ggttcaatgt taatacactg   61020
atgcacacac ataccctttt tgataaccta ctagttgcat atattaaact tggtaataaa   61080
tgaagaacca atatattagc taaatactgg tgctagttat aaatcttgac cacacataat   61140
tttagttcaa accacacctg aggattgttc gttataaagt tataaagtta taaagttata   61200
caaaagataa tatgtaacta taatagtatt aaaccacaaa tctaaaatac agggcgcata   61260
attgtcaacc ttttatgcaa acggataata tccatatata tacatcatgt ggataattcg   61320
aataatagct ccattggtaa aataataatg taggcgaatc atggtgatga gatggtttat   61380
cctaaacctc cccatcgaca tagccatgct atagggacct gaccatttta ccttcataac   61440
agatctcttc cataagccaa tagctagact aaaccacaga ttagcaaatg tgtacatcat   61500
atattgtgct agttagtacc aatagaacca tcaggacaat ataaatacta aggaatctta   61560
gctcttagct tgattagaat ccaatagcaa acacgagtag tatgagcagc cttaggttcg   61620
acctcaataa ttatattttg cttgtgcata attgcttctt gttgaatatt ggtttttctc   61680
gcatattata gaaattgtat atcggttagt cgtgaggcaa cgtatgcagc tttcaggagg   61740
tgaaggttga tcaagattgt atcaagaata atgactattc taagcaggca agtcatcact   61800
attccttgaa catgttgatc ctaattgcga aattattttg tttacaaata aaattgcatg   61860
caatgatgaa catcctactt gtgattatgc catgccttga ttattgttta cccttaaaat   61920
ccttgtaacc atgattacgt atgagtccct agtcaattat gacaattgct tagagatgct   61980
attctagaat catgcatact catatttatc aaatgctata tgcttgggca attacctttg   62040
ggaaggtaat tgagatgcgg catgtggaga catgaacgcc acattgccat gatattaatg   62100
acatgatttg tgaaaggaga aataaaatta aacaactgtt ttcgactggg gcggacggag   62160
gatttgggtg gtatctggaa aaggctagta ccgtccccgg tcaattaagg accgagccat   62220
gaagttaagc atgaaacgac ccccgtacaa ccgcacttct cgtatgggta tagacctagc   62280
ggagtagata gctgagcgga ggcagtatcc atgcatagtg gtttcttgat gtgtgaggca   62340
ggggctctac ggtggggcag ccattggtag gaccgcaagg cgggtatcta cagtggtgtc   62400
gccatcggta ggactgccat gtgagaatct aaaacataat tataacttaa tgcatgtgtg   62460
agtcttccct tcccgggtgc gccagaactc ctctcactgc tagaaaccgt gtacgcctag   62520
agtgcatgag gatgaaaagt tcatggagcg ggtactgcca atgcgaggtt atcgaaaagc   62580
tctgccgtga cgcatctcat gtgttgggac gaggctcatg tgttgggcag tcgcggagtg   62640
cgggtaaagt gtacatccac tgcagtgtga gtaaaccaaa tctattcgaa tagccgtgct   62700
cgcggttatt gagcaccggg acatgtatta cacttggcta gactctaaat tcttaacttg   62760
tggggaatgg gatattgcat gatgaatttt atgctgatgg agccacatcc cgagaggagg   62820
gaaggtggac atcctcagaa aaccatgacg attcaatggc gggaagctat ccttgggatc   62880
acaatggatg gtggacagaa ccgtcgttgt ttaaagtgaa cactggtact aaaatttgat   62940
cgatctatgc taggttttag gcttgtgaaa agaattgtaa aattagcttt atgcaaaagg   63000
acctgaagcc attccttgaa ataccctcta tcatatgcat tgttattatg gtggcttgct   63060
gagtacggtt ggtactcacc cttgctattt atatatcttt taggagagtg ttgaagagaa   63120
gcccttgtcg gtacgcttgc gtatcccaca agatgatcgg agtgcggtct tgttctaggt   63180
ctcgtttccc cagtcgactg cctgtggcat gttaaccggg cccttatatt attttgtctt   63240
tcgctgttgt tctctgatag ttgttggcct acctggccct aatgtaagta tttaactctt   63300
ttagcctaaa ttcattcgtg atatgttgtg atccaactat gtatgtgtgt accaactact   63360
gatccaggga ttggtacgga taaacacaga agatttccga tttccaaaat cgggggtcta   63420
cacctgaccc cctcaggggg ggggggtcgg gcccgagggt gatgtggccg cccccctctt   63480
tgtctccccg aggggtcgga ccgctcccgt ttctgccccg agggctgagg cgccccgacc   63540
ccttgtgggt tttgcgccgc gtgtatgggt taggtgagca caacggggct cacctaaccg   63600
tatttattgt ggtttggacg agcgcgtcac gccgcatgta gcgcagtgca gcgcgctcgt   63660
ttatccggtc tgtgaccagt cacagaccgg tcagatcgtg ggttaggtgg caacaggcgg   63720
tctgacacac gcctcgcccc atcccgtcag gataagagcc tccaggcact tgtccctagc   63780
ccggagccag catgctaact cctggagatg acacgttggt cccggtcaga tatatgccag     63840
gcttcatccc aaccattaca agcaagatat tgtatgaaga agggcgaaca tgcagattgc     63900
tggactgaca cgtggtggac aagaatgacc gatttgtgac cggtctgaca ctggtcatgt     63960
cgtcggcaga caaccatgtt cccacgttgc acctgctttc ggcggagtgg aggtaggtat     64020
gggccatccc atcagaaggt cgttcggaca gcagccattg caagtctccg cccatttatg     64080
aagagatgac agggtgatcc cctggagaga aaaaaaggag gaccttgccc acttaggagg     64140
tgaggacgac tggaagggga gaggatctgg agagtagatc ccacgagagg aaaaaaggga     64200
gaagagggtt tctagagtaa gagctctctg actctccagc tctttgtagc ttcttcgtac     64260
acagatccac cagaaaatag gagtagggta ttacgcttct cagcggcccg aacctgtata     64320
catcgcccgt gtcttgtgct tttttcattc tcgcgaactt tccacagact aggagcttag     64380
aatctcgccc agggcccccg gccgaaccgg caaagggggg cctgcgcggt ctcccggtga     64440
ggagccccac gctccgtcaa ctttggctta taattaaaaa tactctaagg atattttttt     64500
atattttatt ttcttatgtc tatatgaaat tttaaataag atagatggtt aaacatatat     64560
tggaaaaaca tatatccaaa agtccactat cacaagcgta gcatagatac gat tacaata    64620
cgtttccgcg aagactgttt atacctactc tattccctgt tccttgtgcg gttgtgccat     64680
ttggggctgt tttttcatct cggattaact cgcgtggaaa ccgcgagacg aatgttttga     64740
gcctaattaa tccgtcatta gcatatatgg gttattatag cacttatggc taatcatggc     64800
ctaattagac ttaaaagatt cgtctcatga tttacatgca aactatgcaa ttagtttttc     64860
tttttatcta tatttaatgc ttcatatatg tgtccaaaga tttgatgcga tgttctggga     64920
aaatcttttt ttaactaaac atgcccaagg tgtttctcca attaagttga cccaaaatca     64980
ttcggcgtca cctttgtctt tcactttcct tccactacaa ggtgatgaca ctgacaaaag     65040
gtccaaaagc tacaggatct gatttttgtt catccatctg tgatgtgtcg gcaagccatc     65100
catggagttc atccactcaa ctcctctctc tcagagagag agagagagag agagacagac     65160
agacacatgc atgatagatt gtgctagtac ggtagtaaca ttttattgcc tccttttcta     65220
aaattctagg ttgtttggaa aacaaaaatt ctagattgtt caataaatta ataatattag     65280
gtatttattt taagtcactt taggtgttaa tttttgaatt ttaaactgct taaactctct     65340
ttcgacgcat ctgagagcag gtacaatagc agactataag ccagctataa atatatttta     65400
agtagataaa agaggaaaaa taagagtagc gggctataga tttgtagaca gctgcagcgc     65460
gagctccaag atacatatgt gtatgacatg tgagaccaaa cattaattat gtagtatatg     65520
tttatatgta tctattgtat gaattggcta ttaaattgac tatgggtgtg ttcggaggtg     65580
ggtgttggga accatctccc aagcacggaa aacggagcgg tccattatgg cgtgattaat     65640
taagtattag ctatttttta aaaaaataaa tcaatatgat ttttttaaac aacttttgta     65700
tagaaacttt ttgcaaaaac tcaccgttta gtagtttgaa aagcgtgcgc gcggaatatg     65760
agggagaggg gttgggaacc tcctcatccg aacgcagcct atacatgatt tggagccaat     65820
agttggctat aatattaaac ttgctctgag tggctcttga atcatcgaag tgatagaaat     65880
catatgcaga aatgtttata tttgtgatgt aaaatttgaa tctaaaatta tttatatttt     65940
gaaatggagg aagtactacc taaaacaagt atgagaaaga gacatgaaaa acacaaaatc     66000
tagacttaaa aataattgga attactagca ggaggtcgaa gtcaatcaag acggcgaaga     66060
aaagcacagg ggacagcaga cacgttaaca cgtaagtaaa caaacaagtg gttaattaat     66120
tagggggccc tcaagtctcc cctaaagcca ctaaacatga caggtttgtg taccatggaa     66180
aaaagggtga agcaaaactt tattctctct ctcattagat taccagttgg aaagcaatcc     66240
tgggacctct agctaatctc attattgtag aacaacgttt tcttagagag agagagagag     66300
agaaataagt caataaaaat tactactaat ccacttgaac cagttctgtc ggtgtcggat     66360
gatttaccac atttgacgaa acggactatt tattcgacgt ttcgaaaaac acactttttt     66420
agaaaaaaaa aactttcctc tattagccac tcgttttagt tatataccta tccgagtatc    66480
tgttaagttt atttatcaaa atatttaatt tatctctata attaaatata caatccgtaa    66540
aaacaatcac gcagtaattc gtttcaaact gagcctcagc tagaaaatca aaatggaaat    66600
gaataacaat agcaacagta gagttagttt ttcggcttat catccgcaac ccaaatgcga    66660
attttaaact tagccttaga gttaattttt aaggcttgtt taccatactt cattttccca    66720
gcattagttt cttttgtcac taaaaattgt ttttttaagt tgtttcgttc attttctcac    66780
ggtttatcag cagtagagcg aagccattct tggagcctgt ttggcacagc tctagctcca    66840
gctctagctc cactctttct ggagctggag ctcagcccaa cagttttagg tgcaccaaaa    66900
ttaggagtgt agttgggtgg aactctctca caaaaaattg tggagctgga tttagacagc    66960
tccacaactt cactccaaac ccaactcctg aagttaaatt gataagttga agctctatct    67020
atcaagccct ttttcttgat catgcttcta cctactccat ttttgtttct tggccctcac    67080
aggaattgga aaggaaaggc gtatatgcat caatgcatgc atgcgcacat caacctcgtc    67140
catcaaccat cataatcatc atcatctcgc cagctgacga aaatgacctg catccatcca    67200
tcacggacaa tccaagcgaa caccgctacc aacatcacag ccaacctgtt tatcactagc    67260
tcttgatacc actcctacat aaacactacg cgcaggttaa ttaattaagc gtgattactg    67320
aagtaacatc taatcacgtc ctggttagcc tttaataaga caacagttag agcaggtaca    67380
atagcagcag gatataagcc agctataaaa aaagagagaa aagagcaacg ggctacagat    67440
ctatagccag ctgtagcatg gacttcaaga cacaacgtgt gtataacagg tgggaccaga    67500
taataatagt gtagtatagt aagtaactat tatatatatt gactatagat gatttggagc    67560
tattagtgtg ctatagtatt aaacttgctc atagagcagg tacaatagta ggatattagc    67620
cagctataaa catattataa tgagataaac attgatagag aagagcagcg ggctacagat    67680
ctgtagccag ctacaacacg gactccaaga cacaacgagt gtatgacaga tgggaccaga    67740
tattagtagt atagtaagca actattatat aaattaacta ttacattggc tatagatgat    67800
ttggagttag tagtgggcta tactattaaa ctttttctct tagcaaaaat caagcgccta    67860
atcacattag aggagtagct ttgagacaaa ccaattagcg gcgaatcaag cgatctgcgt    67920
ggtcgtacag tgatgggccg ggccgggccc acagcccgac agtgacaggg ggcctgacgc    67980
atgtcagcct cagccctgga cgggagctag ccgttgtgtc cccgggggag gggagggggg    68040
cattcccatc atttcgcccc tcctccgggc ccacatctca gtgggggtaa aggtgtaaat    68100
tactgcgacc gcgagtccag cgagcctaga tttggacctt gtgtccgttt gactgaaccg    68160
gagctactcc ccaatacggg gggattgcgt tgtgtgcatg ccatgtgggc ccgagcgccc    68220
tttgttcgtg gctttgggtt ggaaaggtga ccgtgtgagc tgtgcggtgt tgtactacgt    68280
attagtataa atcatttttg ggtactactc cctccgtcca aagcttattt ataatttgtt    68340
gtactccaac cgtccgtctt atttaaaaaa aatataaaaa aaattaaaaa aataagtcac    68400
acataaaata ttaatcatgt tttatcatct aacaataaaa aatactaatt ataaaaaaat    68460
ttcatataaa acggacagtc aaacattgtc acgaaaatct aatgtttgcc ttttttttta    68520
agaccaaggg agtatctacg aacaaagata atacatgtta taatcatgaa gcccatgatg    68580
tgattagccc ggccgtttga ctaacctcac gagctacgtg gctgacaagt ttaacttgtt    68640
aactccatca tttcggatac ttagagcatg tacaatagca gactattagc cagctataaa    68700
catattttaa tgggataaaa gatgagagag aagagcagcg ggctacagat ttatagccag    68760
ctgcagcacg gactccaaga cgcaatatgt gtatgacagg taagaccata tgttaatagt    68820
atagtaagca actattttat aaactggcta ttagatcggc tatagataaa ttggagctag    68880
tagtggacta tactattcaa cttgctctta tatgatataa atattgatat aactatatga    68940
ttttgttaat gacatgtttg tttatggatg gactatgtgg ggtcggtcgc ctccgtagct    69000
gaccaaaata caaacttaaa acccctatct ataaaaatct aacttttgtt tataaatata    69060
gatataaaag ttcataatta gagcctcatc ttttaaacga aaagagtact atgaaaacaa     69120
ctcgtaatac aaagactaat tacgacgaaa agaaaatagt actgacaaga ggaaagcagt     69180
gaacttgcat actccctccg taaaaaaaac caacctagac acggatataa cactatatat     69240
ctagattcgt tcgttgtaat gaagtgtcac ctccgtatct aggttggttt tttcgtacga     69300
aagaagtatg agtaaatcta aagctatgta tacccttcgt caaaaaaaaa aagtaaacct     69360
tgtactggtg cgtgtcacat cctaatataa tattgttttt tatggagggt gtacagttga     69420
aaaaaattga tgtgttttaa ggatgaaaaa tattggtaat gttggctatg taactctaga     69480
aaaaaaaatg cagtaataat aaaatgctaa tttgctggag tactagatta tagacaatcc     69540
agtccaggac acgacaccct ccctactctc tccacttcca ctctcaccgg ccaccgcgcg     69600
ctctctctct ctctctcccc cttctcccgc aagattcttc ccccaaatcc cacccgatcc     69660
accgccgccg cccgctcgcc ggagtcccat cgctgccacc gccgccggag ccgcggcccg     69720
acgcccgccg ggcctgcttg ctgtgtgtgt gaggaggtgg agttgctcgc gctcgttccc     69780
gcggccacct ccgcctgctg ctgcttctgc ttccgctggc attgcgggga ggtcgtgtgc     69840
cgggggacgt gggggctcgt gttggagcgc ggctgccggt gaggtggggg gtgcggcgcg     69900
gcgcggctcg cgctcgtgcg ccggtggcgc gggcgcgggg ggaagcgtac gggggagggg     69960
gagtgtggcg gcggcggcgc gcggggtagg gacgggcgcc gccaccacca ccggctcgtt     70020
cgctggcagg cgctacgcgt ccagatccgt acgccggtat gcttcgtctc gccgcaactc     70080
tctccatttg attagtatcc cctcgccgaa acgaggcctg tgaggcgccc gctttctggc     70140
tggcttccct gtactcgctg cttgctcctg cctgttgggt taacccgttt ccatcgaatt     70200
tgggtaagcg aaacatcgcc tcatatgggc atttggggtt ctggcagcct taggctcgcc     70260
atccgtcgcc gagcttccaa gtgaccggcg cttgttggta tatttgcttg cttgttcctg     70320
tttggtggct gcgctaaatc ttttgtgctg cattgaattt atgccaccca tatacagcaa     70380
attactgagc tgaaataatt cggctaatta ggtccagcaa tatgacatct cgtggattga     70440
atgctaagct gacattgtat cactgatgct ggcttatata taggttgttg agaagtgaag     70500
atgtcgacag gtgaaaccct gcgtgcagag ctatcatcca ggacgccgcc tttcggtttg     70560
aggctatgga ttgtgattgg aatcagtatt tgggtggtga tcttctttat actaggtttc     70620
atgtgcctct ggtccatata ccgaaggaag ccgaagaagt cctttgataa gattccagta     70680
tctcaaatcc cggatgtttc caaggagatt gcagtagatg aagttcgtga gcatgctgtt     70740
gtcgaaaact tccgtgtgca agaaagccac gcgatatcgg tgcaggagaa acattacgag     70800
aaagattcag ggaaaatgct ggcacacttg gttaggagta aatcgagtga tgccgataat     70860
ttgagccaat gcagctcggt gtaccaatgt gatagggctg gtagctcgta ttctggtgat     70920
gaaggcagct cgggcaatgc taggaggcac ttttctcaat atgcaactgt ctcagcatcc     70980
cctctggttg gtctcccaga attctctcat ctgggctggg gtcattggtt tactctgaga     71040
gatttggagc atgcaacaaa tcggttttcc aaggagaatg tcattggaga gggtggatat     71100
ggggtagttt accgtggtcg actcataaat ggaactgacg tcgcaataaa gaagcttctt     71160
aataatatgt aagagatcct gaaatctatt ctgcgtttta cagaacttgt gactccttct     71220
gatgccatca tattaatttt cttttgatat ggtgctgcag gggccaggca gaaaaggagt     71280
tcagggttga agttgaggct attggccacg tcaggcataa gaatcttgtc cgccttctag     71340
gatattgtgt tgagggaatc cacaggtaaa gctatttatc aatcaccttt gctgatggat     71400
ggctagcttt tgtttctact ggcacattat ttacttgcat agggatgtag gattgctctt     71460
ggtctatgtc cacctactca ccagattatc tcaagggata ggttattcct gactgcactc     71520
cttatgctat cgattttttc ccttccaaat ctgatggtgg gattcagcat gcccagtgac     71580
agattatgct cagtccacag aaaccttctt tggaccacca ttcttttacc atgaaaatgt     71640
ggccatagct ccgaaagcta ggattcacta gaagcgcaca actgcttatt ggtttgttag      71700
ttggctataa caaggtctta ctgaaatgta cttccatagt tcattacttt gtgaatgcct      71760
gttcttgttc ttcacgtttc ttctcatgca tgttcaattc taaatttgta ttcatgatat      71820
gtccaagcta ctgtattctc caaagaaaat cagaagtcca ttcacctatg tattttccag      71880
ttttccgcca ttttggatac tgctctagaa acaagttaat aatatagata tttatatggt      71940
ttggccagtg ctgcttaagt gaccatcgag atagaaattg cttaagaaat atactaagat      72000
gttgagtgtc aggtgttttc ggataatctt gttaccaaca aataggtcct atgaatataa      72060
tggtgtctgc ttcacgtaat tcaaaatcca cactcagcca aaataatctg caatagggtg      72120
ttgaaaatat gattatgttt ctcccttgtt ttcatcatga ctacagaaat gaacaatgtt      72180
gctacatctt gtaataattt gtggttttca attgaacaaa acatccatca aatgatatct      72240
acagcaatat attttgcact tctgagcaca caataggttt gagtgtattc gagtcatggt      72300
cattgattta agctttttat ttcactacat aaccattgat ttgagtgtat ctaaggagtt      72360
ctgtttccac aagtacttta tgttaatggt gtctccttat gctttggcca tccaaactca      72420
ttactgttgt ttaatatttt tagtggttag tggtgtccaa atctttcttt gtgtacatca      72480
tactatgttt ttgtagtcta ttaaacttcc atcctatcat ctgacttgtt atattccagg      72540
atgcttgtat acgaatatgt gaataacggg aacttagaac agtggcttca tggtgccatg      72600
cgccaacatg gtgttcttac ctgggaagcc cgaatgaaag ttgttcttgg aattgctaaa      72660
gcgtaagaaa caaaccatcg tccccgtcaa aaagaaaaga attgttcttc actttagctc      72720
ttttatatgt atatgtttag ttgcataacc cattttccat aactgaattg gtatacaggc      72780
ttgcttattt acatgaagca atagagccaa aagttgtaca ccgggatatc aaatcaagca      72840
acatactaat cgatgaagaa ttcaatggca aactttctga ttttggcttg gctaagatgc      72900
tgggtgcagg gaagagccat atcacaactc gagttatggg aacttttggg tatgttgata      72960
tttttttgga gttagtatta atctttccta tgcttagctt ttactgttgg aatgtgcagt      73020
acttcgctta ttcatacagt ataaaatttt acatgctgcg aactttgtcc ttcgtatatt      73080
ataacaggta gctttctcat tgctatcatt gattcatttc aggtatgtgg cccctgagta      73140
tgccaacaca ggtctgttaa acgagaagag tgatgtctac agttttggtg tgctattact      73200
ggaagcagtg actggtagag atccagttga ttatggccgg cctgctaatg aggtgagcat      73260
atatcctaca atctcatgcg tattatgtat gttacaaaag tccgtactat tggaaattat      73320
tttacggcaa aataacgtct atactaggag agacgaattt gcttcaggtg tatggctgtc      73380
tggcagttgt ctactgtcta gttacccttg tctcactttt acagtctatt gttttatttt      73440
tcaggagctg actagctgta taccttgtca tatataacaa cactgtaacg tggatgcctt      73500
gcaggtgcat ctagtggagt ggctcaaaat gatggttggc acaagaagag ctgaagaggt      73560
agttgaccct gacatggagg tcaaaccgac cattcgggct cttaagcgtg ctctcctagt      73620
ggcactgagg tgcgtcgacc cagactctga gaaaagacct actatgggtc atgttgttcg      73680
gatgctcgag gcagaagatg tcccatcccg tgaggtggta acgctttctc ctttcctgca      73740
ataacattca tcatattata tcattgcaat aaatctgaag cttttgctgt aatcctactg      73800
aaggaccgga ggagccggag gggcaacact gccaatgcag ataccgagtc caagacaagc      73860
tcaagcgaat tcgagataag tggcgataga agggactcag ggccatcagc aaggtttcaa      73920
ctctaagaag acggtgatca tagtcaagaa caatggcttc aaaactctat gcagtaacat      73980
ggtggttggc agagaaaaag gggtatttct ggagggcatt gcattttgta ttgtaggtct      74040
gcatggcggt agagactgga gagagcacag tgtctgatga tggatacccg gagacctgta      74100
attcccattc agtattctgt ttgttagtca agcagcttgt acagatcgtt gtctgttcca      74160
ttttttcatt cttctggttt ttttgtttag gaggctcttg gattaccagt acgaaccgct      74220
gtctcttttc tagaatcacc aacatggaac ctatcaatat ttactactag tactacgact      74280
tgctttcttc ttgctgagat ctatcatgta ctgtacataa ctgacgtgtt cagctgcact   74340
tggacaagta gatgctcgtt ctgtatgtcg aatttacttg atgaggtcga gcattaagta   74400
ccatggctgc agccggcttc tgtttagttg tgctgacatg cggcggcgac ctcacgctgt   74460
gtggcccatt cttgatcttg ggccgaaact gtagcaacgg gcgtacggcc catctatatc   74520
gggattgttc ggcccgttgt agatgggccg gatcgggatt gcgacttacg tgcgacccat   74580
ttcggttggg ccggtggtcc gctacttcat ctagcagtgg tcggcggcag ggttcacaat   74640
tccaatagaa tccaaacatt attggattga gttaaaaaca caaaccaatc ggctttttgt   74700
caggttcaga aaattttaaa ctgaatttta attttttgac aaaaatctat ttagatttcg   74760
tctgtttttt taggtttgtc aacggattca gcgaaatccg atgatatcgc tcgtgagtgg   74820
atttttgatc cggtatcgag attgtgaacc cttgtcgcgc attgcctgac aaagacaacc   74880
agtgaagcgc cgtgcgcgcc gcgtgcgcgc cgcgtgacgc gaagatgcgc aggaaggaac   74940
aagctggcaa gcggcgcgcc catgacggcg gcggcgacga cgacccgcgc gcgtgcgtgc   75000
gtcaacgcac gcgaccggcc gagatccgtc agtggccgcg gctatatata atacatcgtc   75060
gcctcacacc ccccacacac cgagtcatcg ctcgccggag ttagagttcg tagcggcgaa   75120
ggatatagcc atatattata gatggcgatt ggtgttggtg gctgctgcgc cgtgctgctc   75180
gcggcggcgc tgctcttctc ctctccggcc accacatgta agcacgccca tcttcttctt   75240
cttcttcttt ttttctttct tttttttttt tttttggaaa tgagccgcag ctgacaaaaa   75300
gatcactcac acatggatac actgtcgtga cactaaccaa tgcctaagcc attttgtttt   75360
cttgttttgg atttttcttt ttatgtgtat cacttttgct tgttgctctt gcagatgctt   75420
atgattccct ggatccaaac ggcaacatca cgataaaatg ggatgtgatg caatggactc   75480
ctgatggcta tgctgtaagt agcggtggca gtacaccaac atctctacct ttattttcgt   75540
ctcaacctgt acatttacac tatcttgttc tactacctct aataaaaaaa tatatttgat   75600
gttttaaaat ctattaagtt ctagagatta ggaaagctac acatggtttt atgttttgat   75660
actattaagt agtatatttt ataagttata ttgaaggctg gggtttcaaa agtttgacta   75720
cactagatct tattcaaagc gtctaatgat tactgaacgg aggaagtatg aacttataga   75780
cttgaagtta aacagcatag ccacatctct tcatgtatac ttcatccgtt tcatattata   75840
agattttcta gcattatcca tattcatata tgtgcgtcta gattcattaa tatctatatg   75900
aattgggcaa tgctataaaa tcttataacc tgagaaacgg agggagtatg tcgcaaacaa   75960
caacaacaat aacaacgagc aaaatctgta tcgaatccgg tttccctctt gtaactgtat   76020
caaagatctg tcctctgaaa cgtcccctgt tcatcaggcc gttgtcacac tgtccaacta   76080
ccagcaattc cggcacatcc agccaccggg gtggcagctg gggtggacat ggcagcagaa   76140
ggaggtgatc tggtccatgt acggcgcgca ggccatcgag cagggcgact gctccatgtc   76200
caaggagggc agcaatgtcc cccacagctg caagaagcat cccaccgtcg tcgacctcct   76260
cccgggcacc ccaatcgacc tgcagatcgc caactgctgc aaggctggat cactgagcgc   76320
attcagccag gacccggcaa attctgccgc gtcgtttcag atc                     76363
<210>28
<211>53905
<212>DNA
<213>稻(Orza sativa)Asominori
<400>28
gatcagtgag tgagagtgat gtgctattga ttttcgtcta ggattttgct gtgctcttct   60
tcttcttctc ctctctacca agaaagatcg atggaggaga atttgtagga cgcgtttctc  120
acgaattact tagctgttaa tgatcagctt gatgtgtacg atatgatggt gcagagtgaa  180
agttgtgttg ttcactggtg gatcatggga tgggaatatg ggattgttgt aagatgtaac    240
tcaagtgttt tcttttttgg gattactttt ggtaataaga gcttgggtga tcgaaaacta    300
cagatggttt ttcttttaag ttgtatgatc tctgtagagt ttttgagtaa tttgtagttt    360
tgtaccctat caaagatcat ctctagctgc ctctgagctc tccaactcta tatgtccatc    420
tctagtatat atgtcccata tttctgactg aaaattttca agtcggttgg ttccctccgc    480
ctggatattc tttcagctaa ttagattttt tttaaatgat aaatttgcta aaagcttgtt    540
caaattcagc taagatctat tcaaacttca atttctctat cgaaattccc ggaaatttca    600
attcaatcat tccccaatac atgccgattt ccgtaatatt gaaccatgac atgtaaacaa    660
cgaaggaatc aagggcatat ttagtttcat ctcacatcga atatacggac acacatttga    720
agtattaaat gcactctaat aacaaaacaa attacagatt ccgccagaaa actacgagac    780
gaatctatta agcctaatta atacatcatt agcaaatgtt tactatagca ccacattgtc    840
aactcatgac gcaattaggc ttaaaagatt cgtctcgcag tttcctgacg aaccgtgtaa    900
ttattatttt ttctacgttt aatactttat gtatgtgccc aaatattcaa tgtgacaacg    960
tgaaaatttt tatttggaac taaataggcc ctaatattct ttcaagatat tagaatagtt   1020
atccctctcc acctccctgc acaaacagtg aacttctttc tccttgggca caggagtagt   1080
agcagctccc ggaaacagaa agcaatcaag caaagtcctg aacctgaagc atcctgaaac   1140
cagcagacgg cagaaaccag tgggcgcagg cgatagcagt ttttcgtggt ccggcgtaca   1200
gccaaaatac tggccatcgg gtgcctacat agaatgagtc cactggacgc agctaccacc   1260
gtgtgtgcta cactgaccgc cgctgctcgt cgaccagttg tacggggctg acttattctg   1320
aatttctaat ggtttatttg ggggtttaga acactgaggg gtgctttaga tccaaagatg   1380
tgaagtttgg gcgtgtcaca tcgggtatta tatatagtgt cgcacagggt gtttgggcac   1440
taataaaaat actaattatt gatcctatac gataagctat ataatactcg atgtgacacg   1500
ccaaaacttt acatccctga atctaaacac ccttttaaat agagtatttg gtgtgaaata   1560
taattttgat ttgggaagaa ggtgagtgag atttggaaaa aaaaagcatt tcaattaaaa   1620
aatttgccag cagtaaataa agaaactact cggttttgta attaaagtga ggttttggca   1680
cttctttgcc ctaaactggc ctccatttta taaagtgaga accgtgcagc aaaagcctga   1740
aaaggcaaaa agaaagaaat tgtagaggtt tttcaggagg atacaactag gtgggtctct   1800
aactctctat gcagctgtgg tctgtggagc aaaacgatga aatggaagac gggacgttga   1860
cgagggtgaa gaaaacgagc gtttgaccag cgtcaaccat ggcgtgaaca gtagcaccac   1920
taacctgacc gagaggttga agaagatgca atcaacgggg tactatagtt cccacgaatt   1980
tcccagcaac aacgggttgg ttctcactac tcacgaattc cctgtggctc aacaactact   2040
agtacatcct tttgtccatt atgataaaag ttctatctta atttttattt acacgttttt   2100
caaactgttt tttaattttc tatataaaaa atacttaaaa tatcaaataa aatctatttt   2160
tggagtttta aaaaactcaa ttaatcatat atattattga cttattttat tttacgtgga   2220
ctaaaatatc ttcatcttca tttaggttat gttcttttct catcaagata catgatacat   2280
tagcatgttt ttcaaactgt tttttaattt tgtatataaa cttactctaa aatatcaaat   2340
aaaatttact tttagggttt ataaaagtaa aactcaatta atcattacta acttgtttca   2400
ttttacgtgg actaaaatat cttcatcttc atctaaggtg gtgtttggat ccaaggacta   2460
aattttaatc cctatcacat cggatatttg acactaatta gaagtattaa acatagatta   2520
atgatgaaac ccattccata accctggact aattcgcgag acgaatatat tgagcataat   2580
taatccatga ttagcctatg tgatgctgta gtaaacatgt actaattacg gattaattaa   2640
gcttaaaaaa tttatcttac gaattagctc tcatttatac aattaatttt attgttagtt   2700
tacgtttaat acttttaatt agtatacatc cgacgtaaca ctgatcgata caaacaccaa   2760
ctaaatcgaa aatcaccgaa tggctcgtca tcctcccaca tgagatgcca agatggaaca   2820
ccaacaatcc aacggctagg aagcgcccca tcccacccac cgcctaaccg ccttcctatg     2880
caagtgggtc ccaccccttc cttccttttt tttttctttt tacaaatccc cttccctttc     2940
ttggctagct agctagcttg gcccaacgcc acgagccgag ccgagcacat ccggagccaa     3000
gccgagctca gcgcctcagc tccccctcct cctcgtccca ttcccggttt cctcctccga     3060
tttcccccaa atccgcacgc ctctcccctc cgcctccatt tttcccgatt cccaattccc     3120
aaatccggat cagccgcagc cgcagcagca aaaaatttcg aaatccaaat ccaaacccat     3180
cccccccacg acgacgtcac ccacatcccc acccccgcga gacgagacga gacgactccc     3240
aaatctctct ctcctctctc ctatgcgcgc cgccgccgcc gccgcagcag cagcagctag     3300
gaggcggagc agcagcagca gcagcagctg agatgatcgt gcgcacctac ggccgcagat     3360
cccgctcctt ctccgacggg ggaggagggg agcgcggcgg cggcggtggg ttctcgtcgt     3420
cgcaagacgc gttcgaattc gacggggagg aggaggacga cctcgtcctg ctggggtcgt     3480
cgtcgcagtc gtcgcacccg cccgcgccgt cgcaggagtc gtcgtcgatg tgggacttcg     3540
acgaggaccc gccgccgccg ccccggcggc ggcgggggag gggtgggggt ggggactacg     3600
cggagcccgc cacggcggcg gcggcggcgg cggcggccac ctcgctcatg gaggcggagg     3660
agtacggcga gatgatggag agcgtggacg aggcgaactt cgcgctcgac gggctgcgcg     3720
ccaccgcgcc gaggcgggtg cgccgggcca gcttcctcgc gctgctcggg atctgcgcct     3780
ccgcgccgcg ccgccgcgtc ctccgggccc aggggtcggt acaccaaaga accctccttt     3840
tttttttctt acttgtctgc gctgtaagta aagaataaca attcgcgttc ttgctcttgc     3900
ttcgcgggca atcttggtga ggaatcttgt tagggttatg aaattgggca gccagttctt     3960
gtttcttctg cgtaatcttg gcggaaacag tgggattttg tacgattatg gctccgtaat     4020
cggcatttct gtgggaaatg aaccaccttt agggcatttg accttcgaac agcatgcttg     4080
gtgttgcaat ccgtagctat tgccttcatc ttaggcacaa gaacttgttc tgaattatga     4140
tttaccaact tgtgtttgtt ttcttgttct gagttttctt gcttggttag ggttagggtt     4200
atcaccgtgg tggtgcagaa ttagatgttc gctacttgtc ttaacctctg ccttgcccaa     4260
tttggtaccg agtgttacag ctgggtttag gaagtgtgat ctttgagcat ttctagcatg     4320
ttggtctctt tattttgcta atctcacatg gttgtagagg aaggaagcat agtgactgat     4380
gatgaatgcc tagatactag aaatacatct ttattaactg aattaggatt gcttgggtat     4440
ctatgtagat atgactgtag aatgttactg ctggaaatgc tatccaatat ccattgatct     4500
ctagcctaat atatctctcg aggccaagag atcagtcaat tttgaacttt caggagagtt     4560
tctatttggt acttaatctc ttttatttgt tacttttggt gcctggctct cttttcatga     4620
ttgctaagta gacaggtaaa gttctaccta aaattattct taaaagttca aaatcgcttt     4680
agattaagga gtgccagcca gagccttagg cagagtctta taaaccaaaa gcacaatgct     4740
acaatgttca caaaactttt gtggaatttc cacttgagct gtataaacat cgcaatctac     4800
tgtgaataaa agaagcactt gatggaagtt catgttagca aatgacatgt tttctgtgag     4860
gaggttgatt gcttgaactg ttatggactc ttgcaacttt ttattttact tcgtacccat     4920
ttatgctaat gtgcacaaat aaaattgctg agagtaaaaa tgtacaactt gttacgcacc     4980
agcacacttc ctatttgtat ccattttcct gttgaatttc aaatgtattc aattgctgaa     5040
attgttccat tcaacaaaca catattccgt taatgaaatt attatacatt gcgttttgtt     5100
ttcttactca caagtgtcct cttttcttat atcctataga ttggtgcaac aaattattga     5160
tgcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct     5220
attcgttttg gcaagtgatg tgagtacctc tcaatcccat ccttgtgctt ctgtgcatgc     5280
ttcattctat tttttacgca tatcgattgt tttcttttat ataacagccc ataaaaataa     5340
tcacatcatg gcaaagttat ttatttctcc agtacagtta tataagtatt caccactttt     5400
ccatgaatat cttggcatgt gattacaaag aagattattt aagaaagtcc atgcttttat     5460
ttcatcattt tgtttgaagt tgaactttaa tttatggtgt aaatttcagt taatattgct     5520
agcagctcgt attctttaat ggcataactt cacttgtgct tattctccaa tatctccctt     5580
cttgttgttc aggttcaaga aaatcatttg ttggattcag aatcttgtgt ccattttctt     5640
cttaaattat taaatcctcc agtgaatctt gttgattcca aagcaccatc gataggttcc     5700
aaacttcttg gaatcagtaa agttcaaatg cttaatggat caaataagga ttctgactgc     5760
atttcagagg aaatcctttc aaaagttgaa gagattctct taagctgtca agagatcaag     5820
tcgctcgaca aagatgacaa gaaaacaaca aggccagaac tgtgtccaaa gtggcttgct     5880
ttgttgacaa tggaaaaggc atgcttgtct gctgtttcag tggagggtaa gttttaatca     5940
aatttcttgg tcatgatttc cctttatgac cattataatt atttttatga gccaaataag     6000
cagttgccat aagttacata gcacctgttt acaatattca tgggtggttt gcttagccct     6060
ttgcttcacc tgcctttgat tgatgacttc catccgtgtt gcacaactga attggagtaa     6120
ttgactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc ccttatcaaa     6180
tatttgattg ttacagagac ttctgacact gtgtccagag tcggaggaaa ttttaaagag     6240
acattaaggg agttgggcgg tcttgatagt atttttgacg ttatgatgga ttgccattca     6300
acattggagg tgagatctcg ctaacatcgc atattttaca cttcctttgt tcaactctaa     6360
aggatggtgc aagttttgtt cctttttgcc attttagctt taatgtgctt gaagccacat     6420
gaaagcaatg cttgtccaga tacatagcca aaggttgtta tattttggga catggaaaat     6480
gcttgaggta gtaactattt tcatcaggac atggaaaatt ggctgcatca caaattatgt     6540
tgtttcatgt tgcaaaatag ttttttaata cttttttatt ctgcatgtgg tgttagtgtc     6600
ttacagtgat tcctctgatg attatatccc ccacgataat aatacttgac atatctacac     6660
caagtggaca ttattcattt ggatgttact tttccagcta tacttgctgt tcttgcataa     6720
actttggagt aaattgcgta tccctttaag agataaactg cttggtgctc ctatctgtgt     6780
actttttatg cccccaacta ataatgcaat catattacgc tgataaactg aataaataaa     6840
ttaacaatat acttctggtg gaaaccttgt gtatcagaat ctcataaagg atacctcaac     6900
ttcagctttg gacctaaatg aaggaacatc tttgcaaagt gccgctctcc tcttgaaatg     6960
tttgaaaata ttggaaaatg ccacatttct aagcgatgat aacaaggtaa tgttccttat     7020
atattctgtt tcagtttagt acccattttc ttcttctgta ccatcttctc ccctcatttg     7080
ttctgtgcaa aatgtgcaaa cagtgtgact ttgtatttct gcttaacatt tttctttttt     7140
tcctgaaaag cagtataaac tcttacactc attttgcttc ttgcagaccc atttgcttaa     7200
tatgagtaga aaattgtacc cgaaacgctc ctcgctttct tttgttggtg tcattatcag     7260
tattattgag ttattatcag gtatttttct taataataca atatgtccgc taacacaata     7320
aaatgtttta aacatccagt atgttaaagt tgcagtctga cgcctatttt gttttgctgc     7380
agctctttca atactgcaga attcttctgt tgtttccagc tctacatatc cgaaatcgtc     7440
taaagtctct caacagagtt gctctggtaa taacaaacac caaatttgtt tgatcaactc     7500
gttggctttt ctgtgcactg tttcaatata gtttggtcgc cattcaagtc tcactacaga     7560
tgttgaactt gacctgacac ggtggcacca atatttataa aacgctacct gatattttta     7620
atatttcatg tttcctgacc cagattatct tgttggttcc tcatataagt ttaattagtg     7680
tcgttcttga aactttgtta tgcagcagat gtcatggggg gaacttcatt taatgatgga     7740
aagcgcaaga actcgaagaa aaaaaacctt ttgtcgaacc agacacgcca tagttgctta     7800
tcttcaaaat cagaagtttc tcatattact atatcttctg gtagtgatgc tggtctgtca     7860
cagaaggcat tcaattgttc tccatctata tcaagcaatg gggcatcaag tggttcatta     7920
ggcgagagac atagcaatgg tggtgctttg aagttgaata taaaaaagga tcgtggcaat     7980
gcaaatccaa ttagaggctc aagtgggtgg atttcaataa gagcgcacag ttctgatggg     8040
aactccagag aaatggcaaa aagacgccgt ctatctgaaa atgtaatcac cgacagtggt     8100
ggcggtgatg acccttttgc ttttgatgat gttgatcagg agccttcaaa ttgggaactg     8160
cttggtccaa aaaagaaatc gcctcagaaa catcaagaca aatcaggaaa tggagtgcta     8220
gttgcaagtc atgaaccaga ccaacctgaa gatcttaatc agtcgggtac aacatctctt     8280
tttagtgcta aagatgaatc cagtcttttg gaagactgcc tcttggcatc agttaaggta     8340
attaaatatg tttccttctg atctttcttg tttcttcttc aagagaatat acattcttgg     8400
gtcacagttt ctcggtttgt ctttgtgact ttgttgagtg acatattttg aattcacaaa     8460
atttcctttt caatatggct cctcaatcta tagcatctgt cgtgtatgta ttctgtacaa     8520
aatagtattg taacatctcc tagaagaaat tggcaccatc catatcatac agtagcaatt     8580
tatgagacgt gatcctgatt ggaggtttag gacagagcct cgagctaaat tgctattgta     8640
ttgtatctac tatcttttag tacatgatat gtgctgggca ctctgtgtct gagtgtagtg     8700
agtgcttaag tttacatagt tcagctaaca tgcatatgta agacagttta tgattaaatt     8760
taagtgtaga aagaaggtac tttcaaaaga tttttaagga caatataatt gtttcaccgg     8820
gactcatgct tgttctgact gtgagcctaa tgttaccttt acatgccctt acattgtcta     8880
ttttttatcg ttttatgaga tcttccaaac aacttgatct gtcttaatgt ttttttgcta     8940
gctcctttct tggatatctg gtaaatggtt aggccgaagt atgaactttg ccttattgtt     9000
tcaaagaaaa tgtaacaact cctggaaaag tctaattttg gttgcccttt attttgctga     9060
ccgtattggc acacatctaa ttctgctgtt cctttctggc aggttcttat gaacttagca     9120
aatgacaacc catctggttg tgaattgatt gcgtcatgtg gtggacttaa caccatggcc     9180
tccttgatca tgaagcattt cccctcattt tgttttgtcg tggacaacaa ctataacacg     9240
agagatgtca atcttgatca tgagttatca tcttctcaaa acagcaaggc acaccaggtc     9300
aaaattaagc aattgcgaga tcatgaactt gattttctgg ttgccatatt gggcttgctt     9360
gttaaccttg tagagaagga tagccttaat aggtaagtcc ctcacatgct tccttccatt     9420
tgctcaattc atatcagtgt tactgttctg gcagttcctt ggggtcagga ctcagaaaca     9480
tccaattaat gttcatgttc tcttaacgac tcagaaatac tttataacct ctccacaggg     9540
tacggctttc atctgcccgt gttcctgttg atctatctca gaatccacag agtgaagaga     9600
cacagagaga tgtcatagca ctcctctgtt ctgtattctt agcaagtcaa ggtgctagtg     9660
aagcttctgg aactatatca ccggtaattc aaaattcttc aagttccttt tgtatgtaga     9720
ttatatcttt gtaaaactcg gcatttatta cctgctcttt gtttcaaaaa gcagtatttt     9780
attttgctcc ttagcatagg tcagcagaac agttgatctt attcagaaaa caatattttg     9840
catgtaacat actgttatct atgagatgaa aattaatgca tgtgtaataa tgtcaatgat     9900
aaatatttgc tatctgaatc cagtctacca actctagtta gaccgaaatt actgaggttc     9960
tatttcaaag aataatttag tgcaccattt gttcaactac tatgaagtaa aatggtattc    10020
ccttctattg acatcgggtt agaagtgaaa ggccatctta atgcaatgtt ctcaatgcca    10080
caaacccaca aatttcatta acacatacag attattatta acatagctat aaattggatt    10140
tccagaagct tgagttgaat ttattttgtt acaattgaaa gcactgggaa cattagcatt    10200
tttttttagt tcttggttat tgcaatttat aatgttatac agaactgtgt acctcacaat    10260
gcattcatta tgacattcta tgaaccattt gattgactgt tgcttgtaaa caacaggatg    10320
atgaggagtc tttgatgcaa ggagcacggg aagctgaaat gatgatcgta gaggcctatg    10380
cagcccttct tcttgcgttt ctttcaactg aaaggtttgc aatctgtagt tgatggattg    10440
ttttattaat gtctaactac ttgcataatg tcagcactat ggcatttaac ttatactgtc    10500
tgttaactgc aacagcatga aggttcgtgg agccatttcc agctgccttc caaataacag    10560
cttaaaaatc cttgtgcctg cgctagagaa atttgtggta tgtctccata attcttgaac    10620
tactgtttgt ataaaaaagt atggatgatc tttgaattta ctccattttg gaaatcatta    10680
atttttcatg tctgaggtgt gaggtgtcac cataattgta cttcccatcc aggaagcctg    10740
tttgcaaaat ttcacataaa taaggaaaat ttgaacttgt ttcaagtttg aatagtaaca    10800
ggatgtttta tttctcaact ggagaaaaca ttccggctgg gacttttaac ccttaaaatg    10860
ctagtgtgct cccactgtaa gattgtctgc tgtcacattt gaaactttgt gtaatacctt    10920
tatcactacc cttgagatga gagacacaat ctggtaccga gttaagttat tgataactcc    10980
cagttgaagt acagcaccaa atcaagccaa catgttggct acgtaattaa atgttctctt    11040
acaacagata gaggtaaaaa gggagtttct aagtatctaa cctcttaccc tcttggctta    11100
gcactccagg cacaactctt tcttaacttg cgatttagga cttgactctg agaatattgt    11160
gtgcccacac tggttgagtg catgcctatc taagctgcta gtttttgttc attttgatta    11220
actctgaagc tgcctgagct tattctgctt ccatcattta ttaatccatc atgtttctct    11280
ttcagtcgtt ccatctgcag ctcaatatga tcacagagga aacgcactca gctgtcacag    11340
aagttatcga gaaatgcaaa ctttcataga aagagtgaag aggggcctgt acagatcaac    11400
taacaacctc tttgcagcaa aaaagcatac acacaagtgt ttgtcttggc ctggggctct    11460
gcagatggac tgatactctg acctgcagtg ggcttgggag ctaacaatgg tttcattctt    11520
ttttttttta tgttttcccc tgttgttttt gctcatgttt tgtgtaattt tttcttctca    11580
tctagcgatg ttatttttct tagcatgatg ggagtagccc tccttttttt tttctctaat    11640
taagtgtaaa gtagcaacag catagggatg aatgttcagt gtagtgtgtg gtgtttcagt    11700
tattcagaga cgtccataca gtttgtacct tgtgaccaca cgtcttaatc tgatgaagct    11760
tagaataaat cacatgttag caatgcaata tcatctgcgt cttctctcac tttggtggcc    11820
atcaaattct gtgtagaagt gtatggttgg tgtgctgttg caaatgccgt attccgctct    11880
gttttgtgga agttaagaag tccctagttg aaataccgat ttttcatgat ctcggagatt    11940
gatgcaactc tgattgcagc atttcttttt attagaatgt acactccatg ctatcatgat    12000
gtttattgtt tagtactaca agatttggtt aaccattatt ttaatatcat aataatttta    12060
taaaatcttg gagtaacaag ttcataatac atgatagcat aactttttga ggctagtcta    12120
tgtatattgt ctcctttgtt tttaaactaa gcactcaata aattattgat ggctgtaatt    12180
ttctgaaggt ttcaccggtt tcggcccgtg ctttataaat agcttcggca caaaagacaa    12240
aacggtccct ccaacacata aatggttgag tttacgtttt cattatcttt ggtaaaatca    12300
agtccaccac gtagacactc ataacaaaag tttgaatatc ctcagaaatt ttgacttgag    12360
tctatcttac ctttgatatc ggacatccaa ccctccctcc ctccctgaac tttatattat    12420
tcatattaca cctgaacttt atattattca tattacaccc tgaagtggtt ttcatttaat    12480
tgcatacatg ctgaaatagt ttgacaacgt gagatgcaca aaatctacac gttcgtctta    12540
agttgcaatt cattttatcc cttttctttt tctctcttac ataggaatat caatagtact    12600
aattcacatt acaatatagt ataaattggt gatcgattat tggcaatata ctatattaaa    12660
tattcaaaac tagtcattta agctgccaaa taagtaaacc actatcgaaa accacaatat    12720
aaatggcatt acaaaactta gggggttgaa tatccaattt taaagttcat gatgctagag    12780
gaatttctat caaaagttta tgggtacata tggacttttt cctttttaaa agaagctatt    12840
cttatcgtaa acgttaaata ttttttgtac tttatttttt atgattgaaa aaaaaactta    12900
gttttcaaaa tgattggtct gtatacaagc atcaattaga cttaataaat tcatctaaca    12960
gtttcctggc agaaactgta atttgttttt gttattagac tacgtttatt atttcaaatg    13020
tgtgtacgta tatccgatgt gacaaccaaa cccaaaaatt ttccctaact ccatgaggcc    13080
ttacagatat atttgatggg tgtaaagttt tttaagttct ttgggtgcaa agtttttaaa    13140
gtatacggac acacatttga agtattaaat atagacaaat aacaaaacat attacatatt    13200
ctgcctgtaa acaacgagac aaatttatta agcctaatta atctgtcatt agcaaacgtt    13260
tactgcagca tcacattgtc aaatcatagc gtaattaggc tcaaaaatat tcgtctcgta    13320
atttacatgc aaactgtgta attggttttt tttttcgtca acatttaata ctccatgcat    13380
gtccaaatat ttgatgcgat ctttttggcc aaattttgtt ggaatctaaa caaggatcaa    13440
atttgctgaa tttttccaga cgtcacggct tgttcatcca tcgttcgcat cgcgattcgc    13500
caccgacgcc ttggtttcca acgaatttta tcatccgctt aaatacatcc aaagctctcc    13560
atcgccatcg gcggccaacg gcgaccgctc cgctctaccc aatccaccca tccactcgcc    13620
gccgccccct gatccaaagc ctccgccgcg ccgccgtcga gaggaggagg aggaggagga    13680
ggaggaggag gaggcgtgag cccctatggg gaccctcctc cggccgcgtc cgctcgccca    13740
cgccgccggc gccggcgacg ccacgccgtc gaccgcgcac ggtagccacg cgcctctcga    13800
gaggcccccc ccccgccgct cgctgatctc tcttctcatc ctgtttgggt ttgggtttgt    13860
gatttgggtg tttttttttt tccgcagcgg tggtggtgag cggtggccgc ggccgtggcg    13920
tggagtgcca gccgcatcgg gtgcgccgcc gcccgggtcc gcaggttgcg gtggcgacgg    13980
cgagctggag gaggcggagg gagaccgtgg tgagatcgga tttcgccgct ggtggtgccg    14040
ctaccatggg ggattcgccg caggcgctct caggtttgca gcctcctcca ctctcttctc    14100
gcaaaatgtg ttgctatgtt cctctcgctg ggctggcctc atagccatta atgtagtttg    14160
ctggaacatt acattcggaa cgttgttggc aattgcttga caaaatgtgg aattgtggag    14220
gggagaaaaa tcgtttgaac ctgcagtgac aaaattgcca tctataattt taaaactgaa    14280
ggtgtggaaa tcaaacataa tcattgccag cacatcattc ttgttaacca ccttgacata    14340
ttgttggctt ataacagtta gctccacacc aacttggaag gtgtcaatgg aatgtaagta    14400
taaattgagg ataactggca gttgttaaga ctttctacag aacttgtagc agctaaaact    14460
agctattgtg catttatgtt tcatggaatt tgagcggcaa tggatatttc ttactaagac    14520
gtataatgca aaacaaaaaa aaaaaaaact atgtctatgc agtttacatg taatgtgcgg    14580
atgcaaataa aatcatgttc atggacaaac taatgggatt cataccaaat tccagaattg    14640
catttcttat gtggttactt ttgtttgttg atttggttac cagacatcga tgtggtttca    14700
agggtcagag gggtttgctt ctacgcggtg actgcagttg cagcaatctt tttgtttgtc    14760
gccatggttg tggttcatcc acttgtgctc ctatttgacc gataccggag gagagctcag    14820
cactacattg caaagatttg ggcaactctg acaatttcca tgttctacaa gcttgacgtc    14880
gagggaatgg agaacctgcc accgaatagt agccctgctg tctatgttgc gaaccatcag    14940
agtttcttgg atatctatac ccttctaact ctaggaaggt gtttcaagtt tataagcaag    15000
acaagtatat ttatgttccc aattattgga tgggcaatgt atctcttagg agtaattcct    15060
ttgcggcgta tggacagcag gagccagctg gtatggctgt agtctcatcc ctgctttctt    15120
aagtagacat atatacattt acagtatttg gtaaataaac aagattttat gaatcatata    15180
tgattttggg gaaaacacaa aactctcttt gttggctgcc ttgaacatag ttctgttcac    15240
acagttatag caccttcttt aaaatgaaga actttgttgc atacacataa ggccaaacca    15300
cataatgaat tttgtttatt tctatctttg aatgttagca tcgtttttgt ttaatgcatg    15360
atcgccttcc tatatatttg tagtatgtca acattgtatt ccatgctgag cataacaaat    15420
ggtttgttaa aattcaggac tgtcttaaac ggtgtgtgga tttggtgaaa aaaggagcat    15480
ctgtattttt ctttccagag gggactagaa gcaaagatgg aaagctaggt gcatttaagg    15540
ttcagtaacc aaacttaggt tacattacat ctaatgagat ttttatattc agtatataat    15600
gttaaccttc tcatggtgta ctgacgtggt tataaatgtc cccagagagg tgcattcagt    15660
gtggctacaa agaccggtgc tcctgtgata cctattactc ttctcgggac agggaaactg    15720
atgccttctg gaatggaagg catccttaat tcaggttcag taaagctcat tattcaccat    15780
ccaattgaag ggaatgatgc tgagaaatta tgttctgaag caaggaaggt gatagctgac    15840
actcttattc taaacggtta tggagtgcac taaagaaaga tggtgttttt ttttattata    15900
tggaacctat tcaaaggcac agacaggctt tcaaggctaa gcttgttaca ggtactgata    15960
ctagttacta attactttcg taatcagtat aaataagctt gtgtagtgta atggcattgt  16020
acatttctgc acttggtaaa tttacagaag aggcaagtaa tattttagag gattgagttt  16080
attcacccag tcatatagtt gaagaggcaa gtaacctgta agagaggact gaacattaac  16140
acctcttgtt cgattaaaaa tgaccaaaga gcatcaaaca tgtattcgag gctgttactt  16200
tagatatggc ccattaattt gtttagttgt ctatgtacat cctagttggt gtaaatgcca  16260
gttaccattt ctatgatcta aaacaatcaa ctcttttagt atattttcaa aaacgaaaat  16320
tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc  16380
accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat  16440
tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt  16500
ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc  16560
tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag  16620
agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt  16680
ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta  16740
tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc  16800
tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg  16860
attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct  16920
acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac  16980
aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg  17040
ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa  17100
gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg  17160
cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg  17220
ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg  17280
ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta  17340
gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg  17400
attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg  17460
ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg  17520
cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga  17580
cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttccttt ccttgatgaa  17640
ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa  17700
tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac  17760
ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca  17820
ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc  17880
tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc  17940
gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag  18000
gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg  18060
aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct  18120
gagaagcgta ataccctact cctgtgtttt ggggggatct gtgtatgaag gagctacaaa  18180
gtatgagcca gcctctccct tgttctgggt tccgaatctg gaaaagtcca gtccagtccc  18240
cccctctaag tgggcaaggt cctcctttta tatcttaagg ggataccaca tgcaccatct  18300
ccctcctttc tgtggggact taccctacct tttcataaat ggacggagat ttgtatagtt  18360
gccgtccgaa tgaccttctg ataggacggc ccatacctac ctccacttcc gccgaaagca  18420
ggtgcgacgt gggattatgg ctgtctgctg acgacatgac cagtgtcaga ctggtcacaa  18480
attgctcatt cctgtccacc acgcgtcagt ttagcaatct acatgttggc ccttcttcac  18540
acaacatctt gcctgtaatg gttaggatga agcctggcat atatctaacc aggactaacg  18600
tgccatctct aggaggtaac acgctagctc cagctgggga cgagcgccta gaagccctcg    18660
tcctgacggg atggggcgag gcgtgcgtca gatcgcctgt cgccacctaa cccgcgatct    18720
gaccggtctg tgactggtca cagaccggat aaacgagtgc actgcacttc gttacatgcc    18780
gcgtgacacg ctcagccaaa ccgcaataaa tgtggttagg tgagccccgc tgtgctcacc    18840
taacccatac acgcggagca aaaacccacg aggggtcggg gcgcctcggc cctcggggcc    18900
gaggcgggtg cggtccgacc ccctcggggg gactaagagg agggcgaaca catcaccctc    18960
gggcccgacg tcccccgagg gtgccaggcc acgtgggcga ttgtgtctgc ctcaaacctc    19020
tagtcatgat actcctgatc ccatgtcacc gacagtagcc cccggcgtta tgccagggcg    19080
atcgccctct ttaagggaag cggtcgggcg tgacgccact cctaaggcct ggtgacaggt    19140
gggaccggtc tccacaattg ggcagaaacc caacggtcac aaatcacgca catcggcaat    19200
ggtaactcta ctatcaataa tgagcggtct cttcaagact gccacattac tcgagtagca    19260
cacgaatctg gacatggcga ttcgtttcgt ctggagatat ggtaacgtcg ctttggtcgg    19320
cgagcgtaat taacgcgcgc acgatatgat ctatctcgac tgccacaacc gcatatccac    19380
ctcatgcgcc gcaagcgggc gaatgggatt agtggaagcg tgggcgcgag aaacgagggg    19440
gcgaaatagt gggcgcgaga agcgaggagc cgggcacagc gttggcaaga gtataaaggc    19500
actgaggaaa ggatctgttt ccttcctttc gccatcattt cccttgtctt cgccgcttgc    19560
gccctaactc cttctttcct gtgctctact ttcgccacac gcgctcgctc tcaatcttct    19620
cttcctccgg cgccatggca cggggctccg ctctgctcga tggtagcgtg ctgccgcctt    19680
cccgcatcgt gagcgagagg caggctgggc tgccgcgccg cttcatgccg gaatctgcca    19740
ccggccggga gatagtcacg ctgggtgagg gacgcccggc gccagactac ccggggcggt    19800
ccgtcttctt tctccccttt gcaatggcag ggctggttcc gccattttct tctttcttca    19860
tggatgttct gaagttctac gatctccaga tggcgcacct cacccccaac gcggtgatga    19920
cattggccat cttcgcgcat ctgtgcgaga tgttcattgg ggtgcgccca tctcttcggc    19980
tgttccggtg gttcttcacc gtgcagtcgg tgtcgccgcc atcggtagtt ggtggctgct    20040
acttccagcc atgggggccg gtgctgaatc gctacatccc ctgcgccctc cgcaagaagt    20100
gggacgactg gaagagcgac tggttctaca cccccctcgc cgacgaagcg cgcctctgac    20160
ttccgagcca gcccccggcg caggcctcca gctggcgggc gccggtagat ctgggggatg    20220
gctatgacgc cgtcctcgac cgcctggcgg gcctacgatc ccaggggctc acaggggcca    20280
tggtgtacgg cgactacctc cgtcgtcgga ttgcgccgct ccagcggcgc gctcggggcg    20340
cctgggagta caccgggtcc gaagactaca tgaggaccca ccagggagtc agatgggact    20400
gggctcctga ggatttcaag atagtggtcc aacgggtgct gaatctcaac tccatggagg    20460
cgtccctcat tccccaagga atcctccctc tctgcagcga tccagaccgc gcctccatcc    20520
tgaccattat gacggcggtc ggggcctcag aggagtgagc tccaaagggc cacgacggcg    20580
caggcgggag ccgtaggggg gatcaatcta ccccgggagg gggtcgtgct tctgggtctc    20640
gcgacggagg cccgaggagc agccgccctg ccgacgcccg ggggaagagg aagcagggag    20700
gaacacctcc cccatctcct ccccgagggg gcggggcggt gcgtgccaac agcaggcgcc    20760
cggagggggc cgcgccgaca tcgcagcccg agggggagcg caagaagaag cggctccgca    20820
agatggggga gacagaacca tctcggggaa accttatttc ccctccaaag tggtcgttta    20880
accgaccccc tcgcaggttc gtctctcacc catcgtggct gtattcattc tctcaacgcg    20940
agttttcact cacccatctt gttcgtcttc tggtcttttc ttctgtttca gcgagatccc    21000
gtcgcgtccc tcccgccatt ccaagtccgg ccagtctgag gccgaggatc cggcggccgc    21060
agaggcccgg aggcgggaat ctgaccggcg agaggccgcg gatcgcctac gggaagccga    21120
ggaggccgcc caggaggccg cccgggctcg ccagggcgag gaaaccgctc gggaggaggc    21180
cgcccgggcc cgccaggccg aggaagccgc tcgggaggag gccgcccgag cccaccaggc    21240
cgaggaagcc gctcgggaga aagccggatt tcgccaggac gaggcaatgg cgacttccga     21300
ggcagctcgc gatgaggtcg cgggcgcgtc gcttgagccc gcttcctcgg gcgacgctca     21360
ggcgacaact tccggggcag ctggcgacga ggctgcgggc gcgtcgcttg ggcccactcc     21420
ctcaggcgac gcccaggacc aaccaggtct gagggacatc cccgagtccg gcacttccat     21480
cggcggcccg agccgcgtgg catcctctcc aaggcggctc ttccccacgc cttctatcgc     21540
cccgctgagc gcagagcccc ttctgcaggc cttggccgcc gcaaacatcg cggtgttgga     21600
cgggcttagt gcccaggtgg aggccctgca agcagagtgg gcggagctcg acgccgcgtg     21660
ggcgcgtgtc gaggaggggc ggcgctcagt ggaggccatg gtggaggtgg gccgcaaggc     21720
acaccgccgg catgtctcgg agcttgaagc ccgtaagaag gtgttggcgg aaatcgccaa     21780
ggaagtggag gaggagcggg gggctgccct cattgccacc agcgtgatga acgaggcgca     21840
ggacaccctc cgccttcaat acgggagctg ggaggcggag ctagggaaaa agctcgacgc     21900
cgcccagggg gtgcttgacg ttgccgctgc ccgagaacag cgggcggggg agaccgaagc     21960
ggcgtcccga cggcgcgaag agacccttga ggcgcgcgcc atggcgctgg aagagcgcgc     22020
ctgcgtcgtg gagagggatc tggcggaccg cgaggccgcc gtcactatcc gggaggcaac     22080
actggcggcg cacgagtccg cctgtgccga agaggagtcc gcactccgcc tccacgagga     22140
cgcgctcacc gagcgggagc gagctctcga ggaggccgag gccgcggcgc aacggctggc     22200
ggacagcctg tccctccgcg aggcagcgca ggaggagcag gcgcgccgca ctctggaatg     22260
tgtccgcgcc gagaggaccg cactaaacca gcgggccgct gacctcgagg cgcgggagaa     22320
ggagctggac gcgagggcgc gcagcggcgg ggcggctgcg ggcgaaaacg acttagccgc     22380
ccgcctcgct gctgccgaac ataccatcgc cgatctgcag ggcacgctaa actcgtccgc     22440
cggggaggtc gaggccctcc gcttggcagg cgaggtaggg cccggcatgc tttgggacgc     22500
cgtctcccgc ctagatcgcg ccggtcggca ggtgggcctc tggagagggc ggaccgtaaa     22560
gtacgccgcc aaccatggag gcctcgccca gcgcctctcg aagatggccg gggctctcca     22620
acggctcccc gaggagctcg agaagacaat taagtcatcc tcgagggacc tcgcccaagg     22680
agcggtggag ctcgtactgg cgagttacca ggccagggac cccaatttct ctccatggat     22740
ggcgctggat gagttccctc ctgggaccga ggacagcgcg cgcgcaggtc cgggatgccg     22800
ccgaccatat cgtccacagc ttcgagggct cagcccctcg gctcgcgttc gcccccaact     22860
ccgacgagga ggacaatgcc ggtggtgcag acgacagtga cgatgaggcc ggcgacccgg     22920
gcgtatcgga ttgatccccc aagcccccgc cattcttcag ttttttcttc ttttccttct     22980
tctaaggcct tcgggcctct tttttgtata gatcaactta atctgtaatc aaaaatgaag     23040
aaatttttgt gtcaatttca tcttgctgtg tgtatgagat gaggatgatc tgtgacgtgg     23100
tccttttgcg tcttagcttg attaagggct cgtgcccagg tcccagtcct caaaaggcgt     23160
gggtcggggc tagtgcctgg ggagatccac atgtcgagac tggccaggcc gggaacgtgg     23220
tgaccgaggg ttatgggtga cccgattgtg ggtttttgcc gattcccccc cggagttcac     23280
cacgccccgg ggcacggctc ggttctgggc cccgtttggc gattttagcc gacccgagcc     23340
cccgagggca ggattgagca cgagtgacct atttcaagtc aagattcttc aaaaggaaaa     23400
aaaaacacag atacagcctt taggaaattg aaactgcttt tattgaaata ctgaaataag     23460
agaaataaga atgtgcatgt gtggcagccc ccggccaacc ctgcacgccc gagggggtgc     23520
ggggttggcc cgagcccgaa acctgacacc cgaccccccc cctcaggggt agaagcgacg     23580
aaggtgttcg atgttccacg ggttaggcag ctcaatgccg tcgcccgtgg ccagccgtat     23640
ggagcccggc cgggggacgc cgaccactcg atacggaccc tcccacattg gtgagagctt     23700
gctcaatcca gcacgcgttt ggacgcggcg taggacgagg tcgtcgacgc agagtgatcg     23760
ggcccggacg tgacgctgat ggtagcgccg caggctctgc tggtagcgcg cggctctgag     23820
ggccgcgcgt cgccttcgct cttccaagta gtcgaggtca tctctgcgaa gctgatcttg     23880
atcagcctcg cagtacatgg tggcccgagg agacctcagg gtgagctcgg atgggagaac    23940
cgcttccgcg ccgtagacga ggaagaaagg cgtttccccg gttgctcggc ttggtgtagt    24000
tcggtttgcc cagagcaccg ctggcaactc ctcgatccat gaatcgccgt gcttcttgag    24060
tatgttgaag gtcttggttt taaggccttt gaggatttct gaattggcgc gctccacttg    24120
gccattgctt ctggggtggg caggtgaggc gaagcagagc ttgatgccca tgtcttcgca    24180
gtagtcgccg aagagttcac tagtgaattg ggtgccatta tccgtaataa tacggttagg    24240
cactccaaac cgggccgtga tgcccttaat gaatttaagt gcggagtgct tatcgatctt    24300
gacgaccgga taagcctcgg gccacttagt gaacttgtcg atcgcgacat acagatactc    24360
aaacccgccc ggggcccgcc taaacggtcc caggatatcg agcccccaga cagcaaatgg    24420
ccacgaaagt ggtatggtct gcagggcctg ggccggctga tggatttgct tggcgtggaa    24480
ttgacacgct ctacatcgcc ggaccaggtc gaccgcatca ttgagagctg tcggccaata    24540
gaaaccctgg cgaaaagctt taccaaccaa ggtgcgcgag gcggagtggg ctccgcattc    24600
gccttcatgg atatcggcaa gaagcacaac gccttgttcc cgaggaatgc acttcaggag    24660
gattccatta gccgcgcgcc gatagagggt cccttctacc agcacgtagc gtttggagat    24720
gcgatggacg cgttcactcc cttcgcggtc ctcgggtaaa gtcttatctg tgaggtatgc    24780
ttggatctcg gcaatccaag caatcaatct aagggagctg ggagcgctcc cctcgggtcc    24840
cgaggcctgg acttcaacgg gcctcggggg ccggtcaggc gcgtccgtct cccctaaggg    24900
gtcgggtcgc gccgacggct gggcaagcct ttcttcaaag gcgcccggtg gggtctgggc    24960
tcgcgtggac gcgagccgtg agagttcgtc ggcaatcatg ttatcccgtc tgggcacatg    25020
ccgaagctca atcccgtcaa aatggcgctc catacgccgt acttggcgca cgtaggcgtc    25080
catctgcggg tcagagcacc ggtactcctt acagacttgg ttaacgacca gctgggagtc    25140
gcctaacacc aggaggcggc ggatccccag tccagctgcc actctgagtc cggcaaggag    25200
tccctcgtac tctgccatat tgttggtcgc tcgaaagtcg aggcggacca agtatctgag    25260
gacgtctccg ctcggagagg tcaacgtgac ccccgcaccg gcgccctgaa gagacaggga    25320
gccgtcgaac tgcattaccc agtgggcggt gtgaggcagc tgcgaggggt ccgtgctggc    25380
ctcggggatt gagacgggct cgggagccgg ggtccactct gccacaaaat cggcgagagc    25440
ctggctcttg atagcgtggc gtggttcaaa gtgcaaatcg aactcagaaa gttcgattgc    25500
ccatttcacc acccgtcctg taccgtctcg attatgcaag atttgaccga gggggtaaga    25560
cgtaaccaca gtgacccgat gcgcctggaa ataatggcgc agtttcctcg aggccatcag    25620
aatagcgtaa agcatcttct gggcctgagg gtatcgggtt ttggcgtccc ggagggcctc    25680
actaacaaag tagacgggcc gctgcacctt tcggtggggc cgatcctctt cgctaggggc    25740
cgcatccctg gggcactctt cgtccaagca gcctcgcggg gcgcacttgt cttctgtgct    25800
gatgacctcg gggtcggagg ataacagggg cggccttccc acagtggctt tggggccgtc    25860
ctgggggtca ggggctcctg gcgtcgtcgg acaagcgggc aaagggccaa ctccggtcgt    25920
caggggcctt aggcctccgt tcggctcggg ggcctcttct ccctgctctt tcccgggtcg    25980
agtcagcaca gggttagcct cggggtcaaa gggcgatagg tgcggccttc ccacagtggc    26040
ctcagggcct tcctgggggt cgggggctcc tagcaccgtc tgacaagcgg gcagagggcc    26100
aactccggtc gtcgggggcc tcgggccacc gttcggctcg ggggcctctc ctccctgctc    26160
tctcccgggc caagtcggca cagggtgggg aagcgcgaaa tgagaattgt cctcatcgcg    26220
ctccacaacc aatgccgcac taactacttg cggggtcgcc gctaagtaga gtagcaaggg    26280
ctcgtctggc tccggggcga ccagaactgg gggagagctt agatacgcct tcaactgggt    26340
gagggcattt tcagcttcct tcgtccaggt aaacggtccg gagcgtttga gaagcttaaa    26400
taagggtaac gccttctctc ccagcctcga tatgaaccga cttagggcgg ccatgcaacc    26460
ggtgacgtat tgcacatccc taagtttgct gggggggcgc atccgctcta tagcccgtat    26520
cttctcgggg ttggcctcaa tgccccgggc agagaccaag aacccgagaa gcttgcccgc   26580
aggtacaccg aacacacact tatcggggtt taattttatg cgggcggagc ggagactctc   26640
aaaagtttcc gctagatcta tgagtaacgt ttcctggttg cgcgtcttta caaccaagtc   26700
atcgacataa gcttcaatat tacgtcctaa ttggctaccc aaagaaattc gagtagtacg   26760
ttgaaaagta ggacctgcat tctttaaccc gaagggcatt gtcgtataac aataggttcc   26820
tatgggggta atgaacgcag ttttttcctc atcctcccta gccatgcgaa tctgatggta   26880
accagagtat gcatctagaa aacacaaaag gtcgcacccc gcagtggagt cgacaatctg   26940
atctatgcga ggcagggggt aaggatcctt aggacatgcc ttgttaaggt cggtgtagtc   27000
gatgcacatc cgaagcttgc cgttcgcctt gggaacgacc accgggttcg ctagccactc   27060
ggcggggttg acgctgccat catatttttc ggcgatggtg ggccggaacc ttgggggcca   27120
acggacattc cgaagactcg ccacaaaggc tctacagccg acaccaccaa ccgggggcac   27180
ggagggctga ttcccgcgtc cgtgttgagg tgacactctg gacgaggaag cgccctccgt   27240
tgcgtgggca gcacttcggt cattacgccg gcgctcgatg ctggtgcggg cgtccggccc   27300
cccacgcaga tctttctggg tcgaaggagt cgacgaagga gtggcggccg aatggcgaac   27360
agcggctgcc gctcgtcgtg ccctccgtct tgacgacgcg gagccggtgg tagcagcacc   27420
agaggccttg gtggcggagg accgcccacc agcatctagg cgctgccgta ccgtcatgac   27480
taatttggcc acgtcgtcca gccatcgttg ggctggagac tccgggtcag ggacgacagg   27540
cgggtgacgt aagagcgcgc ccgcagcttg gagcgcgccc tggggcgtgc tgccgtcgcc   27600
gtagacgagg aggcgacgct ccccatctcg ccgttcttct ccatcgcccg cgatcggtga   27660
agtcgcggat ctttcgaccc tctcgagcgc ctccccccgc ttaggacttt ggcgtggagg   27720
gagcggtgga gtacgagctc gacggcgtgg gttcggctcc ccgtcgtcgc cactcacact   27780
cggagagagg tcgtgcgcct ttgcttgctc ggccatcagg ctgaacagga aaagcttggc   27840
gcacacggaa gagtacgaga gctcagaaaa acacacactg agtcccctac ctggcgcgcc   27900
agatgacgga gcgtggggct cctcaccggg agaccgcgca ggcccccctt tgccggttcg   27960
gccggggact cagggtgaaa ttctaagctc tctgtatgtg gaaggttcgc gaccgtcgaa   28020
agagcataag acacgggcga tgtatacagg ttcgggccgc tgagaagcgt aataccctac   28080
tcctgtgttt tggggggatc tgtgtatgaa ggagctacaa agtatgagcc agcctctccc   28140
ttgttctggg ttccgaatct ggaaaagtcc agtccagtcc ccccctctaa gtgggcaagg   28200
tcctcctttt atatcttaag gggataccac atgcaccatc tccctccttt ctgtggggac   28260
ttaccctacc ttttcataaa tggacggaga tttgtatagt tgccgtccga atgaccttct   28320
gataggacgg cccataccta cctccacttc cgccgaaagc aggtgcgacg tgggattatg   28380
gctgtctgct gacgacatga ccagtgtcag actggtcaca aattgctcat tcctgtccac   28440
cacgcgtcag tttagcaatc tacatgttgg cccttcttca cacaacatct tgcctgtaat   28500
ggttaggatg aagcctggca tatatctaac caggactaac gtgccatctc taggaggtaa   28560
cacgctagct ccagctgggg acgagcgcct agaagccctc gtcctgacgg gatggggcga   28620
ggcgtgcgtc agatcgcctg tcgccaccta acccgcgatc tgaccggtct gtgactggtc   28680
acagaccgga taaacgagtg cactgcactt cgttacatgc ggcgtgacac gctcagccaa   28740
accgcaataa atgtggttag gtgagccccg ctgtgctcac ctaacccata cacgcggagc   28800
aaaaacccac gaggggtcgg ggcgcctcgg ccctcggggc cgaggcgggt gcggtccgac   28860
cccctcgggg ggactaagag gagggcgaac acatcaccct cgggcccgac gtcccccgag   28920
ggtgccaggc cacgtgggcg attgtgtctg cctcaaacct ctagtcatga tactcctgat   28980
cccatgtcat cgacaaggcc atccgaatgt attaaggagt aaaagttaca agaaaaaaca   29040
ccacaatgca ccaaggtgca tgaccacaca ccatacacta cccccaagca caaaccactg   29100
agggtgaagc ctagcaccaa acgaccgcca ctaagtgtga ccaaacgccg ctaggcctac   29160
ggcagcaaca catagatgag acttcgaaaa cgatgccacc aaggtggtca cgacatgtag   29220
gatgctgcca tcgtccatct aaaaagatgt ggttttcacc cagagaaact catcaagaag   29280
gggagagggt aacccttgac agcgccccaa ggaggttacg acgcccgaag gcgtagccgc   29340
tgccggtccg gtgaaccacc ggactaggct tccgcctagg accctatagc cttgatcgca   29400
gatcaccgtc caccactcag aaccaccaca cagacaaaag gtagcacgta gcttccaccg   29460
caccgcaccg acgccccttc gtcggccgac tccatcgaac caccatccct gagagctggc   29520
ccaggacccc tccgttccac cacccgccgg ccgccttgcc agttttggcc aaaggagaac   29580
ccgggactgg gtgacattgc ttcggcagcc tgagcttccc ccgctggcga gctgctgtct   29640
caatccaacc tagaaactcc ccgcaaaaga aggggatgag ctctaggaag ggcgagggtg   29700
ccgaccggca acgaggaaga caacccatcg actccagctc cctttgcact accatctggg   29760
cctgcgccaa tgccggatac gctgtcgctc cggctccggc gccacccacc tgcaccccct   29820
ttgcctggtc tccgcgcccc tcctggctgc gtcgcgccgc ccagctggcc gctaagggca   29880
ccacgacggc cgcccggcta ccgaggcctg gccgcgccat gggacagctc gcgctggcac   29940
cagcgagcca cggccgtcgc gctgttgccg gcgccagcga gcacaaccgc cagctccaag   30000
ggccgagcat gccactgagc cgccgccgct gccgcccggg ccggctgcac gtcaccggcg   30060
cacacgaccg cacgccgcca cgctccgcct ccgcgcccga ggcagcccca tgccattgcc   30120
gcgcacctcg cccgcccgct gccgagccgc caccgcgcac cttgctgagc cgccaccgcc   30180
gtccctagcc gcctcgtgcc gccgccacgc cagatccagg cgcgggatgg ccggatccgg   30240
ccttgggggc gccggatccg ccgcctcccc acaccgccac ggcgtcacca cctccgaccg   30300
cagtgagggc ttcgtcgttt gccccatcct catcgcgtcg aggaggaaga cgccaagaaa   30360
aaagggcctc gccgctgcct tccttgctcg ctgccggctt cgccgccggc gagctccggc   30420
ggcggcgagg tgggggagaa gaagtgggga gtgggcagct agggtttttt cgccccccaa   30480
gccgcccgtg cgagagcgac ggtggggggg gggggacttt ccaacctctt ccagtgttct   30540
agttctccac gttatgtaac tcaatttgtt taaccataga aagtaagaaa cctaccagcg   30600
tgttaagctc tctttcattc cctttcttct tcctggtttt gcttccatca catgtcaagt   30660
gaagggttct taactaccat tactcctaca catctaattt ttttctcaga tctttcgcag   30720
gtatatattg atgctacatt ttatgatctt aagataatct ccttcacatt accctctgct   30780
gaaactttag cttgaaccgt catcttcacc acaatttgag cccaatttgc acagagcaca   30840
acgagcaata gcttgccctt acgttcatta tttagcatga actactacta actacccaag   30900
aatcaataca ccggtttaat aacgccattt tatcacgtta atatatgttt cattcaacac   30960
accggttttg gcacagttgc aaacttgcaa taaattcttt cctacttctc catcccataa   31020
tataacaaat tggtatgtct cgtctggtac taagttgcta tattatgaga tggagggagc   31080
acttcttttc ttccaaaata taagaatata gtattggatt agatattatc tagattcacg   31140
aattcgatta ggttgtctag atttatagtt gtatgtaatg tataattcgg taataggtta   31200
ttacctctcg ggatggaggg agtagttttg actttttttt ttcttataaa tcgctttgat   31260
ttttatatta gtcaaatttt atcgagttta actaagttta tagaaaaaaa ttagcaacat   31320
ttaagcacca cactagtttc attaaattta gcatggaata tattttgata atatatttgt   31380
tctgtgttaa aaatgctgct atatttttct ataaacgtag tcaaatttaa ataagttaga   31440
ctaaaaaaaa tcaaaacgac ttataatatg aaatggagga agtagtagac tataacaaat   31500
ttaaaccgtg ctttgatttt agagcatcac taatatgtta gcaataatct atccctaaaa   31560
tttatttttt ttcctaaact gaaaatagga agtggaaata ctcctccatc taagagagag   31620
cctaaattca ataaaaaact aaaaaactaa aggtggatcc ctctattaaa ctaccgcaaa   31680
aaatttatgt tttttttctc ttccacgcgc gcagaacaga tatctcgatc aagttagcat   31740
gtaaaatttt taaagagata ccttatacga ctccttccgt atttccaaaa gcaaacggat    31800
ttaaaatctg actcaaataa agatctatat atccaattta catgacacat gtttcgccga    31860
atttttatat taataataat taatattttt aaaattaaat tattagcaat ttgtttggag    31920
gatttatcaa aacaggatgg acgttgttta taacagcgtc tagacctaga cgcgcttgca    31980
aactgcggcc acccttttat cacacaaatt tttgacaatt tgacactttc caaaaattaa    32040
ttttataaat taaccgtgac caaaacttat ttaaaaataa tctttttgtt gagcgcaaaa    32100
tcgtatactt cagcgccaaa tagcacggcg ccgacctccc ccttcccctc ccctctatcc    32160
tccactgctg ccgcccacct ctccgtatca gctgcgtcgc gttggtttcc gccggcgctg    32220
ctgctgctgc accagtccgc tagggcgggc gggcatggcg cgccgcgccg cttcccgcgt    32280
ccgcgccggc gctgttggcg cccttcgctc ggagggctcg acccaagggc gagggggccg    32340
cacggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccggcgtgg    32400
caggggcgcc tcgatctacg gcttgaactg cgccctcgcc gacgtcgcgc gtcacagccc    32460
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc    32520
caacttgtgc acctacggca ttctcatcgg ttcctgctgc tgcgcgggcc gcttggacct    32580
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt    32640
cactcctctg ctcaagggcc tctgtgctga caagaggacg agcgacgcaa tggacatagt    32700
gctccgcaga atgacccagc ttggctgcat accaaatgtc ttctcctaca atattcttct    32760
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctcc aaatgatgcc    32820
tgatgatgga ggtgactgcc cacctgatgt ggtgtcgtat accactgtca tcaatggctt    32880
cttcaaggag ggggatctgg acaaagctta cggtacatac catgaaatgc tggaccgggg    32940
gattttacca aatgttgtta cctacagctc tattattgct gcgttatgca aggctcaagc    33000
tatggacaaa gccatggagg tacttaccag catggttaag aatggtgtca tgcctaattg    33060
caggacgtat aatagtatcg tgcatgggta ttgctcttca gggcagccga aagaggctat    33120
tggatttctc aaaaagatgc acagtgatgg tgtcgaacca gatgttgtta cttataactc    33180
gctcatggat tatctttgca agaacggaag atgcacggaa gctagaaaga tgttcgattc    33240
tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc ttcaggggta    33300
tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg tacgaaacgg    33360
tatccaccct aatcattatg ttttcagcat tctaatatgt gcatacgcta aacaagggaa    33420
agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga atccggatac    33480
agtgacctat ggaacagtta taggcatact ttgcaagtca ggcagagtag aagatgctat    33540
gcgttatttt gagcagatga tcgatgaaag actaagccct ggcaacattg tttataactc    33600
cctaattcat agtctctgta tctttgacaa atgggacaag gctaaagagt taattcttga    33660
aatgttggat cgaggcatct gtctggacac tattttcttt aattcaataa ttgacagtca    33720
ttgcaaagaa gggagggtta tagaatctga aaaactcttt gacctgatgg tacgtattgg    33780
tgtgaagccc gatatcatta cgtacagtac tctcatcgat ggatattgct tggcaggtaa    33840
gatggatgaa gcaacgaagt tacttgccag catggtctca gttggaatga aacctgattg    33900
tgttacatat aatactttga ttaatggcta ctgtaaaatt agcaggatgg aagatgcgtt    33960
agttcttttt agggagatgg agagcagtgg tgttagtcct gatattatta cgtataatat    34020
aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac tctatgtcgg    34080
gattaccgaa agtggaacgc agcttgaact tagcacatac aacataatcc ttcatgggct    34140
ttgcaaaaac aatctcactg acgaggcact tcgaatgttt cagaacctat gtttgacgga    34200
tttacagctg gagactagga cttttaacat tatgattggt gcattgctta aagttggcag    34260
aaatgatgaa gccaaggatt tgtttgcagc tctctcggct aacggtttag tgccagatgt    34320
taggacctac agtttaatgg cagaaaatct tatagagcag gggttgctag aagaattgga    34380
tgatctattt ctttcaatgg aggagaatgg ctgtactgcc aactcccgca tgctaaattc    34440
cattgttagg aaactgttac agaggggtga tataaccagg gctggcactt acctgttcat    34500
gattgatgag aagcacttct ccctcgaagc atccactgct tccttgtttt tagatctttt    34560
gtctggggga aaatatcaag aatatcatag gtttctccct gaaaaatata agtcctttat    34620
agaatctttg agctgctgaa gccttttgca gctttgaaat tctgtgttgg agttcttttc    34680
tcctacagtt gtattagagg agggatcttc tctttatgtg taaatagcga ggtatgtatg    34740
tcacctctcc gaattatttt tactctggtt cctagacggt aaacaagcaa ttatgttctg    34800
cctttgatgc cagaaaaaac acaaaagttt gtcgttatct ctactaacgg atcataaagg    34860
aatttgtaac tggagtttca aacttaattt gtctaggcag tagttttggc attagatcca    34920
acattgtgta ggattcattt gtgtgtatca atctataggg tttcattaaa tttcgttaat    34980
gtgtactgtt taggtgttga atagtttgac ttgtttttta actgaacaaa agatactgaa    35040
atcgttccat tcaacaaaca catgttccgt taatgaaatt attgtacgtt accttttgtt    35100
ttcttactca caagtgtcct cttttcttat atcctataga ttggtacaac aaattattga    35160
ttcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct    35220
attcattttg tgaagtgatg tgagtacctc tcaatcccat ccttatgctt ctgtgcatgc    35280
ttcattccaa ttttttacgc atatcgattg ttttctttta tataacagtc cataaagata    35340
atcacatcat gacaaagtta tttatttcta cagtatagtt atataagtat tcaccagttt    35400
tccatgaata ttttggcatg tgattacaaa gaagattatt tgagaaaatc catgctttta    35460
tttcatcttt ttgtttgaag ttgaacttta atttatggtg taaatttcag ttattattgc    35520
tagcagctcg tactctttaa tggtataact tcacttgtgc ttattctcca atatctccct    35580
tcttgttgtt caggttcaag aaaatcattt gttggattca gaatctggtg tccattttct    35640
tcttaaatta ttaaatcctc cagtgaatct tgttgattcc aaagcaccat cgataggttc    35700
caaacttctt ggaatcagta aagttcaaat gcttaatgga tcaaataagg attctgactg    35760
catttcagag gaaatccttt caaaagttga agagattctc ttaagctgtc aagtgatcaa    35820
gtcgctcgac aaagatgaca agaaaacaac aaggccagaa ctgtgtccaa agtggcttgc    35880
tttgttgaca atggaaaatg catgcttgtc tgctgtttca gtagagggta agttttaatc    35940
aaatttcttg gtcatgattt ccctttatga ccattatatt tatttatatg agccaaataa    36000
gcagttgtca acttgtcata agttacatag cacctatttg caatattcat gggtggtttg    36060
cttagccctt ttcttcacct gcttttgatt gatgacttcc atctgtgttg cagaattgaa    36120
ttggagtagt ggactgcact agaagcacct atggccattg tcatactagg aaggttttcc    36180
cttatcaaat atttgattgt tacagagact tctgacacag tgtccagagt tggaggaaat    36240
tttaaagaga cattaaggga gatgggaggt cttgatagta tttttgacgt tatggtggat    36300
tttcattcaa cattggaggt gagatctcgc taacatcgca tattttacat ttcctttgtt    36360
caactctaat ggattgtgca ggcttgttcc ttttcgccat tttagcttta atgtgcttga    36420
agccacatga aagtaatgct tgtccagata catagccaaa ggttgttata ttttggggca    36480
tggaaaatgc ttgaggtagt aactattttc atcaggacat ggaaaattgg ctgcaacaca    36540
aattatgttg ttttatgttg caaaaatagt tttttaatac ttttttattc tgcatgtggt    36600
gttagtatct tacagttcct ctgatgatta tatcccccac gataataaca cttgaaacga    36660
taataacact tgacatatct acaccaagtg aacattattc atttggatgt tacttttcca    36720
gctatacttg ctgttcttgc atgtgtaagc aagtttggag taaattgcgc attaatttaa    36780
atgcttggtg ttcctatctg tgtacttttt attccccaac taataatgca atcatattac    36840
gctgataaac tgaataaata aattaacaat atacttctgg tggcaaacct tgtgtatcag    36900
aatctcataa aggatacatc cacttcagct ttggaccgaa atgaaggaac atctttgcaa    36960
agtgctgctc tcctcttgaa atgtttgaaa atattggaaa atgccatatt tctaagcgat    37020
gataacaagg taatgctcct tatatgttct gtttcagttt agtacccatt tccttcttct    37080
gtactatctt ctctcctgat ttgttctgtg caaaatgtgc aaacagtgcg actttgtatg    37140
tctgcttaac aattttcttt tcttcctgaa aaagcaatat gaactcttac attcattttg    37200
cttcttgcag acccatttgc ttaatatgag tagaaaattg aacccgaaac gctccttgct    37260
ttcttttgtt ggtgtcatta tcaatactat tgagttatta tcaggtattt ttcttaataa    37320
tacaatgtgt tcgctaacac aataaaatgt tttaaacatc cagtatgtta aagttgcagt    37380
ctgacgccta ttttgttttg ctgcagctct ttcaatactt cagaattctt ctgttgtttc    37440
cagctctaca tatccgaaat cgtctaaagt ctctcaacag agttactctg gtaataacaa    37500
acaccaattt tgtttgatca gttgatctcg ttggcttttc tatgcactgt ctcaatatag    37560
tttggtcgcc attcaagtct cactacagat gttgaacttg gcctgacacc aaatatttat    37620
aaaatgctac ctgatatttt taatatttca tgtttcctga cccagattat cttgttggtt    37680
cctcgtataa gtttaattag tgacattctt gaagctttgt tatgcagcag atgtcatggg    37740
gggaacttca tttaatgatg gaaagagcaa gaactcgaaa aaaaaaaact tttgtcgaac    37800
cagacacgtc attgttgctt atcttcaaaa tcagaagttt ctcatattac tatatcttct    37860
ggtagtgatg ctggtctgtc acagaaggca ttcaattgtt ctccatttat atcaagcaat    37920
ggggcatcaa gtggttcatt aggcgagagg cacagcaatg gtagtggttt gaagttgaat    37980
ataaaaaagg atcgtggcaa tgcaaatcca attagaggct caactggatg gatttcaata    38040
agagcgcaca gttctgatgg gaactccaga gaaatggcaa aaagactccg tctatcttaa    38100
aatgtaatca ccgacagtgg tggtggtgat gacccttttg catttgaccg ccgcgtcggc    38160
gtcgccacca cgtaatcgcc cacgtcgctg cccccgctgc cacgtcgtcg accgcgcacg    38220
gtaatcacac gcatctcgag gccgccgcta gctgatatct tctcatccgg ttgatttgtg    38280
attttggcgt ttttgcagtg gtgatggcgg ggggcgaccg tggccgaggc gtggagtgcc    38340
atccgcatca gggtgtatcg gccgcgctgc tccgccctgg tccgcaggct ttggcggcga    38400
gctggcggcg gagggagact gtggtgagat cggatttcgc cgctggtggt gtcgctacca    38460
tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct tccctttttt    38520
attttttttt ctcgcaaaat gtgttgtgat gttcgtctcg ctgggcaggc ctcatagcca    38580
ttaatgtagt ttgctggaac atttacattt ggaacgttgt tggcaattgc ttgacaaaat    38640
gtggaattgt ggaggggaga aaaatcattt gaacctgcag tgacaaaatt gccatctcta    38700
attttaaaac tgaaggtgtg gaaatcaaac ataatcattg ccagcgcatc attcttgtta    38760
accaccatga tatattgttg gttataacag ttagctccac accaaccttg aaggtgtcaa    38820
tagaatgttt agtataaatt gaggagaaca ggcagttgtt aagactttct aaagaacttg    38880
tagcagctaa tactagctat tgtgcatttg tgtttcatgg aatttgagca gcaatggata    38940
tttcttacta agatgtatga tgcaaaacaa aaaactatgt ctatacagtt tacatgtaat    39000
gtgcggatgc aaataaaatc atgtacatgg acaaactcat gggattcata ccgaattcca    39060
gaattgcatt tcttatgtgg ttacttttgt tgttgatttg gttaccagac atcgatgtga    39120
tttcaagggt cagaggggtt tgcttctacg cggtggctgc agttgcagca atctttttgt    39180
ttgtcgccat ggttgtggtt catccacttg tgctcctatt tgaccgatac cggaggagag    39240
ttcaggaaaa aaatttgaaa atacccattt tttgaaaaag atttacgttt atatacacta    39300
gtatgaagaa tttgcgaaaa tataactaat ccgcagatcg gttatgcggg agcgcaacaa    39360
aagtatggcg tggcggcgcg gagtggacgg ccgaggcgtt cgcgcggaat ggggctgcgg    39420
gaccgagcca gtctcgcttg ccggtaacgc ggaaccggta cgctcccgca gcgccagtgt    39480
gcggaaccgc ggcgccaaca tttttttact gcatggcact gtgtttaata ctgtttgaca    39540
ctgtttctgg tactgtttta cacagttccc gggtcagttc cgcacaatgg aggcgcggca    39600
ccgaccatga acaatgtgtg aacagtgctg cacagggtta aaacagtgta taaactgcgc    39660
tgcacagtgc tggagtcgct ggccactgcg gttccgcgtt ttggaaccgc gggaccgtcg   39720
cgattccgcg ttttggagct gccggaccat gacggttccg cgcaggatcg tcggtcccgt   39780
attttgaatc tgcggaaccg tcgctgtccc gcgtttccgt ttcgcgggat gcgtatattt   39840
ttataaaacc tctccatgca tgtatataaa cataaattat tgaaaaaata agtatatttg   39900
caaatttttt tcgagagctc agcactacat tgcaaagatt tgggcaactc tgacaatttc   39960
catgttctac aagcttgacg tcgagggaat ggagaacctg ccaccgaata gtagccctgc   40020
tatctatgtt gcgaaccatc agagtttttt ggatatctat acccttctaa ctctaggaag   40080
gtgtttcaag tttataagca agacaagtat atttatgttc cgaattattt gatgggcaat   40140
gtatctctta ggagtaattc ctttgcggcg tatggacagc aggagccagc tggtatggct   40200
gtagtctcat ccctgctttc ttaagtagac atatatgcaa ttacagaatt tggtaaacaa   40260
acaagatttt atgaatcata tatgattttg gggaaaacac caaactctct ttggtggctg   40320
ccttgaacat agttctattc acacagttat agcaccttct ttaaaatgaa gaactttgtt   40380
gcatacacat atggccaaac cacataatga attttgttta tttctatctt tgaatgttag   40440
caccttattt tcatgcatat catgctaatt tgcttgccca cgttgagtgg gaattttttt   40500
ccatgtttta taatttatat atgttctaga cttctagtcc acaatttatc tacttcatgt   40560
tcctgagcct ctagtatggc tggtagcaga ctaggtgctg agtgctgtcc atttttgcag   40620
actgaagaga ggagaaatac aggactgtcc gttgttagtc agatttgtaa aaatagactc   40680
tgatgtagtt tattttagcc cctattttat atttaacaat acaaatatat aacgtatcct   40740
aagaacttat cgtaatttag gagaagttgc tcgtttcatt aaattaaact gtgaagtaaa   40800
aatgtgtgct cgagtctgtc aatgcaatcc tgtgttcttg tttgaagata tggtgtaggg   40860
caggctagga tcgaacactg aatggtaaga ctgcttctgc cttcatttgt gcacttggtg   40920
ctgccacgcc gattaagcag tagaacaaag taattttgtc gtgcacaaat gagttatatt   40980
tcattgaaaa tcgaagtgaa aatgaaccaa aagatagaag aaaaggggaa acttggtaat   41040
tatatactcc acaaatttat tggtaagatt tgatattaga cgctcgatta cttggcttaa   41100
gttaaggata tcaaatttgg ggaagcacca aaggaattat tgtgaaggag ttgtgggtgc   41160
ataacgttat ctactaggtt caaatcctag tgactatgaa tattaatgag taaggtaagg   41220
gatttattgt taattttagt ttctttaaga ttgtgtccgg gtacaccatt cggtaagtgt   41280
aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgatttacct tttcatttgt   41340
ttctgcgttc tgggtatgaa tttgacgaga ttccatggtc agctcaacat atcagttact   41400
gcgtgtcaag cgatcttata tggtatgcgc acaagcgatt gtatacggat atgacagtat   41460
aacgtgtgat attgatacga tgttcctttc ctttataaag gaacaaagac ttttttaaaa   41520
aaaagaaggg gtattactaa aaaccaaaat gtcaaaaaca aaatatcagt gcacatggca   41580
agtgtgcacg agcaatagct tgcccttacg ttcattattt agcatgtact actactaact   41640
acgcaaaaat caattcaccg attattaaac tgttaacatc attttagcac gttaacatat   41700
gtttcattca acacaccggt tttggcacat ttacaaactt gcaaagttgc aatactccct   41760
tcgttacata gcataagaga ttttaggtga atgtgacaca tctatccaaa ttcattatac   41820
tagaatgtat caccgcctcc acgccgggag ggagagcgcc gccggtggag aaagggggag   41880
ggagtggtcg aggggaacca gtagggtgcc ctccccgtcg ccgcctcccc gtggccgcgc   41940
cggcgagaca ggaggaagag ggggatatgg agcggcgccg ccggtgaggg cgcgcgcgcg   42000
ggggggagcg gcgacgccgg tgaggaaggg aaggggagtg gtggctttga gagagatagg   42060
ggggaggaaa aatgatttta gagttagggt ttgggctgct gagtttttat atagatcggg   42120
atcaatcagg accgtccatc agatcggaca actacggctt ctcccgcgtt gggccgggtg   42180
ccactcctag gttgcccaca ctattgggcc acatgtacgc tccgcgtgaa ataagttcac   42240
tttaggtcct ttaagttgcc tctgaattgt tcccaggccg gccgcactat tgggccaccc   42300
cataggccat gtgtacgctc cgcacagaat aatttcgctt tagctccctt aatttgtccc   42360
ctcaaactcc taaaaccagt gcaaatcttt aatttttagt tcacccattg caactcacgg   42420
gcatatttgc tagtgacata taatatgaaa cgaaggatgt agcagactat agaatttaaa   42480
ctgtgctttc attttagagc atcactaact gttatttaga tttttattta aataaatgct   42540
gaaatgatgt ttttattatg aaaattagca ataaagctcc caaaatttca aaaaaaaatt   42600
aaaagagatt tattaatcat ggttaattta attaaaaatt aaatctaacc atatcatatt   42660
atttcacggt ccgtgatgag gaaatggcag ctgctatcac ttacggtggg agagaagggg   42720
cattgtttat ttttataact atctcttata actcccatga aactataaaa taaatataat   42780
cattatcata acattagttt tttttccatt gcaacgcaag ggtaattttt cagtacaata   42840
aaaaaaataa aagtgggcca ttctgaacgg aaatttctgg ttttttttcc caagagcgcc   42900
gcacacaact gcgcaagaga tcgatcgcga tcaccctgct cgtcgccgat ctcctacacc   42960
atccctgcca tctccttccc ctccactggc tgctgctgca cctgtcagct agggcgggca   43020
tggcgcgccg cgccgcttcc cgcgctgctg gcgcccttcg ctcggagggc tcgatccaag   43080
ggcgaggggg ccgcgcgggg ggcagtggcg gtggcgcgga ggacgcacgc cacgtgttcg   43140
acgaattgct ccgtcgtggc ataccagatg tcttctccta caatattctt ctcaacgggc   43200
tgtgtgatga gaacagaagc caagaagctc tcgagttact gcacataatg gctgatgatg   43260
gaggtgactg cccacctgat gtggtgtcgt acagcaccgt catcaatggc ttcttcaagg   43320
agggggatct ggacaaaatg cttgaccaga ggatttcgcc aaatgttgtg acctacaact   43380
ctattattgc tgcgctatgc aaggctcaaa ctgtggacaa ggccatggag gtacttacca   43440
ccatggttaa gagtggtgtc atgcctgatt gcatgacata taatagtatt gtgcatgggt   43500
tttgctcttc agggcagccg aaagaggcta ttgtatttct caaaaagatg cgcagtgatg   43560
gtgtcgaacc agatgttgtt acttataact cgctcatgga ttatctttgc aagaacggaa   43620
gatgcacgga agcaagaaag atttttgatt ctatgaccaa gaggggccta aagcctgata   43680
ttactaccta tggtaccctg cttcaggggt atgctaccaa aggagccctt gttgagatgc   43740
atggtctctt ggatttgatg gtacgaaacg gtatccaccc taatcattat gttttcagca   43800
ttctagtatg tgcatacgct aaacaagaga aagtagaaga ggcaatgctt gtattcagca   43860
aaatgaggca gcaaggattg aatccgaatg cagtgaccta tggaacagtt atagatgtac   43920
tttgcaagtc aggtagagta gaagatgcta tgctttattt tgagcagatg atcgatgaag   43980
gactaagacc tgacagcatt gtttataact ccctaattca tagtctctgt atctttgaca   44040
aatgggagaa ggctgaagag ttatttcttg aaatgttgga tcgaggcatc tgtcttagca   44100
ctattttctt taattcaata attgacagtc attgcaaaga agggagggtt atagaatctg   44160
gaaaactctt tgacttgatg gtacgaattg gtgtgaagcc cgatatcatt acccttggca   44220
ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct   44280
aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac   44340
gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat   44400
aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat   44460
gtcaggatta ccgaaagtgg aatgcagatt gaactttgtt agatttaatt ggataattaa   44520
tccatttaaa tcaattaaat caaataaatt ccaaggctca ttatgctagg aattcatgtg   44580
aattcattct tctatgggat atcaatggga tgaagagttt tgagaattaa tccatttgat   44640
taaggaattg gtaacttata tcaattaatc ctaattgatg gatggttgat ggttgtgtag   44700
tggaggatgg ttcatggcta gttgatgaca attagttgct ctattcctct tcctattcca   44760
ttggtaactt acatcaatta ctcttaattg attgttggtt gatggttgtg tagtggagga   44820
tggttcatgg ctagttgatg acaattagtt gctccattcc tcttcctatt ccatgactct   44880
tactcttcat cttccattcc tcttataaaa tgagaatgga tttgatctcc cgcgagaaga   44940
agaagacaca ctttcatcca ttttcaaaag ctgttgctgc tacggtaatc ccatcccgac   45000
gagtgtgtgc acacgcgttg ggagagtagg cctccgaaac cacgcgttgc tgcgacgttt   45060
gcacagacgg gcgggcgatc aggtttttgg ggagcgcaag gcgcgactac tcactgttcg   45120
tcaacatcta cttcatcttc accaacatgt cgaacactgg agacaaggag aaggagactc   45180
ccgtcaacac caacggaggc aatactgcct caaactccag cggaggacca ttcttggggt   45240
ataaccttat tacattattt caattagaag ttttactgtt aatgttcatc gcaatgtcaa   45300
cattgtgtca ttatgtgatt gttgatgctt attcaacgtt aagcatgctc atgttgatta   45360
cattcaccac tatcactgga tcaaatccta ttgtaaatat catgtttatt atcttgttat   45420
tttggattaa aatatgccga attatgacca aatttccaac aaacttagca catacaacat   45480
aatccttcat ggactttgca aaaacaaact cactgatgat gcacttcgaa tgtttcagaa   45540
cctatgtttg atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt   45600
gcttaaagtt ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg   45660
tttagtgccg aattattgga cgtacagatt gatggctgaa aatattatag gacaggggtt   45720
gctagaagaa ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc   45780
tggcatgcta aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg   45840
cacttacctt tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt   45900
gtttatagat cttttgtctg ggggaaaata tcaagaatat catatatttc tccctgaaaa   45960
atacaagtcc tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt   46020
gttggaattc ttttctccta cagtccgatt agaggaggga tcttctctgt atgtgtaaat   46080
agcgaggtat gtatgtcacc tctccgaatt attttgactg tggttcctgg actgtaaaca   46140
agctattatc ttctggtgtt gatgccagaa aaaacacaaa agtttgtcgt tatctctact   46200
aacggatcat aaaggggttt gtaactggag tttcaaactt aaggtatcta ggcagtaggt   46260
atatattgat cctacatctt atgatcttaa gatgatatcc ttctcattat cctctgctga   46320
aactttagct tgaaccgtca tctacaccac aatttgagcc ccttagcaca gagcacaacg   46380
agcaatagct tgcccttacg ttcattattt agcatgcact actactaact acccaataat   46440
caatacatcg gttattaaac tgtttgtaca gtttaataat gtcattttat cacgttaaca   46500
tatgtttcat tcaacaccac accggttttg gcacagttgc aaacttgcaa taacattttt   46560
actacttctc cgccccataa tataacaatc tcgttccata ctatattgct atattacggg   46620
acggatgaag tacttctttc cttccaaaat ataagaatct agtcctagat tagatattat   46680
ttggattcac gaatttgatt aggctatcta gatttgtagt cgtatgtaat gtctaattcg   46740
gtaataggtt attacctctt tggatggagg gagtagtttt tatttcgtac tccctctgtt   46800
tcatattata agttgttttg acttttttct tagtcaaatt ttattgagtt tgactaaatt   46860
tatagaaaaa aaattagcaa catttaagca ccacattagt ttcattaaat gtagcatgga   46920
atatattttt ataatatgtt tgttttttta ttaaaatgct actatatttt tctataaatg   46980
tagccaaatt taaagaagtt tgattacgaa aaaaaatcaa aatgacatat aatatgaaac   47040
tgaggatgta gcagactata gcaaatttaa actatgcttt tattttagag catcaccaaa   47100
agagatagcc taaatcttat cttaactaat taaaatattc ataattttcc tttcgtcaca   47160
ttaaattttc gtccgtaaat ccgattgaaa tccaactaga caatccaaaa aatagagaaa   47220
aagaacagaa aaaataataa aaagcacaca aatcttatct caatcccgcg ggaagctgcc   47280
gatgccgccg aatccgctcg agcgccgccg ccgccgctca cggggaacga tgtcgctgct   47340
atcgcacgtg gtatgggagg gcgccgccgc cgctgcttgg gagataggat atggagagag   47400
aaggaaatgt gagggagggt taggtttttc cccattcgta tcttcagcga cacggaggcg   47460
atccaagctg tccatcagat cagacggctc agaacgcctc catcttcagg ccgcgcatgc   47520
ttgatgggcc gagggaaggc cggagggtcg aacaaacgta gtcagaggag gagttggagg   47580
aggtaaagta gaatttattt gcgggctgag atagtaaatg gactgaaaat ggcccataga   47640
gaaattggga attttattta aataaatgtt gaaaaggtgt ttatattatc aaaattagaa   47700
attaagctcc gaaaatttta aaaaatattc aaagagcatt attaatcatg attaatttaa   47760
taaaaattaa atccaaccat atcatattat ttcacggcgc gcagtaggaa aatgcgcagc   47820
tgttgtcgct tacggtggga gagaagggac attgtttatt ttcagaacta tcttttataa   47880
ctcccatgga actttaaaat aaatataatc attattatag cattagtttt tttctgtctt   47940
ttttttcccc aagagcgccg cgcagaagag atcgatcgcg atctccctgc cccgacgtcg   48000
ccggccgatc tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg   48060
ccatctcctc cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag   48120
acaaactgcg ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc   48180
gggcatggcg cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat   48240
ccaagggcga ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga   48300
cgaattgctc cggcgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga   48360
cgtcgcgcgt cacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagctgg   48420
cgccgacgag gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg   48480
cgcgggccgc ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag   48540
agtggaagcc atcaccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag   48600
cgacgcaatg gacatagtgc tccgcagaat gaccgagctc ggttgcatac caaatgtctt   48660
ctcctacaat aatcttctca acgggctgtg tgatgagaac agaagccaag aagctctcga   48720
gttgctgcac atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta   48780
taccactgtc atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata   48840
ccatgaaatg ctggaccggg ggattttacc tgatgttgtg acctacagct ctattattgc   48900
tgcgttatgc aagggtcaag ctatggacaa gccatggagg tacttaccac gatggttaag   48960
aatggtgtca tgcctgattg catgacatat aatagttatt tcttgaaatg ttggatcgag   49020
gcatttgtct ggacactatt ttctttaatt caataattga cagtcattgc aaagaaggga   49080
gggttataga atctgaaaaa ctctttgacc tgatggtacg tattggtgtg aagcctgata   49140
tcattacata cagtacactc atcgatggat attgcttggc aggtaagatg gatgaagcaa   49200
tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca   49260
ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg   49320
agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt   49380
tatttcaaac cagaagaact gctgctgcaa aagaactcta tgtcaggatt accgaaagtg   49440
gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac   49500
tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg   49560
ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca   49620
aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt   49680
tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt   49740
caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac   49800
tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc   49860
acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat   49920
atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct   49980
gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat   50040
tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat   50100
tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga   50160
aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt tgtgactgga    50220
gtttcaaact taatgtgtct aggcagtaat tttgacatta gatccaaaac aatttatagg    50280
gtttcattaa atttcatcta tgtgtactgt ttaggtgttg aatagtttga cttgtttttt    50340
aactgaacaa aagatatgtc tgaagctttg ttctttacca aatgcagtac tgatcatcac    50400
aatatatttt ttatggaaca agattggatt gtatagaatg gtttccgatc tgattatctt    50460
atctcaacgt attattatgc acatgtacta atcatgaaat atctgatgga atgatgtttc    50520
tatttacctg tgtgaggcag caaggagtga gatggataac accacatact ccctctatcc    50580
cagaatataa gaagttttag agttggacac gattattaag aaagtaggta gaagtgagta    50640
gtggagggtt gtgattgcat gagtagtgga ggtaggtggg aaaagtgaat ggtggagggt    50700
tgtgattggt tgggaagaga atgttggtag agaagttgtt atattttggg gagtacatta    50760
ttattctaga acaatactgt tgtgctcaag aagcgttcca aagatgtttc acaacctgtg    50820
ctcgatgggt tttgagctta atcctgggac attcagtatc atgatctgtc tcattcttaa    50880
acatggaata aaggatgaca gcatgatttc tttgtctcta taatcttttg gctacccaca    50940
gataatagct gtaaatctat actactttaa aaggagtagt ggtggtggtg agtggtgaat    51000
ctgccaccac cccaccacca actctcaaaa ttctgacatg tgggatcact gtcaatccct    51060
tctccaagac atgtgggatc actgtcaatc ccttctccaa accaattgta tgatagaaca    51120
gtggaaatca cggacagacc atggagctct caaccataat catccttgcg agttaataac    51180
aaatggagcg taaacttggc aagcaaaaaa ctcaaattaa ttctaaaatt aagctctagg    51240
attcaaaata gatttcctct ctgcattgtg ctgttatgat ttttaattcc gtaacaacgc    51300
aaatgcattt tgctagtctt ataaagaagg gttaatgcaa atattctgat taaatgattg    51360
tatctatgaa gtttgaatgc tagtggaagc tcctttgacc atgttttgtt gtgcgagcat    51420
ttaagagagt gaagagaatg cttctttggt gctgttctgg tatggaagga tccacagata    51480
aaattcaggt tctactgctt ctctgcttgt aattttcatg aagctgcagt gaataccttg    51540
ttgaccactt gatctgttgc tttgaaggag aatatagtag tggccaaggt tggtgacggt    51600
gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg    51660
tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc    51720
cgctgcatca aggccaactg ctccgaactg atcaatttct ggtacggatc acttctcctt    51780
tccttttttt tttcacctta agcactctct tgattcttcg ctgctacctc ccttaatttc    51840
tttcaatata ttgtggcact tgatcatggc ggagacccac cttccagtgt gaatggattt    51900
tgtcaaagaa ctaaatttat tccattagct tattttctga ttacatggaa gacattcttt    51960
tctggaataa atacagaact aaatcctgtt tcctgaataa aagttgttag tgtgtggcat    52020
ggtgcatttc cgcgcttcta aattttataa aacctgttca ttcaatttga acctgcatcc    52080
aatccaatat tttaggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat    52140
gcttctgaag aaaggttaat tgttgtttca tctcaggagg taatatgcag atgattattc    52200
caattggcat tgccttgcca tttttatcac gagtctttac aattttatat cctcctacat    52260
attctttcca gattccagat gatccagtgt ctccaacaat tgaggcgctt attttgctcc    52320
atagtaaagc aagtacactt gctgagaacc accagttgac aacacggctt gttgtaccat    52380
caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa atgagaagac    52440
ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac ctgtcttttg    52500
atgaggagct tgtgcaggta atttatttgg ccatacctac accagagatc catatattac    52560
ttttataact gcagttttta cttgttaaca tttcattgtg cttttacatt tgttccaagc    52620
tttcaggttg ctgggcttcc agctattgaa agaggagccc tgacagagat tgcttcgagg    52680
ctttgaacta ggacactcag agatggaagt tcttccaata atccgacacc ttttgcccct    52740
gttgatggtc ctcctgttga tatcttgcct aacaaggaat tcatgctata tggacgatct    52800
gctaatagtc ccccatatgg agggcctgct aatgatccac catatggaag acctgccatt   52860
gatccaccat atggaagacc aatatccaca atatggaaga cctgccaatg atccaccata   52920
tagaagacct gtcaatgata catcatattg agggttggac aatgatgggc ctcgtgatca   52980
ggcccggtcc tgaggggggt cgaatggggc gatcgctccg ggcccccgat tcccagggcc   53040
cccacctatc tgtgcaacga gtagtagcga tcttccagcg cgcaacgtga ggcgatgttt   53100
ctccgtgatt tcgccggcct gcaactgcga gatcgcgagt ataacgatca gccgatcgat   53160
ctcatctgcc gactgccatg ctgatgccac acgcaagcgc agcatatcag ccttatcttg   53220
gttgatcggc atgctggacg agcacatctg ttgtcgcatc aactgctgac tgctatatat   53280
gtgctggtgc tgaatcgatc gattgtcgtc gcggaagtga agaacaacca cggcactgct   53340
gcctgctggg ctctagccgc catcagtaag tacgctatac tgcctatcta gatctagatc   53400
gagattacat agtggaatta tctgtttata acaaaattac aaggtatcaa ttgataattt   53460
aaggttataa ccgtacaaac ttcagtgatt tgctggtttc acattggtta gatttgtttc   53520
aactaatttg gtacttctgt agccttgtaa tttacgaatc tagtattaat attttcttaa   53580
gtattagcct gttccttgat attatgctgt tgagaaagta tgcaatagat aacaaaaaca   53640
agtaggtgtg ttgaggatgc tcaagagtaa tacagccact tcaataattc tgatattatc   53700
aggacatcat caataattct gcgcctacaa atcttcaaag aaaattttaa tataatgcgt   53760
atgatttttt aaatacgaat attgattgct atttaaagat atttatatta tatggtaatt   53820
attatttgaa ggtttataat aaaggcctcc gtttttagtt tcacgctggg ccttcagaat   53880
ctcaggaccg gccctgctca tgatc                                         53905
<210>29
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>29
atcaggagcc ttcaaattgg gaac    24
<210>30
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>30
ctcgcaaatt gcttaatttt gacc    24
<210>31
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>31
tgaaggagtt atgggtgcgt gacg    24
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>32
ttgccgagca cacttgccat gtgc    24
<210>33
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>33
gcgacgcaat ggacatagtg ctcc    24
<210>34
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>34
ttacctgcca agcaatatcc atcg    24
<210>35
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>35
aaggcatact cagtggaggg caag    24
<210>36
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>36
ttaacctgac cgcaagcacc tgtc    24
<210>37
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>37
tggatggact atgtggggtc agtc    24
<210>38
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>38
agtggaagtg gagagagtag ggag    24
<210>39
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>39
ccctccaaca cataaatggt tgag    24
<210>40
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>40
tttctgccag gaaactgtta gatg    24
<210>41
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>41
gcgatcttat acgcatacta tgcg    24
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>42
aaagtctttg ttccttcacc aagg    24
<210>43
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>43
gaggatttat caaaacagga tggacg    26
<210>44
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>44
tgggcggcag cagtggagga taga    24
<210>45
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>45
aagaagggag ggttatagaa tctg    24
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>46
atatcaggac taacaccact gctc    24
<210>47
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>47
acgagtagta gcgatcttcc agcg    24
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>48
cagcgtgaaa ctaaaaacgg aggc    24
<210>49
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>49
atcccacatc atcataatcc gacc    24
<210>50
<211>25
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>50
agcttctccc ttggatacgg tggcg    25
<210>51
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>51
atttgttggt tagttgcggc tgag    24
<210>52
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>52
gcccaaactc aaaaggagag aacc    24
<210>53
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>53
cctcaagtct cccctaaagc cact    24
<210>54
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>54
gctctactgc tgataaaccg tgag    24
<210>55
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>55
tggatggact atgtggggtc agtc    24
<210>56
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>56
agtggaagtg gagagagtag ggag    24
<210>57
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>57
tacgacgcca tttcactcca ttgc    24
<210>58
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>58
catttctcta tgggcgttgc tctg    24
<210>59
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>59
acctgtaggt atggcacctt caacac    26
<210>60
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>60
ccaaggaacg aagttcaaat gtatgg    26
<210>61
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>61
tgatgtgttt gggcatccct ttcg    24
<210>62
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>62
gaga tagggg acgacagaca cgac    24
<210>63
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>63
tcctatggct gtttagaaac tgcaca    26
<210>64
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>64
caagttcaaa cataactggc gttg    24
<210>65
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>65
cactgtcctg taagtgtgct gtgc    24
<210>66
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>66
caagcgtgtg ataaaatgtg acgc    24
<210>67
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>67
tgcctactgc cattactatg tgac    24
<210>68
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>68
acatactacc gtaaatggtc tctg    24
<210>69
<211>4820
<212>DNA
<213>稻
<400>69
atcgatcgcg atctccctgc cccgacgtcg ccggccgatc tctcattctc tccacgccct   60
gctcgtcgcc gatctcctac accatccctg ccatctcctc cttcccctcc cctctatcct  120
ccactggtgc cgcccacctc tccgtataag acaaactgcg ttgcggcgtt ggtttccgcc  180
ggcgctgctg ctgcacctgt cagctagggc gggcatggcg cgccgcgccg cttcccgcgc  240
tgttggcgcc cttcgctcgg acggctcgat ccaagggcga ggaggccgcg cggggggcag  300
tggcgccgag gacgcacgcc acgtgttcga cgaattgctc cgccgtggca ggggcgcctc  360
gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt gacagccccg cggccgccgt  420
gtcccgctac aaccgcatgg cccgagccgg cgccgacgag gtaactcccg acttgtgcac  480
ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc ttggacctcg gtttcgcggc   540
cttgggcaat gtcattaaga agggatttag agtggacgcc atcgccttca ctcctctgct   600
caagggcctc tgtgccgaca agaggacgag cgacgcaatg gacatagtgc tccgcagaat   660
gaccgagctc ggctgcatac caaatgtctt ctcctacaat attcttctca aggggctgtg   720
tgatgagaac agaagccaag aagctctcga gctgctgcac atgatggctg atgatcgagg   780
aggaggtagc ccacctgatg tggtgtcgta taccactgtc atcaatggct tcttcaaaga   840
gggggattca gacaaagctt acagtacata ccatgaaatg ctggaccggg ggattttacc   900
tgatgttgtg acctacaact ctattattgc tgcgttatgc aaggctcaag ctatggacaa   960
agccatggag gtacttaaca ccatggttaa gaatggtgtc atgcctgatt gcatgacata  1020
taatagtatt ctgcatggat attgctcttc agggcagccg aaagaggcta ttggatttct  1080
caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt acttatagct tgctcatgga  1140
ttatctttgc aagaacggaa gatgcatgga agctagaaag attttcgatt ctatgaccaa  1200
gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt atgctaccaa  1260
aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg gtatccaccc  1320
tgatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga aagtagatca  1380
ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccgaatg cagtgacgta  1440
tggagcagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta tgctttattt  1500
tgagcagatg atcgatgaag gactaagccc tggcaacatt gtttataact ccctaattca  1560
tggtttgtgc acctgtaaca aatgggagag ggctgaagag ttaattcttg aaatgttgga  1620
tcgaggcatc tgtctgaaca ctattttctt taattcaata attgacagtc attgcaaaga  1680
agggagggtt atagaatctg aaaaactctt tgagctgatg gtacgtattg gtgtgaagcc  1740
caatgtcatt acctacaata ctcttatcaa tggatattgc ttggcaggta agatggatga  1800
agcaatgaag ttactttctg gcatggtctc agttgggttg aaacctaata ctgttactta  1860
tagcactttg attaatggct actgcaaaat tagtaggatg gaagacgcgt tagttctttt  1920
taaggagatg gagagcagtg gtgttagtcc tgatattatt acgtataaca taattctgca  1980
aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtta ggattaccga  2040
aagtggaacg cagattgaac ttagcacata caacataatc cttcatggac tttgcaaaaa  2100
caaactcact gatgatgcac ttcagatgtt tcagaaccta tgtttgatgg atttgaagct  2160
tgaggctagg actttcaaca ttatgattga tgcattgctt aaagttggca gaaatgatga  2220
agccaaggat ttgtttgttg ctttctcgtc taacggttta gtgccgaatt attggacgta  2280
caggttgatg gctgaaaata ttataggaca ggggttgcta gaagaattgg atcaactctt  2340
tctttcaatg gaggacaatg gctgtactgt tgactctggc atgctaaatt tcattgttag  2400
ggaactgttg cagagaggtg agataaccag ggctggcact tacctttcca tgattgatga  2460
gaagcacttt tccctcgaag catccactgc ttccttgttt atagatcttt tgtctggggg  2520
aaaatatcaa gaatattata ggtttctccc tgaaaaatac aagtccttta tagaatcttt  2580
gagctgctga agcattttgc agctttgaaa ttctgtgttg gaattctttt ctcctacagt  2640
cctattagag gagggatctt ctctgtatgt gtaaatagcg agtttgaatg ctagtggaag  2700
ctcctttgac catgttttgt tgtgcgagca tttaagagag tgaagagaat gcttctttgg  2760
tgctgttctg gtatggaagg atccacagat aaaattcagt agtggccaag gttggtgacg  2820
gtgatggtgg catgtgatcc cccagatctt cagtgaccca gagaggaggg gacggcgcgt  2880
ggtgagctac aaggcatact cagtggaggg caagatcaag gcctcccgtc cgtaggggac  2940
tccgctgcat caaggccaac tgctccgaac tgatcaattt ctggtgcaga caggtgcttg  3000
cggtcaggtt aaagaagttg gcaaaaatgc ttctgaagaa aggttaattg ttgtttcatc  3060
tcaggagatt ccagatgatc cagtgtctcc aacaattgag gcgcttattt tgctccatag  3120
taaagtaagt acacttgctg agaaccacca gttgacaaca cggcttgttg taccatcaaa    3180
caaagttggt tgtattcttg gggaaggtgg aaaggtaatt actgaaatga gaagacggac    3240
tggggctgaa atccgagtct actcaaaagc agataaacct aagtacctgt cttttgatga    3300
ggagcttgtg caggttgctg ggcttccagc tattgaaaga ggagccctga cagagattgc    3360
ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc cgacaccttt    3420
tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca tgctatatgg    3480
acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat atggaagacc    3540
tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct gccaatgatc    3600
caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat gatgggcctc    3660
gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc cccccgattc    3720
ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg caacgtgagg    3780
cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat aacgatcagc    3840
cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag catatcagcc    3900
ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa ctgctgactg    3960
ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag aacaaccacg    4020
gcactgctgc ctgctgggct ctagccgcca tcagctgcgg agctgatcca tggacgtgag    4080
gattaccgaa gactgtcagg tctcactggg tatccaggtg gctctgtcga attgtggatt    4140
ccaaatagtt aactggagtc tgtcattggt gttggtggtg tcaatctagc tgagatccgt    4200
ctggtatagc gtaagagaaa catcatgcac tatccccagt cataaccatg ccccaatggc    4260
caccaatagt tttcctcgtg aaaatctccc cttgatccca gatctctggt gcgagagtga    4320
agttgcacga agcccatcct ggttcttccg agtccattgt ggagatccag ggcattccgg    4380
atcaagtgaa agccgcacag agccttctgc aaggcttcat cggcgcaagc agcaacagca    4440
ggcaggcgcc ccagtcctct cgcatggccc attattttta gtaagctgga ggacattcgc    4500
aacagggggg tcagtggtca ctgcaaagct gagtttgttc ttcagttcaa ctgcagaaaa    4560
ttgcagatcg gttgccgtag ttgctagaac ggtacatagt tgccacctaa ctgtagcgag    4620
tggcataact tattgtgtgt tactgcccaa tgttgtctct ccttgtgttc atggattcag    4680
acttgtgatt gtagtatttc tggatcagac tggagtaaaa gaaaaaaaaa aaggaagaca    4740
tgggtttaac agtaagctca aaacgttgac agtagtaaaa taaaaggggt ttgttcactt    4800
taaaaaaaaa aaaaaaaaaa                                                4820
<210>70
<211>4821
<212>DNA
<213>稻
<400>70
cgatcgcgat ctccctgccc cgacgtcgcc ggccgatctc tcattctctc cacgccctgc   60
tcgtcgccga tctcctacac catccctgcc atctcctcct tcccctcccc tctatcctcc  120
actggtgccg cccacctctc cgtataagac aaactgcgtt gcggcgttgg tttccgccgg  180
cgctgctgct gcacctgtca gctagggcgg gcatggcgcg ccgcgccgct tcccgcgctg  240
ttggcgccct tcgctcggac ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg  300
gcgccgagga cgcacgccac gtgttcgacg aattgctccg ccgtggcagg ggcgcctcga  360
tctacggctt gaaccgcgcc ctcgccgacg tcgcgcgtga cagccccgcg gccgccgtgt  420
cccgctacaa ccgcatggcc cgagccggcg ccgacgaggt aactcccgac ttgtgcacct  480
acggcattct catcggttgc tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct  540
tgggcaatgt cattaagaag ggatttagag tggacgccat cgccttcact cctctgctca   600
agggcctctg tgccgacaag aggacgagcg acgcaatgga catagtgctc cgcagaatga   660
ccgagctcgg ctgcatacca aatgtcttct cctacaatat tcttctcaag gggctgtgtg   720
atgagaacag aagccaagaa gctctcgagc tgctgcacat gatggctgat gatcgaggag   780
gaggtagccc acctgatgtg gtgtcgtata ccactgtcat caatggcttc ttcaaagagg   840
gggattcaga caaagcttac agtacatacc atgaaatgct ggaccggggg attttacctg   900
atgttgtgac ctacaactct attattgctg cgttatgcaa ggctcaagct atggacaaag   960
ccatggaggt acttaacacc atggttaaga atggtgtcat gcctgattgc atgacatata  1020
atagtattct gcatggatat tgctcttcag ggcagccgaa agaggctatt ggatttctca  1080
aaaagatgcg cagtgatggt gtcgaaccag atgttgttac ttatagcttg ctcatggatt  1140
atctttgcaa gaacggaaga tgcatggaag ctagaaagat tttcgattct atgaccaaga  1200
ggggcctaaa gcctgaaatt actacctatg gtaccctgct tcaggggtat gctaccaaag  1260
gagcccttgt tgagatgcat ggtctcttgg atttgatggt acgaaacggt atccaccctg  1320
atcattatgt tttcagcatt ctaatatgtg catacgctaa acaagggaaa gtagatcagg  1380
caatgcttgt gttcagcaaa atgaggcagc aaggattgaa tccgaatgca gtgacgtatg  1440
gagcagttat aggcatactt tgcaagtcag gcagagtaga agatgctatg ctttattttg  1500
agcagatgat cgatgaagga ctaagccctg gcaacattgt ttataactcc ctaattcatg  1560
gtttgtgcac ctgtaacaaa tgggagaggg ctgaagagtt aattcttgaa atgttggatc  1620
gaggcatctg tctgaacact attttcttta attcaataat tgacagtcat tgcaaagaag  1680
ggagggttat agaatctgaa aaactctttg agctgatggt acgtattggt gtgaagccca  1740
atgtcattac ctacaatact cttatcaatg gatattgctt ggcaggtaag atggatgaag  1800
caatgaagtt actttctggc atggtctcag ttgggttgaa acctaatact gttacttata  1860
gcactttgat taatggctac tgcaaaatta gtaggatgga agacgcgtta gttcttttta  1920
aggagatgga gagcagtggt gttagtcctg atattattac gtataacata attctgcaag  1980
gtttatttca aaccagaaga actgctgctg caaaagaact ctatgttagg attaccgaaa  2040
gtggaacgca gattgaactt agcacataca acataatcct tcatggactt tgcaaaaaca  2100
aactcactga tgatgcactt cagatgtttc agaacctatg tttgatggat ttgaagcttg  2160
aggctaggac tttcaacatt atgattgatg cattgcttaa agttggcaga aatgatgaag  2220
ccaaggattt gtttgttgct ttctcgtcta acggtttagt gccgaattat tggacgtaca  2280
ggttgatggc tgaaaatatt ataggacagg ggttgctaga agaattggat caactctttc  2340
tttcaatgga ggacaatggc tgtactgttg actctggcat gctaaatttc attgttaggg  2400
aactgttgca gagaggtgag ataaccaggg ctggcactta cctttccatg attgatgaga  2460
agcacttttc cctcgaagca tccactgctt ccttgtttat agatcttttg tctgggggaa  2520
aatatcaaga atattatagg tttctccctg aaaaatacaa gtcctttata gaatctttga  2580
gctgctgaag cattttgcag ctttgaaatt ctgtgttgga attcttttct cctacagtcc  2640
tattagagga gggatcttct ctgtatgtgt aaatagcgag tttgaatgct agtggaagct  2700
cctttgacca tgttttgttg tgcgagcatt taagagagtg aagagaatgc ttctttggtg  2760
ctgttctggt atggaaggat ccacagataa aattcagtag tggccaaggt tggtgacggt  2820
gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg  2880
tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc  2940
cgctgcatca aggccaactg ctccgaactg atcaatttct ggtgcagaca ggtgcttgcg  3000
gtcaggttaa agaagttggc aaaaatgctt ctgaagaaag gttaattgtt gtttcatctc  3060
aggagattcc agatgatcca gtgtctccaa caattgaggc gcttattttg ctccatagta  3120
aagtaagtac acttgctgag aaccaccagt tgacaacacg gcttgttgta ccatcaaaca  3180
aagttggttg tattcttggg gaaggtggaa aggtaattac tgaaatgaga agacggactg  3240
gggctgaaat ccgagtctac tcaaaagcag ataaacctaa gtacctgtct tttgatgagg  3300
agcttgtgca ggttgctggg cttccagcta ttgaaagagg agccctgaca gagattgctt  3360
cgaggctttg aactaggaca ctcagagatg gaagttcttc caataatccg acaccttttg  3420
cccctgttga tggtcctcct gttgatatct tgcctaacaa ggaattcatg ctatatggac  3480
gatctgctaa tagtccccca tatggagggc ctgctaatga tccaccatat ggaagacctg  3540
ccattgatcc accatatgga agaccaatat ccacaatatg gaagacctgc caatgatcca  3600
ccatatagaa gacctgtcaa tgatacatca tattgagggt tgaacaatga tgggcctcgt  3660
gatcaggccc ggtcctgagg ggggtcgaat ggggcgatcg ctccgggccc cccgattccc  3720
agggccccca cctatctgtg caacgagtag tagcgatctt ccagcgcgca acgtgaggcg  3780
atgtttctcc gtgatttcgc cggcctgcaa ctgcgagatc gcgagtataa cgatcagccg  3840
atcgatctca tctgccgact gccatgctga tgccacacgc aagcgcagca tatcagcctt  3900
atcttggttg atcggcatgc tggacgagca catctgttgt cgcatcaact gctgactgct  3960
atatatgtgc tggtgctgaa tcgatcgatt gtcgtcacgg aagtgaagaa caaccacggc  4020
actgctgcct gctgggctct agccgccatc agctgcggag ctgatccatg gacgtgagga  4080
ttaccgaaga ctgtcaggtc tcactgggta tccaggtggc tctgtcgaat tgtggattcc  4140
aaatagttaa ctggagtctg tcattggtgt tggtggtgtc aatctagctg agatccgtct  4200
ggtatagcgt aagagaaaca tcatgcacta tccccagtca taaccatgcc ccaatggcca  4260
ccaatagttt tcctcgtgaa aatctcccct tgatcccaga tctctggtgc gagagtgaag  4320
ttgcacgaag cccatcctgg ttcttccgag tccattgtgg agatccaggg cattccggat  4380
caagtgaaag ccgcacagag ccttctgcaa ggcttcatcg gcgcaagcag caacagcagg  4440
caggcgcccc agtcctctcg catggcccat tatttttagt aagctggagg acattcgcaa  4500
caggggggtc agtggtcact gcaaagctga gtttgttctt cagttcaact gcagaaaatt  4560
gcagatcggt tgccgtagtt gctagaacgg tacatagttg ccacctaact gtagcgagtg  4620
gcataactta ttgtgtgtta ctgcccaatg ttgtctctcc ttgtgttcat ggattcagac  4680
ttgtgattgt agtatttctg gatcagactg gagtaaaaga aaaaaaaaaa ggaagacatg  4740
ggtttaacag taagctcaaa acgttgacag tagtaaaata aaaggggttt gttcacttta  4800
aaaaaaaaaa  aaaaaaaaaa  a                                          4821
<210>71
<211>5005
<212>DNA
<213>稻
<400>71
gagatcgatc gcgatctccc tgccccgacg tcgccggccg atctctcatt ctctccacgc   60
cctgctcgtc gccgatctcc tacaccatcc ctgccatctc ctccttcccc tcccctctat  120
cctccactgg tgccgcccac ctctccgtat aagacaaact gcgttgcggc gttggtttcc  180
gccggcgctg ctgctgcacc tgtcagctag ggcgggcatg gcgcgccgcg ccgcttcccg  240
cgctgttggc gcccttcgct cggacggctc gatccaaggg cgaggaggcc gcgcgggggg  300
cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccgccgtg gcaggggcgc  360
ctcgatctac ggcttgaacc gcgccctcgc cgacgtcgcg cgtgacagcc ccgcggccgc  420
cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc ccgacttgtg  480
cacctacggc attctcatcg gttgctgctg ccgcgcgggc cgcttggacc tcggtttcgc  540
ggccttgggc aatgtcatta agaagggatt tagagtggac gccatcgcct tcactcctct  600
gctcaagggc ctctgtgccg acaagaggac gagcgacgca atggacatag tgctccgcag    660
aatgaccgag ctcggctgca taccaaatgt cttctcctac aatattcttc tcaaggggct    720
gtgtgatgag aacagaagcc aagaagctct cgagctgctg cacatgatgg ctgatgatcg    780
aggaggaggt agcccacctg atgtggtgtc gtataccact gtcatcaatg gcttcttcaa    840
agagggggat tcagacaaag cttacagtac ataccatgaa atgctggacc gggggatttt    900
acctgatgtt gtgacctaca actctattat tgctgcgtta tgcaaggctc aagctatgga    960
caaagccatg gaggtactta acaccatggt taagaatggt gtcatgcctg attgcatgac   1020
atataatagt attctgcatg gatattgctc ttcagggcag ccgaaagagg ctattggatt   1080
tctcaaaaag atgcgcagtg atggtgtcga accagatgtt gttacttata gcttgctcat   1140
ggattatctt tgcaagaacg gaagatgcat ggaagctaga aagattttcg attctatgac   1200
caagaggggc ctaaagcctg aaattactac ctatggtacc ctgcttcagg ggtatgctac   1260
caaaggagcc cttgttgaga tgcatggtct cttggatttg atggtacgaa acggtatcca   1320
ccctgatcat tatgttttca gcattctaat atgtgcatac gctaaacaag ggaaagtaga   1380
tcaggcaatg cttgtgttca gcaaaatgag gcagcaagga ttgaatccga atgcagtgac   1440
gtatggagca gttataggca tactttgcaa gtcaggcaga gtagaagatg ctatgcttta   1500
ttttgagcag atgatcgatg aaggactaag ccctggcaac attgtttata actccctaat   1560
tcatggtttg tgcacctgta acaaatggga gagggctgaa gagttaattc ttgaaatgtt   1620
ggatcgaggc atctgtctga acactatttt ctttaattca ataattgaca gtcattgcaa   1680
agaagggagg gttatagaat ctgaaaaact ctttgagctg atggtacgta ttggtgtgaa   1740
gcccaatgtc attacctaca atactcttat caatggatat tgcttggcag gtaagatgga   1800
tgaagcaatg aagttacttt ctggcatggt ctcagttggg ttgaaaccta atactgttac   1860
ttatagcact ttgattaatg gctactgcaa aattagtagg atggaagacg cgttagttct   1920
ttttaaggag atggagagca gtggtgttag tcctgatatt attacgtata acataattct   1980
gcaaggttta tttcaaacca gaagaactgc tgctgcaaaa gaactctatg ttaggattac   2040
cgaaagtgga acgcagattg aacttagcac atacaacata atccttcatg gactttgcaa   2100
aaacaaactc actgatgatg cacttcagat gtttcagaac ctatgtttga tggatttgaa   2160
gcttgaggct aggactttca acattatgat tgatgcattg cttaaagttg gcagaaatga   2220
tgaagccaag gatttgtttg ttgctttctc gtctaacggt ttagtgccga attattggac   2280
gtacaggttg atggctgaaa atattatagg acaggggttg ctagaagaat tggatcaact   2340
ctttctttca atggaggaca atggctgtac tgttgactct ggcatgctaa atttcattgt   2400
tagggaactg ttgcagagag gtgagataac cagggctggc acttaccttt ccatgattga   2460
tgagaagcac ttttccctcg aagcatccac tgcttccttg tttatagatc ttttgtctgg   2520
gggaaaatat caagaatatt ataggtttct ccctgaaaaa tacaagtcct ttatagaatc   2580
tttgagctgc tgaagcattt tgcagctttg aaattctgtg ttggaattct tttctcctac   2640
agtcctatta gaggagggat cttctctgta tgtgtaaata gcgagtttga atgctagtgg   2700
aagctccttt gaccatgttt tgttgtgcga gcatttaaga gagtgaagag aatgcttctt   2760
tggtgctgtt ctggtatgga aggatccaca gataaaattc aggagaatat agtagtggcc   2820
aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac ccagagagga   2880
ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc aaggcctccc   2940
gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa tttctggtgc   3000
agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa gaaaggttaa   3060
ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt gaggcgctta   3120
ttttgctcca tagtaaagta agtacacttg ctgagaacca ccagttgaca acacggcttg   3180
ttgtaccatc aaacaaagtt ggttgtattc ttggggaagg tggaaaggta attactgaaa   3240
tgagaagacg gactggggct gaaatccgag tctactcaaa agcagataaa cctaagtacc  3300
tgtcttttga tgaggagctt gtgcaggttg ctgggcttcc agctattgaa agaggagccc  3360
tgacagagat tgcttcgagg ctttgaacta ggacactcag agatggaagt tcttccaata  3420
atccgacacc ttttgcccct gttgatggtc ctcctgttga tatcttgcct aacaaggaat  3480
tcatgctata tggacgatct gctaatagtc ccccatatgg agggcctgct aatgatccac  3540
catatggaag acctgccatt gatccaccat atggaagacc aatatccaca atatggaaga  3600
cctgccaatg atccaccata tagaagacct gtcaatgata catcatattg agggttgaac  3660
aatgatgggc ctcgtgatca ggcccggtcc tgaggggggt cgaatggggc gatcgctccg  3720
ggccccccga ttcccagggc ccccacctat ctgtgcaacg agtagtagcg atct tccagc 3780
gcgcaacgtg aggcgatgtt tctccgtgat ttcgccggcc tgcaactgcg agatcgcgag  3840
tataacgatc agccgatcga tctcatctgc cgactgccat gctgatgcca cacgcaagcg  3900
cagcatatca gccttatctt ggttgatcgg catgctggac gagcacatct gttgtcgcat  3960
caactgctga ctgctatata tgtgctggtg ctgaatcgat cgattgtcgt cacggaagtg  4020
aagaacaacc acggcactgc tgcctgctgg gctctagccg ccatcagctg cggagctgat  4080
ccatggacgt gaggattacc gaagactgtc aggtctcact gggtatccag gtggctctgt  4140
cgaattgtgg attccaaata gttaactgga gtctgtcatt ggtgttggtg gtgtcaatct  4200
agctgagatc cgtctggtat agcgtaagag aaacatcatg cactatcccc agtcataacc  4260
atgccccaat ggccaccaat agttttcctc gtgaaaatct ccccttgatc ccagatctct  4320
ggtgcgagag tgaagttgca cgaagcccat cctggttctt ccgagtccat tgtggagatc  4380
cagggcattc cggatcaagt gaaagccgca cagagccttc tgcaaggctt catcggcgca  4440
agcagcaaca gcaggcaggc gccccagtcc tctcgcatgg cccattattt ttagtaagct  4500
ggaggacatt cgcaacaggg gggtcagtgg tcactgcaaa gctgagtttg ttcttcagtt  4560
caactgcaga aaattgcaga tcggttgccg tagttgctag aacggtacat agttgccacc  4620
taactgtagc gagtggcata acttattgtg tgttactgcc caatgttgtc tctccttgtg  4680
ttcatggatt cagacttgtg attgtagtat ttctggatca gactggagta aaagaaaaaa  4740
aaaaaggaag acatgggttt aacagtaagc tcaaaacgtt gacagtagta aaataaaagg  4800
ggtttgttca ctttatttcc aatatcaacc ttaccaacat ttggcgttga atcatttata  4860
ccacatcgct tgtgcagctg aatttggggc tgtttaaaag atggtctctt ggattgctaa  4920
ttgcctcgcg gcaagcgtgg taccttgtac aatataaata taattataac tatttaattt  4980
cataaaaaaa aaaaaaaaaa aaaaa                                        5005
<210>72
<211>4978
<212>DNA
<213>稻
<400>72
gcgatctccc tgccccgacg tcgccggccg atctctcatt ctctccacgc cctgctcgtc   60
gccgatctcc tacaccatcc ctgccatctc ctccttcccc tcccctctat cctccactgg  120
tgccgcccac ctctccgtat aagacaaact gcgttgcggc gttggtttcc gccggcgctg  180
ctgctgcacc tgtcagctag ggcgggcatg gcgcgccgcg ccgcttcccg cgctgttggc  240
gcccttcgct cggacggctc gatccaaggg cgaggaggcc gcgcgggggg cagtggcgcc  300
gaggacgcac gccacgtgtt cgacgaattg ctccgccgtg gcaggggcgc ctcgatctac  360
ggcttgaacc gcgccctcgc cgacgtcgcg cgtgacagcc ccgcggccgc cgtgtcccgc  420
tacaaccgca tggcccgagc cggcgccgac gaggtaactc ccgacttgtg cacctacggc  480
attctcatcg gttgctgctg ccgcgcgggc cgcttggacc tcggtttcgc ggccttgggc   540
aatgtcatta agaagggatt tagagtggac gccatcgcct tcactcctct gctcaagggc   600
ctctgtgccg acaagaggac gagcgacgca atggacatag tgctccgcag aatgaccgag   660
ctcggctgca taccaaatgt cttctcctac aatattcttc tcaaggggct gtgtgatgag   720
aacagaagcc aagaagctct cgagctgctg cacatgatgg ctgatgatcg aggaggaggt   780
agcccacctg atgtggtgtc gtataccact gtcatcaatg gcttcttcaa agagggggat   840
tcagacaaag cttacagtac ataccatgaa atgctggacc gggggatttt acctgatgtt   900
gtgacctaca actctattat tgctgcgtta tgcaaggctc aagctatgga caaagccatg   960
gaggtactta acaccatggt taagaatggt gtcatgcctg attgcatgac atataatagt  1020
attctgcatg gatattgctc ttcagggcag ccgaaagagg ctattggatt tctcaaaaag  1080
atgcgcagtg atggtgtcga accagatgtt gttacttata gcttgctcat ggattatctt  1140
tgcaagaacg gaagatgcat ggaagctaga aagattttcg attctatgac caagaggggc  1200
ctaaagcctg aaattactac ctatggtacc ctgcttcagg ggtatgctac caaaggagcc  1260
cttgttgaga tgcatggtct cttggatttg atggtacgaa acggtatcca ccctgatcat  1320
tatgttttca gcattctaat atgtgcatac gctaaacaag ggaaagtaga tcaggcaatg  1380
cttgtgttca gcaaaatgag gcagcaagga ttgaatccga atgcagtgac gtatggagca  1440
gttataggca tactttgcaa gtcaggcaga gtagaagatg ctatgcttta ttttgagcag  1500
atgatcgatg aaggactaag ccctggcaac attgtttata actccctaat tcatggtttg  1560
tgcacctgta acaaatggga gagggctgaa gagttaattc ttgaaatgtt ggatcgaggc  1620
atctgtctga acactatttt ctttaattca ataattgaca gtcattgcaa agaagggagg  1680
gttatagaat ctgaaaaact ctttgagctg atggtacgta ttggtgtgaa gcccaatgtc  1740
attacctaca atactcttat caatggatat tgcttggcag gtaagatgga tgaagcaatg  1800
aagttacttt ctggcatggt ctcagttggg ttgaaaccta atactgttac ttatagcact  1860
ttgattaatg gctactgcaa aattagtagg atggaagacg cgttagttct ttttaaggag  1920
atggagagca gtggtgttag tcctgatatt attacgtata acataattct gcaaggttta  1980
tttcaaacca gaagaactgc tgctgcaaaa gaactctatg ttaggattac cgaaagtgga  2040
acgcagattg aacttagcac atacaacata atccttcatg gactttgcaa aaacaaactc  2100
actgatgatg cacttcagat gtttcagaac ctatgtttga tggatttgaa gcttgaggct  2160
aggactttca acattatgat tgatgcattg cttaaagttg gcagaaatga tgaagccaag  2220
gatttgtttg ttgctttctc gtctaacggt ttagtgccga attattggac gtacaggttg  2280
atggctgaaa atattatagg acaggggttg ctagaagaat tggatcaact ctttctttca  2340
atggaggaca atggctgtac tgttgactct ggcatgctaa atttcattgt tagggaactg  2400
ttgcagagag gtgagataac cagggctggc acttaccttt ccatgattga tgagaagcac  2460
ttttccctcg aagcatccac tgcttccttg tttatagatc ttttgtctgg gggaaaatat  2520
caagaatatt ataggtttct ccctgaaaaa tacaagtcct ttatagaatc tttgagctgc  2580
tgaagcattt tgcagctttg aaattctgtg ttggaattct tttctcctac agtcctatta  2640
gaggagggat cttctctgta tgtgtaaata gcgagtttga atgctagtgg aagctccttt  2700
gaccatgttt tgttgtgcga gcatttaaga gagtgaagag aatgcttctt tggtgctgtt  2760
ctggtatgga aggatccaca gataaaattc aggttctact gcttctctgc ttgtaatttt  2820
catgaagctg cagtgaatac cttgttgacc acttgatctg ttgctttgaa ggagaatata  2880
gtagtggcca aggttggtga cggtgatggt ggcatgtgat cccccagatc ttcagtgacc  2940
cagagaggag gggacggcgc gtggtgagct acaaggcata ctcagtggag ggcaagatca  3000
aggcctcccg tccgtagggg actccgctgc atcaaggcca actgctccga actgatcaat  3060
ttctggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat gcttctgaag  3120
aaaggttaat tgttgtttca tctcaggaga ttccagatga tccagtgtct ccaacaattg    3180
aggcgcttat tttgctccat agtaaagtaa gtacacttgc tgagaaccac cagttgacaa    3240
cacggcttgt tgtaccatca aacaaagttg gttgtattct tggggaaggt ggaaaggtaa    3300
ttactgaaat gagaagacgg actggggctg aaatccgagt ctactcaaaa gcagataaac    3360
ctaagtacct gtcttttgat gaggagcttg tgcaggttgc tgggcttcca gctattgaaa    3420
gaggagccct gacagagatt gcttcgaggc tttgaactag gacactcaga gatggaagtt    3480
cttccaataa tccgacacct tttgcccctg ttgatggtcc tcctgttgat atcttgccta    3540
acaaggaatt catgctatat ggacgatctg ctaatagtcc cccatatgga gggcctgcta    3600
atgatccacc atatggaaga cctgccattg atccaccata tggaagacca atatccacaa    3660
tatggaagac ctgccaatga tccaccatat agaagacctg tcaatgatac atcatattga    3720
gggttgaaca atgatgggcc tcgtgatcag gcccggtcct gaggggggtc gaatggggcg    3780
atcgctccgg gccccccgat tcccagggcc cccacctatc tgtgcaacga gtagtagcga    3840
tcttccagcg cgcaacgtga ggcgatgttt ctccgtgatt tcgccggcct gcaactgcga    3900
gatcgcgagt ataacgatca gccgatcgat ctcatctgcc gactgccatg ctgatgccac    3960
acgcaagcgc agcatatcag ccttatcttg gttgatcggc atgctggacg agcacatctg    4020
ttgtcgcatc aactgctgac tgctatatat gtgctggtgc tgaatcgatc gattgtcgtc    4080
acggaagtga agaacaacca cggcactgct gcctgctggg ctctagccgc catcagtaag    4140
ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc actgggtatc    4200
caggtggctc tgtcgaattg tggattccaa atagttaact ggagtctgtc attggtgttg    4260
gtggtgtcaa tctagctgag atccgtctgg tatagcgtaa gagaaacatc atgcactatc    4320
cccagtcata accatgcccc aatggccacc aatagttttc ctcgtgaaaa tctccccttg    4380
atcccagatc tctggtgcga gagtgaagtt gcacgaagcc catcctggtt cttccgagtc    4440
cattgtggag atccagggca ttccggatca agtgaaagcc gcacagagcc ttctgcaagg    4500
cttcatcggc gcaagcagca acagcaggca ggcgccccag tcctctcgca tggcccatta    4560
tttttagtaa gctggaggac attcgcaaca ggggggtcag tggtcactgc aaagctgagt    4620
ttgttcttca gttcaactgc agaaaattgc agatcggttg ccgtagttgc tagaacggta    4680
catagttgcc acctaactgt agcgagtggc ataacttatt gtgtgttact gcccaatgtt    4740
gtctctcctt gtgttcatgg attcagactt gtgattgtag tatttctgga tcagactgga    4800
gtaaaagaaa aaaaaaaagg aagacatggg tttaacagta agctcaaaac gttgacagta    4860
gtaaaataaa aggggtttgt tcactttaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    4920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa  aaaaaaaaaa  aaaaaaaa    4978
<210>73
<211>4722
<212>DNA
<213>稻
<400>73
cgccgatctc ctacaccatc cctgccatct cctccttccc ctcccctcta tcctccactg    60
gtgccgccca cctctccgta taagacaaac tgcgttgcgg cgttggtttc cgccggcgct   120
gctgctgcac ctgtcagcta gggcgggcat ggcgcgccgc gccgcttccc gcgctgttgg   180
cgcccttcgc tcggacggct cgatccaagg gcgaggaggc cgcgcggggg gcagtggcgc   240
cgaggacgca cgccacgtgt tcgacgaatt gctccgccgt ggcaggggcg cctcgatcta   300
cggcttgaac cgcgccctcg ccgacgtcgc gcgtgacagc cccgcggccg ccgtgtcccg   360
ctacaaccgc atggcccgag ccggcgccga cgaggtaact cccgacttgt gcacctacgg   420
cattctcatc ggttgctgct gccgcgcggg ccgcttggac ctcggtttcg cggccttggg    480
caatgtcatt aagaagggat ttagagtgga cgccatcgcc ttcactcctc tgctcaaggg    540
cctctgtgcc gacaagagga cgagcgacgc aatggacata gtgctccgca gaatgaccga    600
gctcggctgc ataccaaatg tcttctccta caatattctt ctcaaggggc tgtgtgatga    660
gaacagaagc caagaagctc tcgagctgct gcacatgatg gctgatgatc gaggaggagg    720
tagcccacct gatgtggtgt cgtataccac tgtcatcaat ggcttcttca aagaggggga    780
ttcagacaaa gcttacagta cataccatga aatgctggac cgggggattt tacctgatgt    840
tgtgacctac aactctatta ttgctgcgtt atgcaaggct caagctatgg acaaagccat    900
ggaggtactt aacaccatgg ttaagaatgg tgtcatgcct gattgcatga catataatag    960
tattctgcat ggatattgct cttcagggca gccgaaagag gctattggat ttctcaaaaa   1020
gatgcgcagt gatggtgtcg aaccagatgt tgttacttat agcttgctca tggattatct   1080
ttgcaagaac ggaagatgca tggaagctag aaagattttc gattctatga ccaagagggg   1140
cctaaagcct gaaattacta cctatggtac cctgcttcag gggtatgcta ccaaaggagc   1200
ccttgttgag atgcatggtc tcttggattt gatggtacga aacggtatcc accctgatca   1260
ttatgttttc agcattctaa tatgtgcata cgctaaacaa gggaaagtag atcaggcaat   1320
gcttgtgttc agcaaaatga ggcagcaagg attgaatccg aatgcagtga cgtatggagc   1380
agttataggc atactttgca agtcaggcag agtagaagat gctatgcttt attttgagca   1440
gatgatcgat gaaggactaa gccctggcaa cattgtttat aactccctaa ttcatggttt   1500
gtgcacctgt aacaaatggg agagggctga agagttaatt cttgaaatgt tggatcgagg   1560
catctgtctg aacactattt tctttaattc aataattgac agtcattgca aagaagggag   1620
ggttatagaa tctgaaaaac tctttgagct gatggtacgt attggtgtga agcccaatgt   1680
cattacctac aatactctta tcaatggata ttgcttggca ggtaagatgg atgaagcaat   1740
gaagttactt tctggcatgg tctcagttgg gttgaaacct aatactgtta cttatagcac   1800
tttgattaat ggctactgca aaattagtag gatggaagac gcgttagttc tttttaagga   1860
gatggagagc agtggtgtta gtcctgatat tattacgtat aacataattc tgcaaggttt   1920
atttcaaacc agaagaactg ctgctgcaaa agaactctat gttaggatta ccgaaagtgg   1980
aacgcagatt gaacttagca catacaacat aatccttcat ggactttgca aaaacaaact   2040
cactgatgat gcacttcaga tgtttcagaa cctatgtttg atggatttga agcttgaggc   2100
taggactttc aacattatga ttgatgcatt gcttaaagtt ggcagaaatg atgaagccaa   2160
ggatttgttt gttgctttct cgtctaacgg tttagtgccg aattattgga cgtacaggtt   2220
gatggctgaa aatattatag gacaggggtt gctagaagaa ttggatcaac tctttctttc   2280
aatggaggac aatggctgta ctgttgactc tggcatgcta aatttcattg ttagggaact   2340
gttgcagaga ggtgagataa ccagggctgg cacttacctt tccatgattg atgagaagca   2400
cttttccctc gaagcatcca ctgcttcctt gtttatagat cttttgtctg ggggaaaata   2460
tcaagaatat tataggtttc tccctgaaaa atacaagtcc tttatagaat ctttgagctg   2520
ctgaagcatt ttgcagcttt gaaattctgt gttggaattc ttttctccta cagtcctatt   2580
agaggaggga tcttctctgt atgtgtaaat agcgagtttg aatgctagtg gaagctcctt   2640
tgaccatgtt ttgttgtgcg agcatttaag agagtgaaga gaatgcttct ttggtgctgt   2700
tctggtatgg aaggatccac agataaaatt caggttctac tgcttctctg cttgtaattt   2760
tcatgaagct gcagtgaata ccttgttgac cacttgatct gttgctttga aggagaatat   2820
agtagtggcc aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac   2880
ccagagagga ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc   2940
aaggcctccc gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa   3000
tttctggtgc agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa    3060
gaaaggttaa ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt    3120
gaggcgctta ttttgctcca tagtaaagtg gaaaggtaat tactgaaatg agaagacgga    3180
ctggggctga aatccgagtc tactcaaaag cagataaacc taagtacctg tcttttgatg    3240
aggagcttgt gcaggttgct gggcttccag ctattgaaag aggagccctg acagagattg    3300
cttcgaggct ttgaactagg acactcagag atggaagttc ttccaataat ccgacacctt    3360
ttgcccctgt tgatggtcct cctgttgata tcttgcctaa caaggaattc atgctatatg    3420
gacgatctgc taatagtccc ccatatggag ggcctgctaa tgatccacca tatggaagac    3480
ctgccattga tccaccatat ggaagaccaa tatccacaat atggaagacc tgccaatgat    3540
ccaccatata gaagacctgt caatgataca tcatattgag ggttgaacaa tgatgggcct    3600
cgtgatcagg cccggtcctg aggggggtcg aatggggcga tcgctccggg ccccccgatt    3660
cccagggccc ccacctatct gtgcaacgag tagtagcgat cttccagcgc gcaacgtgag    3720
gcgatgtttc tccgtgattt cgccggcctg caactgcgag atcgcgagta taacgatcag    3780
ccgatcgatc tcatctgccg actgccatgc tgatgccaca cgcaagcgca gcatatcagc    3840
cttatcttgg ttgatcggca tgctggacga gcacatctgt tgtcgcatca actgctgact    3900
gctatatatg tgctggtgct gaatcgatcg attgtcgtca cggaagtgaa gaacaaccac    3960
ggcactgctg cctgctgggc tctagccgcc atcagctgcg gagctgatcc atggacgtga    4020
ggattaccga agactgtcag gtctcactgg gtatccaggt ggctctgtcg aattgtggat    4080
tccaaatagt taactggagt ctgtcattgg tgttggtggt gtcaatctag ctgagatccg    4140
tctggtatag cgtaagagaa acatcatgca ctatccccag tcataaccat gccccaatgg    4200
ccaccaatag ttttcctcgt gaaaatctcc ccttgatccc agatctctgg tgcgagagtg    4260
aagttgcacg aagcccatcc tggttcttcc gagtccattg tggagatcca gggcattccg    4320
gatcaagtga aagccgcaca gagccttctg caaggcttca tcggcgcaag cagcaacagc    4380
aggcaggcgc cccagtcctc tcgcatggcc cattattttt agtaagctgg aggacattcg    4440
caacaggggg gtcagtggtc actgcaaagc tgagtttgtt cttcagttca actgcagaaa    4500
attgcagatc ggttgccgta gttgctagaa cggtacatag ttgccaccta actgtagcga    4560
gtggcataac ttattgtgtg ttactgccca atgttgtctc tccttgtgtt catggattca    4620
gacttgtgat tgtagtattt ctggatcaga ctggagtaaa agaaaaaaaa aaaggaagac    4680
atgggtttaa cagtaaaaaa aaaaaaaaaa aaaaaaaaaa aa                       4722
<210>74
<211>6164
<212>DNA
<213>稻
<400>74
cgcagaagag atcgatcgcg atctccctgc cccgacgtcg ccggccgatc tctcattctc    60
tccacgccct gctcgtcgcc gatctcctac accatccctg ccatctcctc cttcccctcc   120
cctctatcct ccactggtgc cgcccacctc tccgtataag acaaactgcg ttgcggcgtt   180
ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc gggcatggcg cgccgcgccg   240
cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat ccaagggcga ggaggccgcg   300
cggggggcag tggcgccgag gacgcacgcc acgtgttcga cgaattgctc cgccgtggca   360
ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt gacagccccg   420
cggccgccgt gtcccgctac aaccgcatgg cccgagccgg cgccgacgag gtaactcccg   480
acttgtgcac ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc ttggacctcg    540
gtttcgcggc cttgggcaat gtcattaaga agggatttag agtggacgcc atcgccttca    600
ctcctctgct caagggcctc tgtgccgaca agaggacgag cgacgcaatg gacatagtgc    660
tccgcagaat gaccgagctc ggctgcatac caaatgtctt ctcctacaat attcttctca    720
aggggctgtg tgatgagaac agaagccaag aagctctcga gctgctgcac atgatggctg    780
atgatcgagg aggaggtagc ccacctgatg tggtgtcgta taccactgtc atcaatggct    840
tcttcaaaga gggggattca gacaaagctt acagtacata ccatgaaatg ctggaccggg    900
ggattttacc tgatgttgtg acctacaact ctattattgc tgcgttatgc aaggctcaag    960
ctatggacaa agccatggag gtacttaaca ccatggttaa gaatggtgtc atgcctgatt   1020
gcatgacata taatagtatt ctgcatggat attgctcttc agggcagccg aaagaggcta   1080
ttggatttct caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt acttatagct   1140
tgctcatgga ttatctttgc aagaacggaa gatgcatgga agctagaaag attttcgatt   1200
ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt   1260
atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg   1320
gtatccaccc tgatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga   1380
aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccgaatg   1440
cagtgacgta tggagcagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta   1500
tgctttattt tgagcagatg atcgatgaag gactaagccc tggcaacatt gtttataact   1560
ccctaattca tggtttgtgc acctgtaaca aatgggagag ggctgaagag ttaattcttg   1620
aaatgttgga tcgaggcatc tgtctgaaca ctattttctt taattcaata attgacagtc   1680
attgcaaaga agggagggtt atagaatctg aaaaactctt tgagctgatg gtacgtattg   1740
gtgtgaagcc caatgtcatt acctacaata ctcttatcaa tggatattgc ttggcaggta   1800
agatggatga agcaatgaag ttactttctg gcatggtctc agttgggttg aaacctaata   1860
ctgttactta tagcactttg attaatggct actgcaaaat tagtaggatg gaagacgcgt   1920
tagttctttt taaggagatg gagagcagtg gtgttagtcc tgatattatt acgtataaca   1980
taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtta   2040
ggattaccga aagtggaacg cagattgaac ttagcacata caacataatc cttcatggac   2100
tttgcaaaaa caaactcact gatgatgcac ttcagatgtt tcagaaccta tgtttgatgg   2160
atttgaagct tgaggctagg actttcaaca ttatgattga tgcattgctt aaagttggca   2220
gaaatgatga agccaaggat ttgtttgttg ctttctcgtc taacggttta gtgccgaatt   2280
attggacgta caggttgatg gctgaaaata ttataggaca ggggttgcta gaagaattgg   2340
atcaactctt tctttcaatg gaggacaatg gctgtactgt tgactctggc atgctaaatt   2400
tcattgttag ggaactgttg cagagaggtg agataaccag ggctggcact tacctttcca   2460
tgattgatga gaagcacttt tccctcgaag catccactgc ttccttgttt atagatcttt   2520
tgtctggggg aaaatatcaa gaatattata ggtttctccc tgaaaaatac aagtccttta   2580
tagaatcttt gagctgctga agcattttgc agctttgaaa ttctgtgttg gaattctttt   2640
ctcctacagt cctattagag gagggatctt ctctgtatgt gtaaatagcg aggtatgtat   2700
gccacctctc cgaattattt ttactgtggt tcctagactg taaacaagca attatgttat   2760
gctgttgatg ccagaaaaaa cataaaagtt tgtcgttatc tctactaacg gatcataaag   2820
ggatttgtga ctggagtttc aaacttaatg tgtctaggca gtaattttga cattagatcc   2880
aaaacaattt atagggtttc attaaatttc atctatgtgt actgtttagg tgttgaatag   2940
tttgacttgt tttttaactg aacaaaagat atgtctgaag ctttgttctt taccaaatgc   3000
agtactgatc atcacaatat attttttatg gaacaagatt ggattgtata gaatggtttc   3060
tgatctgatt atcttatctc aacgtattat tatgcacatg tactaatcat gaaatatctg   3120
atggaatgat gtttctattt acctgtgtga ggcagcaagg agtgagatgg ataacaccac    3180
atactccctc tgtcccagaa tataagaagt tttagagttg gacacgatta ttaagaaagt    3240
aggtagaagt gagtagtgga gggttgtgat tgcatgagta gtggaggtag gtgggaaaag    3300
tgaatggtgg agggttgtga ttggttggga agagaatgtt ggtagagaag ttgttatatt    3360
ttggggagta cattattatt ctagaacaat actgttgtgc tcaagaagcg ttccaaagat    3420
gtttcacaac ctgtgctcga tgggttttga gcttaatcct gggacattca gtatcatgat    3480
ctgtctcatt cttaaacatg gaataaagga tgacagcatg atttctttgt ctctataatc    3540
ttttggctac ccacagataa tagctgtaaa tctatactac tttaaaagga gtagtggtgg    3600
tggtgagtgg tgaatctgcc accaccccac caccaactct caaaattctg acatgtggga    3660
tcactgtcaa tcccttctcc aagacatgtg ggatcactgt caatcccttc tccaaaccaa    3720
ttgtatgata gaacagtgga aatcacggac agaccatgga gctctcaacc ataatcatcc    3780
ttgcgagtta ataacaaatg gagcgtaaac ttggcaagca aaaaactcaa attaattcta    3840
aaattaagct ctaggattca aaatagattt cctctctgca ttgtgctgtt atgattttta    3900
attccgtaac aacgcaaatg cattttgcta gtcttataaa gaagggttaa tgcaaatatt    3960
ctgattaaat gattgtatct atgaagtttg aatgctagtg gaagctcctt tgaccatgtt    4020
ttgttgtgcg agcatttaag agagtgaaga gaatgcttct ttggtgctgt tctggtatgg    4080
aaggatccac agataaaatt caggttctac tgcttctctg cttgtaattt tcatgaagct    4140
gcagtgaata ccttgttgac cacttgatct gttgctttga aggagaatat agtagtggcc    4200
aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac ccagagagga    4260
ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc aaggcctccc    4320
gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa tttctggtgc    4380
agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa gaaaggttaa    4440
ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt gaggcgctta    4500
ttttgctcca tagtaaagta agtacacttg ctgagaacca ccagttgaca acacggcttg    4560
ttgtaccatc aaacaaagtt ggttgtattc ttggggaagg tggaaaggta attactgaaa    4620
tgagaagacg gactggggct gaaatccgag tctactcaaa agcagataaa cctaagtacc    4680
tgtcttttga tgaggagctt gtgcaggttg ctgggcttcc agctattgaa agaggagccc    4740
tgacagagat tgcttcgagg ctttgaacta ggacactcag agatggaagt tcttccaata    4800
atccgacacc ttttgcccct gttgatggtc ctcctgttga tatcttgcct aacaaggaat    4860
tcatgctata tggacgatct gctaatagtc ccccatatgg agggcctgct aatgatccac    4920
catatggaag acctgccatt gatccaccat atggaagacc aatatccaca atatggaaga    4980
cctgccaatg atccaccata tagaagacct gtcaatgata catcatattg agggttgaac    5040
aatgatgggc ctcgtgatca ggcccggtcc tgaggggggt cgaatggggc gatcgctccg    5100
ggccccccga ttcccagggc ccccacctat ctgtgcaacg agtagtagcg atcttccagc    5160
gcgcaacgtg aggcgatgtt tctccgtgat ttcgccggcc tgcaactgcg agatcgcgag    5220
tataacgatc agccgatcga tctcatctgc cgactgccat gctgatgcca cacgcaagcg    5280
cagcatatca gccttatctt ggttgatcgg catgctggac gagcacatct gttgtcgcat    5340
caactgctga ctgctatata tgtgctggtg ctgaatcgat cgattgtcgt cacggaagtg    5400
aagaacaacc acggcactgc tgcctgctgg gctctagccg ccatcagctg cggagctgat    5460
ccatggacgt gaggattacc gaagactgtc aggtctcact gggtatccag gtggctctgt    5520
cgaattgtgg attccaaata gttaactgga gtctgtcatt ggtgttggtg gtgtcaatct    5580
agctgagatc cgtctggtat agcgtaagag aaacatcatg cactatcccc agtcataacc    5640
atgccccaat ggccaccaat agttttcctc gtgaaaatct ccccttgatc ccagatctct    5700
ggtgcgagag tgaagttgca cgaagcccat cctggttctt ccgagtccat tgtggagatc    5760
cagggcattc cggatcaagt gaaagccgca cagagccttc tgcaaggctt catcggcgca   5820
agcagcaaca gcaggcaggc gccccagtcc tctcgcatgg cccattattt ttagtaagct   5880
ggaggacatt cgcaacaggg gggtcagtgg tcactgcaaa gctgagtttg ttcttcagtt   5940
caactgcaga aaattgcaga tcggttgccg tagttgctag aacggtacat agttgccacc   6000
taactgtagc gagtggcata acttattgtg tgttactgcc caatgttgtc tctccttgtg   6060
ttcatggatt cagacttgtg attgtagtat ttctggatca gactggagta aaagaaaaaa   6120
aaaaaggaag acatgggttt aacagtaaaa aaaaaaaaaa aaaa                    6164
<210>75
<211>791
<212>PRT
<213>稻
<400>75
Met Ala Arg Arg Ala Ala Ser Arg Ala Val Gly Ala Leu Arg Ser
1                 5                  10                  15
Asp Gly Ser Ile Gln Gly Arg Gly Gly Arg Ala Gly Gly Ser Gly
                 20                  25                  30
Ala Glu Asp Ala Arg His Val Phe Asp Glu Leu Leu Arg Arg Gly
                 35                  40                  45
Arg Gly Ala Ser Ile Tyr Gly Leu Asn Arg Ala Leu Ala Asp Val
                 50                  55                  60
Ala Arg Asp Ser Pro Ala Ala Ala Val Ser Arg Tyr Asn Arg Met
                 65                  70                  75
Ala Arg Ala Gly Ala Asp Glu Val Thr Pro Asp Leu Cys Thr Tyr
                 80                  85                  90
Gly Ile Leu Ile Gly Cys Cys Cys Arg Ala Gly Arg Leu Asp Leu
                 95                 100                 105
Gly Phe Ala Ala Leu Gly Asn Val Ile Lys Lys Gly Phe Arg Val
                110                 115                 120
Asp Ala Ile Ala Phe Thr Pro Leu Leu Lys Gly Leu Cys Ala Asp
                125                 130                 135
Lys Arg Thr Ser Asp Ala Met Asp Ile Val Leu Arg Arg Met Thr
                140                 145                 150
Glu Leu Gly Cys Ile Pro Asn Val Phe Ser Tyr Asn Ile Leu Leu
                155                 160                 165
Lys Gly Leu Cys Asp Glu Asn Arg Ser Gln Glu Ala Leu Glu Leu
                170                 175                 180
Leu His Met Met Ala Asp Asp Arg Gly Gly Gly Ser Pro Pro Asp
                185                 190                 195
Val Val Ser Tyr Thr Thr Val Ile Asn Gly Phe Phe Lys Glu Gly
                200                 205                 210
Asp Ser Asp Lys Ala Tyr Ser Thr Tyr His Glu Met Leu Asp Arg
                215                 220                 225
Gly Ile Leu Pro Asp Val Val Thr Tyr Asn Ser Ile Ile Ala Ala
                230                 235                 240
Leu Cys Lys Ala Gln Ala Met Asp Lys Ala Met Glu Val Leu Asn
                245                 250                 255
Thr Met Val Lys Asn Gly Val Met Pro Asp Cys Met Thr Tyr Asn
                260                 265                 270
Ser Ile Leu His Gly Tyr Cys Ser Ser Gly Gln Pro Lys Glu Ala
                275                 280                 285
Ile Gly Phe Leu Lys Lys Met Arg Ser Asp Gly Val Glu Pro Asp
                290                 295                 300
Val Val Thr Tyr Ser Leu Leu Met Asp Tyr Leu Cys Lys Asn Gly
                305                 310                 315
Arg Cys Met Glu Ala Arg Lys Ile Phe Asp Ser Met Thr Lys Arg
                320                 325                 330
Gly Leu Lys Pro Glu Ile Thr Thr Tyr Gly Thr Leu Leu Gln Gly
                335                 340                 345
Tyr Ala Thr Lys Gly Ala Leu Val Glu Met His Gly Leu Leu Asp
                350                 355                 360
Leu Met Val Arg Asn Gly Ile His Pro Asp His Tyr Val Phe Ser
                365                 370                 375
Ile Leu Ile Cys Ala Tyr Ala Lys Gln Gly Lys Val Asp Gln Ala
                380                 385                 390
Met Leu Val Phe Ser Lys Met Arg Gln Gln Gly Leu Asn Pro Asn
                395                 400                 405
Ala Val Thr Tyr Gly Ala Val Ile Gly Ile Leu Cys Lys Ser Gly
                410                 415                 420
Arg Val Glu Asp Ala Met Leu Tyr Phe Glu Gln Met Ile Asp Glu
                425                 430                 435
Gly Leu Ser Pro Gly Asn Ile Val Tyr Asn Ser Leu Ile His Gly
                440                 445                 450
Leu Cys Thr Cys Asn Lys Trp Glu Arg Ala Glu Glu Leu Ile Leu
                455                 460                 465
Glu Met Leu Asp Arg Gly Ile Cys Leu Asn Thr Ile Phe Phe Asn
                470                 475                 480
Ser Ile Ile Asp Ser His Cys Lys Glu Gly Arg Val Ile Glu Ser
                485                 490                 495
Glu Lys Leu Phe Glu Leu Met Val Arg Ile Gly Val Lys Pro Asn
                500                 505                 510
Val Ile Thr Tyr Asn Thr Leu Ile Asn Gly Tyr Cys Leu Ala Gly
                515                 520                 525
Lys Met Asp Glu Ala Met Lys Leu Leu Ser Gly Met Val Ser Val
                530                 535                 540
Gly Leu Lys Pro Asn Thr Val Thr Tyr Ser Thr Leu Ile Asn Gly
                545                 550                 555
Tyr Cys Lys Ile Ser Arg Met Glu Asp Ala Leu Val Leu Phe Lys
                560                 565                 570
Glu Met Glu Ser Ser Gly Val Ser Pro Asp Ile Ile Thr Tyr Asn
                575                 580                 585
Ile Ile Leu Gln Gly Leu Phe Gln Thr Arg Arg Thr Ala Ala Ala
                590                 595                 600
Lys Glu Leu Tyr Val Arg Ile Thr Glu Ser Gly Thr Gln Ile Glu
                605                 610                 615
Leu Ser Thr Tyr Asn Ile Ile Leu His Gly Leu Cys Lys Asn Lys
                620                 625                 630
Leu Thr Asp Asp Ala Leu Gln Met Phe Gln Asn Leu Cys Leu Met
                635                 640                 645
Asp Leu Lys Leu Glu Ala Arg Thr Phe Asn Ile Met Ile Asp Ala
                650                 655                 660
Leu Leu Lys Val Gly Arg Asn Asp Glu Ala Lys Asp Leu Phe Val
                665                 670                 675
Ala Phe Ser Ser Asn Gly Leu Val Pro Asn Tyr Trp Thr Tyr Arg
                680                 685                 690
Leu Met Ala Glu Asn Ile Ile Gly Gln Gly Leu Leu Glu Glu Leu
                695                 700                 705
Asp Gln Leu Phe Leu Ser Met Glu Asp Asn Gly Cys Thr Val Asp
                710                 715                 720
Ser Gly Met Leu Asn Phe Ile Val Arg Glu Leu Leu Gln Arg Gly
                725                 730                 735
Glu Ile Thr Arg Ala Gly Thr Tyr Leu Ser Met Ile Asp Glu Lys
                740                 745                 750
His Phe Ser Leu Glu Ala Ser Thr Ala Ser Leu Phe Ile Asp Leu
                755                 760                 765
Leu Ser Gly Gly Lys Tyr Gln Glu Tyr Tyr Arg Phe Leu Pro Glu
                770                 775                 780
Lys Tyr Lys Ser Phe Ile Glu Ser Leu Ser Cys
                785                 790 791
<210>76
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>76
tctcattctc tccacgccct gctc    24
<210>77
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>77
acggcggagc aattcgtcga acac    24
<210>78
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>78
agtgtgtggc atggtgcatt tccg    24
<210>79
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>79
ctctacagga tacacggtgt aagg    24
<210>80
<211>4746
<212>DNA
<213>稻
<400>80
gccgcgcaga agagatcgat cgcgatctcc ctgccccgac gtcgccggcc gatctctcat    60
tctctccacg ccctgctcgt cgccgatctc ctacaccatc cctgccatct cctccttccc   120
ctcccctcta tcctccactg gtgccgccca cctctccgta taagacaaac tgcgttgcgg   180
cgttggtttc cgccggcgct gctgctgcac ctgtcagcta gggcgggcat ggcgcgccgc   240
gccgcttccc gcgctgttgg cgcccttcgc tcggacggct cgatccaagg gcgaggaggc   300
cgcgcggggg gcagtggcgc cgaggacgca cgccacgtgt tcgacgaatt gctccgccgt   360
ggcaggggcg cctcgatcta cggcttgaac cgcgccctcg ccgacgtcgc gcgtgacagc   420
cccgcggccg ccgtgtcccg ctacaaccgc atggcccgag ccggcgccga cgaggtaact   480
cccgacttgt gcacctacgg cattctcatc ggttgctgct gccgcgcggg ccgcttggac   540
ctcggtttcg cggccttggg caatgtcatt aagaagggat ttagagtgga cgccatcgcc   600
ttcactcctc tgctcaaggg cctctgtgcc gacaagagga cgagcgacgc aatggacata   660
gtgctccgca gaatgaccga gctcggctgc ataccaaatg tcttctccta caatattctt   720
ctcaaggggc tgtgtgatga gaacagaagc caagaagctc tcgagctgct gcacatgatg   780
gctgatgatc gaggaggagg tagcccacct gatgtggtgt cgtataccac tgtcatcaat   840
ggcttcttca aagaggggga ttcagacaaa gcttacagta cataccatga aatgctggac    900
cgggggattt tacctgatgt tgtgacctac aactctatta ttgctgcgtt atgcaaggct    960
caagctatgg acaaagccat ggaggtactt aacaccatgg ttaagaatgg tgtcatgcct   1020
gattgcatga catataatag tattctgcat ggatattgct cttcagggca gccgaaagag   1080
gctattggat ttctcaaaaa gatgcgcagt gatggtgtcg aaccagatgt tgttacttat   1140
agcttgctca tggattatct ttgcaagaac ggaagatgca tggaagctag aaagattttc   1200
gattctatga ccaagagggg cctaaagcct gaaattacta cctatggtac cctgcttcag   1260
gggtatgcta ccaaaggagc ccttgttgag atgcatggtc tcttggattt gatggtacga   1320
aacggtatcc accctgatca ttatgttttc agcattctaa tatgtgcata cgctaaacaa   1380
gggaaagtag atcaggcaat gcttgtgttc agcaaaatga ggcagcaagg attgaatccg   1440
aatgcagtga cgtatggagc agttataggc atactttgca agtcaggcag agtagaagat   1500
gctatgcttt attttgagca gatgatcgat gaaggactaa gccctggcaa cattgtttat   1560
aactccctaa ttcatggttt gtgcacctgt aacaaatggg agagggctga agagttaatt   1620
cttgaaatgt tggatcgagg catctgtctg aacactattt tctttaattc aataattgac   1680
agtcattgca aagaagggag ggttatagaa tctgaaaaac tctttgagct gatggtacgt   1740
attggtgtga agcccaatgt cattacctac aatactctta tcaatggata ttgcttggca   1800
ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct   1860
aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac   1920
gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat   1980
aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat   2040
gttaggatta ccgaaagtgg aacgcagatt gaacttagca catacaacat aatccttcat   2100
ggactttgca aaaacaaact cactgatgat gcacttcaga tgtttcagaa cctatgtttg   2160
atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt gcttaaagtt   2220
ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg tttagtgccg   2280
aattattgga cgtacaggtt gatggctgaa aatattatag gacaggggtt gctagaagaa   2340
ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc tggcatgcta   2400
aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg cacttacctt   2460
tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt gtttatagat   2520
cttttgtctg ggggaaaata tcaagaatat tataggtttc tccctgaaaa atacaagtcc   2580
tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt gttggaattc   2640
ttttctccta cagtcctatt agaggaggga tcttctctgt atgtgtaaat agcgagtttg   2700
aatgctagtg gaagctcctt tgaccatgtt ttgttgtgcg agcatttaag agagtgaaga   2760
gaatgcttct ttggtgctgt tctggtatgg aaggatccac agataaaatt cagtagtggc   2820
caaggttggt gacggtgatg gtggcatgtg atcccccaga tcttcagtga cccagagagg   2880
aggggacggc gcgtggtgag ctacaaggca tactcagtgg agggcaagat caaggcctcc   2940
cgtccgtagg ggactccgct gcatcaaggc caactgctcc gaactgatca atttctggtg   3000
cagacaggtg cttgcggtca ggttaaagaa gttggcaaaa atgcttctga agaaaggtta   3060
attgttgttt catctcagga gattccagat gatccagtgt ctccaacaat tgaggcgctt   3120
attttgctcc atagtaaagt aagtacactt gctgagaacc accagttgac aacacggctt   3180
gttgtaccat caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa   3240
atgagaagac ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac   3300
ctgtcttttg atgaggagct tgtgcaggtt gctgggcttc cagctattga aagaggagcc   3360
ctgacagaga ttgcttcgag gctttgaact aggacactca gagatggaag ttcttccaat   3420
aatccgacac cttttgcccc tgttgatggt cctcctgttg atatcttgcc taacaaggaa   3480
ttcatgctat atggacgatc tgctaatagt cccccatatg gagggcctgc taatgatcca  3540
ccatatggaa gacctgccat tgatccacca tatggaagac caatatccac aatatggaag  3600
acctgccaat gatccaccat atagaagacc tgtcaatgat acatcatatt gagggttgaa  3660
caatgatggg cctcgtgatc aggcccggtc ctgagggggg tcgaatgggg cgatcgctcc  3720
gggccccccg attcccaggg cccccaccta tctgtgcaac gagtagtagc gatcttccag  3780
cgcgcaacgt gaggcgatgt ttctccgtga tttcgccggc ctgcaactgc gagatcgcga  3840
gtataacgat cagccgatcg atctcatctg ccgactgcca tgctgatgcc acacgcaagc  3900
gcagcatatc agccttatct tggttgatcg gcatgctgga cgagcacatc tgttgtcgca  3960
tcaactgctg actgctatat atgtgctggt gctgaatcga tcgattgtcg tcacggaagt  4020
gaagaacaac cacggcactg ctgcctgctg ggctctagcc gccatcagct gcggagctga  4080
tccatggacg tgaggattac cgaagactgt caggtctcac tgggtatcca ggtggctctg  4140
tcgaattgtg gattccaaat agttaactgg agtctgtcat tggtgttggt ggtgtcaatc  4200
tagctgagat ccgtctggta tagcgtaaga gaaacatcat gcactatccc cagtcataac  4260
catgccccaa tggccaccaa tagttttcct cgtgaaaatc tccccttgat cccagatctc  4320
tggtgcgaga gtgaagttgc acgaagccca tcctggttct tccgagtcca ttgtggagat  4380
ccagggcatt ccggatcaag tgaaagccgc acagagcctt ctgcaaggct tcatcggcgc  4440
aagcagcaac agcaggcagg cgccccagtc ctctcgcatg gcccattatt tttagtaagc  4500
tggaggacat tcgcaacagg ggggtcagtg gtcactgcaa agctgagttt gttcttcagt  4560
tcaactgcag aaaattgcag atcggttgcc gtagttgcta gaacggtaca tagttgccac  4620
ctaactgtag cgagtggcat aacttattgt gtgttactgc ccaatgttgt ctctccttgt  4680
gttcatggat tcagacttgt gattgtagta tttctggatc agactggagt aaaagaaaaa  4740
aaaaaa                                                             4746
<210>81
<211>4779
<212>DNA
<213>稻
<400>81
tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg ccatctcctc   60
cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag acaaactgcg  120
ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc gggcatggcg  180
cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat ccaagggcga  240
ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga cgaattgctc  300
cgccgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt  360
gacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagccgg cgccgacgag  420
gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc  480
ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag agtggacgcc  540
atcgccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag cgacgcaatg  600
gacatagtgc tccgcagaat gaccgagctc ggctgcatac caaatgtctt ctcctacaat  660
attcttctca aggggctgtg tgatgagaac agaagccaag aagctctcga gctgctgcac  720
atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta taccactgtc  780
atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata ccatgaaatg  840
ctggaccggg ggattttacc tgatgttgtg acctacaact ctattattgc tgcgttatgc  900
aaggctcaag ctatggacaa agccatggag gtacttaaca ccatggttaa gaatggtgtc  960
atgcctgatt gcatgacata taatagtatt ctgcatggat attgctcttc agggcagccg  1020
aaagaggcta ttggatttct caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt  1080
acttatagct tgctcatgga ttatctttgc aagaacggaa gatgcatgga agctagaaag  1140
attttcgatt ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg  1200
cttcaggggt atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg  1260
gtacgaaacg gtatccaccc tgatcattat gttttcagca ttctaatatg tgcatacgct  1320
aaacaaggga aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg  1380
aatccgaatg cagtgacgta tggagcagtt ataggcatac tttgcaagtc aggcagagta  1440
gaagatgcta tgctttattt tgagcagatg atcgatgaag gactaagccc tggcaacatt  1500
gtttataact ccctaattca tggtttgtgc acctgtaaca aatgggagag ggctgaagag  1560
ttaattcttg aaatgttgga tcgaggcatc tgtctgaaca ctattttctt taattcaata  1620
attgacagtc attgcaaaga agggagggtt atagaatctg aaaaactctt tgagctgatg  1680
gtacgtattg gtgtgaagcc caatgtcatt acctacaata ctcttatcaa tggatattgc  1740
ttggcaggta agatggatga agcaatgaag ttactttctg gcatggtctc agttgggttg  1800
aaacctaata ctgttactta tagcactttg attaatggct actgcaaaat tagtaggatg  1860
gaagacgcgt tagttctttt taaggagatg gagagcagtg gtgttagtcc tgatattatt  1920
acgtataaca taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa  1980
ctctatgtta ggattaccga aagtggaacg cagattgaac ttagcacata caacataatc  2040
cttcatggac tttgcaaaaa caaactcact gatgatgcac ttcagatgtt tcagaaccta  2100
tgtttgatgg atttgaagct tgaggctagg actttcaaca ttatgattga tgcattgctt  2160
aaagttggca gaaatgatga agccaaggat ttgtttgttg ctttctcgtc taacggttta  2220
gtgccgaatt attggacgta caggttgatg gctgaaaata ttataggaca ggggttgcta  2280
gaagaattgg atcaactctt tctttcaatg gaggacaatg gctgtactgt tgactctggc  2340
atgctaaatt tcattgttag ggaactgttg cagagaggtg agataaccag ggctggcact  2400
tacctttcca tgattgatga gaagcacttt tccctcgaag catccactgc ttccttgttt  2460
atagatcttt tgtctggggg aaaatatcaa gaatattata ggtttctccc tgaaaaatac  2520
aagtccttta tagaatcttt gagctgctga agcattttgc agctttgaaa ttctgtgttg  2580
gaattctttt ctcctacagt cctattagag gagggatctt ctctgtatgt gtaaatagcg  2640
agtttgaatg ctagtggaag ctcctttgac catgttttgt tgtgcgagca tttaagagag  2700
tgaagagaat gcttctttgg tgctgttctg gtatggaagg atccacagat aaaattcagg  2760
agaatatagt agtggccaag gttggtgacg gtgatggtgg catgtgatcc cccagatctt  2820
cagtgaccca gagaggaggg gacggcgcgt ggtgagctac aaggcatact cagtggaggg  2880
caagatcaag gcctcccgtc cgtaggggac tccgctgcat caaggccaac tgctccgaac  2940
tgatcaattt ctggtgcaga caggtgcttg cggtcaggtt aaagaagttg gcaaaaatgc  3000
ttctgaagaa aggttaattg ttgtttcatc tcaggagatt ccagatgatc cagtgtctcc  3060
aacaattgag gcgcttattt tgctccatag taaagtaagt acacttgctg agaaccacca  3120
gttgacaaca cggcttgttg taccatcaaa caaagttggt tgtattcttg gggaaggtgg  3180
aaaggtaatt actgaaatga gaagacggac tggggctgaa atccgagtct actcaaaagc  3240
agataaacct aagtacctgt cttttgatga ggagcttgtg caggttgctg ggcttccagc  3300
tattgaaaga ggagccctga cagagattgc ttcgaggctt tgaactagga cactcagaga  3360
tggaagttct tccaataatc cgacaccttt tgcccctgtt gatggtcctc ctgttgatat  3420
cttgcctaac aaggaattca tgctatatgg acgatctgct aatagtcccc catatggagg  3480
gcctgctaat gatccaccat atggaagacc tgccattgat ccaccatatg gaagaccaat  3540
atccacaata tggaagacct gccaatgatc caccatatag aagacctgtc aatgatacat  3600
catattgagg gttgaacaat gatgggcctc gtgatcaggc ccggtcctga ggggggtcga    3660
atggggcgat cgctccgggc cccccgattc ccagggcccc cacctatctg tgcaacgagt    3720
agtagcgatc ttccagcgcg caacgtgagg cgatgtttct ccgtgatttc gccggcctgc    3780
aactgcgaga tcgcgagtat aacgatcagc cgatcgatct catctgccga ctgccatgct    3840
gatgccacac gcaagcgcag catatcagcc ttatcttggt tgatcggcat gctggacgag    3900
cacatctgtt gtcgcatcaa ctgctgactg ctatatatgt gctggtgctg aatcgatcga    3960
ttgtcgtcac ggaagtgaag aacaaccacg gcactgctgc ctgctgggct ctagccgcca    4020
tcagctgcgg agctgatcca tggacgtgag gattaccgaa gactgtcagg tctcactggg    4080
tatccaggtg gctctgtcga attgtggatt ccaaatagtt aactggagtc tgtcattggt    4140
gttggtggtg tcaatctagc tgagatccgt ctggtatagc gtaagagaaa catcatgcac    4200
tatccccagt cataaccatg ccccaatggc caccaatagt tttcctcgtg aaaatctccc    4260
cttgatccca gatctctggt gcgagagtga agttgcacga agcccatcct ggttcttccg    4320
agtccattgt ggagatccag ggcattccgg atcaagtgaa agccgcacag agccttctgc    4380
aaggcttcat cggcgcaagc agcaacagca ggcaggcgcc ccagtcctct cgcatggccc    4440
attattttta gtaagctgga ggacattcgc aacagggggg tcagtggtca ctgcaaagct    4500
gagtttgttc ttcagttcaa ctgcagaaaa ttgcagatcg gttgccgtag ttgctagaac    4560
ggtacatagt tgccacctaa ctgtagcgag tggcataact tattgtgtgt tactgcccaa    4620
tgttgtctct ccttgtgttc atggattcag acttgtgatt gtagtatttc tggatcagac    4680
tggagtaaaa gaaaaaaaaa aaggaagaca tgggtttaac agtaaaaaaa aaaaaaaaaa    4740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa                           4779
<210>82
<211>6158
<212>DNA
<213>稻
<400>82
cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc    60
tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct   120
cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg   180
ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc   240
cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg   300
cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg   360
caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc   420
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc   480
cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct   540
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt   600
cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt   660
gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct   720
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc   780
tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg   840
cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg   900
ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca   960
agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga  1020
ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc  1080
tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag  1140
cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga  1200
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg  1260
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa  1320
cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg  1380
gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa  1440
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc  1500
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa  1560
ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct  1620
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag  1680
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat  1740
tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg  1800
taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa  1860
tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc  1920
gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa  1980
cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt  2040
taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg  2100
actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat  2160
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg  2220
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa  2280
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt  2340
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa  2400
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc  2460
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct  2520
tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt  2580
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt  2640
ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt  2700
atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt  2760
atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa  2820
agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat  2880
ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat  2940
agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat  3000
gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt  3060
tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc  3120
tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc  3180
acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa  3240
gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa  3300
agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata  3360
ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag  3420
atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg  3480
atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa  3540
tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt  3600
ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg  3660
gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc  3720
aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat  3780
ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc  3840
taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt  3900
taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata  3960
ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg  4020
ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat  4080
ggaaggatcc acagataaaa ttcaggagaa tatagtagtg gccaaggttg gtgacggtga  4140
tggtggcatg tgatccccca gatcttcagt gacccagaga ggaggggacg gcgcgtggtg  4200
agctacaagg catactcagt ggagggcaag atcaaggcct cccgtccgta ggggactccg  4260
ctgcatcaag gccaactgct ccgaactgat caatttctgg tgcagacagg tgcttgcggt  4320
caggttaaag aagttggcaa aaatgcttct gaagaaaggt taattgttgt ttcatctcag  4380
gagattccag atgatccagt gtctccaaca attgaggcgc ttattttgct ccatagtaaa  4440
gtaagtacac ttgctgagaa ccaccagttg acaacacggc ttgttgtacc atcaaacaaa  4500
gttggttgta ttcttgggga aggtggaaag gtaattactg aaatgagaag acggactggg  4560
gctgaaatcc gagtctactc aaaagcagat aaacctaagt acctgtcttt tgatgaggag  4620
cttgtgcagg ttgctgggct tccagctatt gaaagaggag ccctgacaga gattgcttcg  4680
aggctttgaa ctaggacact cagagatgga agttcttcca ataatccgac accttttgcc  4740
cctgttgatg gtcctcctgt tgatatcttg cctaacaagg aattcatgct atatggacga  4800
tctgctaata gtcccccata tggagggcct gctaatgatc caccatatgg aagacctgcc  4860
attgatccac catatggaag accaatatcc acaatatgga agacctgcca atgatccacc  4920
atatagaaga cctgtcaatg atacatcata ttgagggttg aacaatgatg ggcctcgtga  4980
tcaggcccgg tcctgagggg ggtcgaatgg ggcgatcgct ccgggccccc cgattcccag  5040
ggcccccacc tatctgtgca acgagtagta gcgatcttcc agcgcgcaac gtgaggcgat  5100
gtttctccgt gatttcgccg gcctgcaact gcgagatcgc gagtataacg atcagccgat  5160
cgatctcatc tgccgactgc catgctgatg ccacacgcaa gcgcagcata tcagccttat  5220
cttggttgat cggcatgctg gacgagcaca tctgttgtcg catcaactgc tgactgctat  5280
atatgtgctg gtgctgaatc gatcgattgt cgtcacggaa gtgaagaaca accacggcac  5340
tgctgcctgc tgggctctag ccgccatcag ctgcggagct gatccatgga cgtgaggatt  5400
accgaagact gtcaggtctc actgggtatc caggtggctc tgtcgaattg tggattccaa  5460
atagttaacc ggagtctgtc attggtgttg gtggtgtcaa tctagctgag atccgtctgg  5520
tatagcgtaa gagaaacatc atgcactatc cccagtcata accatgcccc aatggccacc  5580
aatagttttc ctcgtgaaaa tctccccttg atcccagatc tctggtgcga gagtgaagtt  5640
gcacgaagcc catcctggtt cttccgagtc cattgtggag atccagggca ttccggatca  5700
agtgaaagcc gcacagagcc ttctgcaagg cttcatcggc gcaagcagca acagcaggca  5760
ggcgccccag tcctctcgca tggcccatta tttttagtaa gctggaggac attcgcaaca  5820
ggggggtcag tggtcactgc aaagctgagt ttgttcttca gttcaactgc agaaaattgc  5880
agatcggttg ccgtagttgc tagaacggta catagttgcc acctaactgt agcgagtggc  5940
ataacttatt gtgtgttact gcccaatgtt gtctctcctt gtgttcatgg attcagactt  6000
gtgattgtag tatttctgga tcagactgga gtaaaagaaa aaaaaaaagg aagacatggg  6060
tttaacagta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa  6120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa                          6158
<210>83
<211>2864
<212>DNA
<213>稻
<400>83
aagagatcga tcgcgatctc cctgccccga cgtcgccggc cgatctctca ttctctccac     60
gccctgctcg tcgccgatct cctacaccat ccctgccatc tcctccttcc cctcccctct    120
atcctccact ggtgccgccc acctctccgt ataagacaaa ctgcgttgcg gcgttggttt    180
ccgccggcgc tgctgctgca cctgtcagct agggcgggca tggcgcgccg cgccgcttcc    240
cgcgctgttg gcgcccttcg ctcggacggc tcgatccaag ggcgaggagg ccgcgcgggg    300
ggcagtggcg ccgaggacgc acgccacgtg ttcgacgaat tgctccgccg tggcaggggc    360
gcctcgatct acggcttgaa ccgcgccctc gccgacgtcg cgcgtgacag ccccgcggcc    420
gccgtgtccc gctacaaccg catggcccga gccggcgccg acgaggtaac tcccgacttg    480
tgcacctacg gcattctcat cggttgctgc tgccgcgcgg gccgcttgga cctcggtttc    540
gcggccttgg gcaatgtcat taagaaggga tttagagtgg acgccatcgc cttcactcct    600
ctgctcaagg gcctctgtgc cgacaagagg acgagcgacg caatggacat agtgctccgc    660
agaatgaccg agctcggctg cataccaaat gtcttctcct acaatattct tctcaagggg    720
ctgtgtgatg agaacagaag ccaagaagct ctcgagctgc tgcacatgat ggctgatgat    780
cgaggaggag gtagcccacc tgatgtggtg tcgtatacca ctgtcatcaa tggcttcttc    840
aaagaggggg attcagacaa agcttacagt acataccatg aaatgctgga ccgggggatt    900
ttacctgatg ttgtgaccta caactctatt attgctgcgt tatgcaaggc tcaagctatg    960
gacaaagcca tggaggtact taacaccatg gttaagaatg gtgtcatgcc tgattgcatg   1020
acatataata gtattctgca tggatattgc tcttcagggc agccgaaaga ggctattgga   1080
tttctcaaaa agatgcgcag tgatggtgtc gaaccagatg ttgttactta tagcttgctc   1140
atggattatc tttgcaagaa cggaagatgc atggaagcta gaaagatttt cgattctatg   1200
accaagaggg gcctaaagcc tgaaattact acctatggta ccctgcttca ggggtatgct   1260
accaaaggag cccttgttga gatgcatggt ctcttggatt tgatggtacg aaacggtatc   1320
caccctgatc attatgtttt cagcattcta atatgtgcat acgctaaaca agggaaagta   1380
gatcaggcaa tgcttgtgtt cagcaaaatg aggcagcaag gattgaatcc gaatgcagtg   1440
acgtatggag cagttatagg catactttgc aagtcaggca gagtagaaga tgctatgctt   1500
tattttgagc agatgatcga tgaaggacta agccctggca acattgttta taactcccta   1560
attcatggtt tgtgcacctg taacaaatgg gagagggctg aagagttaat tcttgaaatg   1620
ttggatcgag gcatctgtct gaacactatt ttctttaatt caataattga cagtcattgc   1680
aaagaaggga gggttataga atctgaaaaa ctctttgagc tgatggtacg tattggtgtg   1740
aagcccaatg tcattaccta caatactctt atcaatggat attgcttggc aggtaagatg   1800
gatgaagcaa tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt   1860
acttatagca ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt   1920
ctttttaagg agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt   1980
ctgcaaggtt tatttcaaac cagaagaact gctgctgcaa aagaactcta tgttaggatt   2040
accgaaagtg gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc   2100
aaaaacaaac tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg   2160
aagcttgagg ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat   2220
gatgaagcca aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg   2280
acgtacaggt tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa   2340
ctctttcttt caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt   2400
gttagggaac tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt  2460
gatgagaagc acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct  2520
gggggaaaat atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa  2580
tctttgagct gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct  2640
acagtcctat tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac  2700
ctctccgaat tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt  2760
tgatgccaga aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt  2820
tgtgactgga gtttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaa                   2864
<210>84
<211>2819
<212>DNA
<213>稻
<400>84
ctcattctct ccacgccctg ctcgtcgccg atctcctaca ccatccctgc catctcctcc    60
ttcccctccc ctctatcctc cactggtgcc gcccacctct ccgtataaga caaactgcgt   120
tgcggcgttg gtttccgccg gcgctgctgc tgcacctgtc agctagggcg ggcatggcgc   180
gccgcgccgc ttcccgcgct gttggcgccc ttcgctcgga cggctcgatc caagggcgag   240
gaggccgcgc ggggggcagt ggcgccgagg acgcacgcca cgtgttcgac gaattgctcc   300
gccgtggcag gggcgcctcg atctacggct tgaaccgcgc cctcgccgac gtcgcgcgtg   360
acagccccgc ggccgccgtg tcccgctaca accgcatggc ccgagccggc gccgacgagg   420
taactcccga cttgtgcacc tacggcattc tcatcggttg ctgctgccgc gcgggccgct   480
tggacctcgg tttcgcggcc ttgggcaatg tcattaagaa gggatttaga gtggacgcca   540
tcgccttcac tcctctgctc aagggcctct gtgccgacaa gaggacgagc gacgcaatgg   600
acatagtgct ccgcagaatg accgagctcg gctgcatacc aaatgtcttc tcctacaata   660
ttcttctcaa ggggctgtgt gatgagaaca gaagccaaga agctctcgag ctgctgcaca   720
tgatggctga tgatcgagga ggaggtagcc cacctgatgt ggtgtcgtat accactgtca   780
tcaatggctt cttcaaagag ggggattcag acaaagctta cagtacatac catgaaatgc   840
tggaccgggg gattttacct gatgttgtga cctacaactc tattattgct gcgttatgca   900
aggctcaagc tatggacaaa gccatggagg tacttaacac catggttaag aatggtgtca   960
tgcctgattg catgacatat aatagtattc tgcatggata ttgctcttca gggcagccga  1020
aagaggctat tggatttctc aaaaagatgc gcagtgatgg tgtcgaacca gatgttgtta  1080
cttatagctt gctcatggat tatctttgca agaacggaag atgcatggaa gctagaaaga  1140
ttttcgattc tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc  1200
ttcaggggta tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg  1260
tacgaaacgg tatccaccct gatcattatg ttttcagcat tctaatatgt gcatacgcta  1320
aacaagggaa agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga  1380
atccgaatgc agtgacgtat ggagcagtta taggcatact ttgcaagtca ggcagagtag  1440
aagatgctat gctttatttt gagcagatga tcgatgaagg actaagccct ggcaacattg  1500
tttataactc cctaattcat ggtttgtgca cctgtaacaa atgggagagg gctgaagagt  1560
taattcttga aatgttggat cgaggcatct gtctgaacac tattttcttt aattcaataa  1620
ttgacagtca ttgcaaagaa gggagggtta tagaatctga aaaactcttt gagctgatgg  1680
tacgtattgg tgtgaagccc aatgtcatta cctacaatac tcttatcaat ggatattgct  1740
tggcaggtaa gatggatgaa gcaatgaagt tactttctgg catggtctca gttgggttga  1800
aacctaatac tgttacttat agcactttga ttaatggcta ctgcaaaatt agtaggatgg   1860
aagacgcgtt agttcttttt aaggagatgg agagcagtgg tgttagtcct gatattatta   1920
cgtataacat aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac   1980
tctatgttag gattaccgaa agtggaacgc agattgaact tagcacatac aacataatcc   2040
ttcatggact ttgcaaaaac aaactcactg atgatgcact tcagatgttt cagaacctat   2100
gtttgatgga tttgaagctt gaggctagga ctttcaacat tatgattgat gcattgctta   2160
aagttggcag aaatgatgaa gccaaggatt tgtttgttgc tttctcgtct aacggtttag   2220
tgccgaatta ttggacgtac aggttgatgg ctgaaaatat tataggacag gggttgctag   2280
aagaattgga tcaactcttt ctttcaatgg aggacaatgg ctgtactgtt gactctggca   2340
tgctaaattt cattgttagg gaactgttgc agagaggtga gataaccagg gctggcactt   2400
acccttccat gattgatgag aagcactttt ccctcgaagc atccactgct tccttgttta   2460
tagatctttt gtctggggga aaatatcaag aatattatag gtttctccct gaaaaataca   2520
agtcctttat agaatctttg agctgctgaa gcattttgca gctttgaaat tctgtgttgg   2580
aattcttttc tcctacagtc ctattagagg agggatcttc tctgtatgtg taaatagcga   2640
ggtatgtatg ccacctctcc gaattatttt tactgtggtt cctagactgt aaacaagcaa   2700
ttatgttatg ctgttgatgc cagaaaaaac ataaaagttt gtcgttatct ctactaacgg   2760
atcataaagg gatttgtgac tggagtttca aaaaaaaaaa aaaaaaaaaa aaaaaaaaa    2819
<210>85
<211>2649
<212>DNA
<213>稻
<400>85
ggtgccgccc acctctccgt ataagacaaa ctgcgttgcg gcgttggttt ccgccggcgc    60
tgctgctgca cctgtcagct agggcgggca tggcgcgccg cgccgcttcc cgcgctgttg   120
gcgcccttcg ctcggacggc tcgatccaag ggcgaggagg ccgcgcgggg ggcagtggcg   180
ccgaggacgc acgccacgtg ttcgacgaat tgctccgccg tggcaggggc gcctcgatct   240
acggcttgaa ccgcgccctc gccgacgtcg cgcgtgacag ccccgcggcc gccgtgtccc   300
gctacaaccg catggcccga gccggcgccg acgaggtaac tcccgacttg tgcacctacg   360
gcattctcat cggttgctgc tgccgcgcgg gccgcttgga cctcggtttc gcggccttgg   420
gcaatgtcat taagaaggga tttagagtgg acgccatcgc cttcactcct ctgctcaagg   480
gcctctgtgc cgacaagagg acgagcgacg caatggacat agtgctccgc agaatgaccg   540
agctcggctg cataccaaat gtcttctcct acaatattct tctcaagggg ctgtgtgatg   600
agaacagaag ccaagaagct ctcgagctgc tgcacatgat ggctgatgat cgaggaggag   660
gtagcccacc tgatgtggtg tcgtatacca ctgtcatcaa tggcttcttc aaagaggggg   720
attcagacaa agcttacagt acataccatg aaatgctgga ccgggggatt ttacctgatg   780
ttgtgaccta caactctatt attgctgcgt tatgcaaggc tcaagctatg gacaaagcca   840
tggaggtact taacaccatg gttaagaatg gtgtcatgcc tgattgcatg acatataata   900
gtattctgca tggatattgc tcttcagggc agccgaaaga ggctattgga tttctcaaaa   960
agatgcgcag tgatggtgtc gaaccagatg ttgttactta tagcttgctc atggattatc  1020
tttgcaagaa cggaagatgc atggaagcta gaaagatttt cgattctatg accaagaggg  1080
gcctaaagcc tgaaattact acctatggta ccctgcttca ggggtatgct accaaaggag  1140
cccttgttga gatgcatggt ctcttggatt tgatggtacg aaacggtatc caccctgatc  1200
attatgtttt cagcattcta atatgtgcat acgctaaaca agggaaagta gatcaggcaa  1260
tgcttgtgtt cagcaaaatg aggcagcaag gattgaatcc gaatgcagtg acgtatggag   1320
cagttatagg catactttgc aagtcaggca gagtagaaga tgctatgctt tattttgagc   1380
agatgatcga tgaaggacta agccctggca acattgttta taactcccta attcatggtt   1440
tgtgcacctg taacaaatgg gagagggctg aagagttaat tcttgaaatg ttggatcgag   1500
gcatctgtct gaacactatt ttctttaatt caataattga cagtcattgc aaagaaggga   1560
gggttataga atctgaaaaa ctctttgagc tgatggtacg tattggtgtg aagcccaatg   1620
tcattaccta caatactctt atcaatggat attgcttggc aggtaagatg gatgaagcaa   1680
tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca   1740
ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg   1800
agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt   1860
tatttcaaac cagaagaact gctgctgcaa aagaactcta tgttaggatt accgaaagtg   1920
gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac   1980
tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg   2040
ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca   2100
aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt   2160
tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt   2220
caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac   2280
tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc   2340
acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat   2400
atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct   2460
gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat   2520
tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat   2580
tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga   2640
aaaaaaaaa                                                           2649
<210>86
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>86
cagttgggtt gaaacctaat actg    24
<210>87
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>87
cactaaaccg ttagacgaga aagc    24

Claims (13)

1.一种恢复水稻育性的方法,包括将核酸导入到水稻中,其中该核酸编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列。
2.权利要求1的方法,包括将核酸导入到水稻中,其中所述核酸编码SEQ ID NO:75的氨基酸序列。
3.权利要求1或2的方法,其中编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
4.权利要求3的方法,其中编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列,并具有恢复育性功能的核酸,符合下列1)-12)中的至少一个条件:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
5.一种鉴定受试水稻个体或其种子是否具有水稻恢复基因(Rf-1基因)的方法,其中利用编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸。
6.权利要求5的方法,其中利用下列a)-p)任何的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
7.权利要求5或6的方法,其中当编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸,符合下列1)-12)中的至少一个条件时,可确定受试水稻个体或其种子具有Rf-1基因:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
8.权利要求6或7的方法,其中该方法包括:
i)根据包括下述任何一个碱基邻近区域的碱基序列制备引物对:
1)与SEQ ID NO:69的第1769位碱基相应的碱基;
2)与SEQ ID NO:70的第1767位碱基相应的碱基;
3)与SEQ ID NO:71的第1772位碱基相应的碱基;
4)与SEQ ID NO:72的第1762位碱基相应的碱基;
5)与SEQ ID NO:73的第1703位碱基相应的碱基;
6)与SEQ ID NO:74的第1779位碱基相应的碱基;
7)与SEQ ID NO:80的第1783位碱基相应的碱基;
8)与SEQ ID NO:81的第1729位碱基相应的碱基;
9)与SEQ ID NO:82的第1781位碱基相应的碱基;
10)与SEQ ID NO:83的第1774位碱基相应的碱基;
11)与SEQ ID NO:84的第1728位碱基相应的碱基;以及
12)与SEQ ID NO:85的第1644位碱基相应的碱基
以扩增上述的碱基及其邻近的区域;
ii)利用受试水稻个体或其种子的基因组DNA进行核酸扩增反应;以及
iii)根据所述的核酸扩增产物中发现的多态性来鉴定受试水稻个体或其种子中Rf-1的存在。
9.权利要求8的方法,其中当步骤iii)符合下述1)-12)中的至少一个条件时,可确定受试水稻个体或其种子中具有Rf-1基因:
1)包括SEQ ID NO:69的第1769位相应碱基的区域不具有TaqI识别序列;
2)包括SEQ ID NO:70的第1767位相应碱基的区域不具有TaqI识别序列;
3)包括SEQ ID NO:71的第1772位相应碱基的区域不具有TaqI识别序列;
4)包括SEQ ID NO:72的第1762位相应碱基的区域不具有TaqI识别序列;
5)包括SEQ ID NO:73的第1703位相应碱基的区域不具有TaqI识别序列;
6)包括SEQ ID NO:74的第1779位相应碱基的区域不具有TaqI识别序列;
7)包括SEQ ID NO:80的第1783位相应碱基的区域不具有TaqI识别序列;
8)包括SEQ ID NO:81的第1729位相应碱基的区域不具有TaqI识别序列;
9)包括SEQ ID NO:82的第1781位相应碱基的区域不具有TaqI识别序列;
10)包括SEQ ID NO:83的第1774位相应碱基的区域不具有TaqI识别序列;
11)包括SEQ ID NO:84的第1728位相应碱基的区域不具有TaqI识别序列;以及
12)包括SEQ ID NO:85的第1664位相应碱基的区域不具有TaqI识别序列。
10.一种抑制Rf-1基因的功能以恢复育性的方法,其中通过导入长度至少为100个碱基的反义序列,并且其选自互补于编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸的碱基序列。
11.权利要求10的方法,其中编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
12.一种核酸,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列。
13.权利要求11的核酸,其选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
CN038209101A 2002-07-05 2003-03-17 水稻bt型细胞质雄性不育的水稻恢复基因 Expired - Fee Related CN1678745B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002197560 2002-07-05
JP197560/2002 2002-07-05
PCT/JP2003/003154 WO2004005515A1 (ja) 2002-07-05 2003-03-17 イネbt型雄性不稔細胞質に対する稔性回復遺伝子

Publications (2)

Publication Number Publication Date
CN1678745A true CN1678745A (zh) 2005-10-05
CN1678745B CN1678745B (zh) 2010-05-12

Family

ID=30112401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038209101A Expired - Fee Related CN1678745B (zh) 2002-07-05 2003-03-17 水稻bt型细胞质雄性不育的水稻恢复基因

Country Status (7)

Country Link
US (1) US7544856B2 (zh)
EP (1) EP1541687A4 (zh)
JP (1) JPWO2004005515A1 (zh)
CN (1) CN1678745B (zh)
AU (1) AU2003213397B2 (zh)
CA (1) CA2491411A1 (zh)
WO (1) WO2004005515A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102477091A (zh) * 2010-11-30 2012-05-30 中国科学院遗传与发育生物学研究所 水稻雄性不育蛋白及其编码基因与应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003027290A1 (fr) * 2001-09-19 2003-04-03 Japan Tobacco Inc. Procede pour conferer ou reguler la fertilite d'un cytoplasme a sterilite male de riz bt au moyen d'un gene de restauration de la fertilite, et procede d'estimation de la presence d'un gene de restauration de la fertilite
WO2004113537A1 (ja) * 2003-06-18 2004-12-29 Japan Tobacco Inc. 稔性回復遺伝子を複数の遺伝子座に配置させることを含むハイブリッド植物の稔性を向上させる方法
EP1919895A2 (en) 2005-08-02 2008-05-14 Lexicon Pharmaceuticals, Inc. 2-aminoaryl pyridines as protein kinases inhibitors
ES2644576T3 (es) 2011-11-28 2017-11-29 Anglo Netherlands Grain Bv Procedimiento de diferenciación de líneas de plantas fértiles y estériles por detección de marcadores polimórficos en ADN del cloroplasto

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222588A (ja) 1994-02-10 1995-08-22 Mitsui Toatsu Chem Inc イネ細胞質雄性不稔回復系統の遺伝子診断法
JPH09313187A (ja) 1996-05-30 1997-12-09 Mitsui Petrochem Ind Ltd イネの細胞質雄性不稔回復遺伝子の近傍に位置するdnaマーカーおよびdna診断法
JP2000139465A (ja) 1998-11-06 2000-05-23 Mitsui Chemicals Inc イネの細胞質雄性不稔回復遺伝子近傍に位置するdnaマーカーおよびこれを用いた細胞質雄性不稔回復遺伝子の判別方法
AU2001278745A1 (en) * 2000-08-17 2002-02-25 Japan Tobacco Inc. Method of estimating the genotype of fertility recovery locus to rice BT type male fertility cytoplasm
AU2003222566A1 (en) * 2002-01-10 2003-07-24 Cornell Research Foundation, Inc. Genes for altering mitochondrial function and for hybrid seed production

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102477091A (zh) * 2010-11-30 2012-05-30 中国科学院遗传与发育生物学研究所 水稻雄性不育蛋白及其编码基因与应用
CN102477091B (zh) * 2010-11-30 2013-11-13 中国科学院遗传与发育生物学研究所 水稻雄性不育蛋白及其编码基因与应用

Also Published As

Publication number Publication date
CA2491411A1 (en) 2004-01-15
JPWO2004005515A1 (ja) 2005-11-04
EP1541687A4 (en) 2006-01-04
WO2004005515A1 (ja) 2004-01-15
AU2003213397A1 (en) 2004-01-23
US7544856B2 (en) 2009-06-09
EP1541687A1 (en) 2005-06-15
CN1678745B (zh) 2010-05-12
US20060179517A1 (en) 2006-08-10
AU2003213397B2 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
CN106749574B (zh) 一种植物雄性育性相关蛋白ms6021及其编码基因与应用
CN1231673A (zh) 在植物中调节防御反应的多核苷酸及其用途
JP2012065678A (ja) 雄性不稔を仲介するヌクレオチド配列およびその使用方法
CN102027120A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN1171817A (zh) 开花的遗传学控制
WO2020177560A1 (zh) 一种培育抗灰斑病植物的方法
CN1114694C (zh) 赋予植物抗病性的方法和材料
CN113061171B (zh) 抗稻瘟病蛋白和基因、分离的核酸及其应用
CN1589325A (zh) 一种利用水稻bt-雄性不育细胞质的育性恢复基因来赋予或控制育性的方法及鉴定育性恢复基因存在的方法
CN108441499A (zh) 雄性育性相关基因ht2925及其应用
US6541684B1 (en) Nucleotide sequences encoding maize RAD51
CN1117867C (zh) Dna序列及其用途
US10837068B2 (en) Rice mitochondrial sterile gene and application thereof
CN1771327A (zh) 逆境耐受性
CN1678745A (zh) 水稻bt型细胞质雄性不育的水稻恢复基因
CN101061228A (zh) 异戊烯基转移酶序列及其使用方法
CN1316007A (zh) 多核苷酸序列
CN104911191B (zh) 一种育性调控基因fg3及其应用
CN110818784A (zh) 水稻基因OsATL15在调节农药的吸收转运中的应用
CN1478148A (zh) 可增强植物对渗透压的抵抗力的新转录因子
CN1266458A (zh) 指导在花器官中优势基因表达的新dna片段
CN1379783A (zh) 通过功能性地抑制植物细胞周期蛋白抑制剂基因增加植物细胞增殖的方法
AU762983B2 (en) Ku70 orthologue and uses thereof
CN100552028C (zh) 含有使育性恢复基因置于多个基因位点的改善杂交植物育性的方法
CN1409763A (zh) 植物的光周期敏感性基因及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: JAPAN TOBACCO INC.

Free format text: FORMER OWNER: JAPAN TOBACCO INC.; APPLICANT

Effective date: 20071221

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20071221

Address after: Tokyo, Japan, Japan

Applicant after: Japan Tabacco Inc.

Address before: Tokyo, Japan

Applicant before: Japan Tobacco Industry Corporation

Co-applicant before: Syngenta Limited

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100512

Termination date: 20130317