水稻BT型细胞质雄性不育的水稻恢复基因
发明领域
本发明涉及水稻BT型细胞质雄性不育的水稻恢复基因。
本申请要求基于2002年7月5日提交的日本专利申请No.2002-107560的优先权。该专利申请的全部公开内容在此并入本文。
背景技术
水稻是自花授粉植物,所以为了在品种之间进行杂交,首先必须在开花前将颖花内的全部雄蕊除去以避免自花授粉,然后用来自亲本品种的花粉使将与之杂交的品种获得育性。然而,这种人工杂交的方法完全不适合商业规模地来生产大量的杂交种子。
因此,通过利用细胞质雄性不育的三系法来生产杂交水稻。在三系法中,使用了下列三个品系,即具有雄性不育细胞质的不育系、具有Rf-1基因的恢复系和与不育系具同样核基因但不具有任何不育细胞质的保持系。利用这三个品系,(i)用恢复系的花粉对不育系进行授粉而获得杂交种子;同时(ii)用保持系的花粉对不育系进行授粉而使不育系得以保存下去。
当在三系法中使用BT型雄性不育细胞质时,繁殖恢复系水稻是非常重要的,为此,必需在育种的各个阶段中确保水稻中保持有Rf-1基因,并且确保在最后阶段中Rf-1基因是纯合的。在三系法中还需要验证以确保用作恢复系的品种具有Rf-1基因,或验证Rf-1基因的存在以确保所得到的杂交种子已恢复了育性。
为了确定植物体中的Rf-1基因位点的基因型,首先需要将待确定其基因型的植物与标准系杂交获得杂交种子,以形成F1代植株,然后进行自花授粉,继而研究能以超过某一水平(例如,70-80%或更高)的频率来产生种子的个体的出现机率。所述标准系指保持系、不育系或这两个品系的一组品系,并且根据待测个体的细胞质是否属于BT型、正常型还是未知的来作出合适的选择。如果标准系为不育系,则以待测个体作为母本来杂交,而如果标准系是保持系,则作为父本来杂交。
但是,实施这些技术需要花费大量的劳动力和时间。进一步的问题是,为生产种子而进行的授粉易受环境因素的影响,并且如果在恶劣的环境,如低温或日照不足下进行研究,不育的造成可能与基因型构成无关,导致不能准确地确定Rf-1基因位点的基因型。
为了解决这些问题,最近已经提出用分子生物学的技术来验证Rf-1基因的存在。该技术基于检测与Rf-1基因连锁的碱基序列(这些序列以下称作DNA标记)来验证Rf-1基因的存在或缺失。值得注意的是由于目前还没弄清Rf-1基因的DNA序列,所以不可能直接检测Rf-1基因。
例如已有报道,水稻中Rf-1基因的位点位于第10号染色体上,并且定位于DNA标记(RFLP标记)位点G291和G127位点之间,其可用于限制性片段长度多态性分析(RFLP)(Fukuta等人,1992,Jpn J.Breed.42(supl.1)164-165)。已知的方法是通过研究与Rf-1基因连锁的DNA标记位点G291和G127的基因型可鉴定Rf-1基因位置的基因型。
但是传统的分子生物学技术存在几个问题。首先,利用RFLP标记需要通过Southern印迹分析来进行检测。为了进行Southern印迹分析,必需从待测个体中纯化微克级的DNA,此外还需要包括限制性内切酶处理、电泳、印迹、与探针杂交以及信号检测等一系列的步骤;这不仅包括了相当量的劳动,还需花费约1周的时间才能获得检测结果。
第二个问题是,由于RFLP标记位点G291和G127之间的基因图距长约30cM(在水稻DNA中相当于约9000kbp),在该区域中发生双重重组的机率达到百分之几,因而不能完全保证通过这些标记来正确评估Rf-1基因位置的基因型。
第三,当通过检测RFLP标记位点G291和G127来评估Rf-1基因的存在,不仅Rf-1基因而且这些位点之间的基因区域被引入到育种所筛选出的育性恢复系中。结果是:从RF-1基因供体亲本中引入的DNA序列将具有30cM或更长的染色体区域,这表示存在着引入可能潜在于该区域内的有害基因的风险。
为了解决这些问题,已经开发出与Rf-1基因的位点连锁的显性DNA标记(日本专利公开No.222588/1995)和共显性DNA标记(日本专利公开No.313187/1997)。这些标记与Rf-1基因的位点连锁,与Rf-1基因的遗传距离分别为1.6±0.7cM(相当于水稻DNA中约480kbp)和3.7±1.1cM(相当于水稻DNA中约1110kbp),它们的位点位于Rf-1基因位点的相对两侧。因此,可通过检测显性PCR标记和共显性PCR标记的位点的存在来评估Rf-1基因的存在。利用共显性PCR标记也可以评估Rf-1基因的位点是纯合还是杂合的。
但是,即使使用这些PCR标记,仍然存在着几个问题。共显性标记与Rf-1基因的位点具有3.7±1.1cM的遗传距离,所以还没有完全解决与Rf-1基因位点之间重组频率可能很高的问题。其结果是,就共显性标记本身来说,是能够准确地检测出是纯合型还是杂合型。但如果共显性标记和Rf-1基因的位点之间发生重组,就不能准确确定Rf-1基因位点的基因型,尤其不能确定其是纯合型还是杂合型的。另一方面,如果用显性标记确定Rf-1基因位点的基因型,则不管个体是Rf-1基因纯合体(Rf-1/Rf-1)还是杂合体(Rf-1/rf-1),该标记不能区分检测个体。因此,即使结合使用共显性标记和显性标记来确定Rf-1基因位点的基因型,也不可能正确地鉴别植株个体是Rf-1基因纯合型还是杂合型。此外,如果用显性标记进行PCR没有得到扩增产物,也不能排除可能是由于实验程序的一些问题所导致的可能性。进一步的问题是,由于共显性标记和显性标记之间的遗传距离长达约5.3cM(约1590kbp),从Rf-1基因供体亲本引入的染色体区域的大小不能限定在足够小的数值,也就不能防止该区域中可能含有的有害基因的伴随引入。
日本专利公开No.139465/2000描述了根据位于水稻第10号染色体上Rf-1基因附近的RFLP标记的碱基序列而开发的共显性标记。然而,这些PCR标记大多数与Rf-1基因之间的遗传距离都大于约1cM。
发明公开
本发明的一个目的是提供恢复水稻育性的方法。本发明的方法包括将核酸导入到水稻中,其中该核酸编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列。本发明的一个优选实施方案中,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%同一性的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
优选地,本发明的方法中,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列,并具有恢复育性功能的核酸,符合下列1)-12)中的至少一个条件:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
本发明的另一个目的是提供一种鉴定受试水稻个体或其种子是否具有水稻恢复基因(Rf-1基因)的方法,其中利用编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列,并具有恢复育性功能的核酸。优选地,本发明方法的实施方案中,当编码SEQID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸,符合下列1)-12)中的至少一个条件时,可确定受试水稻个体或其种子具有Rf-1基因:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
本发明的另一个目的是提供一种抑制Rf-1基因的功能以恢复育性的方法。本发明的抑制方法包括,在一个实施方案中,导入长度至少为100个碱基的反义序列,并且其选自互补于编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸的碱基序列。
本发明的另一个目的是提供编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸。本发明提供,在一个实施方案中,该核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
附图简述
图1显示从RFLP标记位点S12564开始的染色体步行实验结果。
图2显示与BAC克隆AC068923相关的λ克隆重叠区(contig)的序列对比。
图3显示重组体花粉(全部有育性)的Rf-1位点附近的染色体组织结构,是根据从该花粉产生的10个个体(RS1,RS2,RC1-8)标记位点的基因型,在最靠近Rf-1位点进行作图的结果。白条代表粳稻(iaponica)区域,而黑条代表籼稻(indica)区域。
图4是基因图谱,其中水稻第10号染色体上的Rf-1基因位点以与各种标记的关系而定位在连锁图谱上;图距值是从1042个F1代个体的分离数据计算出来的。
图5显示用于通过互补分析鉴定Rf-1区域的10个基因组克隆的片段。使用通过染色体步行(细线)获得的λ克隆对以粗线表示的染色体区域进行互补分析。发现XSF18存在缺失,其用点线表示。
图6显示利用来自XSG16的15.7kb片段(实施例10)和来自XSF18的16.2kb片段(实施例8)进行互补分析的结果。通过抽穗证明用XSG16的15.7kb片段转化的植株恢复了育性。
图7是显示Rf-1基因结构的示意图。白条和黑条分别表示外显子和内显子。显示外显子部分的碱基对数目。
图8是显示经互补分析的IR24基因组片段之间位置关系,用于cDNA文库筛选的探针,和从分离的cDNAs推导的Rf-1基因的示意图。Rf-1基因中的白条和黑条分别表示外显子和内显子。显示外显子部分的碱基对数目。
实施本发明的最佳方式
开始我们将Rf-1位点限定在第10号染色体上极小的区域内。以此为基础,我们开发了Rf-1位点附近的PCR标记,并找到一种利用这些与Rf-1位点连锁的PCR标记来检测Rf-1基因的方法。具体地,通过确定与Rf-1位点接近的新PCR标记位点的基因型来检测Rf-1基因的存在并选择Rf-1基因纯合的个体,其中该新标记是根据Rf-1位点作图定位于水稻第10号染色体上的PCR标记位点S12564 Tsp509I和C1361 MwoI之间而建立的。我们先前于2000年8月17日提交了关于检测Rf-1基因的方法的专利申请,其为日本专利申请No.2000-247204。该专利申请的全部公开内容在此引入作为参考。
1.日本专利申请No.2000-247204描述的用于评估Rf-1位点的基因型
的方法
日本专利申请No.2000-247204描述的方法是,根据Rf-1位点作图定位于水稻第10号染色体上的PCR标记位点S12564和C1361之间,进而确定待测水稻个体或其种子是否具有Rf-1基因。
标记
设计特异于Rf-1基因位点附近特定区域的引物对用于PCR,并且扩增产物用特定的限制性内切酶消化;经电泳,在籼稻系中,有些呈现与粳稻系大小不同的可观察条带。在籼稻系中呈现的特有条带在此称为Rf-1连锁带。目前本发明人已证实Rf-1基因位点定位于水稻第10号染色体上的PCR标记S12564 Tsp509I和C1361 MwoI之间,本领域的技术人员可以适当开发和利用Rf-1基因附近存在的PCR标记。
例如,根据本发明,检测待测水稻个体基因组中是否含有下列PCR标记中的至少一个,进而确定被测个体是否具有与这些PCR标记连锁的Rf-1基因:
(1)标记1:PCR标记R1877 EcoRI:当水稻基因组DNA用具有SEQ IDNO:1和SEQ ID NO:2所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶EcoRI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(2)标记2:PCR标记G4003 HindIII(SEQ ID NO:19):当水稻基因组DNA用具有SEQ ID NO:3和SEQ ID NO:4所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶HindIII的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(3)标记3:PCR标记C1361 MwoI(SEQ ID NO:20):当水稻基因组DNA用具有SEQ ID NO:5和SEQ ID NO:6所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MwoI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(4)标记4:PCR标记G2155 MwoI(SEQ ID NO:21):当水稻基因组DNA用具有SEQ ID NO:7和SEQ ID NO:8所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MwoI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(5)标记5:PCR标记G291 MspI(SEQ ID NO:22):当水稻基因组DNA用具有SEQ ID NO:9和SEQ ID NO:10所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶MspI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(6)标记6:PCR标记R2303 BslI(SEQ ID NO:23):当水稻基因组DNA用具有SEQ ID NO:11和SEQ ID NO:12所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶BslI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(7)标记7:PCR标记S10019 BstUI(SEQ ID NO:24):当水稻基因组DNA用具有SEQ ID NO:13和SEQ ID NO:14所示序列的DNA引物进行PCR反应,可根据扩增产物中是否具有限制酶BstUI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;
(8)标记8:PCR标记S10602 KpnI(SEQ ID NO:25):当水稻基因组DNA用具有SEQ ID NO:15和SEQ ID NO:16所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶KpnI的识别位点,来检测粳稻和籼稻品系个体之间的多态性;以及
(9)标记9:PCR标记S12564 Tsp509I(SEQ ID NO:26):当水稻基因组DNA用具有SEQ ID NO:17和SEQ ID NO:18所示序列的DNA引物进行PCR,可根据扩增产物中是否具有限制酶Tsp509I的识别位点,来检测粳稻和籼稻品系个体之间的多态性。
假定Rf-1基因位点最可能定位于水稻(rice)第10号染色体上9个RFLP的标记区域R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G2155的附近(参见Fukuta等人,1992,Jpn.J.Breed.42(supl.1)164-165所描述的RFLP连锁分析的结果,以及Harushima等人,1998,遗传学Genetics148,479-494所描述的水稻RFLP连锁图谱),本发明人将那些RFLP标记转变为共显性PCR标记,如CAPS标记或dCAPS标记,正如下文参考实施例1所描述的(Michaels和Amasino,1998,植物杂志The Plant Journal,14(3),381-385;Neff等人,1998,植物杂志The Plant Journal,14(3),387-392)。通过这种转变得到了上述PCR标记。
在这些PCR标记中,由PCR标记R1877 EcoRI、G291 MspI(SEQ IDNO:22)、R2303 BslI(SEQ ID NO:23)和S12564 Tsp509I(SEQ ID NO:26)组成的一组,以及由C1361 MwoI(SEQ ID NO:20)、S10019 BstUI(SEQ ID NO:24)、G4003 HindIII(SEQ ID NO:19)、S10602 KpnI(SEQ ID NO:25)和G2155MwoI(SEQ ID NO:21)组成的另一组,是分别位于稻第10号染色体上Rf-1基因位点的相对两侧。
因此,在一个实施方案中,通过(a)从PCR标记R1877 EcoRI、G291MspI、R2303 BslI和S12564 Tsp509I组中选择至少一个PCR标记,以及(b)从C1361 MwoI、S10019 BstUI、G4003 HindIII、S10602 KpnI和G2155 MwoI组中至少选择一个PCR标记来检测出Rf-1连锁带,进而确定Rf-1基因的存在。在这种情况下,优选(a)组的至少S12564 Tsp509I和(b)组的至少C1361 MwoI用作最接近Rf-1基因的PCR标记。如果被测水稻的基因组中,用(a)和(b)的PCR标记检测出Rf-1连锁带,则可以评估该水稻很可能包含Rf-1基因。
在另一个实施方案中,通过上述(a)组的至少2个PCR标记和(b)组的至少2个PCR标记来检测Rf-1连锁带。例如,从如图1所示的基因图谱上的Rf-1基因,通过用更接近Rf-1基因的(a)和(b)组的标记可检测到,而用离Rf-1基因较远的(a)和(b)组的标记不能检测到Rf-1连锁带而挑选个体,从而筛选出携带不需要基因区域最小的Rf-1基因的水稻个体。同样优选的,(a)组的至少一个PCR标记是S12564 Tsp509I,而(b)组的至少一个PCR标记是C1361 MwoI。因而,两个PCR标记位点S12564 Tsp509I和C1361 MwoI之间的遗传距离为0.3cM。利用这种特性,从Rf-1基因供体亲本引入的染色体区域可以缩小至大约1cM大小。这有助于将供体亲本中Rf-1基因附近可能存在的有害基因被引入恢复系的可能性降至最小。
Rf-1基因的检测
为了检测待测试水稻的基因组中的Rf-1基因,利用上述SEQ IDNO:1-18的引物进行PCR从水稻基因组扩增上述任何一个PCR标记,然后用聚合酶链式反应-限制性片段长度多态方法(PCR-RFLP)进行检测。PCR-RFLP是一种适用于下述情形的方法,其中不同品种之间,PCR扩增的DNA片段中限制性酶的识别位点存在多态性,并且可根据那些限制性酶的切割模式而方便地鉴定出特异的多态性(D.E.Harry等人,Theor.Appl.Genet.(1998),97:327-336)。
限制性内切酶的切割模式根据所使用的引物对在可观察的凝胶上,如下述表1所示显示条带。
表1
检测条带的大致大小(bp)
使用引物对1检测标记1(R1877 EcoRI)当待测水稻的基因组纯合的具有Rf-1基因时: 1500和1700当待测水稻的基因组杂合的具有Rf-1基因时: 1500、1700和3200当待测水稻的基因组不具有Rf-1基因时: 3200 |
使用引物对2检测标记2(G4003 HindIII)当待测水稻的基因组纯合的具有Rf-1基因时: 362当待测水稻的基因组杂合的具有Rf-1基因时: 95、267和362当待测水稻的基因组不具有Rf-1基因时: 95和267 |
使用引物对3检测标记3(C1361 MwoI)当待测水稻的基因组纯合的具有Rf-1基因时: 50和107当待测水稻的基因组杂合的具有Rf-1基因时: 25、50、79和107当待测水稻的基因组不具有Rf-1基因时: 25、50和79 |
使用引物对4检测标记4(G2155 MwoI)当待测水稻的基因组纯合的具有Rf-1基因时: 25、27和78当待测水稻的基因组杂合的具有Rf-1基因时: 25、27、78和105当待测水稻的基因组不具有Rf-1基因时: 25和105 |
使用引物对5检测标记5(G291 MspI)当待测水稻的基因组纯合的具有Rf-1基因时: 25、49和55当待测水稻的基因组杂合的具有Rf-1基因时: 25、49、55和104当待测水稻的基因组不具有Rf-1基因时: 25和104 |
使用引物对6检测标记6(R2303 BslI)当待测水稻的基因组纯合的具有Rf-1基因时: 238、655和679当待测水稻的基因组杂合的具有Rf-1基因时: 238、655、679和1334当待测水稻的基因组不具有Rf-1基因时: 238和1334 |
使用引物对7检测标记7(S10019 BstUI)当待测水稻的基因组纯合的具有Rf-1基因时: 130、218和244当待测水稻的基因组杂合的具有Rf-1基因时: 130、218、244和462当待测水稻的基因组不具有Rf-1基因时: 130和462 |
使用引物对8检测标记8(S10602 KpnI)当待测水稻的基因组纯合的具有Rf-1基因时: 724当待测水稻的基因组杂合的具有Rf-1基因时: 117、607和724当待测水稻的基因组不具有Rf-1基因时: 117和607 |
使用引物对9检测标记9(S12564 Tsp509I)当待测水稻的基因组纯合的具有Rf-1基因时: 41和117当待测水稻的基因组杂合的具有Rf-1基因时: 26、41、91和117当待测水稻的基因组不具有Rf-1基因时: 26、41和91 |
II.Rf-1位点的鉴定
如上所述,日本专利申请No.2000-247204所公开的RFLP-PCR标记,是基于我们发现Rf-1位点作图定位于DNA标记位点S12564 Tsp509I和C1361 MwoI之间。通过将Rf-1基因回交引入不含有Rf-1基因的正常粳稻品种中而建立育性恢复的品系。如果在这个过程中使用日本专利申请No.2000-247204所描述的鉴定Rf-1位点的方法,不仅可以有效建立恢复系(2-3年内),而且可以控制插入片段的长度。
然而,经杂交的引入不可避免的将Rf-1附近的区域也同时引入。日本专利申请No.2000-247204表明Rf-1位点作图定位于DNA标记位点S12564Tsp509I和C1361 MwoI之间,但这两个位点的距离为约0.3cM,即约90kbp。如果在Rf-1附近存在有害基因,不可否认该有害基因将可能与Rf-1基因一起被插入。
因此,基于Rf-1位点和DNA标记位点S12564 Tsp509I之间的紧密连锁,我们通过染色体步行和遗传分析在DNA标记位点S12564 Tsp509I和C1361 MwoI之间搜寻与Rf-1基因连锁的区域。结果,我们成功的鉴定出包括Rf-1基因,多达约76kb的区域,并确定了所述区域的全部碱基序列。根据本发明,将有可能通过遗传工程将育性恢复基因的功能导入到BT型雄性不育细胞质中。
具体地,在日本专利申请No.2000-247204中,对通过用MS-FRKoshihikari(在Rf-1位点是杂合的)对MS Koshihikari进行授粉而制备的1042个个体的群体进行连锁分析,发现1个Rf-1和S12564 Tsp509I位点之间发生重组的重组体和2个在Rf-1和C1361 MwoI位点之间发生重组的重组体(在此参考实施例1-2)。在本发明中,向群体中增加了4103个个体从而总共分析了5145个个体。结果,新发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组体和6个在Rf-1和C1361 MwoI位点之间发生重组的重组体,总数分别为2和8个重组体。通过本发明的高精度分离分析检测这10个个体是邻近Rf-1位点发生重组的重组体(实施例1)。
比较在Rf-1和C1361 MwoI位点之间的8个重组体和在Rf-1和S12564Tsp509I位点之间的2个重组体的频率,表明S12564 Tsp509I位点与Rf-1位点的遗传距离比C1361 MwoI位点的更近。遗传距离(以重组频率表示:cM)和物理距离(以碱基对数目表示:bp)并不总是成比例的,但通常可认为遗传距离减小,其物理距离也减小。
因此,我们试图从S12564 Tsp509I位点开始进行染色体步行来分离Rf-1位点(实施例2)。利用籼稻品种IR24和粳稻品种Asominori的基因组DNA,从λDASH II载体制备基因组文库来进行染色体步行。IR24是携带Rf-1的品种,而Asominori是不携带Rf-1的品种。染色体步行的结果是,从IR24的基因组克隆中制备了覆盖约76kp的染色体区域的重叠群(染色体上的重叠克隆的按序排列的组(odered set)),进而确定了其整个碱基序列(76363bp)。
然后,根据所获得的碱基序列数据等新开发了12个标记,并对上述接近Rf-1位点的10个重组体进行高精度分离分析(实施例3)。结果是,包括在上述约76kb的染色体区域中的65kb序列显示包含确定Rf-1基因功能存在的序列。这个区域被由8个基因组克隆组成的重叠区所覆盖。每个克隆长度为约12-22kb,并且具有至少为4.7kb的重叠结构域。已知水稻基因的长度范围很广(从短到长),但看来大部分基因的长度为几个kb或更短。因此,这8个基因组克隆中至少有一个预期包含全长的Rf-1基因。
我们进一步在上述约76kb的染色体区域中限定Rf-1基因区域,并进行互补分析以直接证明育性恢复能力的存在。
具体而言,通过遗传工程技术将上述76kb区域中的10个部分片段(每个10-21kb)分别导入雄性不育系MS Koshihikari的未成熟种子中(图5)。在所利用的10个部分片段中,8个片段来自于先前通过染色体步行所获得的8个基因组克隆(图1中所示的XSE1、XSE7、XSF4、XSF20、XSG22、XSG16、XSG8和XSH18,并在实施例3中描述)。此外,来自于两个克隆XSF18和XSX1的片段也进行了互补分析。XSF18在5′和3′末端与XSF20是相同的(分别是SEQ ID NO:27的第20328位和41921位碱基),但缺乏中间的第33947-38591位碱基。这是因为克隆XSF18是最初分离的,但在分离后的扩增中发现包含上述缺失,因此重新进行扩增步骤来分离标为XSF20的完整克隆(实施例8)。XSX1是从克隆XSG8和XSH18,通过限制性内切酶处理并连接以包含足够的重叠结构域而重新制备的,因为两克隆的重叠结构域相对较小(约7kb)(实施例13)。
由于Rf-1是显性基因,如果插入片段完全包含Rf-1基因,转化的个体在当代即恢复育性。在互补分析中,评估用每个片段转化的植株的种子育性,以发现用来源于λ噬菌体克隆XSG16的15.6kb片段(包括SEQ ID NO:27的第38538-54123位的碱基)转化的恢复种子育性的植株(实施例10)。用其它片段转化的植株全都是不育的。这些结果表明上述15.6kb片段完全包含Rf-1基因。而且,本发明提供的通过遗传工程技术导入Rf-1基因的方法证明是有效的。
为了进一步详细说明λ噬菌体克隆XSG16中包含Rf-1基因的区域,我们通过互补分析评估比15.6kb片段(包括SEQ ID NO:27的第38538-54123位碱基)更短的片段的种子育性。结果是,用来自XSG16的11.4kb片段(包括SEQ ID NO:27的第42357-53743位碱基)转化的植株显示恢复种子育性(实施例10(2))。用更短的6.8kb片段(包括SEQ ID NO:27的第42132-48883位碱基)转化的植株也恢复种子育性(实施例10(3))。这些结果表明上述6.8kb片段包含Rf-1基因。
本发明进一步继续研究和鉴定具有恢复育性功能的核酸。已经证实了由核酸编码的氨基酸序列。具体地,首先利用如实施例14-15所描述的PCR制备相应于SEQ ID NO:27的第43733-44038位和48306-50226位碱基的DNA片段。利用上述的两个DNA片段作为探针(探针P和Q)筛选从导入Rf-1基因的Koshihikari品系制备的cDNA文库。结果是,6个克隆的末端碱基序列与XSG16的序列相同,分离这6个含有Rf-1基因的克隆,并且分析其碱基序列(SEQ ID NOS:69-74)。
所有的序列,SEQ ID NOS:69-74编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每个SEQ ID NO:69的第215-2587位,SEQ ID NO:70的第213-2585位的碱基,SEQ ID NO:71的第218-2590位的碱基,SEQ ID NO:72的第208-2580位的碱基,SEQ ID NO:73的第149-2521位的碱基和SEQ ID NO:74的第225-2597位的碱基编码具有SEQID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ ID NO:27的第43907-46279位的碱基。
将SEQ ID NO:75的氨基酸序列与推测的玉米育性恢复基因(Rf2)的氨基酸序列比较,两个氨基酸序列中N-末端的7个氨基酸残基(Met-A1a-Arg-Arg-Ala-Ala-Ser)都同时存在。这7个氨基酸残基被认为是线粒体的靶信号部分(Liu等人,2001)。根据上述事实,认为这种情形下分离的cDNAs包含Rf-1基因的全部编码区域。除了上述区域外,没有发现水稻Rf-1和玉米Rf-2的氨基酸序列之间的同源性。
此外,将这种情形下分离的cDNAs序列与IR24(SEQ ID NO:27)的基因组序列比较,证明了Rf-1基因外显子和内含子的结构(图7)。结果是,在植株体内显示多种转录产物中剪接模式和poly A的加入位置是不同的。Rf-1基因的编码区域中没有内含子。
对于在实施例10(3)的互补分析中恢复种子育性的6.8kb片段,本发明者进一步继续互补分析。具体地,在实施例16中,对包含启动子区域的4.2kb片段(SEQ ID NO:27的第42132-46318位的碱基)和上述6.8kb片段内Rf-1基因的假定翻译区域进行互补分析,4.2kb片段恢复种子育性。
进一步地,在实施例17中,获得6个包含具有育性恢复功能的核酸的新克隆。具体地,利用相应于SEQ ID NO:27的第45522-45545和45955-45932位碱基的引物,以及IR24的基因组克隆XSG16作为模板进行PCR以获得DNA片段。利用DNA片段作为探针R和上述提到的探针P进行噬菌斑杂交分析。从对探针P和探针R为阳性的噬菌斑新获得6个克隆(#7-#12)。结果显示在SEQ ID NOS:80-85中。
推测所有的序列,SEQ ID NOS:80-85编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每个SEQ ID NO:80的第229-2601位,SEQ ID NO:81的第175-2547位的碱基,SEQ ID NO:82的第227-2599位的碱基,SEQ ID NO:83的第220-2592位的碱基,SEQ ID NO:84的第174-2546位的碱基和SEQ ID NO:85的第90-2462位的碱基编码具有SEQ ID NO:75的1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将这种情形下分离的cDNAs序列与IR24(日本专利公开No.2001-285247,SEQ ID NO:27)的基因组序列比较,证明了外显子和内含子的结构(图8)。这种情况下分离的cDNAs之间,3个cDNAs没有任何与推测的翻译区域不相关的外显子,并且由单个的外显子组成(#10-#12,SEQ ID NOS:83-85)。
III.包含Rf-1位点的核酸
本发明提供包含育性恢复基因位点(Rf-1)的核酸。本发明所述包含育性恢复基因位点(Rf-1)的核酸包括具有SEQ ID NO:27的碱基序列或具有与SEQ ID NO:27的碱基序列至少70%相同,并有恢复育性功能的的碱基序列。进一步如实施例10中所描述的,证实Rf-1基因尤其完全包含于SEQ IDNO:27的第38538-54123位的碱基序列中。更进一步的,确定包含Rf-1基因的区域优选是SEQ ID NO:27的第38538-54123位碱基,更优选是第42357-53743位碱基,更加优选是第42132-48883位碱基,以及还优选第42132-46318位碱基。
本发明人进一步继续研究,确定下列区域是含有Rf-1基因的核酸。
a)SEQ ID NO:69的第215-2587位的碱基;
b)SEQ ID NO:70的第213-2585位的碱基;
c)SEQ ID NO:71的第218-2590位的碱基;
d)SEQ ID NO:72的第208-2580位的碱基;
e)SEQ ID NO:73的第149-2521位的碱基;
f)SEQ ID NO:74的第225-2597位的碱基;
h)SEQ ID NO:80的第229-2601位的碱基;
i)SEQ ID NO:81的第175-2547位的碱基;
j)SEQ ID NO:82的第227-2599位的碱基;
k)SEQ ID NO:83的第220-2592位的碱基;
l)SEQ ID NO:84的第174-2546位的碱基;和
m)SEQ ID NO:85的第90-2462位的碱基。
上述碱基序列相应于g)SEQ ID NO:27的第43907-46279位的碱基;并且所有的碱基编码SEQ ID NO:75的第1-791位的氨基酸序列。
在此后的本说明书中,术语“SEQ ID NO:27的碱基序列”指SEQ IDNO:27的全部碱基序列或其对育性恢复功能起作用的部分序列,特别是第38538-54123位的碱基。该术语更优选的指第42357-53743位的碱基,还优选指第42132-48883位的碱基,还更优选指第42132-46318位的碱基。以及最优选,它指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQID NO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQ ID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ IDNO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQ ID NO:85的第90-2462位的碱基。
在下面的实施例中,从含有Rf-1基因的籼稻水稻IR24基因组文库中分离了包含育性恢复基因(Rf-1)的核酸,并且确定其具有SEQ ID NO:27的碱基序列。然而,本发明的包含育性恢复基因(Rf-1)的核酸可来源于任何携带RF-1基因的籼稻品种。携带Rf-1基因的籼稻品种包括,但不特异地限于,例如IR24、IR8、IR36、IR64、Chinsurah和BoroII。已知的不携带Rf-1基因的粳稻品种包括,但不限于,例如Asominori、Koshihikari、Kirara 397、Akihikari、Akitakomachi、Sasanishiki、Kinuhikari、Nipponbare、Hatsuboshi、Koganebare、Hinohikari、Mineasahi、Aichinokaori、Hatsushimo、Akebono、Fujihikari、Minenoyukimochi、Kokonoemochi、Fukuhibiki、Dontokoi、Gohyakumangoku、Hanaechizen、Todorokiwase、Haenuki、Domannaka、Yamakikari等。“籼稻”和“粳稻”品种对本领域的技术人员来说是众所周知的,并且本发明所包括的水稻品种对本领域的技术人员而言也是容易确定的。
本发明的核酸包括单链和双链形式的DNA,及其互补的RNA。DNA包括,例如,基因组DNA(包括相应的cDNA)、化学合成的DNA、由PCR扩增的DNA,及其组合。
本发明的包含Rf-1基因的核酸优选具有SEQ ID NO:27的碱基序列。不只一个密码子可编码相同的氨基酸,这称为遗传密码的简并性。因此,与SEQ ID NO:27不完全相同的DNA序列可能与具有SEQ ID NO:27编码完全相同的氨基酸序列的蛋白质。这种变体DNA序列可能是由于沉默突变导致的(例如在PCR扩增过程中产生),或也可能是天然序列的故意(deliberate)诱变的产物。
优选的,本发明的Rf-1基因编码SEQ ID NO:75中所描述的氨基酸序列。然而,其不只限于此,并且可编码其中缺失、添加或取代一个或多个氨基酸残基的氨基酸序列。
本发明的蛋白质包括任何同源的蛋白质,只要其具有育性恢复功能。“氨基酸变异”发生在一个或多个氨基酸残基,优选1-20,更优选1-10,最优选1-5个氨基酸残基。由Rf-1基因编码的氨基酸序列与SEQ ID NO:75的氨基酸序列具有至少约70%,优选约80%或更大,更优选约90%或更大,还优选约95%或更大,以及最优选约98%或更大的同一性。
氨基酸的同一性百分数可通过目测和数学计算来确定。两个蛋白质序列之间的同一性百分数可通过基于Needleman,S.B.和Wunsch,C.D.(J.Mol.Biol.,48:443-453,1970)算法比较序列信息,并利用可从威斯康星(Wisconsin)大学遗传计算机组(UWGCG)获得的GAP计算机程序来确定。“GAP”计算机程序优选的默认参数包括:(1)如Henikoff,S和Henikoff,J.G.(Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)所描述的积分矩阵,blosum62;(2)对于每个缺口(gap)罚分(penalty)为12;(3)对于每个缺口的每个长度罚分为4;以及(4)对于末端缺口不罚分。
也可使用本领域的技术人员用于序列比较的其他程序。例如,同一性百分数可通过利用如Altschul等人(核酸研究Nucl.Acids.Res.25.,第3389-3402页,1997)所描述的BLAST程序比较序列信息来确定。该程序可从国家生物技术信息中心(NCBI)的网点,或国际互联网上的日本DNA数据库(DDBJ)的网点获得。关于经BLAST程序的同源性搜索的各种因素(参数)在该网点上有详细描述。通常利用默认参数进行搜索,也可适当改变一些设置。
本领域的技术人员众所周知,即使具有相同功能的蛋白质,根据其来自不同的品种而具有不同的氨基酸序列。本发明的Rf-1基因包括SEQ IDNO:27所示碱基序列的同系物和变体,只要它们具有恢复育性的功能。术语“具有恢复育性的功能”指当这种DNA片段导入后可使水稻植株个体或其种子获得育性。育性恢复可能是由于经Rf-1基因的蛋白表达或可赋予育性的Rf-1基因核酸(DNA或RNA)本身的一些功能所导致。
Rf-1基因同系物或变体是否具有育性恢复功能可通过下面列举的方法来检验,但并不限于此。将待测核酸片段导入到根据Hiei等人(植物杂志Plant Journal(1994),6(2),第272-282页)的方法,用MS-FR Koshihikari对MS Koshihikari(不育系)进行授粉而获得的未成熟种子中。所获得的转化体在正常条件下进行培养,只有被测核酸片段具有育性恢复功能时,种子才能成熟。
来源于不携带Rf-1基因的粳稻Asominori相应区域的核酸具有如SEQID NO:28所示的碱基序列。SEQ ID NO:28和SEQ ID NO:27的相应部分大体上有约98%的同一性。因此,本发明的包含育性恢复基因(Rf-1)位点的核酸与SEQ ID NO:27至少约70%,优选约80%或更大,更优选90%或更大,还更优选95%或更大,最优选98%或更大%的同一性。特别的,术语“SEQ IDNO:27”指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQ IDNO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQ ID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ IDNO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQ ID NO:85的第90-2462位的碱基中的任何一项。
核酸的同一性百分数可通过目测和数学计算来确定。备选地,两个核酸序列之间的同一性百分数可利用如Devereux等人,核酸研究Nucl.AcidsRes.,12:387(1984)所描述的,并可从威斯康星大学遗传计算机组(UWGCG)获得的GAP计算机程序,6.0版本来比较序列信息而确定。GAP程序优选的默认参数包括:(1)碱基的一元比较矩阵(包含相同时值为1,不同时值为0),以及Gribskov和Burgess,核酸研究Nucl.Acids Res.,14:6745(1986)的加权(weighted)比较矩阵,如Schwartz和Dayhoff编辑的蛋白质序列和结构的图集Atlas of Protein Sequence and Structure,国家生物医学研究基金会National Biomedical Research Foundation,第353-358页所描述的;(2)对于每个缺口罚分为3.0,对于每个缺口中的每个记号(symbol)额外罚分为0.10;以及(3)对于末端缺口不罚分。也可以采用本领域技术人员用于序列比较的其它程序。
本发明的核酸也包括在中等严谨条件下能与SEQ ID NO:27的碱基序列进行杂交并具有育性恢复功能的核酸,以及在高度严谨条件下能与SEQID NO:27的碱基序列进行杂交并具有育性恢复功能的核酸。
如在此所使用的,本领域技术人员可根据例如,DNA的长度容易地确定中等严谨的条件。基本条件如Sambrook等人,分子克隆:实验室指南Molecular Cloning:A Laboratory Manual,第二版,Vol1,第1.101-104页,冷泉港实验室出版社,(1989)所阐述的,并包括利用硝化纤维素滤膜的预洗溶液,5×SSC,0.5%SDS,1.0mM EDTA(pH8.0),杂交条件为约1×SSC-6×SSC,于约40℃-60℃(或其它类似的杂交溶液,如Stark’s溶液,约50%甲酰胺中,于约42℃),以及洗涤条件为在约60℃,0.5×SSC,0.1%SDS。当杂交溶液包含约50%甲酰胺时,杂交温度可降低约15-20℃。本领域技术人员也可根据例如DNA的长度容易地确定高度严谨的条件。通常,高度严谨的条件包括相对于上述中等严谨的条件而言,其杂交和/或洗涤条件为在更高温度和/或更低的盐浓度下进行。例如,这些条件包括,杂交条件为0.1×SSC-0.2×SSC,在约60-65℃和/或洗涤条件为0.2×SSC,0.1%SDS在约65-68℃。本领域技术人员认识到可根据例如探针长度的因素来必要的调节温度和洗涤溶液的盐浓度。
特别优选的,“SEQ ID NO:27”指g)SEQ ID NO:27的第43907-46279位的碱基,或备选的指其相应的a)SEQ ID NO:69的第215-2587位的碱基;b)SEQ ID NO:70的第213-2585位的碱基;c)SEQ ID NO:71的第218-2590位的碱基;d)SEQ ID NO:72的第208-2580位的碱基;e)SEQ ID NO:73的第149-2521位的碱基;f)SEQ ID NO:74的第225-2597位的碱基;h)SEQID NO:80的第229-2601位的碱基;i)SEQ ID NO:81的第175-2547位的碱基;j)SEQ ID NO:82的第227-2599位的碱基;k)SEQ ID NO:83的第220-2592位的碱基;l)SEQ ID NO:84的第174-2546位的碱基;或m)SEQID NO:85的第90-2462位的碱基中的任何一项。
本发明的DNA也包括由于缺失、插入或取代一个或多个碱基而不同于SEQ ID NO:27的碱基序列,但仍保持育性恢复功能的核酸。只要保持育性恢复功能,缺失、插入或取代碱基的数目没有特别的限制,但优选为1至数千个,更优选1-1000,还更优选1-500,甚至更优选1-200,最优选1-100个碱基。
根据本说明书在此的描述,Rf-1基因已经进一步得到说明,并且本领域技术人员可以在除去例如除Rf-1基因之外的区域或Rf-1基因中内含子区域的核酸后而加以利用。可例如通过用具有相似理化特性的残基替换给定的氨基酸(特别的,SEQ ID NO:75的氨基酸序列)。这种保守取代的实例包括将一个脂肪族残基变化为另一个,例如将Ile、Val、Leu或Ala中的一个变化为另一个;将一个极性残基变化为另一个,例如在Lys和Arg、Glu和Asp、或Gln和Asn之间的变化;或一个芳香族残基变化为另一个,例如将Phe、Trp或Tyr中的一个变化为另一个。其它已知的保守取代包括,例如在具有相似疏水特性的整个区域之间的变化。本领域技术人员可利用如Sambrook等人分子克隆:实验室指南Molecular Cloning:A LaboratoryManual,第二版,冷泉港实验室出版社,(1989)所描述的,已知的遗传工程技术,利用例如位点特异性突变引入所需要的缺失、插入或取代。
我们将携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24与不携带Rf-1基因,如Asominori(SEQ ID NO:28)和GenBank保藏的Nipponbare BAC克隆(登录号AC068923)的粳稻品种进行比较。结果,我们发现含有Rf-1基因的籼稻品种的Rf-1区域至少具有下述的单个碱基多态性(SNP)。
1)与SEQ ID NO:27的第1239位碱基相应的碱基是A;
2)与SEQ ID NO:27的第6227位碱基相应的碱基是A;
3)与SEQ ID NO:27的第20680位碱基相应的碱基是G;
4)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
5)与SEQ ID NO:27的第49609位碱基相应的碱基是A;
6)与SEQ ID NO:27的第56368位碱基相应的碱基是T;
7)与SEQ ID NO:27的第57629位碱基相应的碱基是C;以及
8)与SEQ ID NO:27的第66267位碱基相应的碱基是G。
因此,本发明包含Rf-1区域的核酸优选地符合上述1)-8)中一个至全部的条件。
在下面的实施例3中,在Rf-1区域中检测最接近Rf-1基因的重组体(RS1-RS2,RC1-RC8)的染色体组织结构。结果显示确定Rf-1基因功能存在的序列包含于SEQ ID NO:27的第1239-66267位的碱基序列,即在最大可能估计的P4497 MboI-B56691 XbaI位点之间的区域(约65kb)(图3)。然而,可能对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,而不管其余区域是粳稻还是籼稻基因型,其遗传功能可能没有显著的变化。可能还有一个极端的情况,在粳稻与籼稻之间,编码区域是完全相同的而只有启动子区域不同;并且启动子区域和编码区域只部分的包含在P4497 MboI-B56691 XbaI位点之间(约65kb)的区域内。因此,不能得出结论认为上述的普通籼稻区域(SEQ ID NO:27的第1239-66267位碱基)完全包含了完整的Rf-1基因。然而,认为至少SEQ ID NO:27完全包含了完整的Rf-1基因,原因如下:
1)基因的大小通常为几千个碱基而很少超过10kb;
2)由本发明确定的IR24基因组碱基序列(SEQ ID NO:27)完全包含上述的普通籼稻区域;
3)SEQ ID NO:27的5′末端位于上述普通籼稻区域5′末端的上游1238bp处,并形成另一个基因的一部分(S12564);以及
4)SEQ ID NO:27的3′末端位于上述普通籼稻区域3′末端的下游10096bp处。
如此,我们第一次成功的将Rf-1基因的区域限定到76kb内。因此,相对于现有技术,例如日本专利公开No.2000-139465中所描述的,用与Rf-1基因的遗传距离为约1cM(约300kb)的共显性标记所选择出来的核酸,本发明包含Rf-1基因区域的核酸含有与Rf-1基因接近的其它基因的可能性大大减少。而且,相对于我们现有的日本专利申请No.2000-247204中所描述的,用DNA标记位点S12564 Tsp509I和C1361 MwoI(其间的距离为约0.3cM)所选择出来的核酸,本发明上述的核酸含有其它基因的可能性也减少了。
我们进而通过互补分析证实Rf-1基因完全包含在特别为SEQ IDNO:27碱基序列的第38538-54123位碱基中。因而,在本发明的一个实施方案中,与SEQ ID NO:27的碱基序列或与SEQ ID NO:27第38538-54123位碱基的碱基序列至少70%相同的碱基序列至少符合下面条件1)和2)中的至少一个:
1)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
2)与SEQ ID NO:27的第49609位碱基相应的碱基是A。
本发明人进一步确定下列区域为含有Rf-1基因的核酸。
a)SEQ ID NO:69的第215-2587位的碱基;
b)SEQ ID NO:70的第213-2585位的碱基;
c)SEQ ID NO:71的第21 8-2590位的碱基;
d)SEQ ID NO:72的第208-2580位的碱基;
e)SEQ ID NO:73的第149-2521位的碱基;
f)SEQ ID NO:74的第225-2597位的碱基;
h)SEQ ID NO:80的第229-2601位的碱基;
i)SEQ ID NO:81的第175-2547位的碱基;
j)SEQ ID NO:82的第227-2599位的碱基;
k)SEQ ID NO:83的第220-2592位的碱基;
l)SEQ ID NO:84的第174-2546位的碱基;和
m)SEQ ID NO:85的第90-2462位的碱基。
上述碱基序列相应于g)SEQ ID NO:27的第43907-46279位的碱基。本发明的核酸进一步包括
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
SEQ ID NO:27的第45461位碱基相应于1)SEQ ID NO:69的第1769位碱基;2)SEQ ID NO:70的第1767位碱基;3)SEQ ID NO:71的第1772位碱基;4)SEQ ID NO:72的第1762位碱基;5)SEQ ID NO:73的第1703位碱基;6)SEQ ID NO:74的第1779位碱基;7)SEQ ID NO:80的第1783位碱基;8)SEQ ID NO:81的第1729位碱基;9)SEQ ID NO:82的第1781位碱基;10)SEQ ID NO:83的第1774位碱基;11)SEQ ID NO:84的第1728位碱基;以及12)SEQ ID NO:85的第1644位碱基。因此,特别优选的,用于本发明方法的的核酸符合下列条件1)-12)中的至少一个:
1)与SEQ ID NO:69的第1769位碱基相应的碱基是A;
2)与SEQ ID NO:70的第1767位碱基相应的碱基是A;
3)与SEQ ID NO:71的第1772位碱基相应的碱基是A;
4)与SEQ ID NO:72的第1762位碱基相应的碱基是A;
5)与SEQ ID NO:73的第1703位碱基相应的碱基是A;
6)与SEQ ID NO:74的第1779位碱基相应的碱基是A;
7)与SEQ ID NO:80的第1783位碱基相应的碱基是A;
8)与SEQ ID NO:81的第1729位碱基相应的碱基是A;
9)与SEQ ID NO:82的第1781位碱基相应的碱基是A;
10)与SEQ ID NO:83的第1774位碱基相应的碱基是A;
11)与SEQ ID NO:84的第1728位碱基相应的碱基是A;或
12)与SEQ ID NO:85的第1644位碱基相应的碱基是A。
IV.恢复水稻育性的方法
本发明提供用于恢复水稻育性的方法,包括将核酸导入到水稻中,其中所述核酸具有SEQ ID NO:27所示的碱基序列或具有与SEQ ID NO:27的碱基序列至少70%相同,并具有恢复育性功能的碱基序列。本发明的方法可包将核酸导入到水稻中,其中所述核酸具有SEQ ID NO:27的部分,尤其是SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选42132-48883位碱基,或具有与SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基至少70%相同,并具有恢复育性功能的碱基序列。
在本发明特别优选的实施方案中,将编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,并具有恢复育性功能的核酸导入水稻。最优选的,编码SEQ ID NO:75的氨基酸序列,或与SEQ ID NO:75的氨基酸序列至少70%相同,并具有恢复育性功能的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
在本发明中,可导入水稻的包含育性恢复基因(Rf-1)位点的核酸,可以是上述在“III.包含Rf-1位点的核酸”中描述的任何一个核酸。用于将核酸导入水稻的方法可以是任何已知的方法,而没有特别的限制。本发明的核酸可通过已知的遗传工程技术或杂交而导入。遗传工程技术是优选使用的,因为可以防止包含其它邻近基因,并能缩短建立品系的周期。
可以使用遗传工程技术中任何用于转导的合适的表达系统。重组表达载体包括可被导入水稻的,含有本发明育性恢复基因(Rf-1)的核酸,该核酸可操作的连接于例如来源于哺乳动物、微生物、病毒或昆虫基因的合适的转录或翻译调节序列。
调节序列的实例包括转录启动子、操纵子或增强子、mRNA核糖体结合位点以及调控转录和翻译起始和终止的合适序列。当调节序列功能性地与DNA序列关联时,将碱基序列可操作地连接于调控序列。因此,如果启动子碱基序列控制DNA序列的转录,则将启动子碱基序列可操作连接于该DNA序列。通常将使DNA在水稻中能够复制的复制原点,和用于鉴定转化体的选择基因整合到表达载体中。对于可选择的标记,常规使用的可选择标记都可通过标准方法来使用。实例是针对抗生素,如四环素、氨苄青霉素、卡那霉素、新霉素、潮霉素或壮观霉素的抗性基因。
此外,可将编码合适信号肽(水稻本身或异源的)的序列整合到表达载体中。可将信号肽的DNA序列(分泌前导区)与本发明的核酸序列以读框内的方式融合,以便DNA开始转录,并且mRNA翻译成为含有信号肽的融合蛋白。
本发明也提供包含本发明基因的重组载体。用于将本发明基因的DNA片段整合到例如质粒的载体中的方法,在例如Sambrook,J.等人,分子克隆,实验室指南Molecular Cloning,A Laboratory Manual,(第二版),冷泉港实验室,1.53(1989)中有描述。商业上可获得的连接试剂盒(例如,购自TAKARA)使用非常方便。进而将获得的重组载体(如重组质粒)转化到宿主水稻细胞中。
通过标准方法将所需要的基因与本领域中可获得的重组载体(如质粒DNA)连接而方便的制备得到载体。植物转化载体尤其适合于利用本发明的核酸片段来赋予水稻育性。对用于植物的载体没有特别的限制,只要它们在植物细胞中能够表达令人感兴趣的基因而产生蛋白质,但优选地包括pBI221、pBI121(Clontech)、和其衍生的载体。尤其是,用于转化属于单子叶植物的水稻的载体包括pIG121Hm和pTOK233(Hiei等人,Plant J.,6,271-282(1994)),和pSB424(Komari等人,Plant J.,10,165-174(1996))。
通过用本发明的核酸片段替换上述载体中的β-葡糖苷酸酶(GUS)基因而构建植物转化载体,并转染到植物中来制备转基因植物。植物转化载体优选至少包括启动子、起始密码子、所需要的基因(本发明的核酸序列或其部分)、终止密码子和终止子。如果需要也可以包含编码信号肽的DNA、增强子序列、所需要基因的5′和3′非翻译区、可选择的标记区域等。只要能在植物细胞中发挥作用,对启动子和终止子没有特别的限制,其中组成型表达启动子包括最初已包含在上述载体中的35S启动子,以及肌动蛋白和遍在蛋白(ubiquitin)基因的启动子。
用于将质粒导入宿主细胞的合适方法包括利用磷酸钙或氯化钙/氯化铷、电穿孔、电注射、用PEG等化学处理,使用基因枪等,其在Sambrook,J.等人,分子克隆,实验室指南Molecular Cloning,A Laboratory Manual,(第二版),冷泉港实验室,1.74(1989)中有描述。可通过例如叶盘法[科学Science,227,129(1985)]或电穿孔法[自然Nature,319,791(1986)]来转化植物细胞。
将基因转导入植物的方法包括利用农杆菌(Agrobacterium)介导(Horsch等人,科学Science,227,129(1985);Hiei等人,Plant J.,6,271-282(1994))、电穿孔(Fromm等人,自然Nature,319,791(1986))、PEG(Pazkowski等人,EMBOJ.,3,2717(1984))、微注射(Crossway等人,Mol.Gen.Genet.,202,179(1986))、粒子轰击(McCabe等人,Bio/Technology,6,923(1988))。对这些方法没有特别的限制,只要它们适合于将核酸转导入所需要的植物中。
经杂交的转导可如下举例进行。首先,将Rf-1供体亲本与粳稻品种杂交获得的F1,与粳稻品种回交。在所得到的植株个体中筛选在S12564Tsp509I位点纯合的粳稻和在P4497 MboI和B53627 BstZ17I位点杂合的个体,并进一步进行回交。在所得到的植株个体中筛选在P4497 MboI和B56691 XbaI位点杂合的个体和在B53627 BstZ17I位点杂合的粳稻,并进一步进行回交。随后,对在P4497 MboI和B56691 XbaI位点杂合的个体的每个回交后代进行筛选并用于后继的回交,重复进行约10个循环。最终,将在P4497 MboI和B56691 XbaI杂合的个体进行自交,并在所得到的个体中筛选在两个位点都是纯合的籼稻,由此就获得遗传来自Rf-1供体亲本的,P4497 MboI-B56691 XbaI之间有限的染色体区域的恢复系。
根据本发明,分离包含育性恢复基因(Rf-1)的核酸,由此利用遗传工程方法将Rf-1基因导入到水稻品种中以建立恢复系。本发明首次成功地将Rf-1区域限定在76kb或更窄的区域内。因此,本发明的包含Rf-1位点的核酸,相对现有技术而言,极大的减少了含有与Rf-1基因邻近的其它基因的可能性。而且,通过本发明确定了包含Rf-1基因区域的全部碱基序列。根据在此的说明书,本领域技术人员可对Rf-1基因本身进行进一步的分析。因而,可以只导入Rf-1基因,而不包括任何邻近基因。当邻近基因带来有害性状时,这是尤其重要的。此外,可以比通过杂交所获得的,在更短的时间内,如1-2年内建立恢复系。
在实施例4-13和17在此所描述的互补分析中,通过农杆菌介导法,用来自图5中所描述的10个克隆的片段实际转化MS Koshihikari(具有BT型细胞质且核心基因基本上与Koshihikari相同)。结果证明,可从包含SEQID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基的碱基序列的核酸建立育性恢复系。
用于建立水稻恢复系的农杆菌介导法在Hiei等人,Plant J.,6,第271-282页(1994)、Komari等人,Plant J.,10,第165-174页(1996)、Ditta等人,Proc.Natl.Acad.Sci.USA 77:第7347-7351(1980)中有描述,但不限于此。
首先,制备含有待插入的令人感兴趣的核酸片段的质粒载体。合适的质粒载体包括例如具有如Komari等人,Plant J.,10,第165-174(1996),同上所描述的质粒图谱的pSB11、pSB22等。备选的,本领域技术人员自己也可根据如上所述的pSB11、pSB22的质粒载体来构建适合的载体。在下面的实施例中,以pSB11为基础制备具有潮霉素抗性基因盒的中间载体pSB200并加以利用。具体地,首先将胭脂碱合酶终止子(Tnos)与遍在蛋白启动子和遍在蛋白内含子融合(Pubi-ubiI)。将潮霉素抗性基因(HYG(R))插入到所得到的Pubi-ubiI-Tnos复合体的ubiI和Tnos之间,以产生Pubi-ubiI-HYG(R)-Tnos组合件。将该组合件与pSB11(Komari等人,如上)的HindIII/EcoRI片段融合以产生pKY205。将用于添加限制性内切酶位点NotI、NspV、EcoRV、KpnI、SacI、EcoRI的接头序列插入到该pKY205的Pubi的上游HindIII位点,以产生具有潮霉素抗性基因盒的pSB200。
然后,用包含插入核酸的重组载体转化大肠杆菌细胞(例如DH5α、JM109、MV1184,均可从例如TAKARA商业购买得到)。
因此,根据例如Ditta等人(1980)的方法将转化的大肠杆菌细胞用于与农杆菌菌株,优选同时与辅助大肠杆菌菌株组合)进行三亲杂配。合适的农杆菌菌株包括根瘤农杆菌(Agrobacterium tumefaciens)菌株,如LBA4404/pSB1、LBA4404/pNB1、LBA4404/pSB3等。它们均具有Komari等人,Plant J.,10,第165-174页(1996),同上中所描述的质粒图谱,且本领域技术人员也可利用它们来构建载体。合适的辅助大肠杆菌菌株包括但不限于,例如HB101/pRK2013(可从Clontech获得)。有报道显示携带pRK2073的大肠杆菌细胞也可用作辅助大肠杆菌,虽然它们并不常用(Lemas等人,质粒Plasmid 1992,27,第161-163页)。
然后,根据例如Hiei等人(1994)的方法将欲交配的农杆菌细胞转化到雄性不育的水稻中。通过例如用粳稻品种对雄性不育水稻进行授粉来制备为转化所需的未成熟水稻种子。
可通过例如评估直立(standing)植株中抽穗后约1个月的种子育性来评估转化植物中育性的恢复。对直立植株的评估指观察田间生长的植株等。备选的方法是对穗中谷粒成熟的百分率进行实验室研究。
V.鉴定Rf-1基因存在的方法
根据本发明,表明确定Rf-1基因功能存在的序列定位于水稻第10号染色体上多态性检测标记位点P4497 MboI和B56691 XabI之间。而且,互补分析证实Rf-1基因完全包含于尤其是SEQ ID NO:27碱基序列的第38538-54123位碱基中。
将携带Rf-1(SEQ ID NO:27)基因的籼稻品种IR24与不携带所述基因(Asominori(SEQ ID NO:28)和Nipponbare BAC克隆AC068923)的粳稻品种进行比较,表明两品种之间存在多态性。结果是,根据在Rf-1基因附近区域中碱基序列的多态性,就能够方便、快速和准确地鉴定待测水稻植株或种子是否携带Rf-1基因。
因此,本发明也提供用于鉴定待测水稻个体或其种子是否具有Rf-1基因的方法,其中该方法利用可确定Rf-1基因功能存在的序列定位于水稻第10号染色体上多态性检测标记位点P4497 MboI和B56691 XabI之间这一事实。
可通过任何已知的方法检测多态性。例如,已知的方法包括分析限制性片段长度多态性(RFLPs)、通过测序直接确定、用识别8个碱基的限制性内切酶切割基因组DNA,然后放射性标记末端,并进一步用识别6个碱基或4个碱基的限制性内切酶切割标记的消化物,继而通过双向电泳研究消化产物(RLGS,限制性界标基因组扫描(restriction landmark genomescanning));等。也已经开发AFLP分析(扩增的片段长度多态性,P.Vos等人,核酸研究Nucleic Acids Res.Vol.23,第4407-4414页(1995)),其中通过聚合酶链式反应(PCR)来扩增/检测RFLP。
例如,涉及通过PCR扩增来检测RFLP(将RFLP标记转化为PCR标记)或通过PCR扩增来检测微卫星中的多态性(微卫星标记)的常规方法将在下面例证说明。
将RFLP标记转化为PCR标记
A.基于相应于RFLP探针的基因组区域中多态性的PCR标记(D.E.Harry,B.Temesgen,D.B.Neale;Codominant PCR-based marker for pinus taedadeveloped from maped cDNA clones,Theor. Appl.Genet.(1998)97:第327-336页)。在利用针对RFLP标记探针序列设计的引物进行基因组PCR后(“RFLP”是用DNA片段作为探针通过Southern分析而观察到的多态性。用作探针的DNA片段的碱基序列称为“RFLP标记探针序列”),可通过下列两个方法中的任一个制备PCR标记。第一种方法涉及用一系列的限制性内切酶处理产物以搜寻产生片段长度多态的限制酶,而第二种方法涉及通过比较品种间产物的碱基序列而搜寻多态性,并根据该多态性制备PCR标记。
B.基于产生RFLP位点鉴定的PCR标记。通过鉴定存在于RFLP标记探针序列中或接近RFLP标记探针序列(通常在几个kb内)的产生RFLP位点(只由两个比较品种中的一个携带的限制性内切酶识别位点)来获得PCR标记。
微卫星标记
微卫星是基因组中大量存在的约2-4个碱基,如(CA)n的重复序列。如果品种间多态性以重复的数目发生,则可利用邻近区域中设计的引物通过PCR扩增,在PCR产物的长度中观察多态性,由此可以检测到DNA多态性。利用微卫星检测多态性的标记称为微卫星标记(O.Parnaud,X.Chen,S.R.McCouch,Mol.Gen.Genet.(1996)252:第597-607页)。
本发明中用于检测多态性的方法也没有特别限制。从效率和方便角度考虑,PCR-RFLP是优选的,其将PCR和RFLP结合来由其限制性内切酶切割模式鉴定多态性,其中该多态性存在于由PCR扩增的DNA片段的序列中不同品系间内切酶的识别位点。PCR-RFLP也称为CAPS(切割扩增的多态性序列)。如果在显示多态性的区域中不存在任何适合的限制性内切酶识别位点时,也可利用称为dCAPS(衍生的切割扩增的多态性序列)的改进的CAPS,其中在PCR期间引入限制性内切酶位点(Michaels,S.D.和Amasino,R.M.(1998),植物杂志The Plant Journal 14(3)381-385;A.Konieczny等人,(1993),Plant J.4(2)第403-410页;Neff,M.M.,Neff,J.D.,Chory,J.和Pepper,A.E.(1998),植物杂志The Plant Journal 14(3)387-392)。这些方法在下面详细说明。
CAPS,dCAPS
本发明的鉴定方法包括,但不限于:
i)根据在籼稻和粳稻品种间,在Rf-1位点和其邻近区域的碱基序列中显示多态性的位点的碱基序列来制备引物对以扩增所述的碱基序列;
ii)利用被测水稻个体或其种子的基因组DNA作为模板进行核酸扩增反应;以及
iii)根据在核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子是否具有Rf-1基因。
制备第i)中引物对优选包括下述任何一种方式:
a)在核酸扩增产物的多态性中存在缺失区的变化时,则根据缺失区的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;
b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化时,则根据碱基改变位点的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;或
c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基变化时,制备引物对以引入错配碱基,其中引物对中包含碱基改变位点并且将包含碱基改变位点的区域改变成可导致在核酸扩增产物中限制性内切酶识别差异的碱基序列,以形成可检测多态性的标记。
在本发明中,可合理的选择鉴定Rf-1基因存在的合适多态性位点,以便可如下所述,根据将携带Rf-1基因籼稻品种(IR24)的碱基序列(SEQ IDNO:27)与不携带所述基因粳稻品种的相应序列(Asominori(SEQ ID NO:28)和NipponbareBAC克隆AC068923)之间进行比较来制备多态性的检测标记,但不只限于此。
如果发现多态性导致了限制性酶识别的差异,举例来说,针对多态性位点的侧翼序列来制备用于核酸扩增的引物对,并用于检测该多态性。优选的,不将引物设计成特异于高度重复的序列,以避免产生不需要的产物。如果发现多态性没有引起限制性内切酶识别的差异,可通过应用上述的dCAPS方法来制备标记。优选不将用于dCAPS标记的引物设计成特异于重复的序列,并使产物长度优选为50-300个碱基,更优选为约100个碱基,以便于检测多态性。
如果发现多态性涉及微卫星,可针对微卫星的侧翼序列来制备核酸扩增引物,并用于检测该多态性。同样,优选不将引物设计成特异于重复序列。
1)核酸扩增
在本发明中,根据在被测水稻个体或种子的Rf-1位点确定的碱基序列来制备引物对,优选用于扩增包含多态性的邻近区域。使用引物对进行核酸扩增反应,其中以被测水稻个体或种子的基因组DNA作为模板。核酸扩增反应优选为聚合酶链式反应(PCR)(Saiki等人,1985,科学Science 230,第1350-1354页)。
用于核酸扩增的引物对,可根据多态性位点及其邻近区域的碱基序列,通过任何已知的方法来制备。具体地,根据多态性位点及其邻近区域的碱基序列来制备引物对的方法包括,产生与多态性位点及其邻近区域的碱基序列具有相同的碱基序列,或与所述区域互补的碱基序列的单链DNA,如果需要,产生的单链DNA含有不影响对多态性位点及其邻近区域碱基序列的结合特异性的修饰,其满足下列条件:
1)每个引物的长度应为15-30个碱基;
2)每个引物的碱基序列中G+C的比例应为30-70%;
3)每个引物的碱基序列中A、T、G和C的分布不应有局部的严重不平衡。
4)由引物对所扩增的核酸扩增产物的长度应为50-3000个碱基,优选为50-300个碱基;以及
5)在每个引物或引物的碱基序列之间不应存在任何互补的序列片段。
如在此所使用的,多态性位点的“邻近区域”指包含多态性位点及其邻近区的区域是在适于核酸扩增,优选适于PCR的距离之内。所扩增的邻近区域优选具有约50个碱基-约3000个碱基,更优选约50个碱基-约2000个碱基范围内的长度,但不只限于此。为了便于鉴定多态性,产物长度优选为50-300个碱基,更优选为约100个碱基。邻近区域优选在多态性位点的5′和3′侧,具有约0-约3000个碱基,更优选约0-约2000个碱基,还优选约0-约1000个碱基范围内的长度,但不只限于此。
核酸扩增反应的程序和条件没有特别的限制,对于本领域的技术人员而言是众所周知的。本领域技术人员可根据各种因素,如多态性位点及其邻近区域的碱基序列、引物对的碱基序列和长度等来应用合适的条件。通常,当引物对越长或G+C的比例越高或A、T、G和C的分布更均衡,则可在更严谨的条件下进行核酸扩增反应(以更高的温度和更少的循环数进行退火反应和核酸延伸反应)。采用更严谨的条件可使扩增反应具有更高的特异性。
扩增反应可在如下条件下进行,但不只限于此:94℃2分钟1个循环,94℃1分钟、58℃1分钟和72℃2分钟进行30个循环,以及最后是72℃2分钟1个循环,其中用50ng的基因组DNA作为模板,并使用200μm的每种dNTP和5U的ExTaqTM(TAKARA)。反应也可在如下条件下进行:94℃2分钟1个循环,94℃1分钟、58℃1分钟和72℃1分钟进行30个循环,以及最后是72℃2分钟1个循环。在另一个实施方案中,反应可在如下条件下进行:94℃2分钟1个循环,94℃30秒、58℃30秒和72℃30秒进行35个循环,以及最后是72℃2分钟1个循环。
用作PCR模板的受试水稻(待测水稻)基因组DNA可通过Edwards等人(核酸研究Nucleic Acids Res.8(6):1349,1991)的方法而容易的从植株个体或种子中提取出来。更优选的,使用经标准技术纯化的DNA。特别优选的提取方法是CATB法(Murray,M.G.等人,核酸研究Nucleic Acids Res.8(19):4321-4325,1980)。优选用作PCR模板的DNA的终浓度为0.5ng/μL。
2)
检测多态性的标记的制备
通过用引物对进行核酸扩增反应而检验在扩增产物中是否检测到存在多态性后,可根据发现的多态性来制备检测该多态性的标记。下面提供可在扩增产物中检测多态性的非限制性的实施例。
a)在核酸扩增产物的多态性中存在包含缺失区域的变化。
在这种情况下,针对缺失区域的侧翼序列来制备用于核酸扩增的引物对,以形成检测多态性的标记。如果缺失区域达到足够的大小,可通过例如琼脂糖凝胶或丙烯酰胺凝胶上电泳扩增产物,从迁移率的差异来检测多态性。举例来说,当碱基对数目的差别是约5%或更大时,在用琼脂糖凝胶电泳的情况下就可检测多态性,或当长度差别约为1个碱基或更多时,在用测序级的丙烯酰胺凝胶电泳的情况下才可检测多态性。备选地,也可利用寡核苷酸(oligobase)或DNA片段作为分析探针与核酸扩增产物进行杂交来检测多态性,其中所述的寡核苷酸或DNA片段具有与除缺失区域以外的碱基序列互补的序列。备选地,如果需要,可通过确定扩增产物的碱基序列来确证多态性。本领域技术人员可适当采用用于核酸电泳、杂交、测序等已知的技术。在这种情况下,扩增产物长度的差异直接反映多态性,以此为基础的用于检测多态性的标记被称为ALP(扩增子长度多态性)标记。
b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化。
在这种情况下,针对碱基变化位点的侧翼序列来制备核酸扩增的引物对,以形成检测多态性的标记。此时,在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化,即核酸扩增产物可能受到或不受到一种或多种特定的限制性内切酶的切割。因此,扩增产物可用限制性内切酶处理,并在例如琼脂糖凝胶上进行电泳,而从迁移率的差异来检测多态性。如果需要,可通过确定扩增产物的碱基序列来确证多态性。
在这种情况下,通过PCR等的扩增产物的限制性片段长度的差异反应出多态性,并且基于此而用于检测多态性的标记被称为CAPS标记或PCR-RFLP标记(A.Konieczny等人,如上)。
这通过下文实施例1中的引物对P4497 MboI、P23945 MboI、P41030TaqI、P45177 BstUI、B59066 BsaJI和B56691 XbaI来例证说明。如果可通过如上文a)所描述的通过核酸扩增产物的长度来检测多态性,也可通过与限制性内切酶处理相结合而更容易的检测多态性。
c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基变化。
在这种情况下,制备用于引入错配的引物对,其包含碱基变化位点并且将包含碱基变化位点的区域改变成可导致核酸扩增产物中的限制性内切酶识别差异的碱基序列,以形成检测多态性的标记。
具体地,基于天然靠近Rf-1基因区域的碱基序列的引物对,可在核酸扩增产物中产生多态性,但没有导致限制性内切酶识别的差异,因此,在一个或两个引物中引入错配,以将包含碱基变化位点(多态性)的区域改变成在核酸扩增产物中导致限制性内切酶识别差异的碱基序列。例如,可使用Mikaelian等人,核酸研究Nucl.Acids.Res.20:376.1992中所描述的方法作为通过PCR介导的位点特异性突变来取代、缺失或增加特定碱基的标准方法。利用引入错配引物的扩增产物作为检测多态性的标记,可受到或不受到一种或多种特定限制性内切酶的切割,因为在引入错配的位点存在限制性内切酶识别的差异。因此,可用限制性内切酶处理扩增产物,并在例如琼脂糖凝胶上电泳,如上文b)中所描述的从迁移率的差别来检测多态性。
错配的引入必须既不影响引物与靶植物基因组的结合,也不影响多态性碱基的变化。多态性碱基的变化用于在其附近引入错配,以通过碱基变化和错配的相结合来产生限制性内切酶识别的差异。引入这种错配的方法是本领域技术人员已知的,并在例如Michaels,S.D.和Amasino,R.M.(1998),Neff,M.M.,Neff,J.D.,Chory,J.和Pepper,A.E.(1998)中有详细描述。
这种情况下的标记是上述b)中所描述的CAPS标记的改进,并称为dCAPS(来源于CAPS)标记。这通过下文实施例3中的P9493 BslI来例证说明。
如果在上述b)或c)的情况下,存在与品种多态性无关的许多额外限制性酶切位点,则很难鉴定基于多态性的任何限制性内切酶识别差异。在这种情况下,可将错配适当的引入到引物中,以消除不必要的限制性酶切位点。例如,在实施例3中将错配引入到R-引物中来消除在B60304 MspI中与多态性无关的MspI位点。
虽然本发明并不只限于任何特定的方法,CAPS或dCAPS方法相对于其它RFLP方法具有几个优点。具体地,例如比RFLP可用更小量的样品作出分析。另一个优点是可大大减少分析所需要的时间和人力。用PCR标记检测的多态性可通过琼脂糖凝胶电泳来观察,这比用微卫星标记的丙烯酰胺凝胶电泳要更容易。
本发明鉴定方法的优选实施方案
为了例证性说明的目的,如下描述鉴定被测水稻是否具有Rf-1基因的方法的优选实施方案。在此的实施例中,发现携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24的碱基序列,与粳稻品种的相应区域相比,至少具有下列1)-8)的多态性:
1)与SEQ ID NO:27的第1239位碱基相应的碱基是A;
2)与SEQ ID NO:27的第6227位碱基相应的碱基是A;
3)与SEQ ID NO:27的第20680位碱基相应的碱基是G;
4)与SEQ ID NO:27的第45461位碱基相应的碱基是A;
5)与SEQ ID NO:27的第49609位碱基相应的碱基是A;
6)与SEQ ID NO:27的第56368位碱基相应的碱基是T;
7)与SEQ ID NO:27的第57629位碱基相应的碱基是C;以及
8)与SEQ ID NO:27的第66267位碱基相应的碱基(是G)。
因此在本发明的优选实施方案中,当被测水稻个体或种子符合上述1)-8)的一个至全部条件时,可以判断其携带Rf-1基因。
我们进一步核实为Rf-1基因功能的表达所必需的区域包含于尤其是SEQ ID NO:27的碱基序列的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位的碱基中。因此在本发明的实施方案中,当具有与SEQ ID NO:27的碱基序列或SEQID NO:27的第38538-54123位碱基的碱基序列至少70%相同的碱基序列的核酸至少符合下列1)和2)中的一个条件,则确定被测水稻个体或种子具有Rf-1基因:
1)与SEQ ID NO:27的第45461位碱基相应的碱基是A;以及
2)与SEQ ID NO:27的第49609位碱基相应的碱基是A。
可利用多态性检测的已知方法确定是否符合上述条件。也可以直接确定包含所述序列的邻近区域的碱基序列。然而,上述的CAPS或dCAPS方法,由于其是快速和方便的而是优选使用的。可通过下列步骤来进行CAPS或dCAPS方法,包括例如:
i)根据包括下列任何一个碱基的邻近区域的碱基序列来制备引物对;
1)相应于SEQ ID NO:27的第1239位碱基的碱基;
2)相应于SEQ ID NO:27的第6227位碱基的碱基;
3)相应于SEQ ID NO:27的第20680位碱基的碱基;
4)相应于SEQ ID NO:27的第45461位碱基的碱基;
5)相应于SEQ ID NO:27的第49609位碱基的碱基;
6)相应于SEQ ID NO:27的第56368位碱基的碱基;
7)相应于SEQ ID NO:27的第57629位碱基的碱基;和
8)相应于SEQ ID NO:27的第66267位碱基的碱基是G。
以扩增上述碱基及其邻近区域的碱基。
ii)利用被测水稻个体或其种子的基因组DNA作为模板来进行核酸扩增反应;以及
iii)根据在所述核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子中Rf-1的存在。
检测核酸扩增产物中的多态性可如下进行,但不只限于此,当符合下列1)-8)的一个至全部的要求时,鉴定被测水稻个体或其种子具有Rf-1基因:
1)包括与SEQ ID NO:27的第1239位碱基相应的碱基的区域不具有任何MboI识别序列;
2)包括与SEQ ID NO:27的第6227位碱基相应的碱基的区域不具有任何BslI识别序列;
3)包括与SEQ ID NO:27的第20680位碱基相应的碱基的区域不具有任何MboI识别序列;
4)包括与SEQ ID NO:27的第45461位碱基相应的碱基的区域不具有任何TaqI识别序列;
5)包括与SEQ ID NO:27的第49609位碱基相应的碱基的区域不具有任何BstUI识别序列;
6)包括与SEQ ID NO:27的第56368位碱基相应的碱基的区域不具有任何MspI识别序列;
7)包括与SEQ ID NO:27的第57629位碱基相应的碱基的区域不具有任何BsaJI识别序列;以及
8)包括与SEQ ID NO:27的第66267位碱基相应的碱基的区域不具有任何XbaI识别序列。
然而,只要可检测出上述1)-8)的特异区域中的每种多态性,本发明不只限于上述的限制性内切酶。
优选地,本发明的鉴定方法包括:
i)以包括下列任一碱基的邻近区域的碱基序列为基础来制备引物对;
1)与第45461位碱基相应的碱基;或
2)与第49609位碱基相应的碱基;
以扩增上述的碱基及其邻近区域的碱基;
ii)利用被测水稻个体或其种子的基因组DNA作为模板来进行核酸扩增反应;以及
iii)根据在所述核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子中Rf-1的存在。在步骤iii)中,当符合下列1)和2)中的至少一个条件,但不限于此时,可确定被测水稻个体或其种子具有Rf-1基因:
1)包括与SEQ ID NO:27的第45461位碱基相应的碱基的区域不具有任何TaqI识别序列;
2)包括与SEQ ID NO:27的第49609位碱基相应的碱基的区域不具有任何BstUI识别序列。
上述讨论的SEQ ID NO:27的第45461位碱基相应于1)SEQ ID NO:69的第1769位碱基;2)SEQ ID NO:70的第1767位碱基;3)SEQ ID NO:71的第1772位碱基;4)SEQ ID NO:72的第1762位碱基;5)SEQ ID NO:73的第1703位碱基;6)SEQ ID NO:74的第1779位碱基;7)SEQ ID NO:80的第1783位碱基;8)SEQ ID NO:81的第1729位碱基;9)SEQ ID NO:82的第1781位碱基;10)SEQ ID NO:83的第1774位碱基;11)SEQ ID NO:84的第1728位碱基;以及12)SEQ ID NO:85的第1644位碱基。
本领域的技术人员可根据SEQ ID NO:27的碱基序列适当选择用于扩增反应的引物对,以优选满足上述的条件。优选地,使用具有选自SEQ IDNOS:39和40、SEQ ID NOS:41和42、SEQ ID NOS:43和44、SEQ ID NOS:45和46、SEQ ID NOS:47和48、SEQ ID NOS:49和50、SEQ ID NOS:51和52、SEQ ID NOS:53和54的碱基序列的任何引物对。更优选地,引物对选自SEQID NOS:45和46、SEQ ID NOS:47和48。如果需要,也可使用含有取代、缺失或添加,同时仍保持与多态性位点及其邻近区域的碱基序列的特异结合性的上述引物对的序列用作引物。
为了检验所得到的PCR产物的限制性片段长度的多态性,将其用相应于PCR标记中识别位点的限制性内切酶进行切割。可在针对所使用的限制性内切酶所推荐的反应温度下,孵育数小时至1天来实现这种切割。通过在约0.7%-2%的琼脂糖凝胶或约3%的MetaPhorTM琼脂糖凝胶上电泳来分析用限制性酶切割后的PCR扩增样品。例如经溴化乙啶在紫外光下观察凝胶。
在本发明最优选的实施方案中,根据所使用的引物对,限制性内切酶切割模式显示如下列表2中所示的凝胶上观察到的条带。
表2
所检测出条带的大致大小(bp)
用P4497 MobI(SEQ IDNO:39和40)扩增限制性酶MboI被测水稻基因组具有Rf-1基因(纯合): 730没有: 385,345 |
用P9493 BslI(SEQ IDNO:41和42)扩增限制性酶BslI被测水稻基因组具有Rf-1基因(纯合): 126没有: 100,26 |
用P23945 MobI(SEQ ID NO:43和44)扩增限制性酶MboI被测水稻基因组具有Rf-1基因(纯合): 160,100没有: 260 |
用P41030 TaqI(SEQ IDNO:45和46)扩增限制性酶TaqI被测水稻基因组具有Rf-1基因(纯合): 280没有: 90,190 |
用P45177 BstUI(SEQ ID NO:47和48)扩增限制性酶BstUI被测水稻基因组具有Rf-1基因(纯合): 20,65,730 |
没有: 20,65,175,555 |
B60304 MspI(SEQ ID NO:49和50)扩增限制性酶MspI被测水稻基因组具有Rf-1基因(纯合): 330没有: 220,110 |
B59066 BsaJI(SEQ ID NO:51和52)扩增限制性酶BsaJI被测水稻基因组具有Rf-1基因(纯合): 420没有: 65,355 |
用B56691 XbaI(SEQ ID NO:53和54)扩增限制性酶XbaI被测水稻基因组具有Rf-1基因(纯合): 670没有: 140,530 |
在下文的实施例3中,利用包括上述8个引物对的14个多态性标记检测具有花粉育性的接近于Rf-1基因的重组体(RS1-RS2,RC1-RC8)的Rf-1区域的染色体组织结构。结果是,证实所有植株中均携带了来源于籼稻品种P9493 BslI和59066 BsaJI之间的Rf-1基因。该结果表明具有如图3所示的染色体组织结构的重组体花粉具备花粉育性,即Rf-1基因在这些花粉中是有功能的。这意味着确定Rf-1基因功能存在的序列包括在这些重组花粉共有的籼稻区域中,即根据最大可能性来估计,包括在P4497 MboI-B56691XbaI位点之间的区域(约65kb)中。
在本发明中,根据假设S12564 Tsp509I位点应与Rf-1位点非常靠近而开始染色体步行,这可从经杂交的个体的出现频率来判断。事实上,根据本发明的高精度分离分析的结果表明,计算这两个位点的遗传距离约为0.04cM。如在日本专利公开No.2000-139465中所描述的,已知即使与Rf-1位点最紧密连锁的一个标记,据报道与Rf-1位点的遗传距离为约1cM。考虑到在水稻中,估计1cM相当于平均约300kb,如果从日本专利公开No.2000-139465中所描述的标记开始染色体步行,应需要相当长的时间来定位Rf-1基因的区域。
VI.抑制Rf-1基因的功能以恢复育性的方法
根据本发明,分离含有育性恢复基因(Rf-1)位点的核酸,包括具有恢复育性功能的核酸。确定其全部碱基序列,由此可通过遗传工程技术来控制Rf-1基因的育性恢复功能。因此,本发明进一步提供一种抑制Rf-1基因的功能以恢复育性的方法。
根据本发明的一个实施方案,抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个连续碱基的反义序列,其具有与SEQ ID NO:27的碱基序列的核酸互补,或与SEQ ID NO:27的碱基序列至少70%相同,且具有恢复育性功能的碱基序列的核酸互补的碱基序列。
在一个实施方案中,本发明所述的抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个连续碱基的反义序列,且其选自与具有SEQ ID NO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基的碱基序列的核酸互补,或与具有与SEQ IDNO:27的第38538-54123位碱基,优选第42357-53743位碱基,更优选第42132-48883位碱基,还更优选第42132-46318位碱基的碱基序列至少70%相同,且具有恢复育性功能的碱基序列的核酸互补的碱基序列。
在特别优选的实施方案中,本发明所述的抑制Rf-1基因的功能以恢复育性的方法包括,导入长度至少为100个碱基的反义序列,且其选自与编码SEQ ID NO:75的氨基酸序列,或编码与SEQ ID NO:75的氨基酸序列至少70%相同,且具有恢复育性功能的氨基酸序列的核酸互补的碱基序列。
最优选地,编码SEQ ID NO:75的氨基酸序列,或编码与SEQ ID NO:75的氨基酸序列至少70%相同的氨基酸序列的核酸选自下列a)-p)的核酸:
a)包括SEQ ID NO:69的第215-2587位碱基的核酸;
b)包括SEQ ID NO:70的第213-2585位碱基的核酸;
c)包括SEQ ID NO:71的第218-2590位碱基的核酸;
d)包括SEQ ID NO:72的第208-2580位碱基的核酸;
e)包括SEQ ID NO:73的第149-2521位碱基的核酸;
f)包括SEQ ID NO:74的第225-2597位碱基的核酸;
g)包括SEQ ID NO:27的第43907-46279位碱基的核酸;
h)包括SEQ ID NO:80的第229-2601位碱基的核酸;
i)包括SEQ ID NO:81的第175-2547位碱基的核酸;
j)包括SEQ ID NO:82的第227-2599位碱基的核酸;
k)包括SEQ ID NO:83的第220-2592位碱基的核酸;
l)包括SEQ ID NO:84的第174-2546位碱基的核酸;
m)包括SEQ ID NO:85的第90-2462位碱基的核酸;
n)与a)-m)任何的核酸至少70%相同的核酸,并且其具有恢复育性的功能;
o)与a)-m)任何的核酸在中等或高度严谨条件下杂交的核酸,并且其具有恢复育性的功能;以及
p)其中从a)-m)任何的核酸缺失、添加或取代一个或多个碱基的核酸,并且其具有恢复育性的功能。
反义序列的长度为至少100个碱基或更长,更优选为500个碱基或更长,最优选为1000个碱基或更长。从导入的技术方便性来考虑,优选长度为10000个碱基或更短,更优选为5000个碱基或更短。可用已知的方法来合成反义序列。可利用例如Terada等人(植物细胞生理学Plant Cell Physiol.2000 Jul,41(7),第881-888页)所描述的已知方法将反义序列导入到水稻中。
也可以预期,可通过在包含转座元件,例如但不限于,Tos17(HirochikaH.等人,1996,Proc.Natl.Acad.Sci.USA93,第7783-7788页))的突变系中筛选在SEQ ID NO:27的碱基序列中包含转座元件的品系来建立Rf-1断裂(disrupted)系。在植物中,已经研究了经同源重组的基因断裂。也可能通过建立这样的品系来抑制育性恢复功能,在该品系中利用具有SEQ ID NO:27的碱基序列的核酸,或具有与SEQ ID NO:27的碱基序列至少70%相同的碱基序列的核酸,而已经通过Rf-1基因变体取代Rf-1基因。
参考文献
1.Fukuta et al.1992,Jpn J.Breed.42(supl.1)p.164-165.
2.Japanese Patent Public Disclosure No.HEI7(1995)-222588.
3.Japanese Patent Public Disclosure No.HEI9(1997)-313187.
4.Japanese Patent Public Disclosure No.2000-139465.
5.Harushima et al.1998,Genetics 148 p.479-494.
6.Michaels and Amasino 1998,The Plant Journal 14(3)p.381-385.
7.Neff et al.1998,The Plant Journal 14(3)p.387-392.
8.D.E.Harry,et al.,Theor Appl Genet(1998)97:p.327-336.
9.Hiei et al.,Plant Journal(1994),6(2),p.272-282.
10.Komari et al.,(1996)10,p.165-174.
11.Ditta et al.,Proc.Natl.Acad.Sci.USA(1980),77:p.7347-7351.
12.P.Vos et al.,Nucleic Acids Res.Vol.23,p.4407-4414(1995).
13.O.Parnaud,X.et al,Mol.Gen.Genet.(1996)252:p.597-607.
14.A.Konieczny et al.,(1993),Plant J.4(2)p.403-410.
15.Edwards et al.,Nucleic Acids Res.8(6):1349,1991.
16.Murray M.G.et al.,Nucleic Acids Res.8(19):4321-4325,1980.
17.Terada et al.,Plant Cell Physiol.2000 Jul,41(7),p.881-888.
18.Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA,p.7783-7788.
19.Cui,X.,Wise,R.P.and Schanble,P.S.(1996)The rf2 nuclearrestorer gene ofmale-sterile T-cytoplasm maize.Science,272,1334-1336
20.Liu,F.,Cui,X.,Horner,H.T.,Weiner,H.and Schnable,P.S.(2001)Mitochondrial aldehyde dehydrogenase activity is required for male fertility inmaize.The Plant Cell,13,1063-1078
实施例
下面通过实施例来进一步阐明本发明,但并不限制本发明的技术范围。本领域技术人员可根据说明书的描述容易地对本发明进行改进/变化,并且这些改进/变化包括在本发明技术范围内。
参考实施例
下面的参考实施例是以我们先前的申请(2000年8月17日提交的日本专利申请No.2000-247204)中所描述的实施例为基础的。
参考实施例1:将Rf-1基因周围的RFLP标记转换为PCR标记
在该参考的实施例中,将Rf-1基因位点周围的9个RFLP标记(即R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G1255)转换为PCR标记。
(1)材料和方法
下列9个RFLP标记,R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602和G1255,购自于日本农林渔水产省,国家农业生物资源研究所(the National Institute of Agrobiological Sciences,the Ministry ofAgriculture,Forestry and Fisheries oaJapan)。确定载体中插入的碱基序列后,按照下列步骤进行实验。在此的水稻品种中,Asominori属于粳稻,而IR24属于籼稻。
(2)Asominori基因组文库的制备
通过CTAB法从Asominori的绿色叶片中提取总DNA。用MboI部分消化后,用NaCl密度梯度离心(6-20%线性梯度、20℃、37000rpm、4小时、总体积=12mL)根据大小对DNA进行分级。将每个级分的部分(约0.5mL)进行电泳,并收集和纯化含有15-20kb DNA的级分。利用λDASH II(Stratagene)作为载体,按照所附的方案来构建文库。用Giga Pack IIIGold(Stratagene)包裹。包装后,加入500μl的SM缓冲液和20μl氯仿。离心后,向上清液加入20μl氯仿以产生文库溶液。
用5μl的稀释50倍的文库溶液感染XL-1 Blue MRA(P2),由此形成83个噬菌斑。这相当于每个文库为4.15×105pfu,自此,假定插入片段的平均长度为20kb,计算该噬菌斑覆盖了8.3×109bp。因此认为该文库具有足够大小的水稻基因组(4×108bp)。
(3)含有R1877-、C1361-和G4003-标记区域的基因组克隆的分离。
就C1361和G4003而言,分离含有RFLP标记探针的质粒,并进行限制性酶处理和电泳,以分离RFLP标记探针部分;在DNA回收滤器上(TakaraSUPERC-01)回收所需要的DNA。对于R1877,设计特异于标记探针两末端的引物,用Asominori的总DNA作为模板进行PCR反应;电泳所扩增的产物并用上述的方法回收。用Rediprime DNA标记系统(Amersham Pharmacia)标记回收的DNA,以制备用于筛选文库的探针。按常规方法进行PCR(这也可应用于下列的描述)。
将噬菌斑印迹到Hybond-N+(Amersham Pharmacia)上后,按常规方法进行文库的筛选。初级筛选后,分别打孔挑取阳性噬菌斑的区域,悬浮在SM缓冲液中,并用于第二轮筛选。次级筛选后,打孔挑取阳性噬菌斑,并进行第三轮筛选以分离单个的噬菌斑。
将令人感兴趣的分离的噬菌斑悬浮在SM缓冲液中,并通过平板裂解法进行噬菌体的初级增殖。通过振荡培养物将所得到的富含噬菌体的液体进行次级增殖,并用λ起动试剂盒(QIAGEN)纯化噬菌体DNA。
对于每个标记,在8个平板上进行初筛。每个平板使用10μl等分的文库溶液。经过初级、次级和第三轮筛选后,分离出与R1877相关的4个基因组克隆,并分离出分别与C1361及G4003相关的3个基因组克隆。
(4)将R1877转化为PCR标记
分析分离的基因组克隆,以鉴定导致RFLP的位点,或存在于IR24(籼稻)而不存在于Asominori(粳稻)中的EcoRI位点,由此将其转化为PCR标记。
具体来说,将4个分离的克隆进行如下分析。首先,用T3和T7引物确定每个克隆中插入片段两末端的碱基序列。然后,设计从标记探针的两末端向外延伸的引物。用T3和T7引物与其组合而产生总共4个引物的组合,并以每个克隆为模板用于进行PCR。
在单独的步骤中,用NotI和EcoRI消化每个克隆,并进行电泳以评估插入物的大小和每个EcoRI片段的长度。
这些分析表明个别克隆的相对位置。在RFLP分析中,已报道标记探针R1877可在Nipponbare(粳稻)中检测出20kb的EcoRI片段,而在Kasalath(籼稻)中检测出6.4kb的EcoRI片段(
ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthern/chr10/R1877.JPG)。将该事实与上述分析结果结合起来,可以给出存在于IR24而不存在于Asominori中的EcoRI位点的推定位置。因此,设计用于扩增邻近区域的引物组合(SEQID NO:1×SEQ ID NO:2),用于进行30个循环以上的基因组PCR,每个循环由94℃×1分钟,58℃×1分钟,和72℃×2分钟组成。用EcoRI处理所得到的PCR产物,并在0.7%的琼脂糖凝胶上进行电泳。
结果是,在Asominori和IR24之间观察到预期的多态性。通过用EcoRI处理,在IR24品种中,切割PCR产物(~3200bp)产生1500bp和1700bp的片段,而Asominori中没有这种切割。利用Asominori-IR24的RIL(重组体近交系)对标记进行作图,结果是PCR标记与RFLP标记位点R1877定位于相同的区域,由此证实将RFLP标记R1877转换为PCR标记,其在本发明中被命名为R1877 EcoRI。
(5)将G4003转化为PCR标记
分析分离的基因组克隆,以鉴定导致RFLP的位点,或存在于Asominori而不存在于IR24中的HindIII位点,由此将G4003转化为PCR标记。
通过进行与用于R1877的所相似的分析,表明3个分离克隆的相对位置。在RFLP分析中,已报道标记探针G4003可在Nipponbare(粳稻)中检测出3kb的HindIII片段,在Kasalath(籼稻水稻)中检测出10kb的片段
(
ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthern/chr10/R1877.JPG)。将该报道与上述分析结合起来,可得到临时的结论,存在于Asominori而不存在于IR24中的HindIII位点将位于2个候选位点中的一个。因此,设计扩增每个HindIII邻近区域的引物组合(SEQ ID NO:3×SEQ ID NO:4),用于进行35个循环以上的基因组PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用HindIII处理所得到的PCR产物,并在2%的琼脂糖凝胶上进行电泳。结果发现标记探针内部的HindIII位点具有多态性。通过用HindIII处理,在Asominori中切割PCR产物(362bp)产生95bp片段和267bp片段,而IR24中没有这种切割。位点作图证明,将RFLP标记G4003转换为PCR标记,在本发明中将其命名为G4003 HindIII(SEQ ID NO:19)。
(6)将C1361转化为PCR标记
根据分离的基因组克隆的碱基序列信息来设计引物。用Asominori和IR24的总DNA作为模板进行PCR反应,并在电泳后,用已知的方法回收PCR产物。利用回收的DNA作为模板,本发明人用ABI Model 310分析各个水稻品种的碱基序列,搜寻可导致多态性的突变。
通过进行与R1877所使用的相同的分析,建立分离的3个克隆大致的相对位置。然而如所产生的,很难通过PCR扩增C1361标记周围的区域或确定其碱基序列,因而不容易鉴定导致RFLP的位点。因此,本发明人注意到能够产生相对较长的PCR产物(2.7kb)的区域,并尝试创建dCAPS标记。
具体来说,在利用Asominori和Koshihikari(均为粳稻)以及Kasalath和IR24(均为籼稻),比较所述区域的基因组PCR产物的碱基序列后,本发明人在粳稻品种和籼稻品种之间发现了6个多态性的位点。使用这6个位点中的一个创建dCAPS标记。为此,用SEQ ID NO:5和SEQ ID NO:6作为引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MwoI处理PCR产物并在3%的MetaPhorTM琼脂糖凝胶上进行电泳分析。在Asominori中,切割发生在2个位点,而产生约25bp、50bp和79bp的3个可观察到的条带,但在IR24中,切割只发生在1个位点,产生约50bp和107bp的2个可观察到的条带。作图证明,将RFLP标记C1361转换为PCR标记,在本发明中将其命名为C1361 MwoI(SEQ ID NO:20)。
(7)将G2155转化为PCR标记
设计特异于标记探针两末端的引物,并用Asominori、Koshihikari、IR24或IL216(该品系是通过回交将Rf-1基因引入到Koshihikari中而产生的;其基因型为Rf-1/Rf-1)的总DNA为模板进行PCR。根据上面已经描述的方法,纯化PCR产物并搜寻对提供限制性片段多态性有用的突变。
具体来说,比较被测品种之间相应区域的碱基序列,结果在具有Rf-1基因的品种/品系(IR24和IL216)和没有Rf-1基因的品种(Asominori和Koshihikari)之间发现3个位点的突变。利用3个位点中的1个来创建dCAPS标记。为此,用SEQ ID NO:7和SEQ ID NO:8作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MwoI处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在Asominori中,在1个位点发生切割,产生约25bp和105bp的两个可观察到的条带;但在IR24中,在2个位点发生切割,产生约25bp、27bp和78bp的三个可观察到的条带。作图证明,将RFLP标记G2155转换为PCR标记,在本发明中将其命名为G2155 MwoI(SEQ ID NO:21)。
(8)将G291转换为PCR标记
设计特异于标记探针内部序列的引物,并用于各种组合来进行PCR,以找到可产生预期大小的扩增产物的引物组合。利用所选择的引物组合,本发明人用Asominori、Koshihikari、IR24和IL216的总DNA作为模板进行PCR。通过上面已描述的方法纯化所得到的PCR产物并搜寻对提供限制性片段多态性有用的突变。
具体而言,利用设计特异于标记探针序列的引物,本发明人对每个被测品种进行基因组PCR,并比较产物的碱基序列。结果是,在具有Rf-1基因的品种/品系(IR24和IL216)和没有Rf-1基因的品种(Asominori和Koshihikari)之间发现4个位点的突变。使用4个位点中的1个创建dCAPS标记。为此,用SEQ ID NO:9和SEQ ID NO:10作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用MspI处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在具有Rf-1基因的品种/品系中,在2个位点发生切割,产生约25bp、49bp和55bp的三个可观察到的条带;但在不具有Rf-1基因的品种中,只在1个位点发生切割,产生约25bp和104bp的两个可观察到的条带。作图证明,将RFLP标记G291转换为PCR标记,在本发明中将其命名为G291 MspI(SEQ IDNO:22)。
(9)将R2303转换为PCR标记
设计特异于标记探针内部序列的引物,并用Asominori(粳稻)和IR24及Kasalath(籼稻)的总DNA作为模板进行PCR。通过上面已描述的方法纯化所得到的PCR产物并搜寻可用于提供限制性片段多态性的突变。
结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。由于突变出现在BslI识别位点,直接将该位点用于产生CAPS标记。为此,用SEQ ID NO:11和SEQ ID NO:12作引物,进行30个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×2分钟组成。用BslI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约238bp和1334bp的2个可观察到的条带;而在籼稻品种中,在2个位点发生切割,产生约238bp、655bp、和679bp的3个可观察到的条带。作图证明,将RFLP标记R2303转换为PCR标记,在本发明中将其命名为R2303 BslI(SEQ ID NO:23)。
(10)将S10019转换为PCR标记
根据(9)中将R2303转换为PCR标记的方法将S10019转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。由于突变出现在BstUI识别位点,直接将该位点用于产生CAPS标记。为此,用SEQ ID NO:13和SEQ ID NO:14作引物,进行30个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×1分钟组成。用BstUI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约130bp和462bp的2个可观察到的条带;而在籼稻品种中,在2个位点发生切割,产生约130bp、218bp、和244bp的3个可观察到的条带。作图证明,将RFLP标记S10019转换为PCR标记,在本发明中将其命名为S10019 BstUI(SEQ ID NO:24)。
(11)将S10602转换为PCR标记
根据(9)中将R2303转换为PCR标记的方法将S10602转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。将该突变用于产生dCAPS标记。为此,用SEQ ID NO:15和SEQ ID NO:16作引物,进行33个循环以上的PCR,每个循环由94℃×1分钟,58℃×1分钟,72℃×1分钟组成。用KpnI处理PCR产物,并在2%的琼脂糖凝胶上电泳分析。在粳稻品种中,在1个位点发生切割,产生约117bp和607bp的2个可观察到的条带;而在籼稻品种中,没有发生切割,只产生724bp的可观察到的条带。作图证明,将RFLP标记S10602转换为PCR标记,在本发明中将其命名为S10602 KpnI(SEQ IDNO:25)。
(12)将S12564转换为PCR标记
根据将R2302转换为PCR标记的方法将S12564转化为PCR标记。
具体而言,结果是,比较被测品种之间相应区域的碱基序列,在粳稻品种和籼稻品种之间发现突变。将该突变用于产生CAPS标记。为此,用SEQ ID NO:17和SEQ ID NO:18作引物,进行35个循环以上的PCR,每个循环由94℃×30秒,58℃×30秒,72℃×30秒组成。用Tsp509I处理PCR产物,并在3%的MetaPhorTM琼脂糖凝胶上电泳分析。在粳稻品种中,在2个位点发生切割,产生约26bp、41bp和91bp的3个可观察到的条带;而在籼稻品种中,在1个位点发生切割,产生约41bp和117bp的2个可观察到的条带。作图证明,将RFLP标记S12564转换为PCR标记,在本发明中将其命名为S12564 Tsp509I(SEQ ID NO:26)。
参考实施例2Rf-1基因位点的作图图谱
从用MS-FR Koshihikari对MS Koshihikari授粉而产生的F1代群体的1042个幼苗提取DNA,并将该DNA提取物用于分析。MS Koshihikari(BC10F1代)是通过用BT型雄性不育细胞质替换Koshihikari的细胞质而建立的。MS-FR Koshihikari是通过将源于IR8的Rf-1基因(由国家农业生物资源研究所National Institute of Agrobiological Sciences提供)导入到MSKoshihikari中(Rf-1基因位点是杂合的)而创建的品系。
首先,研究每一个体中在参考实施例1中所述2个标记位点R1877EcoRI和G2155 MwoI之间的基因型,推测其位于Rf-1位点的相对侧。认为关于位点R1877 EcoRI或G2155 MwoI的粳稻型纯合体在这两个标记位点之间是重组体。然后,研究每个这种重组体G291 MspI、R2303 BslI、S12564Tsp509I、C1361 MwoI、S10019 BstUI、G4003 HindIII和S10602 KpnI位点的基因型,并鉴定重组的位置。
对R1877 EcoRI和G2155 MwoI位点的基因型研究表明,46个个体是Rf-1基因位点附近的重组体。研究在Rf-1基因位点附近的标记位点的基因型,结果如表3所示。
表3.Rf-1位点附近的重组体个体中标记位点的基因型
位点 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
R1877 EcoRIG291 MspIR2303 BsIIS12564 Tsp5091C1361 MwolS10019 BstUIG4003 HindIIIS10602 KpnIG2155 MwoI |
JHHHHHHHH |
JJHHHHHHH |
JJJHHHHHH |
JJJHHHHHH |
JJJHHHHHH |
JJJHHHHHH |
JJJHHHHHH |
JJJJHHHHH |
HHHHJJJJJ |
HHHHJJJJJ |
HHHHHJJJJ |
HHHHHJJJJ |
HHHHHJJJJ |
HHHHHJJJJ |
HHHHHJJJJ |
HHHHHJJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHJJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHJJ |
HHHHHHHHJ |
HHHHHHHHJ |
J:纯合的Koshihikari型
H:杂合的Koshihikari型/MS-FR Koshihikari型
如表3中所示,获得在S12564 Tsp509I标记位点纯合的粳稻重组体8和在C1361 MwoI标记位点纯合的粳稻重组体9和10。所有这些重组体均恢复了育性,认为前者是Rf-1和S12564 Tsp509I位点之间的重组体,而认为后者是Rf-1和C1361 MwoI位点之间的重组体,表明Rf-1基因定位于S12564 Tsp509I知C1361 MwoI位点之间。根据报道,在上述杂交中具有BT型雄性不育细胞质的个体中,只有携带Rf-1基因的花粉具有育性(C.Shinjyo,JAPAN.J.GENETICS Vol.44,No.3:149-156(1969)),Rf-1基因位点可在更详细的连锁图谱上进行定位(图4)。
实施例1:获得靠近Rf-1位点的重组个体
(材料和方法)
用MS-FR Koshihikari(BC9F1代,在Rf-1基因位点是杂合的)对MSKoshihikari(BC10F1代)进行授粉产生了由4103个个体的BC10F1群体,从其中每一个体提取DNA,在S12564 Tsp509I和C1361 MwoI位点的基因型与上述参考实施例2中描述的方式相同。在S12564 Tsp509I位点具有纯合基因型的Koshihikari个体,被认为是由于在Rf-1和S12564 Tsp509I位点之间发生重组所产生的,而在C1361 MwoI位点具有纯合基因型的Koshihikari个体,被认为是由于在Rf-1和C1361 MwoI位点之间发生重组所产生的。
(结果和讨论)
研究这4103个个体,发现了1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和6个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。在上述参考实施例2中,通过杂交先前所获得的对1042个个体的研究如表3所示,已经发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和2个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。
因此从5145个个体中总共能够获得了2个在Rf-1和S12564 Tsp509I位点之间发生重组的重组个体和8个在Rf-1和C1361 MwoI位点之间发生重组的重组个体。在下面的实施例中对这10个个体进行高精度分离测试。
实施例2染色体步行
(1)第一次染色体步行
(材料和方法)
按照参考实施例1中所述方法,用λDASHII载体从Asominori粳稻(不携带Rf-1)的基因组DNA构建基因组文库,并用染色体步行进行检测。
利用Asominori的总DNA为模板,结合下述引物对常规进行PCR:
5′-atcaggagccttcaaattgggaac-3′(SEQ ID NO:29)和
5′-ctcgcaaattgcttaattttgacc-3′(SEQ ID NO:30)
其中该引物对是针对RFLP探针S12564的部分碱基序列(登录号D47284)来设计的。将所得到的约1200bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)纯化。用rediprime DNA标记系统(AmershamPharmacia)标记纯化的DNA,以产生文库筛选探针(探针A,图1)。
在将噬菌斑印迹到Hybond-N+(Amersham Pharmacia)上后,对文库进行常规筛选。通过平板裂解法用λMidi试剂盒(QIAGEN)纯化噬菌体DNA后,分离单个的噬菌斑。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,筛选得到的4个克隆中的两个克隆(WSA1和WSA3)具有如图1所示的相对位置关系。通过引物步行(DNA测序仪377,ABI)确定与WSA1和WSA3相应的Asominori基因组碱基序列。
(2)第二次染色体步行
(材料和方法)
除了上述的Asominori基因组文库外,类似地从籼稻品种IR24(携带Rf-1)的基因组DNA构建IR24基因组文库,并用染色体步行进行测试。
利用WSA3的DNA为模板,结合下述引物对常规进行PCR:
5′-tgaaggagttatgggtgcgtgacg-3′(SEQ ID NO:31)和
5′-ttgccgagcacacttgccatgtgc-3′(SEQ ID NO:32)
其中该引物对是针对(1)中确定的Asominori基因组碱基序列来设计的。纯化所得到的524bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针E,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的15个克隆中的1个克隆(WSE8)具有如图1所示的相对位置关系。通过引物步行确定与WSE8相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的7个克隆中的2个克隆(XSE1和XSE7)具有如图1所示的相对位置关系。通过引物步行确定与XSE1和XSE7相应的IR24基因组碱基序列。
(3)第三次染色体步行
(材料和方法)
用染色体步行测试上述的Asominori基因组文库和IR24基因组文库。
利用WSE8的DNA为模板,结合下述引物对常规进行PCR:
5′-gcgacgcaatggacatagtgctcc-3′(SEQ ID NO:33)和
5′-ttacctgccaagcaatatccatcg-3′(SEQ ID NO:34)
其中该引物对是针对(2)中确定的Asominori基因组碱基序列来设计的。纯化所得到的约1159bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针F,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,筛选Asominori基因组文库所得到的8个克隆中的2个克隆(WSF5和WSF7)具有如图1所示的相对位置关系。通过引物步行确定与WSF5和WSF7相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的13个克隆中的2个克隆(XSF4和XSF20)具有如图1所示的相对位置关系。通过引物步行确定与XSF4和XSF20相应的IR24基因组碱基序列。
(4)第四次染色体步行
(材料和方法)
用染色体步行测试上述的Asominori基因组文库和IR24基因组文库。
利用WSF7的DNA为模板,结合下述引物对常规进行PCR:
5′-aaggcatactcagtggagggcaag-3′(SEQ ID NO:35)和
5′-ttaacctgaccgcaagcacctgtc-3′(SEQ ID NO:36)
其中该引物对是按照(3)中确定的Asominori基因组碱基序列来设计的。纯化所得到的约456bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针G,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的6个克隆中的2个克隆(WSG2和WSG6)具有如图1所示的相对位置关系。通过引物步行确定与WSG2和WSG6相应的Asominori基因组碱基序列。
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选IR24基因组文库所得到的14个克隆中的3个克隆(XSG8、XSG16和XSG22)具有如图1所示的相对位置关系。通过引物步行确定与XSG8、XSG16和XSG22相应的IR24基因组碱基序列。
(5)第五次染色体步行
(材料和方法)
用染色体步行测试上述的IR24基因组文库。
我们详细浏览了TIGR(The Institute for Genomic Research)的公共网址,发现在公共数据库(GenBank)中已经登记保藏了包含RFLP标记S12564的BAC(细菌人工染色体)克隆(登录号AC068923)。该BAC克隆包含Nipponbare粳稻的基因组DNA,经碱基序列比较显示其完全包括了在(1)-(4)中制备得到的Asominori和IR24的重叠区域。
因此,利用IR24的总DNA为模板,结合下述引物对常规进行PCR:
5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:37)和
5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:38)
其中设计该引物对用于扩增该BAC克隆的部分序列。纯化所得到的约600bp的扩增产物,并用上述方法对其进行标记,而产生文库筛选探针(探针H,图1)。
按上述的方法进行文库筛选和噬菌体DNA的纯化。
(结果和讨论)
末端碱基序列分析和限制酶片段长度分析结果表明,通过筛选Asominori基因组文库所得到的15个克隆中的1个(XSH18)具有如图1所示的相对位置关系。通过引物步行确定与XSH18相应的IR24基因组碱基序列。
实施例3:高精度分离分析
(1)PCR标记P4497 MboI的开发
将实施例2中所确定的相应于IR24重叠群(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第1239位碱基是A,而相应于所述位置的SEQID NO:28的第12631位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置附近的区域,通过PCR扩增约730bp的片段:
P4497 MboI F:
5′-ccctccaacacataaatggttgag-3′(SEQ ID NO:39)
(相应于SEQ ID NO:27的第853-876位碱基)
(相应于SEQ ID NO:28的第12247-12270位碱基)和
P4497 MboI R:
5′-tttctgccaggaaactgttagatg-3′(SEQ ID NO:40)
(相应于SEQ ID NO:27的第1583-1560位碱基)
(相应于SEQ ID NO:28的第12975-12952位碱基)。
用MboI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,可通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物具有MboI识别序列(GATC),能被MboI切割,而来自IR24DNA的扩增产物缺乏MboI识别序列而不能用MboI切割,从而导致用MboI处理后,DNA片段的长度存在差异。
(2)PCR标记P9493 BslI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第6227位碱基是A,而相应于所述位置的SEQID NO:28的第17627位碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约126bp的片段:
P9493 BslI F:
5′-gcgatcttatacgcatactatgcg-3′(SEQ ID NO:41)
(相应于SEQ ID NO:27的第6129-6152位碱基)
(相应于SEQ ID NO:28的第17529-17552位碱基)和
P9493 BslI R:
5′-aaagtctttgttccttcaccaagg-3′(SEQ ID NO:42)
(相应于SEQ ID NO:27的第6254-6231位碱基)
(相应于SEQ ID NO:28的第17654-17631位碱基)。
用BslI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物中具有BslI识别序列(CCNNNNNNNGG),能被BslI所切割,而来自IR24 DNA的扩增产物缺乏BslI识别序列而不能用BslI切割,从而导致用BslI处理后,DNA片段的长度存在差异。
通过应用dCAPS方法(Michaels和Amasino 1998,Neff等人,1998)而发展该标记。具体地,通过利用上述的P9493 BslI R引物,在SEQ ID NO:27的第6236位碱基和SEQ ID NO:28的第17636位碱基处,用g取代a。因此,来自Asominori DNA的片段在SEQ ID NO:28的第17626-17636位具有CCtttccttG
G的序列,而可以用BslI切割。
(3)PCR标记P23945 MboI的开发
将实施例2中所确定的相应于II24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第20680位碱基是G,而相应于所述位置的SEQID NO:28的第32079位碱基是A。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约260bp的片段:
P23945 MboI F:
5′-gaggatttatcaaaacaggatggacg-3′(SEQ ID NO:43)
(相应于SEQ ID NO:27的第20519-20544位碱基)
(相应于SEQ ID NO:28的第31918-31943位碱基)和
P23945 MboI R:
5′-tgggcggcagcagtggaggataga-3′(SEQ ID NO:44)
(相应于SEQ ID NO:27的第20778-20755位碱基)
(相应于SEQ ID NO:28的第32177-32154位碱基)。
用MboI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24 DNA的扩增产物中具有MboI识别序列(GATC),能被MboI所切割,而来自Asominori DNA的扩增产物缺乏MboI识别序列而不能用MboI切割,从而导致用MboI处理后,DNA片段的长度存在差异。
(4)PCR标记P41030 TaqI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第45461位碱基是A,而相应于所述位置的SEQID NO:28的第49164位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约280bp的片段:
P41030 TaqI F:
5′-aagaagggagggttatagaatctg-3′(SEQ ID NO:45)
(相应于SEQ ID NO:27的第45369-45392位碱基)
(相应于SEQ ID NO:28的第49072-49095位碱基)和
P41030 TaqI R:
5′-atatcaggactaacaccactgctc-3′(SEQ ID NO:46)
(相应于SEQ ID NO:27的第45468-45625位碱基)
(相应于SEQ ID NO:28的第49351-49328位碱基)。
用TaqI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自AsominoriDNA的扩增产物中具有TaqI识别序列(TCGA),能被TaqI所切割,而来自IR24 DNA的扩增产物缺乏TaqI识别序列而不能用TaqI切割,从而导致用TaqI处理后,DNA片段的长度存在差异。
(5)PCR标记P45177BstUI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与相应于Asominori重叠区(SEQ ID NO:28)的基因组碱基序列进行比较,发现SEQ ID NO:27的第49609位碱基是A,而相应于所述位置的SEQID NO:28的第53311位碱基是G。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约812bp的片段:
P45177 BstUI F:
5′-acgagtagtagcgatcttccagcg-3′(SEQ ID NO:47)
(相应于SEQ ID NO:27的第49355-49378位碱基)
(相应于SEQ ID NO:28的第53057-53080位碱基)和
P45177 BstUI R:
5′-cagcgtgaaactaaaaacggaggc-3′(SEQ ID NO:48)
(相应于SEQ ID NO:27的第50166-50143位碱基)
(相应于SEQ ID NO:28的第53868-53845位碱基)。
用BstUI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24 DNA的扩增产物中在两个位置具有BstUI识别序列(CGCG),而被BstUI切割成3个片段,,而来自Asominori DNA的扩增产物在3个位置具有BstUI识别序列而而被BstUI切割成4个片段,从而导致用BstUI处理后,DNA片段的长度存在差异。
(6)PCR标记B60304 MspI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第56368位碱基是T,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约330bp的片段:
B60304 MspI F:
5′-atcccacatcatcataatccgacc-3′(SEQ ID NO:49)
(相应于SEQ ID NO:27的第56149-56172位碱基)和
B60304 MspI R:
5′-agcttctcccttggatacggtggcg-3′(SEQ ID NO:50)
(相应于SEQ ID NO:27的第56479-56455位碱基)。
用MspI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有MspI识别序列(CCGG),能被MspI所切割,而来自IR24 DNA的扩增产物缺乏MspI识别序列而不能用MspI切割,从而导致用MspI处理后,DNA片段的长度存在差异。
通过应用dCAPS方法而发展该标记。具体地,通过利用上述的B60304MspI R引物,在SEQ ID NO:27的第56463位碱基处,用t取代g。结果,SEQ ID NO:27的第56460-56463位的MspI识别序列从CCG
G变为ccgt,而使得来自SEQ ID NO:27的序列不能用MspI切割。因此,来自IR24的片段没有MspI识别序列,而来自Nipponbare的DNA在相应于SEQ ID NO:27的第56367-56370位碱基的区域具有1个MspI识别序列的位置。
(7)PCR标记B59066 BsaJI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第57629位碱基是C,而AC068923中相应于所述位置的碱基是CC。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约420bp的片段:
B59066 BsaJI F:
5′-atttgttggttagttgcggctgag-3′(SEQ ID NO:51)
(相应于SEQ ID NO:27的第57563-57586位碱基)和
B59066 BsaJI R:
5′-gcccaaactcaaaaggagagaacc-3′(SEQ ID NO:52)
(相应于SEQ ID NO:27的第57983-57960位碱基)。
用BsaJI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有BsaJI识别序列(CCNNGG),能被BsaJI所切割,而来自IR24 DNA的扩增产物缺乏BsaJI识别序列而不能用BsaJI切割,从而导致用BsaJI处理后,DNA片段的长度存在差异。
(8)PCR标记B56691 XbaI的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第66267位碱基是G,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约670bp的片段:
B56691 XbaI F:
5′-cctcaagtctcccctaaagccact-3′(SEQ ID NO:53)
(相应于SEQ ID NO:27的第66129-66152位碱基)和
B56691 XbaI R:
5′-gctctactgctgataaaccgtgag-3′(SEQ ID NO:54)
(相应于SEQ ID NO:27的第66799-66776位碱基)。
用XbaI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自NipponbareDNA的扩增产物中具有XbaI识别序列(TCTAGA),能被XbaI所切割,而来自IR24 DNA的扩增产物缺乏XbaI识别序列而不能用XbaI切割,从而导致用XbaI处理后,DNA片段的长度存在差异。
(9)PCR标记B53627 BstZ17I的开发
将实施例2中所确定的相应于IR24重叠区(SEQ ID NO:27)的基因组碱基序列与上述的BAC克隆的碱基序列(登录号AC068923)进行比较,发现SEQ ID NO:27的第69331位碱基是T,而AC068923中相应于所述位置的碱基是C。
为了检测这一变化,首先利用下述引物对从所述位置的附近区域,通过PCR扩增约620bp的片段:
B53627 BstZ17I F:
5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:55)
(相应于SEQ ID NO:27的第68965-68988位碱基)和
B53627 BstZ17I R:
5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:56)
(相应于SEQ ID NO:27的第69582-69559位碱基)。
用BstZ17I处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自IR24DNA的扩增产物中具有BstZ17I识别序列(GTATAC),能被BstZ17I所切割,而来自Nipponbare DNA的扩增产物缺乏BstZ17I识别序列而不能用BstZ17I切割,从而导致用BstZ17I处理后,DNA片段的长度存在差异。
(10)PCR标记B40936 MseI的开发
下列所有PCR标记(10)-(12)的开发涉及研究进一步相应于在SEQ IDNO:27 3′末端第76363位碱基的下游区(3′)的碱基序列。
针对上述BAC克隆的碱基序列(登录号AC068923)设计下列引物对:
5′-tacgacgccatttcactccattgc-3′(SEQ ID NO:57)和
5′-catttctctatgggcgttgctctg-3′(SEQ ID NO:58)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1300bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B40936 MseI F:
5′-acctgtaggtatggcaccttcaacac-3′(SEQ ID NO:59)和
B40936 MseI R:
5′-ccaaggaacgaagttcaaatgtatgg-3′(SEQ ID NO:60)。
用MseI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自MS-FRKoshihikari(Rf-1 Rf-1)DNA的扩增产物中具有MseI识别序列(TTAA),能被MseI所切割,而来自Koshihikari DNA的扩增产物中缺乏MseI识别序列而不能用MseI切割,从而导致用MseI处理后, DNA片段的长度存在差异。
可应用dCAPs方法发展该标记。
(11)PCR标记B19839 MwoI的开发
针对上述BAC克隆的碱基序列(登录号AC068923)来设计下列引物对:
5′-tgatgtgtttgggcatccctttcg-3′(SEQ ID NO:61)和
5′-gagataggggacgacagacacgac-3′(SEQ ID NO:62)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1200bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B19839 MwoI F:
5′-tcctaggctgtttagaaactgcaca-3′(SEQ ID NO:63)和
B19839 MwoI R:
5′-caagttcaaacataactggcgttg-3′(SEQ ID NO:64)。
用MwoI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自KoshihikariDNA的扩增产物中具有MwoI识别序列(GCNNNNNNNGC),能被MwoI所切割,而来自MS-FR Koshihikari(Rf-1 Rf-1)DNA的扩增产物中缺乏MwoI识别序列而不能用MwoI切割,从而导致用MwoI处理后,DNA片段的长度存在差异。
可应用dCAPs方法发展该标记。
(12)PCR标记B2387 BfaI的开发
针对上述BAC克隆的碱基序列(登录号AC068923)来设计下列引物对:
5′-cactgtcctgtaagtgtgctgtgc-3′(SEQ ID NO:65)和
5′-caagcgtgtgataaaatgtgacgc-3′(SEQ ID NO:66)。
利用该引物对,结合以MS-FR Koshihikari(Rf-1位点的基因型为:Rf-1Rf-1)和Koshihikari的总DNAs为模板,常规进行PCR。将所得到的约1300bp的扩增产物在琼脂糖凝胶上电泳,然后用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化的DNA碱基序列进行分析,显示出数个多态性位点。
通过对所述位置附近的区域进行PCR扩增,可以检测到其中一个多态性位点,其中利用下列引物对:
B2387 BfaI F:
5′-tgcctactgccattactatgtgac-3′(SEQ ID NO:67)和
B2387 BfaI R:
5′-acatactaccgtaaatggtctctg-3′(SEQ ID NO:68)。
用BfaI处理后,可在琼脂糖凝胶上电泳观察到扩增产物。如此,通过在琼脂糖凝胶中迁移率的差异来显示所述变化,这是因为来自KoshihikariDNA的扩增产物中具有BfaI识别序列(CTAG),能被BfaI所切割,而来自MS-FR Koshihikari(Rf-1 Rf-1)DNA的扩增产物中缺乏BfaI识别序列而不能用BfaI切割,从而导致用BfaI处理后,DNA片段的长度存在差异。
(13)分离分析
对于在实施例1中获得的在Rf-1和S12564 Tap509I位点之间发生重组的2个重组体(RS1和RS2)和在Rf-1和C1361 MwoI位点之间发生重组的8个重组体(RC1到RC8),鉴定在上述(1)到(12)中开发的12个DNA标记位点的基因型。结果如表4所示,并显示了在S12564 Tsp509I和C1361 MwoI位点的每一重组体的基因型。
表4在Rf-1位点附近的重组体中不同标记位点的基因型
位点 |
RS1 |
RS2 |
RC1 |
RC2 |
RC3 |
RC4 |
RC5 |
RC6 |
RC7 |
RC8 |
S12564 Tsp509I |
J |
J |
H |
H |
H |
H |
H |
H |
H |
H |
P4497 MboIP9493 BsIIP23945 MboIP41030 TaqIP45177 BstUIB60304 MspIB59066 BsaJIB56691 XbaIB53627 BstZ17IB40936 MseIB19839 MwoIB2387 BfaIC1361 MwoI |
JHHHHHHHHHHHH |
JHHHHHHHHHHHH |
HHHHHHHHHHHHJ |
HHHHHHHHHHHHJ |
HHHHHHHHHHHHJ |
HHHHHHHHHHJJJ |
HHHHHHHHHHHHJ |
HHHHHHHJJJJJJ |
HHHHHHHHHHHHJ |
HHHHHHHHHHHJJ |
J:纯合的Koshihikari
H:杂合的Koshihikari/MS-FR Koshihikari
表4显示所有的重组体具有籼稻来源的,在P9493 BslI和B59066 BsaJI之间的Rf-1染色体区域。这一结果表明,具有如图3所示的染色体组织结构的重组体花粉具有花粉育性,即Rf-1基因在这些花粉中是有功能的。这意味着决定Rf-1基因功能存在的序列被包括在这些重组体花粉共有的籼稻区域中,即按最大可能性来估计包括在位点P4497 MboI至B56691 XbaI位点之间(约65kb)的区域内。
然而,存在这种可能,对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,并且无论其余区域是粳稻还是籼稻基因型,其遗传功能可能没有明显的变化。因此,还不能得出结论认为上述的共有籼稻区域(SEQ ID NO:27的第1239-66267位碱基)完全包含了全部的Rf-1基因。然而,认为至少SEQ ID NO:27完全包含了全部的Rf-1基因,理由如下:
1)通常基因的大小为数千个碱基而很少超过10kb;
2)本发明确定的IR24的基因组碱基序列(SEQ ID NO:27)完全包含
上述的共同籼稻区域;
3)SEQ ID NO:27的5′末端位于上述共同籼稻区域5′端的上游1238bp处,且构成另一个基因的一部分(S12564);以及
4)SEQ ID NO:27的3′末端位于上述共同籼稻区域3′端的下游10096bp处。
实施例4:来自XSE1的9.7kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSE1(图1和图5),并在琼脂糖凝胶上进行电泳。用QIAEXII(QIANGEN)纯化分离出的9.7kb片段(包括SEQ IDNO:27的第1-9657位碱基)。
另一方面,以pSB 11(Komari等人,如上)为基础制备具有潮霉素抗性基因表达盒的中间载体pSB200。具体地,首先将胭脂碱合酶终止子(Tnos)与遍在蛋白启动子和遍在蛋白内含子(Pubi-ubiI)融合。将潮霉素抗性基因(HGY(R))插入所得到的Pubi-ubiI-Tnos复合体的ubiI和Tnos之间,而完成Pubi-ubiI-HYG(R)-Tnos的组装。再将其与pSB11的HindIII/EcoRI片段融合得到pKY205。将用于添加限制性内切酶位点,NotI、NspV、EcoRV、KpnI、SacI、EcoRI位点的接头序列插入到该pKY205中Pubi上游的HindIII位点中,获得具有潮霉素抗性基因表达盒的pSB200。
用NotI完全消化质粒载体pSB200后,用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)去磷酸化。将反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上纯化回收载体片段。
用DNA连接试剂盒Ver.1(TAKARA),将上述制备的两个片段,即来自XSE1的9.7kb片段和载体片段进行连接反应。反应后,用乙醇沉淀法回收DNA。将回收的DNA溶于纯水(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,对混合物进行电穿孔。电穿孔后,将该溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有壮观霉素的LB平板上,并温育(37℃,16hr)。从所得到的24个克隆分离质粒。分析质粒的限制性内切酶片段的长度模式及其边界碱基序列,以选择出用重组质粒转化的所需要的大肠杆菌细胞。
根据Ditta等人(1980)的方法,将上述选择出的大肠杆菌细胞用于与根瘤农杆菌菌株LBA4404/pSB1(Komari等人,1996)和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从在含有壮观霉素的AB平板上形成的6个克隆中分离出质粒,并分析其限制性内切酶片段的长度模式,以选择出所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,将上述选择出的农杆菌细胞用于转化MSKoshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉来制备为转化所需的MS Koshihikari未成熟种子。
适应性培养之后,将转化植株转移到长日照条件的温室中。将生长到适合移植阶段的48株个体移植到1/5000a Wagner罐中(4株/罐),并在移植3-4周后转移到短日照条件的温室中。抽穗后约1个月,检测直立植株的种子育性。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明9.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例5:来自XSE7的14.7kb片段的互补分析
(材料和方法)
用EcoRI完全消化λ噬菌体克隆XSE7(图1和图5),然后用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳,以分离14.7kb的片段(包括SEQ ID NO:27的第2618-17261位碱基),其用QIAEXII(QIAGEN)纯化回收。
另一方面,用SacI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化,并用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上纯化回收载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSE7的14.7kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明14.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例6:来自XSF4的21.3kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSF4(图1和图5),并在琼脂糖凝胶上进行电泳。用QIAEXII(QIANGEN)纯化分离出的21.3kb片段(包括SEQ IDNO:27的第12478-33750位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF4的21.3kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明21.3kb的插入片段至少没有包含全长的Rf-1基因。
实施例7:来自XSF20的13.2kb片段的互补分析
(材料和方法)
用SalI完全消化λ噬菌体克隆XSF20(图1和图5),将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳以分离13.2kb的片段(包含SEQ ID NO:27的第26809-40055位碱基),其用QIAEXII(QIAGEN)从凝胶上纯化回收。
另一方面,用EcoRV完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF20的13.2kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有44个转化植株个体都是不育的。这表明13.2kb的插入片段至少没有包含全长的Rf-1基因。
实施例8:来自XSF18的16.2kb片段的互补分析
(材料和方法)
λ噬菌体克隆XSF18与XSF20在5′和3′端(分别是SEQ ID NO:27的第20328位和第41921位碱基)是相同的,但缺乏内部第33947-38591位的碱基。因此,它包括SEQ ID NO:27的第20328-33946位碱基和第38592-41921位的碱基。这是因为克隆XSF18是最初被分离的,但分离后在扩增期间发现包含上述缺失,因此重新进行扩增步骤而分离到完整的克隆,称为XSF20。
用NotI完全消化λ噬菌体克隆XSF18(图5),在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的16.2kb片段(包括SEQ ID NO:27的第21065-33946位和第38592-41921位的碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSF18的16.2kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的(图6)。这表明16.2kb的插入片段至少没有包含全长的Rf-1基因。
实施例9:来自XSG22的12.6kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSG22(图1和图5),并在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的12.6kb片段(包括SEQ IDNO:27的第31684-44109位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG22的12.6kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明12.6kb的插入片段至少没有包含全长的Rf-1基因。
实施例10:(1)来自XSG16的15.7kb片段的互补分析
(材料和方法)
用NotI部分消化λ噬菌体克隆XSG16(图1和图5),并在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的15.7kb片段(包括SEQ IDNO:27的第38538-54123位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG16的15.7kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
在47个转化的植株个体中,至少有37株个体明显的恢复了育性(图6)。这表明在来自水稻(IR24)的15586个碱基(SEQ ID NO:27的第38538-54123位碱基)的15.7kb插入片段中包括了全长的Rf-1基因。
(2)XSG16中内部11.4kb片段的互补分析
(材料和方法)
用AlwNI和BsiWI完全消化λ噬菌体克隆XSG16,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用DNA钝化试剂盒(TAKARA)钝化。将反应溶液在琼脂糖凝胶上电泳以分离11.4kb的片段,其用QIAEXII(QIAGEN)进行纯化。
用SmaI完全消化质粒载体pSB11(Komari等人,植物杂志Plant Journal,1996),再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段进行连接反应。反应后,用乙醇沉淀法回收DNA。将回收的DNA溶于纯水(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,将混合物进行电穿孔。电穿孔后,将该溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有壮观霉素的LB平板上,并温育(37℃,16hr)。从所得到的14个克隆中分离质粒,分析质粒的限制性内切酶片段的长度模式及其边界碱基序列,以选择出所需要的大肠杆菌细胞。
根据Ditta等人(1980)的方法,将上述选择出的大肠杆菌细胞用于与根瘤农杆菌菌株LBA4404/pSB4U(Takakura等人,日本专利申请号2001-269982(WO02/019803 A1))和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从在含有壮观霉素的AB平板上形成的12个克隆中分离出质粒,并分析其限制性内切酶片段的长度模式以选择出所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,将上述选择出的农杆菌细胞用于转化MSKoshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉来制备用于转化所需的MSKoshihikari未成熟种子。
适应性培养后,将转化植物转移到长日照条件的温室中。将生长到适合移植阶段的120株个体移植到1/5000a Wagner罐中(4株/罐),并在移植约1个月后,转移到短日照条件的温室中。抽穗后约1个月,从每一植株中取样一典型穗用于评价种子育性(总谷粒数中可育谷粒数的百分比)。
(结果和讨论)
在120个转化的植株个体中,有59株个体显示了10%或更高的种子育性,其中有19株个体显示了70%或更高的种子育性。这表明11.4kb的插入片段(SEQ ID NO:27的第42357-53743位碱基)包含了表达育性恢复功能所必需的Rf-1基因。
(3)XSG16中内部6.8kb片段的互补分析
(材料和方法)
用HpaI和AlwNI完全消化λ噬菌体克隆XSG16,并在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)纯化分离的6.8kb片段。
根据上述(2)中的方法进行包括制备质粒载体pSB11的后继步骤。
(结果和讨论)
在120个转化的植株个体中,有67株个体显示10%或更高的种子育性,其中有26株个体显示70%或更高的种子育性。这表明在6.8kb的插入片段(SEQ ID NO:27的第42132-48883位碱基)包含了表达育性恢复功能所必需的Rf-1基因区域。
实施例11:来自XSG8的16.9kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSG8(图1和图5),在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的16.9kb片段(包含SEQ ID NO:27的第46558-63364位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSG8的16.9kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化的植物。
(结果和讨论)
所有48个转化植株个体都是不育的。这表明16.9kb的插入片段至少没有包含全长的Rf-1基因。
实施例12:来自XSH18的20.0kb片段的互补分析
(材料和方法)
用NotI完全消化λ噬菌体克隆XSH18(图1和图5),在琼脂糖凝胶上电泳。用QIAEXII(QIAGEN)回收纯化分离的20.0kb片段(包括SEQ ID NO:27的第56409-76363位碱基)。
另一方面,用NotI完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的两个片段,即来自XSH18的20.0kb片段和载体片段进行连接反应。然后,根据实施例4中描述的方法制备和研究转化植物。
(结果和讨论)
所有44个转化植株个体都是不育的。这表明20.0kb的插入片段至少没有包含全长的Rf-1基因。
实施例13:来自XSG8和XSH18重叠区的19.7kb片段的互补分析
(材料和方法)
用SalI和StuI完全消化在实施例11中连接获得的,从所需要的大肠杆菌中分离的质粒(XSG8SB200F),并在琼脂糖凝胶上电泳。再用QIAEXII(QIAGEN)回收纯化分离的12.8kb片段(包括SEQ ID NO:27的第50430-63197位碱基)。
另一方面,用SalI、StuI和XhoI完全消化在实施例12中连接获得的,从所需要的大肠杆菌中分离的质粒(XSH18SB200R),并在琼脂糖凝胶上电泳,以分离6.9kb的片段(包括SEQ ID NO:27的第63194-70116位碱基),再用QIAEXII(QIAGEN)回收纯化。
进一步,用EcoRV完全消化质粒载体pSB200,再用乙醇沉淀法回收DNA。将回收的DNA溶于TE溶液,然后用CIAP(TAKARA)去磷酸化。将反应溶液在琼脂糖凝胶上电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。
用DNA连接试剂盒Ver.1(TAKARA)将上述制备的三个片段,即来自XSG8的12.8kb片段、来自XSH18的6.9kb片段和载体片段进行连接反应。连接产物包含来自XSG8和XSH18的重叠区(包括SEQ ID NO:27的第50430-70116位碱基)(图5中的XSX1)的19.7kb片段。然后,根据实施例4中描述的方法制备和研究转化的植株个体。
(结果和讨论)
所有40个转化植株个体都是不育的。这表明19.7kb的插入片段至少没有包含全长的Rf-1基因。
实施例14:cDNA文库的制备
首先,制备经回交而将Rf-1导入Koshihikari的IL216品系(基因型为,Rf-1/Rf-1)。IL216经常规方法生长在温室中,在叶耳(auricle)长度为-5~5cm之间的生长阶段期间,对幼穗进行取样。通过SDS-酚方法(Watanabe,A.和Price,C.A.(1982)Translation of mRNAs for subunits of chloriplast couplingfacor 1 in spinach.Proceedings of the National Academy of Sciences of theU.S.A.,79,6304-6308)提取总的RNA,并且利用QuickPrep mRNA纯化试剂盒(Amersham Phamacia Biotech)纯化poly(A)+RNA。
提供纯化的poly(A)+RNA,用ZAP-cDNA合成试剂盒(Stratagene)来制备cDNA文库。计算所制备的文库的滴度(1ml)为16,000,000pfu/ml,并且确定为是足够大的。
实施例15:cDNA文库的筛选
(1)筛选引物的制备
利用下列两种类型的引物进行PCR:
正义引物
5’-tctcattctctccacgccctgctc-3’(SEQ ID NO:76)
反义引物
5’-acggcggagcaattcgtcgaacac-3’(SEQ ID NO:77)
并且以XSG16,IR24的基因组克隆作为模板。SEQ ID NO:76和77分别相应于SEQ ID NO:27的第43733-43756位碱基和第44038-44015位碱基。
电泳后,用QIAEX II凝胶提取试剂盒(QIAGEN)从琼脂糖凝胶回收约300bp的扩增产物。用Rediprime II DNA标记系统(Amersham PharmaciaBiotech)32P-标记回收的片段(此后该片段称为“探针P”)。
此外,利用下列两种类型的引物进行PCR:
正义引物
5’-agtgtgtggcatggtgcatttccg-3’(SEQ ID NO:78)
反义引物
5’-ctctacaggatacacggtgtaagg-3’(SEQ ID NO:79)
并且以XSG16,IR24的基因组克隆作为模板。SEQ ID NO:78和79分别相应于SEQ ID NO:27的第48306-48329位碱基和第50226-50203位碱基。电泳后,从琼脂糖凝胶回收约1900bp的扩增产物。用上述的方法32P-标记回收的片段(此后该片段称为“探针Q”)。
(2)cDNA文库的筛选
提供实施例14中所制备的cDNA文库,来制备70个琼脂培养基,其中出现了约15000个噬菌斑。对于每个琼脂培养基进行两次噬菌斑挑取,将噬菌斑转移到Hybond-N+上(Amersham Pharmacia Biotech)。一张膜用于与探针P杂交,而另一张膜用于与探针Q杂交。根据制造商的指导说明进行全部步骤。
将探针加入含有250M Na2HPO4、1mM EDTA和7%SDS的杂交溶液,并且杂交在65℃下进行16小时。然后在65℃用含有0.1×SSC和0.1%SDS的溶液洗涤两次,每次15分钟。洗涤后,用FUJIX BAS 1000(Fuji Photo Films)分析膜。
结果是,鉴定出8个对探针P和探针Q都显示阳性的噬菌斑。因此,分离出这些噬菌斑,根据制造商(Stratagene)的指导说明亚克隆到pBluescript中。在8个克隆中,鉴定出6个克隆的末端碱基序列是XSG16的。确定了6个克隆的全部碱基序列,结果如序列表中SEQ ID NOS:69-74所示。
推测所有的序列,SEQ ID NOS:69-74编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每一个SEQ ID NO:69的第215-2587位碱基、SEQ ID NO:70的第213-2585位碱基、SEQ ID NO:71的第218-2590位碱基、SEQ ID NO:72的第208-2580位碱基、SEQ ID NO:73的第149-2521位碱基,以及SEQ ID NO:74的第225-2597位碱基编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将SEQ ID NO:75的氨基酸序列与推测的玉米育性恢复基因(Rf2)的氨基酸序列进行比较,N-末端的7个氨基酸残基(Met-Ala-Arg-Arg-Ala-Ala-Ser)在两个氨基酸序列中同时存在。认为这7个氨基酸残基是线粒体的靶信号部分(Liu等人,2001)。根据上述事实,认为在此情况下分离的cDNAs包含Rf-1基因的全部编码区域。除了上述区域外,在水稻Rf-1和玉米Rf2的氨基酸序列之间没有发现同源性。推测Rf-1和Rf2的基因产物在转移到线粒体后能够恢复育性的机制相互之间是截然不同的。
此外,将在此情况下分离的cDNAs序列与IR24的基因组序列(SEQ IDNO:27)比较,并且阐明了Rf-1基因的外显子和内含子结构(图7)。结果是,表明在植物体中存在拼接形式和polyA加入位置不同的多种转录产物。Rf-1基因的编码区域中没有内含子。
实施例16:互补分析
利用包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段进行互补分析。4.2kb的片段是在含有来源于IR24的6.8kb基因组的质粒中的,其在实施例10(3)中正式具有育性恢复功能。
首先,用EcoRI处理实施例(3)中描述的质粒,并用琼脂糖凝胶进行电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段(相应于SEQ ID NO:27的第42132-46318位碱基),利用QIAEXII(QIAGEN)从凝胶中回收该片段。利用DNA连接试剂盒Ver.1(TAKARA)将4.2kb的片段与用EcoRI和CIAP(TAKARA)处理的pBluescript II SK(-)一起进行连接反应。反应后,用乙醇沉淀法回收DNA。
将回收的DNA溶于纯水中(用Millipore系统制备),然后与大肠杆菌DH5α细胞混合,将该混合物进行电穿孔。电穿孔后,将溶液在LB培养基中振荡培养(37℃,1hr),然后接种在含有氨苄青霉素的LB平板上并温育(37℃,16hr)。从所得到的12个集落分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。然后,用BamHI和SalI处理从选择的大肠杆菌分离的质粒,在琼脂糖凝胶上电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。
另一方面,用BamHI和SalI处理TnosJH0072(包括nos终止子和氨苄青霉素抗性基因表达盒的中间载体),在琼脂糖凝胶上电泳。分离出包含nos终止子和氨苄青霉素抗性基因的3.0kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。
将包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段与来源于ThosJH0072的片段进行连接反应,并用上述的方法进行电穿孔。将反应物涂布在含有氨苄青霉素的LB平板上并温育(37℃,16hr)。从所得到的12个克隆分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。
进一步的,用SgfI处理从所选择的大肠杆菌分离的质粒,在琼脂糖凝胶上电泳。分离出包含Rf-1基因的启动子区域和推测的翻译区域的4.2kb片段,利用QIAEXII(QIAGEN)从凝胶中回收该片段。将4.2kb片段与已经用PacI和CIAP(TAKARA)处理的pSB200Pac(包括潮霉素抗性基因表达盒的中间载体)进行连接反应,并用上述的方法进行电穿孔。将反应物涂布在含有壮观霉素的LB平板上并温育(37℃,16hr)。从所得到的16个克隆分离质粒,分析其限制性内切酶片段长度的模式和边界的碱基序列,以选择所需要的大肠杆菌细胞。
上述步骤的结果是,获得其中已经在中间载体内插入嵌合基因的大肠杆菌细胞,其中该嵌合基因是含有Rf-1基因的启动子区域和推测的Rf-1基因翻译区域的片段与nos终止子的结合。根据Ditta等人(1980)的方法,将大肠杆菌细胞与根瘤农杆菌菌株LBA4404/pSB1(Komari等人,1996)和辅助大肠杆菌菌株HB101/pRK2013(Ditta等人,1980)进行三亲杂配。从含有壮观霉素的AB平板上形成的6个克隆中分离质粒,分析其限制性内切酶片段长度的模式,以选择所需要的农杆菌细胞。
根据Hiei等人(1994)的方法,用上述选择出来的农杆菌细胞转化MS Koshihikari(具有BT细胞质和与Koshihikari基本上相同的核基因)。用Koshihikari对MS Koshihikari进行授粉而制备为转化所必需的MSKoshihikari未成熟种子。
适应性培养后,将转化植株转移到长日照条件的温室中。将生长到适合移植阶段的32株个体移植到1/5000a Wagner罐中(4株/罐),并在移植3-4周后转移到短日照条件的温室中。抽穗后约1个月,检测直立(standing)植株的种子育性。结果是在32个转化植株中有28个个体恢复了育性。
经过上述步骤,已经实验性证实通过表达推测的翻译区域可提供Rf-1基因的功能。
实施例17:cDNA的公离
在实施例15中,用探针P和探针Q筛选来源于IL216幼穗的cDNA文库。分离并分析对两个探针都为阳性的噬菌斑,并分离出6个cDNA。在这个实施例中,用下述的探针P和探针R进行相似的筛选,分离出另外的6个cDNAs。如下进行详细说明。
首先,利用下列两个类型的引物进行PCR:
正义(sense)引物
5’-cagttgggttgaaacctaatactg-3’(SEQ ID NO:86)
反义引物
5’-cactaaaccgttagacgagaaagc-3’(SEQ ID NO:87)
并且以IR24的基因组克隆,XSG16作为模板。SEQ ID NO:86和87分别相应于SEQ ID NO:27的第45522-45545位碱基和第45955-45932位碱基。
电泳后,用QIAEX II(QIAGEN)从琼脂糖凝胶回收约430bp的扩增产物。用Rediprime II DNA标记系统(Amersham Pharmacia Biotech)32P-标记回收的片段(此后该片段称为“探针R”,图8)。
提供来源于IL216幼穗的的cDNA文库,来制备20个琼脂培养基,其中出现了约15000个噬菌斑。对于每个琼脂培养基进行两次噬菌斑挑取,将噬菌斑转移到Hybond-N+上(Amersham Pharmacia Biotech)。一张膜用于与实施例15的探针P杂交,而另一张膜用于与探针R杂交。根据制造商的指导说明进行所有的步骤。结果是,鉴定出12个证明对探针P和探针R都为阳性的噬菌斑。
因此,分离出这些噬菌斑,根据制造商(Stratagene)的指导说明亚克隆到pBluescript中。确定克隆的末端碱基序列。在12个克隆中,鉴定出6个克隆的末端碱基序列是XSG16的,因此确定了6个克隆的全部碱基序列(#7-#12)。结果如SEQ ID NOS:80-85所示。
推测所有的序列,SEQ ID NOS:80-85编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。具体地,所有的和每一个SEQ ID NO:80的第229-2601位碱基、SEQ ID NO:81的第175-2547位碱基、SEQ ID NO:82的第227-2599位碱基、SEQ ID NO:83的第220-2592位碱基、SEQ ID NO:84的第174-2546位碱基,以及SEQ ID NO:85的第90-2462位碱基编码具有SEQ ID NO:75的第1-791位氨基酸的蛋白质。上述碱基序列相应于SEQ IDNO:27的第43907-46279位的碱基。
将在这种情况下分离的cDNA序列与IR24(SEQ ID NO:27)的基因组序列进行比较,并且确定了外显子和内含子的结构(图8)。在这种情况下分离的cDNA中,有3个cDNA没有与推测的翻译区域无关的任何外显子,而由单个的外显子组成(#10-#12,SEQ ID NOS:83-85)。
序列表
<110>日本烟草产业株式会社(JAPAN TOBACCO INC.)
欣根塔有限公司(Syngenta Limited)
<120>水稻BT型细胞质雄性不育的水稻恢复基因
<130>YCT811
<150>JP 2002-197560
<151>2002-07-05
<160>87
<210>1
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物
<400>1
cattcctgct tccatggaaa cgtc 24
<210>2
<211>33
<212>DNA
<213>人工序列
<220>
<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物
<400>2
ctctttctgt atacttgagc tttgacatct gac 33
<210>3
<211>20
<212>DNA
<213>人工序列
<220>
<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物
<400>3
gatcgacgag tacctgaacg 20
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物
<400>4
aatagttgga ttgtcctcaa aggg 24
<210>5
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物
<400>5
aaagcaaccg acttcagtgg catcacc 27
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物
<400>6
ctggacttca tttccctgca gagc 24
<210>7
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物
<400>7
gaccaccaat taactgatta agctggc 27
<210>8
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物
<400>8
tttctggctc caataatcag ctgtagc 27
<210>9
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增G291 MspI标记序列的寡核苷酸引物
<400>9
ctgctgcagc aagctgcacc gaaccgg 27
<210>10
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增G291 MspI标记序列的寡核苷酸引物
<400>10
acattttttc ttccgaaact tccg 24
<210>11
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R2303 BslI标记序列的寡核苷酸引物
<400>11
atggaaagat acactagaat gagc 24
<210>12
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增R2303 Bs1I标记序列的寡核苷酸引物
<400>12
atcttatata gtggcaggaa agcc 24
<210>13
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物
<400>13
aacaatctta tcctgcacag actg 24
<210>14
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物
<400>14
gtcacataga agcagatggg ttcc 24
<210>15
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物
<400>15
agctgttgag agttctatgc cacc 24
<210>16
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物
<400>16
tagccatgca acaagatgtc atac 24
<210>17
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物
<400>17
ctagttagac cgaataactg aggttc 26
<210>18
<211>27
<212>DNA
<213>人工序列
<220>
<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物
<400>18
tttgtgggtt tgtggcattg agaaaat 27
<210>19
<211>2240
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G4003 HindIII
<400>19
gcggccgctc cgggaagtcg agcgagtaga cgcccctgac gccgtacgcg tcggcgagcc 60
gcagcggcgt ctctggcggt gtgaaggaca gcccgttcag cgtcgcgcgg cgccgcccgt 120
tgatcgtcac cggcgccgtg ctccgcagca ggtacgcctg cgtcacgttg atcgacgagt 180
acctgaacga tccctgtggg ttcggcctcg ccgctccggc actcaggttc cacctgccca 240
atgcaaaaaa ccaaaaccca aaagcttaat gcgaataata catcattcca cgtatttaaa 300
aaaataattt ataggtaaaa tttttataat gtattttagc gacgtaaatg tcaatgctga 360
gaaataaacg ataatacttt aaatgaagtt ctaaaattta aattttggca tcggttgatg 420
ttggataaag aaaacgatgg aggctagtaa tttttcttct tttttaagta tctagattgt 480
catatattga atttttcagt ttttcatccc tttgaggaca atccaactat tattttcctt 540
ttcttatgta aaaggttgaa caacatattc aaacataaaa aaataaaatt aaatgaaata 600
aatttacaat tcataaaatt tacagaattt atgttaagaa aatattcaaa cttagataat 660
aataaagcaa caaaatcgta ctaaaaagaa gtataattgt acattgtata ctactactcc 720
tacaatttta gacttagaat ttttaatttc ctgaaatcta gtaatgccat ttttttcttt 780
ctagttgaac cagacagtaa gtttaactcg aaacttataa gctaatgagc gaagtcgggc 840
aattcactcg tacctgacgg agcgagcttg gttcatggag aaggacttgt cgaactggtc 900
ctggggaggg tcggggagcg ggccggaggc ccgcccccgg gagttggagt agcggaggac 960
ggcgacgccg gcgacgcggc gccacacggt gtcgttcacc atgcgcgcgc tggcgacgac 1020
gtagtagtcg gagctcgcgt tctggtcggt ggtgacgagg aaggagtagg actggccgac 1080
gtggacgtcc aggttggtgt agttctgctg cgtcgtgtag gagccctccg tctccaccag 1140
caccatgttg tgcccctgga tcctgaagtt gaggctcgtc gacgtcccca cgttgtgcac 1200
tcggatcctg tacgtcttgc ctgtgtcccc acaccgacgt cgccgacaca cgcgcaaaag 1260
ataatagact cattgtaagt aggtagtaac cttctccgtt tcatattata aatcgtttga 1320
ttatattttt gttagttaaa cttctttaag ttttttttct ataaacttaa ttaaatctaa 1380
agaattttaa taaaaaaaat caaacgactt ataatataaa atggatggag tagttgcatc 1440
aatttgtgga tgaagcaaac aagattatat ccttttcatg agggtgaaag tattcagtga 1500
acaattcgtc agtttcaagt ttcatgaaat cggacagggt ctctgaaagt ctgtattttt 1560
ggtactgttg gattgactac tctggcttct gttgtcacat cttttgtatc ctagtttcgg 1620
taaaaaaaat tttggcattt ttactcctat cgttgatctg tttaactgaa accattgcat 1680
gatatactac tagcagacaa aactggtgaa aattcacgag aatgaacttt ttgtcagtta 1740
agcattagcg gacagcttca gtaagcagag caggctgcct taaggcttaa agcactatct 1800
tccacaacac tttgtcctac aatcaaattc caaatttact atcacaaaaa gcgaaggaac 1860
taactaaacc ttactcctac tagtactact gctatgacta tgaaacaaga ttccaatcca 1920
aagaaaacac agtgctcgat cagcatgata aaagcaacga aacctgctca tccagctgcc 1980
aaaatgccac cccactgact ctacgtacgt actacgtatt gacgctgtaa aaaactagcc 2040
gtagtacaga gaagaggacc caaagtttcg tcaaaaattt tattttaccc ggatccacat 2100
tgatggtctc gtactcgatg ccggccggga caaggctgtc gttgtacctg tacgggccct 2160
tgccgttaat cagcacgccg tccggcatcc cgaggtcctt gccactgtcc agcatcttcc 2220
tcagatcctg caacgaattc 2240
<210>20
<211>2601
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记C1361 MwoI
<400>20
tcttgctgag atccaagttg cggtaacttt gcccttttct ttttttcttc tcttctgaat 60
tttttcatgg tttttgggag agattttcgt aacttgatta cagttctagg aaaaggccac 120
cttgttcaaa cagggctttc ttgaaaggga tcaatttgct aggagtacat gattctaaaa 180
gcgatttcga aataaaacac agttctcgat ctcatacctg aaaacaaaag gcccatactg 240
tgtaaactgt gattatgctt ctgttaaatg ggatatttgt acaaaattga cgccaaccac 300
ctataaacag attgtgagct tttatcttag taaaataaaa tgtgacattc tactcagtgt 360
tcagtgatcc gatgtcgtct cttctgcgta caacttctaa cagccgtttt cggtagtaca 420
aactagcgaa acaccaaaaa cgcagcattt gagttctgga atacgctgaa attgttagaa 480
tcaaccacga aaccaaaatc attgttcaga aacgttgcaa cgagataaaa cacaagaact 540
tgttttaaca aagcatacgg acagtacata tacggttaca acacccagtc tttatacagt 600
tctgctggag ttccatctac tggctgtcat tgtatctcag gacagacagg ttaacatagg 660
tacaacacaa ttacaggcta aaccgaagcg aactacactg tcagcatctc taacagtatc 720
gtcaagcaag cttatttaca gctgctctag taaatttaca acgtccctgg cagaatccct 780
ctcgtttctg gcagcgacga ggcacggtcc atggccttag caggacatct cacccgtcag 840
ctgcatagaa agcaaccgac ttcagtggaa tcacctcctg ctcctgcaaa aaagttggtt 900
cgatcaatca cgcgtttaat ccaaaacaaa atgggtatta attatgctag cctatgaagc 960
tacctcagag ttctctattt gctctgcagg gaaatgaagt ccagtggaac agttctcaag 1020
cacctcaggg ctcttcatcc atgctttgtg tgcttcaatg gctttcagct tatagcgaaa 1080
catctgcgat acggatctaa aattaaggat gtcgacaatt acttaacaca acaaataatt 1140
gaagcaggtc cagttaaaga aaagtagcag cgaagaatag cactctgaag tctgaacctc 1200
agataaagaa atggttggtt tttccagttc atctccctca acatggattc cagtaccctg 1260
gcattctggg caaaggatgg atgttatttt cttaggtgca ttttttgcct ttcttcctcg 1320
attgcttttt cccttgcttg caattttgtc tgctagcatc tcatattggc ataaaatagt 1380
ccagtgcaca aggcaagaag tgtgaaacaa atgaaatgcc tgcaaaatta gccgtacaaa 1440
gtcattggag gttgcagcag aatactacaa atttttaaag aagaaactat acactgtcta 1500
tgttttgctt gaaatgaatt caaccacttt gcattatacg gtttggaatc cctggtttgt 1560
gagaactgta attccattac aacagtgaag aagttaccat aactaatgaa tggaaattag 1620
tcaaatgcct aattttttag gtttgcttta atttatttat ctgtgagaaa tgctaagcat 1680
gtcatgcgtt gctatcttca agaaatacta agaaactgca aaggcaaaga atgtttgaaa 1740
taacttaccc cgcttgagtt tctactgctg caggctagat ttcctgtctt gcagttgagc 1800
aaggtagcta catccttttc aagaagcatt ggtcgcccac aaatatcaca agctttctca 1860
gcagcaaggc gcttctgctt acgcaactcc ctcctcatag atttggtgga taagaggcca 1920
acttgaagat tgtgtgaagt acctgtcggg gaacctgtta tgatagcttg gctattgtca 1980
tgggcggagc tgctttgctc attcgactcc tctgaagatg cttcttgatc tgaaaatgac 2040
ttctttcttc tctttccacg gtgtccagca tcatcaatca cgaagaaaga tccagcagag 2100
ataggaaggt cctgatcatc agaagaccac ttcctgccca actcaattgt ataagagaag 2160
ttgacaatgg caaagtcaga ttgctcatag gtgtcacact catccaagcc atgggagcca 2220
tcctgtccta cccaagcaca ccagatcttg ctaatctttt tacttccttt gctagcttcc 2280
cataacctgt atgcaatatt tccatatccc aaaagatgca caggcaaatc cgaaacaaca 2340
tcctttagca atacactagg aataacgaga ggaccgtcag ttccactttg gtttgacagc 2400
acatgatctt cagatacaga agcagttcta ccattaccat gcgcatttgc accacggcgt 2460
gtgccttttg cgccattgcg agagctagaa tcatctctca acctcgaagt cacttcagtg 2520
tcgttcgctg gaaccagagc cagctctctg gtgttctgcg agctcgagtc cagcaagagc 2580
gggtccttct cgcgcgagtt g 2601
<210>21
<211>1333
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G2155 MwoI
<400>21
ccctctgctt gatccagtgt acatccatgg gttaggacag attagttact cagttaatta 60
agtgtgagac tggaaaaaaa tatctgacgg cagttttata agttgagtga ttgaactagt 120
gaaagttcag ttaactgtca acggctgtag atttgggatg gcagactgtt ctgagtcaaa 180
atgaagcttt tactgtgcgt ggttaccagg tgcagtaaaa taatttcaga tctaatcgca 240
gtaaaaaaat gtagtactat atgttaagac gagattggtc ggtcaaaatc tatctggccc 300
tttacatctc ccaaatgtta cctcagttgc aggtggtaaa aaaaaatcac tcgtttcacg 360
tgatgtcggc agatcatgga ccatgtctca aatgctgaaa ctctgaacaa tcaacaaaaa 420
aatccaacca gatgagctgt gcaactgata attgatcatc acactatttg caactcatct 480
ttcatgtaga tggaacttca atcccgaaga aataatgaca gcaaaatgct gcgatcctga 540
agaaaggatg gcggcaaaat ggcagcgata aaaaaaaaat ggttggttac tgaagaatta 600
tttgtgcagc agttgagaca gtagcaagat aagagctagc taagctagct aggtagagtt 660
ggatggaaga gtagtagtat gagatagagc atggagcgcg acaactcaag tggatgctaa 720
agtaaaaggc attctcttct cttgtttgga atcagaaaag aaaagaaaag acttgagctg 780
cttggctgga atgtttggtt ggatcatgcg cgctctcctt agcttagctc gccaagaaat 840
cctcgcttca tctctctcaa taattcaaag ccacgagctc tctgctcata tccagtgcga 900
cgattcccgt taatgcaaat gcattatatc cagttcgaaa tgttacaatt cttgcgtttg 960
cagcaagcca gcaagtggtg tgaattgttt aatccctcgt gcatttcaac gaaattctct 1020
cacaaattcg cattgacttc tttcttagca caattagtaa gcagtgacaa ataaagaatt 1080
tttgaacagg atgtctttcc aaggaaggtg agatttttta tgtggatagc aaggatcgcc 1140
tttccttagc atgaagagaa tgtgatcaac tttacacctt gcttacgatt atggccttaa 1200
tttttgatac cctaaacagg agcacatcac atgcatgtcg acctgagacc accaattaac 1260
tgattaagtt ggcatttcag atgcatccgt cagttacatg atcaggtgat cgatggatca 1320
actgtaggtt tca 1333
<210>22
<211>863
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记G291 MspI
<400>22
cgaacaggat caaaagtaga cgacgagggc atttagaagg agaggaattg tatttgttcc 60
cggtatttaa tttttaaatt tgtggtcgga agtttcggaa gaaaaaatgt gctcatgagt 120
gattattggc tctgaacacc aacctctctt ttcgttgatt ccttctgagg tgttgggtgt 180
tgggacacga tgctgccgcc gacacgacac cgggttccac aatacactaa tctactcgcg 240
acaccttcat tgaactgcat ataattattt agaaagtcca ttaacacatc ttataaaacc 300
ttgttgaatc atataatcat tctataaagt ctatttgaac atcttatgaa aaaataagat 360
ctgacctagt cgttacactc tcttacattt tccattagcc taactaattc cgtgcaggaa 420
acgcccaaaa ataatagtac caatagtcca ctaatcccgt gccagaggcc gccaatgatt 480
agtgattaac ccaaaaaaca taatcatcat cacacgccgc taatgaccag ctctcgctta 540
gctcatccca caggcggccc ccacacgcca ctcctgccat gtgggcccac ctttcacacc 600
ccccaccaac cagaaaaaaa actcccccaa aaaaaaaact tttaatgctt atctcgcggc 660
agtataaaag gcgaccccac cacccacaca caatcacagt cagcgaccca acccaacccg 720
agccgaggag tcgagtcgtg tgaaaattac gaaattgccc ttcgactcca ccaccaccac 780
ccaccggcga ggcgaggaga ggagaaaaat tgggaggaaa aaaaaaggga aaaagaaaaa 840
gggtggagga gatttttgcg aag 863
<210>23
<211>1510
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记R2303 BslI
<400>23
tgccatgaag acctatggaa agaatatctt cttctcactc tgtgaatggt gagtttactc 60
tctgtaacat ttagggctag gtcgaaggaa catgaagcat tgctgattca ctccactgtg 120
tttttttttt ctgtataggg ggaaagaaaa tcctgctaca tgggcaggcc gcatgggtaa 180
cagctggaga acaactggcg acatcgccga caactggggc aggttctact catcctctct 240
ttaaccctgt ttacatagtt cttgagtttt tcagtactga tcgtaattgc cctgttattt 300
cagtatgaca tctcgtgcag acgaaaatga ccaatgggct gcctatgctg gacctggtgg 360
atggaatggt aagaacttga gatgtatctg ttcctaggtt gcttaaccat ttgagagctt 420
caaaatgatc aacatatgtt tctgctgtgc aatatcagat cctgacatgc ttgaagtggg 480
aaatggtggg atgtctgaag ctgagtaccg gtcacacttc agtatctggg cactagcaaa 540
ggtaccatag catgttctat gtactaataa ttttgctgca atgttgaact tctttgcatt 600
tcctcactgc aagttttgct tgaattgttc aggctcctct tttgatcgga tgcgatgtgc 660
gctcaatgag ccagcagacg aagaacatac tcagcaactc ggaggtgatc gctgtcaacc 720
aaggcaagcc ttctcagttt cacatgctta gatttagcca tacctcttgg atatttcacc 780
atactcataa tgtaactctc tgaacagata gtctaggtgt ccaaggaaag aaagtacaat 840
ctgacaacgg attggaggta tcccttcaat ggcttccaaa tttgcagttt ctcattgtcc 900
cataagcctt ggcatgatca tgactaactc tgaagctgac aatactttgt gtaaatttgt 960
cggtaggttt gggccgggcc actcagcaac aacaggaagg ctgtggtgct ctggaacagg 1020
cagtcatacc aggcaaccat cactgcacat tggtcgaaca tcgggctcgc tggatcggtc 1080
gcggtcactg ctcgtgatct atgggcggta aagcctttgc tttcttcaga gctcaaagta 1140
gaacatcttc tcttcagaat tcagagttca taacaaattt ctgtcaattg tgcagcactc 1200
ttcgttcgcg gctcagggac agatatcagc atcggtggcg cctcatgact gcaagatgta 1260
tgtcttgaca ccaaactagt cagcaaagaa aagcagcaca ggttagtacg tgtccggcga 1320
atacagctaa attgatcagg attcaggaag aaggtttgca atttgcaagg attggtagag 1380
ctggaaatgg gatgccattt ggttatgtat gtagaaataa gctgtaagcc tgtaagcgta 1440
tatgtaatca gccgtcaaat gctggcgagt gtatttctga agtttgcaac gaaagttgca 1500
gcaataaaaa 1510
<210>24
<211>1016
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记BstUI
<400>24
tggggattct tttctttaag caatttaaca ttattgtcct aacaatatac acaatattgg 60
tttttctttc agtatcaaat aattctttta cttttgaaaa cacatttgca atgtgttgga 120
aacacaatta tatcttgcac ttccttttgg aaatttaatc atttgaaaac tgattcgcgt 180
ttcatggctg taatcttctc ttgcgaacat cgctctttct ttgatggttc tctgttgaga 240
agaagagcaa ccaagtaaat tttcgaaatg tttttttgtt ctttctattc accattgcag 300
gttgtcaaag ccatcgagaa ggccataccg attccgagag cgcaacccat tgccttggat 360
ggcccagcaa gggaagagct gaaggccatg gaggcgcaga aggtcgagat cgaccgcacc 420
gcggcgctcc aggtgcgccg tgagctttgg ctggggctgg catacctcgt cgtccagact 480
gccggcttca tgaggctcac attctgggag ctctcatggg atgtcatgga acccatctgc 540
ttctatgtga cctccatgta cttcatggcc ggctacacct tcttcctccg gaccaagaag 600
gagccctcct tcgagggctt cttcgagagc cggttcgcgg cgaagcagaa gcggttgatg 660
cacgcccggg atttcgatct ccgccggtat gacgagctcc ggcgagcctg tggcctgccg 720
gtggttcgga ctccgacgag cccctgcaga ccgtcgtcgt cgtcgtcgtc gtcttcgacg 780
caggagagcc attgccattc ttactgccat tgccaatgat ctttgtgctg ttctgttctg 840
ttgtcagaat tttttcatgc ccagtttatg ggggttaagc tagcttctcc attgtaccgt 900
tctgatgtgc ggatgatgcg atgcaaagca tagtttgttg aagagatgac aaggcagatt 960
ttagcttgaa aacctggagg tgagaaaaaa aaatcctgat gtgtttgtgt gtgtga 1016
<210>25
<211>676
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记S10602 KpnI
<400>25
accaccttca tatgaagaaa ttaacggtgt tttcatgagg aatccaacag tcgctgaatt 60
ggtggaaact gtggaattct tcttggctga ggtaaccaat catcacttca ccacaatgca 120
caagtttgta gcttactact acagtacttc taataagttt tgtctgttga gattttattg 180
ctgatttcta tgcatggtca tctttttgac aggccatcca gtcttatcgt gctgagagtg 240
aaactgagct caacctggca gctggtgact atatagttgt ccggaaggta cggccctatc 300
ttcccattgg acatgtttct aaccataaac atatctttgc tggacttttg tgggcaaagt 360
tggctacact aaacttgtgt tcattaacct gctcaatcag gtgtcaaaca atggatgggc 420
agaaggtgaa tgcagaggga aagctggctg gttcccttac gactacatcg agaaaaggga 480
ccgtgtgctt gcaagtaaag tcgcccaggt cttctaggcg ttcaatgagc catacataca 540
taaccctggt gttgtacact gtattatgat cgttcgtgat cttcaaagac cctctgatca 600
gagaaatcac aaatattctt ttgttctatt attgtcatta tcactacccc ttttgtcaaa 660
accagtgcag cctttt 676
<210>26
<211>1059
<212>DNA
<213>稻(Oryza sativa L.)
<223>PCR标记Tsp509I
<400>26
gcgagatcat gaacttgatt ttctggttgc catattgggc ttgcttgtta accttgtaga 60
gaaggatagc cttaataggt aagtccctca catgcttcct tccatttgct caattcatat 120
cagtgttact gttctggcag ttccttgggg tcaggactca gaaacatcca attaatgttc 180
atgttctctt aacgactcag aaatacttta taacctctcc acagggtacg gctttcatct 240
gcccgtgttc ctgttgatct atctcagaat ccacagagtg aagagacaca gagagatgtc 300
atagcactcc tctgttctgt attcttagca agtcaaggtg ctagtgaagc ttctggaact 360
atatcaccgg taattcaaaa ttcttcaagt tccttttgta tgtagattat atctttgtaa 420
aactcggcat ttattacctg ctctttgttt caaaaagcag tattttattt tgctccttag 480
cataggtcag cagaacagtt gatcttattc agaaaacaat attttgcatg taacatactg 540
ttatctatga gatgaaaatt aatgcatgtg taataatgtc aatgataaat atttgctatc 600
tgaatccagt ctaccaactc tagttagacc gaattactga ggttctattt caaagaataa 660
tttagtgcac catttgttca actactatga agtaaaatgg tattcccttc tattgacatc 720
gggttagaag tgaaaggcca tcttaatgcg atgttctcaa tgccacaaac ccacaaattt 780
cattaacaca tacagattat tattaacata gctataaatt ggatttccag aagcttgagt 840
tgaatttatt ttgttacaat tgaaagcact gggaacatta gcattttttt ttagttcttg 900
gttattgcaa tttataatgt tatacagaac tgtgtacctc acaatgcatt cattatgaca 960
ttctatgaac catttgattg actgttgctt gtaaacaaca ggatgatgag gagtctttga 1020
tgcaaggagc acgggaagct gaaatgatga tcgtagagg 1059
<210>27
<211>76363
<212>DNA
<213>稻(Orza sativa)IR24
<400>27
gatcaactaa caacctcttt gcagcaaaaa agcatacaca caagtgtttg tcttggcctg 60
gggctctgca gatggactga tactctgacc tgcagtgggc ttgggagcta acaatggttt 120
cattcttttt ttttttatgt tttcccctgt tgtttttgct catgttttgt gtaatttttt 180
cttctcatct agcgatgtta tttttcttag catgatggga gtagccctcc tttttttttc 240
tctaattaag tgtaaagtag caacagcata gggatgaatg ttcagtgtag tgtgtggtgt 300
ttcagttatt cagagacgtc catacagttt gtaccttgtg accacacgtc ttaatctgat 360
gaagcttaga ataaatcaca tgttagcaat gcaatatcat ctgcgtcttc tctcactttg 420
gtggccatca aattctgtgt agaagtgtat ggttggtgtg ctgttgcaaa tgccgtattc 480
cgctctgttt tgtggaagtt aagaagtccc tagttgaaat accgattttt catgatctcg 540
gagattgatg caactctgat tgcagcattt ctttttatta gaatgtacac tccatgctat 600
catgatgttt attgtttagt actacaagat ttggttaacc attattttaa tatcataata 660
attttataaa atcttggagt aacaagttca taatacatga tagcataact ttttgaggct 720
agtctatgta tattgtctcc tttgttttta aactaagcac tcaataaatt attgatggct 780
gtaattttct gaaggtttca ccggtttcgg cccgtgcttt ataaatagct tcggcacaaa 840
agacaaaacg gtccctccaa cacataaatg gttgagttta cgttttcatt atctttggta 900
aaatcaagtc caccacgtag acactcataa caaaagtttg aatatcctca gaaattttga 960
cttgagtcta tcttaccttt gatatcggac atccaaccct ccctccctcc ctgaacttta 1020
tattattcat attacacctg aactttatat tattcatatt acaccctgaa gtggttttca 1080
tttaattgca tacatgctga aatagtttga caacgtgaga tgcactaaaa atctacacgt 1140
tcgtcttaag ttgcaattca ttttatccct tttctttttc tctcttacat aggaatatca 1200
atagtactaa ttcacattac aatatagtat aaattggtaa tcgattattg gcaatatact 1260
atattaaata ttcaaaacta gtcatttaag ctgccaaata agtaaaccac tatcgaaaac 1320
cacaatataa atggcattac aaaacttagg gggttgaata tccaatttta aagttcatga 1380
tgctagagga atttctatca aaagtttatg ggtacatatg gactttttcc tttttaaaag 1440
aagctattct tgtcgtaaac gttaaatatt ttttgtactt tattttttat gattgaaaaa 1500
aaaacttagt tttcaaaatg attggtctgt atacaagcat caattagact taataaattc 1560
atctaacagt ttcctggcag aaactgtaat ttgtttttgt tattagacta cgtttattat 1620
ttcaaatatg tgtacgtata tctgatgtga caaccaaacc caaaaatttt ccctaactcc 1680
atgaggcctt acagatatat ttgatgggtg taaagttttt taagttcttt gggtgcaaag 1740
tttttaaagt atacggacac acatttgaag tattaaatat agacaaataa caaaacatat 1800
tacatattct gcctgtaaac aacgagacaa atttattaag cctaattaat ctgtcattag 1860
caaacgttta ctgcagcatc acattgtcaa atcatagcgt aattaggctc aaaaatattc 1920
gtctcgtaat ttacatgcaa actgtgtaat tggttttttt ttcgtcaaca tttaatactc 1980
catgcatgtc caaatatttg atgcgatctt tttggccaaa ttttgttgga atctaaacaa 2040
ggatcaaatt tgctgaattt ttccagacgt cacggcttgt tcatccatcg ttcgcatcgc 2100
gattcgccac cgacgccttg gtttccaacg aattttatca tccgcttaaa tacatccaaa 2160
gctctccatc gccatcggcg gccaacggcg accgctccgc tctacccaat ccacccatcc 2220
actcgccgcc gccccctgat ccaaagcctc cgccgcgccg ccgtcgagag gaggaggagg 2280
aggaggagga ggaggcgtga gcccctatgg ggaccctcct ccggccgcgt ccgcttgccc 2340
acgccgccgg cgccggcgac gccacgccgt cgaccgcgca cggtagccac gcgcctctcg 2400
agaggccccc cccccccgcc gctcgctgat ctctcttctc atcctgtttg ggtttgggtt 2460
tgtgatttgg gtgttttttt tttttccgca gcggtggtgg tgagcggtgg ccgcggccgt 2520
ggcgtggagt gccagccgca tcgggtgcgc cgccgcccgg gtccgcaggt tgcggtggcg 2580
acggcgagct ggaggaggcg gagggagacc gtggtgagat cggatttcgc cgctggtggt 2640
gccgctacca tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct 2700
tctcgcaaaa tgtgttgcta tgttcctctc gctgggctgg cctcatagcc attaatgtag 2760
tttgctggaa cattacattc ggaacgttgt tggcaattgc ttgacaaaat gtggaattgt 2820
ggaggggaga aaaatcgttt gaacctgcag tgacaaaatt gccatctata attttaaaac 2880
tgaaggtgtg gaaatcaaac ataatcattg ccagcacatc attcttgtta accaccttga 2940
catattgttg gcttataaca gttagctcca caccaacttg gaaggtgtca atggaatgta 3000
agtataaatt gaggataact ggcagttgtt aagactttct acagaacttg tagcagctaa 3060
aactagctat tgtgcattta tgtttcatgg aatttgagcg gcaatggata tttcttacta 3120
agacgtataa tgcaaaaaaa aaaaaaaaac tatgtctatg cagtttacat gtaatgtgcg 3180
gatgcaaata aaatcatgtt catggacaaa ctaatgggat tcataccaaa ttccagaatt 3240
gcatttctta tgtggttact tttgtttgtt gatttggtta ccagacatcg atgtggtttc 3300
aagggtcaga ggggtttgct tctacgcggt gactgcagtt gcagcaatct ttttgtttgt 3360
cgccatggtt gtggttcatc cacttgtgct cctatttgac cgataccgga ggagagctca 3420
gcactacatt gcaaagattt gggcaactct gacaatttcc atgttctaca agcttgacgt 3480
cgagggaatg gagaacctgc caccgaatag tagccctgct gtctatgttg cgaaccatca 3540
gagtttcttg gatatctata cccttctaac tctaggaagg tgtttcaagt ttataagcaa 3600
gacaagtata tttatgttcc caattattgg atgggcaatg tatctcttag gagtaattcc 3660
tttgcggcgt atggacagca ggagccagct ggtatggctg tagtctcatc cctgctttct 3720
taagtagaca tatatacatt tacagtattt ggtaaataaa caagatttta tgaatcatat 3780
atgattttgg ggaaaacaca aaactctctt tgttggctgc cttgaacata gttctgttca 3840
cacagttata gcaccttctt taaaatgaag aactttgttg catacacata aggccaaacc 3900
acataatgaa ttttgtttat ttctatcttt gaatgttagc atcgtttttg tttaatgcat 3960
gatcgccttc ctatatattt gtagtatgtc aacattgtat tccatgctga gcataacaaa 4020
tggtttgtta aaattcagga ctgtcttaaa cggtgtgtgg atttggtgaa aaaaggagca 4080
tctgtatttt tctttccaga ggggactaga agcaaagatg gaaagctagg tgcatttaag 4140
gttcagtaac caaacttagg ttacattaca tctaatgaga tttttatatt cagtatataa 4200
tgttaacctt ctcatggtgt actgacgtgg ttataaatgt ccccagagag gtgcattcag 4260
tgtggctaca aagaccggtg ctcctgtgat acctattact cttctcggga cagggaaact 4320
gatgccttct ggaatggaag gcatccttaa ttcaggttca gtaaagctca ttattcacca 4380
tccaattgaa gggaatgatg ctgagaaatt atgttctgaa gcaaggaagg tgatagctga 4440
cactcttatt ctaaacggtt atggagtgca ctaaagaaag atggtgtttt tttttattat 4500
atggaaccta ttcaaaggca cagacaggct ttcaaggcta agcttgttac aggtactgat 4560
actagttact aattactttc gtaatcagta taaataagct tgtgtagtgt aatggcattg 4620
tacatttctg cacttggtaa atttacagaa gaggcaagta atattttaga ggattgagtt 4680
tattcaccca gtcatatagt tgaagaggca agtaacctgt aagagaggac tgaacattaa 4740
cacctcttgt tcgattaaaa atgaccaaag agcatcaaac atgtattcga ggctgttact 4800
ttagatatgg cccattaatt tgtttagttg tctatgtaca tcctagttgg tgtaaatgcc 4860
agttaccatt tctatgatct aaaacaatca actcttttag tatattttca aaaacgaaat 4920
tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 4980
accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 5040
tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 5100
ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 5160
tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 5220
agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 5280
ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 5340
tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 5400
tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 5460
attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 5520
acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 5580
aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 5640
ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 5700
gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 5760
cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 5820
ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 5880
ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 5940
gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 6000
attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 6060
ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 6120
cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 6180
cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttcattt ccttgatgaa 6240
ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 6300
tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 6360
ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 6420
ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 6480
tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 6540
gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 6600
gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 6660
aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 6720
gagaagcgta ataccctact cctgtgtttt gggggatctg tgtatgaagg agctacaaag 6780
tatgagccag cctctccctt gttctgggtt ccgaatctgg aaaagtccag tccagtcccc 6840
ccctctaagt gggcaaggtc ctccttttat atcttaaggg gataccacat gcaccatctc 6900
cctcctttct gtggagactt accctacctt ttcataaatg gacggagatt tgtatagttg 6960
ccgtccgaat gaccttctga taggacggcc catacctacc tccacttccg ccgaaagcag 7020
gtgcgacgtg ggattatggc tgtctgctga cgacatgacc agtgtcagac tggtcacaaa 7080
ttgctcattc ctgtccacca cgcgtcagtt tagcaatcta catgttggcc cttcttcaca 7140
caacatcttg cctgtaatgg ttaggatgaa gcctggcata tatctaacca ggactaacgt 7200
gccatctcta ggaggtaaca cgctagctcc agctggggac gagcgcctag aagccctcgt 7260
cctgacggga tggggcgagg cgtgcgtcag atcgcctgtc gccacctaac ctgcgatctg 7320
accggtctgt gactggtcac agaccggata aacgagtgca ctgcacttcg ttacatgcag 7380
cgtgacacgc tcagccaaac cgcaataaat gtggttaggt gagccccgct gtgctcacct 7440
aacccataca cgcggagcaa aaacccacga ggggtcgggg cgcctcggcc ctcggggccg 7500
aggcgggtgc ggtccgaccc cctcgggggg actaagagga gggcgaacac atcaccctcg 7560
ggcccgacgt cccccgaggg tgccaggcca cgtgggcgat tgtgtctgcc tcaaacctct 7620
agtcatgata ctcctgatcc catgtcaccg acagtagccc ccggcgttat gccagggcga 7680
tcgccctctt taagggaagc ggtcgggcgt gacgccactc ctaaggcctg gtgacaggtg 7740
ggaccggtct ccacaattgg gcagaaaccc aacggtcaca aatcacgcac atcggcaatg 7800
gtaactctac tatcaataat gagcggtctc ttcaagactg ccacattact cgagtagcac 7860
acgaatctgg acatggcgat tcgtttcgtc tggagatatg gtaacgtcgc tttggtcggc 7920
gagcgtaatt aacgcgcgca cgatatgatc tatctcgact gccacaaccg catatccacc 7980
tcatgcgccg caagcgggcg aatgggatta gtggaagcgt gggcgcgaga aacgaggggg 8040
cgaaatagtg ggcgcgagaa gcgaggagcc gggcacagcg ttggcaagag tataaaggca 8100
ctgaggaaag gatctgtttc cttcctttcg ccatcatttc ccttgtcttc gccgcttgcg 8160
ccctaactcc ttctttcctg tgctctactt tcgccacacg cgctcgctct caatcttctc 8220
ttcctccggc gccatggcac ggggctccgc tctgctcgat ggtagcgtgc tgccgccttc 8280
ccgcatcgtg agcgagaggc aggctgggct gccgcgccgc ttcatgccgg aatctgccac 8340
cggccgggag atagtcacgc tgggcgaggg acgcccggcg ccagactacc cggggcggtc 8400
cgtcttcttt ctcccctttg caatggcagg gctggttccg ccattttctt ctttcttcat 8460
ggatgttctg aagttctacg atctccagat ggcgcacctc acccccaacg cggtgatgac 8520
attggccatc ttcgcgcatc tgtgcgagat gttcattgggg gtgcgcccat ctcttcggct 8580
gttccggtgg ttcttcaccg tgcagtcggt gtcgccgcca tcggtagttg gtggctgcta 8640
cttccagcca cgggggccgg tgctgaatcg ctacatcccc tgcgccctcc gcaagaagtg 8700
ggacgactgg aagagcgact ggttctacac ccccctcgcc gacgaagcgc gcctccgact 8760
tccgagccag cccccggcgc aggcctccag ctggcgggcg ccggtagatc tgggggatgg 8820
ctatgacgcc gtcctcgacc gcctggcggg cctacgatcc caggggctca cagggaccat 8880
ggtgtacggc gactacctcc gtcgtcggat tgcgccgctc cagcggcgcg ctcggggcgc 8940
ctgggagtac accgggtccg aagactacat gaggacccac cagggagtca gatgggactg 9000
ggctcctgag gatttcaaga tagtggtcca acgggtgctg aatctcaact ccatggaggc 9060
gtccctcatt ccccaaggaa tcctccctct ctgcagcgat ccagaccgcg cctccatcct 9120
gaccattatg acggcggtcg gggcctcaga ggagtgagct ccaaagggcc acgacggcgc 9180
aggcgggagc cgtagggggg atcaatctac ccggggaggg ggtcgtgctt ctgggtctcg 9240
cgacggaggc ccgaggagca gccgccctgc cgacgcccgg gggaagagga agcagggagg 9300
aacacctccc ccatctcctc cccgaggggg cggggcggtg cgtgccagca gcaggcgccc 9360
ggagggggcc gcgccgacat cgcagcccga gggggagcgc aagaagaagc ggctccgcaa 9420
gatgggggag acagaaccat ctcagggaaa ccttatttcc cctctaaagt ggtcgtttaa 9480
ccgaccccct cgcaggttcg tctctcaccc atcgtggctg tattcattct ctcaacgcga 9540
gttttcactc acccatcttg ttcgtcttct ggtcttttct tctgtttcag cgagatcccg 9600
tcgcgtccct cccgccattc caagtccggc cagtctgagg ccgaggatcc ggcggccgca 9660
gaggcccgga ggcgggaatc tgaccggcga gaggccgcgg atcgcctacg ggaagccgag 9720
gaggccgccc aggaggccgc ccgggctcgc caggtcgagg aaaccgctcg ggaggaggcc 9780
gcccgggccc gccaggccga ggaagccgct cgggaggagg ccgcccgagc ccaccaggcc 9840
gaggaagccg ctcgggagaa agccggattt cgccaggacg aggcaatggc gacttccgag 9900
gcagctcgcg atgaggtcgc gggcgcgtcg cttgagccca cttcctcggg cgacgctcag 9960
gcgacaactt ccggggcagc tggcgacgag gctgcgggcg cgtcgcttgg gcccactccc 10020
tcaggcgacg cccaggacca accaggtccg agggacatcc ctgagtccgg cacttccatc 10080
ggcggcccga gccgcgtggc atcctctcca aggcggctct tccccacgcc ttctatcgcc 10140
ccactgagcg cagagcccct tctgcaggcc ttggccgccg caaacaccgc ggtgttggac 10200
gggcttagtg cccaggtgga ggccctgcaa gcagagtggg cggagctcga cgccgcgtgg 10260
gcgcatgtcg aggaggggcg gcgctcagtg gaggccatgg tggaggtggg ccgcaaggca 10320
caccgccggc atgtctcgga gcttgaagcc cgtaagaagg tgttggcgga aatcgccaag 10380
gaagtggagg aggagcgggg ggctgccctc attgccacca gcgtgatgaa cgaggcgcag 10440
gacaccctcc gccttcaata cgggagctgg gaggcggagc tagggaaaaa gctcgacacc 10500
gcccaggggg tgcttgacgc tgccgctgcc cgagaacagc gggcggggga gaccgaagcg 10560
gcgtcccgac ggcgcgaaga gacccttgag gcgcgcgcca tggcgctgga agagcgcgcc 10620
tgcgtcgtgg agagggatct ggcggaccgc gaggccgccg tcactatccg ggaggcaaca 10680
ctggcggcgc acgagtccgc ctgtgccgaa gaggagtccg cactccgcct ccacgaggac 10740
gcgctcaccg agcgggagcg agctctcgag gaggccgagg ccgcggcgca acggctggcg 10800
gacagcctgt ccctccgcga ggcagcgcag gaggagcagg cgcgccgcac tctggaatgt 10860
gtccgcgccg agaggaccgc actgaaccag caggccgctg acctcgaggc gcgggagaag 10920
gagctggacg cgagggcgcg cagcgacggg gcggctgcgg gcgaaaacga cttagccgcc 10980
cgcctcgctg ctgccgaaca taccatcgcc gatctgcagg gcgcgctaaa ctcgtccgcc 11040
ggggaggtcg aggccctccg cttggcaggc gaggtagggc ccggcatgct ttgggacgcc 11100
gtctcccgcc tagatcgcgc cggtcggcag gtgggcctct ggagagggcg gaccgtaaag 11160
tacgccgcca accatggagg cctcgcccag cgcctctcga agatggccag ggctctccaa 11220
cggctccccg aggagctcga gaagacaatt aagtcatcct cgagggacct cgcccaagga 11280
gcggtggagc tcgtactggc gagttaccag gccagggacc ccaatttctc tccatggatg 11340
gcgctggatg agttccctcc tgggaccgag gacagcgcgc gcgcaggtcc gggatgccgc 11400
cgaccatatc gtccacagct tcgagggctc agcccctcgg ctcgcgttcg cccccaactc 11460
cgacgaggag gacaatgccg gtggtgcaga cgacagtgac gatgaggccg gcgacccggg 11520
cgtatcggat tgatccccca agcccccgcc attctttagt tttttcttct tttccttctt 11580
ctaaggcctt cgggcctctt ttttgtatag atcaacttaa tctgtaatca aaaatgaaga 11640
aatttttgtg tcaatttcat cttgctgtgt gtatgagatg aggatgatct gtgacgtggt 11700
ccttttgcgt cttagcttga ttaagggctc gtgcccaggt cccagtcctc aaaaggcgtg 11760
ggtcggggct agtgcctggg gagatccaca tgtcgagact ggccaggccg ggaacgtggt 11820
gaccgagggt tatgggtgac ccgattgtgg gtttttgccg attccccccc ggagttcacc 11880
acgccccggg gcacggctcg gttctgggcc ccgtttggcg attttagccg acccgagccc 11940
ccgagggcag gattgagcac gagtgaccta tttcaagtca agattcttca aaaggaaaaa 12000
aaaacacaga tacagccttt aggaaattga aactgctttt attgaaatac tgaaataaga 12060
gaaataagaa tgtgcatgtg tggcagcccc cggccaacgc tgcacgcccg agggggtgcg 12120
gggttggccc gagcccgaaa cctgacaccc gacccccccc tcaggggtag aagcgacgaa 12180
ggtgttcgat gttccacggg ttaggcagct caatgccgtc gcccgtggcc agccgtatgg 12240
agcccggccg ggggacgccg accactcgat acggaccctc ccacattggt gagagcttgc 12300
tcaatccagc acgcgtttgg acgcggcgta ggacgaggtc gtcgacgcag agtgatcggg 12360
cccggacgtg acgctgatgg tagcgccgca ggctctgctg gtagcgcgcg gctctgaggg 12420
ccgcgcgccg ccttcgctct tccaagtagt cgaggtcatc tctgcgaagt tgatcttgat 12480
cagcctcgca gtacatggtg gcccgaggag acctcagggt gagctcggat gggagaaccg 12540
cttccgcgcc gtagacgagg aagaaaggcg tttccccggt tgctcggctt ggtgtagttc 12600
ggtttgccca gagcaccgct agcaactcct cgatccatga atcgtcgtgc ttcttgagta 12660
tgttgaaggt cttggtttta aggcctttga ggatttctga attggcgcgc tccacttggc 12720
cattgcttct ggggtgggca ggtgaggcga agcagagctt gatgcccatg tcttcgcagt 12780
agtcgccgaa gagttcacta gtgaattggg tgccattatc cgtaataata cggttaggca 12840
ctccaaaccg ggccgtgatg cccttaatga atttaagtgc ggagtgctta tcgatcttga 12900
cgaccggata agcctcgggc cacttagtga acttgtcgat cgcgacatac agatactcaa 12960
acccgcccgg ggcccgccta aacggtccca ggatatcgag cccctagaca gcaaatggcc 13020
acgaaagtgg tatggtctgc agggcctggg ccggctgatg gatttgcttg gcgtggaatt 13080
gacacgctct acatcgccgg accaggtcga ccgcatcatt gagagctgtc ggccaataga 13140
aaccctggcg aaaagcttta ccaaccaagg tgcgcgaggc ggagtgggct ccgcattcgc 13200
cttcatggat atcggcaaga agcacaacgc cttgttcccg aggaatgcac ttcaggagga 13260
ttccattagc cgcgcgccga tagagggtcc cttctaccag cacgtagcgt ttggagatgc 13320
gatggacgcg ttcactccct tcgcggtcct cgggtaaagt cttatctgtg aggtatgctt 13380
ggatctcggc aatccaagca atcaatctaa gggagctggg agcgctcccc tcgggtcccg 13440
aggcctggac ttcgacgggc ctcgggggcc ggtcaggcgc gtccgtctcc cctaaggggt 13500
cgggtcgcgc cgacggctgg gcaagccttt cttcaaaggc gcccggtggg gtctgggctc 13560
gcgtggacgc gagccgtgag agttcgtcgg caatcatgtt atcccgtctg ggcacatgcc 13620
gaagctcaat cccgtcaaaa tggcgctcca tacgccgtac ttggcgcacg taggcgtcca 13680
tctgcgggtc agagcaccgg tactccttac agacttggtt aacgaccagc tgggagtcgc 13740
ctaacaccag gaggcggcgg atccccagtc cagctgccac tctgagtccg gcaaggagtc 13800
cctcgtactc tgccatattg ttagtcgctc gaaagtcgag gcggaccaag tatctgagga 13860
cgtctccgct cggagaggtc aacgtgaccc ccgcaccggc gccctgaaga gacagggagc 13920
cgtcgaactg cattacccag tgggcggtgt gaggcagctg cgaggggtcc gtgctggcct 13980
cggggattga gacgggctcg ggagccgggg tccactctgc cacaaaatcg gcgagagcct 14040
ggctcttgat agcgtgacgt ggttcaaagt gcaaatcgaa ctcagaaagt tcgattgccc 14100
atttcaccac ccgtcctgta ccctctcgat tatgcaagat ttgaccgagg gggtaagacg 14160
taaccacagt gacccgatgc gcctggaaat aatggcgcag tttcctcgag gccatcagaa 14220
tagcgtaaag catcttctgg gcctgagggt atcgggtttt ggcgtcccgg agggcctcac 14280
taacaaagta gacgggccgc tgcacctttc ggtggggccg atcctcttcg ctaggggccg 14340
catccctggg gcactcttcg tccaagcagc ctcgcggggc gcacttgtct tctgtgctga 14400
tgacctcggg gtcggaggat aacaggggcg gccttcccac agtggctttg gggccgtcct 14460
gggggtcagg ggctcctggc gtcgtcggac aagcgggcaa agggccaact ccggtcgtca 14520
ggggccttag gcctccgttc ggctcggggg cctcttctcc ctgctctttc ccgggtcgag 14580
tcagcacagg gttagcctcg gggtcaaagg gcgataggtg cggccttccc acagtggcct 14640
cagggccttc ctgggggtcg ggggctccta gcaccgtctg acaagcgggc agagggccaa 14700
ctccggtcgt cgggggcctc aggccaccgt tcggctcggg ggcctctcct ccctgctctc 14760
tcccgggcca agtcggcaca gggtggggaa gcgcgaaatg agaattatcc tcatcgcgct 14820
ccacaaccaa tgccgcacta actacttgcg gggtcgccgc taagtagagt agcaagggct 14880
cgtctggctc cggggcgacc ataactgggg gagagcttag atacgccttc aactgggtga 14940
gggcattttc agcttccttc gtccaggtaa acggtccgga gcgtttgaga agcttaaata 15000
agggtaacgc cttctctccc agcctcgata tgaaccgact tagggcggcc atgcaaccgg 15060
tgacgtattg cacatcccta agtttgctgg ggggcgcatc cgctctatag cccgtatctt 15120
ctcggggttg gcctcaatgc cccgggcaga gaccaagaac ccgagaagct tgcccgcagg 15180
tacaccgaac acacacttat cggggtttaa ttttatgcgg gcggagcgga gactctcaaa 15240
agtttccgct agatctatga gtaacgtttc ctggttgcgc gtctttacaa ccaagtcatc 15300
gacataagcc tcaatattac gtcctaattg gctaccgaaa gaaattcgag tagtacgttg 15360
aaaagtagga cctgcattct ttaacccgaa gggcattgtc gtataacaat aggttcctat 15420
gggggtaatg aacgcagttt tttcctcatc ctccctagcc atgcgaatct gatggtaacc 15480
agagtatgca tctagaaaac acaaaaggtc gcaccccgca gtggagtcga caatctgatc 15540
tatgcgaggc agggggtaag gatccttagg acatgccttg ttaaggtcgg tgtagtcgat 15600
gcacatccga agcttgccgt tcgccttggg aacgaccacc gggttcgcca gccactcggc 15660
ggggttgacg ctgccatcat atttttcggc gatggtgggc cggaaccttg ggggccaacg 15720
gacattccga agactcgcca caaaggctct acagccgaca ccaccaaccg ggggcacgga 15780
gggctgattc ccgcgtccgt gttgaggtga cactctggac gaggaagcgc cctccgttgc 15840
gtgggcagca cttcggtcat tacgccggcg ctcgatgctg gtgcgggcgt ccggcccccc 15900
acgcagatct ttctgggtcg aaggagtcga cgaaggagtg gcggccgaat ggcgaacagc 15960
ggctgccgct cgtcgtgccc tccgtcttga cgacgcggag ccggtggtag cagcaccaga 16020
ggccttggtg gcggaggacc gcccaccagc atctaggcgc tgccgtgccg tcatgactaa 16080
tttggccacg tcgtccagcc atcgttgggc tggagactcc gggtcaggga cgacaggcgg 16140
gtgacgtaag agcgcgcccg cagcttggag cgcgccctgg ggcgtgctgc cgtcgccgta 16200
gacgaggagg cgacgctccc catctcgccg ttcttctcca tcgcccgcga tcggtgaagt 16260
cgcggatctt tcgaccctct cgagcgcctc cccccgctta ggactttggc atggagggag 16320
cggtggagta cgagctcgac ggcgtgggtt cggctccccg tcgtcgccac tcacactcgg 16380
agagaggtcg tgcgcctttg cttgctcggc catcaggctg aacaggaaaa gcttggcgca 16440
cacggaagag tacgagagct cagaaaaaca cacactgagt cccctacctg gcgcgccaga 16500
tgacggagcg tggggctcct caccgggaga ccgcgcaggc ccccctttgc cggttcggcc 16560
ggggactcaa ggtgaaattc taagctctct gtatgtggaa ggtttgcgac cgtcgaaaga 16620
gcataagaca cgggcgatgt atacaggttc gggccgctga gaagcgtaat accctactcc 16680
tgtgttttgg gggatctgtg tatgaaggag ctacaaagta tgagccagcc tctcccttgt 16740
tctgggttcc gaatctggaa aagtccagtc cagtccagtc cccccctcta agtgggcaag 16800
gtcctccttt tatatcttaa ggggatacca catgcaccat ctccctcctt tctgtggaga 16860
cttaccctat cttttcataa atggacggag atttgtatag ttgccgtccg aatgaccttc 16920
tgataggacg gcccatacct acctccactt ccgccgaaag caggtgcgac gtgggattat 16980
ggctgtctgc tgacgacatg accagtgtca gactggtcac aaattgctca ttcctgtcca 17040
ccacgcgtca gtttagcaat ctacatgttg gcccttcttc acacaacatc ttgcctgtaa 17100
tggttaggat gaagcctggc atatatctaa ccaggactaa cgtgccatct ctaggaggta 17160
acacgctagc tccagctggg gacgagcgcc tagaaaccct cgtcctgacg ggatggggcg 17220
aggcgtgcgt cagatcgcct gtcgccacct aacccgcgat ctgaccggtc tgtgactggt 17280
cacagaccgg ataaacgagt gcactgcact tcgttacatg cggcgtgaca cgctcagcca 17340
aaccacaata aatgtggtta ggtgagcccc gctgtgctca cctaacccat acacgcggag 17400
caaaaaccca cgaggggtcg gggcgcctcg gccctcgggg ccgaggcggg tgcggtccga 17460
ccccctcggg gggactaaga ggagggcgaa cacatcaccc tcgggcccga cgtcccccga 17520
gggtgccagg ccacgtgggc gattgtgtct gcctcaaacc tctagtcatg atactcctga 17580
tcccatgtca ccgacaaggc catccgaatg tattaaggag taaaagttac aagaaaaaac 17640
accataatgc accaatgtgc atgaccacac accatacact acccccaagc acaaaccact 17700
gagggtgaag cctagcacca aacgaccgcc actaagtgtg accaaacgcc gctaggccta 17760
cggcagcaac acatagatga gacttcgaaa acgatgccac caaggtggtc acgacatcta 17820
ggatgctgcc atcgtccatc taaaaagatg tggttttcac ccagagaaac tcatcaagaa 17880
ggggagaggg taacccttga cagcgcccca aggaggttac gacgcccgaa ggcgtagccg 17940
ctgccggtcc ggtgaaccac cggactaggc ttccgcctag gaccctatag ccttgatcgc 18000
agatcaccgt ccaccactca gaaccaccac acagacaaaa ggtagcacgt agcttccacc 18060
acaccgcacc gacgcccctt cgtcggccga ctccatcgaa ccaccatccc tgagagctgg 18120
cccaggaccc ctccgttcca ccacccgccg gccgccttgc cagttttggc caaaggagaa 18180
cccgggactg ggtgacattg cttcggcagc ctgagcttcc cccgctggcg agctgctgtc 18240
tcaatccaac ctagaaactc cccgcaaaag aaggggatga gctctaggaa gggcgagggt 18300
gccgaccggc aacgaggaag acaacccatc gactccagct ccctttgcac taccatctgg 18360
ccctgcgcca atgccggata cgctgtcgct ccggctccgg cgccacccac ctgcaccccc 18420
tttgcctggt ctccgcgccc ctcctggctg cgtcgcgccg cccagctggc cgctaagggc 18480
accgcgacgg ccgcccggct accgaggcct ggccgcgcca tgggacagct cgcgctggca 18540
ccagcgagcc acggccgtcg cgctgttgcc ggcgccagcg agcacaaccg ccagctccaa 18600
gggccgagca tgccactgag ccgccgccgc tgccgcccgg gccggctgca cgtcaccggc 18660
gcacacgacc gcacgccgcc acgctccgcc tccgcgcccg aggcagcccc atgccattgc 18720
cgcgcacctc gcccgcccgc tgccgagccg ccaccgcgca ccttgctgag ccgccaccgc 18780
cgtccctagc cgcctcgtgc cgccgccacg ccagatccag gcgcgggatg gccggatccg 18840
gccttggggg cgccggatcc accgcctccc cacaccgcca cggcgtcacc acctccgacc 18900
gcagtgaggg cttcgtcgtt tgccccatcc tcatcgcgtc gaggaggaag acgccaagaa 18960
aaaagggcct cgccgctgcc ttccttgctc gctgccggct tcgccgccgg cgagctccgg 19020
cggcggcgag gtgggggaga agaagtgggg agtgggcagc tagggttttt tcgcccccca 19080
agccgcccgt gcgagagcga cggtgggggg gggggggact ttccaacctc ttccagtgtt 19140
ctagttctcc acgttatgta actcaatttg tttaaccata gaaagtaaga aacctaccag 19200
cgtgttaagc tctctttcat tccctttctt cttcctggtt ttgcttccat cacatgtcaa 19260
gtgaagggtt cttaactacc attactccta cacatctaat ttttttctca gatctttcgc 19320
aggtatatat tgatgctaca ttttatgatc ttaagataat ctccttcaca ttaccctctg 19380
ctgaaacttt agcttgaacc gtcatcttca ccacaatttg agcccaattt gcacagagca 19440
caacgagcaa tagcttgccc ttacgttcat tatttagcat gaactactac taactaccca 19500
agaatcaata caccggttta ataacgccat tttatcacgt taatatatgt ttcattcaac 19560
acaccggttt tggcacagtt gcaaacttgc aataaattct ttcctacttc tccatcccat 19620
aatataacaa attggtatgt ctcgtctggt actaagttac tatattatga gatggaggga 19680
gcacttcttt tcttccaaaa tataagaata tagtattgga ttagatatta tctagattca 19740
cgaattcgat taggttgtct agatttatag ttgtatgtaa tgtataattc ggtaataggt 19800
tattacctct caggatggag ggagtagttt tgactttttt tttcttataa atcgctttga 19860
tttttatatt agtcaaattt tatcgagttt aactaagttt atagaaaaaa attagcaaca 19920
tttaagcacc acactagttt cattaaattt agcatggaat atattttgat aatatatttg 19980
ttctgtgtta aaaatgctgc tatatttttc tataaacgta gtcaaattta aataagttag 20040
actaaaaaaa atcaaaacga cttataatat gaaatggagg aagtagtaga ctataacaaa 20100
tttaaaccgt gctttgattt tagagcatca ctaatatgtt agcaataatc tatccctaaa 20160
atttattttt tttcctaaac tgaaaatagg aagtggaaat actcctccat ctaagagaga 20220
gcctaaattc aataaaaaac taaaaaacta aaggtggatc cctctattaa actaccgcaa 20280
aaaatttatg ttttttttct cttccacgcg cgcagaacag atatctcgat caagttagca 20340
tgtaaaattt ttaaagagat accttatacg actccttccg tatttccaaa agcaaacgga 20400
tttaaaatct gactcaaata aagatctata tatccaattt acatgacaca tgtttcgccg 20460
aatttttata ttaataataa ttaatatttt taaaattaaa ttattagcaa tttgtttgga 20520
ggatttatca aaacaggatg gacgttgttt ataacagcgt ctagacctag acgcgcttgc 20580
aaactgcggc caccctttta tcacacaaat ttttgacaat ttgacacttt ccaaaaatta 20640
attttataaa ttaaccgtga ccaaaactta tttaaaaatg atctttttgt tgagcgcaaa 20700
atcgtatact tcagcgccaa atagcacggc gccgacctcc cccttcccct cccctctatc 20760
ctccactgct gccgcccacc tctccgtatc agctgcgtcg cgttggtttc cgccggcgct 20820
gctgctgctg caccagtccg ctagggcggg cgggcatggc gcgccgcgcc gcttcccgcg 20880
tccgcgccgg cgctgttggc gcccttcgct cggagggctc gacccaaggg cgagggggcc 20940
gcacgggggg cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccggcgtg 21000
gcaggggcgc ctcgatctac ggcttgaact gcgccctcgc cgacgtcgcg cgtcacagcc 21060
ccgcggccgc cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc 21120
ccaacttgtg cacctacggc attctcatcg gttcctgctg ctgcgcgggc cgcttggacc 21180
tcggtttcgc ggccttgggc aatgtcatta agaagggatt tagagtggat gccatcgcct 21240
tcactcctct gctcaagggc ctctgtgctg acaagaggac gagcgacgca atggacatag 21300
tgctccgcag aatgacccag cttggctgca taccaaatgt cttctcctac aatattcttc 21360
tcaaggggct gtgtgatgag aacagaagcc aagaagctct cgagctgctc caaatgatgc 21420
ctgatgatgg aggtgactgc ccacctgatg tggtgtcgta taccactgtc atcaatggct 21480
tcttcaagga gggggatctg gacaaagctt acggtacata ccatgaaatg ctggaccggg 21540
ggattttacc aaatgttgtt acctacaact ctattattgc tgcgttatgc aaggctcaag 21600
ctatggacaa agccatggag gtacttacca gcatggttaa gaatggtgtc atgcctaatt 21660
gcaggacgta taatagtatc gtgcatgggt attgctcttc agggcagccg aaagaggcta 21720
ttggatttct caaaaagatg cacagtgatg gtgtcgaacc agatgttgtt acttataact 21780
cgctcatgga ttatctttgc aagaacggaa gatgcacgga agctagaaag atgttcgatt 21840
ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt 21900
atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg 21960
gtatccaccc taatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga 22020
aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccggata 22080
cagtgaccta tggaacagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta 22140
tgcgttattt tgagcagatg atcgatgaaa gactaagccc tggcaacatt gtttataact 22200
ccctaattca tagtctctgt atctttgaca aatgggacaa ggctaaagag ttaattcttg 22260
aaatgttgga tcgaggcatc tgtctggaca ctattttctt taattcaata attgacagtc 22320
attgcaaaga agggagggtt atagaatctg aaaaactctt tgacctgatg gtacgtattg 22380
gtgtgaagcc caatatcatt acgtacagta ctctcatcga tggatattgc ttggcaggta 22440
agatggatga agcaacgaag ttacttgcca gcatggtctc agttggaatg aaacctgatt 22500
gtgttacata taatactttg attaatggct actgtaaaat tagcaggatg gaagatgcgt 22560
tagttctttt tagggagatg gagagcagtg gtgttagtcc tgatattatt acgtataata 22620
taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtcg 22680
ggattaccga aagtggaacg cagcttgaac ttagcacata caacataatc cttcatgggc 22740
tttgcaaaaa caatctcact gacgaggcac ttcgaatgtt tcagaaccta tgtttgacgg 22800
atttacagct ggagactagg acttttaaca ttatgattgg tgcattgctt aaagttggca 22860
gaaatgatga agccaaggat ttgtttgcag ctctctcggc taacggttta gtgccagatg 22920
ttaggaccta cagtttaatg gcagaaaatc ttatagagca ggggttgcta gaagaattgg 22980
atgatctatt tctttcaatg gaggagaatg gctgtactgc caactcccgc atgctaaatt 23040
ccattgttag gaaactgtta cagaggggtg atataaccag ggctggcact tacctgttca 23100
tgattgatga gaagcacttc tccctcgaag catccactgc ttccttgttt ttagatcttt 23160
tgtctggggg aaaatatcaa gaatatcata ggtttctccc tgaaaaatat aagtccttta 23220
tagaatcttt gagctgctga agccttttgc agctttgaaa ttctgtgttg gagttctttt 23280
ctcctacagt cgtattagag gagggatctt ctctttatgt gtaaatagcg aggtatgtat 23340
gtcacctctc cgaattattt ttactctggt tcctagacgg taaacaagca attatgttct 23400
gcctttgatg ccagaaaaaa cacaaaagtt tgtcgttatc tctactaacg gatcataaag 23460
gaatttgtaa ctggagtttc aaacttaatt tgtctaggca gtagttttgg cattagatcc 23520
aacattgtgt aggattcatt tgtgtgtatc aatctatagg gtttcattaa atttcgttta 23580
tgtgtactgt ttaggtgttg aatagtttga cttgtttttt aactgaacaa aagatactga 23640
aatcgttcca ttcaacaaac acatgttccg ttaatgaaat tattgtacgt taccttttgt 23700
tttcttactc acaagtgtcc tcttttctta tatcctatag attggtacaa caaattattg 23760
attcaatttt ggttttgaac attgatgatc ctccctgcac tattggtgca gctgctcttc 23820
tattcatttt gtgaagtgat gtgagtacct ctcaatccca tccttatgct tctgtgcatg 23880
cttcattcca attttttacg catatcgatt gttttctttt atataacagt ccataaagat 23940
aatcacatca tgacaaagtt atttatttct acagtatagt tatataagta ttcaccagtt 24000
ttccatgaat attttggcat gtgattacaa agaagattat ttgagaaaat ccatgctttt 24060
atttcatcat tttgtttgaa gttgaacttt aatttatggt gtaaatttca gttattattg 24120
ctagcagctc gtactcttta atggtataac ttcacttgtg cttattctcc aatatctccc 24180
ttcttgttgt tcaggttcaa gaaaatcatt tgttggattc agaatctggt gtccattttc 24240
ttcttaaatt attaaatcct ccagtgaatc ttgttgattc caaagcacca tcgataggtt 24300
ccaaacttct tggaatcagt aaagttcaaa tgcttaatgg atcaaataag gattctgact 24360
gcatttcaga ggaaatcctt tcaaaagttg aagagattct cttaagctgt caagtgatca 24420
agtcgctcga caaagatgac aagaaaacaa caaggccaga actgtgtcca aagtggcttg 24480
ctttgttgac aatggaaaat gcatgcttgt ctgctgtttc agtagagggt aagttttaat 24540
caaatttctt ggtcatgatt tccctttatg accattatat ttatttatat gagccaaata 24600
agcagttgtc aacttgtcat aagttacata gcacctattt gcaatattca tgggtggttt 24660
gcttagccct tttcttcacc tgcttttgat tgatgacttc catctgtgtt gcagaattga 24720
attggagtag tggactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc 24780
ccttatcaaa tatttgattg ttacagagac ttctgacaca gtgtccagag ttggaggaaa 24840
ttttaaagag acattaaggg agatgggagg tcttgatagt atttttgacg ttatggtgga 24900
ttttcattca acattggaga tgagatctcg ctaacatcgc atattttaca tttcctttgt 24960
tcaactctaa tagattgtgc aggcttgttc cttttcgcca ttttagcttt aatgcgcttg 25020
aagccacatg aaagtaatgc ttgtccagat acatagccaa aggttgttat attttggggc 25080
atggaaaatg cttgaggtag taactatttt catcaggaca tggaaaattg gctgcaacac 25140
aaattatgtt gttttatgtt gcaaaaatag ttttttaata cttttttatt ctgcatgtgg 25200
tgttagtatc ttacagttcc tctgatgatt atatccccca cgataataac acttgaaacg 25260
ataataacac ttgacatatc tacaccaagt gaacattatt catttggatg ttacttttcc 25320
agctatactt gctgttcttg catgtgtaag caagtttgga gtaaattgcg cattaattta 25380
aatgcttggt gttcctatct gtgtactttt tattccccaa ctaataatgc aatcatatta 25440
cgctgataaa ctgaataaat aaattaacaa tatacttctg gtggcaaacc ttgtgtatca 25500
gaatctcata aaggatacat ccacttcagc tttggaccga aatgaaggaa catctttgca 25560
aagtgctgct ctcctcttga aatgtttgaa aatattggaa aatgccatat ttctaagcga 25620
tgataacaag gtaatgctcc ttatatgttc tgtttcagtt tagtacccat ttccttcttc 25680
tgtactatct tctctcctga tttgttctgt gcaaaatgtg caaacagtgc gactttgtat 25740
gtctgcttaa caattttctt ttcttcctga aaaagcaata tgaactctta cattcatttt 25800
gcttcttgca gacccatttg cttaatatga gtagaaaatt gaacccgaaa cgctccttgc 25860
tttcttttgt tggtgtcatt atcaatacta ttgagttatt atcaggtatt tttcttaata 25920
atacaatgtg ttcgctaaca caataaaatg ttttaaacat ccagtatgtt aaagttgcag 25980
tctgacgcct attttgtttt gctgcagctc tttcaatact tcagaattct tctgttgttt 26040
ccagctctac atatccgaaa tcgtctaaag tctctcaaca gagttactct ggtaataaca 26100
aacaccaatt ttgtttgatc agttgatctc gttggctttt ctatgcactg tctcaatata 26160
gtttggtcgc cattcaagtc tcactacaga tgttgaactt ggcctgacac caaatattta 26220
taaaatgcta cctgatattt ttaatatttc atgtttcctg acccagatta tcttgttggt 26280
tcctcgtata agtttaatta gtgacattct tgaagctttg ttatgcagca gatgtcatgg 26340
ggggaacttc atttaatgat ggaaagagca agaactcgaa aaaaaaaaac ttttgtcgaa 26400
ccagacacgt cattgttgct tatcttcaaa atcagaagtt tctcatatta ctatatcttc 26460
tggtagtgat gctggtctgt cacagaaggc attcaattgt tctccattta tatcaagcaa 26520
tggggcatca agtggttcat taggcgagag gcacagcaat ggtagtggtt tgaagttgaa 26580
tataaaaaag gatcgtggca atgcaaatcc aattagaggc tcaactggat ggatttcaat 26640
aagagcgcac agttctgatg ggaactccag agaaatggca aaaagactcc gtctatctta 26700
aaatgtaatc accgacagtg gtggtggtga tgaccctttt gcatttgacc gccgcgtcgg 26760
cgtcgccacc acgtaatcgc ccacgtcgct gcccccgctg ccacgtcgtc gaccgcgcac 26820
ggtaatcaca cgcatctcga ggccgccgct agctgatatc ttctcatccg gttgatttgt 26880
gattttggcg tttttgcagt ggtgatggcg gggggcgacc gtggccgagg cgtggagtgc 26940
catccgcatc agggtgtatc ggccgcgctg ctccgccctg gtccgcaggc tttggcggcg 27000
agctggcggc ggagggagac tgtggtgaga tcggatttcg ccgctggtgg tgtcgctacc 27060
atgggggatt cgccgcaggc gctctcaggt ttgcagcctc ctccactctc ttcccttttt 27120
tatttttttt tctcgcaaaa tgtgttgtga tgttcgtctc gctgggctgg cctcatagcc 27180
attaatgtag tttgctggaa catttacatt tggaacgttg ttggcaattg ctttacaaaa 27240
tgtggaattg tggaggggag aaaaatcatt tgaacctgca gtgacaaaat tgccatctct 27300
aattttaaaa ctgaaggtgt ggaaatcaaa cataatcatt gccagcgcat cattcttgtt 27360
aaccaccatg atatattgtt ggttataaca gttagctcca caccaacctt gaaggtgtca 27420
atagaatgtt tagtataaat tgaggagaac aggcagttgt taagactttc taaagaactt 27480
gtagcagcta atactagcta ttgtgcattt gtgtttcatg gaatttgagc agcaatggat 27540
atttcttact aagatgtatg atgcaaaaca aaaaactatg tctatacagt ttacatgtaa 27600
tgtgcggatg caaataaaat catgtacatg gacaaactca tgggattcat accgaattcc 27660
agaattgcat ttcttatgtg gttacttttg ttgttgattt ggttaccaga catcgatgtg 27720
atttcaaggg tcagaggggt ttgcttctac gcggtggctg cagttgcagc aatctttttg 27780
tttgtcgcca tggttgtggt tcatccactt gtgctcctat ttgaccgata ccggaggaga 27840
gttcaggaaa aaaatttgaa aatacccatt ttttgaaaaa gatttacgtt tatatacact 27900
agtatgaaga atttgcgaaa atataactaa tccgcagatc ggttatgcgg gagcgcaaca 27960
aaagtatggc gtggcggcgc ggagtggacg gccgaggcgt tcgcgcggaa tggggctgcg 28020
ggaccgagcc agtctcgctt gccggtaacg cggaaccggt acgctcccgc agcgccagtg 28080
tgcggaaccg cggcgccaac atttttttac tgcatggcac tgtgtttaat actgtttgac 28140
actgtttctg gtactgtttt acacagttcc cgggtcagtt ccgcacaatg gaggcgcggc 28200
accgaccatg aacaatgtgt gaacagtgct gcacagggtt aaaacagtgt ataaactgcg 28260
ctgcacagtg ctggagtcgc tggccactgc ggttccgcgt tttggaaccg cgggaccgtc 28320
gcgattccgc gttttggagc tgccggacca tgacggttcc gcgcaggatc gtcggtcccg 28380
tattttgaat ctgcggaacc gtcgctgtcc cgcgtttcca tttcgcggga tgcgtatatt 28440
tttataaaac ctctccatgc atgtatataa acataaatta ttgaaaaaat aagtatattt 28500
gcaaattttt ttcgagagct cagcactaca ttgcaaagat ttgggcaact ctgacaattt 28560
ccatgttcta caagcttgac gtcgagggaa tggagaacct gccaccgaat agtagccctg 28620
ctatctatgt tgcgaaccat cagagttttt tggatatcta tacccttcta actctaggaa 28680
ggtgtttcaa gtttataagc aagacaagta tatttatgtt ccgaattatt tgatgggcaa 28740
tgtatctctt aggagtaatt cctttgcggc gtatggacag caggagccag ctggtatggc 28800
tgtagtctca tccctgcttt cttaagtaga catatatgca attacagaat ttggtaaaca 28860
aacaagattt tatgaatcat atatgatttt ggggaaaaca ccaaactctc tttggtggct 28920
gccttgaaca tagttctatt cacacagtta tagcaccttc tttaaaatga agaactttgt 28980
tgcatacaca tatggccaaa ccacataatg aattttgttt atttctatct ttgaatgtta 29040
gcaccttatt ttcatgcata tcatgctaat ttgcttgccc acgttgagtg ggaatttttt 29100
tccatgtttt ataatttata tatgttctag acttctagtc cacaatttat ctacttcatg 29160
ttcctgagcc tctagtatgg ctggtagcag actaggtgct gagtgctgtc catttttgca 29220
gactgaagag aggagaaata caggactgtc cgttgttagt cagatttgta aaaatagact 29280
ctgatgtagt ttattttagc ccctatttta tatttaacaa tacaaatata taacgtatcc 29340
taagaactta tcgtaattta ggagaagttg ctcgtttcat taaattaaac tgtgaagtaa 29400
aaatgtgtgc tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg 29460
gcaggctagg atcgaacact gaatggtaag actgcttctg ccttcatttg tgcacttggt 29520
gctgccacgc cgattaagca gtagaacaaa gtaattttgt cgtgcacaaa tgagttatat 29580
ttcattgaaa atcgaagtga aaatgaacca aaagatagaa gaaaagggga aacttggtaa 29640
ttatatactc cacaaattta ttggtaagat ttgatattag acgctcgatt acttggctta 29700
agttaaggat atcaaatttg gggaagcacc aaaggaatta ttgtgaagga gttgtgggtg 29760
cataacgtta tctactagtt caaatcctag tgactatgaa tattaatgag taaggtaagg 29820
gatttattgt taattttagt ttctttaaga ttgtgtccga gtacaccatt cggtaagtgt 29880
aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgcttttacc ttttcatttg 29940
tttctgcgtt ctgggtatga atttgacgag attccatggt cagctcaaca tatcagttac 30000
tgcgtgtcaa gcgatcttat atggtatgcg cacaagcgat tgtatacgga tatgacagta 30060
taatgtgtga tattgatacg atgttccttt cctttataaa ggaacaaaga ctttttttaa 30120
aaaaagaagg ggtattacta aaaaccaaaa tgtcaaaaac aaaatatcag tgcacatggc 30180
aagtgtgcac gagcaatagc ttgcccttac gttcattatt tagcatgtac tactactaac 30240
tacgcaaaaa tcaattcacc gattattaaa ctgttaacat cattttagca cgttaacata 30300
tgtttcattc aacacaccgg ttttggcaca tttacaaact tgcaaagttg caatactccc 30360
ttcgttacat agcataagag attttaggtg aatgtgacac atctatccaa attcattata 30420
ctagaatgta tcaccgcctc cacgccggga gggagagcgc cgccggtgga gaaaggggga 30480
gggagtggtc gaggggaacc agtagggtgc cctccccgtc gccgcctccc cgtggccgcg 30540
ccggcgagac aggaggaaga gggggagatg gagcggcgcc gccggtgagg gcgcgcgtgc 30600
gcgggggggg ggggggggga gcggcgacgc cggtgaggaa gggaagggga gtggtggctt 30660
tgagagagat aggggagagg gaaaatgatt ttagagttag ggtttgggct gctgagtttt 30720
tatatagatc gggatcaatc aggaccgtcc atcagatcgg acaactacgg tttctcccgc 30780
gttgggccgg gtgccactcc taggttgccc acactattgg gccacatgta cgctccgcgt 30840
gaaataagtt cactttaggt cctttaagtt gcctctgaat tgttcccagg ccggccgcac 30900
tattgggcca ccccataggc catgtgtacg ctccgcacag aataatttcg ctttagctcc 30960
cttaatttgt cccctcaaac ttctaaaacc agtgcaaatc tttaattttt agttcaccca 31020
ttgcaactca cgggcatatt tgctagtgac atataatatg aaacgaagga tgtagcagac 31080
tatagaattt aaactgtgct ttcattttag agcatcacta actgttattt agatttttat 31140
ttaaataaat gcagaaatga tgtttttatt atgaaaatta gcaataaagc tcccaaaatt 31200
tcaaaaaaaa attaaaagag atttattaat catggttaat ttaattaaaa attaaatcta 31260
accatatcat attatttcac ggtccgtgat gaggaaatgg cagctgctat cacttatggt 31320
gggagagaag gggcattgtt tatttttata actatctctt ataactccca tgaaactata 31380
aaataaatat aatcattatc ataacattag tttttttcca ttgcaacgca agggtaattt 31440
ttcagtacaa taaaaaaata aaagtgggcc attctgaacg gaaatttctg gttttttttc 31500
ccaagagcgc cgcacacaac tgcgcaagag atcgatcgcg atcaccctgc tcgtcgccga 31560
tctcctacac catccctgcc atctccttcc cctccactgg ctgctgctgc acctgtcagc 31620
tagggcgggc atggcgcgcc gcgccgcttc ccgcgctgct ggcgcccttc gctcggaggg 31680
ctcgatccaa gggcgagggg gccgcgcggg gggcagtggc ggtggcgcgg aggacgcacg 31740
ccacgtgttc gacgaattgc tccgtcgtgg cataccagat gtcttctcct acaatattct 31800
tctcaacggg ctgtgtgatg agaacagaag ccaagaagct ctcgagctac tgcacataat 31860
ggctgatgat ggaggtgact gcccacctga tgtggtgtcg tacagcaccg tcatcaatgg 31920
cttcttcaag gagggggatc tggacaaaac ttacagtaca tacaatgaaa tgcttgacca 31980
gaggatttcg ccaaatgttg tgacctacaa ctctattatt gctgcgctat gcaaggctca 32040
aactgtggac aaggccatgg aggtacttac caccatggtt aagagtggtg tcatgcctga 32100
ttgcatgaca tataatagta ttgtgcatgg gttttgctct tcagggcagc cgaaagaggc 32160
tattgtattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttataa 32220
ctcgctcatg gattatcttt gcaagaacgg aagatgcacg gaagcaagaa agatttttga 32280
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 32340
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 32400
cggtatccac cctaatcatt atgttttcag cattctagta tgtgcatacg ctaaacaaga 32460
gaaagtagaa gaggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 32520
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 32580
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 32640
ctccctaatt catggtttgt gcacctgtaa caaatgggag agagctgaag agttaattct 32700
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 32760
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgacctga tggtacgtat 32820
tggtgtgaag cccgatatca ttacgtacag tactctcatc gatggatatt gcttggcagg 32880
taagatggat gaagcaacga agttacttgc cagcatggtc tcagttggaa tgaaacctga 32940
ttgtgttaca tatagtactt tgattaatgg ctactgtaaa attagcagga tgaaagatgc 33000
gttagttctt tttagggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 33060
tataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 33120
cgggattacc aaaagtggaa ggcagcttga acttagcaca tacaacataa tccttcatgg 33180
actttgcaaa aacaaactca ctgatgatgc acttcggatg tttcagaacc tatgtttgat 33240
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 33300
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 33360
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 33420
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 33480
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 33540
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 33600
tttgtctggg ggaaaatatc aagaatatca tagatttctc cctgaaaaat acaagtcctt 33660
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 33720
ttctcctaca gtccgattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 33780
atgtcacctc tccgaattat tttgactgtg gttcctggac tgtaaacaag ctattatctt 33840
ctggtgttga tgccagaaaa aacacaaaag tttgtcgtta tctctactaa cggatcataa 33900
aggggtttgt aactggagtt tcaaacttaa ggtatctagg cagtaggtat atattgatcc 33960
tacatcttat gatcttaaga tgatatcctt ctcattatcc tctgctgaaa ctttagcttg 34020
aaccgtcatc tacaccacaa tttgagcccc ttagcacaga gcacaacgag caatagcttg 34080
cccttacgtt cattatttag catgcactac tactaactac ccaataatca atacatcggt 34140
tattaaactg tttgtacagt ttaataatgt cattttatca cgttaacata tgtttcattc 34200
aacaccacac cggttttggc acagttgcaa acttgcaata acatttttac tacttctccg 34260
ccccataata taacaatctc gttccatact atattgctat attacaggat ggatgaagta 34320
cttcttttct tccaaaatat aagaatctag tactagatta gatattattt ggattcacga 34380
atttgattag gctgtctaga tttgtagtcg tatgtaatgt ctaattcggt aataggttat 34440
tacctctttg gatggaggga gtagttttta tttcgtactc cctccgtttc atattataag 34500
ttgttttgac ttttttctta gtcaaatttt attgagtttg attaaattta tagaaaaaaa 34560
ttagcaacat ttaagcacca cattagtttc attaaatgta gcatggaata tatttttata 34620
atatgtttgt tttttattaa aatgctacta tatttttcta taaatgtagt caaatttaaa 34680
gaagtttgat tatgaaaaaa tcaaaatgac atataatatg aaactgagga tgtagcagac 34740
tatagcaaat ttaaactatg cttttatttt agagcatcac caaaagatta gcaataattt 34800
atccctaaaa ttcaagtttt gggtttctta aactgaaaat aggaagtgaa aaatcttttc 34860
cgtccaagag atagcctaaa tcttatctta actaattaaa atattcataa ttttcctttc 34920
gtcacattaa attttcgtcc gtaaatctga ttgaaatcca attggacaat ccaaaaaata 34980
gagaaaaaga acagaaaaaa taataaaaag cacacaaatc ttatctcaat cccgcgggaa 35040
gctgccgacg ccgccgaatc cgctcgagcg ccgccgccgc cgctcacggg gaacgatgtc 35100
gctgctgtcg cacgcggtat gggagggcgc cgctgccact gcttgggaga taggatatgg 35160
agagagaagg aaatgtgagg gttagggtta ggtttttccc cgtccgtatc ttcagcgaca 35220
cggaggcgat ccaagctgtc catcagatcg gacggctcag aatgcctcca tcgtcgggcc 35280
gcgcatgctt gatgggccga gggaaggccg gagggtcgaa caaacgcaat caaaggagga 35340
gttggaggag gtaaattaga atttatttgc gggctgagat agtaaatgga ctgaaaatgg 35400
cccatagaga aattgggaat tttatttaaa taaatgttga aaaggtgttt atattatcaa 35460
aattaaaaat taagctccga aaattctaaa aaatattcaa agagcattat taatcatggt 35520
taatttaata aaaattaaat ccaaccatat catattattt cacggcgcgc ggtaggaaaa 35580
tgcgcagctg ttgtcgttta cggtgggaga gaagggacat tgtttatttc cagaactatc 35640
ttttataact cccatggaac tttaaaataa atataatcat tattatagca ttagtttttt 35700
tctgtctttt ttttccccaa gagcgccgcg cagaagagat cgatcgcgat ctccctgccc 35760
cgacgtcgcc ggccgatctc tcattctctc cacgccctgc tcgtcgccga tctcctacac 35820
catccctgcc atctcctcct tcccctcccc tctatcctcc actggtgccg cccacctctc 35880
cgtataagac aaactgcgtt gcggcgttgg tttccgccgg cgctgctgct gcacctgtca 35940
gctagggcag gcatggcgcg ccgcgccgct tcccgcgctg ttggcgccct tcgctcggac 36000
ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg gcgccgagga cgcacgccac 36060
gtgttcgagg aattgctccg gcgtggcagg ggcgcctcga tctacggctt gaaccgcgcc 36120
ctcgccgacg tcgcgcgtca cagccccgcg gccgccgtgt cccgctacaa ccgcatggcc 36180
cgagccggcg ccggcaaggt aactcccacc gtgcacacct atggcattct catcggttgc 36240
tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct tgggcaatgt cgtcaagaag 36300
ggatttagag tggaagccat caccttcact cctctgctca agggcctctg tgccgacaag 36360
aggacgagcg acgcaatgga catagtgctc cgcagaatga ccgagctcag ctgcatgcca 36420
gatgttttct cctgcaccat tcttctcaag ggtctgtgtg atgagaacag aagccaagaa 36480
gctctcgagc tgctgcacat gatggctgat gatcgaggag gaggtagcgc acctgatgtg 36540
gtgtcgtata ccactgtcat caatggcttc ttcaaagagg gggattcaga caaagcttac 36600
agtacatacc atgaaatgct tgatcggagg atttcaccag atgttgtgac ttacagctct 36660
attattgctg cgttatgcaa gggtcaagct atggacaaag ccatggaggt acttaccacg 36720
atggttaaga atggtgtcat gcctaattgc atgacatata atagtattct gcatggatat 36780
tgctcttcag agcagccgaa agaggctatt ggatttctca aaaagatgcg cagtgatggt 36840
gtcgaaccag atgttgttac ttataactcg ctcatggatt atctttgcaa gaacggaaga 36900
tccaccgaag ctagaaagat ttttgattct atgaccaaga ggggcctaga gcctgatatt 36960
gctacctatt gtaccctgct tcaggggtat gctaccaaag gagcccttgt tgagatgcat 37020
gctctcttgg atttgatggt acgaaacggc atccaccctg atcatcatgt attcaacatt 37080
ctaatatgtg catacgctaa acaagagaaa gtagatgagg caatgcttgt attcagcaaa 37140
atgaggcagc atggattgaa tccgaatgta gtgacgtatg gagcagttat aggcatactt 37200
tgcaagtcag gcagtgtaga cgatgctatg ctttattttg agcagatgat cgatgaagga 37260
ctaaccccta acattattgt gtatacctcc ctaattcata gtctctgtat ctttgacaaa 37320
tgggacaagg ctgaagagtt aattcttgaa atgttggatc gaggcatctg tctgaacact 37380
attttcttta attcaataat tcacagtcat tgcaaagaag ggagggttat agaatctgaa 37440
aaactctttg acctgatggt acgtattggt gtgaagccca atgtcattac gtacagtact 37500
ctcatcgatg gatattgctt ggcaggtaag atggatgaag caacgaagtt actctccagc 37560
atgttctcag ttggaatgaa acctgattgt gttacatata atactttgat taatggctac 37620
tgtagagtta gcaggatgga tgacgcatta gctcttttca aagagatggt gagcagtggt 37680
gttagtccta atattattac gtataacata attctgcaag gtttatttca taccagaaga 37740
actgctgctg caaaagaact ctatgtcggg attaccaaaa gtggaacgca gcttgaactt 37800
agcacataca acataatcct tcatgggctt tgcaaaaaca atctcactga cgaggcactt 37860
cgaatgtttc agaacctatg tttgacggat ttacagctgg agactaggac ttttaacatt 37920
atgattggtg cattgcttaa agttggcaga aatgatgaag ccaaggattt gtttgcagct 37980
ctctcggcta acggtttagt gccagatgtt aggacctaca gtttaatggc agaaaatctt 38040
atagagcagg ggttgctaga agaattggat gatctatttc tttcaatgga ggagaatggc 38100
tgtactgcca actcccgcat gctaaattcc attgttagga aactgttaca gaggggtgat 38160
ataaccaggg ctggcactta cctttccatg attgatgaga agcacttttc cctcgaagca 38220
tccactgctt ccttgttata gatcttttgt ctgggggaaa atatcaagaa tatcatagat 38280
ttctccctga aaaatacaag tcctttatag aatctttgag ctgctgaagc attttgcagc 38340
tttgaaattc tgtgttggaa ttcttttctc ctacagtccg attagaggag ggatcttctc 38400
tgtatgtgta aatagcgagg tatgtatgtc acctctccga attattttga ctgtggttcc 38460
tggactgtaa acaagctatt atcttctggt gttgatgcca gaaaaaacac aaaagtttgt 38520
cgttatctct actaacggat cataaagggg tttgtaactg gagtttcaaa cttaaggtat 38580
ctaggcagta gttttgacat tagatccaac attgtgtagt attcatttgt gtgtatcaat 38640
ctatagggtt tcattaaatt tcatttgtgt actgtttagg tgttgaatat attgttttac 38700
ttgtttttta actgaacaaa agatagctga agctttgttc tttaccaaat gcagtagtga 38760
tcatcacaat atattttttt acggaacagg agattgtata aaatggtttc catcggcggc 38820
caacggcgac cgctctgctc tgacccacca cccaatccat ccatccactc gccgccgccc 38880
ctgatccaag cctccgccgc gcgacagcga cgcaccgccg tcgagaggag gaggcgtgag 38940
ccccatgggg accctcctcc ggccgcgtaa tgccgctgca cggtaaccac gcgcctctcg 39000
aggcctccgc cgctagctga tctcttctca tcctgtttgg gtttgggttt gtgatttggg 39060
tgttttttcc gcagcggtgg tggtggtggt ggttgcggcg ggagggggcg gtggccgcgg 39120
ccgtggcgtg gagtgccagc tgcatcgggt gcaccgccgc cggggtccgc aggttgtggt 39180
ggcgacggcg agctgaggag gcggagggag actggtgagg gacacaggca ggcaggctct 39240
caaggctaag cttgttacag gtactgagac tagttactaa ttactttgat aatcagtata 39300
aataagcttg tgtagtgtaa tggcattgtg catttctgca cttgtaaatt ttacagaaga 39360
tggtcattca atttgaacct gcatctaata ttttagtggt ttgagtttat tctcccagtc 39420
acagagttga agaggcaagt aacctgtaag agaggactga acattaacac ctcttgttcg 39480
attaaaaatg accaaagagc atcaaacatg tattcgaggc tgttacttta atatggccca 39540
ttaatttgtt tagttggcta tgtacatcct agttggtgca gtgttgtgga aaacggaata 39600
cgggtgtcgg atggacgagg tgccgtcaag cgattaatcg taatacggat gattaaacgg 39660
aattatatgg atttttggcg ttcgcactaa gatgtacata attgatgtta atggcaatgg 39720
tggagacaaa atgcatcatc ttaataaaaa atatttgtat aaatctctaa ctatattatg 39780
aaaatgccat ttattagttc aatagatatc aacactgatg gttagtagcg caatagcatt 39840
gggcttgtta gtcaaaatag tgcagctggg ctgcaagttg caagtttatg ttagtttcat 39900
aaacagacat ctgatttgtc gataaataac cgactaatcg tgccatacaa ctgtataatt 39960
actctgaaat agtaatgttg ctccgacttg atgatacggt acggtctggc taccgtttcc 40020
gttttgacag acgattaaac ggctgtgccg gtcgacttcc acaacactga gttggtgtaa 40080
atgccagtta ccatttctat gatctaaaat aatcaactct tttagtatat tttcaaaaac 40140
gaaaattcag tacacatgca tgaatcttaa tcttcatatc tagctcgtta caaaatcaac 40200
aaaggcaccg tgtcagctgg tgcacattag ctagttcgta cttagcatta tccactagca 40260
ccttattttc atgcatatca tgctaatttg cttgcccacg ttgagtggga atttttttcc 40320
atgttttata atttatatat gttctagact tctacttcat gttcctgagc ctctagtatg 40380
gctggtagca gactaggtgc tgaatgctgt ccttttttgc agactgaaga gaggagaaat 40440
acaagactgt ccgttgttag tcagatttgt aaaaatagac actgatgtag tttatttttg 40500
cccctatttt atatttaaca atacaaatat ataacgtatc ctaagaattt atcgtaattt 40560
aggagaagtt gctcgtttca ttaaattaaa ttgggaagta aaaatgtgtg ctcgagtatg 40620
tcaatgcaat cctgtgttct tgtttgaaga tatggtgtag ggcaggccag gattgaacac 40680
tgaatggtaa gactgcttct gctttcagac gttattgcta aatttttagc tagttgcaat 40740
tagtgctgtc acgccgatta agcagtagaa caaagtaatt ttgtcgtgac aaatgagtta 40800
tatttctttg aaaatcgaag cgaaaacgaa ccaaaagata gaagaaaagg gaaacttggt 40860
aattactcca caaagagaac aaatttattg gtaagatttg atatgagatg ctcgattact 40920
tggcttaagt taacaatatc aaatttgggg aagcaccaaa agaattattg tgacttaagt 40980
taaagatatc aaatttgggg aagcaccaaa ggaattattg tgatggagtt gtgggtgcat 41040
aacgttattt gctttgttca aatcctagtg actatgaata tgaatattaa tgcgtaaggt 41100
aaggaattta ttgttaattt taggttcttt acgattgtgt ccggggacgc cattcggtaa 41160
ctgtaataat gttttgtatt ggattcactt gtgttacatg cacgcactaa acatgtgctt 41220
taccttttca tttgtttgtg cgttctgcgt ttgaatttga cgagattcca tggtcagctc 41280
aacatgtcag ttactgcgtg tcaagcagtt actgcgtgtc aagcgatctt atatggtatg 41340
cgcacaagcg attgtatacg gatatgacag tataacgtgt gatattgatt tttttatata 41400
aaaaaatacg atgttacttt ccttcataaa ggaacaaaga cttttttttt aaaaaaaaga 41460
aggggtatta ctaaaaacaa aaatgtcaaa aacaaaatat cagtgcacat ggcaagtgtg 41520
ctcggcaatt ttttgtctgt actttaaaca aaaatatttc tatatggtat tttttacaag 41580
ggtgtcacaa atattttaaa ttagccaaac atctgcattt tattaaaaac tgtataaatt 41640
ataatttata ctctaaaagg ttgtgtacat ctctcttgga gaaaatgtat aagttgcgaa 41700
caaacattaa tccacgttat ataagtcaat ctgttattta accatagaaa gtaagaaacc 41760
tactagcgtg ttaagctaag ctctctttca ttctctttct tcttcctggt tttgcttcaa 41820
tcacttgtca agtgaagggt tcttaactac cattactcct actcaccaaa tttttttctc 41880
agatctttcg taggtatata ttgatcctac atcttatgat cttaagatga tatccttctc 41940
attatcctct gctgaaactt tagcttgaac cgtcatctac accacaattt gagcccctta 42000
gcacagagca caacgagcaa tagcttgccc ttacgttcat tatttagcat gcactactac 42060
taactaccca ataatcaata catcggttat taaactgttt gtacagttta ataatgtcat 42120
tttatcacgt taacatatgt ttcattcaac accacaccgg ttttggcaca gttgcaaact 42180
tgcaataaca tttttactac ttctccaccc cataatataa caatctcgtt ccatactaga 42240
ttgctatatt acgggacgga tgaagtactt ctttccttcc aaaatataag aatatagtac 42300
tagattagat attatttgga ttcacgaatt tgattaggct atctagattt gtagtcgtac 42360
gtaatgtcta attcggtaat aggttattac ctctttggat ggagggagta gtttttattt 42420
cgtactccct ccgtttcata ttataagttg ttttgacttt tttcttagtc aaattttatt 42480
gagtttgact aaatttatag aaaaaaatta gcaacattta agcaccacat tagtttcatt 42540
aaatgtagca tggaatatat ttttataata tgtttgtttt tttattaaaa tgctactata 42600
tttttctata aatgtagcca aatttaaaga agtttgatta cgaaaaaaaa tcaaaatgac 42660
atataatatg aaactgagga tgtagcagac tatagcaaat ttaaactatg cttttatttt 42720
agagcatcac caaaagatta gcaataattt atccctaaaa ttcaagtttt gggtttctta 42780
aactgaaaat aggaagtgaa aaatcttttc cgtccaagag atagcctaaa tcttatctta 42840
actaattaaa atattcataa ttttcctttc gtcacattaa attttcgtcc gtaaatccga 42900
ttgaaatcca attggacaat ccaaaaaata gagaaaaaga acagaaaaaa taataaaaag 42960
cacacaaatc ttatctcaat cccgcgggaa gctgccgacg ccgccgaatc cgctcgagcg 43020
ccgccgccgc cgccgccgct cacggggaac gatgtcgctg ctgtcgcacg cggtatggga 43080
gggcgccgcc gccgctgctt gggagatagg atatggagag agaaggaaat gtgagggagg 43140
gttaggtttt tccccatccg tatcttcagc gacacggagg cgatccaagc tgtccatcag 43200
atcggacggc tcagaacgcc tccatcgtca ggccgcgcat gcttgatggg ccgagggaag 43260
gccggagggt cgaacaaacg cagtcagagg aggagttgga ggaggtaaag tagaatttat 43320
ttgcgggctg agatagtaaa tggactgaaa atggcccata gagaaattgg gaattttatt 43380
taaataaatg ttgaaaaggt gtttatatta tcaaaattag aaattaagct ccgaaaattt 43440
taaaaaatat tcaaagagca ttattaatca tgattaattt aataaaaatt aaatccaacc 43500
atatcatatt atttcacggc gcacggtagg aaaatgcgca gctgttgtcg ctgacggtgg 43560
gagagaaggg acattgttta tttccagaac tatcttttat aactcccatg gaactttaaa 43620
ataaatataa tcattattat agcattagtt tttttctgtc ttttttttcc ccaagagcgc 43680
cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc 43740
tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct 43800
cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg 43860
ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc 43920
cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg 43980
cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg 44040
caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc 44100
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 44160
cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct 44220
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 44280
cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt 44340
gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct 44400
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc 44460
tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg 44520
cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg 44580
ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca 44640
agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga 44700
ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc 44760
tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag 44820
cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga 44880
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 44940
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 45000
cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg 45060
gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 45120
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 45180
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 45240
ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct 45300
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 45360
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat 45420
tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg 45480
taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa 45540
tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc 45600
gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 45660
cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 45720
taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg 45780
actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat 45840
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 45900
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 45960
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 46020
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 46080
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 46140
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 46200
tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt 46260
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 46320
ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 46380
atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt 46440
atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa 46500
agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat 46560
ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat 46620
agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat 46680
gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt 46740
tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc 46800
tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc 46860
acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa 46920
gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa 46980
agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata 47040
ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag 47100
atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg 47160
atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa 47220
tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt 47280
ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg 47340
gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc 47400
aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat 47460
ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc 47520
taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt 47580
taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata 47640
ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg 47700
ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat 47760
ggaaggatcc acagataaaa ttcaggttct actgcttctc tgcttgtaat tttcatgaag 47820
ctgcagtgaa taccttgttg accacttgat ctgttgcttt gaaggagaat atagtagtgg 47880
ccaaggttgg tgacggtgat ggtggcatgt gatcccccag atcttcagtg acccagagag 47940
gaggggacgg cgcgtggtga gctacaaggc atactcagtg gagggcaaga tcaaggcctc 48000
ccgtccgtag gggactccgc tgcatcaagg ccaactgctc cgaactgatc aatttctggt 48060
acggatcact tctcctttcc tttttttttt caccttaagc actctcttga ttcttcgctg 48120
ctacctccct taatttcttt caatatattg tggcacttga tcatggcgga gacccacctt 48180
ccagtgtgaa tggattttgt caaagaacta aatttattcc attagcttat tttccgatta 48240
catggaagac attcttttct ggaataaata cagaactaaa tcctgtttcc tgaataaaag 48300
ttgttagtgt gtggcatggt gcatttccgc gcttctaaat tttataaaac ctgttcattc 48360
aatttgaacc tgcatccaat ccaatatttt aggtgcagac aggtgcttgc ggtcaggtta 48420
aagaagttgg caaaaatgct tctgaagaaa ggttaattgt tgtttcatct caggaggtaa 48480
tatgcagatg attattccaa ttggcattgc cttgccattt ttatcacgag tctttacaat 48540
tttatatcct cctacatatt ctttccagat tccagatgat ccagtgtctc caacaattga 48600
ggcgcttatt ttgctccata gtaaagtaag tacacttgct gagaaccacc agttgacaac 48660
acggcttgtt gtaccatcaa acaaagttgg ttgtattctt ggggaaggtg gaaaggtaat 48720
tactgaaatg agaagacgga ctggggctga aatccgagtc tactcaaaag cagataaacc 48780
taagtacctg tcttttgatg aggagcttgt gcaggtaatt tatttggcca tacctacacc 48840
agagatccat atattacttt tataactgca gtttttactt gttaacattt cattgtgctt 48900
ttacatttgt tccaagcttt caggttgctg ggcttccagc tattgaaaga ggagccctga 48960
cagagattgc ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc 49020
cgacaccttt tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca 49080
tgctatatgg acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat 49140
atggaagacc tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct 49200
gccaatgatc caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat 49260
gatgggcctc gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc 49320
cccccgattc ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg 49380
caacgtgagg cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat 49440
aacgatcagc cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag 49500
catatcagcc ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa 49560
ctgctgactg ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag 49620
aacaaccacg gcactgctgc ctgctgggct ctagccgcca tcagtaagta cgctatactg 49680
cctatctaga tctagatcga gattacatag tggaattatc tgtttataac aaaattacaa 49740
ggtatcaatt gataatttaa ggttataacc gtacaaactt cagtgatttg ctggtttcac 49800
attggttaga tttgtttcaa ctaatttggt acttctgtag ccttgtaatt tacgaatcta 49860
gtattaatat tttcttaagt attagcctgt tccttgatat tatgctgttg agaaagtatg 49920
caatagataa caaaaacaag taggtgtgtt gaggatgctc aagagtaata caggcacttc 49980
aataattctg atattatcag gacatcatca ataattctgc gcctacaaat cttcaaagaa 50040
aattttaata taatgcgtat gattttttaa atacgaatat tgattgctat ttaaagatat 50100
ttatattata tggtaattat tatttgaagg tttataataa aggcctccgt ttttagtttc 50160
acgctgggcc ttcagaatct caggaccggc cctgctcatg atccttacac cgtgtatcct 50220
gtagagtact tctctaaaag agagtaccct agtggaagta gcaaagttgc accatctgct 50280
tcatacgaaa gatatgcagc aactactcgc ttgcctaata gagaactgcc ctcatctatt 50340
agtcctggtg ccgattatat gtcctgccgt tcttatcttg accaagtacc tactgatagg 50400
tactctaata gggttacact acaattaggc ctcttgagag ccgggaatag taatgtgcaa 50460
caattaggaa tcaccagagc tggaaattcc aatgcttatg attatactga ggtacatttc 50520
caatgcgtta gcttgcctct tctttgcaaa tggccctcgc ctgatatgtt tccattagaa 50580
acatgaaacc atatatttga ctgttgcatt atgtctattt tcttccatga tggttcagac 50640
gtctgaaaaa aggacaaaaa tattctagaa tatgtcatgg tgatccaaat atatccttct 50700
gtcttgtgcc cactctaata tctatcgttg gtaacactat tcaattgtta ccatgttgtt 50760
gcaaacccta gattcagtta ttcagctgtt ctctgctgct gttgcttacc agttttctta 50820
gttgggtgtt gatcttttct cattttttat ttccttgttt cctggttcac ctgctgcctc 50880
tctgatgcat ctgaatgtat atttttgttc tcttcagtgc ttaatagatt taaatttcat 50940
tcttttcagg ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc 51000
actgggtatg gcttacgcag actgaatttt tacaggacac aaacatgaat tttgtcctca 51060
taatcattga gtgatgatct ctttgcaggt atccaggtgg ctctgtcgaa ttgtggattc 51120
caaatagtta actggagtct gtcattggtg ttggtggtgt caatctagct gagatccgtc 51180
tggtatagcg taagagaaac atcatgcact atccccagtc ataaccatgc cccaatggcc 51240
accaatagtt ttcctcgtga aaatctcccc ttgatcccag atctctggtg cgagagtgaa 51300
gttgcacgaa gcccatcctg gttcttccga gtccattgtg gagatccagg gcattccgga 51360
tcaagtgaaa gccgcacaga gccttctgca aggcttcatc ggcgcaagca gcaacagcag 51420
gcaggcgccc cagtcctctc gcatggccca ttatttttag taagctggag gacattcgca 51480
acaggggggt cagtggtcac tgcaaagctg agtttgttct tcagttcaac tgcagaaaat 51540
tgcagatcgg ttgccgtagt tgctagaacg gtacatagtt gccacctaac tgtagcgagt 51600
ggcataactt attgtgtgtt actgcccaat gttgtctctc cttgtgttca tggattcaga 51660
cttgtgattg tagtatttct ggatcagact ggagtaaaag aaaaaaaaaa aggaagacat 51720
gggtttaaca gtaagctcaa aacgttgaca gtagtaaaat aaaaggggtt tgttcacttt 51780
atttccaata tcaaccttac caacatttgg cgttgaatca tttataccac atcgcttgtg 51840
cagctgaatt tggggctgtt taaaagatgg tctcttggat tgctaattgc ctcgcggcaa 51900
gcgtggtacc ttgtacaata taaatataat tataactatt taatttcata attaaacatg 51960
ttgttacaaa tctctactat tataaaaatt gaagatgttt tttgccggta ttttggtacg 52020
tcatctgtgt atgaatccgt ttttaagttc gtttgctttt ggaaatacat atctgtattt 52080
gattcagttt ataagatcgt tcacttttgg taatacagaa ggaatcatat aagaattctg 52140
tttaaaaaca ctcgtatagt aacttgagac gatcagacgc ctaactacag ctcatgattt 52200
tctaaatata tatatatata tatatatata tactagaaaa aatatatgtg tgttaaaagc 52260
tatcttaatc ttattattgt tatatatttt agttaacaag aaatctattg tgggaacttg 52320
tttggatata tattttttta aaaaaaatca tgagctgcaa ttaggaatcc aatcgtctca 52380
agttagcagg agggcgagtt tttttaaaga gatttcttat acgatttctt ctatatttct 52440
aaaagcaaac gaacttaaaa accgactcaa acatggatct gtatttccaa aaacgaataa 52500
acttaaaaac cgactcatgc acagatgatt aatttttata atagtagaga taaacgaact 52560
cccacagtga attttatttt aactgaacca tataacaata ataagattaa aatagacttc 52620
acccgttgca atgcacgggc attttttcta gttaaagaag aaataaaaaa acacaaaaat 52680
ttataaaatg taaaaaagaa aaatattata attttgttag aattattatt ataatataga 52740
aaaatagttg ccaaaatttc tcaacgaatg tcgaataaac tcagcaatgt catatattta 52800
aatatgatgg taatatttgt tcgcaaaact ttaatcttca atccttcaac aacatagata 52860
tacaacgtcg taatcgccaa caagcccgag tgaccataca ggatagccga gcggtggatc 52920
tgtactgttc ttgggtgaaa taaatctagt acattgtata tcttatctta atatctacta 52980
ttataaaaat tgaagatatt tcttcaaaga tttccatacg ttctctactc cgttacaata 53040
tcggttctac tccgttacaa tatcggtttt gtacaccccg cgcacgcgtt gtgtgttctc 53100
ccgttccaat acatgaagct agagtcttgc ttctccctgg tctggcaggc cctttttcca 53160
ccatccccac cagggccagc gggttacatt gaccgatcac ggcccacatt agtggatgca 53220
gccagccacg ctcttcacaa atcatgtgat gaacattagc tgagttaaaa tttatccttt 53280
gatgattgtt agaaatgttt ttttctccac atcttctctt tcaattttgg aaaaatagat 53340
ttcttgattt ttgtgctcgt acatcactaa taaatcagtt gttacccttc cacacattgt 53400
caatttacca tgtctatttc agctcttacc ttgtatagtc ttgactcttg agtcctcgct 53460
attgactaag ttgctacatg cctcctacaa atcaatagac tgccataaca atattttcta 53520
cgacatgatc catattagtc catgcaatgc aagtacacac acactactgc acgaaaaaac 53580
tatgcaccat aacttcaaaa ctaacatgtt agaatgacgt taatttttca ttacaattat 53640
attcatcgac cgttaattta ctaggcatcc tgtttaaaaa aaatattcac cgaccatacc 53700
cacatgttcc gtagttcatt aggtgatgga tcggtagtta cagcagctgg atttttatat 53760
tttggtcatt ttgaaaaatt tatttcgcaa atagactcct gaaaaaactt atcccagaaa 53820
tagtcccttt tggagcgtca gagtggctgg cgccgtggtc caacgggaca gcgccaacct 53880
ctctggcgcc gccccccgcc tctattcttg tttctctata tagagttgca aactttttat 53940
ttttgtttta tttttttgga tgttttttca ctcttagaat cacgatacaa ccaactacaa 54000
aaaaaattaa actcgaacgg aatatatcac ttagctagaa gtctgaaaat atagcatacc 54060
acttatctac tttgcacctt caccaaaatt agaccataac ttctttagta aaatcctttg 54120
atcagcatat taaacataat gcactctatc actaggtgaa attacttaat ctaattcaaa 54180
atataactac atgtagcctt gaaaaattct acatgccaca tatttcgtcc gtttgagttt 54240
attattttta tggttcgttc atgtgagttc ccaagtgtga aaaaaaaata aaataaaaat 54300
aaaaaagttg cacatcctct cctctgcatt agagaggaga ggagaggaaa aattctacag 54360
gtcacatatt tcgtccattt gagttcattt tttctatggt tggttcttgt gtgttcctaa 54420
gcgtgaaaaa aatatcaaaa aaataataat aaataaaaaa attcgggggg ggggggcgcc 54480
agccactctt aggggtgaaa acgatcggat aatatccgat ccaatctgct ccgaatccat 54540
ccgaaataag gatatggtat gggtttttag aaatctggcg gatatggatg cggatgagga 54600
tatggtatct ccgaaatacg acggattatc cgacattttt gtcggattat ccgataggcc 54660
ctttaccgga taatccgaaa ttatgaacac atgtaaccac tctatctatt gcatataaca 54720
taagttggtc catccaatga cctaattcat caattaccct agatttctta ctatgtggtt 54780
ttcaccattt catgtcacac ttgcgtagct gtatttttat aaaatggaca tcatgtattt 54840
atgttgttta gcacttaagc acataattat tacaatgggt cgtttattga cattgtgtta 54900
tttttacttg cattgctaac tcaatgttgt attgattgca tacacacgta acatctgata 54960
aaatttaatc cgtttctgaa ccgattccgc accatttccg acatctgcat ccgtacacta 55020
tccacaccca ctccgaatcc gcttaaaaat atggtttagg atatggtatg accactatcc 55080
gtccgaatcc gctttatttt cacccctagc cactctggcg cgcttcccct gccacctcag 55140
catcgtccca ccacgtcggc agaaggacgg cggctccagc cactctggcg ccacaaaaaa 55200
ggaccatttc tagcataagt ttttttaggg gtctatttac gaaataagtt tttaaaagga 55260
ccaaaatgtg aaaaatccag gttacagcag actgtgataa gcaatagcta tattgcctat 55320
atatacacgt atatgcattg ctaatccttc aattttgtcc aattctttta aattgtcttc 55380
acctgttgca acgcatgatt ttttttctag tcttaacctt aactaatctt aataactaac 55440
taaaagattc gtatctttcc gatcgtcacc ttgtccatac gctaattttt cgtccgtccc 55500
ccctccccct caaaaaaaaa gggaaaaatc cattttacac cctcgaactc ttatgcttgt 55560
ctaaaataca cccccgaact ataaaaccgg gtataataca ccctcgagct atcaataccg 55620
gacagttcaa gggtgtatta tacctggttt tgtagtttgg gggtgtattt tagataagca 55680
taagagttca agggcgtaaa tggacttttc cccaaaaaaa atcccagtcg ttactttcca 55740
tcctgagaat cggagacagg gaaaactgaa gcatacacgc aaatagaatc aaagataggg 55800
aaaactaagc atatacacac aaatatatcc aaaaattccc atgcagctag atcgggtgcc 55860
accgttgttg ccaaaccacc acattgcaat gtaaatctaa gactaaagcc taaatcctat 55920
gctaagtcat caaattagac tcggttctac caatttggta atatatcaaa ttagacttga 55980
tttttactga tttgaggttc tcgaggtgtc acactatgaa acggaagttt ttcccgttgc 56040
aacgcacggg cactatgcaa tatcttaact aattaaaaga ttcatatttt tcctttcgtc 56100
acaccgatct ttcgtccgtc tgtaacatca cgtgcacctc ctctccaaat cccacatcat 56160
cataatccga cccaaaaaca aaatctcaat ctcaatccaa tcagaatcat cacaaaatca 56220
tccaaaatat caagagatga ttataggaga tggaggggtg agcaggagca acatcatcat 56280
cgcataaaaa ccccaaaatc aatcacaaca acgacatcat tatcacataa gaaaaacaat 56340
acaaacaaca tacacaatca acaacactgg cggatccagc cgaggggaca acggcgtggc 56400
agcgggcaga tcctctcggt cagatccgcc cacgggtgcc actgacgtcg ccgccgccac 56460
cggatccaag ggagaagctt cggacagagg gagagggggg tagaggaccg ctaaatccgc 56520
ccaccggaaa tgccgccgcc accacctccg tcggatttgc ccgagggagc gccgatgccg 56580
ccaccgccat cgcgggagaa gcttgggcac ggagggtgag gaggaggggg ggtagagaat 56640
cgccggatcc atccgctgga aaagcctccg ccggatccgc ctgccggaaa caccggtgtc 56700
gccgcctccg ccggattcgg tagcgggagc cgccgatgcc accaccgccg ccggatccgg 56760
tcggtgggag ccactgacac catcgccgcc gcctcctctg ctaccgacaa gggagagacg 56820
agaggggcgg gggcgagggc gggggacgag agggttagag ggagggaccg agtgggagag 56880
agagggacga gtgagaggag ggggacgagt gaataaggat gcgtgacctt atccactcgc 56940
gcggtcgcac cccggctctt tctctcgctc agctgttgcg cttgtggaga ggatgcgaga 57000
tttttttttg agtaaaatgc acgggcggtc cttaaacttg tagcggtctg tcatctaggt 57060
tcccaaactc tcaaaatgca tatccaggtc ctagaatttg tcaaagtgta tcatctagat 57120
cccaaaccga cacatcctct cttggatcct acatggcgct aatgtgactt gtcacatgga 57180
cgtgacacgt cttttttttt cttcttttct ttttcttttc cgttttcttc tcattcttct 57240
ttttttccat cttctgctcg ggtcacatag aaaggaaaag aaaggaaaat acaagagaag 57300
aaaaaaagaa aaaagaaaat ttttaaatgg gtctcattcg tcagtcaaaa ttatgccaca 57360
tcatgtccct gcgacatgcc acatcagcac cacgtagcat cctgaagggg ttgtggcgat 57420
ttgggaccta aatgacacac tatgacaagt tctaggactt ggatatgtat tttgagagtt 57480
taaggattta tatgacacac tactataagt ttaaggaccg cccatgccct ttactttttt 57540
tttttacacg gagagaatgc gaatttgttg gttagttgcg gctgagggtt tctcgcacgg 57600
agaaatttgc ggtgggagaa ttttttttcg aggttctttc tattgggaga agacgggatt 57660
atagggatta ttactggtgt ggtggcccct gttttctttc tttttcgagc ttctttccgt 57720
taaattcact tttctctctt caaggagcgt aggacatgac tgaatgcagc tgctgtaaat 57780
tagaaataaa aaagaaacat attctgtttt tcattttttt caataggtaa atataaagat 57840
ttttaagtaa tatttaaaaa tatatagtgc tgatcaacga cattgttaag tgagattttg 57900
ctgttactat cacttttttt tccattgggc tcacgtacgg cattaaaagt tttagttttg 57960
gttctctcct tttgagtttg ggcatatacc aatattgaga taggtatact aaagttcatt 58020
tggattttat tcgattcaac ttttttgggt tttgttcagt tcttttttac atgtttctca 58080
tctgaaatta ggaaattagg tttggtaaag tcttgaatag ataacgctgt tgacgtttga 58140
acatatattt atctatttat ttatttaaaa atatatgaat aatttttatt ttgttatgac 58200
ttttgtcggt gacatgggac cgggagtatc atgactagag gcttgggcag gagcgatcac 58260
ccacgtggcc tgatgtaaca tcctgaaaat tcccaacaat aaaaatcact aaaattttga 58320
actttttaaa acttttgcat catgctggtt gttatgattg ctattgcttg ccaaaccgta 58380
aatgatcaca aagaaagtaa agtaaggatc taaaatttaa gtaatagata aatttacgag 58440
aatataatat ttaattgcta accctacaaa taattacgca caagaaaaca aagccagaca 58500
aacggaaggt taattactaa tttaaattat ggattaatta ttaaatactt gaaccatgtg 58560
ttgcgtgcca tggcatctaa atacacatga aataatggtc atataattaa attaagcttt 58620
ataaaattat gtgaggtttt aattaagcaa ttagcttaat gttgtaccga gtcttaatat 58680
actatttata gaataaataa attcaaccta tccgtgtaaa atatattgct ataagttcat 58740
tcaatgtact attgtaataa taatggccac attaggatat tttaattaat tttggaaccc 58800
tcaaagcctc caaaattatc taggttaatt ttgaaattat acctcattta agtaatgcaa 58860
tagaaaaata tacataaaaa taaaatatgg gtaatattag aaattgagta aattttcatc 58920
taaattaaaa catatattgg gtaaacctcc tttatgtaaa aattaagatt tatagaatga 58980
aatttgtaca agggataaac taaaatcggg ttaaatagaa aatggcactg ttcattgcac 59040
tctaggtgct cgacgtggtc cctggcccta ttttccccct cagccgcgcg cgcctggctg 59100
cctcgcgccc cgcgccacgc cacccgcgtc gcgtcgccgc tgccgcgccg tcgccgtcgg 59160
ccgttccgcg ccgctcgtcc gtcgctccgc cgcctcgcgc cccgcgccgc gtcgtcatcg 59220
cgtcgccgtc gccatcaccg cgcctggccg cccctgaccc cgcgccgcgc cgcgccgtcc 59280
cgtagccgcg tgcgcgttcc atcgccgctg ccgcgccgcg cgccgtcacc gcgcgccgct 59340
cgtccgccgc gcatagcccc gcgccgccgc gccatcgtgt cgccgcgccg tcgcgtcgct 59400
ctcgagcccc gcatccctct cgagccccgc acgtcgcgtc ttgtcgccgt tgctgccgcg 59460
tcgtcgtcgc cgatgctgtc gcgtcgccgc tgccgcccgt cgcgtcgcct tgcgccccgt 59520
gccgccgctg ccgcgttgtc gctgtcacct tcgcgtcccg cctcgtgccg cgcgccaccg 59580
ctgccgcccc gtcatcgccc gctcgtcgcg cgcgccgccg ccgctgccgc gccgtcaccg 59640
tcgtgtcgcc gtcggcctcg cgccttgagc cgccgcgcgc ccgtcccctc gcgcctgcgc 59700
cccgccgcac ggccgtcccc tcgccgtcgc cctgcgccac tgccgcgccg cccgtcccat 59760
cgcgccgagc cccgtgccgc cgcgcgcgtc gcgtcgcccc gcctgtcacg ccgctcgccg 59820
cctcgagcca cacgcgtcgc gccgtcgcgt cgccattagg gccggccacc cctttccccg 59880
cgccctataa aaccccccgg ccacccccct ttcaccccac accatcccca cccattcccc 59940
tcttcctctc ctccttcccc tcttcgtccc ctccaccgcg ccgcgccgcc gccttcgtgc 60000
cgccgcgccg tgcgccgtcg tcgcgccgcc ctcgcgccgc cgcaccgccg ccttcgtgcc 60060
gccgcgccgt gcgccgacgt cgtgccgccg tcgccgtcgc cgtcgtcgtg ccgccgtcgc 60120
cgtcgccgtc gtcggtaagc cgccgtccct tccctcgttc cgacgccgtc gccgcccggg 60180
tgggaaggag ccgagagaga gagggaggaa ggagccggga gtaggaagaa agaaaagaaa 60240
agagagagag agaaaagaaa agagaagaaa agagaaaaga gagaaaagaa aagaaaagag 60300
attagagaag ggagggaaga gtgggcccca cctgtcatta gccccatcca attcccctta 60360
gaaaaataat tctgtagaaa agaaaatcaa gatcttgacc ccacctgtca gtcactatag 60420
cgtgtggata aggttgtatt aaaaataaat gaattaggaa cagtactatt tcgcaactat 60480
tagaattaat tcaaatttga atctttacac tagcataact aattcatttt agctccgatt 60540
tgagtggaac ttgaacctaa attcatctaa attcataagc tttccaatgg tatataattt 60600
actattaaat aaaatatatt tataattatt aagtaattaa tatcatatga ttaggttatg 60660
gtcaacttaa aaatatgcta ataaataaaa ttagtattgt ggatgtaata atatttgtct 60720
ctaacatgtc ttgccactgt aacaaccaca caaactaata ttaagtgatg tctgaaatga 60780
atgaatgaat aggaaaatac tagtacttgt ttaatattcg atagccatat aattaaaccc 60840
atggcttata ggttatttaa atcaaatgta gccttgtgat tatgcaacta aaatataaac 60900
acatatagat gaatctttag cttgattagg aggaataata acagagctag tgtgactagt 60960
tatgatatag cttgttgtcg gttgcctata tttagtaaat ggttcaatgt taatacactg 61020
atgcacacac ataccctttt tgataaccta ctagttgcat atattaaact tggtaataaa 61080
tgaagaacca atatattagc taaatactgg tgctagttat aaatcttgac cacacataat 61140
tttagttcaa accacacctg aggattgttc gttataaagt tataaagtta taaagttata 61200
caaaagataa tatgtaacta taatagtatt aaaccacaaa tctaaaatac agggcgcata 61260
attgtcaacc ttttatgcaa acggataata tccatatata tacatcatgt ggataattcg 61320
aataatagct ccattggtaa aataataatg taggcgaatc atggtgatga gatggtttat 61380
cctaaacctc cccatcgaca tagccatgct atagggacct gaccatttta ccttcataac 61440
agatctcttc cataagccaa tagctagact aaaccacaga ttagcaaatg tgtacatcat 61500
atattgtgct agttagtacc aatagaacca tcaggacaat ataaatacta aggaatctta 61560
gctcttagct tgattagaat ccaatagcaa acacgagtag tatgagcagc cttaggttcg 61620
acctcaataa ttatattttg cttgtgcata attgcttctt gttgaatatt ggtttttctc 61680
gcatattata gaaattgtat atcggttagt cgtgaggcaa cgtatgcagc tttcaggagg 61740
tgaaggttga tcaagattgt atcaagaata atgactattc taagcaggca agtcatcact 61800
attccttgaa catgttgatc ctaattgcga aattattttg tttacaaata aaattgcatg 61860
caatgatgaa catcctactt gtgattatgc catgccttga ttattgttta cccttaaaat 61920
ccttgtaacc atgattacgt atgagtccct agtcaattat gacaattgct tagagatgct 61980
attctagaat catgcatact catatttatc aaatgctata tgcttgggca attacctttg 62040
ggaaggtaat tgagatgcgg catgtggaga catgaacgcc acattgccat gatattaatg 62100
acatgatttg tgaaaggaga aataaaatta aacaactgtt ttcgactggg gcggacggag 62160
gatttgggtg gtatctggaa aaggctagta ccgtccccgg tcaattaagg accgagccat 62220
gaagttaagc atgaaacgac ccccgtacaa ccgcacttct cgtatgggta tagacctagc 62280
ggagtagata gctgagcgga ggcagtatcc atgcatagtg gtttcttgat gtgtgaggca 62340
ggggctctac ggtggggcag ccattggtag gaccgcaagg cgggtatcta cagtggtgtc 62400
gccatcggta ggactgccat gtgagaatct aaaacataat tataacttaa tgcatgtgtg 62460
agtcttccct tcccgggtgc gccagaactc ctctcactgc tagaaaccgt gtacgcctag 62520
agtgcatgag gatgaaaagt tcatggagcg ggtactgcca atgcgaggtt atcgaaaagc 62580
tctgccgtga cgcatctcat gtgttgggac gaggctcatg tgttgggcag tcgcggagtg 62640
cgggtaaagt gtacatccac tgcagtgtga gtaaaccaaa tctattcgaa tagccgtgct 62700
cgcggttatt gagcaccggg acatgtatta cacttggcta gactctaaat tcttaacttg 62760
tggggaatgg gatattgcat gatgaatttt atgctgatgg agccacatcc cgagaggagg 62820
gaaggtggac atcctcagaa aaccatgacg attcaatggc gggaagctat ccttgggatc 62880
acaatggatg gtggacagaa ccgtcgttgt ttaaagtgaa cactggtact aaaatttgat 62940
cgatctatgc taggttttag gcttgtgaaa agaattgtaa aattagcttt atgcaaaagg 63000
acctgaagcc attccttgaa ataccctcta tcatatgcat tgttattatg gtggcttgct 63060
gagtacggtt ggtactcacc cttgctattt atatatcttt taggagagtg ttgaagagaa 63120
gcccttgtcg gtacgcttgc gtatcccaca agatgatcgg agtgcggtct tgttctaggt 63180
ctcgtttccc cagtcgactg cctgtggcat gttaaccggg cccttatatt attttgtctt 63240
tcgctgttgt tctctgatag ttgttggcct acctggccct aatgtaagta tttaactctt 63300
ttagcctaaa ttcattcgtg atatgttgtg atccaactat gtatgtgtgt accaactact 63360
gatccaggga ttggtacgga taaacacaga agatttccga tttccaaaat cgggggtcta 63420
cacctgaccc cctcaggggg ggggggtcgg gcccgagggt gatgtggccg cccccctctt 63480
tgtctccccg aggggtcgga ccgctcccgt ttctgccccg agggctgagg cgccccgacc 63540
ccttgtgggt tttgcgccgc gtgtatgggt taggtgagca caacggggct cacctaaccg 63600
tatttattgt ggtttggacg agcgcgtcac gccgcatgta gcgcagtgca gcgcgctcgt 63660
ttatccggtc tgtgaccagt cacagaccgg tcagatcgtg ggttaggtgg caacaggcgg 63720
tctgacacac gcctcgcccc atcccgtcag gataagagcc tccaggcact tgtccctagc 63780
ccggagccag catgctaact cctggagatg acacgttggt cccggtcaga tatatgccag 63840
gcttcatccc aaccattaca agcaagatat tgtatgaaga agggcgaaca tgcagattgc 63900
tggactgaca cgtggtggac aagaatgacc gatttgtgac cggtctgaca ctggtcatgt 63960
cgtcggcaga caaccatgtt cccacgttgc acctgctttc ggcggagtgg aggtaggtat 64020
gggccatccc atcagaaggt cgttcggaca gcagccattg caagtctccg cccatttatg 64080
aagagatgac agggtgatcc cctggagaga aaaaaaggag gaccttgccc acttaggagg 64140
tgaggacgac tggaagggga gaggatctgg agagtagatc ccacgagagg aaaaaaggga 64200
gaagagggtt tctagagtaa gagctctctg actctccagc tctttgtagc ttcttcgtac 64260
acagatccac cagaaaatag gagtagggta ttacgcttct cagcggcccg aacctgtata 64320
catcgcccgt gtcttgtgct tttttcattc tcgcgaactt tccacagact aggagcttag 64380
aatctcgccc agggcccccg gccgaaccgg caaagggggg cctgcgcggt ctcccggtga 64440
ggagccccac gctccgtcaa ctttggctta taattaaaaa tactctaagg atattttttt 64500
atattttatt ttcttatgtc tatatgaaat tttaaataag atagatggtt aaacatatat 64560
tggaaaaaca tatatccaaa agtccactat cacaagcgta gcatagatac gat tacaata 64620
cgtttccgcg aagactgttt atacctactc tattccctgt tccttgtgcg gttgtgccat 64680
ttggggctgt tttttcatct cggattaact cgcgtggaaa ccgcgagacg aatgttttga 64740
gcctaattaa tccgtcatta gcatatatgg gttattatag cacttatggc taatcatggc 64800
ctaattagac ttaaaagatt cgtctcatga tttacatgca aactatgcaa ttagtttttc 64860
tttttatcta tatttaatgc ttcatatatg tgtccaaaga tttgatgcga tgttctggga 64920
aaatcttttt ttaactaaac atgcccaagg tgtttctcca attaagttga cccaaaatca 64980
ttcggcgtca cctttgtctt tcactttcct tccactacaa ggtgatgaca ctgacaaaag 65040
gtccaaaagc tacaggatct gatttttgtt catccatctg tgatgtgtcg gcaagccatc 65100
catggagttc atccactcaa ctcctctctc tcagagagag agagagagag agagacagac 65160
agacacatgc atgatagatt gtgctagtac ggtagtaaca ttttattgcc tccttttcta 65220
aaattctagg ttgtttggaa aacaaaaatt ctagattgtt caataaatta ataatattag 65280
gtatttattt taagtcactt taggtgttaa tttttgaatt ttaaactgct taaactctct 65340
ttcgacgcat ctgagagcag gtacaatagc agactataag ccagctataa atatatttta 65400
agtagataaa agaggaaaaa taagagtagc gggctataga tttgtagaca gctgcagcgc 65460
gagctccaag atacatatgt gtatgacatg tgagaccaaa cattaattat gtagtatatg 65520
tttatatgta tctattgtat gaattggcta ttaaattgac tatgggtgtg ttcggaggtg 65580
ggtgttggga accatctccc aagcacggaa aacggagcgg tccattatgg cgtgattaat 65640
taagtattag ctatttttta aaaaaataaa tcaatatgat ttttttaaac aacttttgta 65700
tagaaacttt ttgcaaaaac tcaccgttta gtagtttgaa aagcgtgcgc gcggaatatg 65760
agggagaggg gttgggaacc tcctcatccg aacgcagcct atacatgatt tggagccaat 65820
agttggctat aatattaaac ttgctctgag tggctcttga atcatcgaag tgatagaaat 65880
catatgcaga aatgtttata tttgtgatgt aaaatttgaa tctaaaatta tttatatttt 65940
gaaatggagg aagtactacc taaaacaagt atgagaaaga gacatgaaaa acacaaaatc 66000
tagacttaaa aataattgga attactagca ggaggtcgaa gtcaatcaag acggcgaaga 66060
aaagcacagg ggacagcaga cacgttaaca cgtaagtaaa caaacaagtg gttaattaat 66120
tagggggccc tcaagtctcc cctaaagcca ctaaacatga caggtttgtg taccatggaa 66180
aaaagggtga agcaaaactt tattctctct ctcattagat taccagttgg aaagcaatcc 66240
tgggacctct agctaatctc attattgtag aacaacgttt tcttagagag agagagagag 66300
agaaataagt caataaaaat tactactaat ccacttgaac cagttctgtc ggtgtcggat 66360
gatttaccac atttgacgaa acggactatt tattcgacgt ttcgaaaaac acactttttt 66420
agaaaaaaaa aactttcctc tattagccac tcgttttagt tatataccta tccgagtatc 66480
tgttaagttt atttatcaaa atatttaatt tatctctata attaaatata caatccgtaa 66540
aaacaatcac gcagtaattc gtttcaaact gagcctcagc tagaaaatca aaatggaaat 66600
gaataacaat agcaacagta gagttagttt ttcggcttat catccgcaac ccaaatgcga 66660
attttaaact tagccttaga gttaattttt aaggcttgtt taccatactt cattttccca 66720
gcattagttt cttttgtcac taaaaattgt ttttttaagt tgtttcgttc attttctcac 66780
ggtttatcag cagtagagcg aagccattct tggagcctgt ttggcacagc tctagctcca 66840
gctctagctc cactctttct ggagctggag ctcagcccaa cagttttagg tgcaccaaaa 66900
ttaggagtgt agttgggtgg aactctctca caaaaaattg tggagctgga tttagacagc 66960
tccacaactt cactccaaac ccaactcctg aagttaaatt gataagttga agctctatct 67020
atcaagccct ttttcttgat catgcttcta cctactccat ttttgtttct tggccctcac 67080
aggaattgga aaggaaaggc gtatatgcat caatgcatgc atgcgcacat caacctcgtc 67140
catcaaccat cataatcatc atcatctcgc cagctgacga aaatgacctg catccatcca 67200
tcacggacaa tccaagcgaa caccgctacc aacatcacag ccaacctgtt tatcactagc 67260
tcttgatacc actcctacat aaacactacg cgcaggttaa ttaattaagc gtgattactg 67320
aagtaacatc taatcacgtc ctggttagcc tttaataaga caacagttag agcaggtaca 67380
atagcagcag gatataagcc agctataaaa aaagagagaa aagagcaacg ggctacagat 67440
ctatagccag ctgtagcatg gacttcaaga cacaacgtgt gtataacagg tgggaccaga 67500
taataatagt gtagtatagt aagtaactat tatatatatt gactatagat gatttggagc 67560
tattagtgtg ctatagtatt aaacttgctc atagagcagg tacaatagta ggatattagc 67620
cagctataaa catattataa tgagataaac attgatagag aagagcagcg ggctacagat 67680
ctgtagccag ctacaacacg gactccaaga cacaacgagt gtatgacaga tgggaccaga 67740
tattagtagt atagtaagca actattatat aaattaacta ttacattggc tatagatgat 67800
ttggagttag tagtgggcta tactattaaa ctttttctct tagcaaaaat caagcgccta 67860
atcacattag aggagtagct ttgagacaaa ccaattagcg gcgaatcaag cgatctgcgt 67920
ggtcgtacag tgatgggccg ggccgggccc acagcccgac agtgacaggg ggcctgacgc 67980
atgtcagcct cagccctgga cgggagctag ccgttgtgtc cccgggggag gggagggggg 68040
cattcccatc atttcgcccc tcctccgggc ccacatctca gtgggggtaa aggtgtaaat 68100
tactgcgacc gcgagtccag cgagcctaga tttggacctt gtgtccgttt gactgaaccg 68160
gagctactcc ccaatacggg gggattgcgt tgtgtgcatg ccatgtgggc ccgagcgccc 68220
tttgttcgtg gctttgggtt ggaaaggtga ccgtgtgagc tgtgcggtgt tgtactacgt 68280
attagtataa atcatttttg ggtactactc cctccgtcca aagcttattt ataatttgtt 68340
gtactccaac cgtccgtctt atttaaaaaa aatataaaaa aaattaaaaa aataagtcac 68400
acataaaata ttaatcatgt tttatcatct aacaataaaa aatactaatt ataaaaaaat 68460
ttcatataaa acggacagtc aaacattgtc acgaaaatct aatgtttgcc ttttttttta 68520
agaccaaggg agtatctacg aacaaagata atacatgtta taatcatgaa gcccatgatg 68580
tgattagccc ggccgtttga ctaacctcac gagctacgtg gctgacaagt ttaacttgtt 68640
aactccatca tttcggatac ttagagcatg tacaatagca gactattagc cagctataaa 68700
catattttaa tgggataaaa gatgagagag aagagcagcg ggctacagat ttatagccag 68760
ctgcagcacg gactccaaga cgcaatatgt gtatgacagg taagaccata tgttaatagt 68820
atagtaagca actattttat aaactggcta ttagatcggc tatagataaa ttggagctag 68880
tagtggacta tactattcaa cttgctctta tatgatataa atattgatat aactatatga 68940
ttttgttaat gacatgtttg tttatggatg gactatgtgg ggtcggtcgc ctccgtagct 69000
gaccaaaata caaacttaaa acccctatct ataaaaatct aacttttgtt tataaatata 69060
gatataaaag ttcataatta gagcctcatc ttttaaacga aaagagtact atgaaaacaa 69120
ctcgtaatac aaagactaat tacgacgaaa agaaaatagt actgacaaga ggaaagcagt 69180
gaacttgcat actccctccg taaaaaaaac caacctagac acggatataa cactatatat 69240
ctagattcgt tcgttgtaat gaagtgtcac ctccgtatct aggttggttt tttcgtacga 69300
aagaagtatg agtaaatcta aagctatgta tacccttcgt caaaaaaaaa aagtaaacct 69360
tgtactggtg cgtgtcacat cctaatataa tattgttttt tatggagggt gtacagttga 69420
aaaaaattga tgtgttttaa ggatgaaaaa tattggtaat gttggctatg taactctaga 69480
aaaaaaaatg cagtaataat aaaatgctaa tttgctggag tactagatta tagacaatcc 69540
agtccaggac acgacaccct ccctactctc tccacttcca ctctcaccgg ccaccgcgcg 69600
ctctctctct ctctctcccc cttctcccgc aagattcttc ccccaaatcc cacccgatcc 69660
accgccgccg cccgctcgcc ggagtcccat cgctgccacc gccgccggag ccgcggcccg 69720
acgcccgccg ggcctgcttg ctgtgtgtgt gaggaggtgg agttgctcgc gctcgttccc 69780
gcggccacct ccgcctgctg ctgcttctgc ttccgctggc attgcgggga ggtcgtgtgc 69840
cgggggacgt gggggctcgt gttggagcgc ggctgccggt gaggtggggg gtgcggcgcg 69900
gcgcggctcg cgctcgtgcg ccggtggcgc gggcgcgggg ggaagcgtac gggggagggg 69960
gagtgtggcg gcggcggcgc gcggggtagg gacgggcgcc gccaccacca ccggctcgtt 70020
cgctggcagg cgctacgcgt ccagatccgt acgccggtat gcttcgtctc gccgcaactc 70080
tctccatttg attagtatcc cctcgccgaa acgaggcctg tgaggcgccc gctttctggc 70140
tggcttccct gtactcgctg cttgctcctg cctgttgggt taacccgttt ccatcgaatt 70200
tgggtaagcg aaacatcgcc tcatatgggc atttggggtt ctggcagcct taggctcgcc 70260
atccgtcgcc gagcttccaa gtgaccggcg cttgttggta tatttgcttg cttgttcctg 70320
tttggtggct gcgctaaatc ttttgtgctg cattgaattt atgccaccca tatacagcaa 70380
attactgagc tgaaataatt cggctaatta ggtccagcaa tatgacatct cgtggattga 70440
atgctaagct gacattgtat cactgatgct ggcttatata taggttgttg agaagtgaag 70500
atgtcgacag gtgaaaccct gcgtgcagag ctatcatcca ggacgccgcc tttcggtttg 70560
aggctatgga ttgtgattgg aatcagtatt tgggtggtga tcttctttat actaggtttc 70620
atgtgcctct ggtccatata ccgaaggaag ccgaagaagt cctttgataa gattccagta 70680
tctcaaatcc cggatgtttc caaggagatt gcagtagatg aagttcgtga gcatgctgtt 70740
gtcgaaaact tccgtgtgca agaaagccac gcgatatcgg tgcaggagaa acattacgag 70800
aaagattcag ggaaaatgct ggcacacttg gttaggagta aatcgagtga tgccgataat 70860
ttgagccaat gcagctcggt gtaccaatgt gatagggctg gtagctcgta ttctggtgat 70920
gaaggcagct cgggcaatgc taggaggcac ttttctcaat atgcaactgt ctcagcatcc 70980
cctctggttg gtctcccaga attctctcat ctgggctggg gtcattggtt tactctgaga 71040
gatttggagc atgcaacaaa tcggttttcc aaggagaatg tcattggaga gggtggatat 71100
ggggtagttt accgtggtcg actcataaat ggaactgacg tcgcaataaa gaagcttctt 71160
aataatatgt aagagatcct gaaatctatt ctgcgtttta cagaacttgt gactccttct 71220
gatgccatca tattaatttt cttttgatat ggtgctgcag gggccaggca gaaaaggagt 71280
tcagggttga agttgaggct attggccacg tcaggcataa gaatcttgtc cgccttctag 71340
gatattgtgt tgagggaatc cacaggtaaa gctatttatc aatcaccttt gctgatggat 71400
ggctagcttt tgtttctact ggcacattat ttacttgcat agggatgtag gattgctctt 71460
ggtctatgtc cacctactca ccagattatc tcaagggata ggttattcct gactgcactc 71520
cttatgctat cgattttttc ccttccaaat ctgatggtgg gattcagcat gcccagtgac 71580
agattatgct cagtccacag aaaccttctt tggaccacca ttcttttacc atgaaaatgt 71640
ggccatagct ccgaaagcta ggattcacta gaagcgcaca actgcttatt ggtttgttag 71700
ttggctataa caaggtctta ctgaaatgta cttccatagt tcattacttt gtgaatgcct 71760
gttcttgttc ttcacgtttc ttctcatgca tgttcaattc taaatttgta ttcatgatat 71820
gtccaagcta ctgtattctc caaagaaaat cagaagtcca ttcacctatg tattttccag 71880
ttttccgcca ttttggatac tgctctagaa acaagttaat aatatagata tttatatggt 71940
ttggccagtg ctgcttaagt gaccatcgag atagaaattg cttaagaaat atactaagat 72000
gttgagtgtc aggtgttttc ggataatctt gttaccaaca aataggtcct atgaatataa 72060
tggtgtctgc ttcacgtaat tcaaaatcca cactcagcca aaataatctg caatagggtg 72120
ttgaaaatat gattatgttt ctcccttgtt ttcatcatga ctacagaaat gaacaatgtt 72180
gctacatctt gtaataattt gtggttttca attgaacaaa acatccatca aatgatatct 72240
acagcaatat attttgcact tctgagcaca caataggttt gagtgtattc gagtcatggt 72300
cattgattta agctttttat ttcactacat aaccattgat ttgagtgtat ctaaggagtt 72360
ctgtttccac aagtacttta tgttaatggt gtctccttat gctttggcca tccaaactca 72420
ttactgttgt ttaatatttt tagtggttag tggtgtccaa atctttcttt gtgtacatca 72480
tactatgttt ttgtagtcta ttaaacttcc atcctatcat ctgacttgtt atattccagg 72540
atgcttgtat acgaatatgt gaataacggg aacttagaac agtggcttca tggtgccatg 72600
cgccaacatg gtgttcttac ctgggaagcc cgaatgaaag ttgttcttgg aattgctaaa 72660
gcgtaagaaa caaaccatcg tccccgtcaa aaagaaaaga attgttcttc actttagctc 72720
ttttatatgt atatgtttag ttgcataacc cattttccat aactgaattg gtatacaggc 72780
ttgcttattt acatgaagca atagagccaa aagttgtaca ccgggatatc aaatcaagca 72840
acatactaat cgatgaagaa ttcaatggca aactttctga ttttggcttg gctaagatgc 72900
tgggtgcagg gaagagccat atcacaactc gagttatggg aacttttggg tatgttgata 72960
tttttttgga gttagtatta atctttccta tgcttagctt ttactgttgg aatgtgcagt 73020
acttcgctta ttcatacagt ataaaatttt acatgctgcg aactttgtcc ttcgtatatt 73080
ataacaggta gctttctcat tgctatcatt gattcatttc aggtatgtgg cccctgagta 73140
tgccaacaca ggtctgttaa acgagaagag tgatgtctac agttttggtg tgctattact 73200
ggaagcagtg actggtagag atccagttga ttatggccgg cctgctaatg aggtgagcat 73260
atatcctaca atctcatgcg tattatgtat gttacaaaag tccgtactat tggaaattat 73320
tttacggcaa aataacgtct atactaggag agacgaattt gcttcaggtg tatggctgtc 73380
tggcagttgt ctactgtcta gttacccttg tctcactttt acagtctatt gttttatttt 73440
tcaggagctg actagctgta taccttgtca tatataacaa cactgtaacg tggatgcctt 73500
gcaggtgcat ctagtggagt ggctcaaaat gatggttggc acaagaagag ctgaagaggt 73560
agttgaccct gacatggagg tcaaaccgac cattcgggct cttaagcgtg ctctcctagt 73620
ggcactgagg tgcgtcgacc cagactctga gaaaagacct actatgggtc atgttgttcg 73680
gatgctcgag gcagaagatg tcccatcccg tgaggtggta acgctttctc ctttcctgca 73740
ataacattca tcatattata tcattgcaat aaatctgaag cttttgctgt aatcctactg 73800
aaggaccgga ggagccggag gggcaacact gccaatgcag ataccgagtc caagacaagc 73860
tcaagcgaat tcgagataag tggcgataga agggactcag ggccatcagc aaggtttcaa 73920
ctctaagaag acggtgatca tagtcaagaa caatggcttc aaaactctat gcagtaacat 73980
ggtggttggc agagaaaaag gggtatttct ggagggcatt gcattttgta ttgtaggtct 74040
gcatggcggt agagactgga gagagcacag tgtctgatga tggatacccg gagacctgta 74100
attcccattc agtattctgt ttgttagtca agcagcttgt acagatcgtt gtctgttcca 74160
ttttttcatt cttctggttt ttttgtttag gaggctcttg gattaccagt acgaaccgct 74220
gtctcttttc tagaatcacc aacatggaac ctatcaatat ttactactag tactacgact 74280
tgctttcttc ttgctgagat ctatcatgta ctgtacataa ctgacgtgtt cagctgcact 74340
tggacaagta gatgctcgtt ctgtatgtcg aatttacttg atgaggtcga gcattaagta 74400
ccatggctgc agccggcttc tgtttagttg tgctgacatg cggcggcgac ctcacgctgt 74460
gtggcccatt cttgatcttg ggccgaaact gtagcaacgg gcgtacggcc catctatatc 74520
gggattgttc ggcccgttgt agatgggccg gatcgggatt gcgacttacg tgcgacccat 74580
ttcggttggg ccggtggtcc gctacttcat ctagcagtgg tcggcggcag ggttcacaat 74640
tccaatagaa tccaaacatt attggattga gttaaaaaca caaaccaatc ggctttttgt 74700
caggttcaga aaattttaaa ctgaatttta attttttgac aaaaatctat ttagatttcg 74760
tctgtttttt taggtttgtc aacggattca gcgaaatccg atgatatcgc tcgtgagtgg 74820
atttttgatc cggtatcgag attgtgaacc cttgtcgcgc attgcctgac aaagacaacc 74880
agtgaagcgc cgtgcgcgcc gcgtgcgcgc cgcgtgacgc gaagatgcgc aggaaggaac 74940
aagctggcaa gcggcgcgcc catgacggcg gcggcgacga cgacccgcgc gcgtgcgtgc 75000
gtcaacgcac gcgaccggcc gagatccgtc agtggccgcg gctatatata atacatcgtc 75060
gcctcacacc ccccacacac cgagtcatcg ctcgccggag ttagagttcg tagcggcgaa 75120
ggatatagcc atatattata gatggcgatt ggtgttggtg gctgctgcgc cgtgctgctc 75180
gcggcggcgc tgctcttctc ctctccggcc accacatgta agcacgccca tcttcttctt 75240
cttcttcttt ttttctttct tttttttttt tttttggaaa tgagccgcag ctgacaaaaa 75300
gatcactcac acatggatac actgtcgtga cactaaccaa tgcctaagcc attttgtttt 75360
cttgttttgg atttttcttt ttatgtgtat cacttttgct tgttgctctt gcagatgctt 75420
atgattccct ggatccaaac ggcaacatca cgataaaatg ggatgtgatg caatggactc 75480
ctgatggcta tgctgtaagt agcggtggca gtacaccaac atctctacct ttattttcgt 75540
ctcaacctgt acatttacac tatcttgttc tactacctct aataaaaaaa tatatttgat 75600
gttttaaaat ctattaagtt ctagagatta ggaaagctac acatggtttt atgttttgat 75660
actattaagt agtatatttt ataagttata ttgaaggctg gggtttcaaa agtttgacta 75720
cactagatct tattcaaagc gtctaatgat tactgaacgg aggaagtatg aacttataga 75780
cttgaagtta aacagcatag ccacatctct tcatgtatac ttcatccgtt tcatattata 75840
agattttcta gcattatcca tattcatata tgtgcgtcta gattcattaa tatctatatg 75900
aattgggcaa tgctataaaa tcttataacc tgagaaacgg agggagtatg tcgcaaacaa 75960
caacaacaat aacaacgagc aaaatctgta tcgaatccgg tttccctctt gtaactgtat 76020
caaagatctg tcctctgaaa cgtcccctgt tcatcaggcc gttgtcacac tgtccaacta 76080
ccagcaattc cggcacatcc agccaccggg gtggcagctg gggtggacat ggcagcagaa 76140
ggaggtgatc tggtccatgt acggcgcgca ggccatcgag cagggcgact gctccatgtc 76200
caaggagggc agcaatgtcc cccacagctg caagaagcat cccaccgtcg tcgacctcct 76260
cccgggcacc ccaatcgacc tgcagatcgc caactgctgc aaggctggat cactgagcgc 76320
attcagccag gacccggcaa attctgccgc gtcgtttcag atc 76363
<210>28
<211>53905
<212>DNA
<213>稻(Orza sativa)Asominori
<400>28
gatcagtgag tgagagtgat gtgctattga ttttcgtcta ggattttgct gtgctcttct 60
tcttcttctc ctctctacca agaaagatcg atggaggaga atttgtagga cgcgtttctc 120
acgaattact tagctgttaa tgatcagctt gatgtgtacg atatgatggt gcagagtgaa 180
agttgtgttg ttcactggtg gatcatggga tgggaatatg ggattgttgt aagatgtaac 240
tcaagtgttt tcttttttgg gattactttt ggtaataaga gcttgggtga tcgaaaacta 300
cagatggttt ttcttttaag ttgtatgatc tctgtagagt ttttgagtaa tttgtagttt 360
tgtaccctat caaagatcat ctctagctgc ctctgagctc tccaactcta tatgtccatc 420
tctagtatat atgtcccata tttctgactg aaaattttca agtcggttgg ttccctccgc 480
ctggatattc tttcagctaa ttagattttt tttaaatgat aaatttgcta aaagcttgtt 540
caaattcagc taagatctat tcaaacttca atttctctat cgaaattccc ggaaatttca 600
attcaatcat tccccaatac atgccgattt ccgtaatatt gaaccatgac atgtaaacaa 660
cgaaggaatc aagggcatat ttagtttcat ctcacatcga atatacggac acacatttga 720
agtattaaat gcactctaat aacaaaacaa attacagatt ccgccagaaa actacgagac 780
gaatctatta agcctaatta atacatcatt agcaaatgtt tactatagca ccacattgtc 840
aactcatgac gcaattaggc ttaaaagatt cgtctcgcag tttcctgacg aaccgtgtaa 900
ttattatttt ttctacgttt aatactttat gtatgtgccc aaatattcaa tgtgacaacg 960
tgaaaatttt tatttggaac taaataggcc ctaatattct ttcaagatat tagaatagtt 1020
atccctctcc acctccctgc acaaacagtg aacttctttc tccttgggca caggagtagt 1080
agcagctccc ggaaacagaa agcaatcaag caaagtcctg aacctgaagc atcctgaaac 1140
cagcagacgg cagaaaccag tgggcgcagg cgatagcagt ttttcgtggt ccggcgtaca 1200
gccaaaatac tggccatcgg gtgcctacat agaatgagtc cactggacgc agctaccacc 1260
gtgtgtgcta cactgaccgc cgctgctcgt cgaccagttg tacggggctg acttattctg 1320
aatttctaat ggtttatttg ggggtttaga acactgaggg gtgctttaga tccaaagatg 1380
tgaagtttgg gcgtgtcaca tcgggtatta tatatagtgt cgcacagggt gtttgggcac 1440
taataaaaat actaattatt gatcctatac gataagctat ataatactcg atgtgacacg 1500
ccaaaacttt acatccctga atctaaacac ccttttaaat agagtatttg gtgtgaaata 1560
taattttgat ttgggaagaa ggtgagtgag atttggaaaa aaaaagcatt tcaattaaaa 1620
aatttgccag cagtaaataa agaaactact cggttttgta attaaagtga ggttttggca 1680
cttctttgcc ctaaactggc ctccatttta taaagtgaga accgtgcagc aaaagcctga 1740
aaaggcaaaa agaaagaaat tgtagaggtt tttcaggagg atacaactag gtgggtctct 1800
aactctctat gcagctgtgg tctgtggagc aaaacgatga aatggaagac gggacgttga 1860
cgagggtgaa gaaaacgagc gtttgaccag cgtcaaccat ggcgtgaaca gtagcaccac 1920
taacctgacc gagaggttga agaagatgca atcaacgggg tactatagtt cccacgaatt 1980
tcccagcaac aacgggttgg ttctcactac tcacgaattc cctgtggctc aacaactact 2040
agtacatcct tttgtccatt atgataaaag ttctatctta atttttattt acacgttttt 2100
caaactgttt tttaattttc tatataaaaa atacttaaaa tatcaaataa aatctatttt 2160
tggagtttta aaaaactcaa ttaatcatat atattattga cttattttat tttacgtgga 2220
ctaaaatatc ttcatcttca tttaggttat gttcttttct catcaagata catgatacat 2280
tagcatgttt ttcaaactgt tttttaattt tgtatataaa cttactctaa aatatcaaat 2340
aaaatttact tttagggttt ataaaagtaa aactcaatta atcattacta acttgtttca 2400
ttttacgtgg actaaaatat cttcatcttc atctaaggtg gtgtttggat ccaaggacta 2460
aattttaatc cctatcacat cggatatttg acactaatta gaagtattaa acatagatta 2520
atgatgaaac ccattccata accctggact aattcgcgag acgaatatat tgagcataat 2580
taatccatga ttagcctatg tgatgctgta gtaaacatgt actaattacg gattaattaa 2640
gcttaaaaaa tttatcttac gaattagctc tcatttatac aattaatttt attgttagtt 2700
tacgtttaat acttttaatt agtatacatc cgacgtaaca ctgatcgata caaacaccaa 2760
ctaaatcgaa aatcaccgaa tggctcgtca tcctcccaca tgagatgcca agatggaaca 2820
ccaacaatcc aacggctagg aagcgcccca tcccacccac cgcctaaccg ccttcctatg 2880
caagtgggtc ccaccccttc cttccttttt tttttctttt tacaaatccc cttccctttc 2940
ttggctagct agctagcttg gcccaacgcc acgagccgag ccgagcacat ccggagccaa 3000
gccgagctca gcgcctcagc tccccctcct cctcgtccca ttcccggttt cctcctccga 3060
tttcccccaa atccgcacgc ctctcccctc cgcctccatt tttcccgatt cccaattccc 3120
aaatccggat cagccgcagc cgcagcagca aaaaatttcg aaatccaaat ccaaacccat 3180
cccccccacg acgacgtcac ccacatcccc acccccgcga gacgagacga gacgactccc 3240
aaatctctct ctcctctctc ctatgcgcgc cgccgccgcc gccgcagcag cagcagctag 3300
gaggcggagc agcagcagca gcagcagctg agatgatcgt gcgcacctac ggccgcagat 3360
cccgctcctt ctccgacggg ggaggagggg agcgcggcgg cggcggtggg ttctcgtcgt 3420
cgcaagacgc gttcgaattc gacggggagg aggaggacga cctcgtcctg ctggggtcgt 3480
cgtcgcagtc gtcgcacccg cccgcgccgt cgcaggagtc gtcgtcgatg tgggacttcg 3540
acgaggaccc gccgccgccg ccccggcggc ggcgggggag gggtgggggt ggggactacg 3600
cggagcccgc cacggcggcg gcggcggcgg cggcggccac ctcgctcatg gaggcggagg 3660
agtacggcga gatgatggag agcgtggacg aggcgaactt cgcgctcgac gggctgcgcg 3720
ccaccgcgcc gaggcgggtg cgccgggcca gcttcctcgc gctgctcggg atctgcgcct 3780
ccgcgccgcg ccgccgcgtc ctccgggccc aggggtcggt acaccaaaga accctccttt 3840
tttttttctt acttgtctgc gctgtaagta aagaataaca attcgcgttc ttgctcttgc 3900
ttcgcgggca atcttggtga ggaatcttgt tagggttatg aaattgggca gccagttctt 3960
gtttcttctg cgtaatcttg gcggaaacag tgggattttg tacgattatg gctccgtaat 4020
cggcatttct gtgggaaatg aaccaccttt agggcatttg accttcgaac agcatgcttg 4080
gtgttgcaat ccgtagctat tgccttcatc ttaggcacaa gaacttgttc tgaattatga 4140
tttaccaact tgtgtttgtt ttcttgttct gagttttctt gcttggttag ggttagggtt 4200
atcaccgtgg tggtgcagaa ttagatgttc gctacttgtc ttaacctctg ccttgcccaa 4260
tttggtaccg agtgttacag ctgggtttag gaagtgtgat ctttgagcat ttctagcatg 4320
ttggtctctt tattttgcta atctcacatg gttgtagagg aaggaagcat agtgactgat 4380
gatgaatgcc tagatactag aaatacatct ttattaactg aattaggatt gcttgggtat 4440
ctatgtagat atgactgtag aatgttactg ctggaaatgc tatccaatat ccattgatct 4500
ctagcctaat atatctctcg aggccaagag atcagtcaat tttgaacttt caggagagtt 4560
tctatttggt acttaatctc ttttatttgt tacttttggt gcctggctct cttttcatga 4620
ttgctaagta gacaggtaaa gttctaccta aaattattct taaaagttca aaatcgcttt 4680
agattaagga gtgccagcca gagccttagg cagagtctta taaaccaaaa gcacaatgct 4740
acaatgttca caaaactttt gtggaatttc cacttgagct gtataaacat cgcaatctac 4800
tgtgaataaa agaagcactt gatggaagtt catgttagca aatgacatgt tttctgtgag 4860
gaggttgatt gcttgaactg ttatggactc ttgcaacttt ttattttact tcgtacccat 4920
ttatgctaat gtgcacaaat aaaattgctg agagtaaaaa tgtacaactt gttacgcacc 4980
agcacacttc ctatttgtat ccattttcct gttgaatttc aaatgtattc aattgctgaa 5040
attgttccat tcaacaaaca catattccgt taatgaaatt attatacatt gcgttttgtt 5100
ttcttactca caagtgtcct cttttcttat atcctataga ttggtgcaac aaattattga 5160
tgcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 5220
attcgttttg gcaagtgatg tgagtacctc tcaatcccat ccttgtgctt ctgtgcatgc 5280
ttcattctat tttttacgca tatcgattgt tttcttttat ataacagccc ataaaaataa 5340
tcacatcatg gcaaagttat ttatttctcc agtacagtta tataagtatt caccactttt 5400
ccatgaatat cttggcatgt gattacaaag aagattattt aagaaagtcc atgcttttat 5460
ttcatcattt tgtttgaagt tgaactttaa tttatggtgt aaatttcagt taatattgct 5520
agcagctcgt attctttaat ggcataactt cacttgtgct tattctccaa tatctccctt 5580
cttgttgttc aggttcaaga aaatcatttg ttggattcag aatcttgtgt ccattttctt 5640
cttaaattat taaatcctcc agtgaatctt gttgattcca aagcaccatc gataggttcc 5700
aaacttcttg gaatcagtaa agttcaaatg cttaatggat caaataagga ttctgactgc 5760
atttcagagg aaatcctttc aaaagttgaa gagattctct taagctgtca agagatcaag 5820
tcgctcgaca aagatgacaa gaaaacaaca aggccagaac tgtgtccaaa gtggcttgct 5880
ttgttgacaa tggaaaaggc atgcttgtct gctgtttcag tggagggtaa gttttaatca 5940
aatttcttgg tcatgatttc cctttatgac cattataatt atttttatga gccaaataag 6000
cagttgccat aagttacata gcacctgttt acaatattca tgggtggttt gcttagccct 6060
ttgcttcacc tgcctttgat tgatgacttc catccgtgtt gcacaactga attggagtaa 6120
ttgactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc ccttatcaaa 6180
tatttgattg ttacagagac ttctgacact gtgtccagag tcggaggaaa ttttaaagag 6240
acattaaggg agttgggcgg tcttgatagt atttttgacg ttatgatgga ttgccattca 6300
acattggagg tgagatctcg ctaacatcgc atattttaca cttcctttgt tcaactctaa 6360
aggatggtgc aagttttgtt cctttttgcc attttagctt taatgtgctt gaagccacat 6420
gaaagcaatg cttgtccaga tacatagcca aaggttgtta tattttggga catggaaaat 6480
gcttgaggta gtaactattt tcatcaggac atggaaaatt ggctgcatca caaattatgt 6540
tgtttcatgt tgcaaaatag ttttttaata cttttttatt ctgcatgtgg tgttagtgtc 6600
ttacagtgat tcctctgatg attatatccc ccacgataat aatacttgac atatctacac 6660
caagtggaca ttattcattt ggatgttact tttccagcta tacttgctgt tcttgcataa 6720
actttggagt aaattgcgta tccctttaag agataaactg cttggtgctc ctatctgtgt 6780
actttttatg cccccaacta ataatgcaat catattacgc tgataaactg aataaataaa 6840
ttaacaatat acttctggtg gaaaccttgt gtatcagaat ctcataaagg atacctcaac 6900
ttcagctttg gacctaaatg aaggaacatc tttgcaaagt gccgctctcc tcttgaaatg 6960
tttgaaaata ttggaaaatg ccacatttct aagcgatgat aacaaggtaa tgttccttat 7020
atattctgtt tcagtttagt acccattttc ttcttctgta ccatcttctc ccctcatttg 7080
ttctgtgcaa aatgtgcaaa cagtgtgact ttgtatttct gcttaacatt tttctttttt 7140
tcctgaaaag cagtataaac tcttacactc attttgcttc ttgcagaccc atttgcttaa 7200
tatgagtaga aaattgtacc cgaaacgctc ctcgctttct tttgttggtg tcattatcag 7260
tattattgag ttattatcag gtatttttct taataataca atatgtccgc taacacaata 7320
aaatgtttta aacatccagt atgttaaagt tgcagtctga cgcctatttt gttttgctgc 7380
agctctttca atactgcaga attcttctgt tgtttccagc tctacatatc cgaaatcgtc 7440
taaagtctct caacagagtt gctctggtaa taacaaacac caaatttgtt tgatcaactc 7500
gttggctttt ctgtgcactg tttcaatata gtttggtcgc cattcaagtc tcactacaga 7560
tgttgaactt gacctgacac ggtggcacca atatttataa aacgctacct gatattttta 7620
atatttcatg tttcctgacc cagattatct tgttggttcc tcatataagt ttaattagtg 7680
tcgttcttga aactttgtta tgcagcagat gtcatggggg gaacttcatt taatgatgga 7740
aagcgcaaga actcgaagaa aaaaaacctt ttgtcgaacc agacacgcca tagttgctta 7800
tcttcaaaat cagaagtttc tcatattact atatcttctg gtagtgatgc tggtctgtca 7860
cagaaggcat tcaattgttc tccatctata tcaagcaatg gggcatcaag tggttcatta 7920
ggcgagagac atagcaatgg tggtgctttg aagttgaata taaaaaagga tcgtggcaat 7980
gcaaatccaa ttagaggctc aagtgggtgg atttcaataa gagcgcacag ttctgatggg 8040
aactccagag aaatggcaaa aagacgccgt ctatctgaaa atgtaatcac cgacagtggt 8100
ggcggtgatg acccttttgc ttttgatgat gttgatcagg agccttcaaa ttgggaactg 8160
cttggtccaa aaaagaaatc gcctcagaaa catcaagaca aatcaggaaa tggagtgcta 8220
gttgcaagtc atgaaccaga ccaacctgaa gatcttaatc agtcgggtac aacatctctt 8280
tttagtgcta aagatgaatc cagtcttttg gaagactgcc tcttggcatc agttaaggta 8340
attaaatatg tttccttctg atctttcttg tttcttcttc aagagaatat acattcttgg 8400
gtcacagttt ctcggtttgt ctttgtgact ttgttgagtg acatattttg aattcacaaa 8460
atttcctttt caatatggct cctcaatcta tagcatctgt cgtgtatgta ttctgtacaa 8520
aatagtattg taacatctcc tagaagaaat tggcaccatc catatcatac agtagcaatt 8580
tatgagacgt gatcctgatt ggaggtttag gacagagcct cgagctaaat tgctattgta 8640
ttgtatctac tatcttttag tacatgatat gtgctgggca ctctgtgtct gagtgtagtg 8700
agtgcttaag tttacatagt tcagctaaca tgcatatgta agacagttta tgattaaatt 8760
taagtgtaga aagaaggtac tttcaaaaga tttttaagga caatataatt gtttcaccgg 8820
gactcatgct tgttctgact gtgagcctaa tgttaccttt acatgccctt acattgtcta 8880
ttttttatcg ttttatgaga tcttccaaac aacttgatct gtcttaatgt ttttttgcta 8940
gctcctttct tggatatctg gtaaatggtt aggccgaagt atgaactttg ccttattgtt 9000
tcaaagaaaa tgtaacaact cctggaaaag tctaattttg gttgcccttt attttgctga 9060
ccgtattggc acacatctaa ttctgctgtt cctttctggc aggttcttat gaacttagca 9120
aatgacaacc catctggttg tgaattgatt gcgtcatgtg gtggacttaa caccatggcc 9180
tccttgatca tgaagcattt cccctcattt tgttttgtcg tggacaacaa ctataacacg 9240
agagatgtca atcttgatca tgagttatca tcttctcaaa acagcaaggc acaccaggtc 9300
aaaattaagc aattgcgaga tcatgaactt gattttctgg ttgccatatt gggcttgctt 9360
gttaaccttg tagagaagga tagccttaat aggtaagtcc ctcacatgct tccttccatt 9420
tgctcaattc atatcagtgt tactgttctg gcagttcctt ggggtcagga ctcagaaaca 9480
tccaattaat gttcatgttc tcttaacgac tcagaaatac tttataacct ctccacaggg 9540
tacggctttc atctgcccgt gttcctgttg atctatctca gaatccacag agtgaagaga 9600
cacagagaga tgtcatagca ctcctctgtt ctgtattctt agcaagtcaa ggtgctagtg 9660
aagcttctgg aactatatca ccggtaattc aaaattcttc aagttccttt tgtatgtaga 9720
ttatatcttt gtaaaactcg gcatttatta cctgctcttt gtttcaaaaa gcagtatttt 9780
attttgctcc ttagcatagg tcagcagaac agttgatctt attcagaaaa caatattttg 9840
catgtaacat actgttatct atgagatgaa aattaatgca tgtgtaataa tgtcaatgat 9900
aaatatttgc tatctgaatc cagtctacca actctagtta gaccgaaatt actgaggttc 9960
tatttcaaag aataatttag tgcaccattt gttcaactac tatgaagtaa aatggtattc 10020
ccttctattg acatcgggtt agaagtgaaa ggccatctta atgcaatgtt ctcaatgcca 10080
caaacccaca aatttcatta acacatacag attattatta acatagctat aaattggatt 10140
tccagaagct tgagttgaat ttattttgtt acaattgaaa gcactgggaa cattagcatt 10200
tttttttagt tcttggttat tgcaatttat aatgttatac agaactgtgt acctcacaat 10260
gcattcatta tgacattcta tgaaccattt gattgactgt tgcttgtaaa caacaggatg 10320
atgaggagtc tttgatgcaa ggagcacggg aagctgaaat gatgatcgta gaggcctatg 10380
cagcccttct tcttgcgttt ctttcaactg aaaggtttgc aatctgtagt tgatggattg 10440
ttttattaat gtctaactac ttgcataatg tcagcactat ggcatttaac ttatactgtc 10500
tgttaactgc aacagcatga aggttcgtgg agccatttcc agctgccttc caaataacag 10560
cttaaaaatc cttgtgcctg cgctagagaa atttgtggta tgtctccata attcttgaac 10620
tactgtttgt ataaaaaagt atggatgatc tttgaattta ctccattttg gaaatcatta 10680
atttttcatg tctgaggtgt gaggtgtcac cataattgta cttcccatcc aggaagcctg 10740
tttgcaaaat ttcacataaa taaggaaaat ttgaacttgt ttcaagtttg aatagtaaca 10800
ggatgtttta tttctcaact ggagaaaaca ttccggctgg gacttttaac ccttaaaatg 10860
ctagtgtgct cccactgtaa gattgtctgc tgtcacattt gaaactttgt gtaatacctt 10920
tatcactacc cttgagatga gagacacaat ctggtaccga gttaagttat tgataactcc 10980
cagttgaagt acagcaccaa atcaagccaa catgttggct acgtaattaa atgttctctt 11040
acaacagata gaggtaaaaa gggagtttct aagtatctaa cctcttaccc tcttggctta 11100
gcactccagg cacaactctt tcttaacttg cgatttagga cttgactctg agaatattgt 11160
gtgcccacac tggttgagtg catgcctatc taagctgcta gtttttgttc attttgatta 11220
actctgaagc tgcctgagct tattctgctt ccatcattta ttaatccatc atgtttctct 11280
ttcagtcgtt ccatctgcag ctcaatatga tcacagagga aacgcactca gctgtcacag 11340
aagttatcga gaaatgcaaa ctttcataga aagagtgaag aggggcctgt acagatcaac 11400
taacaacctc tttgcagcaa aaaagcatac acacaagtgt ttgtcttggc ctggggctct 11460
gcagatggac tgatactctg acctgcagtg ggcttgggag ctaacaatgg tttcattctt 11520
ttttttttta tgttttcccc tgttgttttt gctcatgttt tgtgtaattt tttcttctca 11580
tctagcgatg ttatttttct tagcatgatg ggagtagccc tccttttttt tttctctaat 11640
taagtgtaaa gtagcaacag catagggatg aatgttcagt gtagtgtgtg gtgtttcagt 11700
tattcagaga cgtccataca gtttgtacct tgtgaccaca cgtcttaatc tgatgaagct 11760
tagaataaat cacatgttag caatgcaata tcatctgcgt cttctctcac tttggtggcc 11820
atcaaattct gtgtagaagt gtatggttgg tgtgctgttg caaatgccgt attccgctct 11880
gttttgtgga agttaagaag tccctagttg aaataccgat ttttcatgat ctcggagatt 11940
gatgcaactc tgattgcagc atttcttttt attagaatgt acactccatg ctatcatgat 12000
gtttattgtt tagtactaca agatttggtt aaccattatt ttaatatcat aataatttta 12060
taaaatcttg gagtaacaag ttcataatac atgatagcat aactttttga ggctagtcta 12120
tgtatattgt ctcctttgtt tttaaactaa gcactcaata aattattgat ggctgtaatt 12180
ttctgaaggt ttcaccggtt tcggcccgtg ctttataaat agcttcggca caaaagacaa 12240
aacggtccct ccaacacata aatggttgag tttacgtttt cattatcttt ggtaaaatca 12300
agtccaccac gtagacactc ataacaaaag tttgaatatc ctcagaaatt ttgacttgag 12360
tctatcttac ctttgatatc ggacatccaa ccctccctcc ctccctgaac tttatattat 12420
tcatattaca cctgaacttt atattattca tattacaccc tgaagtggtt ttcatttaat 12480
tgcatacatg ctgaaatagt ttgacaacgt gagatgcaca aaatctacac gttcgtctta 12540
agttgcaatt cattttatcc cttttctttt tctctcttac ataggaatat caatagtact 12600
aattcacatt acaatatagt ataaattggt gatcgattat tggcaatata ctatattaaa 12660
tattcaaaac tagtcattta agctgccaaa taagtaaacc actatcgaaa accacaatat 12720
aaatggcatt acaaaactta gggggttgaa tatccaattt taaagttcat gatgctagag 12780
gaatttctat caaaagttta tgggtacata tggacttttt cctttttaaa agaagctatt 12840
cttatcgtaa acgttaaata ttttttgtac tttatttttt atgattgaaa aaaaaactta 12900
gttttcaaaa tgattggtct gtatacaagc atcaattaga cttaataaat tcatctaaca 12960
gtttcctggc agaaactgta atttgttttt gttattagac tacgtttatt atttcaaatg 13020
tgtgtacgta tatccgatgt gacaaccaaa cccaaaaatt ttccctaact ccatgaggcc 13080
ttacagatat atttgatggg tgtaaagttt tttaagttct ttgggtgcaa agtttttaaa 13140
gtatacggac acacatttga agtattaaat atagacaaat aacaaaacat attacatatt 13200
ctgcctgtaa acaacgagac aaatttatta agcctaatta atctgtcatt agcaaacgtt 13260
tactgcagca tcacattgtc aaatcatagc gtaattaggc tcaaaaatat tcgtctcgta 13320
atttacatgc aaactgtgta attggttttt tttttcgtca acatttaata ctccatgcat 13380
gtccaaatat ttgatgcgat ctttttggcc aaattttgtt ggaatctaaa caaggatcaa 13440
atttgctgaa tttttccaga cgtcacggct tgttcatcca tcgttcgcat cgcgattcgc 13500
caccgacgcc ttggtttcca acgaatttta tcatccgctt aaatacatcc aaagctctcc 13560
atcgccatcg gcggccaacg gcgaccgctc cgctctaccc aatccaccca tccactcgcc 13620
gccgccccct gatccaaagc ctccgccgcg ccgccgtcga gaggaggagg aggaggagga 13680
ggaggaggag gaggcgtgag cccctatggg gaccctcctc cggccgcgtc cgctcgccca 13740
cgccgccggc gccggcgacg ccacgccgtc gaccgcgcac ggtagccacg cgcctctcga 13800
gaggcccccc ccccgccgct cgctgatctc tcttctcatc ctgtttgggt ttgggtttgt 13860
gatttgggtg tttttttttt tccgcagcgg tggtggtgag cggtggccgc ggccgtggcg 13920
tggagtgcca gccgcatcgg gtgcgccgcc gcccgggtcc gcaggttgcg gtggcgacgg 13980
cgagctggag gaggcggagg gagaccgtgg tgagatcgga tttcgccgct ggtggtgccg 14040
ctaccatggg ggattcgccg caggcgctct caggtttgca gcctcctcca ctctcttctc 14100
gcaaaatgtg ttgctatgtt cctctcgctg ggctggcctc atagccatta atgtagtttg 14160
ctggaacatt acattcggaa cgttgttggc aattgcttga caaaatgtgg aattgtggag 14220
gggagaaaaa tcgtttgaac ctgcagtgac aaaattgcca tctataattt taaaactgaa 14280
ggtgtggaaa tcaaacataa tcattgccag cacatcattc ttgttaacca ccttgacata 14340
ttgttggctt ataacagtta gctccacacc aacttggaag gtgtcaatgg aatgtaagta 14400
taaattgagg ataactggca gttgttaaga ctttctacag aacttgtagc agctaaaact 14460
agctattgtg catttatgtt tcatggaatt tgagcggcaa tggatatttc ttactaagac 14520
gtataatgca aaacaaaaaa aaaaaaaact atgtctatgc agtttacatg taatgtgcgg 14580
atgcaaataa aatcatgttc atggacaaac taatgggatt cataccaaat tccagaattg 14640
catttcttat gtggttactt ttgtttgttg atttggttac cagacatcga tgtggtttca 14700
agggtcagag gggtttgctt ctacgcggtg actgcagttg cagcaatctt tttgtttgtc 14760
gccatggttg tggttcatcc acttgtgctc ctatttgacc gataccggag gagagctcag 14820
cactacattg caaagatttg ggcaactctg acaatttcca tgttctacaa gcttgacgtc 14880
gagggaatgg agaacctgcc accgaatagt agccctgctg tctatgttgc gaaccatcag 14940
agtttcttgg atatctatac ccttctaact ctaggaaggt gtttcaagtt tataagcaag 15000
acaagtatat ttatgttccc aattattgga tgggcaatgt atctcttagg agtaattcct 15060
ttgcggcgta tggacagcag gagccagctg gtatggctgt agtctcatcc ctgctttctt 15120
aagtagacat atatacattt acagtatttg gtaaataaac aagattttat gaatcatata 15180
tgattttggg gaaaacacaa aactctcttt gttggctgcc ttgaacatag ttctgttcac 15240
acagttatag caccttcttt aaaatgaaga actttgttgc atacacataa ggccaaacca 15300
cataatgaat tttgtttatt tctatctttg aatgttagca tcgtttttgt ttaatgcatg 15360
atcgccttcc tatatatttg tagtatgtca acattgtatt ccatgctgag cataacaaat 15420
ggtttgttaa aattcaggac tgtcttaaac ggtgtgtgga tttggtgaaa aaaggagcat 15480
ctgtattttt ctttccagag gggactagaa gcaaagatgg aaagctaggt gcatttaagg 15540
ttcagtaacc aaacttaggt tacattacat ctaatgagat ttttatattc agtatataat 15600
gttaaccttc tcatggtgta ctgacgtggt tataaatgtc cccagagagg tgcattcagt 15660
gtggctacaa agaccggtgc tcctgtgata cctattactc ttctcgggac agggaaactg 15720
atgccttctg gaatggaagg catccttaat tcaggttcag taaagctcat tattcaccat 15780
ccaattgaag ggaatgatgc tgagaaatta tgttctgaag caaggaaggt gatagctgac 15840
actcttattc taaacggtta tggagtgcac taaagaaaga tggtgttttt ttttattata 15900
tggaacctat tcaaaggcac agacaggctt tcaaggctaa gcttgttaca ggtactgata 15960
ctagttacta attactttcg taatcagtat aaataagctt gtgtagtgta atggcattgt 16020
acatttctgc acttggtaaa tttacagaag aggcaagtaa tattttagag gattgagttt 16080
attcacccag tcatatagtt gaagaggcaa gtaacctgta agagaggact gaacattaac 16140
acctcttgtt cgattaaaaa tgaccaaaga gcatcaaaca tgtattcgag gctgttactt 16200
tagatatggc ccattaattt gtttagttgt ctatgtacat cctagttggt gtaaatgcca 16260
gttaccattt ctatgatcta aaacaatcaa ctcttttagt atattttcaa aaacgaaaat 16320
tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 16380
accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 16440
tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 16500
ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 16560
tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 16620
agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 16680
ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 16740
tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 16800
tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 16860
attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 16920
acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 16980
aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 17040
ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 17100
gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 17160
cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 17220
ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 17280
ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 17340
gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 17400
attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 17460
ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 17520
cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 17580
cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttccttt ccttgatgaa 17640
ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 17700
tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 17760
ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 17820
ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 17880
tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 17940
gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 18000
gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 18060
aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 18120
gagaagcgta ataccctact cctgtgtttt ggggggatct gtgtatgaag gagctacaaa 18180
gtatgagcca gcctctccct tgttctgggt tccgaatctg gaaaagtcca gtccagtccc 18240
cccctctaag tgggcaaggt cctcctttta tatcttaagg ggataccaca tgcaccatct 18300
ccctcctttc tgtggggact taccctacct tttcataaat ggacggagat ttgtatagtt 18360
gccgtccgaa tgaccttctg ataggacggc ccatacctac ctccacttcc gccgaaagca 18420
ggtgcgacgt gggattatgg ctgtctgctg acgacatgac cagtgtcaga ctggtcacaa 18480
attgctcatt cctgtccacc acgcgtcagt ttagcaatct acatgttggc ccttcttcac 18540
acaacatctt gcctgtaatg gttaggatga agcctggcat atatctaacc aggactaacg 18600
tgccatctct aggaggtaac acgctagctc cagctgggga cgagcgccta gaagccctcg 18660
tcctgacggg atggggcgag gcgtgcgtca gatcgcctgt cgccacctaa cccgcgatct 18720
gaccggtctg tgactggtca cagaccggat aaacgagtgc actgcacttc gttacatgcc 18780
gcgtgacacg ctcagccaaa ccgcaataaa tgtggttagg tgagccccgc tgtgctcacc 18840
taacccatac acgcggagca aaaacccacg aggggtcggg gcgcctcggc cctcggggcc 18900
gaggcgggtg cggtccgacc ccctcggggg gactaagagg agggcgaaca catcaccctc 18960
gggcccgacg tcccccgagg gtgccaggcc acgtgggcga ttgtgtctgc ctcaaacctc 19020
tagtcatgat actcctgatc ccatgtcacc gacagtagcc cccggcgtta tgccagggcg 19080
atcgccctct ttaagggaag cggtcgggcg tgacgccact cctaaggcct ggtgacaggt 19140
gggaccggtc tccacaattg ggcagaaacc caacggtcac aaatcacgca catcggcaat 19200
ggtaactcta ctatcaataa tgagcggtct cttcaagact gccacattac tcgagtagca 19260
cacgaatctg gacatggcga ttcgtttcgt ctggagatat ggtaacgtcg ctttggtcgg 19320
cgagcgtaat taacgcgcgc acgatatgat ctatctcgac tgccacaacc gcatatccac 19380
ctcatgcgcc gcaagcgggc gaatgggatt agtggaagcg tgggcgcgag aaacgagggg 19440
gcgaaatagt gggcgcgaga agcgaggagc cgggcacagc gttggcaaga gtataaaggc 19500
actgaggaaa ggatctgttt ccttcctttc gccatcattt cccttgtctt cgccgcttgc 19560
gccctaactc cttctttcct gtgctctact ttcgccacac gcgctcgctc tcaatcttct 19620
cttcctccgg cgccatggca cggggctccg ctctgctcga tggtagcgtg ctgccgcctt 19680
cccgcatcgt gagcgagagg caggctgggc tgccgcgccg cttcatgccg gaatctgcca 19740
ccggccggga gatagtcacg ctgggtgagg gacgcccggc gccagactac ccggggcggt 19800
ccgtcttctt tctccccttt gcaatggcag ggctggttcc gccattttct tctttcttca 19860
tggatgttct gaagttctac gatctccaga tggcgcacct cacccccaac gcggtgatga 19920
cattggccat cttcgcgcat ctgtgcgaga tgttcattgg ggtgcgccca tctcttcggc 19980
tgttccggtg gttcttcacc gtgcagtcgg tgtcgccgcc atcggtagtt ggtggctgct 20040
acttccagcc atgggggccg gtgctgaatc gctacatccc ctgcgccctc cgcaagaagt 20100
gggacgactg gaagagcgac tggttctaca cccccctcgc cgacgaagcg cgcctctgac 20160
ttccgagcca gcccccggcg caggcctcca gctggcgggc gccggtagat ctgggggatg 20220
gctatgacgc cgtcctcgac cgcctggcgg gcctacgatc ccaggggctc acaggggcca 20280
tggtgtacgg cgactacctc cgtcgtcgga ttgcgccgct ccagcggcgc gctcggggcg 20340
cctgggagta caccgggtcc gaagactaca tgaggaccca ccagggagtc agatgggact 20400
gggctcctga ggatttcaag atagtggtcc aacgggtgct gaatctcaac tccatggagg 20460
cgtccctcat tccccaagga atcctccctc tctgcagcga tccagaccgc gcctccatcc 20520
tgaccattat gacggcggtc ggggcctcag aggagtgagc tccaaagggc cacgacggcg 20580
caggcgggag ccgtaggggg gatcaatcta ccccgggagg gggtcgtgct tctgggtctc 20640
gcgacggagg cccgaggagc agccgccctg ccgacgcccg ggggaagagg aagcagggag 20700
gaacacctcc cccatctcct ccccgagggg gcggggcggt gcgtgccaac agcaggcgcc 20760
cggagggggc cgcgccgaca tcgcagcccg agggggagcg caagaagaag cggctccgca 20820
agatggggga gacagaacca tctcggggaa accttatttc ccctccaaag tggtcgttta 20880
accgaccccc tcgcaggttc gtctctcacc catcgtggct gtattcattc tctcaacgcg 20940
agttttcact cacccatctt gttcgtcttc tggtcttttc ttctgtttca gcgagatccc 21000
gtcgcgtccc tcccgccatt ccaagtccgg ccagtctgag gccgaggatc cggcggccgc 21060
agaggcccgg aggcgggaat ctgaccggcg agaggccgcg gatcgcctac gggaagccga 21120
ggaggccgcc caggaggccg cccgggctcg ccagggcgag gaaaccgctc gggaggaggc 21180
cgcccgggcc cgccaggccg aggaagccgc tcgggaggag gccgcccgag cccaccaggc 21240
cgaggaagcc gctcgggaga aagccggatt tcgccaggac gaggcaatgg cgacttccga 21300
ggcagctcgc gatgaggtcg cgggcgcgtc gcttgagccc gcttcctcgg gcgacgctca 21360
ggcgacaact tccggggcag ctggcgacga ggctgcgggc gcgtcgcttg ggcccactcc 21420
ctcaggcgac gcccaggacc aaccaggtct gagggacatc cccgagtccg gcacttccat 21480
cggcggcccg agccgcgtgg catcctctcc aaggcggctc ttccccacgc cttctatcgc 21540
cccgctgagc gcagagcccc ttctgcaggc cttggccgcc gcaaacatcg cggtgttgga 21600
cgggcttagt gcccaggtgg aggccctgca agcagagtgg gcggagctcg acgccgcgtg 21660
ggcgcgtgtc gaggaggggc ggcgctcagt ggaggccatg gtggaggtgg gccgcaaggc 21720
acaccgccgg catgtctcgg agcttgaagc ccgtaagaag gtgttggcgg aaatcgccaa 21780
ggaagtggag gaggagcggg gggctgccct cattgccacc agcgtgatga acgaggcgca 21840
ggacaccctc cgccttcaat acgggagctg ggaggcggag ctagggaaaa agctcgacgc 21900
cgcccagggg gtgcttgacg ttgccgctgc ccgagaacag cgggcggggg agaccgaagc 21960
ggcgtcccga cggcgcgaag agacccttga ggcgcgcgcc atggcgctgg aagagcgcgc 22020
ctgcgtcgtg gagagggatc tggcggaccg cgaggccgcc gtcactatcc gggaggcaac 22080
actggcggcg cacgagtccg cctgtgccga agaggagtcc gcactccgcc tccacgagga 22140
cgcgctcacc gagcgggagc gagctctcga ggaggccgag gccgcggcgc aacggctggc 22200
ggacagcctg tccctccgcg aggcagcgca ggaggagcag gcgcgccgca ctctggaatg 22260
tgtccgcgcc gagaggaccg cactaaacca gcgggccgct gacctcgagg cgcgggagaa 22320
ggagctggac gcgagggcgc gcagcggcgg ggcggctgcg ggcgaaaacg acttagccgc 22380
ccgcctcgct gctgccgaac ataccatcgc cgatctgcag ggcacgctaa actcgtccgc 22440
cggggaggtc gaggccctcc gcttggcagg cgaggtaggg cccggcatgc tttgggacgc 22500
cgtctcccgc ctagatcgcg ccggtcggca ggtgggcctc tggagagggc ggaccgtaaa 22560
gtacgccgcc aaccatggag gcctcgccca gcgcctctcg aagatggccg gggctctcca 22620
acggctcccc gaggagctcg agaagacaat taagtcatcc tcgagggacc tcgcccaagg 22680
agcggtggag ctcgtactgg cgagttacca ggccagggac cccaatttct ctccatggat 22740
ggcgctggat gagttccctc ctgggaccga ggacagcgcg cgcgcaggtc cgggatgccg 22800
ccgaccatat cgtccacagc ttcgagggct cagcccctcg gctcgcgttc gcccccaact 22860
ccgacgagga ggacaatgcc ggtggtgcag acgacagtga cgatgaggcc ggcgacccgg 22920
gcgtatcgga ttgatccccc aagcccccgc cattcttcag ttttttcttc ttttccttct 22980
tctaaggcct tcgggcctct tttttgtata gatcaactta atctgtaatc aaaaatgaag 23040
aaatttttgt gtcaatttca tcttgctgtg tgtatgagat gaggatgatc tgtgacgtgg 23100
tccttttgcg tcttagcttg attaagggct cgtgcccagg tcccagtcct caaaaggcgt 23160
gggtcggggc tagtgcctgg ggagatccac atgtcgagac tggccaggcc gggaacgtgg 23220
tgaccgaggg ttatgggtga cccgattgtg ggtttttgcc gattcccccc cggagttcac 23280
cacgccccgg ggcacggctc ggttctgggc cccgtttggc gattttagcc gacccgagcc 23340
cccgagggca ggattgagca cgagtgacct atttcaagtc aagattcttc aaaaggaaaa 23400
aaaaacacag atacagcctt taggaaattg aaactgcttt tattgaaata ctgaaataag 23460
agaaataaga atgtgcatgt gtggcagccc ccggccaacc ctgcacgccc gagggggtgc 23520
ggggttggcc cgagcccgaa acctgacacc cgaccccccc cctcaggggt agaagcgacg 23580
aaggtgttcg atgttccacg ggttaggcag ctcaatgccg tcgcccgtgg ccagccgtat 23640
ggagcccggc cgggggacgc cgaccactcg atacggaccc tcccacattg gtgagagctt 23700
gctcaatcca gcacgcgttt ggacgcggcg taggacgagg tcgtcgacgc agagtgatcg 23760
ggcccggacg tgacgctgat ggtagcgccg caggctctgc tggtagcgcg cggctctgag 23820
ggccgcgcgt cgccttcgct cttccaagta gtcgaggtca tctctgcgaa gctgatcttg 23880
atcagcctcg cagtacatgg tggcccgagg agacctcagg gtgagctcgg atgggagaac 23940
cgcttccgcg ccgtagacga ggaagaaagg cgtttccccg gttgctcggc ttggtgtagt 24000
tcggtttgcc cagagcaccg ctggcaactc ctcgatccat gaatcgccgt gcttcttgag 24060
tatgttgaag gtcttggttt taaggccttt gaggatttct gaattggcgc gctccacttg 24120
gccattgctt ctggggtggg caggtgaggc gaagcagagc ttgatgccca tgtcttcgca 24180
gtagtcgccg aagagttcac tagtgaattg ggtgccatta tccgtaataa tacggttagg 24240
cactccaaac cgggccgtga tgcccttaat gaatttaagt gcggagtgct tatcgatctt 24300
gacgaccgga taagcctcgg gccacttagt gaacttgtcg atcgcgacat acagatactc 24360
aaacccgccc ggggcccgcc taaacggtcc caggatatcg agcccccaga cagcaaatgg 24420
ccacgaaagt ggtatggtct gcagggcctg ggccggctga tggatttgct tggcgtggaa 24480
ttgacacgct ctacatcgcc ggaccaggtc gaccgcatca ttgagagctg tcggccaata 24540
gaaaccctgg cgaaaagctt taccaaccaa ggtgcgcgag gcggagtggg ctccgcattc 24600
gccttcatgg atatcggcaa gaagcacaac gccttgttcc cgaggaatgc acttcaggag 24660
gattccatta gccgcgcgcc gatagagggt cccttctacc agcacgtagc gtttggagat 24720
gcgatggacg cgttcactcc cttcgcggtc ctcgggtaaa gtcttatctg tgaggtatgc 24780
ttggatctcg gcaatccaag caatcaatct aagggagctg ggagcgctcc cctcgggtcc 24840
cgaggcctgg acttcaacgg gcctcggggg ccggtcaggc gcgtccgtct cccctaaggg 24900
gtcgggtcgc gccgacggct gggcaagcct ttcttcaaag gcgcccggtg gggtctgggc 24960
tcgcgtggac gcgagccgtg agagttcgtc ggcaatcatg ttatcccgtc tgggcacatg 25020
ccgaagctca atcccgtcaa aatggcgctc catacgccgt acttggcgca cgtaggcgtc 25080
catctgcggg tcagagcacc ggtactcctt acagacttgg ttaacgacca gctgggagtc 25140
gcctaacacc aggaggcggc ggatccccag tccagctgcc actctgagtc cggcaaggag 25200
tccctcgtac tctgccatat tgttggtcgc tcgaaagtcg aggcggacca agtatctgag 25260
gacgtctccg ctcggagagg tcaacgtgac ccccgcaccg gcgccctgaa gagacaggga 25320
gccgtcgaac tgcattaccc agtgggcggt gtgaggcagc tgcgaggggt ccgtgctggc 25380
ctcggggatt gagacgggct cgggagccgg ggtccactct gccacaaaat cggcgagagc 25440
ctggctcttg atagcgtggc gtggttcaaa gtgcaaatcg aactcagaaa gttcgattgc 25500
ccatttcacc acccgtcctg taccgtctcg attatgcaag atttgaccga gggggtaaga 25560
cgtaaccaca gtgacccgat gcgcctggaa ataatggcgc agtttcctcg aggccatcag 25620
aatagcgtaa agcatcttct gggcctgagg gtatcgggtt ttggcgtccc ggagggcctc 25680
actaacaaag tagacgggcc gctgcacctt tcggtggggc cgatcctctt cgctaggggc 25740
cgcatccctg gggcactctt cgtccaagca gcctcgcggg gcgcacttgt cttctgtgct 25800
gatgacctcg gggtcggagg ataacagggg cggccttccc acagtggctt tggggccgtc 25860
ctgggggtca ggggctcctg gcgtcgtcgg acaagcgggc aaagggccaa ctccggtcgt 25920
caggggcctt aggcctccgt tcggctcggg ggcctcttct ccctgctctt tcccgggtcg 25980
agtcagcaca gggttagcct cggggtcaaa gggcgatagg tgcggccttc ccacagtggc 26040
ctcagggcct tcctgggggt cgggggctcc tagcaccgtc tgacaagcgg gcagagggcc 26100
aactccggtc gtcgggggcc tcgggccacc gttcggctcg ggggcctctc ctccctgctc 26160
tctcccgggc caagtcggca cagggtgggg aagcgcgaaa tgagaattgt cctcatcgcg 26220
ctccacaacc aatgccgcac taactacttg cggggtcgcc gctaagtaga gtagcaaggg 26280
ctcgtctggc tccggggcga ccagaactgg gggagagctt agatacgcct tcaactgggt 26340
gagggcattt tcagcttcct tcgtccaggt aaacggtccg gagcgtttga gaagcttaaa 26400
taagggtaac gccttctctc ccagcctcga tatgaaccga cttagggcgg ccatgcaacc 26460
ggtgacgtat tgcacatccc taagtttgct gggggggcgc atccgctcta tagcccgtat 26520
cttctcgggg ttggcctcaa tgccccgggc agagaccaag aacccgagaa gcttgcccgc 26580
aggtacaccg aacacacact tatcggggtt taattttatg cgggcggagc ggagactctc 26640
aaaagtttcc gctagatcta tgagtaacgt ttcctggttg cgcgtcttta caaccaagtc 26700
atcgacataa gcttcaatat tacgtcctaa ttggctaccc aaagaaattc gagtagtacg 26760
ttgaaaagta ggacctgcat tctttaaccc gaagggcatt gtcgtataac aataggttcc 26820
tatgggggta atgaacgcag ttttttcctc atcctcccta gccatgcgaa tctgatggta 26880
accagagtat gcatctagaa aacacaaaag gtcgcacccc gcagtggagt cgacaatctg 26940
atctatgcga ggcagggggt aaggatcctt aggacatgcc ttgttaaggt cggtgtagtc 27000
gatgcacatc cgaagcttgc cgttcgcctt gggaacgacc accgggttcg ctagccactc 27060
ggcggggttg acgctgccat catatttttc ggcgatggtg ggccggaacc ttgggggcca 27120
acggacattc cgaagactcg ccacaaaggc tctacagccg acaccaccaa ccgggggcac 27180
ggagggctga ttcccgcgtc cgtgttgagg tgacactctg gacgaggaag cgccctccgt 27240
tgcgtgggca gcacttcggt cattacgccg gcgctcgatg ctggtgcggg cgtccggccc 27300
cccacgcaga tctttctggg tcgaaggagt cgacgaagga gtggcggccg aatggcgaac 27360
agcggctgcc gctcgtcgtg ccctccgtct tgacgacgcg gagccggtgg tagcagcacc 27420
agaggccttg gtggcggagg accgcccacc agcatctagg cgctgccgta ccgtcatgac 27480
taatttggcc acgtcgtcca gccatcgttg ggctggagac tccgggtcag ggacgacagg 27540
cgggtgacgt aagagcgcgc ccgcagcttg gagcgcgccc tggggcgtgc tgccgtcgcc 27600
gtagacgagg aggcgacgct ccccatctcg ccgttcttct ccatcgcccg cgatcggtga 27660
agtcgcggat ctttcgaccc tctcgagcgc ctccccccgc ttaggacttt ggcgtggagg 27720
gagcggtgga gtacgagctc gacggcgtgg gttcggctcc ccgtcgtcgc cactcacact 27780
cggagagagg tcgtgcgcct ttgcttgctc ggccatcagg ctgaacagga aaagcttggc 27840
gcacacggaa gagtacgaga gctcagaaaa acacacactg agtcccctac ctggcgcgcc 27900
agatgacgga gcgtggggct cctcaccggg agaccgcgca ggcccccctt tgccggttcg 27960
gccggggact cagggtgaaa ttctaagctc tctgtatgtg gaaggttcgc gaccgtcgaa 28020
agagcataag acacgggcga tgtatacagg ttcgggccgc tgagaagcgt aataccctac 28080
tcctgtgttt tggggggatc tgtgtatgaa ggagctacaa agtatgagcc agcctctccc 28140
ttgttctggg ttccgaatct ggaaaagtcc agtccagtcc ccccctctaa gtgggcaagg 28200
tcctcctttt atatcttaag gggataccac atgcaccatc tccctccttt ctgtggggac 28260
ttaccctacc ttttcataaa tggacggaga tttgtatagt tgccgtccga atgaccttct 28320
gataggacgg cccataccta cctccacttc cgccgaaagc aggtgcgacg tgggattatg 28380
gctgtctgct gacgacatga ccagtgtcag actggtcaca aattgctcat tcctgtccac 28440
cacgcgtcag tttagcaatc tacatgttgg cccttcttca cacaacatct tgcctgtaat 28500
ggttaggatg aagcctggca tatatctaac caggactaac gtgccatctc taggaggtaa 28560
cacgctagct ccagctgggg acgagcgcct agaagccctc gtcctgacgg gatggggcga 28620
ggcgtgcgtc agatcgcctg tcgccaccta acccgcgatc tgaccggtct gtgactggtc 28680
acagaccgga taaacgagtg cactgcactt cgttacatgc ggcgtgacac gctcagccaa 28740
accgcaataa atgtggttag gtgagccccg ctgtgctcac ctaacccata cacgcggagc 28800
aaaaacccac gaggggtcgg ggcgcctcgg ccctcggggc cgaggcgggt gcggtccgac 28860
cccctcgggg ggactaagag gagggcgaac acatcaccct cgggcccgac gtcccccgag 28920
ggtgccaggc cacgtgggcg attgtgtctg cctcaaacct ctagtcatga tactcctgat 28980
cccatgtcat cgacaaggcc atccgaatgt attaaggagt aaaagttaca agaaaaaaca 29040
ccacaatgca ccaaggtgca tgaccacaca ccatacacta cccccaagca caaaccactg 29100
agggtgaagc ctagcaccaa acgaccgcca ctaagtgtga ccaaacgccg ctaggcctac 29160
ggcagcaaca catagatgag acttcgaaaa cgatgccacc aaggtggtca cgacatgtag 29220
gatgctgcca tcgtccatct aaaaagatgt ggttttcacc cagagaaact catcaagaag 29280
gggagagggt aacccttgac agcgccccaa ggaggttacg acgcccgaag gcgtagccgc 29340
tgccggtccg gtgaaccacc ggactaggct tccgcctagg accctatagc cttgatcgca 29400
gatcaccgtc caccactcag aaccaccaca cagacaaaag gtagcacgta gcttccaccg 29460
caccgcaccg acgccccttc gtcggccgac tccatcgaac caccatccct gagagctggc 29520
ccaggacccc tccgttccac cacccgccgg ccgccttgcc agttttggcc aaaggagaac 29580
ccgggactgg gtgacattgc ttcggcagcc tgagcttccc ccgctggcga gctgctgtct 29640
caatccaacc tagaaactcc ccgcaaaaga aggggatgag ctctaggaag ggcgagggtg 29700
ccgaccggca acgaggaaga caacccatcg actccagctc cctttgcact accatctggg 29760
cctgcgccaa tgccggatac gctgtcgctc cggctccggc gccacccacc tgcaccccct 29820
ttgcctggtc tccgcgcccc tcctggctgc gtcgcgccgc ccagctggcc gctaagggca 29880
ccacgacggc cgcccggcta ccgaggcctg gccgcgccat gggacagctc gcgctggcac 29940
cagcgagcca cggccgtcgc gctgttgccg gcgccagcga gcacaaccgc cagctccaag 30000
ggccgagcat gccactgagc cgccgccgct gccgcccggg ccggctgcac gtcaccggcg 30060
cacacgaccg cacgccgcca cgctccgcct ccgcgcccga ggcagcccca tgccattgcc 30120
gcgcacctcg cccgcccgct gccgagccgc caccgcgcac cttgctgagc cgccaccgcc 30180
gtccctagcc gcctcgtgcc gccgccacgc cagatccagg cgcgggatgg ccggatccgg 30240
ccttgggggc gccggatccg ccgcctcccc acaccgccac ggcgtcacca cctccgaccg 30300
cagtgagggc ttcgtcgttt gccccatcct catcgcgtcg aggaggaaga cgccaagaaa 30360
aaagggcctc gccgctgcct tccttgctcg ctgccggctt cgccgccggc gagctccggc 30420
ggcggcgagg tgggggagaa gaagtgggga gtgggcagct agggtttttt cgccccccaa 30480
gccgcccgtg cgagagcgac ggtggggggg gggggacttt ccaacctctt ccagtgttct 30540
agttctccac gttatgtaac tcaatttgtt taaccataga aagtaagaaa cctaccagcg 30600
tgttaagctc tctttcattc cctttcttct tcctggtttt gcttccatca catgtcaagt 30660
gaagggttct taactaccat tactcctaca catctaattt ttttctcaga tctttcgcag 30720
gtatatattg atgctacatt ttatgatctt aagataatct ccttcacatt accctctgct 30780
gaaactttag cttgaaccgt catcttcacc acaatttgag cccaatttgc acagagcaca 30840
acgagcaata gcttgccctt acgttcatta tttagcatga actactacta actacccaag 30900
aatcaataca ccggtttaat aacgccattt tatcacgtta atatatgttt cattcaacac 30960
accggttttg gcacagttgc aaacttgcaa taaattcttt cctacttctc catcccataa 31020
tataacaaat tggtatgtct cgtctggtac taagttgcta tattatgaga tggagggagc 31080
acttcttttc ttccaaaata taagaatata gtattggatt agatattatc tagattcacg 31140
aattcgatta ggttgtctag atttatagtt gtatgtaatg tataattcgg taataggtta 31200
ttacctctcg ggatggaggg agtagttttg actttttttt ttcttataaa tcgctttgat 31260
ttttatatta gtcaaatttt atcgagttta actaagttta tagaaaaaaa ttagcaacat 31320
ttaagcacca cactagtttc attaaattta gcatggaata tattttgata atatatttgt 31380
tctgtgttaa aaatgctgct atatttttct ataaacgtag tcaaatttaa ataagttaga 31440
ctaaaaaaaa tcaaaacgac ttataatatg aaatggagga agtagtagac tataacaaat 31500
ttaaaccgtg ctttgatttt agagcatcac taatatgtta gcaataatct atccctaaaa 31560
tttatttttt ttcctaaact gaaaatagga agtggaaata ctcctccatc taagagagag 31620
cctaaattca ataaaaaact aaaaaactaa aggtggatcc ctctattaaa ctaccgcaaa 31680
aaatttatgt tttttttctc ttccacgcgc gcagaacaga tatctcgatc aagttagcat 31740
gtaaaatttt taaagagata ccttatacga ctccttccgt atttccaaaa gcaaacggat 31800
ttaaaatctg actcaaataa agatctatat atccaattta catgacacat gtttcgccga 31860
atttttatat taataataat taatattttt aaaattaaat tattagcaat ttgtttggag 31920
gatttatcaa aacaggatgg acgttgttta taacagcgtc tagacctaga cgcgcttgca 31980
aactgcggcc acccttttat cacacaaatt tttgacaatt tgacactttc caaaaattaa 32040
ttttataaat taaccgtgac caaaacttat ttaaaaataa tctttttgtt gagcgcaaaa 32100
tcgtatactt cagcgccaaa tagcacggcg ccgacctccc ccttcccctc ccctctatcc 32160
tccactgctg ccgcccacct ctccgtatca gctgcgtcgc gttggtttcc gccggcgctg 32220
ctgctgctgc accagtccgc tagggcgggc gggcatggcg cgccgcgccg cttcccgcgt 32280
ccgcgccggc gctgttggcg cccttcgctc ggagggctcg acccaagggc gagggggccg 32340
cacggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccggcgtgg 32400
caggggcgcc tcgatctacg gcttgaactg cgccctcgcc gacgtcgcgc gtcacagccc 32460
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 32520
caacttgtgc acctacggca ttctcatcgg ttcctgctgc tgcgcgggcc gcttggacct 32580
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 32640
cactcctctg ctcaagggcc tctgtgctga caagaggacg agcgacgcaa tggacatagt 32700
gctccgcaga atgacccagc ttggctgcat accaaatgtc ttctcctaca atattcttct 32760
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctcc aaatgatgcc 32820
tgatgatgga ggtgactgcc cacctgatgt ggtgtcgtat accactgtca tcaatggctt 32880
cttcaaggag ggggatctgg acaaagctta cggtacatac catgaaatgc tggaccgggg 32940
gattttacca aatgttgtta cctacagctc tattattgct gcgttatgca aggctcaagc 33000
tatggacaaa gccatggagg tacttaccag catggttaag aatggtgtca tgcctaattg 33060
caggacgtat aatagtatcg tgcatgggta ttgctcttca gggcagccga aagaggctat 33120
tggatttctc aaaaagatgc acagtgatgg tgtcgaacca gatgttgtta cttataactc 33180
gctcatggat tatctttgca agaacggaag atgcacggaa gctagaaaga tgttcgattc 33240
tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc ttcaggggta 33300
tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg tacgaaacgg 33360
tatccaccct aatcattatg ttttcagcat tctaatatgt gcatacgcta aacaagggaa 33420
agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga atccggatac 33480
agtgacctat ggaacagtta taggcatact ttgcaagtca ggcagagtag aagatgctat 33540
gcgttatttt gagcagatga tcgatgaaag actaagccct ggcaacattg tttataactc 33600
cctaattcat agtctctgta tctttgacaa atgggacaag gctaaagagt taattcttga 33660
aatgttggat cgaggcatct gtctggacac tattttcttt aattcaataa ttgacagtca 33720
ttgcaaagaa gggagggtta tagaatctga aaaactcttt gacctgatgg tacgtattgg 33780
tgtgaagccc gatatcatta cgtacagtac tctcatcgat ggatattgct tggcaggtaa 33840
gatggatgaa gcaacgaagt tacttgccag catggtctca gttggaatga aacctgattg 33900
tgttacatat aatactttga ttaatggcta ctgtaaaatt agcaggatgg aagatgcgtt 33960
agttcttttt agggagatgg agagcagtgg tgttagtcct gatattatta cgtataatat 34020
aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac tctatgtcgg 34080
gattaccgaa agtggaacgc agcttgaact tagcacatac aacataatcc ttcatgggct 34140
ttgcaaaaac aatctcactg acgaggcact tcgaatgttt cagaacctat gtttgacgga 34200
tttacagctg gagactagga cttttaacat tatgattggt gcattgctta aagttggcag 34260
aaatgatgaa gccaaggatt tgtttgcagc tctctcggct aacggtttag tgccagatgt 34320
taggacctac agtttaatgg cagaaaatct tatagagcag gggttgctag aagaattgga 34380
tgatctattt ctttcaatgg aggagaatgg ctgtactgcc aactcccgca tgctaaattc 34440
cattgttagg aaactgttac agaggggtga tataaccagg gctggcactt acctgttcat 34500
gattgatgag aagcacttct ccctcgaagc atccactgct tccttgtttt tagatctttt 34560
gtctggggga aaatatcaag aatatcatag gtttctccct gaaaaatata agtcctttat 34620
agaatctttg agctgctgaa gccttttgca gctttgaaat tctgtgttgg agttcttttc 34680
tcctacagtt gtattagagg agggatcttc tctttatgtg taaatagcga ggtatgtatg 34740
tcacctctcc gaattatttt tactctggtt cctagacggt aaacaagcaa ttatgttctg 34800
cctttgatgc cagaaaaaac acaaaagttt gtcgttatct ctactaacgg atcataaagg 34860
aatttgtaac tggagtttca aacttaattt gtctaggcag tagttttggc attagatcca 34920
acattgtgta ggattcattt gtgtgtatca atctataggg tttcattaaa tttcgttaat 34980
gtgtactgtt taggtgttga atagtttgac ttgtttttta actgaacaaa agatactgaa 35040
atcgttccat tcaacaaaca catgttccgt taatgaaatt attgtacgtt accttttgtt 35100
ttcttactca caagtgtcct cttttcttat atcctataga ttggtacaac aaattattga 35160
ttcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 35220
attcattttg tgaagtgatg tgagtacctc tcaatcccat ccttatgctt ctgtgcatgc 35280
ttcattccaa ttttttacgc atatcgattg ttttctttta tataacagtc cataaagata 35340
atcacatcat gacaaagtta tttatttcta cagtatagtt atataagtat tcaccagttt 35400
tccatgaata ttttggcatg tgattacaaa gaagattatt tgagaaaatc catgctttta 35460
tttcatcttt ttgtttgaag ttgaacttta atttatggtg taaatttcag ttattattgc 35520
tagcagctcg tactctttaa tggtataact tcacttgtgc ttattctcca atatctccct 35580
tcttgttgtt caggttcaag aaaatcattt gttggattca gaatctggtg tccattttct 35640
tcttaaatta ttaaatcctc cagtgaatct tgttgattcc aaagcaccat cgataggttc 35700
caaacttctt ggaatcagta aagttcaaat gcttaatgga tcaaataagg attctgactg 35760
catttcagag gaaatccttt caaaagttga agagattctc ttaagctgtc aagtgatcaa 35820
gtcgctcgac aaagatgaca agaaaacaac aaggccagaa ctgtgtccaa agtggcttgc 35880
tttgttgaca atggaaaatg catgcttgtc tgctgtttca gtagagggta agttttaatc 35940
aaatttcttg gtcatgattt ccctttatga ccattatatt tatttatatg agccaaataa 36000
gcagttgtca acttgtcata agttacatag cacctatttg caatattcat gggtggtttg 36060
cttagccctt ttcttcacct gcttttgatt gatgacttcc atctgtgttg cagaattgaa 36120
ttggagtagt ggactgcact agaagcacct atggccattg tcatactagg aaggttttcc 36180
cttatcaaat atttgattgt tacagagact tctgacacag tgtccagagt tggaggaaat 36240
tttaaagaga cattaaggga gatgggaggt cttgatagta tttttgacgt tatggtggat 36300
tttcattcaa cattggaggt gagatctcgc taacatcgca tattttacat ttcctttgtt 36360
caactctaat ggattgtgca ggcttgttcc ttttcgccat tttagcttta atgtgcttga 36420
agccacatga aagtaatgct tgtccagata catagccaaa ggttgttata ttttggggca 36480
tggaaaatgc ttgaggtagt aactattttc atcaggacat ggaaaattgg ctgcaacaca 36540
aattatgttg ttttatgttg caaaaatagt tttttaatac ttttttattc tgcatgtggt 36600
gttagtatct tacagttcct ctgatgatta tatcccccac gataataaca cttgaaacga 36660
taataacact tgacatatct acaccaagtg aacattattc atttggatgt tacttttcca 36720
gctatacttg ctgttcttgc atgtgtaagc aagtttggag taaattgcgc attaatttaa 36780
atgcttggtg ttcctatctg tgtacttttt attccccaac taataatgca atcatattac 36840
gctgataaac tgaataaata aattaacaat atacttctgg tggcaaacct tgtgtatcag 36900
aatctcataa aggatacatc cacttcagct ttggaccgaa atgaaggaac atctttgcaa 36960
agtgctgctc tcctcttgaa atgtttgaaa atattggaaa atgccatatt tctaagcgat 37020
gataacaagg taatgctcct tatatgttct gtttcagttt agtacccatt tccttcttct 37080
gtactatctt ctctcctgat ttgttctgtg caaaatgtgc aaacagtgcg actttgtatg 37140
tctgcttaac aattttcttt tcttcctgaa aaagcaatat gaactcttac attcattttg 37200
cttcttgcag acccatttgc ttaatatgag tagaaaattg aacccgaaac gctccttgct 37260
ttcttttgtt ggtgtcatta tcaatactat tgagttatta tcaggtattt ttcttaataa 37320
tacaatgtgt tcgctaacac aataaaatgt tttaaacatc cagtatgtta aagttgcagt 37380
ctgacgccta ttttgttttg ctgcagctct ttcaatactt cagaattctt ctgttgtttc 37440
cagctctaca tatccgaaat cgtctaaagt ctctcaacag agttactctg gtaataacaa 37500
acaccaattt tgtttgatca gttgatctcg ttggcttttc tatgcactgt ctcaatatag 37560
tttggtcgcc attcaagtct cactacagat gttgaacttg gcctgacacc aaatatttat 37620
aaaatgctac ctgatatttt taatatttca tgtttcctga cccagattat cttgttggtt 37680
cctcgtataa gtttaattag tgacattctt gaagctttgt tatgcagcag atgtcatggg 37740
gggaacttca tttaatgatg gaaagagcaa gaactcgaaa aaaaaaaact tttgtcgaac 37800
cagacacgtc attgttgctt atcttcaaaa tcagaagttt ctcatattac tatatcttct 37860
ggtagtgatg ctggtctgtc acagaaggca ttcaattgtt ctccatttat atcaagcaat 37920
ggggcatcaa gtggttcatt aggcgagagg cacagcaatg gtagtggttt gaagttgaat 37980
ataaaaaagg atcgtggcaa tgcaaatcca attagaggct caactggatg gatttcaata 38040
agagcgcaca gttctgatgg gaactccaga gaaatggcaa aaagactccg tctatcttaa 38100
aatgtaatca ccgacagtgg tggtggtgat gacccttttg catttgaccg ccgcgtcggc 38160
gtcgccacca cgtaatcgcc cacgtcgctg cccccgctgc cacgtcgtcg accgcgcacg 38220
gtaatcacac gcatctcgag gccgccgcta gctgatatct tctcatccgg ttgatttgtg 38280
attttggcgt ttttgcagtg gtgatggcgg ggggcgaccg tggccgaggc gtggagtgcc 38340
atccgcatca gggtgtatcg gccgcgctgc tccgccctgg tccgcaggct ttggcggcga 38400
gctggcggcg gagggagact gtggtgagat cggatttcgc cgctggtggt gtcgctacca 38460
tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct tccctttttt 38520
attttttttt ctcgcaaaat gtgttgtgat gttcgtctcg ctgggcaggc ctcatagcca 38580
ttaatgtagt ttgctggaac atttacattt ggaacgttgt tggcaattgc ttgacaaaat 38640
gtggaattgt ggaggggaga aaaatcattt gaacctgcag tgacaaaatt gccatctcta 38700
attttaaaac tgaaggtgtg gaaatcaaac ataatcattg ccagcgcatc attcttgtta 38760
accaccatga tatattgttg gttataacag ttagctccac accaaccttg aaggtgtcaa 38820
tagaatgttt agtataaatt gaggagaaca ggcagttgtt aagactttct aaagaacttg 38880
tagcagctaa tactagctat tgtgcatttg tgtttcatgg aatttgagca gcaatggata 38940
tttcttacta agatgtatga tgcaaaacaa aaaactatgt ctatacagtt tacatgtaat 39000
gtgcggatgc aaataaaatc atgtacatgg acaaactcat gggattcata ccgaattcca 39060
gaattgcatt tcttatgtgg ttacttttgt tgttgatttg gttaccagac atcgatgtga 39120
tttcaagggt cagaggggtt tgcttctacg cggtggctgc agttgcagca atctttttgt 39180
ttgtcgccat ggttgtggtt catccacttg tgctcctatt tgaccgatac cggaggagag 39240
ttcaggaaaa aaatttgaaa atacccattt tttgaaaaag atttacgttt atatacacta 39300
gtatgaagaa tttgcgaaaa tataactaat ccgcagatcg gttatgcggg agcgcaacaa 39360
aagtatggcg tggcggcgcg gagtggacgg ccgaggcgtt cgcgcggaat ggggctgcgg 39420
gaccgagcca gtctcgcttg ccggtaacgc ggaaccggta cgctcccgca gcgccagtgt 39480
gcggaaccgc ggcgccaaca tttttttact gcatggcact gtgtttaata ctgtttgaca 39540
ctgtttctgg tactgtttta cacagttccc gggtcagttc cgcacaatgg aggcgcggca 39600
ccgaccatga acaatgtgtg aacagtgctg cacagggtta aaacagtgta taaactgcgc 39660
tgcacagtgc tggagtcgct ggccactgcg gttccgcgtt ttggaaccgc gggaccgtcg 39720
cgattccgcg ttttggagct gccggaccat gacggttccg cgcaggatcg tcggtcccgt 39780
attttgaatc tgcggaaccg tcgctgtccc gcgtttccgt ttcgcgggat gcgtatattt 39840
ttataaaacc tctccatgca tgtatataaa cataaattat tgaaaaaata agtatatttg 39900
caaatttttt tcgagagctc agcactacat tgcaaagatt tgggcaactc tgacaatttc 39960
catgttctac aagcttgacg tcgagggaat ggagaacctg ccaccgaata gtagccctgc 40020
tatctatgtt gcgaaccatc agagtttttt ggatatctat acccttctaa ctctaggaag 40080
gtgtttcaag tttataagca agacaagtat atttatgttc cgaattattt gatgggcaat 40140
gtatctctta ggagtaattc ctttgcggcg tatggacagc aggagccagc tggtatggct 40200
gtagtctcat ccctgctttc ttaagtagac atatatgcaa ttacagaatt tggtaaacaa 40260
acaagatttt atgaatcata tatgattttg gggaaaacac caaactctct ttggtggctg 40320
ccttgaacat agttctattc acacagttat agcaccttct ttaaaatgaa gaactttgtt 40380
gcatacacat atggccaaac cacataatga attttgttta tttctatctt tgaatgttag 40440
caccttattt tcatgcatat catgctaatt tgcttgccca cgttgagtgg gaattttttt 40500
ccatgtttta taatttatat atgttctaga cttctagtcc acaatttatc tacttcatgt 40560
tcctgagcct ctagtatggc tggtagcaga ctaggtgctg agtgctgtcc atttttgcag 40620
actgaagaga ggagaaatac aggactgtcc gttgttagtc agatttgtaa aaatagactc 40680
tgatgtagtt tattttagcc cctattttat atttaacaat acaaatatat aacgtatcct 40740
aagaacttat cgtaatttag gagaagttgc tcgtttcatt aaattaaact gtgaagtaaa 40800
aatgtgtgct cgagtctgtc aatgcaatcc tgtgttcttg tttgaagata tggtgtaggg 40860
caggctagga tcgaacactg aatggtaaga ctgcttctgc cttcatttgt gcacttggtg 40920
ctgccacgcc gattaagcag tagaacaaag taattttgtc gtgcacaaat gagttatatt 40980
tcattgaaaa tcgaagtgaa aatgaaccaa aagatagaag aaaaggggaa acttggtaat 41040
tatatactcc acaaatttat tggtaagatt tgatattaga cgctcgatta cttggcttaa 41100
gttaaggata tcaaatttgg ggaagcacca aaggaattat tgtgaaggag ttgtgggtgc 41160
ataacgttat ctactaggtt caaatcctag tgactatgaa tattaatgag taaggtaagg 41220
gatttattgt taattttagt ttctttaaga ttgtgtccgg gtacaccatt cggtaagtgt 41280
aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgatttacct tttcatttgt 41340
ttctgcgttc tgggtatgaa tttgacgaga ttccatggtc agctcaacat atcagttact 41400
gcgtgtcaag cgatcttata tggtatgcgc acaagcgatt gtatacggat atgacagtat 41460
aacgtgtgat attgatacga tgttcctttc ctttataaag gaacaaagac ttttttaaaa 41520
aaaagaaggg gtattactaa aaaccaaaat gtcaaaaaca aaatatcagt gcacatggca 41580
agtgtgcacg agcaatagct tgcccttacg ttcattattt agcatgtact actactaact 41640
acgcaaaaat caattcaccg attattaaac tgttaacatc attttagcac gttaacatat 41700
gtttcattca acacaccggt tttggcacat ttacaaactt gcaaagttgc aatactccct 41760
tcgttacata gcataagaga ttttaggtga atgtgacaca tctatccaaa ttcattatac 41820
tagaatgtat caccgcctcc acgccgggag ggagagcgcc gccggtggag aaagggggag 41880
ggagtggtcg aggggaacca gtagggtgcc ctccccgtcg ccgcctcccc gtggccgcgc 41940
cggcgagaca ggaggaagag ggggatatgg agcggcgccg ccggtgaggg cgcgcgcgcg 42000
ggggggagcg gcgacgccgg tgaggaaggg aaggggagtg gtggctttga gagagatagg 42060
ggggaggaaa aatgatttta gagttagggt ttgggctgct gagtttttat atagatcggg 42120
atcaatcagg accgtccatc agatcggaca actacggctt ctcccgcgtt gggccgggtg 42180
ccactcctag gttgcccaca ctattgggcc acatgtacgc tccgcgtgaa ataagttcac 42240
tttaggtcct ttaagttgcc tctgaattgt tcccaggccg gccgcactat tgggccaccc 42300
cataggccat gtgtacgctc cgcacagaat aatttcgctt tagctccctt aatttgtccc 42360
ctcaaactcc taaaaccagt gcaaatcttt aatttttagt tcacccattg caactcacgg 42420
gcatatttgc tagtgacata taatatgaaa cgaaggatgt agcagactat agaatttaaa 42480
ctgtgctttc attttagagc atcactaact gttatttaga tttttattta aataaatgct 42540
gaaatgatgt ttttattatg aaaattagca ataaagctcc caaaatttca aaaaaaaatt 42600
aaaagagatt tattaatcat ggttaattta attaaaaatt aaatctaacc atatcatatt 42660
atttcacggt ccgtgatgag gaaatggcag ctgctatcac ttacggtggg agagaagggg 42720
cattgtttat ttttataact atctcttata actcccatga aactataaaa taaatataat 42780
cattatcata acattagttt tttttccatt gcaacgcaag ggtaattttt cagtacaata 42840
aaaaaaataa aagtgggcca ttctgaacgg aaatttctgg ttttttttcc caagagcgcc 42900
gcacacaact gcgcaagaga tcgatcgcga tcaccctgct cgtcgccgat ctcctacacc 42960
atccctgcca tctccttccc ctccactggc tgctgctgca cctgtcagct agggcgggca 43020
tggcgcgccg cgccgcttcc cgcgctgctg gcgcccttcg ctcggagggc tcgatccaag 43080
ggcgaggggg ccgcgcgggg ggcagtggcg gtggcgcgga ggacgcacgc cacgtgttcg 43140
acgaattgct ccgtcgtggc ataccagatg tcttctccta caatattctt ctcaacgggc 43200
tgtgtgatga gaacagaagc caagaagctc tcgagttact gcacataatg gctgatgatg 43260
gaggtgactg cccacctgat gtggtgtcgt acagcaccgt catcaatggc ttcttcaagg 43320
agggggatct ggacaaaatg cttgaccaga ggatttcgcc aaatgttgtg acctacaact 43380
ctattattgc tgcgctatgc aaggctcaaa ctgtggacaa ggccatggag gtacttacca 43440
ccatggttaa gagtggtgtc atgcctgatt gcatgacata taatagtatt gtgcatgggt 43500
tttgctcttc agggcagccg aaagaggcta ttgtatttct caaaaagatg cgcagtgatg 43560
gtgtcgaacc agatgttgtt acttataact cgctcatgga ttatctttgc aagaacggaa 43620
gatgcacgga agcaagaaag atttttgatt ctatgaccaa gaggggccta aagcctgata 43680
ttactaccta tggtaccctg cttcaggggt atgctaccaa aggagccctt gttgagatgc 43740
atggtctctt ggatttgatg gtacgaaacg gtatccaccc taatcattat gttttcagca 43800
ttctagtatg tgcatacgct aaacaagaga aagtagaaga ggcaatgctt gtattcagca 43860
aaatgaggca gcaaggattg aatccgaatg cagtgaccta tggaacagtt atagatgtac 43920
tttgcaagtc aggtagagta gaagatgcta tgctttattt tgagcagatg atcgatgaag 43980
gactaagacc tgacagcatt gtttataact ccctaattca tagtctctgt atctttgaca 44040
aatgggagaa ggctgaagag ttatttcttg aaatgttgga tcgaggcatc tgtcttagca 44100
ctattttctt taattcaata attgacagtc attgcaaaga agggagggtt atagaatctg 44160
gaaaactctt tgacttgatg gtacgaattg gtgtgaagcc cgatatcatt acccttggca 44220
ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct 44280
aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac 44340
gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat 44400
aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat 44460
gtcaggatta ccgaaagtgg aatgcagatt gaactttgtt agatttaatt ggataattaa 44520
tccatttaaa tcaattaaat caaataaatt ccaaggctca ttatgctagg aattcatgtg 44580
aattcattct tctatgggat atcaatggga tgaagagttt tgagaattaa tccatttgat 44640
taaggaattg gtaacttata tcaattaatc ctaattgatg gatggttgat ggttgtgtag 44700
tggaggatgg ttcatggcta gttgatgaca attagttgct ctattcctct tcctattcca 44760
ttggtaactt acatcaatta ctcttaattg attgttggtt gatggttgtg tagtggagga 44820
tggttcatgg ctagttgatg acaattagtt gctccattcc tcttcctatt ccatgactct 44880
tactcttcat cttccattcc tcttataaaa tgagaatgga tttgatctcc cgcgagaaga 44940
agaagacaca ctttcatcca ttttcaaaag ctgttgctgc tacggtaatc ccatcccgac 45000
gagtgtgtgc acacgcgttg ggagagtagg cctccgaaac cacgcgttgc tgcgacgttt 45060
gcacagacgg gcgggcgatc aggtttttgg ggagcgcaag gcgcgactac tcactgttcg 45120
tcaacatcta cttcatcttc accaacatgt cgaacactgg agacaaggag aaggagactc 45180
ccgtcaacac caacggaggc aatactgcct caaactccag cggaggacca ttcttggggt 45240
ataaccttat tacattattt caattagaag ttttactgtt aatgttcatc gcaatgtcaa 45300
cattgtgtca ttatgtgatt gttgatgctt attcaacgtt aagcatgctc atgttgatta 45360
cattcaccac tatcactgga tcaaatccta ttgtaaatat catgtttatt atcttgttat 45420
tttggattaa aatatgccga attatgacca aatttccaac aaacttagca catacaacat 45480
aatccttcat ggactttgca aaaacaaact cactgatgat gcacttcgaa tgtttcagaa 45540
cctatgtttg atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt 45600
gcttaaagtt ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg 45660
tttagtgccg aattattgga cgtacagatt gatggctgaa aatattatag gacaggggtt 45720
gctagaagaa ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc 45780
tggcatgcta aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg 45840
cacttacctt tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt 45900
gtttatagat cttttgtctg ggggaaaata tcaagaatat catatatttc tccctgaaaa 45960
atacaagtcc tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt 46020
gttggaattc ttttctccta cagtccgatt agaggaggga tcttctctgt atgtgtaaat 46080
agcgaggtat gtatgtcacc tctccgaatt attttgactg tggttcctgg actgtaaaca 46140
agctattatc ttctggtgtt gatgccagaa aaaacacaaa agtttgtcgt tatctctact 46200
aacggatcat aaaggggttt gtaactggag tttcaaactt aaggtatcta ggcagtaggt 46260
atatattgat cctacatctt atgatcttaa gatgatatcc ttctcattat cctctgctga 46320
aactttagct tgaaccgtca tctacaccac aatttgagcc ccttagcaca gagcacaacg 46380
agcaatagct tgcccttacg ttcattattt agcatgcact actactaact acccaataat 46440
caatacatcg gttattaaac tgtttgtaca gtttaataat gtcattttat cacgttaaca 46500
tatgtttcat tcaacaccac accggttttg gcacagttgc aaacttgcaa taacattttt 46560
actacttctc cgccccataa tataacaatc tcgttccata ctatattgct atattacggg 46620
acggatgaag tacttctttc cttccaaaat ataagaatct agtcctagat tagatattat 46680
ttggattcac gaatttgatt aggctatcta gatttgtagt cgtatgtaat gtctaattcg 46740
gtaataggtt attacctctt tggatggagg gagtagtttt tatttcgtac tccctctgtt 46800
tcatattata agttgttttg acttttttct tagtcaaatt ttattgagtt tgactaaatt 46860
tatagaaaaa aaattagcaa catttaagca ccacattagt ttcattaaat gtagcatgga 46920
atatattttt ataatatgtt tgttttttta ttaaaatgct actatatttt tctataaatg 46980
tagccaaatt taaagaagtt tgattacgaa aaaaaatcaa aatgacatat aatatgaaac 47040
tgaggatgta gcagactata gcaaatttaa actatgcttt tattttagag catcaccaaa 47100
agagatagcc taaatcttat cttaactaat taaaatattc ataattttcc tttcgtcaca 47160
ttaaattttc gtccgtaaat ccgattgaaa tccaactaga caatccaaaa aatagagaaa 47220
aagaacagaa aaaataataa aaagcacaca aatcttatct caatcccgcg ggaagctgcc 47280
gatgccgccg aatccgctcg agcgccgccg ccgccgctca cggggaacga tgtcgctgct 47340
atcgcacgtg gtatgggagg gcgccgccgc cgctgcttgg gagataggat atggagagag 47400
aaggaaatgt gagggagggt taggtttttc cccattcgta tcttcagcga cacggaggcg 47460
atccaagctg tccatcagat cagacggctc agaacgcctc catcttcagg ccgcgcatgc 47520
ttgatgggcc gagggaaggc cggagggtcg aacaaacgta gtcagaggag gagttggagg 47580
aggtaaagta gaatttattt gcgggctgag atagtaaatg gactgaaaat ggcccataga 47640
gaaattggga attttattta aataaatgtt gaaaaggtgt ttatattatc aaaattagaa 47700
attaagctcc gaaaatttta aaaaatattc aaagagcatt attaatcatg attaatttaa 47760
taaaaattaa atccaaccat atcatattat ttcacggcgc gcagtaggaa aatgcgcagc 47820
tgttgtcgct tacggtggga gagaagggac attgtttatt ttcagaacta tcttttataa 47880
ctcccatgga actttaaaat aaatataatc attattatag cattagtttt tttctgtctt 47940
ttttttcccc aagagcgccg cgcagaagag atcgatcgcg atctccctgc cccgacgtcg 48000
ccggccgatc tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg 48060
ccatctcctc cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag 48120
acaaactgcg ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc 48180
gggcatggcg cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat 48240
ccaagggcga ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga 48300
cgaattgctc cggcgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga 48360
cgtcgcgcgt cacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagctgg 48420
cgccgacgag gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg 48480
cgcgggccgc ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag 48540
agtggaagcc atcaccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag 48600
cgacgcaatg gacatagtgc tccgcagaat gaccgagctc ggttgcatac caaatgtctt 48660
ctcctacaat aatcttctca acgggctgtg tgatgagaac agaagccaag aagctctcga 48720
gttgctgcac atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta 48780
taccactgtc atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata 48840
ccatgaaatg ctggaccggg ggattttacc tgatgttgtg acctacagct ctattattgc 48900
tgcgttatgc aagggtcaag ctatggacaa gccatggagg tacttaccac gatggttaag 48960
aatggtgtca tgcctgattg catgacatat aatagttatt tcttgaaatg ttggatcgag 49020
gcatttgtct ggacactatt ttctttaatt caataattga cagtcattgc aaagaaggga 49080
gggttataga atctgaaaaa ctctttgacc tgatggtacg tattggtgtg aagcctgata 49140
tcattacata cagtacactc atcgatggat attgcttggc aggtaagatg gatgaagcaa 49200
tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca 49260
ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg 49320
agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt 49380
tatttcaaac cagaagaact gctgctgcaa aagaactcta tgtcaggatt accgaaagtg 49440
gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac 49500
tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg 49560
ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca 49620
aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt 49680
tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt 49740
caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac 49800
tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc 49860
acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat 49920
atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct 49980
gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat 50040
tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat 50100
tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga 50160
aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt tgtgactgga 50220
gtttcaaact taatgtgtct aggcagtaat tttgacatta gatccaaaac aatttatagg 50280
gtttcattaa atttcatcta tgtgtactgt ttaggtgttg aatagtttga cttgtttttt 50340
aactgaacaa aagatatgtc tgaagctttg ttctttacca aatgcagtac tgatcatcac 50400
aatatatttt ttatggaaca agattggatt gtatagaatg gtttccgatc tgattatctt 50460
atctcaacgt attattatgc acatgtacta atcatgaaat atctgatgga atgatgtttc 50520
tatttacctg tgtgaggcag caaggagtga gatggataac accacatact ccctctatcc 50580
cagaatataa gaagttttag agttggacac gattattaag aaagtaggta gaagtgagta 50640
gtggagggtt gtgattgcat gagtagtgga ggtaggtggg aaaagtgaat ggtggagggt 50700
tgtgattggt tgggaagaga atgttggtag agaagttgtt atattttggg gagtacatta 50760
ttattctaga acaatactgt tgtgctcaag aagcgttcca aagatgtttc acaacctgtg 50820
ctcgatgggt tttgagctta atcctgggac attcagtatc atgatctgtc tcattcttaa 50880
acatggaata aaggatgaca gcatgatttc tttgtctcta taatcttttg gctacccaca 50940
gataatagct gtaaatctat actactttaa aaggagtagt ggtggtggtg agtggtgaat 51000
ctgccaccac cccaccacca actctcaaaa ttctgacatg tgggatcact gtcaatccct 51060
tctccaagac atgtgggatc actgtcaatc ccttctccaa accaattgta tgatagaaca 51120
gtggaaatca cggacagacc atggagctct caaccataat catccttgcg agttaataac 51180
aaatggagcg taaacttggc aagcaaaaaa ctcaaattaa ttctaaaatt aagctctagg 51240
attcaaaata gatttcctct ctgcattgtg ctgttatgat ttttaattcc gtaacaacgc 51300
aaatgcattt tgctagtctt ataaagaagg gttaatgcaa atattctgat taaatgattg 51360
tatctatgaa gtttgaatgc tagtggaagc tcctttgacc atgttttgtt gtgcgagcat 51420
ttaagagagt gaagagaatg cttctttggt gctgttctgg tatggaagga tccacagata 51480
aaattcaggt tctactgctt ctctgcttgt aattttcatg aagctgcagt gaataccttg 51540
ttgaccactt gatctgttgc tttgaaggag aatatagtag tggccaaggt tggtgacggt 51600
gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg 51660
tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc 51720
cgctgcatca aggccaactg ctccgaactg atcaatttct ggtacggatc acttctcctt 51780
tccttttttt tttcacctta agcactctct tgattcttcg ctgctacctc ccttaatttc 51840
tttcaatata ttgtggcact tgatcatggc ggagacccac cttccagtgt gaatggattt 51900
tgtcaaagaa ctaaatttat tccattagct tattttctga ttacatggaa gacattcttt 51960
tctggaataa atacagaact aaatcctgtt tcctgaataa aagttgttag tgtgtggcat 52020
ggtgcatttc cgcgcttcta aattttataa aacctgttca ttcaatttga acctgcatcc 52080
aatccaatat tttaggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat 52140
gcttctgaag aaaggttaat tgttgtttca tctcaggagg taatatgcag atgattattc 52200
caattggcat tgccttgcca tttttatcac gagtctttac aattttatat cctcctacat 52260
attctttcca gattccagat gatccagtgt ctccaacaat tgaggcgctt attttgctcc 52320
atagtaaagc aagtacactt gctgagaacc accagttgac aacacggctt gttgtaccat 52380
caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa atgagaagac 52440
ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac ctgtcttttg 52500
atgaggagct tgtgcaggta atttatttgg ccatacctac accagagatc catatattac 52560
ttttataact gcagttttta cttgttaaca tttcattgtg cttttacatt tgttccaagc 52620
tttcaggttg ctgggcttcc agctattgaa agaggagccc tgacagagat tgcttcgagg 52680
ctttgaacta ggacactcag agatggaagt tcttccaata atccgacacc ttttgcccct 52740
gttgatggtc ctcctgttga tatcttgcct aacaaggaat tcatgctata tggacgatct 52800
gctaatagtc ccccatatgg agggcctgct aatgatccac catatggaag acctgccatt 52860
gatccaccat atggaagacc aatatccaca atatggaaga cctgccaatg atccaccata 52920
tagaagacct gtcaatgata catcatattg agggttggac aatgatgggc ctcgtgatca 52980
ggcccggtcc tgaggggggt cgaatggggc gatcgctccg ggcccccgat tcccagggcc 53040
cccacctatc tgtgcaacga gtagtagcga tcttccagcg cgcaacgtga ggcgatgttt 53100
ctccgtgatt tcgccggcct gcaactgcga gatcgcgagt ataacgatca gccgatcgat 53160
ctcatctgcc gactgccatg ctgatgccac acgcaagcgc agcatatcag ccttatcttg 53220
gttgatcggc atgctggacg agcacatctg ttgtcgcatc aactgctgac tgctatatat 53280
gtgctggtgc tgaatcgatc gattgtcgtc gcggaagtga agaacaacca cggcactgct 53340
gcctgctggg ctctagccgc catcagtaag tacgctatac tgcctatcta gatctagatc 53400
gagattacat agtggaatta tctgtttata acaaaattac aaggtatcaa ttgataattt 53460
aaggttataa ccgtacaaac ttcagtgatt tgctggtttc acattggtta gatttgtttc 53520
aactaatttg gtacttctgt agccttgtaa tttacgaatc tagtattaat attttcttaa 53580
gtattagcct gttccttgat attatgctgt tgagaaagta tgcaatagat aacaaaaaca 53640
agtaggtgtg ttgaggatgc tcaagagtaa tacagccact tcaataattc tgatattatc 53700
aggacatcat caataattct gcgcctacaa atcttcaaag aaaattttaa tataatgcgt 53760
atgatttttt aaatacgaat attgattgct atttaaagat atttatatta tatggtaatt 53820
attatttgaa ggtttataat aaaggcctcc gtttttagtt tcacgctggg ccttcagaat 53880
ctcaggaccg gccctgctca tgatc 53905
<210>29
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>29
atcaggagcc ttcaaattgg gaac 24
<210>30
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>30
ctcgcaaatt gcttaatttt gacc 24
<210>31
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>31
tgaaggagtt atgggtgcgt gacg 24
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>32
ttgccgagca cacttgccat gtgc 24
<210>33
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>33
gcgacgcaat ggacatagtg ctcc 24
<210>34
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>34
ttacctgcca agcaatatcc atcg 24
<210>35
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>35
aaggcatact cagtggaggg caag 24
<210>36
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>36
ttaacctgac cgcaagcacc tgtc 24
<210>37
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>37
tggatggact atgtggggtc agtc 24
<210>38
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>38
agtggaagtg gagagagtag ggag 24
<210>39
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>39
ccctccaaca cataaatggt tgag 24
<210>40
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>40
tttctgccag gaaactgtta gatg 24
<210>41
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>41
gcgatcttat acgcatacta tgcg 24
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>42
aaagtctttg ttccttcacc aagg 24
<210>43
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>43
gaggatttat caaaacagga tggacg 26
<210>44
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>44
tgggcggcag cagtggagga taga 24
<210>45
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>45
aagaagggag ggttatagaa tctg 24
<210>46
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>46
atatcaggac taacaccact gctc 24
<210>47
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>47
acgagtagta gcgatcttcc agcg 24
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>48
cagcgtgaaa ctaaaaacgg aggc 24
<210>49
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>49
atcccacatc atcataatcc gacc 24
<210>50
<211>25
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>50
agcttctccc ttggatacgg tggcg 25
<210>51
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>51
atttgttggt tagttgcggc tgag 24
<210>52
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>52
gcccaaactc aaaaggagag aacc 24
<210>53
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>53
cctcaagtct cccctaaagc cact 24
<210>54
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>54
gctctactgc tgataaaccg tgag 24
<210>55
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>55
tggatggact atgtggggtc agtc 24
<210>56
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>56
agtggaagtg gagagagtag ggag 24
<210>57
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>57
tacgacgcca tttcactcca ttgc 24
<210>58
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>58
catttctcta tgggcgttgc tctg 24
<210>59
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>59
acctgtaggt atggcacctt caacac 26
<210>60
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>60
ccaaggaacg aagttcaaat gtatgg 26
<210>61
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>61
tgatgtgttt gggcatccct ttcg 24
<210>62
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>62
gaga tagggg acgacagaca cgac 24
<210>63
<211>26
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>63
tcctatggct gtttagaaac tgcaca 26
<210>64
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>64
caagttcaaa cataactggc gttg 24
<210>65
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>65
cactgtcctg taagtgtgct gtgc 24
<210>66
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>66
caagcgtgtg ataaaatgtg acgc 24
<210>67
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>67
tgcctactgc cattactatg tgac 24
<210>68
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>68
acatactacc gtaaatggtc tctg 24
<210>69
<211>4820
<212>DNA
<213>稻
<400>69
atcgatcgcg atctccctgc cccgacgtcg ccggccgatc tctcattctc tccacgccct 60
gctcgtcgcc gatctcctac accatccctg ccatctcctc cttcccctcc cctctatcct 120
ccactggtgc cgcccacctc tccgtataag acaaactgcg ttgcggcgtt ggtttccgcc 180
ggcgctgctg ctgcacctgt cagctagggc gggcatggcg cgccgcgccg cttcccgcgc 240
tgttggcgcc cttcgctcgg acggctcgat ccaagggcga ggaggccgcg cggggggcag 300
tggcgccgag gacgcacgcc acgtgttcga cgaattgctc cgccgtggca ggggcgcctc 360
gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt gacagccccg cggccgccgt 420
gtcccgctac aaccgcatgg cccgagccgg cgccgacgag gtaactcccg acttgtgcac 480
ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc ttggacctcg gtttcgcggc 540
cttgggcaat gtcattaaga agggatttag agtggacgcc atcgccttca ctcctctgct 600
caagggcctc tgtgccgaca agaggacgag cgacgcaatg gacatagtgc tccgcagaat 660
gaccgagctc ggctgcatac caaatgtctt ctcctacaat attcttctca aggggctgtg 720
tgatgagaac agaagccaag aagctctcga gctgctgcac atgatggctg atgatcgagg 780
aggaggtagc ccacctgatg tggtgtcgta taccactgtc atcaatggct tcttcaaaga 840
gggggattca gacaaagctt acagtacata ccatgaaatg ctggaccggg ggattttacc 900
tgatgttgtg acctacaact ctattattgc tgcgttatgc aaggctcaag ctatggacaa 960
agccatggag gtacttaaca ccatggttaa gaatggtgtc atgcctgatt gcatgacata 1020
taatagtatt ctgcatggat attgctcttc agggcagccg aaagaggcta ttggatttct 1080
caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt acttatagct tgctcatgga 1140
ttatctttgc aagaacggaa gatgcatgga agctagaaag attttcgatt ctatgaccaa 1200
gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt atgctaccaa 1260
aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg gtatccaccc 1320
tgatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga aagtagatca 1380
ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccgaatg cagtgacgta 1440
tggagcagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta tgctttattt 1500
tgagcagatg atcgatgaag gactaagccc tggcaacatt gtttataact ccctaattca 1560
tggtttgtgc acctgtaaca aatgggagag ggctgaagag ttaattcttg aaatgttgga 1620
tcgaggcatc tgtctgaaca ctattttctt taattcaata attgacagtc attgcaaaga 1680
agggagggtt atagaatctg aaaaactctt tgagctgatg gtacgtattg gtgtgaagcc 1740
caatgtcatt acctacaata ctcttatcaa tggatattgc ttggcaggta agatggatga 1800
agcaatgaag ttactttctg gcatggtctc agttgggttg aaacctaata ctgttactta 1860
tagcactttg attaatggct actgcaaaat tagtaggatg gaagacgcgt tagttctttt 1920
taaggagatg gagagcagtg gtgttagtcc tgatattatt acgtataaca taattctgca 1980
aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtta ggattaccga 2040
aagtggaacg cagattgaac ttagcacata caacataatc cttcatggac tttgcaaaaa 2100
caaactcact gatgatgcac ttcagatgtt tcagaaccta tgtttgatgg atttgaagct 2160
tgaggctagg actttcaaca ttatgattga tgcattgctt aaagttggca gaaatgatga 2220
agccaaggat ttgtttgttg ctttctcgtc taacggttta gtgccgaatt attggacgta 2280
caggttgatg gctgaaaata ttataggaca ggggttgcta gaagaattgg atcaactctt 2340
tctttcaatg gaggacaatg gctgtactgt tgactctggc atgctaaatt tcattgttag 2400
ggaactgttg cagagaggtg agataaccag ggctggcact tacctttcca tgattgatga 2460
gaagcacttt tccctcgaag catccactgc ttccttgttt atagatcttt tgtctggggg 2520
aaaatatcaa gaatattata ggtttctccc tgaaaaatac aagtccttta tagaatcttt 2580
gagctgctga agcattttgc agctttgaaa ttctgtgttg gaattctttt ctcctacagt 2640
cctattagag gagggatctt ctctgtatgt gtaaatagcg agtttgaatg ctagtggaag 2700
ctcctttgac catgttttgt tgtgcgagca tttaagagag tgaagagaat gcttctttgg 2760
tgctgttctg gtatggaagg atccacagat aaaattcagt agtggccaag gttggtgacg 2820
gtgatggtgg catgtgatcc cccagatctt cagtgaccca gagaggaggg gacggcgcgt 2880
ggtgagctac aaggcatact cagtggaggg caagatcaag gcctcccgtc cgtaggggac 2940
tccgctgcat caaggccaac tgctccgaac tgatcaattt ctggtgcaga caggtgcttg 3000
cggtcaggtt aaagaagttg gcaaaaatgc ttctgaagaa aggttaattg ttgtttcatc 3060
tcaggagatt ccagatgatc cagtgtctcc aacaattgag gcgcttattt tgctccatag 3120
taaagtaagt acacttgctg agaaccacca gttgacaaca cggcttgttg taccatcaaa 3180
caaagttggt tgtattcttg gggaaggtgg aaaggtaatt actgaaatga gaagacggac 3240
tggggctgaa atccgagtct actcaaaagc agataaacct aagtacctgt cttttgatga 3300
ggagcttgtg caggttgctg ggcttccagc tattgaaaga ggagccctga cagagattgc 3360
ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc cgacaccttt 3420
tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca tgctatatgg 3480
acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat atggaagacc 3540
tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct gccaatgatc 3600
caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat gatgggcctc 3660
gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc cccccgattc 3720
ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg caacgtgagg 3780
cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat aacgatcagc 3840
cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag catatcagcc 3900
ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa ctgctgactg 3960
ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag aacaaccacg 4020
gcactgctgc ctgctgggct ctagccgcca tcagctgcgg agctgatcca tggacgtgag 4080
gattaccgaa gactgtcagg tctcactggg tatccaggtg gctctgtcga attgtggatt 4140
ccaaatagtt aactggagtc tgtcattggt gttggtggtg tcaatctagc tgagatccgt 4200
ctggtatagc gtaagagaaa catcatgcac tatccccagt cataaccatg ccccaatggc 4260
caccaatagt tttcctcgtg aaaatctccc cttgatccca gatctctggt gcgagagtga 4320
agttgcacga agcccatcct ggttcttccg agtccattgt ggagatccag ggcattccgg 4380
atcaagtgaa agccgcacag agccttctgc aaggcttcat cggcgcaagc agcaacagca 4440
ggcaggcgcc ccagtcctct cgcatggccc attattttta gtaagctgga ggacattcgc 4500
aacagggggg tcagtggtca ctgcaaagct gagtttgttc ttcagttcaa ctgcagaaaa 4560
ttgcagatcg gttgccgtag ttgctagaac ggtacatagt tgccacctaa ctgtagcgag 4620
tggcataact tattgtgtgt tactgcccaa tgttgtctct ccttgtgttc atggattcag 4680
acttgtgatt gtagtatttc tggatcagac tggagtaaaa gaaaaaaaaa aaggaagaca 4740
tgggtttaac agtaagctca aaacgttgac agtagtaaaa taaaaggggt ttgttcactt 4800
taaaaaaaaa aaaaaaaaaa 4820
<210>70
<211>4821
<212>DNA
<213>稻
<400>70
cgatcgcgat ctccctgccc cgacgtcgcc ggccgatctc tcattctctc cacgccctgc 60
tcgtcgccga tctcctacac catccctgcc atctcctcct tcccctcccc tctatcctcc 120
actggtgccg cccacctctc cgtataagac aaactgcgtt gcggcgttgg tttccgccgg 180
cgctgctgct gcacctgtca gctagggcgg gcatggcgcg ccgcgccgct tcccgcgctg 240
ttggcgccct tcgctcggac ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg 300
gcgccgagga cgcacgccac gtgttcgacg aattgctccg ccgtggcagg ggcgcctcga 360
tctacggctt gaaccgcgcc ctcgccgacg tcgcgcgtga cagccccgcg gccgccgtgt 420
cccgctacaa ccgcatggcc cgagccggcg ccgacgaggt aactcccgac ttgtgcacct 480
acggcattct catcggttgc tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct 540
tgggcaatgt cattaagaag ggatttagag tggacgccat cgccttcact cctctgctca 600
agggcctctg tgccgacaag aggacgagcg acgcaatgga catagtgctc cgcagaatga 660
ccgagctcgg ctgcatacca aatgtcttct cctacaatat tcttctcaag gggctgtgtg 720
atgagaacag aagccaagaa gctctcgagc tgctgcacat gatggctgat gatcgaggag 780
gaggtagccc acctgatgtg gtgtcgtata ccactgtcat caatggcttc ttcaaagagg 840
gggattcaga caaagcttac agtacatacc atgaaatgct ggaccggggg attttacctg 900
atgttgtgac ctacaactct attattgctg cgttatgcaa ggctcaagct atggacaaag 960
ccatggaggt acttaacacc atggttaaga atggtgtcat gcctgattgc atgacatata 1020
atagtattct gcatggatat tgctcttcag ggcagccgaa agaggctatt ggatttctca 1080
aaaagatgcg cagtgatggt gtcgaaccag atgttgttac ttatagcttg ctcatggatt 1140
atctttgcaa gaacggaaga tgcatggaag ctagaaagat tttcgattct atgaccaaga 1200
ggggcctaaa gcctgaaatt actacctatg gtaccctgct tcaggggtat gctaccaaag 1260
gagcccttgt tgagatgcat ggtctcttgg atttgatggt acgaaacggt atccaccctg 1320
atcattatgt tttcagcatt ctaatatgtg catacgctaa acaagggaaa gtagatcagg 1380
caatgcttgt gttcagcaaa atgaggcagc aaggattgaa tccgaatgca gtgacgtatg 1440
gagcagttat aggcatactt tgcaagtcag gcagagtaga agatgctatg ctttattttg 1500
agcagatgat cgatgaagga ctaagccctg gcaacattgt ttataactcc ctaattcatg 1560
gtttgtgcac ctgtaacaaa tgggagaggg ctgaagagtt aattcttgaa atgttggatc 1620
gaggcatctg tctgaacact attttcttta attcaataat tgacagtcat tgcaaagaag 1680
ggagggttat agaatctgaa aaactctttg agctgatggt acgtattggt gtgaagccca 1740
atgtcattac ctacaatact cttatcaatg gatattgctt ggcaggtaag atggatgaag 1800
caatgaagtt actttctggc atggtctcag ttgggttgaa acctaatact gttacttata 1860
gcactttgat taatggctac tgcaaaatta gtaggatgga agacgcgtta gttcttttta 1920
aggagatgga gagcagtggt gttagtcctg atattattac gtataacata attctgcaag 1980
gtttatttca aaccagaaga actgctgctg caaaagaact ctatgttagg attaccgaaa 2040
gtggaacgca gattgaactt agcacataca acataatcct tcatggactt tgcaaaaaca 2100
aactcactga tgatgcactt cagatgtttc agaacctatg tttgatggat ttgaagcttg 2160
aggctaggac tttcaacatt atgattgatg cattgcttaa agttggcaga aatgatgaag 2220
ccaaggattt gtttgttgct ttctcgtcta acggtttagt gccgaattat tggacgtaca 2280
ggttgatggc tgaaaatatt ataggacagg ggttgctaga agaattggat caactctttc 2340
tttcaatgga ggacaatggc tgtactgttg actctggcat gctaaatttc attgttaggg 2400
aactgttgca gagaggtgag ataaccaggg ctggcactta cctttccatg attgatgaga 2460
agcacttttc cctcgaagca tccactgctt ccttgtttat agatcttttg tctgggggaa 2520
aatatcaaga atattatagg tttctccctg aaaaatacaa gtcctttata gaatctttga 2580
gctgctgaag cattttgcag ctttgaaatt ctgtgttgga attcttttct cctacagtcc 2640
tattagagga gggatcttct ctgtatgtgt aaatagcgag tttgaatgct agtggaagct 2700
cctttgacca tgttttgttg tgcgagcatt taagagagtg aagagaatgc ttctttggtg 2760
ctgttctggt atggaaggat ccacagataa aattcagtag tggccaaggt tggtgacggt 2820
gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg 2880
tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc 2940
cgctgcatca aggccaactg ctccgaactg atcaatttct ggtgcagaca ggtgcttgcg 3000
gtcaggttaa agaagttggc aaaaatgctt ctgaagaaag gttaattgtt gtttcatctc 3060
aggagattcc agatgatcca gtgtctccaa caattgaggc gcttattttg ctccatagta 3120
aagtaagtac acttgctgag aaccaccagt tgacaacacg gcttgttgta ccatcaaaca 3180
aagttggttg tattcttggg gaaggtggaa aggtaattac tgaaatgaga agacggactg 3240
gggctgaaat ccgagtctac tcaaaagcag ataaacctaa gtacctgtct tttgatgagg 3300
agcttgtgca ggttgctggg cttccagcta ttgaaagagg agccctgaca gagattgctt 3360
cgaggctttg aactaggaca ctcagagatg gaagttcttc caataatccg acaccttttg 3420
cccctgttga tggtcctcct gttgatatct tgcctaacaa ggaattcatg ctatatggac 3480
gatctgctaa tagtccccca tatggagggc ctgctaatga tccaccatat ggaagacctg 3540
ccattgatcc accatatgga agaccaatat ccacaatatg gaagacctgc caatgatcca 3600
ccatatagaa gacctgtcaa tgatacatca tattgagggt tgaacaatga tgggcctcgt 3660
gatcaggccc ggtcctgagg ggggtcgaat ggggcgatcg ctccgggccc cccgattccc 3720
agggccccca cctatctgtg caacgagtag tagcgatctt ccagcgcgca acgtgaggcg 3780
atgtttctcc gtgatttcgc cggcctgcaa ctgcgagatc gcgagtataa cgatcagccg 3840
atcgatctca tctgccgact gccatgctga tgccacacgc aagcgcagca tatcagcctt 3900
atcttggttg atcggcatgc tggacgagca catctgttgt cgcatcaact gctgactgct 3960
atatatgtgc tggtgctgaa tcgatcgatt gtcgtcacgg aagtgaagaa caaccacggc 4020
actgctgcct gctgggctct agccgccatc agctgcggag ctgatccatg gacgtgagga 4080
ttaccgaaga ctgtcaggtc tcactgggta tccaggtggc tctgtcgaat tgtggattcc 4140
aaatagttaa ctggagtctg tcattggtgt tggtggtgtc aatctagctg agatccgtct 4200
ggtatagcgt aagagaaaca tcatgcacta tccccagtca taaccatgcc ccaatggcca 4260
ccaatagttt tcctcgtgaa aatctcccct tgatcccaga tctctggtgc gagagtgaag 4320
ttgcacgaag cccatcctgg ttcttccgag tccattgtgg agatccaggg cattccggat 4380
caagtgaaag ccgcacagag ccttctgcaa ggcttcatcg gcgcaagcag caacagcagg 4440
caggcgcccc agtcctctcg catggcccat tatttttagt aagctggagg acattcgcaa 4500
caggggggtc agtggtcact gcaaagctga gtttgttctt cagttcaact gcagaaaatt 4560
gcagatcggt tgccgtagtt gctagaacgg tacatagttg ccacctaact gtagcgagtg 4620
gcataactta ttgtgtgtta ctgcccaatg ttgtctctcc ttgtgttcat ggattcagac 4680
ttgtgattgt agtatttctg gatcagactg gagtaaaaga aaaaaaaaaa ggaagacatg 4740
ggtttaacag taagctcaaa acgttgacag tagtaaaata aaaggggttt gttcacttta 4800
aaaaaaaaaa aaaaaaaaaa a 4821
<210>71
<211>5005
<212>DNA
<213>稻
<400>71
gagatcgatc gcgatctccc tgccccgacg tcgccggccg atctctcatt ctctccacgc 60
cctgctcgtc gccgatctcc tacaccatcc ctgccatctc ctccttcccc tcccctctat 120
cctccactgg tgccgcccac ctctccgtat aagacaaact gcgttgcggc gttggtttcc 180
gccggcgctg ctgctgcacc tgtcagctag ggcgggcatg gcgcgccgcg ccgcttcccg 240
cgctgttggc gcccttcgct cggacggctc gatccaaggg cgaggaggcc gcgcgggggg 300
cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccgccgtg gcaggggcgc 360
ctcgatctac ggcttgaacc gcgccctcgc cgacgtcgcg cgtgacagcc ccgcggccgc 420
cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc ccgacttgtg 480
cacctacggc attctcatcg gttgctgctg ccgcgcgggc cgcttggacc tcggtttcgc 540
ggccttgggc aatgtcatta agaagggatt tagagtggac gccatcgcct tcactcctct 600
gctcaagggc ctctgtgccg acaagaggac gagcgacgca atggacatag tgctccgcag 660
aatgaccgag ctcggctgca taccaaatgt cttctcctac aatattcttc tcaaggggct 720
gtgtgatgag aacagaagcc aagaagctct cgagctgctg cacatgatgg ctgatgatcg 780
aggaggaggt agcccacctg atgtggtgtc gtataccact gtcatcaatg gcttcttcaa 840
agagggggat tcagacaaag cttacagtac ataccatgaa atgctggacc gggggatttt 900
acctgatgtt gtgacctaca actctattat tgctgcgtta tgcaaggctc aagctatgga 960
caaagccatg gaggtactta acaccatggt taagaatggt gtcatgcctg attgcatgac 1020
atataatagt attctgcatg gatattgctc ttcagggcag ccgaaagagg ctattggatt 1080
tctcaaaaag atgcgcagtg atggtgtcga accagatgtt gttacttata gcttgctcat 1140
ggattatctt tgcaagaacg gaagatgcat ggaagctaga aagattttcg attctatgac 1200
caagaggggc ctaaagcctg aaattactac ctatggtacc ctgcttcagg ggtatgctac 1260
caaaggagcc cttgttgaga tgcatggtct cttggatttg atggtacgaa acggtatcca 1320
ccctgatcat tatgttttca gcattctaat atgtgcatac gctaaacaag ggaaagtaga 1380
tcaggcaatg cttgtgttca gcaaaatgag gcagcaagga ttgaatccga atgcagtgac 1440
gtatggagca gttataggca tactttgcaa gtcaggcaga gtagaagatg ctatgcttta 1500
ttttgagcag atgatcgatg aaggactaag ccctggcaac attgtttata actccctaat 1560
tcatggtttg tgcacctgta acaaatggga gagggctgaa gagttaattc ttgaaatgtt 1620
ggatcgaggc atctgtctga acactatttt ctttaattca ataattgaca gtcattgcaa 1680
agaagggagg gttatagaat ctgaaaaact ctttgagctg atggtacgta ttggtgtgaa 1740
gcccaatgtc attacctaca atactcttat caatggatat tgcttggcag gtaagatgga 1800
tgaagcaatg aagttacttt ctggcatggt ctcagttggg ttgaaaccta atactgttac 1860
ttatagcact ttgattaatg gctactgcaa aattagtagg atggaagacg cgttagttct 1920
ttttaaggag atggagagca gtggtgttag tcctgatatt attacgtata acataattct 1980
gcaaggttta tttcaaacca gaagaactgc tgctgcaaaa gaactctatg ttaggattac 2040
cgaaagtgga acgcagattg aacttagcac atacaacata atccttcatg gactttgcaa 2100
aaacaaactc actgatgatg cacttcagat gtttcagaac ctatgtttga tggatttgaa 2160
gcttgaggct aggactttca acattatgat tgatgcattg cttaaagttg gcagaaatga 2220
tgaagccaag gatttgtttg ttgctttctc gtctaacggt ttagtgccga attattggac 2280
gtacaggttg atggctgaaa atattatagg acaggggttg ctagaagaat tggatcaact 2340
ctttctttca atggaggaca atggctgtac tgttgactct ggcatgctaa atttcattgt 2400
tagggaactg ttgcagagag gtgagataac cagggctggc acttaccttt ccatgattga 2460
tgagaagcac ttttccctcg aagcatccac tgcttccttg tttatagatc ttttgtctgg 2520
gggaaaatat caagaatatt ataggtttct ccctgaaaaa tacaagtcct ttatagaatc 2580
tttgagctgc tgaagcattt tgcagctttg aaattctgtg ttggaattct tttctcctac 2640
agtcctatta gaggagggat cttctctgta tgtgtaaata gcgagtttga atgctagtgg 2700
aagctccttt gaccatgttt tgttgtgcga gcatttaaga gagtgaagag aatgcttctt 2760
tggtgctgtt ctggtatgga aggatccaca gataaaattc aggagaatat agtagtggcc 2820
aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac ccagagagga 2880
ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc aaggcctccc 2940
gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa tttctggtgc 3000
agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa gaaaggttaa 3060
ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt gaggcgctta 3120
ttttgctcca tagtaaagta agtacacttg ctgagaacca ccagttgaca acacggcttg 3180
ttgtaccatc aaacaaagtt ggttgtattc ttggggaagg tggaaaggta attactgaaa 3240
tgagaagacg gactggggct gaaatccgag tctactcaaa agcagataaa cctaagtacc 3300
tgtcttttga tgaggagctt gtgcaggttg ctgggcttcc agctattgaa agaggagccc 3360
tgacagagat tgcttcgagg ctttgaacta ggacactcag agatggaagt tcttccaata 3420
atccgacacc ttttgcccct gttgatggtc ctcctgttga tatcttgcct aacaaggaat 3480
tcatgctata tggacgatct gctaatagtc ccccatatgg agggcctgct aatgatccac 3540
catatggaag acctgccatt gatccaccat atggaagacc aatatccaca atatggaaga 3600
cctgccaatg atccaccata tagaagacct gtcaatgata catcatattg agggttgaac 3660
aatgatgggc ctcgtgatca ggcccggtcc tgaggggggt cgaatggggc gatcgctccg 3720
ggccccccga ttcccagggc ccccacctat ctgtgcaacg agtagtagcg atct tccagc 3780
gcgcaacgtg aggcgatgtt tctccgtgat ttcgccggcc tgcaactgcg agatcgcgag 3840
tataacgatc agccgatcga tctcatctgc cgactgccat gctgatgcca cacgcaagcg 3900
cagcatatca gccttatctt ggttgatcgg catgctggac gagcacatct gttgtcgcat 3960
caactgctga ctgctatata tgtgctggtg ctgaatcgat cgattgtcgt cacggaagtg 4020
aagaacaacc acggcactgc tgcctgctgg gctctagccg ccatcagctg cggagctgat 4080
ccatggacgt gaggattacc gaagactgtc aggtctcact gggtatccag gtggctctgt 4140
cgaattgtgg attccaaata gttaactgga gtctgtcatt ggtgttggtg gtgtcaatct 4200
agctgagatc cgtctggtat agcgtaagag aaacatcatg cactatcccc agtcataacc 4260
atgccccaat ggccaccaat agttttcctc gtgaaaatct ccccttgatc ccagatctct 4320
ggtgcgagag tgaagttgca cgaagcccat cctggttctt ccgagtccat tgtggagatc 4380
cagggcattc cggatcaagt gaaagccgca cagagccttc tgcaaggctt catcggcgca 4440
agcagcaaca gcaggcaggc gccccagtcc tctcgcatgg cccattattt ttagtaagct 4500
ggaggacatt cgcaacaggg gggtcagtgg tcactgcaaa gctgagtttg ttcttcagtt 4560
caactgcaga aaattgcaga tcggttgccg tagttgctag aacggtacat agttgccacc 4620
taactgtagc gagtggcata acttattgtg tgttactgcc caatgttgtc tctccttgtg 4680
ttcatggatt cagacttgtg attgtagtat ttctggatca gactggagta aaagaaaaaa 4740
aaaaaggaag acatgggttt aacagtaagc tcaaaacgtt gacagtagta aaataaaagg 4800
ggtttgttca ctttatttcc aatatcaacc ttaccaacat ttggcgttga atcatttata 4860
ccacatcgct tgtgcagctg aatttggggc tgtttaaaag atggtctctt ggattgctaa 4920
ttgcctcgcg gcaagcgtgg taccttgtac aatataaata taattataac tatttaattt 4980
cataaaaaaa aaaaaaaaaa aaaaa 5005
<210>72
<211>4978
<212>DNA
<213>稻
<400>72
gcgatctccc tgccccgacg tcgccggccg atctctcatt ctctccacgc cctgctcgtc 60
gccgatctcc tacaccatcc ctgccatctc ctccttcccc tcccctctat cctccactgg 120
tgccgcccac ctctccgtat aagacaaact gcgttgcggc gttggtttcc gccggcgctg 180
ctgctgcacc tgtcagctag ggcgggcatg gcgcgccgcg ccgcttcccg cgctgttggc 240
gcccttcgct cggacggctc gatccaaggg cgaggaggcc gcgcgggggg cagtggcgcc 300
gaggacgcac gccacgtgtt cgacgaattg ctccgccgtg gcaggggcgc ctcgatctac 360
ggcttgaacc gcgccctcgc cgacgtcgcg cgtgacagcc ccgcggccgc cgtgtcccgc 420
tacaaccgca tggcccgagc cggcgccgac gaggtaactc ccgacttgtg cacctacggc 480
attctcatcg gttgctgctg ccgcgcgggc cgcttggacc tcggtttcgc ggccttgggc 540
aatgtcatta agaagggatt tagagtggac gccatcgcct tcactcctct gctcaagggc 600
ctctgtgccg acaagaggac gagcgacgca atggacatag tgctccgcag aatgaccgag 660
ctcggctgca taccaaatgt cttctcctac aatattcttc tcaaggggct gtgtgatgag 720
aacagaagcc aagaagctct cgagctgctg cacatgatgg ctgatgatcg aggaggaggt 780
agcccacctg atgtggtgtc gtataccact gtcatcaatg gcttcttcaa agagggggat 840
tcagacaaag cttacagtac ataccatgaa atgctggacc gggggatttt acctgatgtt 900
gtgacctaca actctattat tgctgcgtta tgcaaggctc aagctatgga caaagccatg 960
gaggtactta acaccatggt taagaatggt gtcatgcctg attgcatgac atataatagt 1020
attctgcatg gatattgctc ttcagggcag ccgaaagagg ctattggatt tctcaaaaag 1080
atgcgcagtg atggtgtcga accagatgtt gttacttata gcttgctcat ggattatctt 1140
tgcaagaacg gaagatgcat ggaagctaga aagattttcg attctatgac caagaggggc 1200
ctaaagcctg aaattactac ctatggtacc ctgcttcagg ggtatgctac caaaggagcc 1260
cttgttgaga tgcatggtct cttggatttg atggtacgaa acggtatcca ccctgatcat 1320
tatgttttca gcattctaat atgtgcatac gctaaacaag ggaaagtaga tcaggcaatg 1380
cttgtgttca gcaaaatgag gcagcaagga ttgaatccga atgcagtgac gtatggagca 1440
gttataggca tactttgcaa gtcaggcaga gtagaagatg ctatgcttta ttttgagcag 1500
atgatcgatg aaggactaag ccctggcaac attgtttata actccctaat tcatggtttg 1560
tgcacctgta acaaatggga gagggctgaa gagttaattc ttgaaatgtt ggatcgaggc 1620
atctgtctga acactatttt ctttaattca ataattgaca gtcattgcaa agaagggagg 1680
gttatagaat ctgaaaaact ctttgagctg atggtacgta ttggtgtgaa gcccaatgtc 1740
attacctaca atactcttat caatggatat tgcttggcag gtaagatgga tgaagcaatg 1800
aagttacttt ctggcatggt ctcagttggg ttgaaaccta atactgttac ttatagcact 1860
ttgattaatg gctactgcaa aattagtagg atggaagacg cgttagttct ttttaaggag 1920
atggagagca gtggtgttag tcctgatatt attacgtata acataattct gcaaggttta 1980
tttcaaacca gaagaactgc tgctgcaaaa gaactctatg ttaggattac cgaaagtgga 2040
acgcagattg aacttagcac atacaacata atccttcatg gactttgcaa aaacaaactc 2100
actgatgatg cacttcagat gtttcagaac ctatgtttga tggatttgaa gcttgaggct 2160
aggactttca acattatgat tgatgcattg cttaaagttg gcagaaatga tgaagccaag 2220
gatttgtttg ttgctttctc gtctaacggt ttagtgccga attattggac gtacaggttg 2280
atggctgaaa atattatagg acaggggttg ctagaagaat tggatcaact ctttctttca 2340
atggaggaca atggctgtac tgttgactct ggcatgctaa atttcattgt tagggaactg 2400
ttgcagagag gtgagataac cagggctggc acttaccttt ccatgattga tgagaagcac 2460
ttttccctcg aagcatccac tgcttccttg tttatagatc ttttgtctgg gggaaaatat 2520
caagaatatt ataggtttct ccctgaaaaa tacaagtcct ttatagaatc tttgagctgc 2580
tgaagcattt tgcagctttg aaattctgtg ttggaattct tttctcctac agtcctatta 2640
gaggagggat cttctctgta tgtgtaaata gcgagtttga atgctagtgg aagctccttt 2700
gaccatgttt tgttgtgcga gcatttaaga gagtgaagag aatgcttctt tggtgctgtt 2760
ctggtatgga aggatccaca gataaaattc aggttctact gcttctctgc ttgtaatttt 2820
catgaagctg cagtgaatac cttgttgacc acttgatctg ttgctttgaa ggagaatata 2880
gtagtggcca aggttggtga cggtgatggt ggcatgtgat cccccagatc ttcagtgacc 2940
cagagaggag gggacggcgc gtggtgagct acaaggcata ctcagtggag ggcaagatca 3000
aggcctcccg tccgtagggg actccgctgc atcaaggcca actgctccga actgatcaat 3060
ttctggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat gcttctgaag 3120
aaaggttaat tgttgtttca tctcaggaga ttccagatga tccagtgtct ccaacaattg 3180
aggcgcttat tttgctccat agtaaagtaa gtacacttgc tgagaaccac cagttgacaa 3240
cacggcttgt tgtaccatca aacaaagttg gttgtattct tggggaaggt ggaaaggtaa 3300
ttactgaaat gagaagacgg actggggctg aaatccgagt ctactcaaaa gcagataaac 3360
ctaagtacct gtcttttgat gaggagcttg tgcaggttgc tgggcttcca gctattgaaa 3420
gaggagccct gacagagatt gcttcgaggc tttgaactag gacactcaga gatggaagtt 3480
cttccaataa tccgacacct tttgcccctg ttgatggtcc tcctgttgat atcttgccta 3540
acaaggaatt catgctatat ggacgatctg ctaatagtcc cccatatgga gggcctgcta 3600
atgatccacc atatggaaga cctgccattg atccaccata tggaagacca atatccacaa 3660
tatggaagac ctgccaatga tccaccatat agaagacctg tcaatgatac atcatattga 3720
gggttgaaca atgatgggcc tcgtgatcag gcccggtcct gaggggggtc gaatggggcg 3780
atcgctccgg gccccccgat tcccagggcc cccacctatc tgtgcaacga gtagtagcga 3840
tcttccagcg cgcaacgtga ggcgatgttt ctccgtgatt tcgccggcct gcaactgcga 3900
gatcgcgagt ataacgatca gccgatcgat ctcatctgcc gactgccatg ctgatgccac 3960
acgcaagcgc agcatatcag ccttatcttg gttgatcggc atgctggacg agcacatctg 4020
ttgtcgcatc aactgctgac tgctatatat gtgctggtgc tgaatcgatc gattgtcgtc 4080
acggaagtga agaacaacca cggcactgct gcctgctggg ctctagccgc catcagtaag 4140
ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc actgggtatc 4200
caggtggctc tgtcgaattg tggattccaa atagttaact ggagtctgtc attggtgttg 4260
gtggtgtcaa tctagctgag atccgtctgg tatagcgtaa gagaaacatc atgcactatc 4320
cccagtcata accatgcccc aatggccacc aatagttttc ctcgtgaaaa tctccccttg 4380
atcccagatc tctggtgcga gagtgaagtt gcacgaagcc catcctggtt cttccgagtc 4440
cattgtggag atccagggca ttccggatca agtgaaagcc gcacagagcc ttctgcaagg 4500
cttcatcggc gcaagcagca acagcaggca ggcgccccag tcctctcgca tggcccatta 4560
tttttagtaa gctggaggac attcgcaaca ggggggtcag tggtcactgc aaagctgagt 4620
ttgttcttca gttcaactgc agaaaattgc agatcggttg ccgtagttgc tagaacggta 4680
catagttgcc acctaactgt agcgagtggc ataacttatt gtgtgttact gcccaatgtt 4740
gtctctcctt gtgttcatgg attcagactt gtgattgtag tatttctgga tcagactgga 4800
gtaaaagaaa aaaaaaaagg aagacatggg tttaacagta agctcaaaac gttgacagta 4860
gtaaaataaa aggggtttgt tcactttaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4978
<210>73
<211>4722
<212>DNA
<213>稻
<400>73
cgccgatctc ctacaccatc cctgccatct cctccttccc ctcccctcta tcctccactg 60
gtgccgccca cctctccgta taagacaaac tgcgttgcgg cgttggtttc cgccggcgct 120
gctgctgcac ctgtcagcta gggcgggcat ggcgcgccgc gccgcttccc gcgctgttgg 180
cgcccttcgc tcggacggct cgatccaagg gcgaggaggc cgcgcggggg gcagtggcgc 240
cgaggacgca cgccacgtgt tcgacgaatt gctccgccgt ggcaggggcg cctcgatcta 300
cggcttgaac cgcgccctcg ccgacgtcgc gcgtgacagc cccgcggccg ccgtgtcccg 360
ctacaaccgc atggcccgag ccggcgccga cgaggtaact cccgacttgt gcacctacgg 420
cattctcatc ggttgctgct gccgcgcggg ccgcttggac ctcggtttcg cggccttggg 480
caatgtcatt aagaagggat ttagagtgga cgccatcgcc ttcactcctc tgctcaaggg 540
cctctgtgcc gacaagagga cgagcgacgc aatggacata gtgctccgca gaatgaccga 600
gctcggctgc ataccaaatg tcttctccta caatattctt ctcaaggggc tgtgtgatga 660
gaacagaagc caagaagctc tcgagctgct gcacatgatg gctgatgatc gaggaggagg 720
tagcccacct gatgtggtgt cgtataccac tgtcatcaat ggcttcttca aagaggggga 780
ttcagacaaa gcttacagta cataccatga aatgctggac cgggggattt tacctgatgt 840
tgtgacctac aactctatta ttgctgcgtt atgcaaggct caagctatgg acaaagccat 900
ggaggtactt aacaccatgg ttaagaatgg tgtcatgcct gattgcatga catataatag 960
tattctgcat ggatattgct cttcagggca gccgaaagag gctattggat ttctcaaaaa 1020
gatgcgcagt gatggtgtcg aaccagatgt tgttacttat agcttgctca tggattatct 1080
ttgcaagaac ggaagatgca tggaagctag aaagattttc gattctatga ccaagagggg 1140
cctaaagcct gaaattacta cctatggtac cctgcttcag gggtatgcta ccaaaggagc 1200
ccttgttgag atgcatggtc tcttggattt gatggtacga aacggtatcc accctgatca 1260
ttatgttttc agcattctaa tatgtgcata cgctaaacaa gggaaagtag atcaggcaat 1320
gcttgtgttc agcaaaatga ggcagcaagg attgaatccg aatgcagtga cgtatggagc 1380
agttataggc atactttgca agtcaggcag agtagaagat gctatgcttt attttgagca 1440
gatgatcgat gaaggactaa gccctggcaa cattgtttat aactccctaa ttcatggttt 1500
gtgcacctgt aacaaatggg agagggctga agagttaatt cttgaaatgt tggatcgagg 1560
catctgtctg aacactattt tctttaattc aataattgac agtcattgca aagaagggag 1620
ggttatagaa tctgaaaaac tctttgagct gatggtacgt attggtgtga agcccaatgt 1680
cattacctac aatactctta tcaatggata ttgcttggca ggtaagatgg atgaagcaat 1740
gaagttactt tctggcatgg tctcagttgg gttgaaacct aatactgtta cttatagcac 1800
tttgattaat ggctactgca aaattagtag gatggaagac gcgttagttc tttttaagga 1860
gatggagagc agtggtgtta gtcctgatat tattacgtat aacataattc tgcaaggttt 1920
atttcaaacc agaagaactg ctgctgcaaa agaactctat gttaggatta ccgaaagtgg 1980
aacgcagatt gaacttagca catacaacat aatccttcat ggactttgca aaaacaaact 2040
cactgatgat gcacttcaga tgtttcagaa cctatgtttg atggatttga agcttgaggc 2100
taggactttc aacattatga ttgatgcatt gcttaaagtt ggcagaaatg atgaagccaa 2160
ggatttgttt gttgctttct cgtctaacgg tttagtgccg aattattgga cgtacaggtt 2220
gatggctgaa aatattatag gacaggggtt gctagaagaa ttggatcaac tctttctttc 2280
aatggaggac aatggctgta ctgttgactc tggcatgcta aatttcattg ttagggaact 2340
gttgcagaga ggtgagataa ccagggctgg cacttacctt tccatgattg atgagaagca 2400
cttttccctc gaagcatcca ctgcttcctt gtttatagat cttttgtctg ggggaaaata 2460
tcaagaatat tataggtttc tccctgaaaa atacaagtcc tttatagaat ctttgagctg 2520
ctgaagcatt ttgcagcttt gaaattctgt gttggaattc ttttctccta cagtcctatt 2580
agaggaggga tcttctctgt atgtgtaaat agcgagtttg aatgctagtg gaagctcctt 2640
tgaccatgtt ttgttgtgcg agcatttaag agagtgaaga gaatgcttct ttggtgctgt 2700
tctggtatgg aaggatccac agataaaatt caggttctac tgcttctctg cttgtaattt 2760
tcatgaagct gcagtgaata ccttgttgac cacttgatct gttgctttga aggagaatat 2820
agtagtggcc aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac 2880
ccagagagga ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc 2940
aaggcctccc gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa 3000
tttctggtgc agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa 3060
gaaaggttaa ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt 3120
gaggcgctta ttttgctcca tagtaaagtg gaaaggtaat tactgaaatg agaagacgga 3180
ctggggctga aatccgagtc tactcaaaag cagataaacc taagtacctg tcttttgatg 3240
aggagcttgt gcaggttgct gggcttccag ctattgaaag aggagccctg acagagattg 3300
cttcgaggct ttgaactagg acactcagag atggaagttc ttccaataat ccgacacctt 3360
ttgcccctgt tgatggtcct cctgttgata tcttgcctaa caaggaattc atgctatatg 3420
gacgatctgc taatagtccc ccatatggag ggcctgctaa tgatccacca tatggaagac 3480
ctgccattga tccaccatat ggaagaccaa tatccacaat atggaagacc tgccaatgat 3540
ccaccatata gaagacctgt caatgataca tcatattgag ggttgaacaa tgatgggcct 3600
cgtgatcagg cccggtcctg aggggggtcg aatggggcga tcgctccggg ccccccgatt 3660
cccagggccc ccacctatct gtgcaacgag tagtagcgat cttccagcgc gcaacgtgag 3720
gcgatgtttc tccgtgattt cgccggcctg caactgcgag atcgcgagta taacgatcag 3780
ccgatcgatc tcatctgccg actgccatgc tgatgccaca cgcaagcgca gcatatcagc 3840
cttatcttgg ttgatcggca tgctggacga gcacatctgt tgtcgcatca actgctgact 3900
gctatatatg tgctggtgct gaatcgatcg attgtcgtca cggaagtgaa gaacaaccac 3960
ggcactgctg cctgctgggc tctagccgcc atcagctgcg gagctgatcc atggacgtga 4020
ggattaccga agactgtcag gtctcactgg gtatccaggt ggctctgtcg aattgtggat 4080
tccaaatagt taactggagt ctgtcattgg tgttggtggt gtcaatctag ctgagatccg 4140
tctggtatag cgtaagagaa acatcatgca ctatccccag tcataaccat gccccaatgg 4200
ccaccaatag ttttcctcgt gaaaatctcc ccttgatccc agatctctgg tgcgagagtg 4260
aagttgcacg aagcccatcc tggttcttcc gagtccattg tggagatcca gggcattccg 4320
gatcaagtga aagccgcaca gagccttctg caaggcttca tcggcgcaag cagcaacagc 4380
aggcaggcgc cccagtcctc tcgcatggcc cattattttt agtaagctgg aggacattcg 4440
caacaggggg gtcagtggtc actgcaaagc tgagtttgtt cttcagttca actgcagaaa 4500
attgcagatc ggttgccgta gttgctagaa cggtacatag ttgccaccta actgtagcga 4560
gtggcataac ttattgtgtg ttactgccca atgttgtctc tccttgtgtt catggattca 4620
gacttgtgat tgtagtattt ctggatcaga ctggagtaaa agaaaaaaaa aaaggaagac 4680
atgggtttaa cagtaaaaaa aaaaaaaaaa aaaaaaaaaa aa 4722
<210>74
<211>6164
<212>DNA
<213>稻
<400>74
cgcagaagag atcgatcgcg atctccctgc cccgacgtcg ccggccgatc tctcattctc 60
tccacgccct gctcgtcgcc gatctcctac accatccctg ccatctcctc cttcccctcc 120
cctctatcct ccactggtgc cgcccacctc tccgtataag acaaactgcg ttgcggcgtt 180
ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc gggcatggcg cgccgcgccg 240
cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat ccaagggcga ggaggccgcg 300
cggggggcag tggcgccgag gacgcacgcc acgtgttcga cgaattgctc cgccgtggca 360
ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt gacagccccg 420
cggccgccgt gtcccgctac aaccgcatgg cccgagccgg cgccgacgag gtaactcccg 480
acttgtgcac ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc ttggacctcg 540
gtttcgcggc cttgggcaat gtcattaaga agggatttag agtggacgcc atcgccttca 600
ctcctctgct caagggcctc tgtgccgaca agaggacgag cgacgcaatg gacatagtgc 660
tccgcagaat gaccgagctc ggctgcatac caaatgtctt ctcctacaat attcttctca 720
aggggctgtg tgatgagaac agaagccaag aagctctcga gctgctgcac atgatggctg 780
atgatcgagg aggaggtagc ccacctgatg tggtgtcgta taccactgtc atcaatggct 840
tcttcaaaga gggggattca gacaaagctt acagtacata ccatgaaatg ctggaccggg 900
ggattttacc tgatgttgtg acctacaact ctattattgc tgcgttatgc aaggctcaag 960
ctatggacaa agccatggag gtacttaaca ccatggttaa gaatggtgtc atgcctgatt 1020
gcatgacata taatagtatt ctgcatggat attgctcttc agggcagccg aaagaggcta 1080
ttggatttct caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt acttatagct 1140
tgctcatgga ttatctttgc aagaacggaa gatgcatgga agctagaaag attttcgatt 1200
ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt 1260
atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg 1320
gtatccaccc tgatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga 1380
aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccgaatg 1440
cagtgacgta tggagcagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta 1500
tgctttattt tgagcagatg atcgatgaag gactaagccc tggcaacatt gtttataact 1560
ccctaattca tggtttgtgc acctgtaaca aatgggagag ggctgaagag ttaattcttg 1620
aaatgttgga tcgaggcatc tgtctgaaca ctattttctt taattcaata attgacagtc 1680
attgcaaaga agggagggtt atagaatctg aaaaactctt tgagctgatg gtacgtattg 1740
gtgtgaagcc caatgtcatt acctacaata ctcttatcaa tggatattgc ttggcaggta 1800
agatggatga agcaatgaag ttactttctg gcatggtctc agttgggttg aaacctaata 1860
ctgttactta tagcactttg attaatggct actgcaaaat tagtaggatg gaagacgcgt 1920
tagttctttt taaggagatg gagagcagtg gtgttagtcc tgatattatt acgtataaca 1980
taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtta 2040
ggattaccga aagtggaacg cagattgaac ttagcacata caacataatc cttcatggac 2100
tttgcaaaaa caaactcact gatgatgcac ttcagatgtt tcagaaccta tgtttgatgg 2160
atttgaagct tgaggctagg actttcaaca ttatgattga tgcattgctt aaagttggca 2220
gaaatgatga agccaaggat ttgtttgttg ctttctcgtc taacggttta gtgccgaatt 2280
attggacgta caggttgatg gctgaaaata ttataggaca ggggttgcta gaagaattgg 2340
atcaactctt tctttcaatg gaggacaatg gctgtactgt tgactctggc atgctaaatt 2400
tcattgttag ggaactgttg cagagaggtg agataaccag ggctggcact tacctttcca 2460
tgattgatga gaagcacttt tccctcgaag catccactgc ttccttgttt atagatcttt 2520
tgtctggggg aaaatatcaa gaatattata ggtttctccc tgaaaaatac aagtccttta 2580
tagaatcttt gagctgctga agcattttgc agctttgaaa ttctgtgttg gaattctttt 2640
ctcctacagt cctattagag gagggatctt ctctgtatgt gtaaatagcg aggtatgtat 2700
gccacctctc cgaattattt ttactgtggt tcctagactg taaacaagca attatgttat 2760
gctgttgatg ccagaaaaaa cataaaagtt tgtcgttatc tctactaacg gatcataaag 2820
ggatttgtga ctggagtttc aaacttaatg tgtctaggca gtaattttga cattagatcc 2880
aaaacaattt atagggtttc attaaatttc atctatgtgt actgtttagg tgttgaatag 2940
tttgacttgt tttttaactg aacaaaagat atgtctgaag ctttgttctt taccaaatgc 3000
agtactgatc atcacaatat attttttatg gaacaagatt ggattgtata gaatggtttc 3060
tgatctgatt atcttatctc aacgtattat tatgcacatg tactaatcat gaaatatctg 3120
atggaatgat gtttctattt acctgtgtga ggcagcaagg agtgagatgg ataacaccac 3180
atactccctc tgtcccagaa tataagaagt tttagagttg gacacgatta ttaagaaagt 3240
aggtagaagt gagtagtgga gggttgtgat tgcatgagta gtggaggtag gtgggaaaag 3300
tgaatggtgg agggttgtga ttggttggga agagaatgtt ggtagagaag ttgttatatt 3360
ttggggagta cattattatt ctagaacaat actgttgtgc tcaagaagcg ttccaaagat 3420
gtttcacaac ctgtgctcga tgggttttga gcttaatcct gggacattca gtatcatgat 3480
ctgtctcatt cttaaacatg gaataaagga tgacagcatg atttctttgt ctctataatc 3540
ttttggctac ccacagataa tagctgtaaa tctatactac tttaaaagga gtagtggtgg 3600
tggtgagtgg tgaatctgcc accaccccac caccaactct caaaattctg acatgtggga 3660
tcactgtcaa tcccttctcc aagacatgtg ggatcactgt caatcccttc tccaaaccaa 3720
ttgtatgata gaacagtgga aatcacggac agaccatgga gctctcaacc ataatcatcc 3780
ttgcgagtta ataacaaatg gagcgtaaac ttggcaagca aaaaactcaa attaattcta 3840
aaattaagct ctaggattca aaatagattt cctctctgca ttgtgctgtt atgattttta 3900
attccgtaac aacgcaaatg cattttgcta gtcttataaa gaagggttaa tgcaaatatt 3960
ctgattaaat gattgtatct atgaagtttg aatgctagtg gaagctcctt tgaccatgtt 4020
ttgttgtgcg agcatttaag agagtgaaga gaatgcttct ttggtgctgt tctggtatgg 4080
aaggatccac agataaaatt caggttctac tgcttctctg cttgtaattt tcatgaagct 4140
gcagtgaata ccttgttgac cacttgatct gttgctttga aggagaatat agtagtggcc 4200
aaggttggtg acggtgatgg tggcatgtga tcccccagat cttcagtgac ccagagagga 4260
ggggacggcg cgtggtgagc tacaaggcat actcagtgga gggcaagatc aaggcctccc 4320
gtccgtaggg gactccgctg catcaaggcc aactgctccg aactgatcaa tttctggtgc 4380
agacaggtgc ttgcggtcag gttaaagaag ttggcaaaaa tgcttctgaa gaaaggttaa 4440
ttgttgtttc atctcaggag attccagatg atccagtgtc tccaacaatt gaggcgctta 4500
ttttgctcca tagtaaagta agtacacttg ctgagaacca ccagttgaca acacggcttg 4560
ttgtaccatc aaacaaagtt ggttgtattc ttggggaagg tggaaaggta attactgaaa 4620
tgagaagacg gactggggct gaaatccgag tctactcaaa agcagataaa cctaagtacc 4680
tgtcttttga tgaggagctt gtgcaggttg ctgggcttcc agctattgaa agaggagccc 4740
tgacagagat tgcttcgagg ctttgaacta ggacactcag agatggaagt tcttccaata 4800
atccgacacc ttttgcccct gttgatggtc ctcctgttga tatcttgcct aacaaggaat 4860
tcatgctata tggacgatct gctaatagtc ccccatatgg agggcctgct aatgatccac 4920
catatggaag acctgccatt gatccaccat atggaagacc aatatccaca atatggaaga 4980
cctgccaatg atccaccata tagaagacct gtcaatgata catcatattg agggttgaac 5040
aatgatgggc ctcgtgatca ggcccggtcc tgaggggggt cgaatggggc gatcgctccg 5100
ggccccccga ttcccagggc ccccacctat ctgtgcaacg agtagtagcg atcttccagc 5160
gcgcaacgtg aggcgatgtt tctccgtgat ttcgccggcc tgcaactgcg agatcgcgag 5220
tataacgatc agccgatcga tctcatctgc cgactgccat gctgatgcca cacgcaagcg 5280
cagcatatca gccttatctt ggttgatcgg catgctggac gagcacatct gttgtcgcat 5340
caactgctga ctgctatata tgtgctggtg ctgaatcgat cgattgtcgt cacggaagtg 5400
aagaacaacc acggcactgc tgcctgctgg gctctagccg ccatcagctg cggagctgat 5460
ccatggacgt gaggattacc gaagactgtc aggtctcact gggtatccag gtggctctgt 5520
cgaattgtgg attccaaata gttaactgga gtctgtcatt ggtgttggtg gtgtcaatct 5580
agctgagatc cgtctggtat agcgtaagag aaacatcatg cactatcccc agtcataacc 5640
atgccccaat ggccaccaat agttttcctc gtgaaaatct ccccttgatc ccagatctct 5700
ggtgcgagag tgaagttgca cgaagcccat cctggttctt ccgagtccat tgtggagatc 5760
cagggcattc cggatcaagt gaaagccgca cagagccttc tgcaaggctt catcggcgca 5820
agcagcaaca gcaggcaggc gccccagtcc tctcgcatgg cccattattt ttagtaagct 5880
ggaggacatt cgcaacaggg gggtcagtgg tcactgcaaa gctgagtttg ttcttcagtt 5940
caactgcaga aaattgcaga tcggttgccg tagttgctag aacggtacat agttgccacc 6000
taactgtagc gagtggcata acttattgtg tgttactgcc caatgttgtc tctccttgtg 6060
ttcatggatt cagacttgtg attgtagtat ttctggatca gactggagta aaagaaaaaa 6120
aaaaaggaag acatgggttt aacagtaaaa aaaaaaaaaa aaaa 6164
<210>75
<211>791
<212>PRT
<213>稻
<400>75
Met Ala Arg Arg Ala Ala Ser Arg Ala Val Gly Ala Leu Arg Ser
1 5 10 15
Asp Gly Ser Ile Gln Gly Arg Gly Gly Arg Ala Gly Gly Ser Gly
20 25 30
Ala Glu Asp Ala Arg His Val Phe Asp Glu Leu Leu Arg Arg Gly
35 40 45
Arg Gly Ala Ser Ile Tyr Gly Leu Asn Arg Ala Leu Ala Asp Val
50 55 60
Ala Arg Asp Ser Pro Ala Ala Ala Val Ser Arg Tyr Asn Arg Met
65 70 75
Ala Arg Ala Gly Ala Asp Glu Val Thr Pro Asp Leu Cys Thr Tyr
80 85 90
Gly Ile Leu Ile Gly Cys Cys Cys Arg Ala Gly Arg Leu Asp Leu
95 100 105
Gly Phe Ala Ala Leu Gly Asn Val Ile Lys Lys Gly Phe Arg Val
110 115 120
Asp Ala Ile Ala Phe Thr Pro Leu Leu Lys Gly Leu Cys Ala Asp
125 130 135
Lys Arg Thr Ser Asp Ala Met Asp Ile Val Leu Arg Arg Met Thr
140 145 150
Glu Leu Gly Cys Ile Pro Asn Val Phe Ser Tyr Asn Ile Leu Leu
155 160 165
Lys Gly Leu Cys Asp Glu Asn Arg Ser Gln Glu Ala Leu Glu Leu
170 175 180
Leu His Met Met Ala Asp Asp Arg Gly Gly Gly Ser Pro Pro Asp
185 190 195
Val Val Ser Tyr Thr Thr Val Ile Asn Gly Phe Phe Lys Glu Gly
200 205 210
Asp Ser Asp Lys Ala Tyr Ser Thr Tyr His Glu Met Leu Asp Arg
215 220 225
Gly Ile Leu Pro Asp Val Val Thr Tyr Asn Ser Ile Ile Ala Ala
230 235 240
Leu Cys Lys Ala Gln Ala Met Asp Lys Ala Met Glu Val Leu Asn
245 250 255
Thr Met Val Lys Asn Gly Val Met Pro Asp Cys Met Thr Tyr Asn
260 265 270
Ser Ile Leu His Gly Tyr Cys Ser Ser Gly Gln Pro Lys Glu Ala
275 280 285
Ile Gly Phe Leu Lys Lys Met Arg Ser Asp Gly Val Glu Pro Asp
290 295 300
Val Val Thr Tyr Ser Leu Leu Met Asp Tyr Leu Cys Lys Asn Gly
305 310 315
Arg Cys Met Glu Ala Arg Lys Ile Phe Asp Ser Met Thr Lys Arg
320 325 330
Gly Leu Lys Pro Glu Ile Thr Thr Tyr Gly Thr Leu Leu Gln Gly
335 340 345
Tyr Ala Thr Lys Gly Ala Leu Val Glu Met His Gly Leu Leu Asp
350 355 360
Leu Met Val Arg Asn Gly Ile His Pro Asp His Tyr Val Phe Ser
365 370 375
Ile Leu Ile Cys Ala Tyr Ala Lys Gln Gly Lys Val Asp Gln Ala
380 385 390
Met Leu Val Phe Ser Lys Met Arg Gln Gln Gly Leu Asn Pro Asn
395 400 405
Ala Val Thr Tyr Gly Ala Val Ile Gly Ile Leu Cys Lys Ser Gly
410 415 420
Arg Val Glu Asp Ala Met Leu Tyr Phe Glu Gln Met Ile Asp Glu
425 430 435
Gly Leu Ser Pro Gly Asn Ile Val Tyr Asn Ser Leu Ile His Gly
440 445 450
Leu Cys Thr Cys Asn Lys Trp Glu Arg Ala Glu Glu Leu Ile Leu
455 460 465
Glu Met Leu Asp Arg Gly Ile Cys Leu Asn Thr Ile Phe Phe Asn
470 475 480
Ser Ile Ile Asp Ser His Cys Lys Glu Gly Arg Val Ile Glu Ser
485 490 495
Glu Lys Leu Phe Glu Leu Met Val Arg Ile Gly Val Lys Pro Asn
500 505 510
Val Ile Thr Tyr Asn Thr Leu Ile Asn Gly Tyr Cys Leu Ala Gly
515 520 525
Lys Met Asp Glu Ala Met Lys Leu Leu Ser Gly Met Val Ser Val
530 535 540
Gly Leu Lys Pro Asn Thr Val Thr Tyr Ser Thr Leu Ile Asn Gly
545 550 555
Tyr Cys Lys Ile Ser Arg Met Glu Asp Ala Leu Val Leu Phe Lys
560 565 570
Glu Met Glu Ser Ser Gly Val Ser Pro Asp Ile Ile Thr Tyr Asn
575 580 585
Ile Ile Leu Gln Gly Leu Phe Gln Thr Arg Arg Thr Ala Ala Ala
590 595 600
Lys Glu Leu Tyr Val Arg Ile Thr Glu Ser Gly Thr Gln Ile Glu
605 610 615
Leu Ser Thr Tyr Asn Ile Ile Leu His Gly Leu Cys Lys Asn Lys
620 625 630
Leu Thr Asp Asp Ala Leu Gln Met Phe Gln Asn Leu Cys Leu Met
635 640 645
Asp Leu Lys Leu Glu Ala Arg Thr Phe Asn Ile Met Ile Asp Ala
650 655 660
Leu Leu Lys Val Gly Arg Asn Asp Glu Ala Lys Asp Leu Phe Val
665 670 675
Ala Phe Ser Ser Asn Gly Leu Val Pro Asn Tyr Trp Thr Tyr Arg
680 685 690
Leu Met Ala Glu Asn Ile Ile Gly Gln Gly Leu Leu Glu Glu Leu
695 700 705
Asp Gln Leu Phe Leu Ser Met Glu Asp Asn Gly Cys Thr Val Asp
710 715 720
Ser Gly Met Leu Asn Phe Ile Val Arg Glu Leu Leu Gln Arg Gly
725 730 735
Glu Ile Thr Arg Ala Gly Thr Tyr Leu Ser Met Ile Asp Glu Lys
740 745 750
His Phe Ser Leu Glu Ala Ser Thr Ala Ser Leu Phe Ile Asp Leu
755 760 765
Leu Ser Gly Gly Lys Tyr Gln Glu Tyr Tyr Arg Phe Leu Pro Glu
770 775 780
Lys Tyr Lys Ser Phe Ile Glu Ser Leu Ser Cys
785 790 791
<210>76
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>76
tctcattctc tccacgccct gctc 24
<210>77
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>77
acggcggagc aattcgtcga acac 24
<210>78
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>78
agtgtgtggc atggtgcatt tccg 24
<210>79
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>79
ctctacagga tacacggtgt aagg 24
<210>80
<211>4746
<212>DNA
<213>稻
<400>80
gccgcgcaga agagatcgat cgcgatctcc ctgccccgac gtcgccggcc gatctctcat 60
tctctccacg ccctgctcgt cgccgatctc ctacaccatc cctgccatct cctccttccc 120
ctcccctcta tcctccactg gtgccgccca cctctccgta taagacaaac tgcgttgcgg 180
cgttggtttc cgccggcgct gctgctgcac ctgtcagcta gggcgggcat ggcgcgccgc 240
gccgcttccc gcgctgttgg cgcccttcgc tcggacggct cgatccaagg gcgaggaggc 300
cgcgcggggg gcagtggcgc cgaggacgca cgccacgtgt tcgacgaatt gctccgccgt 360
ggcaggggcg cctcgatcta cggcttgaac cgcgccctcg ccgacgtcgc gcgtgacagc 420
cccgcggccg ccgtgtcccg ctacaaccgc atggcccgag ccggcgccga cgaggtaact 480
cccgacttgt gcacctacgg cattctcatc ggttgctgct gccgcgcggg ccgcttggac 540
ctcggtttcg cggccttggg caatgtcatt aagaagggat ttagagtgga cgccatcgcc 600
ttcactcctc tgctcaaggg cctctgtgcc gacaagagga cgagcgacgc aatggacata 660
gtgctccgca gaatgaccga gctcggctgc ataccaaatg tcttctccta caatattctt 720
ctcaaggggc tgtgtgatga gaacagaagc caagaagctc tcgagctgct gcacatgatg 780
gctgatgatc gaggaggagg tagcccacct gatgtggtgt cgtataccac tgtcatcaat 840
ggcttcttca aagaggggga ttcagacaaa gcttacagta cataccatga aatgctggac 900
cgggggattt tacctgatgt tgtgacctac aactctatta ttgctgcgtt atgcaaggct 960
caagctatgg acaaagccat ggaggtactt aacaccatgg ttaagaatgg tgtcatgcct 1020
gattgcatga catataatag tattctgcat ggatattgct cttcagggca gccgaaagag 1080
gctattggat ttctcaaaaa gatgcgcagt gatggtgtcg aaccagatgt tgttacttat 1140
agcttgctca tggattatct ttgcaagaac ggaagatgca tggaagctag aaagattttc 1200
gattctatga ccaagagggg cctaaagcct gaaattacta cctatggtac cctgcttcag 1260
gggtatgcta ccaaaggagc ccttgttgag atgcatggtc tcttggattt gatggtacga 1320
aacggtatcc accctgatca ttatgttttc agcattctaa tatgtgcata cgctaaacaa 1380
gggaaagtag atcaggcaat gcttgtgttc agcaaaatga ggcagcaagg attgaatccg 1440
aatgcagtga cgtatggagc agttataggc atactttgca agtcaggcag agtagaagat 1500
gctatgcttt attttgagca gatgatcgat gaaggactaa gccctggcaa cattgtttat 1560
aactccctaa ttcatggttt gtgcacctgt aacaaatggg agagggctga agagttaatt 1620
cttgaaatgt tggatcgagg catctgtctg aacactattt tctttaattc aataattgac 1680
agtcattgca aagaagggag ggttatagaa tctgaaaaac tctttgagct gatggtacgt 1740
attggtgtga agcccaatgt cattacctac aatactctta tcaatggata ttgcttggca 1800
ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct 1860
aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac 1920
gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat 1980
aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat 2040
gttaggatta ccgaaagtgg aacgcagatt gaacttagca catacaacat aatccttcat 2100
ggactttgca aaaacaaact cactgatgat gcacttcaga tgtttcagaa cctatgtttg 2160
atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt gcttaaagtt 2220
ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg tttagtgccg 2280
aattattgga cgtacaggtt gatggctgaa aatattatag gacaggggtt gctagaagaa 2340
ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc tggcatgcta 2400
aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg cacttacctt 2460
tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt gtttatagat 2520
cttttgtctg ggggaaaata tcaagaatat tataggtttc tccctgaaaa atacaagtcc 2580
tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt gttggaattc 2640
ttttctccta cagtcctatt agaggaggga tcttctctgt atgtgtaaat agcgagtttg 2700
aatgctagtg gaagctcctt tgaccatgtt ttgttgtgcg agcatttaag agagtgaaga 2760
gaatgcttct ttggtgctgt tctggtatgg aaggatccac agataaaatt cagtagtggc 2820
caaggttggt gacggtgatg gtggcatgtg atcccccaga tcttcagtga cccagagagg 2880
aggggacggc gcgtggtgag ctacaaggca tactcagtgg agggcaagat caaggcctcc 2940
cgtccgtagg ggactccgct gcatcaaggc caactgctcc gaactgatca atttctggtg 3000
cagacaggtg cttgcggtca ggttaaagaa gttggcaaaa atgcttctga agaaaggtta 3060
attgttgttt catctcagga gattccagat gatccagtgt ctccaacaat tgaggcgctt 3120
attttgctcc atagtaaagt aagtacactt gctgagaacc accagttgac aacacggctt 3180
gttgtaccat caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa 3240
atgagaagac ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac 3300
ctgtcttttg atgaggagct tgtgcaggtt gctgggcttc cagctattga aagaggagcc 3360
ctgacagaga ttgcttcgag gctttgaact aggacactca gagatggaag ttcttccaat 3420
aatccgacac cttttgcccc tgttgatggt cctcctgttg atatcttgcc taacaaggaa 3480
ttcatgctat atggacgatc tgctaatagt cccccatatg gagggcctgc taatgatcca 3540
ccatatggaa gacctgccat tgatccacca tatggaagac caatatccac aatatggaag 3600
acctgccaat gatccaccat atagaagacc tgtcaatgat acatcatatt gagggttgaa 3660
caatgatggg cctcgtgatc aggcccggtc ctgagggggg tcgaatgggg cgatcgctcc 3720
gggccccccg attcccaggg cccccaccta tctgtgcaac gagtagtagc gatcttccag 3780
cgcgcaacgt gaggcgatgt ttctccgtga tttcgccggc ctgcaactgc gagatcgcga 3840
gtataacgat cagccgatcg atctcatctg ccgactgcca tgctgatgcc acacgcaagc 3900
gcagcatatc agccttatct tggttgatcg gcatgctgga cgagcacatc tgttgtcgca 3960
tcaactgctg actgctatat atgtgctggt gctgaatcga tcgattgtcg tcacggaagt 4020
gaagaacaac cacggcactg ctgcctgctg ggctctagcc gccatcagct gcggagctga 4080
tccatggacg tgaggattac cgaagactgt caggtctcac tgggtatcca ggtggctctg 4140
tcgaattgtg gattccaaat agttaactgg agtctgtcat tggtgttggt ggtgtcaatc 4200
tagctgagat ccgtctggta tagcgtaaga gaaacatcat gcactatccc cagtcataac 4260
catgccccaa tggccaccaa tagttttcct cgtgaaaatc tccccttgat cccagatctc 4320
tggtgcgaga gtgaagttgc acgaagccca tcctggttct tccgagtcca ttgtggagat 4380
ccagggcatt ccggatcaag tgaaagccgc acagagcctt ctgcaaggct tcatcggcgc 4440
aagcagcaac agcaggcagg cgccccagtc ctctcgcatg gcccattatt tttagtaagc 4500
tggaggacat tcgcaacagg ggggtcagtg gtcactgcaa agctgagttt gttcttcagt 4560
tcaactgcag aaaattgcag atcggttgcc gtagttgcta gaacggtaca tagttgccac 4620
ctaactgtag cgagtggcat aacttattgt gtgttactgc ccaatgttgt ctctccttgt 4680
gttcatggat tcagacttgt gattgtagta tttctggatc agactggagt aaaagaaaaa 4740
aaaaaa 4746
<210>81
<211>4779
<212>DNA
<213>稻
<400>81
tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg ccatctcctc 60
cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag acaaactgcg 120
ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc gggcatggcg 180
cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat ccaagggcga 240
ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga cgaattgctc 300
cgccgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga cgtcgcgcgt 360
gacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagccgg cgccgacgag 420
gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg cgcgggccgc 480
ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag agtggacgcc 540
atcgccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag cgacgcaatg 600
gacatagtgc tccgcagaat gaccgagctc ggctgcatac caaatgtctt ctcctacaat 660
attcttctca aggggctgtg tgatgagaac agaagccaag aagctctcga gctgctgcac 720
atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta taccactgtc 780
atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata ccatgaaatg 840
ctggaccggg ggattttacc tgatgttgtg acctacaact ctattattgc tgcgttatgc 900
aaggctcaag ctatggacaa agccatggag gtacttaaca ccatggttaa gaatggtgtc 960
atgcctgatt gcatgacata taatagtatt ctgcatggat attgctcttc agggcagccg 1020
aaagaggcta ttggatttct caaaaagatg cgcagtgatg gtgtcgaacc agatgttgtt 1080
acttatagct tgctcatgga ttatctttgc aagaacggaa gatgcatgga agctagaaag 1140
attttcgatt ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg 1200
cttcaggggt atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg 1260
gtacgaaacg gtatccaccc tgatcattat gttttcagca ttctaatatg tgcatacgct 1320
aaacaaggga aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg 1380
aatccgaatg cagtgacgta tggagcagtt ataggcatac tttgcaagtc aggcagagta 1440
gaagatgcta tgctttattt tgagcagatg atcgatgaag gactaagccc tggcaacatt 1500
gtttataact ccctaattca tggtttgtgc acctgtaaca aatgggagag ggctgaagag 1560
ttaattcttg aaatgttgga tcgaggcatc tgtctgaaca ctattttctt taattcaata 1620
attgacagtc attgcaaaga agggagggtt atagaatctg aaaaactctt tgagctgatg 1680
gtacgtattg gtgtgaagcc caatgtcatt acctacaata ctcttatcaa tggatattgc 1740
ttggcaggta agatggatga agcaatgaag ttactttctg gcatggtctc agttgggttg 1800
aaacctaata ctgttactta tagcactttg attaatggct actgcaaaat tagtaggatg 1860
gaagacgcgt tagttctttt taaggagatg gagagcagtg gtgttagtcc tgatattatt 1920
acgtataaca taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa 1980
ctctatgtta ggattaccga aagtggaacg cagattgaac ttagcacata caacataatc 2040
cttcatggac tttgcaaaaa caaactcact gatgatgcac ttcagatgtt tcagaaccta 2100
tgtttgatgg atttgaagct tgaggctagg actttcaaca ttatgattga tgcattgctt 2160
aaagttggca gaaatgatga agccaaggat ttgtttgttg ctttctcgtc taacggttta 2220
gtgccgaatt attggacgta caggttgatg gctgaaaata ttataggaca ggggttgcta 2280
gaagaattgg atcaactctt tctttcaatg gaggacaatg gctgtactgt tgactctggc 2340
atgctaaatt tcattgttag ggaactgttg cagagaggtg agataaccag ggctggcact 2400
tacctttcca tgattgatga gaagcacttt tccctcgaag catccactgc ttccttgttt 2460
atagatcttt tgtctggggg aaaatatcaa gaatattata ggtttctccc tgaaaaatac 2520
aagtccttta tagaatcttt gagctgctga agcattttgc agctttgaaa ttctgtgttg 2580
gaattctttt ctcctacagt cctattagag gagggatctt ctctgtatgt gtaaatagcg 2640
agtttgaatg ctagtggaag ctcctttgac catgttttgt tgtgcgagca tttaagagag 2700
tgaagagaat gcttctttgg tgctgttctg gtatggaagg atccacagat aaaattcagg 2760
agaatatagt agtggccaag gttggtgacg gtgatggtgg catgtgatcc cccagatctt 2820
cagtgaccca gagaggaggg gacggcgcgt ggtgagctac aaggcatact cagtggaggg 2880
caagatcaag gcctcccgtc cgtaggggac tccgctgcat caaggccaac tgctccgaac 2940
tgatcaattt ctggtgcaga caggtgcttg cggtcaggtt aaagaagttg gcaaaaatgc 3000
ttctgaagaa aggttaattg ttgtttcatc tcaggagatt ccagatgatc cagtgtctcc 3060
aacaattgag gcgcttattt tgctccatag taaagtaagt acacttgctg agaaccacca 3120
gttgacaaca cggcttgttg taccatcaaa caaagttggt tgtattcttg gggaaggtgg 3180
aaaggtaatt actgaaatga gaagacggac tggggctgaa atccgagtct actcaaaagc 3240
agataaacct aagtacctgt cttttgatga ggagcttgtg caggttgctg ggcttccagc 3300
tattgaaaga ggagccctga cagagattgc ttcgaggctt tgaactagga cactcagaga 3360
tggaagttct tccaataatc cgacaccttt tgcccctgtt gatggtcctc ctgttgatat 3420
cttgcctaac aaggaattca tgctatatgg acgatctgct aatagtcccc catatggagg 3480
gcctgctaat gatccaccat atggaagacc tgccattgat ccaccatatg gaagaccaat 3540
atccacaata tggaagacct gccaatgatc caccatatag aagacctgtc aatgatacat 3600
catattgagg gttgaacaat gatgggcctc gtgatcaggc ccggtcctga ggggggtcga 3660
atggggcgat cgctccgggc cccccgattc ccagggcccc cacctatctg tgcaacgagt 3720
agtagcgatc ttccagcgcg caacgtgagg cgatgtttct ccgtgatttc gccggcctgc 3780
aactgcgaga tcgcgagtat aacgatcagc cgatcgatct catctgccga ctgccatgct 3840
gatgccacac gcaagcgcag catatcagcc ttatcttggt tgatcggcat gctggacgag 3900
cacatctgtt gtcgcatcaa ctgctgactg ctatatatgt gctggtgctg aatcgatcga 3960
ttgtcgtcac ggaagtgaag aacaaccacg gcactgctgc ctgctgggct ctagccgcca 4020
tcagctgcgg agctgatcca tggacgtgag gattaccgaa gactgtcagg tctcactggg 4080
tatccaggtg gctctgtcga attgtggatt ccaaatagtt aactggagtc tgtcattggt 4140
gttggtggtg tcaatctagc tgagatccgt ctggtatagc gtaagagaaa catcatgcac 4200
tatccccagt cataaccatg ccccaatggc caccaatagt tttcctcgtg aaaatctccc 4260
cttgatccca gatctctggt gcgagagtga agttgcacga agcccatcct ggttcttccg 4320
agtccattgt ggagatccag ggcattccgg atcaagtgaa agccgcacag agccttctgc 4380
aaggcttcat cggcgcaagc agcaacagca ggcaggcgcc ccagtcctct cgcatggccc 4440
attattttta gtaagctgga ggacattcgc aacagggggg tcagtggtca ctgcaaagct 4500
gagtttgttc ttcagttcaa ctgcagaaaa ttgcagatcg gttgccgtag ttgctagaac 4560
ggtacatagt tgccacctaa ctgtagcgag tggcataact tattgtgtgt tactgcccaa 4620
tgttgtctct ccttgtgttc atggattcag acttgtgatt gtagtatttc tggatcagac 4680
tggagtaaaa gaaaaaaaaa aaggaagaca tgggtttaac agtaaaaaaa aaaaaaaaaa 4740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4779
<210>82
<211>6158
<212>DNA
<213>稻
<400>82
cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc 60
tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct 120
cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg 180
ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc 240
cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg 300
cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg 360
caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc 420
cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 480
cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct 540
cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 600
cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt 660
gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct 720
caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc 780
tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg 840
cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg 900
ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca 960
agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga 1020
ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc 1080
tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag 1140
cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga 1200
ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 1260
gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 1320
cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg 1380
gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 1440
tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 1500
tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 1560
ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct 1620
tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 1680
tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat 1740
tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg 1800
taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa 1860
tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc 1920
gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 1980
cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 2040
taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg 2100
actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat 2160
ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 2220
cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 2280
ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 2340
ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 2400
tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 2460
catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 2520
tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt 2580
tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 2640
ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 2700
atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt 2760
atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa 2820
agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat 2880
ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat 2940
agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat 3000
gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt 3060
tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc 3120
tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc 3180
acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa 3240
gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa 3300
agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata 3360
ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag 3420
atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg 3480
atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa 3540
tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt 3600
ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg 3660
gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc 3720
aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat 3780
ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc 3840
taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt 3900
taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata 3960
ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg 4020
ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat 4080
ggaaggatcc acagataaaa ttcaggagaa tatagtagtg gccaaggttg gtgacggtga 4140
tggtggcatg tgatccccca gatcttcagt gacccagaga ggaggggacg gcgcgtggtg 4200
agctacaagg catactcagt ggagggcaag atcaaggcct cccgtccgta ggggactccg 4260
ctgcatcaag gccaactgct ccgaactgat caatttctgg tgcagacagg tgcttgcggt 4320
caggttaaag aagttggcaa aaatgcttct gaagaaaggt taattgttgt ttcatctcag 4380
gagattccag atgatccagt gtctccaaca attgaggcgc ttattttgct ccatagtaaa 4440
gtaagtacac ttgctgagaa ccaccagttg acaacacggc ttgttgtacc atcaaacaaa 4500
gttggttgta ttcttgggga aggtggaaag gtaattactg aaatgagaag acggactggg 4560
gctgaaatcc gagtctactc aaaagcagat aaacctaagt acctgtcttt tgatgaggag 4620
cttgtgcagg ttgctgggct tccagctatt gaaagaggag ccctgacaga gattgcttcg 4680
aggctttgaa ctaggacact cagagatgga agttcttcca ataatccgac accttttgcc 4740
cctgttgatg gtcctcctgt tgatatcttg cctaacaagg aattcatgct atatggacga 4800
tctgctaata gtcccccata tggagggcct gctaatgatc caccatatgg aagacctgcc 4860
attgatccac catatggaag accaatatcc acaatatgga agacctgcca atgatccacc 4920
atatagaaga cctgtcaatg atacatcata ttgagggttg aacaatgatg ggcctcgtga 4980
tcaggcccgg tcctgagggg ggtcgaatgg ggcgatcgct ccgggccccc cgattcccag 5040
ggcccccacc tatctgtgca acgagtagta gcgatcttcc agcgcgcaac gtgaggcgat 5100
gtttctccgt gatttcgccg gcctgcaact gcgagatcgc gagtataacg atcagccgat 5160
cgatctcatc tgccgactgc catgctgatg ccacacgcaa gcgcagcata tcagccttat 5220
cttggttgat cggcatgctg gacgagcaca tctgttgtcg catcaactgc tgactgctat 5280
atatgtgctg gtgctgaatc gatcgattgt cgtcacggaa gtgaagaaca accacggcac 5340
tgctgcctgc tgggctctag ccgccatcag ctgcggagct gatccatgga cgtgaggatt 5400
accgaagact gtcaggtctc actgggtatc caggtggctc tgtcgaattg tggattccaa 5460
atagttaacc ggagtctgtc attggtgttg gtggtgtcaa tctagctgag atccgtctgg 5520
tatagcgtaa gagaaacatc atgcactatc cccagtcata accatgcccc aatggccacc 5580
aatagttttc ctcgtgaaaa tctccccttg atcccagatc tctggtgcga gagtgaagtt 5640
gcacgaagcc catcctggtt cttccgagtc cattgtggag atccagggca ttccggatca 5700
agtgaaagcc gcacagagcc ttctgcaagg cttcatcggc gcaagcagca acagcaggca 5760
ggcgccccag tcctctcgca tggcccatta tttttagtaa gctggaggac attcgcaaca 5820
ggggggtcag tggtcactgc aaagctgagt ttgttcttca gttcaactgc agaaaattgc 5880
agatcggttg ccgtagttgc tagaacggta catagttgcc acctaactgt agcgagtggc 5940
ataacttatt gtgtgttact gcccaatgtt gtctctcctt gtgttcatgg attcagactt 6000
gtgattgtag tatttctgga tcagactgga gtaaaagaaa aaaaaaaagg aagacatggg 6060
tttaacagta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 6158
<210>83
<211>2864
<212>DNA
<213>稻
<400>83
aagagatcga tcgcgatctc cctgccccga cgtcgccggc cgatctctca ttctctccac 60
gccctgctcg tcgccgatct cctacaccat ccctgccatc tcctccttcc cctcccctct 120
atcctccact ggtgccgccc acctctccgt ataagacaaa ctgcgttgcg gcgttggttt 180
ccgccggcgc tgctgctgca cctgtcagct agggcgggca tggcgcgccg cgccgcttcc 240
cgcgctgttg gcgcccttcg ctcggacggc tcgatccaag ggcgaggagg ccgcgcgggg 300
ggcagtggcg ccgaggacgc acgccacgtg ttcgacgaat tgctccgccg tggcaggggc 360
gcctcgatct acggcttgaa ccgcgccctc gccgacgtcg cgcgtgacag ccccgcggcc 420
gccgtgtccc gctacaaccg catggcccga gccggcgccg acgaggtaac tcccgacttg 480
tgcacctacg gcattctcat cggttgctgc tgccgcgcgg gccgcttgga cctcggtttc 540
gcggccttgg gcaatgtcat taagaaggga tttagagtgg acgccatcgc cttcactcct 600
ctgctcaagg gcctctgtgc cgacaagagg acgagcgacg caatggacat agtgctccgc 660
agaatgaccg agctcggctg cataccaaat gtcttctcct acaatattct tctcaagggg 720
ctgtgtgatg agaacagaag ccaagaagct ctcgagctgc tgcacatgat ggctgatgat 780
cgaggaggag gtagcccacc tgatgtggtg tcgtatacca ctgtcatcaa tggcttcttc 840
aaagaggggg attcagacaa agcttacagt acataccatg aaatgctgga ccgggggatt 900
ttacctgatg ttgtgaccta caactctatt attgctgcgt tatgcaaggc tcaagctatg 960
gacaaagcca tggaggtact taacaccatg gttaagaatg gtgtcatgcc tgattgcatg 1020
acatataata gtattctgca tggatattgc tcttcagggc agccgaaaga ggctattgga 1080
tttctcaaaa agatgcgcag tgatggtgtc gaaccagatg ttgttactta tagcttgctc 1140
atggattatc tttgcaagaa cggaagatgc atggaagcta gaaagatttt cgattctatg 1200
accaagaggg gcctaaagcc tgaaattact acctatggta ccctgcttca ggggtatgct 1260
accaaaggag cccttgttga gatgcatggt ctcttggatt tgatggtacg aaacggtatc 1320
caccctgatc attatgtttt cagcattcta atatgtgcat acgctaaaca agggaaagta 1380
gatcaggcaa tgcttgtgtt cagcaaaatg aggcagcaag gattgaatcc gaatgcagtg 1440
acgtatggag cagttatagg catactttgc aagtcaggca gagtagaaga tgctatgctt 1500
tattttgagc agatgatcga tgaaggacta agccctggca acattgttta taactcccta 1560
attcatggtt tgtgcacctg taacaaatgg gagagggctg aagagttaat tcttgaaatg 1620
ttggatcgag gcatctgtct gaacactatt ttctttaatt caataattga cagtcattgc 1680
aaagaaggga gggttataga atctgaaaaa ctctttgagc tgatggtacg tattggtgtg 1740
aagcccaatg tcattaccta caatactctt atcaatggat attgcttggc aggtaagatg 1800
gatgaagcaa tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt 1860
acttatagca ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt 1920
ctttttaagg agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt 1980
ctgcaaggtt tatttcaaac cagaagaact gctgctgcaa aagaactcta tgttaggatt 2040
accgaaagtg gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc 2100
aaaaacaaac tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg 2160
aagcttgagg ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat 2220
gatgaagcca aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg 2280
acgtacaggt tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa 2340
ctctttcttt caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt 2400
gttagggaac tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt 2460
gatgagaagc acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct 2520
gggggaaaat atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa 2580
tctttgagct gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct 2640
acagtcctat tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac 2700
ctctccgaat tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt 2760
tgatgccaga aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt 2820
tgtgactgga gtttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 2864
<210>84
<211>2819
<212>DNA
<213>稻
<400>84
ctcattctct ccacgccctg ctcgtcgccg atctcctaca ccatccctgc catctcctcc 60
ttcccctccc ctctatcctc cactggtgcc gcccacctct ccgtataaga caaactgcgt 120
tgcggcgttg gtttccgccg gcgctgctgc tgcacctgtc agctagggcg ggcatggcgc 180
gccgcgccgc ttcccgcgct gttggcgccc ttcgctcgga cggctcgatc caagggcgag 240
gaggccgcgc ggggggcagt ggcgccgagg acgcacgcca cgtgttcgac gaattgctcc 300
gccgtggcag gggcgcctcg atctacggct tgaaccgcgc cctcgccgac gtcgcgcgtg 360
acagccccgc ggccgccgtg tcccgctaca accgcatggc ccgagccggc gccgacgagg 420
taactcccga cttgtgcacc tacggcattc tcatcggttg ctgctgccgc gcgggccgct 480
tggacctcgg tttcgcggcc ttgggcaatg tcattaagaa gggatttaga gtggacgcca 540
tcgccttcac tcctctgctc aagggcctct gtgccgacaa gaggacgagc gacgcaatgg 600
acatagtgct ccgcagaatg accgagctcg gctgcatacc aaatgtcttc tcctacaata 660
ttcttctcaa ggggctgtgt gatgagaaca gaagccaaga agctctcgag ctgctgcaca 720
tgatggctga tgatcgagga ggaggtagcc cacctgatgt ggtgtcgtat accactgtca 780
tcaatggctt cttcaaagag ggggattcag acaaagctta cagtacatac catgaaatgc 840
tggaccgggg gattttacct gatgttgtga cctacaactc tattattgct gcgttatgca 900
aggctcaagc tatggacaaa gccatggagg tacttaacac catggttaag aatggtgtca 960
tgcctgattg catgacatat aatagtattc tgcatggata ttgctcttca gggcagccga 1020
aagaggctat tggatttctc aaaaagatgc gcagtgatgg tgtcgaacca gatgttgtta 1080
cttatagctt gctcatggat tatctttgca agaacggaag atgcatggaa gctagaaaga 1140
ttttcgattc tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc 1200
ttcaggggta tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg 1260
tacgaaacgg tatccaccct gatcattatg ttttcagcat tctaatatgt gcatacgcta 1320
aacaagggaa agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga 1380
atccgaatgc agtgacgtat ggagcagtta taggcatact ttgcaagtca ggcagagtag 1440
aagatgctat gctttatttt gagcagatga tcgatgaagg actaagccct ggcaacattg 1500
tttataactc cctaattcat ggtttgtgca cctgtaacaa atgggagagg gctgaagagt 1560
taattcttga aatgttggat cgaggcatct gtctgaacac tattttcttt aattcaataa 1620
ttgacagtca ttgcaaagaa gggagggtta tagaatctga aaaactcttt gagctgatgg 1680
tacgtattgg tgtgaagccc aatgtcatta cctacaatac tcttatcaat ggatattgct 1740
tggcaggtaa gatggatgaa gcaatgaagt tactttctgg catggtctca gttgggttga 1800
aacctaatac tgttacttat agcactttga ttaatggcta ctgcaaaatt agtaggatgg 1860
aagacgcgtt agttcttttt aaggagatgg agagcagtgg tgttagtcct gatattatta 1920
cgtataacat aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac 1980
tctatgttag gattaccgaa agtggaacgc agattgaact tagcacatac aacataatcc 2040
ttcatggact ttgcaaaaac aaactcactg atgatgcact tcagatgttt cagaacctat 2100
gtttgatgga tttgaagctt gaggctagga ctttcaacat tatgattgat gcattgctta 2160
aagttggcag aaatgatgaa gccaaggatt tgtttgttgc tttctcgtct aacggtttag 2220
tgccgaatta ttggacgtac aggttgatgg ctgaaaatat tataggacag gggttgctag 2280
aagaattgga tcaactcttt ctttcaatgg aggacaatgg ctgtactgtt gactctggca 2340
tgctaaattt cattgttagg gaactgttgc agagaggtga gataaccagg gctggcactt 2400
acccttccat gattgatgag aagcactttt ccctcgaagc atccactgct tccttgttta 2460
tagatctttt gtctggggga aaatatcaag aatattatag gtttctccct gaaaaataca 2520
agtcctttat agaatctttg agctgctgaa gcattttgca gctttgaaat tctgtgttgg 2580
aattcttttc tcctacagtc ctattagagg agggatcttc tctgtatgtg taaatagcga 2640
ggtatgtatg ccacctctcc gaattatttt tactgtggtt cctagactgt aaacaagcaa 2700
ttatgttatg ctgttgatgc cagaaaaaac ataaaagttt gtcgttatct ctactaacgg 2760
atcataaagg gatttgtgac tggagtttca aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 2819
<210>85
<211>2649
<212>DNA
<213>稻
<400>85
ggtgccgccc acctctccgt ataagacaaa ctgcgttgcg gcgttggttt ccgccggcgc 60
tgctgctgca cctgtcagct agggcgggca tggcgcgccg cgccgcttcc cgcgctgttg 120
gcgcccttcg ctcggacggc tcgatccaag ggcgaggagg ccgcgcgggg ggcagtggcg 180
ccgaggacgc acgccacgtg ttcgacgaat tgctccgccg tggcaggggc gcctcgatct 240
acggcttgaa ccgcgccctc gccgacgtcg cgcgtgacag ccccgcggcc gccgtgtccc 300
gctacaaccg catggcccga gccggcgccg acgaggtaac tcccgacttg tgcacctacg 360
gcattctcat cggttgctgc tgccgcgcgg gccgcttgga cctcggtttc gcggccttgg 420
gcaatgtcat taagaaggga tttagagtgg acgccatcgc cttcactcct ctgctcaagg 480
gcctctgtgc cgacaagagg acgagcgacg caatggacat agtgctccgc agaatgaccg 540
agctcggctg cataccaaat gtcttctcct acaatattct tctcaagggg ctgtgtgatg 600
agaacagaag ccaagaagct ctcgagctgc tgcacatgat ggctgatgat cgaggaggag 660
gtagcccacc tgatgtggtg tcgtatacca ctgtcatcaa tggcttcttc aaagaggggg 720
attcagacaa agcttacagt acataccatg aaatgctgga ccgggggatt ttacctgatg 780
ttgtgaccta caactctatt attgctgcgt tatgcaaggc tcaagctatg gacaaagcca 840
tggaggtact taacaccatg gttaagaatg gtgtcatgcc tgattgcatg acatataata 900
gtattctgca tggatattgc tcttcagggc agccgaaaga ggctattgga tttctcaaaa 960
agatgcgcag tgatggtgtc gaaccagatg ttgttactta tagcttgctc atggattatc 1020
tttgcaagaa cggaagatgc atggaagcta gaaagatttt cgattctatg accaagaggg 1080
gcctaaagcc tgaaattact acctatggta ccctgcttca ggggtatgct accaaaggag 1140
cccttgttga gatgcatggt ctcttggatt tgatggtacg aaacggtatc caccctgatc 1200
attatgtttt cagcattcta atatgtgcat acgctaaaca agggaaagta gatcaggcaa 1260
tgcttgtgtt cagcaaaatg aggcagcaag gattgaatcc gaatgcagtg acgtatggag 1320
cagttatagg catactttgc aagtcaggca gagtagaaga tgctatgctt tattttgagc 1380
agatgatcga tgaaggacta agccctggca acattgttta taactcccta attcatggtt 1440
tgtgcacctg taacaaatgg gagagggctg aagagttaat tcttgaaatg ttggatcgag 1500
gcatctgtct gaacactatt ttctttaatt caataattga cagtcattgc aaagaaggga 1560
gggttataga atctgaaaaa ctctttgagc tgatggtacg tattggtgtg aagcccaatg 1620
tcattaccta caatactctt atcaatggat attgcttggc aggtaagatg gatgaagcaa 1680
tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca 1740
ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg 1800
agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt 1860
tatttcaaac cagaagaact gctgctgcaa aagaactcta tgttaggatt accgaaagtg 1920
gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac 1980
tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg 2040
ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca 2100
aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt 2160
tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt 2220
caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac 2280
tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc 2340
acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat 2400
atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct 2460
gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat 2520
tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat 2580
tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga 2640
aaaaaaaaa 2649
<210>86
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>86
cagttgggtt gaaacctaat actg 24
<210>87
<211>24
<212>DNA
<213>人工序列
<220>
<223>用于扩增的寡核苷酸引物
<400>87
cactaaaccg ttagacgaga aagc 24