CN106471008B - 棕榈Mantle表型检测 - Google Patents

棕榈Mantle表型检测 Download PDF

Info

Publication number
CN106471008B
CN106471008B CN201580036283.8A CN201580036283A CN106471008B CN 106471008 B CN106471008 B CN 106471008B CN 201580036283 A CN201580036283 A CN 201580036283A CN 106471008 B CN106471008 B CN 106471008B
Authority
CN
China
Prior art keywords
methylation
dna
plant
seq
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580036283.8A
Other languages
English (en)
Other versions
CN106471008A (zh
Inventor
梅丽娜·恩格·阿布杜拉
黄·秀·英格
莱斯利·露·英格·狄
拉金德·辛格
拉加耐度·诺凯亚
拉维葛德伟·撒班森姆尔什
江楠
史蒂芬·W·史密斯
罗布·马尔提恩森
贾里德·奥德韦
迈克尔·霍根
纳森·D·莱基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palm Oil Research and Development Board
Original Assignee
Palm Oil Research and Development Board
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palm Oil Research and Development Board filed Critical Palm Oil Research and Development Board
Publication of CN106471008A publication Critical patent/CN106471008A/zh
Application granted granted Critical
Publication of CN106471008B publication Critical patent/CN106471008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Abstract

提供了用于预测植物中的体细胞克隆异常(例如,Mantled表型)和/或基于预测的体细胞克隆异常的存在或不存在来分拣植物的方法、组合物、试剂盒和计算机程序代码。

Description

棕榈Mantle表型检测
相关申请的交叉引用
本申请要求申请号为61/988,132,2014年5月2日提交的美国临时专利申请和申请号为 62/091,471,2014年12月12日提交的美国临时专利申请的权益,为了各种目的将其全部内容通过引用结合在本文中。
参考作为ASCII文本文件提交的“序列表”、表格或列出附录的计算机程序
序列表编写在2015年4月30日创建的文件SEQ 96380-941211_ST25.txt中,420,872字节,机器格式IBM-PC,MS-Windows操作系统,该序列表通过引用并入本文中。
背景技术
油棕属于Elaeis属,Elaeis属包含两种物种:E.guineensis和E.oleifera。油棕被认为是世界上产油最高效的含油作物,超越相同类型的所有其它作物,例如大豆、油菜籽和向日葵。平均产量3.74吨/公顷/年的产油能力,所需的土地比大豆所需的土地小10倍(OilWorld,2007),生产周期为25-30年,使油棕成为有利可图的农作物。但是,最近的油产量已经达到停滞期。然而,为供给不断增长的世界人口,预计食用油需求将逐步上升。
自从作为油料作物而引入马来西亚,油棕已经经历了至少两波已知的产量提高周期,第一波是杂交tenera(DxP)的引入,杂交tenera代替dura作为商业植物材料。这证实通过仅操纵单个基因,油产量增加高达30%(Kushairi et al.,2006;Singh et al.,2013)。然而,在过去二十年中,马来西亚的平均产油量一直徘徊于3.5至3.9吨/公顷/年之间。由于棕榈油产量下降到第二位,马来西亚和所有其它棕榈油生产国需要提高产量。农用地变得稀少的事实进一步加剧了这种情况。因此,通过更大面积的种植来增加生产不再被视为替代方案。
通过多年的育种和选择,棕榈油工业已经产生了高达13.6吨/公顷/年(接近18.2吨/公顷/年的理论产量(Corley,1998))的棕榈(Sharma and Tan,1999)。最佳实验图产生了平均为9.8 吨/公顷/年的棕榈油(Musa and Gurmit,2008),并且选择的后代能够达到12.2吨/公顷/年 (Rajanaidu et al.,1990)。克隆这些超级棕榈可以为该行业提供急需的高产量种植材料,使其走出停滞。因此,商用克隆被吹捧为第二波油棕改良作物。
由于其生物结构,油棕没有天然的营养繁殖手段,常规杂交育种方法将需要至少三代,或超过20年,以实现这种优良的产量(Soh et al.,2005)。20世纪70年代首次描述了成功的油棕营养繁殖(Jones,1974;Rabechault and Martin,1976)。Jones(1995)对其发育给出了一个相当全面的个人见解。这些油棕克隆的成功报道促进组织培养实验室的发展,从而提供克隆油棕种植材料。来自早期田间试验的令人鼓舞的结果起领头作用,为更多的实验室所效仿。到 80年代中期,马来西亚(Wooi,1990)和其它地方(Le Guen et al.,1991)已有10个克隆油棕实验室。
然而,当Corley等人(1986)首次报道mantling现象(注:果实表面被覆盖的异常现象,可能会导致油棕没有收成)时,由开拓型Bakasawit/Unifield和Tropiclone商业实验室领导的整个克隆行业决定减少生产,并恢复研究和开发。当时,带头研究克隆异常的任务指派给马来西亚棕榈油研究所(PORIM,Palm Oil Research Institute of Malaysia),马来西亚棕榈油研究所是棕榈油行业的保管机构,现在被称为马来西亚棕榈油董事会(MPOB,Malaysian Palm Oil Board)。
通过一致的努力,到20世纪90年代初,获得的结果表明,需要建立更好的组织培养方案,其中包括继代培养过程和使用破坏性较小的生长调节剂类型。还提出了替代方法,例如悬浮和原生质体培养,作为避免继代培养的手段。克隆Dura和pisifera亲本,然后进行常规杂交,以规避克隆teneras潜在发生的体细胞克隆变异,在讨论的不同方法中(Ong-Abdullah,Viva 562/2011)。有趣的是,高达10%的异常棕榈自发回复正常,并在一段时间内保持正常 (Durand-Gasselin et al.,1990)。由Mantled果实(例如,克隆115E)发育的幼苗是正常的,从而推翻了异常是由于显性基因效应或母本传播因子的可能性。通过由Rao和Donough (1990)进行的常规遗传杂交,这种性状也表现出以非孟德尔方式呈现。
早期尝试采用以下技术,比如流式细胞术,随机扩增多态性DNA(RAPD)或经典扩增片段长度多态性(AFLP)分析,不能在Mantled棕榈和正常棕榈之间产生任何可检测的差异(Rival et al.1997,1998;Matthes et al.2001)。然而,当利用甲基化敏感性或相关技术时,似乎改变了 Mantled基因组的甲基化水平(Jaligot et al.2002,Matthes etal.2001,Jaligot et al.2004)。
随后,进一步的研究集中在理解mantling的根本分子学起因和表观遗传调节上。还已知在 Mantled油棕中,雌能花的退化雄蕊和雄蕊分别发育为假心皮(Morcillo etal.,2006)。在严重的情况下,花不育,并且不结果,导致产量较低。据推测,由于进行了同源异型修饰,产生花器官特性的ABCDE模型的B功能同源异型MADS盒基因(Murai,2013)很可能参与其中。
根据MADS盒假设,使用针对MADS盒的剖析技术(van der Linden et al.2002)从油棕分离含MADS盒的基因(Alwee et al.,2006;Auyong,2006)。该方法允许正常油棕、异常油棕和回复油棕中的MADS盒附近的限制性位点中的DNA多态性可视化。识别了两种标记,即MM77和MM78(EP专利申请号13162130.2),并且尽管已经发现MM78不属于MADS盒基因类,但其仍广泛用于进一步确认。在确认MM78的过程中和其它不相关标记物的过去经验中,证实这些标记物的功能性用途是具有基因型依赖性的。因此,当在来自其它遗传背景的克隆上测试时,它们很少使用或不使用。这是生物标记物开发在油棕的克隆保真性上的主要争论点。
先前研究已经发现,相对于原株和正常分株,mantled棕榈中DNA甲基化总体上减少(Jaligot et al.2000;Matthes et al.2001;Jaligot et al.2002;Jaligot etal.2004)。这些结果与拟南芥和其它植物细胞培养物的观察结果类似,其中转座因子(TE)低甲基化并表达(Tanurdzic et al.2008; Miguel et al.2011;Castilho et al.2000;Kubis et al.2003)。除了TE,水稻和玉米中的体细胞克隆再生体经历了广泛的基因和启动子低甲基化(Stroud et al.2013;Stelpflug et al.2014),这也可能有助于油棕和其它作物中的体细胞克隆变异。在mantled棕榈中观察到的同源异型转化类似于B功能MADS盒基因缺失,表明一个或多个MADS盒基因内的逆转录因子或MADS 盒基因本身是表观遗传修饰的候选者(Adam et al.2005)。然而,几十年来对候选逆转录因子(Castilho et al.2000;Kubis et al.2003;Jaligot et al.2014)和候选同源异型基因(Syed Alwee et al.2006;Adam et al.2007;Jaligot et al.2014)中DNA甲基化变化的研究尚未识别出在体细胞克隆mantled棕榈中一致出现的表观遗传变化。事实上,由组织培养再生的水稻和拟南芥植物的近期研究表明造成体细胞克隆变异的原因是遗传机制而不是表观遗传机制(Jiang etal.2011;Miyao et al.2012)。
发明内容
本文描述了用于预测油棕植物、植物细胞或植物组织中存在或不存在体细胞克隆异常(例如, Mantled)的方法、组合物和试剂盒。在一些实施例中,本发明提供了分离油棕植物的方法,该方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域 (DMR)内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、 80%、90%、95%或99%一致,或一致的DNA序列内;c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常;和d)对预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。
在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,确定步骤包括:确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和 72的序列至少90%,95%或99%一致,或一致。
在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQ ID NO:63、64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、 44、45、46、48、49、51、52、57、58、59、60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、 16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常.
在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、68和69 (或选自SEQ ID NO:63、64、65、66、67、68、69和70))的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、37、38、 41、42、47、50、52、53、54、55、56、57、62和74的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、9、10、13、14、19、 22、24、25、26、27、28、29、34和72的序列至少90%、95%或99%一致,或一致的生物标记物中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。
在一些方面,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%或 90%、95%或99%一致,或一致的DNA序列内。在一些方面,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、 67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,每个DMR处于来自所述植物的样品的DNA区域内,其中所述DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定在每个DMR的生物标记物中至少一个胞嘧啶的甲基化状态,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、71和72的序列至少90%、95%或99%一致,或一致。
在任何前述实施例、方面或情况中,体细胞克隆异常可包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。
在任何前述实施例、方面或情况中,确定甲基化状态可包括亚硫酸氢盐转化;和/或确定甲基化状态可包括用甲基化依赖性内切核酸酶消化基因组DNA;和/或确定甲基化状态可包括用甲基化敏感性内切核酸酶消化基因组DNA;和/或确定甲基化状态可以包括测量测序期间甲基化碱基并入的速率;和/或确定甲基化状态可以包括当包括测量甲基化碱基的分子通过纳米孔时的电流。在任何前述实施例、方面或情况中,确定甲基化状态可以包括甲基化DNA免疫沉淀、通过亲和纯化的甲基化DNA捕获或简化代表性亚硫酸氢盐测序。在任何前述实施例、方面或情况中,确定甲基化状态可以包括核酸杂交,例如微阵列或珠阵列杂交。
在任何前述实施例、方面或情况中,物理分离可以包括选择被预测为体细胞克隆异常的植物进行破坏;和/或选择预测缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽,种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。
在一些实施例中,本发明提供用于确定油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%,80%,90%,95%或99%一致,或一致的DNA序列内;以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。
在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自 SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述 DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、 48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、 80%、90%、95%或99%一致,或一致。在一些方面,所述至少一个胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ IDNO:7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。
在一些方面,对照值是植物外源的对照基因座的甲基化值。在一些方面,对照值是植物内源的对照基因座的甲基化值。
在一些方面,其中所述程序代码包括用于接收至少两个、三个或四个不同DMR中的至少一个胞嘧啶的甲基化状态的程序代码,其中每个DMR独立地处于与SEQ ID NO:1至少70%、 80%、90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品中的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、 65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于来自所述植物的样品中的DNA区域内,其中每个DNA区域与独立地选自SEQ IDNO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、 51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、 95%或99%一致,或一致。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、 95%或99%一致,或一致。
在任何前述计算机程序产品中,在一些情况下,所述计算机程序产品可以预测植物中存在或不存在体细胞克隆异常。在一些情况下,体细胞克隆异常呈现出Mantled表型。
在一些实施例中,本发明提供用于确定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,所述试剂盒包含:(1)多核苷酸(例如,可检测地标记的多核苷酸)或成对的多核苷酸(例如,其中可检测地标记所述对中的一条或两条多核苷酸),其能够特异性扩增至少一部分DMR,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;和甲基化依赖性,甲基化敏感性限制酶和/或亚硫酸氢钠;或(2)亚硫酸氢钠、用于全基因组扩增的引物和接头,以及至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的转化的甲基化序列和/或转化的未甲基化序列的存在,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(3) 甲基化敏感性限制酶,用于全基因组扩增的引物和接头,和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(4)甲基化感测结合部分和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内。
在一些方面,DMR处于来自所述植物的样品的DNA元区内,其中DNA元区与选自SEQID NO:63、64、65、66、67、68、69和70的序列至少70%,80%,90%,95%或99%一致或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、 52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、 95%或99%一致,或一致。在一些情况中,DMR处于生物标记物内,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致或一致。
在一些方面,所述试剂盒包含能够特异性扩增两个、三个或四种不同DMR的至少一部分的至少两种、三种或四种多核苷酸或两对、三对或四对多核苷酸,其中每个DMR是独立地处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于DNA元区内,其中所述DNA元区与独立地选自SEQ ID NO:63、 64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、 73和74的序列至少70%、80%、90%、95%或99%一致或一致的DNA序列内。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、71和72的序列至少90%、95%或99%一致或一致。
在一些方面,试剂盒还包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。在一些情况下,多核苷酸探针在实时扩增反应中特异性检测扩增的DMR或其一部分。在一些实施例中,本发明提供了预测油棕植物中存在或不存在体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中的差异甲基化区域 (DMR)内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、 80%、90%、95%或99%一致,或一致的DNA序列内;和c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。
在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自 SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述 DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、 48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、 80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、71和72的序列至少90%、95%或99%一致,或一致。
在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQ ID NO:63、64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、 44、45、46、48、49、51、52、57、58、59、60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、 16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常.
在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、68和69 (或选自SEQ ID NO:63、64、65、66、67、68、69和70))的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、37、38、 41、42、47、50、52、53、54、55、56、57、62和74的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、9、10、13、14、19、 22、24、25、26、27、28、29、34和72的序列至少90%、95%或99%一致,或一致的生物标记物中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。
在一些方面,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%、 90%、95%或99%一致,或一致的DNA序列内。在一些方面,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、 67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,每个DMR处于来自所述植物的样品的DNA区域内,其中每个DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定在每个DMR的生物标记物中至少一个胞嘧啶的甲基化状态,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、71和72的序列至少90%、95%或99%一致,或一致。
在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。
在一些情况下,体细胞克隆异常呈现出Mantled表型。
在一些方面,确定甲基化状态包括亚硫酸氢盐转化;和/或用甲基化依赖性内切核酸酶消化基因组DNA;和/或用甲基化敏感性内切核酸酶消化基因组DNA。
在一些实施例中,本发明提供一种方法,所述方法包括:提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态确定,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、 95%或99%一致或一致的DNA序列内;以及使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。
在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中DNA区域与选自SEQ ID NO:63、64、65、66、67、68、69和70序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、 51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、 95%或99%一致,或一致。在一些情况下,确定步骤包括:确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 71和72的序列至少90%,95%或99%一致,或一致。
在一些方面,本发明提供一种用于检测或预测油棕植物的体细胞克隆异常的方法,该方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域(DMR) 内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、 90%、95%或99%一致,或一致的DNA序列内;c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,所述方法还包括对预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述物理分离包括选择预测为体细胞克隆异常的植物以进行破坏。
在一些情况下,所述物理分离包括选择被预测缺乏体细胞克隆异常的植物以进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。在一些实施例中,所述至少一个胞嘧啶是CHG序列中的第一胞嘧啶,其中H为C、 A或T.
在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自 SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些实施例中,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、 51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。
在一些情况下,所述确定步骤包括确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、 95%或99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品的DNA区域内,所述DNA区域与SEQ ID NO:84、87或90至少90%、95%或99%一致,或一致。
在一些情况下,至少一个胞嘧啶处于AlwNI、BbvI、ScrFI或RsaI限制性内切核酸酶识别位点中。在一些情况下,所述方法包括确定第一个胞嘧啶和第二个胞嘧啶的甲基化状态,其中所述第一个胞嘧啶处于来自所述植物的样品中的DNA区域的DMR内,其中所述DNA区域与 SEQ ID NO:87至少90%、95%或99%一致或一致,并且其中所述第二个胞嘧啶处于来自所述植物的样品中的DNA区域的DMR内,其中所述DNA区域与SEQ ID NO:90至少90%、95%或99%一致或一致。在一些情况下,所述第一个胞嘧啶处于BbvI限制性内切核酸酶位点中,并且所述第二个胞嘧啶处于RsaI限制性内切核酸酶位点中。
在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态减少时,预测存在体细胞克隆异常。在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态增加时,预测存在体细胞克隆异常。在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。
在一些情况下,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少90%、95%或99%一致或一致的DNA序列内。
在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。
在一些情况下,体细胞克隆克隆异常被预测为呈现出Mantled表型。
在一些方面,确定甲基化状态包括亚硫酸氢盐转化。在一些情况下,确定甲基化状态包括用甲基化依赖性内切核酸酶消化基因组DNA。在一些情况下,确定甲基化状态包括用甲基化敏感性内切核酸酶消化基因组DNA。在一些情况下,在消化后扩增基因组DNA。
在一些情况下,确定甲基化状态包括亚硫酸氢盐转化;和/或确定甲基化状态包括用甲基化依赖性内切核酸酶消化基因组DNA;和/或确定甲基化状态包括用甲基化敏感性内切核酸酶消化基因组DNA;和/或确定甲基化状态包括测量测序期间甲基化碱基并入的速率;和/或确定甲基化状态包括当包括测量甲基化碱基的分子通过纳米孔时的电流。在一些情况下,确定甲基化状态可以包括甲基化DNA免疫沉淀、通过亲和纯化的甲基化DNA捕获或减少的代表性亚硫酸氢盐测序。在一些情况下,确定甲基化状态可以包括核酸杂交,例如微阵列或珠阵列杂交。
在一些方面,本发明提供用于检测或预测油棕植物的体细胞克隆异常的方法,所述方法包括: a)从所述植物获得生物样品;b)确定来自所述植物的样品中的至少一种小RNA的表达水平,其中所述至少一种小RNA由包含与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、 101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、 117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、 138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、 154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码;和c)将所述至少一种小RNA的表达水平与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,所述至少一种小RNA的表达水平相对于正常对照植物中所述至少一种RNA的表达增加或降低至少2倍。
在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ IDNOs:144-161 中至少一个序列至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、 99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,与来自预测为体细胞克隆异常的植物的样品中的SEQ ID NOs:144-161中任何一个序列至少90%一致的至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%低。在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ ID NO:91至少90%(例如,91%、 92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,来自预测为体细胞克隆异常的植物的样品中与SEQ IDNO:91至少90%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%、40%、30%或10%低。
在一些情况下,生物样品来自植物的茎尖组织。在一些情况下,所述生物样品来源于所述植物的<2cm期花序组织。在一些情况下,所述生物样品来源于所述植物的至少2cm期花序组织。在一些情况下,所述生物样品来源于体外组织培养的植物细胞、种子或幼苗。
在一些实施例中,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些实施例中,所述物理分离包括选择被预测为体细胞克隆异常的植物进行破坏。在一些情况下,所述物理分离包括选择将预测为缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。在一些情况下,体细胞克隆异常被预测呈现出Mantled表型。
在一些方面,本发明提供用于检测或预测油棕植物的体细胞克隆异常的方法,所述方法包括: a)从所述植物获得生物样品;b)确定由SEQ ID NO:5、75、78或80编码的转录物的表达水平;和c)使所述表达水平与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,当SEQ ID NO:5的表达水平相对于野生型对照植物降低时,或当SEQ IDNO:75 或78或80的表达水平相对于野生型对照植物增加时,预测植物体细胞克隆异常。在一些实施例中,当SEQ ID NO:75或78或80的表达水平相对于SEQ ID NO:5的表达水平增加时,预测植物体细胞克隆异常。
在一些实施例中,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况,所述物理分离包括选择被预测为体细胞克隆异常的植物进行破坏。在一些情况下,所述物理分离包括选择将预测为缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。
在一些实施例中,预测体细胞克隆异常呈现Mantled表型。
在一些方面中,本发明提供用于预测油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%,80%, 90%,95%或99%一致,或一致的DNA序列内;以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。
在一些实施例中,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内,其中所述 DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、 48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、 95%或99%一致,或一致。在一些情况下,所述至少一个胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、 95%或99%一致,或一致。
在一些情况下,所述对照值是植物外源的对照基因座的甲基化值。在一些情况下,所述对照值是植物内源的对照基因座的甲基化值。在一些情况下,其中所述程序代码包括用于接收至少两个、三个或四个不同DMR中的至少一个胞嘧啶的甲基化状态的程序代码,其中每个DMR 独立地处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品中的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。
在一些情况下,每个DMR处于来自所述植物的样品中的DNA区域内,其中每个DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。在一些情况下,预测体细胞克隆异常呈现出Mantled表型。
在一些方面中,本发明提供用于确定油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收值的程序代码,所述值代表:i)小RNA的表达水平(例如,来自植物的样品的小 RNA的表达水平),其中所述小RNA由包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、 136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、 152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码;2)与SEQ ID NO:5、75、78或80至少90%、95%或99%一致,或一致的转录物的表达水平;以及用于将所述表达水平值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述表达水平值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。
在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ IDNOs:144-161 中至少一个序列至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、 99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,与来自预测为体细胞克隆异常的植物的样品中的SEQ ID NOs:144-161中任何一个序列至少90%、95%或99%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%低。在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQID NO:91至少 90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,来自预测为体细胞克隆异常的植物的样品中的与 SEQ ID NO:91至少90%、95%或99%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%、40%、30%或10%低。
在一些情况下,所述计算机程序产品可以预测所述植物中存在或不存在体细胞克隆异常。在一些情况下,体细胞克隆异常呈现Mantled表型。在一些情况下,通过应用计算机程序产品将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些实施例中,本发明提供用于测定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,其中所述DMR处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内;所述试剂盒包括:(1)亚硫酸氢钠、寡核苷酸扩增引物和至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的未转化的甲基化和/或转化的未甲基化序列的存在; (2)甲基化敏感性限制酶和甲基化依赖性限制酶、寡核苷酸扩增引物和至少一种多核苷酸以量化至少一部分DMR的拷贝数;(3)甲基化感测结合部分和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中至少一个胞嘧啶的甲基化状态预示着油棕植物的体细胞克隆异常。
在一些实施例中,所述甲基化敏感性或依赖性限制酶对油棕植物是异源的。在一些实施例中,所述甲基化敏感性或依赖性限制酶选自AlwNI、BbvI、RsaI和ScrFI。在一些实施例中,所述试剂盒包括BbvI和RsaI。在一些实施例中,用于量化来自DMR的至少一个胞嘧啶的未转化的甲基化或转化的未甲基化序列的存在的至少一种多核苷酸包括与来自含有亚硫酸氢盐转化的胞嘧啶的DMR的序列特异性杂交的序列。在一些实施例中,用于量化至少一部分DMR的拷贝数的至少一种多核苷酸包括与来自含有亚硫酸氢盐转化的胞嘧啶的DMR的序列特异性杂交的序列。
在一些实施例中,甲基化敏感性结合部分为抗体。在一些实施例中,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些实施例中,所述DMR 处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、 36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。在一些情况下,所述DMR处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。
在一些实施例中,所述试剂盒包括能够特异性扩增两个、三个或四个不同DMR中的至少一部分的至少两种、三种或四种多核苷酸或至少两对、三对或四对多核苷酸,其中每个DMR 独立地处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于DNA元区内,其中所述DNA元区与独立地选自SEQ ID NO:63、64、 65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。
在一些情况下,每个DMR处于与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、 73和74的序列至少90%、95%或99%一致或一致的DNA序列内。在一些情况下,每个DMR 处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、71和72的序列至少90%、95%或99%一致或一致。在一些情况下,所述试剂盒还包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。在一些情况下,多核苷酸探针在实时扩增反应中特异性检测扩增的DMR或其一部分。
在一些方面中,本发明提供用于检测油棕植物中RNA表达水平的试剂盒,所述试剂盒包括: a)能够与小RNA特异性杂交的寡核苷酸引物,所述小RNA由包括与SEQ ID NO:91、92、 93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、 132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、 148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、 95%或99%一致或一致的多核苷酸的序列编码;或b)能够与转录物特异性杂交的寡核苷酸引物,所述转录物由SEQ ID NO:5、75、78或80编码,其中检测的表达水平预示着油棕植物的体细胞克隆异常。在一些情况下,所述试剂盒还包含可检测地标记的多核苷酸探针;或其中可检测地标记所述寡核苷酸引物。在一些情况下,b)的寡核苷酸引物包括SEQ ID NO: 125、126、127、128或129。在一些情况下,a)的寡核苷酸引物能够与小RNA特异性杂交,所述小RNA由包括与SEQ ID NOs:144-161之一至少90%(例如,91%、92%、93%、94%、 95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。
在一些方面中,本发明提供减少通过体外组织培养繁殖的油棕植物的体细胞克隆异常的方法,所述方法包括:将SEQ ID NO:5或与SEQ ID NO:5至少90%、95%或99%一致的序列编码的mRNA外源施用于所述植物;或将小RNA外源施用于所述植物,所述小RNA由包含与 SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、 107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、 123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、 144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、 160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码。在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物的细胞质或细胞核与mRNA或小RNA接触。在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物与包括异源启动子的表达盒接触,所述异源启动子可操作地连接至与SEQ ID NO:5至少90%、95%或99%一致或一致的多核苷酸。
在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物与包括异源启动子的表达盒接触,所述异源启动子可操作地连接至编码小RNA的多核苷酸,其中所述多核苷酸包括与 SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、 107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、 123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、 144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、 160或161至少90%、95%或99%一致或一致的序列。在一些实施例中,外源施用所述mRNA 或小RNA包括使体外组织培养的植物细胞与所述mRNA或小RNA接触。
在一些方面,本发明提供包含异源启动子的表达盒,所述异源启动子可操作地连接至:i)编码小RNA的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、 115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、 136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、 152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的序列;或ii)编码mRNA的多核苷酸,其中,所述多核苷酸包括与SEQ ID NO:5至少90%、 95%或99%一致或一致的序列。表达盒可以是异源表达盒。在一些方面,本发明提供了包括前述任一种表达盒的重组植物。
在一些实施例中,本发明提供预测油棕植物存在或不存在体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域(DMR) 或亚区域的甲基化密度,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的序列内;和c)使所述甲基化密度与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。
在一些方面,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或 99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、 46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述确定步骤包括确定生物标记物中甲基化密度,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、71和72的序列至少90%、95%或99%一致,或一致。
在一些方面,所述方法包括当甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQID NO:63、 64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的 DNA元区中甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、44、45、46、48、49、51、52、57、58、59、 60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中甲基化密度相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常.
在一些方面,所述确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR) 的甲基化密度,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%或90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、 69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR 处于来自所述植物的样品的DNA区域内,其中所述DNA区域与独立地选自SEQ ID NO:35、 36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述确定步骤包括确定在每个DMR的生物标记物中的甲基化密度,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。
在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。
在一些情况下,体细胞克隆异常呈现出Mantled表型。
在一些方面,确定甲基化密度包括亚硫酸氢盐转化;和/或用甲基化依赖性内切核酸酶消化基因组DNA;和/或用甲基化敏感性内切核酸酶消化基因组DNA。在一些情况下,甲基化密度是CHG甲基化密度。
在一些实施例中,本发明提供一种方法,所述方法包括:提供对多棵植物存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由来自每棵植物的样品中的差异甲基化区域(DMR)内的甲基化密度确定(例如,CHG甲基化密度),其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。
定义
本文所用的“植物”是指来自植物界的生物体的任何细胞或细胞群。“油棕植物”是指物种 E.guineensis的生物体的任何细胞或细胞群。非限制性实例包括完整植物、营养枝器官/结构 (例如叶、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟子房),植物组织(例如维管组织、基本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)和相同的后代。非限制性实例还包括来自体外细胞培养物的植物细胞或植物细胞群。
本文所使用的“原株(ortet)”是指产生克隆的来源棕榈。“克隆”是指通过在无菌条件下克隆繁殖获得的来自标本植物组织或细胞的基因上一致或基本一致的棕榈拷贝。“分株”是指通过体外繁殖衍生的植物。“外植体”是指用于体外繁殖的棕榈的切除组织。“半克隆 (Semiclone)”是指来源于克隆亲本和幼苗亲本之间的杂交的后代。“双克隆(Biclone)”是指来源于杂交的子代,其中两个亲本都是克隆。
本文所用的术语“体细胞克隆异常”是指在体外培养中出现的任何表型或基因型(例如表观遗传)修饰。例如,Mantled表型可以作为经历体外培养的油棕植物中出现的体细胞克隆异常而出现。
“甲基化”是指胞嘧啶的C5位置,腺嘌呤的N6位置的胞嘧啶甲基化和/或羟甲基化或其它类型的核酸甲基化。体外扩增的DNA是未甲基化的,因为体外DNA扩增方法不保留扩增模板的甲基化模式。然而,“未甲基化DNA”或“甲基化DNA”也可以分别指其原始模板未甲基化或甲基化的扩增的DNA。
“甲基化图谱”是指代表来自例如植物的基因组,例如来自植物的细胞或组织的DNA分子内的一个或多个基因座的甲基化状态的一组数据。该图谱可以指示植物中每个碱基的甲基化状态,可以包括关于基因组中碱基对的子集(例如,特异性限制性酶识别序列的甲基化状态) 的信息,或可以包括关于每个基因座的区域甲基化密度的信息。
“甲基化状态”是指DNA的一部分内的特定核苷酸或核苷酸的甲基化的存在、不存在和/ 或数量。特定DNA序列(例如,本文所述的DNA生物标记物或DNA区域)的甲基化状态可以指示所述序列中每个碱基的甲基化状态,或者可以指示所述序列内的碱基对子集的甲基化状态(例如,胞嘧啶的甲基化状态或一个或多个特异限制性内切酶识别序列的甲基化状态),或可以指示关于所述序列内的区域甲基化密度的信息,而不提供在序列中甲基化发生在何处的精确信息。甲基化状态可以任选地由“甲基化值”表示或指示。甲基化值可以例如通过量化用甲基化依赖性限制酶限制性消化后存在的完整DNA的量而产生。在该实施例中,如果使用定量PCR量化DNA中的特定序列,则模板DNA的量大致等于模拟处理的对照表明该序列不是高度甲基化的,而模板的量显着小于模拟处理的样品中产生的量表明该序列存在甲基化的DNA。因此,例如来自上述实施例的值,即甲基化值,代表甲基化状态,因此可用作甲基化状态的定量指标。当期望将样品中的序列的甲基化状态与阈值进行比较时,这是特别有用的。
“甲基化依赖性限制酶”是指在甲基化识别序列处或附近剪切或消化DNA,但是当识别序列未甲基化时不在相同序列处或附近剪切DNA的限制酶。甲基化依赖性限制酶包括在甲基化识别序列处切割的酶(例如,DpnI)和在接近识别序列但不在识别序列处切割的酶(例如 McrBC)。例如,McrBC的识别序列是5'RmC(N40-3000)RmC 3',其中“R”是嘌呤,“mC”是甲基化胞嘧啶,“N40-3000”表示观察到限制事件的两个RmC半位点之间的距离。McrBC 通常接近一个半位点或另一个位点切割,但是剪切位置通常分布在几个碱基对上,从甲基化碱基起约30个碱基对。McrBC有时切割两个半位点的3',有时切割两个半位点的5',有时在两个位点之间切割。典型的甲基化依赖性限制酶包括例如McrBC(参见,例如,美国专利号 5,405,760)、McrA、MrrA、DpnI、MspJI、LpnPI、AspBHI、RlaI和SgrTI。本领域技术人员会理解,任何甲基化依赖性限制酶,包括本文所述的限制酶的同源物和直系同源物,也适用于本发明。
“甲基化敏感性限制酶”是指在未甲基化识别序列处或附近剪切DNA但在识别序列甲基化时不在相同序列处或附近剪切的限制酶。例如,McClelland et al.,Nucleic AcidsRes. 22(17):3640-59(1994)和http://rebase.neb.com描述了典型的甲基化敏感性限制酶。当识别序列内的胞嘧啶在位置C5处甲基化时,在识别序列处或附近不剪切DNA的合适的甲基化敏感性限制酶包括,例如Aat II、Aci I、Acl I、Age I、Alu I、Asc I、Ase I、AsiS I、Bbe I、BsaA I、BsaH I、BsiE I、BsiW I、BsrF I、BssH II、BssK I、BstB I、BstN I、BstU I、Cla I、Eae I、Eag I、 Fau I、Fse I、Hha I、HinP1I、HinC II、Hpa II、Hpy99I、HpyCH4IV、Kas I、Mbo I、Mlu I、 MapA1I、Msp I、Nae I、Nar I、Not I、Pml I、Pst I、Pvu I、Rsr II、Sac II、Sap I、Sau3A I、 Sfl I、Sfo I、SgrA I、Sma I、SnaB I、Tsc I、Xma I和Zra I。当识别序列内的腺苷在N6位置甲基化时不在其识别序列处或附近剪切DNA的合适的甲基化敏感性限制酶包括例如MboI。本领域技术人员会认识到任何甲基化敏感性限制酶,包括本文所述的限制酶的同源物和直系同源物也适用于本发明。本领域技术人员会进一步认识到,在其识别序列处或附近存在胞嘧啶甲基化的情况下不能进行切割的甲基化敏感性限制酶可能对其识别序列处或附近的腺苷甲基化的存在并不敏感。同样,在其识别序列处或附近存在腺苷甲基化的情况下不能进行切割的甲基化敏感性限制酶可能对其识别序列处或附近的胞嘧啶甲基化的存在并不敏感。例如,Sau3AI 对于在其识别序列处或附近的甲基化胞嘧啶的存在是敏感的(即,不能切割),但对在其识别序列处或附近的甲基化腺苷的存在是不敏感的(即,切割)。本领域技术人员还会认识到,一些甲基化敏感性限制酶通过包含其识别序列的DNA的一条或两条链上的碱基的甲基化而阻断,而其它甲基化敏感性限制酶仅通过两条链上的甲基化阻断,但如果识别位点是半甲基化的,则可以切割。
“区分具有和不具有特定体细胞克隆异常的植物的阈值”是指可用于区分来自异常植物的样品和来自非异常植物的样品的特定测量值或值范围。理想地,存在绝对地区分两个组的阈值或值(即,来自异常组的值总是或几乎总是在阈值的一侧(例如,较高),并且来自野生型组的值总是或几乎总是在阈值的另一侧(例如,较低))。然而,在许多情况下,阈值不是绝对地区分异常和野生型样品(例如,当异常和野生型样品产生的值存在一些重叠时)。
术语“生物标记物”是指DNA区域、差异甲基化区域(DMR)或DNA元区的子序列。在一些情况下,生物标记物与DNA区域、DMR或DNA元区的一部分一致。在一些情况下,生物标记物与DNA区域、DMR或DNA元区的一部分基本上一致,或至少90%、95%或99%一致。可以使用任何BLAST进行序列比较,包括具有默认参数的BLAST 2.2算法,分别描述于Altschul etal.,Nuc.Acids Res.25:3389 3402(1997)和Altschul et al.,J.Mol.Biol.215:403 410(1990中。因此,例如,本文所述的DNA区域或生物标记物可对应于油棕植物基因组的 DNA序列,即使在生物标记物或DNA区域与所讨论的特定的油棕植物基因组之间存在轻微变异。这种差异可能是油棕植物之间轻微遗传变异的结果。因此,本文所述的DMR、DNA 区域、DNA元区和生物标记物可以与SEQ ID NO:1的子序列至少约90%、95%、99%、99.9%一致,基本一致或一致。
给定的生物标记物的“灵敏度”是指报告DNA甲基化值与区分野生型样品和异常样品的阈值不同的体细胞克隆异常样品的百分比。例如,在一些情况下,当甲基化相对于阈值增加时,预测存在体细胞克隆克隆异常。在这种情况下,灵敏度计算如下:
Figure BDA0001200375530000221
该方程式也可以表示如下:
Figure BDA0001200375530000222
其中真阳性定义为来自经证实为体细胞克隆异常的植物(例如,Mantled植物)的样品报告DNA甲基化值高于阈值(即与表型相关联的范围),假阴性定义为经证实为体细胞克隆异常样品报告DNA甲基化值低于阈值(即与无体细胞克隆异常相关联的范围)。在当甲基化低于阈值时,预测体细胞克隆异常的情况下,本领域技术人员可以轻易地修改上述方程式。类似地,当通过DNA区域中或生物标记物内甲基化的增加或减少来预测体细胞克隆异常时,可以组合上述方程及其修改版本以获得灵敏度值。
因此,灵敏度的值反映了从已知异常样品获得的给定生物标记物的DNA甲基化测量值将在体细胞克隆异常相关测量值的范围内的概率。本文所定义的计算的灵敏度值的相关性表示当应用于具有该条件的植物时,给定的生物标记物将检测到存在体细胞克隆异常的概率的估计。给定的生物标记物的“特异性”是指报告DNA甲基化值与区分体细胞克隆异常样品和野生型样品的阈值不同的野生型样品的百分比。例如,在一些情况下,当甲基化相对于阈值降低时,预测不存在体细胞克隆异常。在这种情况下,计算特异性如下:
Figure BDA0001200375530000231
该方程式也可以表示如下:
Figure BDA0001200375530000232
其中真阴性定义为来自经证实为体细胞克隆正常的植物的样品报告DNA甲基化值低于阈值 (即与无异常相关联的范围),假阳性定义为来自经证实为体细胞克隆正常的植物的样品,其确认为部分正常报告DNA甲基化值高于阈值(即与异常相关联的范围)。因此,特异性的值反映了从已知的非异常样品获得的给定生物标记物的DNA甲基化测量值将在野生型相关测量值的范围内的概率。在当甲基化低于阈值时,预测体细胞克隆异常的情况下,本领域技术人员可以轻易地修改上述方程式。类似地,当通过DNA区域中或生物标记物内甲基化的增加或减少来预测体细胞克隆异常时,可以组合上述方程及其修改版本以获得特异性值。本文所定义的计算的灵敏度值的相关性表示当应用于不具有该条件的植物时,给定的生物标记物将预测缺乏体细胞克隆异常的概率的估计。
公众可通过国家生物技术信息中心(National Center for BiotechnologyInformation)获得用于执行BLAST分析的软件。该算法涉及首先通过在查询序列中鉴定长度为W的短字来鉴定高分序列对(HSP),当与数据库序列中相同长度的字比对时,高分序列对匹配或满足某些正评估的阈值分T。T被称为邻近字分数阈值(Altschul et al.,同上)。这些最初的邻近字采样充当了开始搜索以发现含有它们的更长的HSP的种子。所述邻近字采样沿着每个序列的两个方向延伸,直到累积的比对分数可提高。对于核苷酸序列,使用参数M(匹配的残基对的奖励分;总是>0)和N(错配残基的罚分;总是<0)来计算累积的分数。对于氨基酸序列,使用计分矩阵来计算累积的分数。当累积的比对分数从其达到的最大值下降了数值X;由于一个或多个负得分残基比对的积累,累积的分数达到零或低于零;或到达任何一个序列的末端时,停止在每个方向上字采样的延伸。BLAST算法的参数W、T和X决定了比对的灵敏性和速度。 BLASTN程序(对于核苷酸序列)默认使用的是,字长度(W)11,期望值(E)10,M=5,N=-4,并且比较两条链。对于氨基酸序列,BLASTP程序默认使用的是,字长度(W)3,期望值(E)10,和BLOSUM62计分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989)) 比对(B)50,期望值(E)10,M=5,N=-4,并且比较两条链。
本文所用的术语“核酸”、“多核苷酸”和“寡核苷酸”是指核酸区域、核酸区段、引物、探针、扩增子和寡聚物片段。该术语不受长度的限制,并且对多脱氧核糖核苷酸(含有2-脱氧 -D-核糖),多核糖核苷酸(含有D核糖)和任何其它嘌呤或嘧啶碱基或修饰的嘌呤或嘧啶碱的N-糖苷是通用的。这些术语包括双链和单链DNA,以及双链和单链RNA。
核酸、多核苷酸或寡核苷酸可以包括例如磷酸二酯键或修饰的键,包括但不限于磷酸三酯、氨基磷酸酯、硅氧烷、碳酸酯、羧甲基酯、乙酰胺酯、氨基甲酸酯、硫醚,桥连的氨基磷酸酯、桥连的亚甲基膦酸酯、硫代磷酸酯、甲基膦酸酯、二硫代磷酸酯、桥连的硫代磷酸酯或砜键,以及这些键的组合。
核酸、多核苷酸或寡核苷酸可以包含五种生物学上存在的碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)和/或除了五种生物学上存在的碱基之外的碱基。例如,本发明的多核苷酸可以含有一个或多个修饰的,非标准的或衍生的碱基部分或一个或多个修饰的糖部分。
通过在比较窗口上比较两个最佳比对序列来确定“序列一致性百分比”或“一致性”,其中比较窗口中多核苷酸序列的部分相比参照序列(其不包含添加或缺失)可以包含添加或缺失 (即,空隙),用于使两个序列进行最佳比对。通过以下步骤计算百分比:确定在两个序列中出现一致的核酸碱基或氨基酸残基的位置的数目,产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数,并将结果乘以100以产生序列一致性的百分比。
术语多肽序列的“基本一致”是指多肽包括具有至少75%序列一致性的序列。可替换地,一致性百分比可以是75%至100%的任何整数。典型实施例包括与使用本文所述程序(优选使用标准参数进行BLAST)的参考序列相比至少:75%、80%、85%、90%、95%或99%,如下文所述。技术人员将认识到,通过考虑密码子简并性、氨基酸相似性、阅读框定位等,可以适当地调整这些值以确定由两个核苷酸序列编码的蛋白质的一致性。除了不一致的残基位置可以因保守氨基酸改变而不同之外,“基本相似”的多肽共享如上所述的序列。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酰胺;具有芳香族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸;具有含硫侧链的氨基酸组是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,天冬氨酸-谷氨酸和天冬酰胺-谷氨酰胺。核苷酸序列基本一致的另一个指示是,两个分子在严格条件下彼此或与第三核酸是否杂交。严格条件是依赖于序列的,并且在不同情况下将不同。通常,将严格条件选择为比确定的离子强度和pH下的特定序列的热解链温度(Tm)低约5℃。Tm是50%的靶序列与完全匹配的探针杂交的温度(在确定的离子强度和pH下)。通常,严格条件是在pH 7下盐浓度为约 0.02摩尔,温度为至少约60℃的条件。
本文所用,术语“特异性杂交”在寡核苷酸的背景下是指在合适条件下与序列杂交但不与其它相关或不相关序列杂交的寡核苷酸。在一些情况下,合适的条件是严格的杂交条件。在一些情况下,合适的条件是核酸扩增条件,例如PCR扩增条件。在一些情况下,与核酸特异性杂交的寡核苷酸可以与亚硫酸氢盐转化的核酸杂交,但不与对亚硫酸氢盐转化有抗性的相同序列的核酸(例如甲基化核酸)或者没有经历亚硫酸氢盐转化的核酸杂交。在一些情况下,与核酸特异性杂交的寡核苷酸可以与核酸序列杂交,但不与已经进行亚硫酸氢盐转化的相同序列的核酸杂交。
在异源启动子的背景下,术语异源是指可操作地连接编码RNA或蛋白质的多核苷酸序列的启动子,其中在野生型生物体中没有发现该启动子可操作地连接该多核苷酸。类似地,在异源表达盒的背景下,术语“异源”指与野生型生物体中发现的任何表达盒不同的表达盒。因此,术语异源表达盒可以含有内源启动子和内源编码序列,只要表达盒作为整体不是天然存在于野生型生物体中即可。
附图说明
图1.正常果形和mantled果形。a-c,(a)正常的果形,(b)可育的mantled果形和(c)单性结实的mantled果实。图像显示为全果(上),纵切果实(中)和横切果实(下)。全果这样展示:正常和单性结实的mantled为侧视图,而可育的mantled为顶视图,以使得多个假心皮可见。黑色箭头表示每个异常果实的几个假心皮之一。白色箭头表示正常果实和可育的mantled果实的木质化的壳和核,单性结实的mantled果实中不存在木质化的壳和核。
图2.mantled DNA甲基化对比正常DNA甲基化的显著变化的总结。“EgDEF”盒指示从外显子1的5'到转录物的3'末端的区域。根据标记,用灰框表示元件1(Rider)、2(Karma)和 3(Koala)反转录转座子。显示出阵列特征ID号。基因组坐标表示除了阵列特征ID107120 和108280之外,每个阵列特征的最5'碱基相对于已公布的E.guineensis基因组的Scaffold p5_sc00322(Singh et al.,2013)的坐标。映射到已公布的E.guineensis基因组的Scaffold p5_sc00322(Singh et al.,2013)有两个特征,并且基因组坐标与p5_sc25957有关,如所公开的。这个小支架随后被映射到EgDEF1间隔,如图所示。在最左列指出了克隆谱系,并且指示每个谱系中mantled样品和正常样品的数目。黑框代表mantled样品的低甲基化事件相对于正常样品在统计学上是显著的。灰框表示mantled样品的超甲基化事件相对于正常样品在统计学上是显著的(p<0.05,双尾学生t检验)。白框表示测量报告DNA甲基化无显著差异。在整个基因座上存在统计学显著的差异甲基化区域(DMR),其中一个跨越Karma反转录转座子。
图3.微阵列特征的文氏图,其报道了mantled分株叶和正常叶之间甲基化差异显著(p<0.05,双侧学生t检验,Methods)。每个椭圆表示从一个来源(基因型)获得的克隆谱系:来源A (5棵mantled和9棵正常分株),来源B(14棵mantled和15棵正常分株),来源C(10棵mantled和10棵正常分株),以及来源D(8棵mantled和7棵正常分株)。基因型之间共享相对较少的特征,并且只有一个特征检测到来自所有4个来源的mantled棕榈中的低甲基化。带下划线的数字表示包括映射到Karma LINE元件(图2中展示的元件2)的四个微阵列特征中的一个的子集。
图4.EgDEF1/MANTLED基因在染色体12上的表观遗传图谱。a,微阵列特征数据绘制在 EgDEF1/MANTLED基因的示意图上,包括Rider、Karma和Koala反转录转座子。CG和CHG 位点如上所示。在y轴上绘制正常克隆分株(n=41)和单性结实的mantled克隆分株(n=37)之间的差异DNA甲基化密度测量结果的Log10p值(双侧学生t检验)。b,原株(O)、正常 (N)和单性结实的mantled克隆分株(M)的叶样品的全基因组亚硫酸氢盐测序。在0至100%标度上绘制跨Karma的单个胞嘧啶的DNA甲基化密度(a中的框),并且表示原株(n=5)、正常分株(n=5)或mantled分株(n=5)的平均值。对CG、CHG和CHH甲基化分别绘图,如直方图的左侧所示。通过水平柱突出显示与Karma反转录转座子对应的差异CHG甲基化区域(CHG DMR)的位置。
图5.通过四个独立的MethylScreen试验测量差异CHG甲基化。根据实施例2所述设计试验。每个试验监测差异甲基化区域(CHG DMR)内的特定CHG胞嘧啶的甲基化。组1、2、3和4表示同一组的原株样品,加上来源于原株的树的一个正常样品,和一个mantled样品的独立组。如实施例2所述计算致密甲基化分子的百分比。使用的CHG甲基化敏感性限制酶是AlwNI (a)、BbvI(b)、ScrFI(c)和RsaI(d)。误差条表示重复试验的标准偏差。
图6.来自独立于图2-5代表的那些样品的原株、分株mantled和正常克隆的叶DNA样品中CHG 甲基化的线性判别分析(LDA)。如实施例2所述,通过用甲基化敏感性限制酶BbvI或Rsa I消化,然后进行定量PCR来监测CHG甲基化。对角线表示LDA确定的正常(原株(n=8) 和正常分株(n=13))和mantled(单性结实的mantled分株(n=19),可育的mantled分株(n=2)和产生正常果实和可育的mantled果实的混合分株(n=7))CHG甲基化密度预测之间的阈值。显示了两个假阴性单性结实的mantled样品(FN1和FN2)。箭头指示图7b 和7c中进一步分析的正常样品和mantled对照样品。
图7.a,来自正常克隆和mantled克隆(分株)的叶样品以及两个假阴性mantled样品的中的 Karma元件的亚硫酸氢盐测序分析。计算在Karma剪接受体位点(在b-e中位点6),加上剪接位点上游27bp(位点5)和下游16bp(位点7)的另外两个CHG位置的CHG甲基化密度(未转化的CHG胞嘧啶碱基读数/总胞嘧啶碱基读数),所有这些都被在来自图3的所有4 个来源的mantled棕榈中检测到低甲基化的独特的共有微阵列特征所覆盖。如星号所示,mantled对照样品和两个假阴性mantled样品相对于正常对照明显低甲基化(p<0.0001,双尾 Fisher精确检验)。b-e,(b)正常对照样品,(c)mantled对照样品和(d)FN1假阴性mantled样品和(e)FN2假阴性mantled样品中Karma元件反义链的各个亚硫酸氢盐测序读数。跨测序扩增子的13个反义CHG位点按比例显示。“S”表示Karma剪接受体位点(CAG /CTG)处的胞嘧啶。“B”表示Bbv I位点。图3中报道的共有微阵列特征由围绕剪接位点的柱表示。甲基化的CHG和未甲基化的CHG位点分别由黑框和白框表示。包括“N”的框表示在并非高质量DNA测序碱基读数的特定读数内的CHG位置,因此这些碱基的DNA甲基化状态未确定。
图8.回复棕榈中的Karma CHG甲基化。a,来自回复分株的小穗产生混合花束,包括正常果实和可育的mantled果实,每个果实只有一个或两个假心皮(箭头)。b-c,来自(a)中代表的花束的全果(左)和纵切(右)正常(b)果实和微mantled(c)果实。d,Bbv I位点处的CHG甲基化密度。图中显示了由两个独立克隆谱系(1和2)的每一个产生100%正常果实的正常分株,以及产生混合花束的回复分株,每束花束具有99%、95%或7%正常果实(n.f.)的。误差条表示叶(n=4),花轴(n=8)或果实(n=2)的生物学重复样的标准偏差。e-f,Karma剪接受体位点处,加上正常果实(白色柱)和微mantled果实(黑色柱)的剪接位点上游27bp和下游16bp的另外两个CHG位点(如图7所示)的甲基化密度,所述正常果实和微mantled果实来自在产生99%(e)或95%(f)正常果实的克隆谱系1中的两个回复分株 (双尾Fisher精确检验,n.s.表示不显著)。对于每棵分株,从同一花束收集正常果实和微mantled果实。通过检测不影响CHG位点的亚硫酸氢盐测序扩增子内的杂合SNP来单独分析等位基因。
图9.Mantled组织中小非编码调节RNA的差异表达。a,如实施例5中所述的转录物模型。b,通过正常茎尖(SA),<2cm期花序组织(<2cm)和晚期花序组织(Inf.)的全转录组小RNA 测序确定的不同的24mer siRNA计数。)。x轴是与A中显示的转录物模型成比例的基因组位置。y轴是在0至3.0的标度上每百万个片段映射到每千个碱基的片段(FPKM)的标准读数。垂直柱表示来源于跨EgDEF1基因座位置的不同的24mer FPKM标准化读数。数据代表每种组织类型的三个独立样品。c,通过mantled茎尖(SA),<2cm期花序组织(<2cm)和晚期花序组织(Inf.)的全转录组小RNA测序确定的不同的24mer siRNA计数。根据B中所述绘图。垂直箭头表示相对于mantled茎尖,正常茎尖中特异性24mer siRNA(SEQ ID NO: 91)表达高11倍。
图10.mantled组织中siRNA的差异表达。a,在正常茎尖样品(空心柱)和mantled(灰色柱) 茎尖样品中的平均FPKM标准化24mer siRNA读数。误差条代表三个重复样的标准偏差。X 轴标记指示所提供的每种不同siRNA的SEQ ID NO。b,在正常<2cm期花序样品(空心柱) 和mantled(灰色柱)<2cm期花序样品中的平均FPKM标准化24mer siRNA读数。误差条代表三个重复样的标准偏差。X轴标记指示所提供的每种不同的siRNA的SEQ ID NO。c,在正常晚期花序样品(空心柱)和mantled(灰色柱)晚期花序样品中的平均FPKM标准化 24mersiRNA读数。误差条代表三个重复样的标准偏差。X轴标记指示每种不同siRNA的SEQ ID NO。
图11.mantled花序的抑制的24nt siRNA表达映射到Karma。正常0期顶端分生组织(n=5 个生物重复样)和单性结实0期顶端分生组织(n=7个生物重复样)的小RNA测序。将每个24nt siRNA的每百万个片段映射到每千个碱基读数的片段(FPKM)标准化表达值绘制在包括Karma(黑框)的内含子5的区域上。高于和低于零线的柱分别表示有义siRNA和反义siRNA,并且在相同的尺度上绘制。相对于正常0期花序组织,由Karma区域表达的24ntsiRNA 簇在mantledv中0期花序组织被阻遏。
图12.花序发育期3-5的24nt小RNA分析。将每次测定的24nt siRNA的FPKM标准化表达值按比例绘制,在图的顶部绘制基因组元件。高于和低于零线的柱分别代表有义siRNA和反义siRNA,并且在两个方向上以相同的比例绘制。
图13.选择性剪接的转录物。对来自正常棕榈和单性结实的mantled棕榈的雌性花序(每个表型的茎尖,<2cm花序和晚期花序各3个生物重复样)进行转录组测序组装EgDEF1/MANTLED 转录物。黑框代表外显子,在转录模型图上方依比例标记并表示Karma和Koala元件。外显子5选择性剪接到Karma开始的剪接受体位点导致mantled花序而非正常花序转录kDEF1 物。在正常花序和mantled花序中都检测到不利用外显子5剪接供体位点的第三转录物 (tDEF1)。坐标与参照pisifera油棕基因组构建体相对(Singh et al.2013)。
图14.cDEF1、kDEF1和tDEF1的qRT-PCR试验设计。A.EgDEF1的基因模型,其指示转录物特异性qRT-PCR引物的相对位置,如实施例5所述。黑框代表EgDEF1外显子。灰框('t')表示包含在tDEF1转录物中的内含子5序列。空心框('k')表示Karma ORF2序列。箭头表示qRT-PCR引物。B.选择性剪接的转录物和用于特异性检测每种转录物的qRT-PCR引物的概略。C.使用正常总RNA或mantled总RNA作为模板的每个试验的终点RT-PCR结果。
图15.在整个正常雌性花序发育和单性结实的mantled雌性花序发育中cDEF1、tDEF1和 kDEF1表达的定量逆转录酶PCR(qRT-PCR)分析。误差条代表每个表型每期3个生物重复的组织样品的三次重复技术试验之间的标准偏差。显示了相对于内源参考基因的表达。
图16.用于检测本文公开的DMR中的差异DNA甲基化的甲基化特异性PCR试验的实施例。实施例6描述了试验的细节。
图17.用于检测本文公开的DMR中的差异DNA甲基化的甲基化DNA免疫沉淀试验的预示实施例。实施例7描述了试验的细节。
具体实施方式
I.引言
已经进行体外培养的植物中体细胞克隆异常的出现阻碍了始终表现出高油产量的油棕种植材料的开发。表现出体细胞克隆异常(作为体外培养的结果)的油棕植物包括例如表现出Mantled 表型的那些油棕植物。发明人已经识别了油棕植物中体细胞克隆异常下的分子机制:与SEQ ID NO:1对应的油棕基因座内的差异甲基化。发明人还识别了SEQ IDNO:1内的DNA区域、元区和生物标记物,其中甲基化状态预示着存在或不存在体细胞克隆异常。因此,可以利用方法、组合物、试剂盒和计算机程序产品(包括本文所述的那些)来确定其中的一个或多个DMR、DNA区域、元区、生物标记物或胞嘧啶核苷酸(例如,CHG基序中的胞嘧啶)的甲基化状态,从而基于预测的每棵植物的体细胞克隆异常的存在或不存在来预测植物和/或分离的植物中存在或不存在体细胞克隆异常。例如,可以测定植物细胞的培养物以预测存在或不存在体细胞克隆异常(例如,Mantled表型)。
II.DNA区域
可以在DNA区域中检测差异甲基化。DNA区域包括具有一个或多个感兴趣的甲基化位点(例如,胞嘧啶,“微阵列特征”,或由选择的引物或引物对扩增的扩增子)和扩增子的3'或5' 方向的任一个或两个方向上高达4千碱基(kb)的核酸侧翼序列(即,“翼展”)。该范围大致对应与通过在筛选两个或更多个样品中的DNA之间的差异甲基化(例如,进行如下文实施例1所述的用于初始识别差异甲基化序列的方法)之前将DNA随机片段化而获得的DNA 片段的长度。在一些实施例中,一个或多个DNA区域的翼展在相对于微阵列特征表示的序列的3'和5'方向上都为约0.5kb、0.75kb、1.0kb、1.5kb、2.0kb、2.5kb、3.0kb、3.5kb或 4.0kb。在一些实施例中,一个或多个DNA区域的翼展在相对于由微阵列特征表示的序列中的最中心的核苷酸的3'和5'方向上都为大约2kb,或2kb。
DNA区中的甲基化位点可以位于非编码转录控制序列(例如,启动子、增强子等)中,或编码序列中,包括内含子,外显子和与SEQ ID NO:1对应的油棕基因组基因座的反转录转座子元件。在一些实施例中,所述方法包括检测一个或多个转座元件内、处或附近(例如,包括在SEQ ID NO:1中的转座元件的3'或5'约1.0kb,1.5kb,2.0kb,2.5kb,3.0kb,3.5kb或4.0 kb中或内的核酸序列)的甲基化状态。
本发明的DNA区域还包括天然存在的变体,包括例如存在于不同受试对象群体中的变体和由单核苷酸多态性(SNP)产生的变体。SNP包括不同大小和简单序列重复子的插入和缺失,比如,二核苷酸和三核苷酸重复子。变体包括相对于本文所述的DNA区具有至少90%、95%、 98%、99%序列一致性,即具有一个或多个缺失、添加、取代、反向序列等的核酸序列。当所述核酸为具有21或24个核苷酸长度的siRNA时,变体包括相对于本文所述的DNA区域共享至少15、16、17、18、19、20、21、22、23或24个一致的核苷酸,例如具有1、2、3、 4、5、6、7、8、9或更多个缺失、添加、取代、反向序列等的核酸序列。
Ⅲ.方法
在一些实施例中,可以通过确定与SEQ ID NO:1对应的油棕植物的基因组区域内的一个或多个胞嘧啶的甲基化状态来预测存在或不存在体细胞克隆异常(例如,Mantled表型)。SEQ ID NO:1含有三个不同的反转录转座子(SEQ ID NO:2,元件1(Rider);SEQ ID NO:3,元件2(Karma);SEQ ID NO:4,元件3(Koala))和EgDEF1基因,EgDEF1基因转录成至少四种不同形式(cDEF1,由SEQ ID NO:5编码;tDEF1,由SEQ ID NO:75编码; kDEF1,由SEQ ID NO:78编码;和gDEF1,由SEQ ID NO:80编码)。
SEQ ID NO:1的一个或多个胞嘧啶(例如,CHG基序中的胞嘧啶)的甲基化状态可以例如确定并与对照或阈值进行比较,由此可以预测存在或不存在体细胞克隆异常。在一些情况下,当一种或多种特定胞嘧啶的甲基化(例如,相对于对照或阈值)增加时,预测体细胞克隆异常。在一些情况下,当一个或多个特定胞嘧啶的甲基化(例如,相对于对照或阈值)减少时,预测体细胞克隆异常。在一些情况下,当一一个或多个特定胞嘧啶的甲基化(例如,相对于对照或阈值)增加或减少时,预测体细胞克隆异常。
在一些实施例中,可以通过确定正常植物、植物细胞或组织对比mantled植物、植物细胞或组织中差异表达的一种或多种转录物的表达水平来预测存在或不存在体细胞克隆异常(例如, Mantled表型)。在一些情况下,当一种或多种转录物的表达(例如,相对于对照或阈值)减少时,预测体细胞克隆异常。在一些情况下,转录物由SEQ ID NO:1内的序列编码。在一些情况下,转录物由SEQ ID NO:77编码。在一些情况下,转录物由SEQ ID NO:130-134、 136-139、142-143或144-161中的一个或多个序列内的序列编码。在一些情况下,转录物由 SEQ ID NO:144-161中的一个或多个序列内的序列编码。在一些情况下,转录物为siRNA 转录物(例如,24mer siRNA)。在一些情况下,当一种或多种转录物的表达(例如,相对于对照或阈值)增加时,预测体细胞克隆异常。在一些情况下,转录物由SEQ ID NO:135、140 或141中的一个或多个序列内的序列编码。在一些情况下,转录物为siRNA转录物(例如, 24mer siRNA)。
A.用于确定甲基化的方法
检测DNA甲基化的任何方法可以用于本发明的方法中。
在一些实施例中,检测甲基化的方法包括随机剪切基因组DNA或使基因组DNA随机片段化,用甲基化依赖性限制酶或甲基化敏感性限制酶切割DNA,随后选择性识别和/或分析切断或未切断的DNA。选择性识别可以包括例如分离切断和未切断的DNA(例如通过大小)和定量切断的感兴趣的序列,或者选择性地,定量未切割的感兴趣的序列。参见,例如,专利号为7,186,512的美国专利。可替换地,该方法可以包含在限制酶消化后扩增完整的DNA,从而只扩增在扩增区域中未被限制酶剪切的DNA。参见,例如,专利号为7,910,296、8,361,719、 7,901,880和8,163,485的美国专利。在一些实施例中,可以使用基因特异性引物或引物对来进行扩增。可替换地,可以将接头加入随机片段化的DNA的末端,可以用甲基化依赖性或甲基化敏感性限制酶消化DNA,可以使用与接头序列杂交的引物扩增完整的DNA。在这种情况下,可以进行第二步骤以确定扩增的DNA池中特定基因的存在、不存在或数量。在一些实施例中,使用实时定量DNA扩增(例如,PCR)扩增DNA。
在一些实施例中,所述方法包括定量基因组DNA群内靶序列中的平均甲基化密度。在一些实施例中,所述方法包括使基因组DNA与甲基化依赖性限制酶或甲基化敏感性限制酶在允许所述基因座中的潜在限制酶剪切位点的至少一些拷贝保持不剪切的条件下接触;定量所述基因座的完整拷贝;以及比较扩增产物的量与表示对照DNA甲基化的量的对照值,从而与对照DNA的甲基化密度相比较,量化所述基因座中的平均甲基化密度。
DNA基因座的甲基化的量可以通过提供包含基因座的基因组DNA样品,用甲基化敏感性或甲基化依赖性限制酶剪切所述DNA,然后量化完整的(例如,未被甲基化敏感性或甲基化依赖性限制性内切酶切断的)DNA或量化感兴趣的DNA基因座处的已切断的DNA的量。完整的或已切断的DNA的量将取决于含有基因座的基因组DNA的初始量,基因座中甲基化的量,和基因组DNA中基因座的甲基化核苷酸的数量(即,分数)。可以通过比较完整的DNA 或已切断的DNA的量与对照值(表示类似处理的DNA样品中完整的DNA或已切断的DNA 的量)来确定DNA基因座中甲基化的量。对照值可以表示已知或预测的甲基化核苷酸数量。可替换地,对照值可表示来自另一个(例如,正常、野生型)细胞的相同基因座或第二基因座中的完整的或已切断的DNA的量。
在允许基因座中的潜在的限制酶剪切位点的至少一些拷贝保持未剪切的条件下,使用至少一种甲基化敏感性或甲基化依赖性限制酶,随后量化剩余的完整拷贝并将该量与对照进行比较,可以确定基因座的平均甲基化密度。如果甲基化敏感性限制酶与DNA基因座的拷贝在允许基因座中潜在的限制酶剪切位点的至少一些拷贝由于在剪切位点处甲基化的存在而保持未剪切的条件下接触,则剩余的完整的DNA将与甲基化密度成正比,因此可与对照进行比较以确定样品中基因座的相对甲基化密度。类似地,如果甲基化依赖性限制酶与DNA基因座的拷贝在允许基因座中的潜在的限制酶剪切位点的至少一些拷贝由于在剪切位点处缺乏甲基化而保持未剪切的条件下接触,则剩余的完整的DNA将与甲基化密度成反比,并且因此可以与对照进行比较以确定样品中基因座的相对甲基化密度。例如,专利号为7,910,296的美国专利公开了这样的试验。
用于上述方法的试剂盒可以包括例如一种或多种甲基化依赖性限制酶,甲基化敏感性限制酶,扩增(例如PCR)试剂和一种或多种探针和/或引物。在一些情况下,所述一种或多种探针和 /或引物对SEQ ID NO:1或其部分具有特异性,例如,与SEQ ID NO:1或其部分特异性杂交。在一些情况下,所述一种或多种探针和/或引物对亚硫酸氢盐转化的SEQ IDNO:1或其部分具有特异性,例如,与亚硫酸氢盐转化的SEQ ID NO:1或其部分特异性杂交。
可以使用定量扩增方法(例如,定量PCR或定量线性扩增)来量化在限制性消化后由一个或多个扩增引物选择的基因座内的完整的DNA的量。例如,专利号为6,180,349;6,033,854和 5,972,602的美国专利,以及例如,Gibson et al.,Genome Research 6:995-1001(1996);DeGraves, et al.,Biotechniques 34(1):106-10,112-5(2003);Deiman B,et al.,Mol Biotechnol.20(2):163-79 (2002),公开了定量扩增的方法。可以“实时”监测扩增。
用于检测DNA甲基化的另外的方法可以涉及在用亚硫酸氢盐处理DNA之前和之后的基因组测序。参见,例如et al.,Proc.Natl.Acad.Sci.USA 89:1827-1831(1992)。当亚硫酸氢钠与DNA 接触时,未甲基化的胞嘧啶转化为尿嘧啶,而不会修改甲基化的胞嘧啶。
在一些实施例中,使用限制酶消化由亚硫酸氢盐转化的DNA扩增的PCR产物来检测DNA 甲基化。参见,例如,Sadri&Hornsby,Nucl.Acids Res.24:5058-5059(1996);Xiong&Laird, Nucleic Acids Res.25:2532-2534(1997)。
在一些实施例中,单独使用MethyLight试验或与其它方法组合使用来检测DNA甲基化(参见,Eads et al.,Cancer Res.59:2302-2306(1999))。简而言之,在MethyLight过程中,基因组 DNA在亚硫酸氢钠反应中转化(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后使用例如与CpG二核苷酸杂交的PCR引物对感兴趣的DNA序列进行扩增。通过使用仅与由未甲基化DNA的亚硫酸氢盐转化产生的序列(或可替换地与未转化的甲基化序列)杂交的一个或多个引物,扩增可以指示一个或多个引物杂交的序列的甲基化状态。类似地,可以用特异性结合至由未甲基化(或甲基化)DNA的亚硫酸氢盐处理产生的序列的探针来检测扩增产物。如果需要,引物和探针都可用于检测甲基化状态。因此,与MethyLight一起使用的试剂盒可以包括亚硫酸氢钠以及引物或可检测地标记的探针(包括但不限于Taqman或分子信标探针),所述引物或可检测地标记的探针区分用亚硫酸氢盐处理的甲基化DNA和未甲基化DNA。其它试剂盒组分可包括例如DNA扩增所需的试剂,包括但不限于PCR缓冲液,脱氧核苷酸;和热稳定聚合酶。
在一些实施例中,单独使用或与其它方法组合使用Ms-SNuPE(甲基化敏感性单核苷酸引物延伸)反应以检测DNA甲基化(参见Gonzalgo&Jones,Nucleic Acids Res.25:2529-2531 (1997))。Ms-SNuPE技术是基于DNA的亚硫酸氢盐处理,随后进行单核苷酸引物延伸 (Gonzalgo&Jones,同上)评估在特定CpG位点处的甲基化差异的定量方法。简而言之,使基因组DNA与亚硫酸氢钠反应以将未甲基化的胞嘧啶转化为尿嘧啶,同时使5-甲基胞嘧啶不变。然后使用亚硫酸氢盐转化的DNA的特异性PCR引物对所需靶序列进行扩增,分离所得产物并将其用作感兴趣的CpG位点的甲基化分析的模板。
用于Ms-SNuPE分析的典型试剂(例如,典型的基于Ms-SNuPE的试剂盒可能供有)可以包括但不限于:用于特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物;优化的 PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因的Ms-SNuPE引物;反应缓冲液(用于Ms-SNuPE反应);和可检测地标记的核苷酸。另外,亚硫酸氢盐转化试剂可以包括:DNA变性缓冲液、磺化反应缓冲液、DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱)、脱磺化反应缓冲液和DNA回收组分。
在一些实施例中,单独使用或与其它方法组合使用甲基化特异性PCR(“MSP”)反应以检测 DNA甲基化。MSP试验需要通过亚硫酸氢钠进行DNA的初始修饰,将所有未甲基化但不甲基化的胞嘧啶转化为尿嘧啶,随后用甲基化DNA特异性引物和未甲基化DNA特异性引物扩增。参见,Herman et al.,Proc.Natl.Acad.Sci.USA 93:9821-9826,(1996);U.S.专利号5,786,146。
另外的甲基化检测方法包括但不限于甲基化的CpG岛扩增(参见,Toyota et al.,Cancer Res. 59:2307-12(1999))和例如公开号为2005/0069879的美国专利;Rein,etal.Nucleic Acids Res. 26(10):2255-64(1998);Olek,et al.Nat Genet.17(3):275-6(1997)和公开号为WO 00/70090的 PCT公布中描述的那些方法。
在一些实施例中,所述方法包括:从所述植物获得生物样品;确定来自所述植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶(例如,CHG基序中的胞嘧啶)的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。
可以通过本领域已知的任何方法获得生物样品。通常,以保留样品的核酸的方式获得生物样品。在一些情况下,获得并处理所述生物样品以保持其中基因组DNA的甲基化状态。在一些情况下,获得和处理所述生物样品以保持RNA完整性。
可替换地,在一些情况下,所述方法包括提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由来自每棵植物的样品中的差异甲基化区域(DMR) 内至少一个胞嘧啶的甲基化状态决定,其中所述DMR处于与SEQ ID NO:1至少70%、80%、 90%、95%或99%一致或一致的DNA序列内;以及使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。
在一些情况下,所述方法还包括使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述植物可以物理分离,例如通过选择预测为体细胞克隆异常的植物并将其破坏或丢弃。在一些情况下,通过选择预测为缺乏体细胞克隆异常的植物进行培养从而对所述植物进行物理分离。在一些情况下,使选择用于培养的植物发芽、移植或种植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理物理分离的植物以减少、减轻、消除或预防体细胞克隆异常。例如,物理分离的植物可以与含有启动子的表达盒接触,所述启动子可操作地连接至编码转录物的多核苷酸,所述转录物在预测为体细胞克隆异常的植物中表达减少。
在一些方面,DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,DNA元区处于SEQ ID NO:1中,或处于与油棕基因组中的SEQID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、 60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和 74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、71和72的序列至少90%、95%或99%一致,或一致。
在一些实施例中,当至少一个胞嘧啶的甲基化状态相对于对照基因座降低时,预测存在体细胞克隆异常。在一些实施例中,当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,至少一个胞嘧啶的甲基化的增加或减少预测着存在体细胞克隆异常。在一些情况下,所述至少一个胞嘧啶处于与选自SEQ IDNO:1-5和7-75、 78或80的序列对应(例如,至少70%、80%、90%、95%或99%一致,或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。
可以将至少一个胞嘧啶的甲基化状态与对照基因座进行比较以确定甲基化的相对变化。例如,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较高,则测试基因座的甲基化状态增加。作为另一个实例,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较低,则测试基因座的甲基化状态降低。通常,对照基因座具有已知的、相对恒定的甲基化状态。例如,可以预先确定没有甲基化,具有一些或大量的甲基化,从而提供相对恒定的值以控制与存在或不存在体细胞克隆异常无关的检测方法等中的误差。在一些实施例中,对照基因座是内源的,即,是独立样品的基因组的一部分。可替换地,对照基因座可以是外源基因座,例如以已知量掺入样品中且甲基化状态已知的DNA序列。
在一些实施例中,确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,以预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR处于与独立地选自SEQID NOS:1-5和7-75的序列对应(例如,至少70%、80%、90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。
在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物降低,该对照植物比如亲本植物或相同果实颜色(nigrescens或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。
B.通过基因表达分析预测异常
基因组DNA的甲基化可以影响邻近基因序列的表达(转录和/或翻译)。因此,在一些实施例中,所述方法包括使DNA区域中至少一个胞嘧啶的甲基化状态与邻近编码序列的表达相关联的步骤,所述邻近编码序列比如cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)、kDEF1 (SEQ ID NO:78),或gDEF1(SEQ ID NO:80)中的一个或多个转录物,和/或靠近EgDEF1基因座的反转录转座子的一个或多个转录物(SEQ ID NO:2、3或4)。例如,可以检测DNA区域中感兴趣的胞嘧啶的3'或5'任一方向上约1.0kb、1.5kb、2.0kb、2.5kb、3.0kb、3.5kb或 4.0kb或更多的基因序列的表达。在一些实施例中,所述方法包括检测或定量邻近编码序列的表达的步骤,所述邻近编码序列例如cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)、kDEF1 (SEQ ID NO:78)或gDEF1(SEQ ID NO:80)中的一个或多个转录物,和/或靠近EgDEF1基因座的反转录转座子的一个或多个转录物(SEQ ID NO:2、3或4),并使所述表达与体细胞克隆异常的存在,或不存在,或预测相关。
在一些情况下,cDEF1表达与正常表型相关。例如,在一些情况下,在正常表型植物中cDEF1 表达水平较高,因此当检测到低水平的(例如,相对于阈值或对照)的cDEF1表达时,预测 Mantled表型。在一些情况下,tDEF1的表达与Mantled表型相关。例如,在一些情况下,在 Mantled表型植物中tDEF1的表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的tDEF1表达时,预测Mantled表型。在一些情况下,kDEF1的表达与Mantled表型相关。例如,在一些情况下,在Mantled表型植物中kDEF1的表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的kDEF1表达时,预测Mantled表型。在一些情况下,gDEF1的表达与Mantled表型相关。例如,在一些情况下,在Mantled表型植物中gDEF1表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的gDEF1表达时,预测 Mantled表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled)植物的样品或异常(例如,Mantled) 植物的表达值。
在一些情况下,SEQ ID NO:1内编码的siRNA的表达与正常表型相关,因此当检测到低水平的(例如,相对于阈值或对照)siRNA表达时,预测Mantled表型。例如,在一些情况下,当检测到由SEQ ID NO:144-161中一个或多个序列编码的一种或多种siRNA的表达水平低 (例如,相对于阈值或对照)时,预测Mantled表型。在一些情况下,当由SEQ ID NO:144-161 中的一个或多个序列编码的一种或多种siRNA的表达相对于对照或阈值降低至少50%时,预测Mantled表型。作为另一个实施例,在一些情况下,当检测到由SEQ ID NO:91编码的siRNA 的表达水平低(例如,相对于阈值或对照)时,预测Mantled表型。在一些情况下,当由SEQ ID NO:91编码的siRNA的表达相对于对照或阈值降低至少50%、60%、70%、80%或90%时,预测Mantled表型。
本领域熟知用于测量特定基因序列的转录和/或翻译的方法。参见例如Ausubel,Current Protocols in Molecular Biology,1987-2006,John Wiley&Sons和Sambrookand Russell, Molecular Cloning:A Laboratory Manual,3rd Edition,2000,ColdSpring Harbor Laboratory Press。在一些实施例中,将SEQ ID NO:1、2、3、4、5、75、78或80中编码的基因的基因表达或蛋白质表达与对照进行比较,所述对照例如来自已知体细胞克隆异常为阴性或已知体细胞克隆异常为阳性的植物的样品的邻近基因序列的表达,或者区分体细胞克隆异常和野生型状态的表达水平。涉及表达检测的此类方法,如本文所述的检测甲基化的方法,可用于预测植物中存在或不存在体细胞克隆异常(例如,可用于预测存在或不存在Mantled表型)。在一些情况下,检测调节RNA的表达。例如,可以检测调节cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)的表达的调节RNA。典型的调节RNA包括但不限于微RNA。在一些情况下,检测至少部分在位于与SEQ ID NO:1对应的基因组基因座中的反转录转座子内编码的一种或多种调节RNA的表达。差异DNA甲基化可导致调节RNA表达的变化(例如,微小RNA,小干扰RNA和反义RNA),然后调节RNA表达的变化可导致顺式或反式中的基因表达的变化。同样,调节RNA本身可以通过RNA引导的DNA甲基化(RdDM)体系引导植物中DNA甲基化状态的建立和/或维持。参见Vu,et al.2013 Development 140:2953-60,Regulski,et al. 2013 Genome Res 23:1651。因此,在一些情况下,涉及调节RNA的机制在与Mantled表型有关的差异DNA甲基化的建立或在差异DNA甲基化调节涉及Mantled表型的基因功能的机制中也可能涉及。
在一些实施例中,该方法还包括使SEQ ID NO:1、或DNA区域,或DNA元区,或生物标记物中一个或多个胞嘧啶的甲基化状态与SEQ ID NO:1、2、3、4、5、75、78或80中一致的一个或多个基因区域的表达相关联。在一些实施例中,所述方法还包括使所述甲基化状态和/或表达水平与Mantled表型相关联的步骤。
在一些实施例中,检测小RNA的表达。小RNA为小非编码表达RNA分子。小RNA可以参与基因调节和其它生物过程。通过本发明的方法检测或定量的典型的小RNA包括由与SEQID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、 124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、 145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或 161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码的一个或多个小RNA。通过本发明的方法检测或定量的典型的小RNA包括至少部分由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、 124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、 145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或 161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码的一种或多种小RNA。
在一些情况下,小RNA在正常植物对比异常(例如,Mantled)植物中差异表达。可以在植物样品中检测这种差异表达,并与对应于样品的植物的预测的正常或异常(例如,Mantled) 表型相关联。这种差异表达的小RNA包括但不限于由与SEQ ID NO:91、92、93、94、95、 96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、 113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、 134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、 150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、 90%、95%或99%一致,或一致的多核苷酸编码或至少部分由该多核苷酸编码的那些小RNA。在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、 103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、 119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、 140、141、142或143至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达增加(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、 113、114、116、117、135、140或141至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达增加(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled) 植物的样品或异常(例如,Mantled)植物的表达值。
在一些情况下,当检测到由与SEQ ID NO:135、140或141至少75%,80%,85%,90%, 95%,95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小 RNA的表达时,或当检测到表达水平增加(例如,相对于阈值或对照)时,预测异常(例如, Mantled)表型。在一些情况下,当检测到由与SEQ ID NO:130、131、132、133、134、136、 137、138、139、142或143至少75%,80%,85%,90%,95%,95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达时,或当检测到表达水平增加(例如,相对于阈值或对照)时,预测正常表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled)植物的样品或异常(例如,Mantled)植物的表达值。
在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、 119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、 156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达减少(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,当由与97、115、118、119、 120、121、122、130、131、132、133、134、135、136、137、138、139、140、141、142、 143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、 159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达减少(相对于阈值或对照)时,预测异常(例如,Mantled)表型。
在一些实施例中,所述方法包括:从植物获得生物样品;检测或量化SEQ ID NO:2、3、4、 5、75、78、80、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、 106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、 122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、 143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、 159、160或161中的一个或多个序列的表达;并且使所述表达或表达水平与植物存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测植物存在或不存在体细胞克隆异常。
可以通过本领域已知的任何方法获得生物样品。通常,以保留样品的核酸的方式获得所述生物样品。在一些情况下,获得并处理所述生物样品以保持其中的RNA。在一些情况下,获得和处理所述生物样品以保持RNA完整性。
可替换地,在一些情况下,所述方法包括提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中通过基因表达分析来确定存在或不存在体细胞克隆异常;以及将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。
在一些情况下,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述植物可以物理分离,例如通过选择预测为体细胞克隆异常的植物并将其破坏或丢弃。在一些情况下,通过选择预测为缺乏体细胞克隆异常的植物进行培养,将所述植物物理分离。在一些情况下,使选择用于培养的植物发芽、移植或种植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理物理分离的植物以减少、减轻,消除或预防体细胞克隆异常。
在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物,比如亲本植物或相同果实颜色(nigrescens 或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。
C.采样和/或分拣
可以由油棕植物的任何合适的细胞或组织获得油棕核酸。例如,油棕核酸可以由叶、茎、根、种子或体外培养物中的或体外培养物获得的植物细胞或植物细胞群获得。在一些情况下,油棕核酸由种子的胚乳组织获得。在一些实施例中,由植物细胞(例如,体外培养物中的植物细胞或从体外培养物获得的植物细胞)、幼苗、未成熟(例如无果实的)植物或成熟植物中提取核酸。在一些情况下,以使得油棕植物的活力不降低或者活力基本上不降低这样的方式获得油棕核酸。例如,在一些情况下,样品提取可以使群体中活植物或种子的数量减少小于约 20%、15%、10%、5%、2.5%、1%或更少。在一些情况下,核酸由植物细胞群获得,其中植物细胞群的一个或所有基因组基因座的基因型和/或表观基因型一致或基本一致。例如,可以提取、分析来自体外培养物中的一部分植物细胞的核酸样品,并且结果用于分拣体外培养物。获得合适样品的典型组织类型包括来自体外苗木和苗圃分株的叶。可替换地,也可以使用组织,比如根、花序和合子胚。也可以在组织培养之前筛选来自潜在的原株的组织。也可以测试来自半克隆和双克隆的种子。
可以自动进行采样。例如,可以使用机器在体外培养物中挑选植物细胞集落或细胞团、或其一部分用于分析。类似地,机器可以从植物或种子获取样品,或从多个植物细胞集落、细胞团、植物或种子获取样品。也可以手动进行采样。本文描述了另外的采样方法。
在一些实施例中,控制采样以防止样品污染。例如,可以在样品加工步骤之间采用洗涤步骤。可替换地,可以使用一次性或可移除的样品处理元件,例如,一次性移液尖、一次性容器或容器,或一次性刀片或研磨机。
在一些情况下,在检测油棕植物DMR内的一个或多个胞嘧啶的甲基化状态之前纯化样品。例如,样品可以离心、提取、沉淀(例如,醇沉淀),或使用固体支持物(例如,使用结合核酸的珠子或膜)纯化。本领域技术人员已知用于纯化植物核酸的其它方法。
在一些实施例中,预测存在或不存在体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。例如,可以基于SEQ ID NO:1中一个或多个胞嘧啶或一个或多个DNA 区域、DNA元区或其中的生物标记物的甲基化状态预测体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。在一些情况下,例如,基于甲基化状态或基因表达可以预测体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。
例如,可以基于预测的植物表型(例如,基于如本文所述的植物的甲基化或表达)将多棵植物分拣(例如,物理分离)为Mantled或非Mantled(例如,野生型)植物。可以分拣并储存或利用并种植野生型植物或以其它方式与植物繁殖材料分离以克隆生成缺乏一个或多个体细胞克隆异常的植物。在一些情况下,可以丢弃或破坏(例如,高压灭菌)或不在商业油棕生产中培养具有一个或多个体细胞克隆异常的植物,例如,Mantled植物,。
在一些情况下,植物是来自体外培养物的植物细胞、植物细胞团或植物细胞集落,并且当来自培养物的一棵或多棵植物被预测为体细胞克隆异常(例如,预测一棵或多棵植物呈现
Mantled表型)时,丢弃或破坏体外培养物。在一些情况下,植物是幼小分株,并测定来自所述植物的核酸以预测存在或不存在体细胞克隆异常。在一些情况下,在种植田间之前分拣所述幼小分株。例如,可以丢弃预测为体细胞克隆异常(例如,Mantled表型)的幼小分株。预测为缺乏体细胞克隆异常的分株可以在田间进一步培养和/或种植。作为另一个可替换方案,可以测定为最佳棕榈油产量已经种植于田间,但是没有成熟到足以验证不存在体细胞克隆异常(例如,Mantled表型)的油棕植物,并且可以从田间移除预测为体细胞克隆异常的植物。在一些实施例中,预测存在或不存在体细胞克隆异常和植物果实颜色和/或壳厚度表型。预测果实颜色和/或壳厚度表型和/或基于这些预测的表型来分拣的方法公开于,例如,申请号为 14/226,508,2014年3月26日提交的美国专利申请和申请号为13/800,652,2013年3月13 日提交的美国专利申请。在一些情况下,可以基于VIR基因的基因型来预测和/或分拣果实颜色。在一些情况下,可以基于SHELL基因的基因型来预测和/或分拣壳厚度。
在一些情况下,将果实颜色和/或壳厚度预测与甲基化状态或基因表达信息组合以预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,基于一种、两种或所有三种预测的表型分拣所述植物。例如,可以基于预测的表型将植物分拣为nigrescens或virescen 种子或植物和dura、tenera或pisifera种子或植物。然后可以根据预测验证所述植物缺乏体细胞克隆异常(例如,Mantled表型)。在一些情况下,可以预测植物缺乏体细胞克隆异常(例如,Mantled表型),然后可以基于预测或预期的nigrescens、virescens、dura、tenera和/或 pisifera表型分拣和/或储备这些植物。
在一些情况下,在田间栽培之前进行幼小植物的一种或多种表型的预测。因此,在一些情况下,所述样品是前期苗圃硬化或苗圃习服期间的幼小分株。在一些实施例中,所述样品从已经发芽并随后培养少于1、2、4、6个月或少于1、2、3、4或5年的半克隆或双克隆植物获得。在一些实施例中,在所述植物已经发芽(例如,从种子中)之前或发芽后不久(例如,在发芽后少于约1、2、3、4或5周)获得所述样品。
在一些实施例中,确定至少一个胞嘧啶的甲基化状态,并且与DNA指纹识别方法组合以帮助登记、选择、维持、组织、识别或追踪克隆材料、树干、株系或培养物。例如,可以利用用于预测存在或不存在体细胞克隆异常的DNA指纹识别和甲基化状态或基因表达确认体外培养物来源于特定来源或谱系。类似地,可以查明存在或不存在受植物品种保护法(例如马来西亚或印度尼西亚的植物品种保护法)保护的株系、树干或品种和预测存在或不存在体细胞克隆异常。在一些实施例中,可以使用DNA指纹识别来识别和/或确认棕榈具有或可能具有一种或多种期望的表型(例如,果实颜色、壳厚度、害虫抗性等)和预测存在或不存在体细胞克隆异常。本领域已知用于DNA指纹识别的方法,并且该方法包括,例如在Lim&Rao,J Oil Palm Research,17:136-144(Dec.2005);Billotte,et al.,Genome,,44(3):413-425(2001); Jack&Mayes,Oleagineux,48(1):1-8(1993);Jack,et al.,Theor ApplGenet,90:543-649(1995); Cheah,et al.,Advances in Oil Palm Research p.332-70(2000);和Corley,J.Oil Palm Research, 17:64-69(2005)中描述的那些方法。
机器可以用于实施本文所述的一种或多种方法,制备用于本文所述的一种或多种方法的植物样品或促进油棕植物的高通量分拣。
在一些情况下,机器可以对种子进行分拣和定向,使得种子都以类似的方式定向。例如,种子可以定向为种子胚胎区域向下,并且无胚胎区域向上。在一些情况下,所述种子可以置于有序阵列中或单行中。
在一些实施例中,使所述种子保持预定取向从而便于有效和精确采样。例如,所述机器可以通过种子形状或视觉外观来使种子定向。在一些情况下,种子定向为便于从包含种子的子叶和/或胚乳组织的各个种子的“冠状物(Crown)”采样,从而保持每个种子的萌芽活力。
在一些情况下,机器可以单独储备植物和相应提取的样品。例如,可以从体外培养物获得样品,并且储备培养物。在一些情况下,以可以确定其所来源的样品和植物(例如,培养物) 这样的方式组织、标记或登记提取的样品和储备的植物。在一些情况下,追踪所提取的样品和储备的植物,使得在收集数据之后可以访问每棵植物的数据。例如,可以从培养物中提取样品,并且对样品和种子预测存在或不存在体细胞克隆异常(例如,Mantled表型)。然后可以基于该预测来访问植物数据、使植物发芽、种植、储备或破坏植物。
在一些情况下,提取和储备由所述机器自动进行,但是甲基化分析和/或经分析的植物的处理手动进行或通过另一台机器进行。因此,在一些实施例中,提供了由两台或更多台机器组成的系统用于提取样品,分拣和储备以及预测存在或不存在体细胞克隆异常(例如,Mantled 表型)。
在一些情况下,所述植物通过机器储备在阵列中,例如,单独地在管或孔阵列中。可以在每个孔中或从每个孔中对所述植物进行采样和/或查询。采样或查询的结果可以与阵列中所述植物的位置相关联。
采样可包括核酸(例如,DNA或RNA)的提取和/或分析。采样还可以包括磁共振成像、光分散、光吸收、ELISA、酶测定等。
例如,专利号为4,910,146、6,307,123、6,646,264、6,673,595、7,367,155、8,312,672、7,685,768、 7,673,572、8,443,545、7,998,669、8,114,669、8,362,317、8,076,076、7,402,731、7,600,642、 8,237,016、8,401,271、8,281,935、8,241,914、6,880,771、7,909,276、8,221,968和7,454,989 的美国专利进一步描述了用于植物培养、采样和/或分拣的系统、机器、方法和组合物。例如,公开号为2012/180386、2009/070891、2013/104454、2012/117865、2008/289061、2008/000815、 2011/132721、2011/195866、2011/0079544、2010/0143906和2013/079917的美国专利申请也进一步描述了用于植物培养、采样和/或分拣的系统、机器、方法和组合物。公开号为 WO2011/119390和WO2011/119394的国际专利申请进一步描述了用于植物培养、采样和/或分拣的另外的系统、机器、方法和组合物。
本文还提供了使用本文所述的系统、机器、方法和组合物进行植物(例如种子、幼苗、植物、植物细胞、植物细胞集落或植物细胞团)采样或分拣的方法。例如,可以将植物或植物组装载到取样器中,并获得样品。在一些情况下,植物可以例如储备成阵列。在一些情况下,储备由对植物进行采样的机器进行。在其它情况下,所述植物由另一台机器储备,或手动储备。在一些情况下,可以从所述样品中提取DNA。在一些情况下,可以通过相同的机器获得样品并提取DNA。在其它情况下,通过另一台机器或手动提取DNA。可以分析提取的DNA,并预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,通过相同的机器,通过另一台机器或手动分析提取的DNA。在一些情况下,通过机器、不同的机器或手动预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,可以基于对体细胞克隆异常(例如,Mantled表型)的存在或不存在的预测来处置(例如,培养、处理或破坏)储备的植物。在一些情况下,可以基于VIR基因型或预测的果实颜色表型,基于其预测的壳厚度表型,和/或基于对体细胞克隆异常(例如,Mantled表型)的存在或不存在的预测,处置储备的植物。例如,可以丢弃或破坏或处理预测为体细胞克隆异常的植物。作为另一个实施例,可以从选择用于田间种植和培养以产油的植物群中移除(例如,分离)预测为pisifera和/或Mantled,或dura和/或Mantled的植物。类似地,例如,预测为tenera并且不存在体细胞克隆异常(例如,缺乏Mantled表型)的植物可以从其它植物中分离和/或选择用于田间培养。在一些情况下,通过机器、不同的机器或手动处置所述植物。
在一些情况下,将所述植物(例如,种子、幼苗、植物、植物细胞、植物细胞集落或植物细胞团)从客户运送到服务提供商,分析并返回。在一些情况下,仅返回具有预测的表型的植物。例如,仅返回预测为缺乏体细胞克隆异常的植物或其组合。在其它情况下,对植物进行采样,并将样品从客户运送到服务提供商进行分析。然后,客户可以利用通过分析提供的信息来处置所述植物。
在一些情况下,提供试剂(例如本文所述的组合物)以对所述植物进行手动或自动采样。例如,可以提供如本文所述的内切核酸酶、寡核苷酸引物或探针或其组合。作为另一个实例,如本文所述,可以提供包含用于分析来自油棕植物的核酸所需的试剂的反应混合物或试剂盒。
C.筛选培养条件
在油棕株系中,体外培养物可以产生体细胞克隆异常。例如,体外培养物可以产生具有Mantled 表型的油棕植物。在一些情况下,可以筛选培养条件或方案以识别减少或消除体细胞克隆变体产生的条件或方案。然后可以使用这些条件或方案来开发体细胞克隆异常减少或无体细胞克隆异常的克隆繁殖的油棕植物系。例如,体外培养物可以经受标准培养条件作为对照。然后可以使类似或相同的培养物经受测试条件。可以在对照和测试培养物中确定体细胞克隆异常的存在或不存、比例或可能性。然后可以识别和利用减少或消除体细胞克隆异常的测试条件。在一些情况下,可以反复重复实验以进一步改善培养条件。典型的培养条件包括但不限于采样期间棕榈的生理状态、外植体类型、继代培养物数量、每胚胎系的分株数、生长素激素水平和类型、细胞分裂素激素水平和类型、盐浓度、渗透压、pH、温度、光周期、饲养细胞的存在和/或类型、培养基组成等。
在一些情况下,可以筛选体外植物培养物以识别已经出现体细胞克隆异常的培养物。例如,可以检验体外油棕植物培养物或体外油棕植物培养物组,可以预测存在或不存在体细胞克隆异常,然后分离、丢弃或破坏预测为具有体细胞克隆异常或体细胞克隆异常的百分比或可能性较高的培养物。在一些情况下,可以处理预测为具有体细胞克隆异常的培养物以降低体细胞克隆异常可能性,预防或逆转体细胞克隆异常。
IV.减少体细胞克隆异常
在一些实施例中,处理植物(例如,植物细胞体外组织培养物)以减少、预防、减轻、消除或逆转体细胞克隆异常或预测的体细胞克隆异常。在一些情况下,通过向所述植物外源施用由SEQ ID NO:5或与SEQ ID NO:5至少90%,95%或99%一致或一致的序列编码的mRNA,或向所述植物外源施用由包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、116、117、 123、124、130、131、132、133、134、136、137、138、139、142、143、144、145、146、 147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%, 95%或99%一致或一致的多核苷酸的序列编码的小RNA来减少、预防、减轻、消除或逆转体细胞克隆异常。
在一些情况下,外源施用mRNA或小RNA包括使植物的细胞质或细胞核与所述mRNA或小 RNA接触。在一些情况下,所述mRNA或小RNA在体外转录反应中产生。在一些情况下,外源施用所述mRNA或小RNA包括使所述植物与包含异源启动子的表达盒接触,所述异源启动子可操作地连接至与SEQ ID NO:5至少75%、80%、85%、90%、95%或99%一致或一致的多核苷酸。在一些情况下,外源施用所述mRNA或小RNA包括使所述植物与包含异源启动子的表达盒接触,所述异源启动子可操作地连接至编码小RNA的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、 104、105、106、107、108、109、110、111、112、113、114、116、117、123、124、130、 131、132、133、134、136、137、138、139、142、143、144、145、146、147、148、149、 150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、 90%、95%或99%一致或一致的序列。
在一些情况下,外源施用所述mRNA或小RNA包括产生转基因植物并且从所述转基因植物产生体外组织培养物,所述转基因植物具有可操作地连接至一个或多个前述多核苷酸的异源启动子。在一些情况下,这样的组织培养体系可以减少或消除体细胞克隆异常的产生。因此,可以在没有产生具有体细胞克隆异常的植物风险或风险较小的情况下,通过体外组织培养繁殖技术无定限地产生具有一种或多种所需特性例如高油产量或所需dura、tenera、pisifera、 virescens或nigrescens表型的油棕植物。
V.试剂盒
本发明还提供了使用本文所述的方法检测和/或量化本发明的DMR、DNA区、DNA元区或生物标记物内的甲基化的试剂盒。
本发明的试剂盒可以包括与本发明的至少一个诊断性生物标记物序列杂交的至少一种多核苷酸和至少一种用于检测甲基化的试剂。用于检测甲基化的试剂可以包括,例如,亚硫酸氢钠、多核苷酸和/或甲基化敏感性或甲基化依赖性限制性酶,所述多核苷酸设计为,如果生物标记物序列未甲基化(例如,包含至少一个C→U转化)则与作为本发明的生物标记物的产物(例如,扩增产物)的序列特异性杂交,或如果生物标记物甲基化,则特异性杂交。试剂盒可以提供适于在试验中使用的试验装置形式的固体支持物。所述试剂盒可以进一步包括可检测标记,可检测标记任选地连接到所述试剂盒中的多核苷酸,例如,探针。所述试剂盒中也可以包括用于进行试验的其它材料,包括试管、移液管等。所述试剂盒还可以包括在本文所述的任何试验中使用一种或多种这些试剂的书面说明书。
在一些实施例中,提供了用于确定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,所述试剂盒包括:(1)多核苷酸或多核苷酸对,其能够特异性扩增DMR的至少一部分,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;和甲基化依赖性、甲基化敏感性限制酶和/或亚硫酸氢钠;或(2)亚硫酸氢钠,用于全基因组扩增的引物和接头,和至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的甲基化转化序列和/或未甲基化转化序列的存在,其中DMR处于与SEQ ID NO: 1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(3)甲基化敏感性限制酶,用于全基因组扩增的引物和接头,和至少一种用于量化DMR的至少一部分的拷贝数的多核苷酸,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(4)甲基化感测结合部分和至少一种多核苷酸以量化DMR的至少一部分的拷贝数,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内。
在一些情况下,所述DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,DNA元区处于SEQ ID NO: 1中,或处于与油棕基因组中的SEQ ID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、 60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和 74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、71和72的序列至少90%、95%或99%一致,或一致。
在一些实施例中,所述试剂盒确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,从而预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR处于与独立地选自SEQ ID NOS:1-5和7-75的序列对应(例如,至少70%、80%、 90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。
在一些实施例中,所述试剂盒包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。
VI.计算机程序产品
本文所述方法的计算可涉及基于计算机的计算和工具来预测植物或植物细胞中存在或不存在体细胞克隆异常(例如,预测Mantled表型)。例如,如本文所述,计算机可以将DNA区域、DNA元区、生物标记物,其一部分或其中的一个或多个胞嘧啶的甲基化值与阈值或对照值进行比较。所述工具有利地以可由常规设计的通用计算机系统(在此称为“主计算机”)执行的计算机程序的形式提供。主计算机可以配置有许多不同的硬件组件,并且可以制成许多维度和式样(例如,台式PC、笔记型电脑、平板PC、手持计算机、服务器、工作站、大型机)。可以包括标准组件,例如监视器、键盘、磁盘驱动器、CD和/或DVD驱动器等。在主计算机连接至网络的情况下,可以经由任何合适的传输介质(例如,有线、光学和/或无线介质)和任何合适的通信协议(例如,TCP/IP)来提供连接;主计算机可以包括合适的联网硬件(例如,调制解调器、以太网卡、WiFi卡)。主计算机可以实现多种操作系统中的任一种,包括UNIX、Linux、Microsoft Windows、MacOS或任何其它操作系统。
用于实现本发明的各方面的计算机代码可以以各种语言编写,包括PERL、C、C++、Java、 JavaScript、VBScript、AWK或可以在主计算机上执行或可以编译以在主机上执行的任何其他脚本或编程语言。还可以以低级语言编写或分配代码,比如汇编语言或机器语言。
主计算机系统有利地提供了界面,用户通过该界面控制所述工具的操作。在本文所述的实施例中,软件工具以脚本(例如,使用PERL)实现,其执行可以由用户从操作系统(比如Linux 或UNIX)的标准命令行界面发起。本领域技术人员将理解,命令可以酌情适应所述操作系统。在其它实施例中,可以提供图形用户界面,图形用户界面允许用户使用指向设备来控制操作。因此,本发明不限于任何特定的用户界面。
结合本发明的各种特征的脚本或程序可以编码在用于存储和/或传输的各种计算机可读介质上。合适的介质的示例包括磁盘或磁带,比如压缩盘(CD)或DVD(数字多用光盘)的光学存储介质、闪存和适于经由符合各种协议的有线、光学和/或无线网络,包括互联网传输的载波信号。
在一些实施例中,所述计算机程序产品包含用程序代码编码的计算机可读介质,所述程序代码包括:
用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;
以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。
在一些情况下,所述DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,所述DNA元区处于SEQ ID NO: 1中,或处于与油棕基因组中的SEQ ID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、 60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、 73和74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、71和72的序列至少90%、95%或99%一致,或一致。
可以将至少一个胞嘧啶的甲基化状态与对照值进行比较以确定甲基化的相对变化,其中所述对照值时对照基因组的甲基化值。例如,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较高,则测试基因座的甲基化状态增加。作为另一个实例,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较低,则测试基因座的甲基化状态降低。通常,对照基因座具有已知的、相对恒定的甲基化状态。例如,可以预先确定没有甲基化,具有一些或大量的甲基化,从而提供相对恒定的值以控制与存在或不存在体细胞克隆异常无关的检测方法等中的误差。在一些实施例中,对照基因座是内源的,即,是独立样品的基因组的一部分。可替换地,对照基因座可以是外源基因座,例如以已知量掺入样品中且甲基化状态已知的DNA序列。
在一些实施例中,确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,从而预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR 处于与独立地选自SEQ ID NOS:1-5和7-75的序列对应(例如,至少70%、80%、90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。
在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物,比如,亲本植物或相同果实颜色(nigrescens 或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。
在一些情况下,所述计算机程序产品预测植物中存在或不存在体细胞克隆异常(例如,Mantled 表型)。在一些情况下,所述计算机程序产品为另一计算机程序产品或本领域技术人员提供数据,以预测所述植物中存在或不存在体细胞克隆异常。在一些情况下,所述计算机程序产品计算统计置信度(例如,p值、t统计量等)以预测植物中存在或不存在体细胞克隆异常。
实施例
提供以下实施例以阐述而不限制要求保护的本发明。
实施例1:全DNA甲基化图谱揭示了Mantled克隆繁殖材料中的差异DNA甲基化。
基于pisifera油棕基因组的基因组构建体设计微阵列特征(Singh et al.2013,Nature 500, 340-344)。超过100万个特征被设计成与油棕基因组的独特序列相交的独特的61个碱基序列。虽然重复序列构成约57%的油棕基因组,但是可以将独特序列特征设计成侧接不同重复元件的序列,以及嵌入特定重复元件内的独特序列。使用基于DNA微阵列,利用甲基化依赖性限制酶McrBC的技术平台识别Mantled克隆材料相对于表型正常的克隆材料的差异甲基化的基因座(Ordway et al.2006 Carcinogenesis 27:2409-2423;Ordwayet al.2007 PLoS ONE 2: e1314)。参见,例如,专利号为7,186,512的美国专利。其中给定的微阵列特征可以报告DNA 甲基化状态的基因组区域取决于为微阵列杂交进行标记的DNA片段的分子大小。在微阵列实验中,通过琼脂糖凝胶提取来纯化1至4kb大小范围的DNA,并用作用于氰染料标记的模板。因此,每个微阵列特征查询的基因组区域是8kb(即,由微阵列特征表示的序列的上游 4kb和下游4kp)。
与mantled异常有关的果型如图1所示。从78个克隆繁殖的棕榈(分株)的矛尖形叶(spear leaf)中提取DNA,包括37棵单性结实的mantled分株,41棵正常分株和从中得到克隆分株的10棵原株。这些样品从四个工业来源得到并且如图2所述,代表11个独立的克隆繁殖事件,并且每个克隆繁殖事件产生3至5棵正常树和2至5棵mantled树。由代表两次技术重复样、并且每个重复样进行染色交换反向杂交的四个独立的微阵列杂交产生全基因组DNA甲基化图谱。
数千个基因座在遗传一致的原株,单性结实的mantled分株样品和正常分株样品之间进行了差异性甲基化,其中在mantled样品中大部分(~90%)是低甲基化的,这与先前报道的总 5mC水平减少一致(Matthes et al.2001;Jaligot et al.2002;Jaligot etal.2004)。有趣的是,大多数这些低甲基化基因座(~75%)映射到转座子和重复子,而较少频繁的超甲基化基因座映射到基因序列和重复序列。这些结果与拟南芥细胞培养物的类似图谱一致(Vaughn et al. 2007),但与水稻中体细胞克隆再生体的表观遗传图谱不同,其中尽管激活了一些TE(Miyao et al.2012;Cui et al.2013),但DNA甲基化的丧失使基因大大受限((Stroud et al.2013)。为了识别来自多个克隆谱系的mantled克隆和正常克隆之间的表观遗传学差异,首先独立地在各来源群内基于微阵列特征杂交识别正常样品和完全mantled样品之间的显著的差异甲基化区域(DMR)。然后在特征对特征的基础上,比较来源群体之间的杂交结果(图3)。虽然在每个群体的mantled克隆和正常克隆之间检测到数万个显著特征,但是99.9%的这些特征排除了4个群体中的任一个(94.4%)或2(5.5%)个,表明在表观遗传学对组织培养的响应中基因型变异显著。只有79个差异甲基化特征是4个群体中的3个共有的(其中67%与重复元件有关),并且所有4个群体中只有单个微阵列特征检测到正常克隆和mantled克隆之间的差异甲基化(图3)。
区分所有4个群体中mantled克隆与正常克隆的单个特征位于EgDEF1的~35kb内含子5(图 4a)即,金鱼草(Antirrhinum majus)DEFICIENS基因的油棕直系同源物中,EgDEF1编码类似于拟南芥APETALA3(AP3)的花同源异型MADS盒转录因子(Adam etal.2005)。金鱼草中的def突变体和拟南芥中的ap3突变体导致雄蕊进行心皮(B类)同源异型转换,强烈地使人想起油棕中的mantled表型(Jaligot et al.2011)。EgDEF1在E.guineensis染色体12上跨越约40kb并且包括7个外显子(图4a)。Ty1/copia反转录转座子位于EgDEF1启动子有义方向的上游,并且与番茄(Solanum lycopersicum)的Rider元件具有相似性,而Ty3/gypsy 反转录转座子Koala位于反义方向的内含子5的中心附近。与以前的报告(Jaligot et al.2014) 一致,在多个群体的mantled克隆中一致地检测到在这些反转录转座子中的任一个内的DNA 甲基化差异(图4a)。
之前未报告的第三个重复元件位于内含子5中,在有义方向,并且与水稻Karma家族LINE 元件具有同源性。Karma元件,以及Tos17 copia样元件,在水稻胚胎发生组织培养物中激活,但是与Tos17不同,Karma元件仅在再生植物中转座,其中该元件的跨代DNA保持低甲基化 (Komatsu et al.2003)。3.2kb油棕Karma元件的侧翼为13bp靶位点复制序列(TTCAAAATGATGA),并编码与水稻Karma ORF2同源的逆转录酶开放阅读框。如在哺乳动物LINE元件中,ORF2之前是紧邻靶位点重复序列的剪接受体序列(GAACAG^ATGC),并且之后是多聚腺苷酸化信号,类似水稻5'截短的Karma元件(Komatsu et al.2003;Cui et al.2013)。独特的60个核苷酸微阵列特征(mantled克隆中一致检测到低甲基化)不仅映射到Karma元件,而且意外包括预测的剪接受体位点。尽管克隆谱系更少,映射到Karma元件内的所有另外三个的微阵列特征也在mantled克隆中检测到显著的低甲基化(图3和4a)。
所识别的基因组差异甲基化区域映射到已公开的E.guineensis基因组构建体的支架13008的坐标58360至61400(Singh et al.2014,Nature 500,340-344的图1)。SEQ IDNO:15、16、 17和18提供了报道这些差异DNA甲基化测量的四个特征的序列。SEQ ID NO:43、44、45 和46中提供了跨越61mer特征序列的4061bp区域(61mer特征序列的+/-2Kb)的序列。SEQ ID NO:66提供了从显著特征57600上游2kb至显著特征62840下游2kb的合并序列。
为了进一步分析跨EgDEF1基因约95Kb区域中的DNA甲基化,分析代表支架13008的坐标 33080至127680的微阵列特征产生的数据,以独立比较来自每个克隆繁殖事件的mantled克隆材料vs.正常克隆材料(图2)。在元素2(Karma)内,相对于来源于所有11个克隆繁殖谱系的样品中的正常样品,mantled样品显示低甲基化。然而,如图2所总结,其它不同区域以更多谱系特异性方式显示了差异DNA甲基化事件。例如,谱系1、2、3和5显示与mantled 样品中元件3(Koala)的5'端有关的序列的超甲基化。SEQ ID NO:25、26、27和72提供报告这些差异DNA甲基化测量的四个特征的序列。SEQ ID NO:53、54、55和74提供了跨61mer 特征序列的4061bp区域(61mer特征序列的+/-2Kb)的序列。SEQ ID NO:68提供了特征79360上游2kb至83520下游2kb的合并序列。此外,与元件1(Rider)有关的区域显示来源于谱系1、3、5、9和11的mantled样品的差异DNA甲基化。SEQ ID NO:7、8、9、10、 11、12、13和71提供了报道这些差异DNA甲基化测量的8个特征的序列。SEQ ID NO:35、 36、37、38、39、40、41和73提供了跨61mer特征序列的4,061bp区域(61mer特征序列的 +/-2Kb)的序列。SEQID NO:63提供了从特征33080上游2kb至35720下游2kb的合并序列。SEQ ID NO:64提供了从特征44480上游2kb至特征45160下游2kb的合并序列。SEQ ID NO:65提供了从特征50360上游2kb至特征51760下游2kb的合并序列。如图2所示,在各种克隆谱系中,EgDEF1内含子5内或EgDEF1基因3'端下游的其它区域的甲基化偶尔有差异(如图2所示)。SEQ ID NO:7至34,71和72提供了报道这些差异DNA甲基化测量的所有30个特征的序列。SEQ ID NO:35-62,73和74提供了跨61mer特征序列的4,061bp 区域(61mer特征序列的+/-2Kb)的序列。
实施例2:正常克隆树和异常克隆树的差异DNA甲基化的验证和确认
为了验证mantled克隆中的Karma低甲基化,对来自5个独立克隆谱系(15个样品)的包含遗传相同的原株,单性结实的mantled分株和正常分株的样品三元组进行全基因组亚硫酸氢盐测序。整个EgDEF1基因座(包括Karma元件)的CG甲基化密度在原株样品、正常样品和mantled样品中惊人地相似(图4b),并且内含子和侧翼区域的CG甲基化密度比外显子的CG甲基化密度更高。相比之下,CHG甲基化密度在mantled克隆中显著降低,显示DMR 在Karma元件的整个长度上覆盖~170个CHG位点(图4b)。CHH甲基化密度比CG和CHG 低得多,并且在mantled克隆中仅略微降低(图4b)。
为了进一步确认元件2中的差异CHG甲基化,设计四个独立的MethylScreen实验(参见例如,专利号为7,910,296、8,361,719、7,901,880和8,163,485的美国专利)以监测甲基化敏感性限制酶靶序列内的CHG位点,甲基化敏感性限制酶靶序列会被CHG甲基化阻断,但对CHH 或CG甲基化不敏感。设计第一扩增子以扩增Karma内576bp区域,其含有甲基化敏感酶AlwNI 的位点。SEQ ID NO:82和83分别提供正向和反向引物。SEQ ID NO:84提供扩增子序列。限制性位点包括两个CHG位点,并且这些胞嘧啶的甲基化阻断酶的消化。设计第二扩增子以扩增Karma内633bp区域,其含有甲基化敏感酶Bbv1和ScrFI的位点。SEQ ID NO:85和 86分别提供正向和反向引物序列。SEQ ID NO:87提供扩增子序列。这些酶位点中的每一个包括CHG位点,并且该位点的甲基化阻断了酶的消化。分别使用相同的扩增子(SEQ IDNO: 87)进行两种酶测定中的每一种。最后,设计第三扩增子以扩增Karma内632bp区域,其含有甲基化敏感性限制酶RsaI的位点。SEQ ID NO:88和89分别提供正向和反向引物序列。SEQ ID NO:90提供扩增子序列。该位点包括CHG位点,并且该位点的甲基化阻断酶的消化。如上所述,对已经进行全基因组亚硫酸氢盐测序的原株样品、正常样品和mantled样品的四个独立组的基因组DNA进行四个MethylScreen试验中的每一个。将基因组DNA分成两等份。第一部分进行模拟处理(不包括限制酶)。第二部分在单独的反应中用四种甲基化敏感性限制酶中的每一种消化。对每个部分重复进行一式两份的定量PCR扩增(可替换地,可以通过凝胶电泳,而不使用实时定量PCR分析结果)。对于两个重复测定中的每一个,用酶消化部分Ct减去模拟处理部分Ct,计算ΔCt。致密甲基化%计算为2^-dCt。图5中提供了重复测定之间的平均致密甲基化%和标准偏差。这些结果证明四个MethylScreen试验中的每一个都能够检测到相对于原株DNA和正常克隆DNA,Mantled克隆DNA的低甲基化。
为了确认在不相关的克隆棕榈中的差异CHG甲基化,对来自一组49棵棕榈的成熟叶样品进行Bbv I和Rsa I qPCR测定。这些样品代表来自4个独立工业来源的21个克隆谱系,包括8 棵原株和13棵正常克隆,19棵单性结实的mantled克隆,2棵可育的mantled克隆和7棵产生具有mantled果实和正常果实的花束的部分回复克隆。虽然限制性位点测定仅监测DMR 中~170个CHG位点中的2个,通过线性判别分析确定的阈值使得检测mantled的灵敏度为 93%并且特异性为100%,反映了Karma低甲基化与mantled表型的强关联(图6)。对从所有7个回复棕榈取出的叶按照mantled样品进行打分,与在发育晚期混合棕榈上出现并恢复为正常表型的正常花束的观察一致(Corely,1986)。
虽然在两个限制性位点的CHG甲基化密度有高度预测性,但其并非与mantled表型完全相关。通过对跨Karma剪接受体位点的区域进行亚硫酸氢盐测序(图7),进一步分析了两棵假阴性mantled棕榈(图6中的FN1和FN2)和2棵对照棕榈(图6中的箭头)。如qPCR所预测,该区域在正常对照样品中密集地CHG甲基化,而mantled对照样品已经去CHG甲基化 (图7b-c)。假阴性mantled样品(通过限制性位点试验预测为具有正常的甲基化)在周围区域保留了大量的CHG甲基化,然而相对于正常对照样品,剪接受体位点附近的CHG甲基化明显降低了50%(图7a-b和d-e),这表明剪接受体CHG位点处或邻近的低甲基化足以预测mantled表型。因为其强预测性,我们分别命名MANTLED超甲基化和低甲基化的表观等位基因(epialleles)Good Karma和Bad Karma。
实施例3:表观遗传镶嵌体(mosaics)中的表型逆转
mantled棕榈有时会逆转,产生包括正常果实和mantled果实的花束(Rao&Donough,1990)。我们假设DNA甲基化有时可以恢复成回复棕榈和镶嵌体棕榈,类似于玉米中同样由转座子调控的表观等位基因((McClintock,1965;Martienssen et al.,1990;Martienssen&Baron,1994)。虽然罕见,我们鉴定出产生具有正常果实和(可育)mantled果子的花束的棕榈的两个克隆谱系。克隆谱系1包括两个回复体克隆,每束分别具有99%和95%正常果实,其中异常果实仅具有一个或两个小的假心皮(图8a-c)。第二谱系(克隆谱系2)包括仅具有7%正常果实的镶嵌体克隆。相对于正常对照克隆,在来自回复体和镶嵌体克隆的叶中,最接近Karma剪接位点(图8d)的Bbv I位点(图5-6)处的CHG甲基化较低。然而,来自两个回复体克隆而非来自mantled镶嵌体克隆的果实恢复了甲基化(图8d-f)。
如同在玉米、Linnaria、拟南芥和番茄中的类似的表观等位基因((Martienssenet al.,1990;Cubas et al.,1999;Manning et al.,2006;Kinoshita et al.,2007),发育期间异常表型的逆转伴随DNA 甲基化的恢复,表明Karma元件的甲基化是mantled表型的起因。没有观察到单个mantled 果实和正常果实之间的差异甲基化,可能反映弱mantled表型的非细胞自主性(图8d)。DEF 和AP3基因的非细胞自主性导致金鱼草和拟南芥的镶嵌嵌合体中的类似逆转((Furner et al., 2008;Perbal et al.,1996;Jenik&Irish,2001)。有趣的是,来自镶嵌体克隆的正常果实和mantled 果实中跨Karma剪接受体位点的区域的亚硫酸氢盐测序显示,剪接受体位点处的CHG甲基化根据表型而显著不同,这表明回复体果实确实是超甲基化细胞和低甲基化细胞的镶嵌体 (图8e-f)。
实施例4:Mantled表型与非编码调节RNA表达的变化相关
在植物中,小非编码调节RNA可以影响DNA甲基化和基因表达。为了确定Mantled表型和小非编码调节RNA的表达之间的相关性,在来源于3棵正常克隆树和3棵Mantled克隆树的茎尖组织、来源于3棵正常克隆树和3棵Mantled克隆树的<2cm期花序组织以及来源于3棵正常克隆树和3棵Mantled克隆树的晚期花序组织上进行全转录组小RNA测序。通过标准Illumina技术产生小RNA测序文库,并且每个文库样品独特地条码化,从而可以单独分析每个样品的转录组。在每条HiSeq 2500道四个文库的池中对文库进行测序。24个核苷酸测序读数(代表小RNA的24mer类)被映射回参考油棕基因组(Singh et al.2013)。识别精确匹配EgDEF1基因区间内的序列的读取,并将其映射到EgDEF1参考序列的对应序列。针对每个样品,计算每种不同的24mer序列的映射读数的数目,并且通过计算在每个样品内对读取计数进行FPKM标准化:(#映射到EgDEF1基因座的不同的24的精确映射的24mer读数)/ (#映射到参考油棕基因组的总24mer读数)*1,000,000。图9显示24mer siRNA读数相对于 EgDEF1基因组基因座的图(图9A)。示出了来自正常克隆树(图8B)和来自Mantled克隆树(图8C)的茎尖(SA)、<2cm花序(<2cm)和晚期花序(Inf.)的标准化计数的单独的印迹。通过比较正常表型和Mantled表型之间的SA和<2cm组织的印迹可以看出,在正常样品中检测到许多24mersiRNA,而在Mantled样品中较少或未检测到24mer siRNA。不管表型如何,在晚期花序中检测到明显较少的不同的24mer siRNA,这与小非编码调节RNA在早期花发育中的重要作用一致。正常SA和<2cm中的一个强峰(与SEQ ID NO:99中提供的24mer siRNA对应,Mantled SA和<2cm中显著降低)映射到EgDEF1外显子5的剪接位点下游152bp 的基因组区域,Karma元件中以产生kDEF1转录物(参见实施例5)。
To further address differential 24mer siRNA expression,24mer siRNAsthat displayed at least a 2-fold difference in expression in one phenotyperelative to the other were identified for each tissue type:shoot apex,<2cmstage inflorescences and later stage inflorescences.As predicted by theanalysis shown in Figure 9,shoot apex tissue has the largest number ofdistinct 24mer siRNAs differentially expressed in Normal relative to Mantledtissues(Table 1).
为了进一步解决差异24mer siRNA表达,对于以下每种组织类型,识别在一种表型中相对于在其它表型中显示表达相差至少2倍的24mer siRNA:茎尖、<2cm期花序和晚期花序。如图 9所示的分析所预测,在正常组织中相对于Mantled组织差异性表达中,茎尖组织具有最大数目的不同的24mer siRNA(表1)。
Figure BDA0001200375530000571
将EgDEF1内含子5的剪接位点下游152bp映射至Karma元件的24mer siRNA(SEQ IDNO: 91)表达差异最大,并且正常茎尖组织的表达水平相对于Mantled茎尖组织的表达水平高11 倍。另外23条siRNAs(SEQ ID NO:92-115)在正常茎尖中的表达水平也比在Mantled茎尖中的表达水平高,倍数差异为2至5.9倍。在Mantled茎尖组织中检测到单个24mer siRNA的表达比正常茎尖组织单个24mer siRNA的表达高2.5倍(SEQ ID NO:115)。在正常茎尖组织相对于Mantled茎尖组织中差异表达的25个siRNA中,两个siRNA(SEQ ID NO:91和 SEQID NO:97)映射到差异甲基化区域内。这些siRNA可影响EgDEF1基因的DNA甲基化和/或差异剪接。此外,其它23个siRNA可能在EgDEF1基因表达的方面发挥作用。
与图9所示的分析一致,较晚发育期(<2cm期花序和晚期花序)显示正常和Normal之间24 个siRNA的表达差异逐渐减少。在<2cm期花序中,10个不同的siRNA存在至少2倍的差异表达(表2)。
Figure BDA0001200375530000581
这些siRNA包括SEQ ID NO:97、104和115表示的siRNA,其在茎尖中也是差异表达的。由SEQ ID NO:104表示的siRNA在正常茎尖(2.7倍)和<2cm期花序(2.8倍)中相对于在Mantled茎尖和<2cm期花序中过表达。由SEQ ID NO:115表示的siRNA在Mantled茎尖 (2.5倍)和<2cm期花序(2.5倍)中相对于在正常茎尖和<2cm期花序中过表达。由SEQ ID NO:97表示的siRNA在正常茎尖中相对于在Mantled茎尖中过表达(3.2倍),但在Mantled <2cm期花序中相对于在正常<2cm期花序中过表达(2倍)。如表2所示,检测到在<2cm期花序中差异表达的另外7个siRNA(SEQ ID NO:116-122)。最后,检测到两个siRNA在正常晚期花序中相对于在Mantled晚期花序中过表达(表3,SEQ ID NO:123和SEQ ID NO: 124)。
Figure BDA0001200375530000591
图10中展示了这些siRNA在正常组织和Mantled组织中的标准化siRNA表达水平(FPKM 方法),以及每个表型每个组织状态的三个重复样的标准偏差。除了相对于Mantled组织在正常组织中以不同数量水平表达的24mer siRNA,识别在一种表型的组织类型中表达但不在另一种表型的组织类型中表达的24mer siRNA。表4列出了对于一种表型的组织类型,24mer siRNA平均检测至少3次读数,而在另一种表型的相同组织中未检测到读数。
Figure BDA0001200375530000601
Figure BDA0001200375530000611
在正常茎尖中检测到5个不同的siRNA(SEQ ID NO:130-134),但是在Mantled茎尖中没有检测到。在Mantled<2cm期花序中检测到一个siRNA(SEQ ID NO:135),但在正常<2cm期花序中没有检测到。在正常<2cm期花序中检测到四个siRNA(SEQ ID NO:136-139),但在Mantled<2cm期花序中没有检测到。在Mantled晚期花序中检测到两个siRNA(SEQ ID NO:140和141),但在正常晚期花序中没有检测到。最后,在正常晚期花序中检测到2个 siRNA(SEQ ID NO:142和143),但是在Mantled晚期花序中没有检测到。因此,早在田间种植和Mantled异常果实表型发育之前,一个或多个这些siRNA(SEQ ID NO:82-124)的表达的定量检测可用于预测体细胞克隆材料中的Mantled表型。此外,在体细胞克隆繁殖的细胞培养阶段中,一个或多个siRNA(例如SEQ ID NO:91和SEQ ID NO:97)的异位表达可用于维持或重置Karma元件内差异甲基化区域的DNA甲基化状态和/或来源于EgDEF1基因座的mRNA的适当剪接,从而抑制克隆来源的棕榈中异常Mantled果实表型的发育。
因为在拟南芥和玉米中,24nt小干扰(si)RNA引导CHH和CHG甲基化,并且DNA甲基化反过来通常是RNA聚合酶IV生物合成24nt siRNA所必需的(Regulski et al.,2013;Zhong et al.,2012;Hollick 2012),我们进一步分析了在正常雌花和mantled雌花中花序发育时程中的 siRNA表达。在0、2、3、4和5期对雌花序组织进行小RNA测序(在0期的7个mantled 和5个正常生物重复样、在2期和3期各6个mantled和8个正常生物重复样、在4期的7 个mantled和5个正常生物重复样和在5期的5个mantled和4个正常生物重复样)。如之前所定义,时期在组织学上分为0期(顶端分生组织)、2期(花被器官萌生)、3期(花被器官器官发育和繁殖器官萌发)、4期(繁殖器官发育)、5期(繁殖器官完全成形)(Adam et al.,2007)。识别映射到基因组支架(包括EgDEF1)的siRNA读数且将每1000映射读数的片段(FPKM)归一化到整个油棕参考基因组(Singh et al.2013)。通过学生t检验,双尾假设等方差比较在正常样品的生物学重复样的每个24mer的FPKM值和mantled样品的生物学重复样的每个24mer的FPKM值。该分析识别了0期正常花序中的24nt Karma siRNA簇,其在mantled花序中减少或不存在,而与EgDEF1内含子匹配但在Karma外部的其它siRNA的表达差异并不显著(图11)。总之,相对于正常0期花序组织,在mantled 0期花序组织中,来源于Karma的几个24nt siRNA(SEQ ID NO:144-147、150-158和160-161)被阻遏或沉默 (表5)。相对于正常2期花序,在mantled 2期花序中,这些24nt siRNA中的几个(SEQ ID NO:145、151、154和157)也被阻遏或沉默,并且两个24nt siRNA(SEQ ID NO:148、149 和159)在2期花序中明显被阻遏(表5)。最后,在3期,在2期受阻遏的一个24nt siRNA (SEQ ID NO:149)在mantled花序中相对于在正常花序中保持阻遏。在花序发育晚期的差异表达的siRNA的数量减少是发育晚期siRNA表达整体降低的结果,即使在正常组织中也是如此(图12)。来源于Karma剪接受体位点附近的siRNA大部分处于反义方向(表5),提高了24nt siRNA(与选择性剪接外显子互补)与表观遗传机制中异常DNA甲基化协作从而引起mantled表型的有趣的可能性。因此,早在田间种植和mantled异常果实表型发育之前,一个或多个这些siRNA(SEQ ID NO:82-124和144-161)的表达的定量检测可用于预测体细胞克隆材料中的mantled表型。此外,在体细胞克隆繁殖的细胞培养期中,一个或多个siRNA (例如SEQ ID NO:144-161)的异位表达可用于维持或重置Karma元件内差异甲基化区域的DNA甲基化状态和/或来源于EgDEF1基因座的mRNA的适当剪接,从而抑制克隆来源的棕榈中异常mantled果实表型的发育。
Figure BDA0001200375530000621
Figure BDA0001200375530000631
Figure BDA0001200375530000641
实施例5:Mantled表型与选择性剪接的转录物表达的变化相关
通过来自正常棕榈和单性结实的mantled棕榈的雌性花序(每个表型的茎尖、<2cm花序和晚期花序各3个生物重复样)的全转录组下一代测序来分析整个花序发育期的正常组织和 mantled组织中的基因表达。检测来源于EgDEF1基因座的四个不同剪接的mRNA转录物(图 9和13)。首先,在正常组织和mantled组织中检测cDEF1转录物(SEQ ID NO:5)。这些全长转录物包括所有EgDEF1内含子的剪接,使得成熟mRNA包括EgDEF1基因的完整外显子1至7并编码全长EgDEF1MADS盒转录因子(SEQ ID NO:6)。第二,在正常组织和 mantled组织中检测较短的转录物tDEF1(SEQ ID NO:75)。此转录物包括EgDEF1外显子 1-5,然而外显子5不剪接至外显子6。相反,tDEF1 mRNA从外显子5延伸至内含子5并在此后不远终止。由于预测的MADS框蛋白K结构域内的移码和早期翻译终止,tDEF1 mRNA 编码截短的蛋白(SEQ IDNO:76)。接下来,仅在mantled组织中检测到选择性剪接转录物。该转录物kDEF1(SEQ IDNO:78)从EgDEF1外显子5剪接到内含子5内的Karma元件的剪接受体位点。该选择性剪接位点的位置落入差异甲基化区域内(图4-8)。选择性剪接事件导致外显子5编码序列后的移码,和预测的MADS盒蛋白K结构域的翻译过早终止(SEQ ID NO:79)。最后,在少量mantled组织样品中检测到非常低水平的另外的选择性剪接的转录物gDEF1(SEQ ID NO:80)。该转录物从EgDEF1外显子5剪接到Karma和差异甲基化区域上游的内含子5的区域中。这种剪接事件还导致外显子5编码序列后的移码和MADS盒转录因子的K结构域内的翻译过早终止(SEQID NO:81)。应注意,截短的MADS盒转录因子蛋白(kDEF1,tDEF1和/或gDEF1)的这种表达包括蛋白质异源二聚化和DNA结合所需的MADS盒结构域,但缺乏转录激活所需的蛋白质的C端结构域,该表达可以对全长MADS 盒蛋白的功能主要起消极影响,并且因此导致同源异型转换表型,比如,在Mantled果实异常的克隆棕榈中显示的同源异型转换表型。
为了定量测量cDEF1、tDEF1和kDEF1的表达,设计并优化每种转录物的特异性qRT-PCR 试验(图14)。为了特异性测量cDEF1表达,设计正向PCR引物以跨越EgDEF1外显子1 和2(图14a,SEQ ID NO:125中的a)的剪接点,并且在EgDEF1外显子7(14a,SEQ ID NO:126的e)内设计反向引物。为了特异性测量kDEF1表达,设计正向PCR引物以跨越 EgDEF1外显子4和5(图14a,SEQ ID NO:127中的b)的剪接点,并且在Karma元件(图 14a,SEQ ID NO:128中的d)内设计反向引物。为了特异性测量tDEF1表达,设计正向PCR 引物以跨越EgDEF1外显子1和2(图14a,SEQ ID NO:125中的a)的剪接点,并设计反向引物以跨越包含在tDEF1转录物中的外显子5的3'序列和内含子5的5'序列(图14a中的 c,SEQ ID NO:129)。设计并合并多个基因座特异性反向引物用作RT引物,从而可以使用 4期正常总RNA样品和5期mantled总RNA样品作为模板由常见逆转录酶反应扩增所有可能的转录物作为cDNA产物。图14b中提供了分析的每种转录物的外显子剪接的总结和所用的qRT-PCR引物。单独使用这些RT产物作为模板和每对引物的终点PCR反应如图14c所示。 cDEF1引物扩增来自正常RNA模板和mantledRNA模板的预测大小的条带,尽管相对于 mantled样品,从正常样品中定性地扩增的产物更多。kDEF1引物从mantled RNA但不从正常RNA扩增预测大小的条带。tDEF1引物从正常RNA和mantled RNA扩增预测大小的条带,但相对于正常样品,从mantled样品中定性扩增的产物更多。使用SYBR绿色定量方法通过在实时PCR试验中扩增一系列稀释的cDNA模板,确定针对油棕的PCR引物,以及内源看家基因参照qRT-PCR试验的引物PD00380的定量效率(Chan etal.(2014)PLoS ONE 9: e99774)。
使用qRT-PCR试验定量测量整个雌花序时程中的cDEF1、tDEF1和kDEF表达(图15)。在0、2、3、4和5花序发育期中对基因表达进行量化。使用EgDEF1外显子6和7以及Karma 的3’区域特异性反向引物的混合物从1μg总RNA进行所有第一链cDNA逆转录反应。针对每个时期,对于每个表型每个时期的三个生物重复样进行三次技术重复。在Roche LC480仪器上的1X Roche SYBR Master Mix中使用1μL第一链cDNA进行qRT-PCR反应。计算中不包括高于33个循环的循环阈值,并且仅对于在3个技术重复中的至少2个中检测到表达的样品计算可检测的表达。通过将每个试验的标准曲线外推定量表达水平,并计算相对于油棕基因表达参照基因(Chan et al.2014)的表达水平。在正常组织和mantled组织中,从0期花序到晚期花序cDEF1表达水平略微上升(图15),而tDEF1以恒定的较低水平表达。然而,在这些结果中,kDEF1表达局限于3至5期花序,仅在mantled组织中。因此,与tDEF1表达不同,在一些情况下,kDEF1在雌性花序中的表达仅在mantled发现,并且预测编码严重截短形式的EgDEF1MADS盒转录因子。
总之,作为体细胞克隆繁殖的结果出现的油棕的mantled果实异常表型与EgDEF1基因座处的多个分子异常相关联。来自mantled油棕的组织具有显著CHG低甲基化的差异甲基化区域,其涵盖嵌入EgDEF1基因的内含子5内的Karma家族LINE反转录转座子元件。该区域的低甲基化敏感地且特异性地诊断Mantled表型,并且在该区域内的多个CHG位点中的任何一个定量测量甲基化含量的试验具有预测异常的强诊断能力。已经检测到来源于EgDEF1基因的四个选择性剪接转录物,其中之一(cDEF1)编码全长MIKC家族MADS盒转录因子,其中三个(kDEF1、tDEF1和gDEF1)编码截短的蛋白,该截短的蛋白包括MADS盒、I和部分 K结构域,但缺乏C端转录激活结构域。在正常组织中,主要表达的转录物编码全长cDEF1 蛋白。然而,在Mantled组织中,表达主要来源于选择性剪接的kDEF1转录物,并且在较小程度上来源于选择性剪接的tDEF1转录物。这些发现支持这样一种机制:EgDEF1基因座的表观遗传的反常导致截短的负显性蛋白的表达,该负显性蛋白干扰正常的同源异型花器官特定通路,从而导致mantled果实表型。此外,来自EgDEF1基因座的小非编码调节RNA的表达在来自mantled棕榈的组织中相对于在来自正常棕榈的组织中,尤其是在较早发育期中显著改变。
实施例6:通过甲基化特异性PCR检测差异DNA甲基化
可以通过甲基化特异性PCR(MSP)方法定量DNA甲基化。使用该方法,用亚硫酸氢盐处理DNA样品以将未甲基化的胞嘧啶(但不将甲基化的胞嘧啶)转化为尿嘧啶。设计引物以覆盖潜在的甲基化胞嘧啶位点,并且针对甲基化构型和未甲基化构型设计不同的引物。图16 展示了使用MSP分析在本文识别的mantled样品和正常样品中的DMR的实例。应注意,可在种植于田间之前,即,不知道最终的mantled表型的时间,对克隆材料进行这种试验。为了简单起见,所有潜在的DNA甲基化位点在正常DNA中表示为甲基化的(实心圆),在 mantledDNA中表示为未甲基化的(空心圆)(图16a)。然而,应注意,给定的DNA分子可包括甲基化胞嘧啶和非甲基化胞嘧啶的混合物。设计用于扩增在引物序列内的位点处甲基化的分子的引物,使得引物在一条链的引物中的潜在甲基化位点处具有胞嘧啶,在另一条链的引物中的潜在的甲基化位点处具有鸟嘌呤。设计用于扩增在引物序列内的位点处未甲基化的分子的引物,使得引物在一条链的引物中的潜在甲基化位点处具有胸腺嘧啶,在另一条链的引物中的潜在甲基化位点处具有腺嘌呤。与并非潜在的甲基化位点的胞嘧啶对应的引物内的碱基设计为与转化的序列碱基配对,因为所有未甲基化的胞嘧啶转化为尿嘧啶。用亚硫酸氢盐处理正常DNA样品和mantled DNA样品以将未甲基化的胞嘧啶转化为尿嘧啶,并且将转化的DNA分别用作模板分别用各引物(非甲基化引物对为UM,甲基化引物对为M)进行PCR扩增。其中胞嘧啶被预测为甲基化的正常样品用M引物对能扩增而用UM引物对不能扩增。其中胞嘧啶被预测为未甲基化的mantled样品用UM引物对能扩增,而用M引物对不能扩增(图16b)。条带的强度差异(而非条带存在或不存在)也可以诊断表型,。
可以应用修饰的方法,其中两条PCR引物之一仅包括一个、两个或三个潜在的甲基化位点。在亚硫酸氢盐转化后,位点的表现与未转化的DNA中的单核苷酸多态性相似。例如,在亚硫酸氢盐转化后,甲基化的胞嘧啶仍然是胞嘧啶并且将与鸟嘌呤碱基配对。然而,未甲基化的胞嘧啶被转化成尿嘧啶并且将与腺嘌呤碱基配对。因此,适于检测单核苷酸多态性的方法也适于监测mantledDMR内的胞嘧啶的甲基化状态。这些方法可以提供定量或定性测量。
实施例7:通过甲基化依赖性免疫沉淀检测差异DNA甲基化
DNA甲基化可以通过甲基化依赖性免疫沉淀(MeDIP)方法定量。在该方法中,使用甲基胞嘧啶特异性抗体对胞嘧啶甲基化的DNA分子进行免疫沉淀,随后扩增特异性DNA序列。图 17中展示了使用MeDIP分析本文识别的Mantled和正常样品中的DMR的实例。应注意,可在种植于田间之前,即,不知道最终的mantled表型的时间,对克隆材料进行这种试验。为了简单起见,所有潜在的DNA甲基化位点在正常DNA中表示为甲基化的(实心圆),在Mantled DNA中表示为未甲基化的(空心圆)(图17b)。然而,应注意,给定的DNA分子可包括甲基化胞嘧啶和非甲基化胞嘧啶的混合物。来自正常样品和Mantled样品的DNA通过限制酶或通过超声处理或通过机械剪切而片段化(图17a)。加入甲基胞嘧啶特异性抗体,使用标准方法对抗体和甲基化DNA分子的复合物进行免疫沉淀(图17a)。然后用设计为侧接DMR的引物对免疫沉淀的部分进行PCR扩增(图17b)。可以通过琼脂糖凝胶电泳分析 PCR扩增反应(图17c)。作为阳性对照,扩增投入的DNA(无免疫沉淀)。作为阴性对照,扩增无抗体的模拟免疫沉淀部分。5-甲基胞嘧啶特异性抗体免疫沉淀的部分显示正常样品中的DMR区域的扩增,但是未显示Mantled样品中的DMR区域的扩增。条带的强度差异(而非条带存在或不存在)也可以诊断表型。
尽管为了清楚理解的目的,通过说明和示例相当详细地描述了前述发明,但是本领域技术人员会理解,可以在所附权利要求的范围内实施某些改变和修改。此外,本文提供的每篇参考文献通过引用整体并入本文,其程度如同每篇参考文献通过引用单独并入。当在本申请和本文提供的参考文献之间存在冲突时,本申请将占优势。
序列表
<110> 梅丽娜·恩格·阿布杜拉
黄·秀·英格
莱斯利·露·英格·狄
拉金德·辛格
拉加耐度·诺凯亚
拉维葛德伟·撒班森姆尔什
江楠
史蒂芬·W·史密斯
纳森·D·莱基
罗布·马尔提恩森
贾里德·奥德韦
迈克尔·霍根
马来西亚棕榈油协会
<120> 棕榈Mantle表型检测
<130> 96380-941211
<150> US 61/988,132
<151> 2014-05-02
<150> US 62/091,471
<151> 2014-12-12
<160> 161
<170> PatentIn version 3.5
<210> 1
<211> 78321
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (14421)..(15355)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (55950)..(57363)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (64044)..(65002)
<223> n is a, c, g, or t
<400> 1
aatctattag tatctgacaa aagttaaatt agagtcgaaa cactaaatga caattaggga 60
tcaacttgat caagtagata gagaatatta gaaaagagag aaattaacaa gatagaacat 120
gattaattag gtgacatagc ccgacaatcc aattggtcta agcaagttga tttaatcaaa 180
tcacggttga actaatatat agatagctca ataaaaatca tacataattg aatctaatga 240
tatttggatc tgaccaagat ggaatttgac atgctgtccg atgatcgtga atcaagactc 300
tctttgctaa ttaagatcaa attagaatca ttgaaagaga atcttttact ggatcaagag 360
agagaaatat ataaagagag tgaaatagtc tatagaaaaa aaatttagag agagaaatta 420
agaagaaaaa ataaattttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480
agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540
tttttttcca ttcttctttc ccttttctgc ttaatggaat aggggacctc ccattcccct 600
tctatttcta gagttggggg ctcaaaattg atgatagcta tcattgggga tgtaggctat 660
ggtgatgcag tagaggatca ccgaccgatg atcgatggtg atgttgcaat caaaaaatca 720
agaaagatag atggaaaata aaggaaaata aggagaaata gatctcaact tgtttggatg 780
ctaacccact cactgacgac tccacttcaa ctatggccgg agcttgctat ggaaaagaag 840
ccaaggcctt caaggatgaa caccaatggt gaggaagatg gtcgaaaata gaagaatggc 900
tggcttttct aatcgacaaa atagggtatc gcccttctta gcaaatattc ggcaataaat 960
atctagaatc caggatccta ggactatgga agagggagag gagggcaagt caaaggatgc 1020
cagattctta tctagcttcc gacaatgatg gggccctatt ttcgataaac acaatcgagg 1080
atgttcggaa aagggttttt tcgatgatga ttctagtgac caactatgag atttcaaagg 1140
gggtgagggg ggtttaaata agatgggagg gaagtttgaa tcctccttaa atctgaacct 1200
ttttcgacaa agccaagagc gtgaaggaga ctccttcgtg aagtcaaaga tggaatagac 1260
tcccttcggg agtttggttc atcacccaac ttccctagca tgtgcggagt atgtgctagc 1320
cttttctctc tttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380
tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440
cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500
tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560
agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620
ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680
cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740
tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800
aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860
gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920
tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980
tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040
tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100
tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160
aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220
attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280
tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340
agtaatatca ataaaaaaaa attttgatgc tccaataagt tagaacttaa atcaaaatat 2400
ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460
tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520
tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580
aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640
agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700
atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760
accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820
atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880
cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940
ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000
tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060
attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120
gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180
gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240
atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300
gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360
caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420
ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480
caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540
tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600
attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660
atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720
taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780
ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840
tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900
ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960
aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020
tgtgtgacac ctgaatcagg cctttctaaa ctattttgag taagtttgat caagtcaaaa 4080
ggatccacac cctaaggttt cttgaataaa accttaggca ccacattgag gacctatagg 4140
aaactttgac cctctctcat atggggtggc acactgaggt tttataaaaa ccttaggcac 4200
ccattttagc cataaaaaaa aagctccaag ggatggggca gtagccatga agaatccttg 4260
gctgtcagga ctctattcaa aagagttctc aaggttttgg actcttatgg agccctagga 4320
tttgtttgcc tataaataga tggccacccc aaggctttag ataatgttag agacttgtga 4380
agctctcccc tttctcttgg ttgccggccc accctctctc ctctctcttc catgccccaa 4440
gacttctttc ttgtctccat catcttgctg aaatttagat ttcagcaaga aaagtcaagt 4500
agaagtcaaa gttctaatgt agctcacaag atgttgagaa cttcctccat ctggcaaagg 4560
ttctgcaaga gagctagcat cctgagaaac aaaaagattg ctgatcagcc ctcatctcca 4620
tatggatatt tgtagagatc agatgcatgc atagctagaa gagaatctta tcacgatcat 4680
cactcgtgaa gatcatctac ctgtgcaaag gtatgagata agaaaaatat tttttttatc 4740
ataattcatg aatcctttgc ttatattata ctgagattct tggaatggat tttttctcta 4800
gtaaaactct agagatcaga tctcgaagtc ttcttcatat aaaggttttg aaagttcttt 4860
atattttcgc tgctttgatt caaaataaat tagatctatt ttgcctttca acctttctca 4920
tatttattga catataaagc tttaattaat gagattaatg aaaagcatgt gcgaaatact 4980
gagaaaatcc taacagtgat atcagagcta cttttgtaca taagaaaagg attcaagtta 5040
aataaaatct gtttgattta agtaaatgaa tcaatcaaaa tttatcctaa cataagtttg 5100
tcctggtata atggtcaaga ccattatgtt gaaaggttat cctaggacaa aaagtctaag 5160
taaaatctat tttatttaag taaatgaatc aattaaagtt tattctaata taagattgcc 5220
ttagcataat ggtgaagacc cttatgttga aaggttgtcc taggatggaa agtgattgat 5280
gagacaaata tatcatgaaa gtatttttca cagatggaat aaaatatata tattttgttt 5340
gtgaaaatga gatttcatga atgtgtttgt cattcaatat gtgtggtgat catcttgaat 5400
tgccacaaat cctttttgga ttagggttgt atcatgactc acaaatcctg atggtttgca 5460
aaattttgca ttctgtagtg atagaaacca aaagttaatc cagttttgga ataagattga 5520
tcaattggta tctaaggcaa gtattttata atggtggtta cttaattagt tataaaagta 5580
cgaagagtct cctaccaatc ttacacttat ctagccaatt tggttgattg aattctgaat 5640
ttgggttgct taagtgttaa gttcactaca aatatattgc aaccatgatt ccgacttagt 5700
caaccaagcc tagatctctt gaatagattc atgttaatta tggatttaca taggatataa 5760
ataaataatt aaaacttgaa gagatctaaa tgaaaccttc tcgtacatat taaatcgaat 5820
gatcttccat cattgtagat atacggatac tctactgatg ttgatgattt tcgactagat 5880
atagtacttt ggttgcatcg aaaaagtaca accactttat aacatgagat gttgcagggt 5940
agagatgggg ttgggcccaa taattgttag gtgaggatcc aaatgatggc tgcacttgcg 6000
tgtgaatggc gagtctgact taattaagaa atagagctaa taactattag atgaggcttc 6060
aggacttaga gacttatgac cactacaact tacttgagaa gcaatggata aagagtcgtc 6120
tatttatcaa ctgacgcatc accaataact atcagatgga gtgatgtata attagtggga 6180
ctatagtatc cacttgaaat cttaatcgta aaaatttttg tttctccacc tgaagagcat 6240
gggagattcg aaaaaatagt gggggtagtt tatttttaaa ataaagctcc taaaataaac 6300
taaaataagt taaatacaaa gtctaactag aatcttcttc tctctgtaga aaatatctgc 6360
ttccaacctc tatttcatat ccttaagact aattgtttga ctagacccag ttataaagat 6420
tgactctaaa acttaaagat agtcttgagt tttgaaaaga tgagctatgt cctggatcaa 6480
gatatcctct ctctaccagc ttgtcccacc cctaatcaag gggcatccta tgaaaagtgg 6540
ttaaacgatg ataacaaggc ttggtgctgt gtgctgacat ctatgtccat tgaactccaa 6600
tgccagcata agggtacaaa ctgtccaagg tatattgact catctacaag agttatatag 6660
tgagtagagc catgtatctc actaggaagt atttaagaga ctcttcaaga tgaagaagta 6720
tgatggatag tctgttaatg atcattgtct gataatgatc aagaacttga aagaacttga 6780
gaagctcgat atgtctatca ataagaaatt gcagattgat ttgatcctac aattccttac 6840
tgattcatat gtgtagttta ttataaacta ccatatgaat aaaatacagt gcaccaaggt 6900
tgagttgtta aatatactga taactactga agggacctcg aagagttcaa gaggcactgt 6960
tcttattatg gagcagacct catctttcaa gaaaaagtct actgaaaaga agaaaaagtt 7020
tgtgaagaag cagaagttag agaataggcc aaagaaagaa gttttcaaga agaaggccac 7080
aaaaaaggaa aagtattttc actgcaactc tgatgaccat tggaagagaa actattctga 7140
ttatgtggca agcttgaaga acaaaaaaga tagcatacct tctgaagata tgtctgatct 7200
tctcgttatt gaaactaatc ttacaatttc ttttactttc agttaggtta tagactctag 7260
ctctagtgct catctatgca cttctataca ggatctggag gaaagtagaa ggctgaggaa 7320
agaagaaata atccaacaag ttgaaaatga tgcaagagtt gttactatgg ctgtggagat 7380
ctatcctcta cgactaccat ctgatcttag tttaattctt agagactgtt attttatacc 7440
tactgctagc aaaaaattga tctctatttc atctctagca taggataatt atgtattaaa 7500
ttttaataaa gattattata ccatttattt gaaaaataaa atggttggac gtaatttttt 7560
aattgacagt ctctatcatt tacatgttga tgtatctatg aatgtaacca agcagaaagt 7620
gaatgccata ggatctaaaa gatctaaaga tgaaataaat tatatgtggc acattaggct 7680
agatcatata agagaagaaa ggattaacag attggagaaa gatgggctct tgggcttatt 7740
gactactgag ttatatccga tctgtgaatt ctgccttcaa gaaaaaatga tcaagctgcc 7800
ctttatgaaa caaggagaaa agaccattaa gatatttgcc ctggtacata ttgatatatg 7860
tggcccatta attcgatgcg ctggtcaaag aaggttgtct ctatttcatc atctttatcg 7920
ataattattc acagtatgga tatgtgtatc ttatgagata caaatatgaa gtctttgaaa 7980
aatttaaaaa atttagaaat gaagtaaaaa aataaactaa aattttttta aagatttttc 8040
aatcagattg aaaagttgaa taccttaatg gagaatttct aaattatctc aaaaaaaata 8100
gcatagtctt ataatggact ccatttggaa tgtcttaact caatagagtt tcgaaataga 8160
gaaatcaaac tttattagat atggttcggt ccatgattag tttcattgac cttctcttat 8220
ttctttggag atatagttta cttaccacta attatctatt gaatagggtt tcctctaaaa 8280
tcatttctac cacattgtat gagatatggt attgtagaaa atcaagtctt gatcatatca 8340
agatttaagg atatccgacc catatcaaaa tatttcagac ggacaagtta gaggtcagat 8400
ctatgaaagc tcggttcaaa agtatcttaa ggagtcttta ggatattatt tctacttttc 8460
agaggatcac aatatgatta taagccaaca tgctctcttc cttaaaaaat agttcatgca 8520
agatggaagt agtaggaggc agattgagct tgaagagagt ctctgaagag caatgagtct 8580
cagaacttac gtaaaaccta tttaagttga gccaatacac acacctcttc ctccatctcg 8640
tagatccagt aaaatttttc attctcctga gagatactta ggtatcatca tagagaatgt 8700
agagaaaata tttctcgtga aaaatgagac atatgaaaat gaccccaaaa cctatagcga 8760
ggcaatatca aatatcgact ataagaaatg gttagaggct atgaagttag aaattaactc 8820
aatacactta aaccaagtct gaacctttat ggatccgtca gaaggtatgg tacctattat 8880
gtataaatag atctacaaaa gaaagattgg ttttgatgga aaggtagaga cctttaaggt 8940
aaagcctgtg actaaaggtt atagctgaca cgaaagcatt gactatcaat atattttttc 9000
actagtagtt atgctaagtc catttgaaca ttacttgcga ttgcagcata ttatgattat 9060
aagatatgac agatagatgt gaaaactatt tttctaaatg aatatcttta ggaagttatc 9120
tatatagagt agactttgtg tttcacttcc agtgatggcg atcacaaagt ttacaaattg 9180
taaagatcta tttatgcact caaacaagca tcttggagct ggaatactta tttcaatgat 9240
gtaatcaaat catttagttt catcaaaaat gagaaagaat cgtgtgtgtt taagaaaatc 9300
agtgggagta ctgttacttt tcttgtattg tacgtggatg acatcctcct gatcgaaaat 9360
gatattttta tgttaatttt agtcaaaata tagttgtcta agaaattctc catgaaggat 9420
cttggggaag catcctatat tttggagata aatgtctata gtgataaatc tatgaggatg 9480
ccaggccttt cacagaagat gtacattaag gaagtgctga agaagttcag catgaaaaac 9540
tccaagtgga gacttctatc cttcaggtat gggattcatc tctccaagaa ggtgtgcctc 9600
aacacatctt aagagataca gtacatgagc aaaatccctt atactgcggc tataggaagt 9660
ctcatgtatg tcatgttatg tacatgacct gatatagctt atgttgtgag tgtcacaagt 9720
agatatcagt tgaatgcagg tgaaaaacac tggacatcta tgaaatgtat ccttaagtac 9780
ttgagaagga ttaaggatat gttcttgatc tttagaggag gagaattaag ggtgcaagaa 9840
tataccgact taaattttat gtttgatatt gatgatcgaa aattgacatc agattatatt 9900
tttttatgca acggtggtac tgtgagttag aaaagtttca agttgcctat catagcagac 9960
tccattatag aagatgagtt tataatcaca ttggaagcta ccaaagaggc attctggttt 10020
aaaaaattta ttacagagct ggatataatg ccatcagatg tcataccact ctactgcgac 10080
aacaatagtg ccataactct agctaaggag ctgaggtctc accaaaagtc taagcacata 10140
gagcaatgat ttaatctcat tcgcaattat ctcgaaaaaa atatatcaag gtatagaaag 10200
tagatactat ggataatatg acagacccac taactaagta gctgagtcaa taaaaaatcg 10260
aagtccatct tgagaagatg ggacttagat ttgtggccaa ttgattttag tgcaaatagg 10320
agattgttag atgtatactc taaaagtcaa ttagactgac aaatataaat tttctaagga 10380
cataatttat atattttgac ttattaataa aataaaattt ggattaattt tttattcata 10440
ttttagtatc catgaattat ccaagagatt aatatgataa tgatatatat tctcaagagt 10500
tgaaaatttg aaacatacgt cattgatgat taatttttga atgctttcga ttaatggatg 10560
atcataagga tagtaattaa tccgatcaat gtacaaatca cttctttttt gatagacgag 10620
tctcgagtct atactatgga gacactggag caagagtgca ggtatttgtt agagaacaaa 10680
ggtatcgagc gtgactaata cgagaagtca attggatggc tatccactcg ttaatgactt 10740
atttgatact acagtagtat gtctagtcct tagatctgca atgcctcagg tgttcataat 10800
gagactgtta gagtttgact gtacataaac ttgatttcta gccatatgga tctttatagt 10860
gcatgttggc tacagtaggt tcgttgtagg aataggatgt gcacatagat agaatctatc 10920
atccttgata gacaaaaaaa atgatcctat ataatttatg agactgagtt caaaaaatct 10980
tgactaagac agtgtgaata atgaaaagaa gtttccacat atatacttca catcagcaat 11040
tccagttaaa taaatcctac atataatagg tattgtagtt tgatgaataa tctataacct 11100
ccatcttatt gaaactctga tagaaggact gtatcatatg gtaactgtat caagagattc 11160
atctactatt ttgctgaatt gtcactacaa actgctagat gtcactgata gattgtggga 11220
cctatgaaga ttatcttgat gatcgatgat tctcatggag aagattgaaa ctatttcaat 11280
gatgttgtgg tagaaatcac aatatatctt actactagat agaatagaac ctatgaggtc 11340
acacataata aaaatttgag attgatcaga ttgttgaatg atgattaaga attgttacag 11400
gattcagatt atcaatataa ttgataattg gactaacttg taattattat aagtagcaaa 11460
gatttaattg ctaaaggtta gcagattcaa ggaggactta tgtgtaaata atgtacatct 11520
taatttgatt ggatcaactt agttatggct aaatttaaga tgaatcaaac agggatttag 11580
tttaatcgaa tttgggtcaa gctttgggct taggtcacat gcactcaaaa gggtttggat 11640
gcatcaagtg tgtgacaccc aaaccaagcc tccctaaact attttgagtt ggttttgacc 11700
aagtcaaaag ggtccacacc ctagggtttc ttgaataaaa ccctaggtgc cacattgagg 11760
accaattagg aaactttgac attctttcac acggagcagc acactagggt ttcatgaaaa 11820
ccctaggcac ccattttagc cataaaagga aagctccaag ggatgggatg gtgccatgaa 11880
gaatccctgg ccattgggac tccattcaaa agttctctag gttttgggct cttatagagc 11940
cctagggttt gtttgcctat aaataggtcg ctaccccaag gctttagata atgctagagg 12000
cttgtgaagc tctctccttt ctcttgtttg ccatcccacc ttctctcctc tctcctccat 12060
gcctcaagac ttctttcttc tctccatcat cttgttgaaa tttagatttc aatgagaagg 12120
atcaagtaga gtcagagttc tactgcagtt ctcaaggtgt tgagaacttt cttcatcagg 12180
caaagattct gcaaaggagt tagcacctca aagaaccaag aaagttgcta atctgccctc 12240
atctccatgt ggatacttat agaggccaag catgacgaga agagccttat cacgatcatc 12300
actcgtggag atcatctacc cgcgcaaagg tatgagataa gaaaaaaata tttttcttat 12360
catgattcat gaatcctttg cttatgttac attgagactc ttggattaga ttttttctct 12420
aataaaattt caaagattag atctcgaagt cttcttcacc taaaggtatt gaaagttctt 12480
tatattttcg ctactttgat tcaaaataga ttagatttgt tttgcctttc aatttttctc 12540
atatttattg agatatgaag ctttaattaa tgagattaat aaaaagcata tgtgaaatac 12600
tgagaacatc ctaacaattt gagcttacaa ttcacttaaa caactaatga tcaaattaat 12660
aatcacaatg cacaataaaa attcatgata aatctttttg ttgttacttt agatcaaaat 12720
ccaactaatc ataacatgat ccacggattg cctatcatat atcaaaccct ctgaattatt 12780
aatcttaaac gatcttttca ttcatgatca taagatttag ttaaaaatca tgaagacaac 12840
ttatattgta atcatcatag atctgtatct taacatcctt agtgtttacc tacctatact 12900
catcctatgt ttgattctat atatcataat ttattcacta atactttgat atcatataaa 12960
ttatcgcatc cccaatctaa gatcatattg gtactttaat atttcattag tgggggttat 13020
gcattagtac tttgatacct tatcagttga atggttaaac actggtactt tgatatccta 13080
tcagtggagg ttatacgctg gtactttaat atcctatcag taagatggtt aaatactgat 13140
actttgataa cctcccagtg ggtgttgtat gctagtactt tattatccta ccaatggggc 13200
agttaaatgc tactactttg atacgctacc aatgggatag ttaaacgcta gtaatctaat 13260
cttagcttga cataaagtaa cgtcgactcg agtttagggt cgactcgaga gaatgttagg 13320
gttagcttga tatgaaagag ggtcgctcgt caatattttg gagtcaactc ttgtttatgg 13380
atgatctaga aagtgtcaga gtgagctcga gtactgcata tttctgatac attgtctatg 13440
ctagaatgtg ctagaactga ttatcttctt tatcaaagtt gatttttgag taacttgatg 13500
atcaattttt ctaggctaga cttgctttgt caaaatgagc acttgttagt ttagagaatc 13560
ttcacctaca catgatctca agcattcatt agtaccaaaa atacttaagt attttgatat 13620
catcaaaatc aattcttggg ttaacacaat acttttcaaa taataagcat acagatataa 13680
tcctataaca atttaaattt tgttcatata tcaatttctt taaaaatatt atattcatct 13740
tgatagctat gaactaaatc aaaatacata ctagtataca acttttactg ggagagtatt 13800
agattaccag catttaacca tcccactggc aaggtatcaa attaccaata cacaacccct 13860
atttataaag tatcaaagta ccagtgttca actgcctcac tggcaggata tcatagtact 13920
agtatttaac taccacattg acaggatatg gaattatcag tatttaacca tcattagtag 13980
aattttgatg catagtcagg ctgcgagtca aaatctatct caaatcaaaa tattgatcac 14040
atgtctaatt ctgtatcata attcattccc ttatgctcta atattatatt aattgtcata 14100
cttctagctc gagatcatga gccaaggatt gcagtaacta ccgcatactt atagagaact 14160
ctttctataa gcatacaaga tattctaaat atactatcaa tatatcatag agaaattaat 14220
ttaaataact aaaagttaat attcaattaa taaattcaac tggcaaatgt atttaaaaat 14280
tttacatcaa ataaatcttg attaataaat attaattaat aacaatagat ttaaatcgaa 14340
acaaggttga tattgttaga atttgatgcc tcaagattca gcccacattg agtccacagt 14400
gaggttcgcg acgaaaaatg nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnaagat 15360
attactaaat tttgcttcta atctcactct taaatagtac ttacctttga aactaggcat 15420
ttgaatctga aaaagaaaga ggagattatg agcttgatag ttcagtaaat catgaataaa 15480
ttagctaaat aaatctatga ataatagtat attaaaaata aatatgtaag atacaataat 15540
tcaaaaatga attcatatat ataatacttt ccaaataata agtatgtggc tgcaatcctt 15600
tcgtaattca aattttgttc attaattatt tttttcaaaa catcacatgg atagtcatga 15660
actaaatcaa agtaccagtg cataacccct attgataaag aatcaaataa caagtgtttg 15720
actgcctcat tatcaggata tcaaattatt aatgcataac ctccactgct agggtatcaa 15780
agtagcaacc tcaatcacct cactggaagg gcatctagtt tcagtattta actactccac 15840
tggcaaggtg ttaaattatc aatatttaac ctccactgat aggattttga tatatagtca 15900
gactgcgagc caaaattcat ttcaaaccaa aatatttttc tcaaagacat attttatgtt 15960
tcacattgaa aaattcacaa aaattatgcg atattgaaat caattggata aaatccacgt 16020
caaatttagt atattcaatc ataaatcatt tactattcta gaaaaggtat attaaaagta 16080
taatgcatca atttcataaa tcataaatat ctcaatataa aaaatatttt attatttatt 16140
aataaatcta ggagaagtga agcattactt atcttgtaag taaaactaac caactgatca 16200
aattaattct gagaatcttt ctcaaaactc atcaccacta tatcaaaaac ttgtgcttct 16260
tgctatgtaa gagcatagac cctttcttcg atctggggtt ccaagtttct attttatttt 16320
gttcaactat caaattagac tgacttttca tttttttgtg gatattcagc tattttatgg 16380
cctttctaac aataaccaaa gtatgtacca atattccaac aataatcatt tattgcatga 16440
ttttcaccgc atcgaaatat ttgatattat caatcaatcc aaacttgtta ttcactgacc 16500
tcttattcaa acccttagta tatttaatat tctacctttg tgattcattc aatcgatttc 16560
ttttttttta ttttctttcc ctttctatat gctcttcatt aacttttctt tcaattatca 16620
atgctttatt caatacatct gtataagtag ttaactcata tagtaccatt tattttctaa 16680
tttctatcct caattccaac tcaaatttat ctactcagtc acattcatct tcaaccaatc 16740
tcgaagcaaa cttgacaagc tccataaatt tagcttcata ttctacaact attatatttc 16800
tttatttcag ataaataaat ttttattctt tctgaatcct catactctaa gaaaaatatt 16860
tttatcataa aatatctttt gaaatcactc ccaagcgagt tgttctccat cttgttcata 16920
tttaggtttc attctctatt atcaattaaa tgtctcatct ttcaacatgt atgatgcata 16980
taagattttt tcatcatcat ggtatctctt aacaataaat gctttctcca tctccataag 17040
ctaattttta gctcctattt catagttttc ttaaaagtca atggagacaa cttcttaaat 17100
tctatgatat tactttattg ctcctattgc tcttatgtcc ttgtggtgac aatatttatt 17160
gttgcacttg ctgtagaggc agttactgtt actgcaattg ctattacgat tccatcaagc 17220
cgactagtgt ctgcattatt tggataatag ttgatttttg ctactttatt tagatgttgg 17280
tggcaaaatc aatgacttct ttttgctgag agatgccacc aacctactaa gtatcatcat 17340
cttattggtt gataccttta gcagcacctc gagtggttct ttttatctga tatggaacca 17400
tcttaatctt gcatgaaaaa caaacttcgc aaaattttct tttaaaatct aatatctaat 17460
attatacttt tattaaaatt taattatgat tattttaaga ataaaaaatt taaattttga 17520
aatcctcaca aggctggcca agagataatg accatcatcc tagtcggttt gacgtaggac 17580
atccaaagat caactataat tcaagcatca tattgagatg ctaggatata atcgatggtg 17640
aaatttaatg atgctcgact gatcaagatg ggggccggcc cgatggcctg ttcaacaatc 17700
attgatcaaa attttttaac caaggtctat caagatcatt aaaaagtctt tctaagatct 17760
ataaattgta ataaagagac acaatctaga gagagacact ttttacataa agaaagtaga 17820
aattttaggg agagaaatta gagagaaagg ggaaagagag aggaagctga gaggaagaaa 17880
gaaaagagaa agactctctc tctttttctt ttctttcttt tctctctttt ctttttcttt 17940
tctttttttt cttccttttc tttctttctt tctttggctc attagaaaaa taggggacct 18000
attgatcccc ttgtttccta aataggggag gaatctcatc ttggtagcta tggccggcga 18060
tgtgagccaa agtggcaaaa tcatgaatct cccaacctgc agccgacatt gacttttggc 18120
actggaaaat caaagaaatt tgacaaaaaa tgggaaaaaa ttgaaaccaa aatagggacc 18180
aaaatccggt aatagctagc aaaaatcctt gatctttgct catggaggat aggaaaaaag 18240
attattcaag agattaaggg aatcttatct catttttttg ctgtgcttag gccatggtgg 18300
ttgcagaaat cgtttgtgaa agctcgacaa actctgcaat ttcttcgggc ttgggcctcg 18360
atctttaata ggagaagaga gaagtcctct ttcttttaaa tagagtcgga gggaaggagt 18420
ttgattccct ccttatggtg gtttcaaact ctgatcggaa gtccattgga aaagaagact 18480
cccattagtt ttaaaatcta ataagattta ttgattagaa aattgataaa aaatgattat 18540
taaaaaagta gcataattat ttaaatcaat gatgcttaga ttgttggagg taaatagtaa 18600
taaaatcaaa aaattaaaat tcatgggacc aaaaaataat gaacaagatt tgaaagaaat 18660
gtctataaat aagaatttat gaaacagggg aacattgatc aaaggtgtgt taaatagtgt 18720
ccttaaagtg ttattgtccc tctcacgtag actttgtgtg ttgggagaga acatagtaat 18780
tctctcaacc tatgcaacct aaatcttttg aaaagaaatt taaaattata gaaaaattgg 18840
caaactagaa ttttggtcat tttctttatt agtaaaaaat atactaagtt atatgtcttt 18900
atttatacta gtgaggtcta tctttgcaca attcagacca aatttatatt ctagttaaaa 18960
gaggtataga ttttttaaaa tagatataac tagtggaaat agtcatagaa aagttaaaaa 19020
tcaatgaaag gtagatttca cttctatatt ggctttattt gtggtcactt tatctaattc 19080
ttttttttga tggagcaata taccctgtta aaatcttctc gatttttttt tcactttaag 19140
caacctattt cgatgcctaa acaatggaat ttagtttaac cacttaatat gctacacttt 19200
taaaaggagc accatattgt agggcttgaa aagttacttg atttaaaaaa agagcatctt 19260
aattggacat catacaagta agttatgacc tccgaaaatt tgatacatga tttatcatct 19320
tgatatggta aatcttgtta agatttcctc atggtgtcta aagtggccgg ttcatactga 19380
gtttggtgat tcttctggtc aatggttaat tgctcgaata tttttaagat ataactaatc 19440
tccaactctg ccgactcctt agtagtatga gcacatggaa agcttgacct aattgatttc 19500
ttaaattgct tgaaatcagt acttagaaaa tatgcaaaat ggatgaaatg tttattgcag 19560
cgagagcttt ctgatctgta cgaccgagag cttactagtt ttttatgagc tatacgtttt 19620
gcacttaagc ctaatttaaa tagtgaaata gttttgcaac aattcaaaac aattaaaatc 19680
aaaagacaag ctgctatgca tgttcaactg actcggcttt caatcgcaat atgtcacata 19740
ggctggccta gaatgcagat gcgtgcgtgg tgagcatcct aaaaacctac atatccaata 19800
aattcccact agttggtgaa gtattaaatg taactcgtat taacttttta atgtaggact 19860
aaagtttatt cgactaatta agaactaaat actttaataa ttgaactttt ccaaccagaa 19920
atcagaaaat atttaagtaa ttaaatatta cataataact agatcaaaat atcatggttc 19980
ctctctcgct cgagatcaat tgggatgttg gtttatcttg gtcatccatc gagatgactc 20040
tatcttagcc tttcaaaacg gcgcggtacc acgggtctca ccgcttcgtt acatcgaatg 20100
ccaccatccc tttttttttt ttttttttat ttatttatgc tttcttgctc ctagattggt 20160
gcggcctcat tacaactcca ctgctacttg atgcttccct ctagcatctc ctttgcagct 20220
ctctcacttc caccactctt cggcctaatg ttgggaaacg acgaaggggc cttacaaaaa 20280
tgtcatccat gatggcagtg gagaagaaaa catcgctggg gctttccttc gatatccttc 20340
gcagccaaag ctcttatagg gttatatggg agaacgctgc attatttggg tgatcttttt 20400
ggatggtgtt gttgactgat gctagttttg cttcatgaat tgaatattta cacaagatga 20460
gaatacaatc tagtacaatt ggtaccaatt acctgggttt gactcctgct cgcatctgat 20520
tgaagcttgg ttaatgtgca tctcaattaa ttcagaaaga tcatcggact tcatgtgaat 20580
tattttgact agcatgaata gggctaaata aggctgaaat atgtgttaaa tttttaaaat 20640
tataacttga tcatatgatg tccaattgag atgttttcaa atcaaaattt ttttcgagat 20700
ttatcactta atgttaaact cttagaaggt cgaaacagac tgaaagtttt cttttcaaga 20760
tgtattttga ccgagtatat aacttgatga tcatatgatg cccaattgag atgttttcaa 20820
atgaaaattt tttttgagat ttatgactta atgttaaact cttaaaaggt cgaaacagac 20880
tgaaagtttt cttttcaaga tgtattttga ccaaatatat ctcataatct ataaagaata 20940
tatttcataa tctatgaata attagataga gcgacagaag ataatgctaa tgtaaaaatc 21000
acgatctatt ttttataaaa tttaatattt ttatataatc acttttacta tagtcatatt 21060
tatttttaaa aatttagtta tatttaaaat atcaaaaaaa tttgacttga attatataag 21120
aaaggatctt cctactatta tagatagaag ctttatatca tagtttacag tgtatggatc 21180
atcaatgaaa gaaagaggga tgtaaacctt acttttgaaa tttttctatt tgtttctaaa 21240
ttttttaaag gatccaagtt gagaattgag agaattcttt ctttctgcaa atcaaatcat 21300
tagtataatc cacatggaga cgttgtaata gaaagtagaa actatatttt atgaataata 21360
gaaagggagt tgatttacgc caagcctttt gtttgcttga ttaattattt atttttatgg 21420
tgttagctgg accccatgaa tagcaaccat cgttgggtca gggtcgtgta tttgttttgg 21480
ggtcttcatt aatatacacg gtggtaaatt gttgggggcg cgtcagatgg aaccaatcct 21540
ggttccttac ggtactgtag tgctctatat gtggacggct gtcattctat ccgtgaaata 21600
agaggtgttg tttttcttta aaaagcagca ctctcctcag caaaaacctc agaatccacc 21660
atgtaatatt actcatcctt ggtcttaaag ctgtagcaat acattacttc caaatgccaa 21720
gcaattaaat aaactacata catcgaacct ctttagtacg tacgtctttt caaaaatatt 21780
tttttcgaag atccgacaaa tgtgaaatgc ttattaactt ctttaatgtc tgtttttgct 21840
tgcatattta cacagacata ccatcaactc catcagttgt tgtttgataa ttcgcttgcc 21900
gagcagagaa gagagagagc aagagagaaa ggaggcatag agagcgtgag atgggaaaag 21960
cgaccgattc ttaaactggc gagacatcac acgttacccg gtacacccaa agctttcacg 22020
aatttggaaa gtgaagccat tatggaagcg ctagcttttt gctctccctt gccggaatgg 22080
aaaggccccc gaccttcttt acccctttct ccacgccacc cacccaccac tcttctatac 22140
acctttatag ctcccttctc ctttggcttt cttttaagca gagctcagag gaaaagagac 22200
cttcctgggt gcttgagaaa tagagaagag agaaaagaga gttggagatg gggaggggga 22260
agatagagat caagaagata gagaatccta caaacaggca ggtgacctac tccaagagga 22320
ggacggggat catgaagaag gctaaggaac tgacggtgct ttgcgatgct gaggtctcgc 22380
ttatcatgtt ctccagcacc ggcaagttct ccgagtattg cagccccctt tccgagtgtg 22440
tacacgatat tatccctcct cgtccccctt tttttttttt ttgataaaaa tgaaactcat 22500
atagtcttct tttatgatta tgtgtttgta atgatggatg attgatggct ggatggcagc 22560
accaagacca tatttgatcg ctaccagcag gtgtcaggga tcaacctgtg gagcgcccaa 22620
tacgaggcag aaactcttct tcttcttctt ctcctctctc tctacaaata tgcttttttt 22680
ctaatttttc ttttcaaaga aaaaagaaaa aaaatgattt ctaatattga tgtattttct 22740
tgtgggagta gaaaatgcaa aacactttga accatctgag ggagatcaac cagaacctcc 22800
gcagagaaat aaggtggagg gccaaaagag aatattgtaa tattagtact ttctggtaaa 22860
aataagcatg tagtttcttt ttgcctttaa attttgttgt gctggttctg atgagcaggc 22920
agcggatggg tgaagatctc gacagtttgg gcatccatga actgcgcggt cttgagcaaa 22980
atttagatga ggctttgaag gttgttcgtc acagaaaagt aagatccccc atttattcac 23040
tgcacctatt ttaattcctt attctccatg ttttgagagc ttttgagata aatgatgaga 23100
agcgcatcga gatcgagttg tctatattct ggaatgatta attttttaat tctcaattaa 23160
tgctgtttca ttgctaaata ttcagccata tattttgtct ctgcatggga tttctatgct 23220
aaaattcctc agatttcagc atacagaatc catgagactt gccttggctt taccacaagt 23280
actccagaat caaaattgtg aaagaaaaat aggataaatc tggttaagct gtaatttatt 23340
tacttacttt ctatctatat taaaattatt cagattattt tgcaaattta tggatatgct 23400
tgaatcacgt atctgatact ttctcttcat ctggatggca gtaccatgtg atcaccacgc 23460
agacggatac ctacaagaaa aaggcaaggc taacatgctt tcttaccatc attctttacg 23520
gtctttgatc cggttttgcg tgtccacttc ttacgtagtc tttttcaaac attcctatct 23580
aagactgaag gtaatgattt gcaaaggaat agctttactg ttttcctcta agtagatgaa 23640
atattactca cgtagaaagg agccatcata attgcagaaa gaataaaact gaatggaata 23700
tgagtagaat tgtcaaaatc ttggtttaag ggttttaata gccagatgag aaagcaacct 23760
acttttcttg aacaacttgt ttgtgactgt cttgttgctc ccatcttgca tctatgatta 23820
gcaaaatata tgataaatag atattcagat ttgatcgaaa agaaggaaga ttttctttaa 23880
tccatttaat ttgaatctca caaaaaaaaa gtagaagatt tggacacgat cgctgggggc 23940
agcacgctct taatagaatg gtgtcacgtt gcagatctcg aaaaattatt caattttttt 24000
taaaaaaaaa agagtcattg aaattagacg ttgtatgacc atgttatgat ctctgaaagt 24060
ttgacttctg actcaacttc ccaatatagc agattttact cctgaaccat gtttaacctc 24120
ctgactcata gtggccaaag tatctacatc gagttcactg gtcttcttgg atcacattca 24180
taagaatact tcccataatt ttgctcaacg ttgtttttct catcaaccaa aggtatatgc 24240
tttttaaaat tgaaatgccc atgaatatta tggcattctt ttatttgaca ttttggttga 24300
tcctatattg tttgtttggc attcaacact tcttcatggg aacctttgaa atgaggtagg 24360
tgctaggatt tttcttttta cctatccata tcatatttcc aatgtcttct tttacattag 24420
gttctttagt gacaataggg gaaacgaccc aatataatac ccttgaaaat ttgggcaata 24480
tctactaaaa ctaacttgaa taaaatatta acataaaaag ggatttagta acataaaagc 24540
ataactcaaa atcactcacc ttgtgtgcca cgttctcatt gcccttatta tttttgcatt 24600
gtgaattgtg tcccccaata aagcaacgtg aatggtggaa gagagttgaa tggctttgtt 24660
gagtaattgt tttgagttac tatagcattg ctctactaaa attgaaatct tgctgtgagg 24720
ctatgtatga gaagcaagtt catgcttttt gactgttggg atggaagtat gagcaatctt 24780
tttaatagaa aatggacgaa tcatgaagtt tttccttttt attgaaaaag atgatcgaaa 24840
aatatgtgca agatagaaaa acactgaaaa gataaaatga gaagtaaaag tggaagtcta 24900
ggagaagaaa atttaagaga aatatcttca atgagaggat gtgtgcacca acaaagccaa 24960
ctttcactaa agaatgtaat gactcacctc tactttcttc gaataagggg ttccagttgt 25020
ggaaagtata tagaatcttc tgaaagactg agtaaatgga gcaattcctt ctaagaaata 25080
ttatggcatt tctctcccac gaaatttcaa agcaaagagc agctagtagt tgatcctcta 25140
atctcttaat tgaagtttgg aatttctctt gcctctattt ggcccaaagg tcatgaagat 25200
ctaccggcca acctcttaag ttgaattaga tcttaataga agtccaaatg cttcttgtag 25260
aagaacatct aataaataaa tgagtgatag attctaatcc agagacaaag agcacacctc 25320
gaattcactt gccatccttt tctagctaga acttctctag catgaaactt gttccttaag 25380
gcaagccaaa taaatactca cattttagga atgactgcct tccaaataat tttataatat 25440
ggacaaatta gaccaccatt attgataaac ttgcaatgaa caattataaa tgagttttca 25500
ggttggcaca ttagcaatat aggatggttt gattattaaa aggatgatat gaagggtttc 25560
aaggtggttt gcctcgttca aatcaaagga ttttgaagat taatattcca agataaggtt 25620
ctccaactcc attaggaaag tgtcttcatg tcatcttaga gaagcagctc gtaccaaact 25680
tgacagatgt tttatttatt tagagtgaca cagataccct ttggcaatac tctccatcct 25740
tgtccgaaca acttctaatc acacctcact tatcttgcat ctaactcaga ggctacaagt 25800
tacacctttc aacaaacctt ttcggtttga aaatttgtga tttcattatt tagagttcga 25860
agagcatatc aagtattggt cggagttggc acccaaagca aacgaaacag ttactgacat 25920
ggtccaaaag ctgagatttc taagatccca acttaagcac tgaataaagc cattatggga 25980
aatatcattt taacgaaaga ggaatttaga gtaagaattg attctcttga taccgaagaa 26040
gaactaatac agctttcatc acttcaaaat gatgaacaga tgcatctcaa gtcagcacta 26100
gaccatcttc taaaatagga agatctatgg aagcaacact cccaaatgca gtggcttcaa 26160
aatggggatt gcaatacgaa gtttatccat gtttgggcaa gtaacaggaa aaaaagaata 26220
ctatcactga actctagcaa ggcgatcaga agattatcga atagcagcaa atccaatcca 26280
cattctacaa ctttttttct accctactag gctcgactga ggaatgactc atccaagctg 26340
attagaagat tctttatcca gaaggacctc tggatcttgc tgacattgag tatccattta 26400
tggagaaaga aatccatgat acagtgtatg acttggcttt ggaaaagtca cccggatgat 26460
attttcccat tctccttcta tatgcacttc tagtgtatca tcaaacatga cctgatgaac 26520
ctactgtaaa atcagctaat gtagaccatc tgaactactt gttcatcacc cttatcccaa 26580
aaaaaaattg gtgtgtattc agttagagac ttcaggccaa taagcctgat taatggagta 26640
ataaaaaata tttcaaaaac tctatcgaaa aggctctcac agaaaatgaa tttgttaatt 26700
ttatccacag agcttgcttt caacaaagga agaaatatct ctgaatattt tgtaatgact 26760
atggaaacta tacacttctg caaagctgaa gtacacaagg atctcaatta taaagtcgac 26820
ttcgagaaag cttttgacaa tgtggattgg agctttctat tgaaattgct atccagcacg 26880
gggctttgat tcgaggtggt gtcaatggat agaatatctg atttatacag ctaaattctc 26940
agtccttatt aatggtgata aaggtaaact ttttaaattg aggaaagatc tcaggcaagg 27000
agatcctcta ttcgcctagc tctttctctt agttgttgat atagaatgat caagggagca 27060
agtaggttca atctttttgt tggaattgga tcatataata tcatgggata acttcaaagc 27120
ttttagttca ctgatgacac acttatattt tgcagatatg atctaaaata catcaaaact 27180
cttaaatttt tactctatag ttatgagcta ctgatgggtc tcaaaattaa ctttgaaaaa 27240
ttccaatttt ttggcttgag aattgcaaag atgtcagtac agcaagttgc atctatccta 27300
gaaagcaagg tggctacatt ttccattact tatttgggtc tcccactcca tcattctaaa 27360
ctgaggaaaa cttattggaa tccactcctt gagaaggttc agaagaaatt gatcgggtag 27420
aaaggtaaac ttcttaacct ctagggtagg cttatactaa ctaatgcagt gcttacaggg 27480
atcccactac tctggaggga tacattcctt ctccctcaat tcattatcaa ataaattgat 27540
aaaatccatc gatcattcat ttggagagga aacgaggagt ataactaagg gcactctaga 27600
atatgttggt cgaatatttg tcgatcaaaa aaatttggag gactgggggt tcctcaatct 27660
aaaaattttc aatacaattc ttctttgtaa atggtggtgg aagctctact ctaatgctgg 27720
tgacccgtgg tgtagtttta ttgccactat ccacccaact tcacactaga gatctaaagg 27780
tatacacaaa tcaacctctt cattttggaa tggtttacag cacacatgaa atatttctac 27840
tcctaatcca ctttcaagtt agcaactagt attattttgg aaagatagtt ggttacataa 27900
tcatccactg aaggatcgat ttcctcacct ttacacaata gcattgaagt gcaacaactc 27960
agtggcaaag gtattaagca atctacttga taatagctct tttagtactc ctcttcctca 28020
aagataccaa gaagattttc agagtctata ggaaagcatt gaacaaatta cattaacgga 28080
acgacctgat actatacaat ggaaatggtt tagtagcaat atttttttgg catgaaggat 28140
ctactatttt ctgcaagatg gaggagtttg gcctctactg agtaatatta tataaaaact 28200
cctaatacca aagaaagcca agttatttgc ttggctaagt gctcacaaca aaatcccaat 28260
gaaagctaat cttcttaata gaggaataat tggaactgat tactgtacac tttgcgatga 28320
cttatcagaa actaatgatc atctaatgct catctatact ttttcaaaag caatttggaa 28380
tcaagtactt tcagacctgc aattgtcgaa acttttatgc atgcttaaca ccctatggga 28440
tacttggaga ctcatcaata tgcaacacga tagaagacct aaactagctg ctctattcgt 28500
aattggtcaa tggtgtcttt ggaaggaaag aaataaaaga ttattcgact tctatacttt 28560
ttatccacga tcgattgctg aaactgtgtc actttttctt tcttgggcat cacacctaac 28620
aacggagcaa ctaaagatgt tagctcctgt tcgagaagtt ctcttatcta agaatgaaaa 28680
cacacaatct ttagtgagaa ttacagatgc taacaggcgc agatgaatgt tttatgagca 28740
tttttatagc tgcagcttat atgtgatcta tggtgcaagg agttaattat aaccatggat 28800
attagttagg ttgactatca gaaatcatct ccaatacatt ctatgtaacc actgatcaat 28860
tccatgttca actagatagg aacctgccta tatacaggta tgtccctgat gtaactatag 28920
tatactatta ttcataaata aataacgaag gttttacctt cttctcataa aaaaaaagta 28980
tcttcatgtc atcctatatg tcatgcatct cctttgctac ttcttttatt tacttcttaa 29040
acttggttct accatatatt atcagcccct tttaaatttg cttttggata ttgcatattc 29100
cactcttcaa tcacctcatg ccaagcaaaa catttattca cacttgaaaa ccaatataag 29160
aataccaaag aatttatcca tgaaattcta gaaactttgg ttttactcct ttctccatca 29220
ttcaaaaagg ttcaaaatga tgataactct atatagctta tttatcaaat ttacgaggtt 29280
ggtgttcaat gtttttgtga aaaaaatatc ttgctatcca catagtttga atccatactt 29340
ttgctatctt gagtttcaaa aattttaatt tgctacaatt tgttgctatt agcatatgac 29400
tacttttaag aagataagcc aatatactat tttcctaaga atttaaaaaa tcaaaaataa 29460
aaatttttat ttaagatttt ttaagggttg ttttccaaat gtgcaatggg gcttaatctt 29520
ggcatcattt tctaacttgt agaattttga cccaagtaac atttgtccaa tcacttagaa 29580
cttctataac ttcgtacaat catttgttaa tgttgttcat ctatttatct atattatcta 29640
tctggaatat agttgctctt aattattttt atatatcgcc tattatccac cctaagcttt 29700
catgttcatc ctcatgttgt tggaggtgca tgtcttattc caaactattt accattgctg 29760
tagattttaa aaaatttgct agtttaggac tttttaatct tttgatatca tgttgatgta 29820
agctaaccct ctaaggctag tcataataca ttttaaggat ttatgttata tgagaccaaa 29880
attttaacaa aatgaagtgt tggaaattgg tagaatggaa gtgtaaagat gcttagagac 29940
atagaactag ccctgggcca tgtaaatctt ccaaaagaag aagaaaataa taaaattaag 30000
atcatattca atctctacag aaaagttggt ctttgttgta taataagcca tcttaacata 30060
tgatggacaa taaaatatat aaacttatga gttttaatac ttagatggaa gaaaagggac 30120
agatatgtca caccccatcc tactagcatg agtaggcaca tgatacacgg ttgcatgccc 30180
tgcagagttt gactcatgag gcatgcaagg tattgaatag tagtctaggt aaaattaaaa 30240
aacttggagc attctaaaaa taaatcaagt tcattttata aaatcaatat ttattatgga 30300
ctccatcaaa tattatgcgc ataacatttt atttgcaaat agaagaagat aagtcctaga 30360
tcctaagtct cctactctta gtctcataat tcatccaagc tatccaccaa atatctaaaa 30420
cgaaaaagaa aaacgatagt atgctaatag ctttgtaagt caccttttat ctctaattag 30480
atcaagcata ttagatataa aacaataatt ttcaaagtat atgatttgca attaggaata 30540
aatatttgat aaatacagaa taaattttca taaagcatat ttactaacat tatttataaa 30600
atatataatg cttatatcaa taaatcaatt tctaaatcaa tatatataaa ctatccattc 30660
tgtcttagcc ttacaactat tgctaccatt ccctgtagca tggttaggaa gagactagct 30720
cttgaatact catgtcattt atcaacatat gcgaatgatc attcgactaa tatagtcaaa 30780
aaaaaattac tctgatttat ataaattaaa aattagtaaa taatatatgc tagtaatcac 30840
cttaccagct aagctctaaa gaaaattagc ttttgaatat acatcatgct attgattatt 30900
atatgtcagt gcttgtctca ttttgtggca tgcaagaaga ctagatccta aacttatatg 30960
catagtcaga ttaaagagca aatgttgcat ctgattatat gaacatctat tatgatgtag 31020
agtttgtatc atgtatattt aatttaaaca caaatataat tatacataaa taatattcat 31080
attttaaatt ttaaatattt agataattat tctagtgcag gtataaaaat aagcaatata 31140
aaattttaaa tcgatttata taacatgcat aataaaaaaa attaaggata gaggtactta 31200
ctgctcaact cataaaacat aagaaatctc tttaactaac tttagtgcaa cctagataga 31260
acatattaat gattaagttt tcatctaaaa taaacataga tatcatttta aaatcttagg 31320
catttaaatg gtctcatgat ttgtgaggct ttcttcagat tctacaattt tgaaattttt 31380
tcaaattata atttttttac cttgattgat aacaaagcca ataatacacc tcaaatccaa 31440
atgtattcct aatagttttc aataaatcta atatcaataa atcataatta agatatcaat 31500
ccattctatg aatttgacca taaatcctac ttgtttctct gaccttcact ataaattaat 31560
catcaaacta aataagtgag gggatcataa ttcttttacg acaatccaag aattcaagtc 31620
tagcatccac attagatggc ttcctgtcca gatatttgcg cctctccaaa attgagatta 31680
tcagattaag aaaaataaaa taagagagag ggttaaagga caatgccttc taggtagtga 31740
tgtccgacat cataattttg atcaaatcta tggggcaacc aataatatta gggaaagagg 31800
attggatttg agcaagaata gcaaagtcat tgtcatcaat ggcctgattc attgagttca 31860
atgaaggatt ggtggttgag tggtggaggt ggcatctagg aaggagagag aaagaaaaag 31920
atagagagaa agagataaga aaaatagaga gaaggtggca gttaagatcc ctttttgtga 31980
ttaatatata gcggtaagat actcaaagat ctcaccttat cgacctcaaa cactaaggga 32040
ggtggaagga gggactacta cccatgaagc tagagaaagg gatgatgatg attggaggaa 32100
ggaagaagga aaaatagtag actcgatgat gataagacta aaagaaaagg gtttgactta 32160
gccacttggt atataatgag gtttggtatg gagtcaatag cttgagtaat agcatggaaa 32220
gagagaagga gctgaagaga gtactaagtc ttattagaat aaagaaagat agaatcttag 32280
cgaaaaatag ggcctcaaat ctttcaggta gaggaaaaag agggatcaac gaatgaaaga 32340
ctaaggaaaa ggtgtggagt aggatatact ctcgattagt ctctcaatca tggattctag 32400
tagggcttcg tcagctgctc aatcatggat tctgatagct caaatggtgg taagtagaaa 32460
gagagagatc taaagagatt gatagtggcc ttaaaaccag cacggtcaag gataggcatg 32520
ccttagagag aggaaaagag agagagatta atggaaataa gcgagaaaaa tatattctta 32580
gagaatagat tggcgataag aagaggaggt ggttggggca tgcttaaaga aataaagaaa 32640
attgagtagg cggaaagtgg tgatgcttgg cgatgagaag atttgagaga gagagcaaaa 32700
aaatgtggat gatggtcata ggatagggaa aggaaagaac aaagaagggg gtgctaagct 32760
aactctttct accttcctca caccctgaag caaaggattt ggccaaggat ggacaaatgg 32820
gcgagggctt tggtggatcc atgcctaccc tttctccctc tcacgatgat tctagtcaag 32880
ctatctatct ttgatagctt gagccaagcc aattgacttg atccaatctc tctaaatcca 32940
tacaaactta agagagtgta ttgattcact tattctcttc taagttgata agaaacataa 33000
ttaagtggag ctcattaagt atttcaggta gttgctaact tggcaaaatg gaagcaataa 33060
taaattttaa aagactatag cttggtataa tctcaaccat ccatgattta gaaagatctt 33120
cagactcaat atagattact ttggctacta caggtaagag ctaaatagga tccaaaagta 33180
agatccatca cattagtaag tcaaattata tgtcaaatct tagtaggtat acttagtcct 33240
acgatgccta attaaaatga tcatcatttg aaccttaaaa tggactagtc aactaaaatt 33300
tttctttttg aagaagattt agaccataaa atatcttcta atctgtgaag aattagatag 33360
agcgaggaat ataaaattga tgtagaaatc aagatctatc atatatacaa ttttaatatt 33420
tttttcataa tttttaaata tttatcttct ttttttatag gtctagtcct atttaaacta 33480
ggaagaggag tccaacttga cttatgcaat aggggatgtc cttctagaag ataagaataa 33540
tttgatcaga attatataag agcaaacctc attattataa ataggggcta tatacatcaa 33600
tttatgagat agagaatcaa tgaaacaaaa gtagacttaa gttttatttt cataattctt 33660
ctatcttcta ctttttttct aggagattca agttgagtgg attgaagaaa atctttcatc 33720
ttctcgatcg gatcatattg gtattagagc gttggtcttc tatatttatg gagagcttta 33780
atgtattgtt taaatacgtg aacaatacaa acaatcaaga gaagtgctat ccatgcttca 33840
aatacatcga aatataaaag caaatatggc tactaattct ttttcaatgg acaatgagat 33900
aaaaggatgt cttacacaac tcaaggagaa gattgtgcaa ctcatgaaga ttgtctccag 33960
attgaagata atttcaatac aagcacaaac accagcaact catgttgtga aactgtttcc 34020
tatgtttgga gatgaagatc ttctatctag tgaggagatt gaattaccta aaagtatgaa 34080
aaatctttct tcaatcattg aaagttaaag cttgaattga gatccccata tataatggaa 34140
ccattgatga aaaaaagcta gataattggc taaactaatt acaaacctat tttattatct 34200
atagatatta tggcatctag aagatagctt ttacttatct caagctttct agccatgctc 34260
ttatctgatg aaattcatat atgagaaata ataatatttt taatatggtg cagagccaat 34320
tcaaaggttt aatcaagaag taattttatc taattggcca taaggaagat cggtggatca 34380
aatgataata cttatgatag aaacataatc aatccactta ggactatacc accaagttcc 34440
acaaacaggc aatctgcctt ggaatcttta tcaacaatta tacaattttt ataaagtatg 34500
ttgaaagtct tcatgagagc atctaaaaaa agatgaaact ctttaaggtt gatgatatca 34560
gtaaagctaa catgaaagtc atagagattg aggagaaaaa tcaaattaga gaagataagg 34620
aaggcaaaaa gcatatcaac ataactcaaa aaaaaaaaat tatgatcatt gaaatctttg 34680
aaaatacatc aaggagaagt attgaaagtt tcatcctgaa ttggagctaa agtagaagaa 34740
gcccaaggat gataatttta agaaaaataa aaagtggtcc tcaattctat agagattgag 34800
gagctatctg aacttgagta agcaaacttc aaattgagct tgatggtgag aaaacctaat 34860
acaacaatta aaacggatct agaggtacat gacaactcac ccacttaaag attcaagtga 34920
agcagagtat cattaaggct attataaatc tttgaagcta gaagaacctc attttccaat 34980
atttggttca gaaatcgagg ttgtagatca agcctcatcc atatccttat cctcttagtt 35040
ggattcagaa ggatgtcaag ttaaaaatta tgagatagtg taccttcaag ttagccatca 35100
ctgagaggtt tatttgtgag gtaacttttg aaatagtttc tttggatatt tgtcaagtta 35160
tccttagaaa tgtgtacctt tagaatcaag atgcaatttt ctatagacga tagagaaagt 35220
atcatcttat aagggatgag aaaaagttca tgatcaacac ctcaagaaca taaggtaact 35280
ttgaccttgc aactgttgcc caagtgaagt gatttgttaa tgtttgtgat gagtgcatga 35340
tgatggtata aagaaccgat atcactcatg agaggtcaag gccttgtcct ttggttccat 35400
caatcgatca atagagattg agattaagga ggagtcacta tagtccttgt cgatgaggaa 35460
ggatgacaac aagcattcct accatgaagt ctagatttga gagcaaatga aagtaatcca 35520
ctgagacctg agagcaaaaa aaggcgagac caaaaatcat cttcaagtaa agtcaaatgg 35580
ttcaaccatg agatggggaa gtaagtattt tcccaccttc aattctaact ttgtagaaac 35640
taaatccctt aaacagggga gccctaattt aagaggatcc tcagattcat tgtggactac 35700
tttggctatt acaataagag ctggatagga atcgaaagca aaattcacca cattaggaag 35760
ccaaattgta tggcaaactt caagagacca taacttgatc acatgaaatc caattaagat 35820
gattttattt ttgaatttga atattttttt gagatctata actttagatc taaatcaagc 35880
taaaatttta ttgcttacgc cttcaaaata ggctagtcaa atcaaaactt ttcttttcaa 35940
aaaagacttt gactgaaaga tatctttcaa tctatgaaga atcaagtaga gtgatgaaag 36000
ataaagttga tataaaaatt gagatctatc tcttataaaa ttttagtaat tttatttttt 36060
ttaatattta tctttattta gagatctatt cctatttaaa ctagaaagaa ttgtccaacc 36120
taacttgttc aatgatcaac atcctcctaa aagataaaaa gaagaatctg actcaaatta 36180
taaaagggcg gacctttttt tttgatgaaa agggaggaaa aaaatccatc aaaatttatt 36240
aagaaaaaaa gagtacaaga aaagaaggat atgaaagagt aagagaagcc ccacaacatc 36300
catcaatatt taaaatttaa atttaaatct cccccatcat tctatcaata tttgatattc 36360
aaatttaaat tcttcgcagc atcccaccaa catttgaaat tcaaatcctt tcatacaaac 36420
aaaataatat ttttcaaatt ctcaactttg agtttcaaaa ttgagaagcc tacatattgt 36480
ctgctcttca ccaaagaggg gagattgttg gcttagcttg gcccaagaga agagaagaag 36540
gccaaggccc aatctgtagc ctagagaagg agggtttggt agctacttaa taatcggatc 36600
taaccgataa agacactatc tctattagaa gaaaaggtag agagaaaaag aggcaattgg 36660
ttaacttcag agggggagga ggtaagctgt tgaggagatt aatctgacgc aaggaaaaaa 36720
gaagagctga caactagcca atgatcgaga agggctggag acaatccaag cccagcacca 36780
agaagcaaga gaaagaattt ggaggtcaaa ggaggagtcc aggaagagag agcgaaacac 36840
aatgttcgga tctagccgac aacgatacca attatactag gaaagaaggt aaaaagggaa 36900
agagcaatcg atcatcttca gcaaagaaaa ataaaagagg cacccgacag tcaagcccat 36960
ggccaaatca gtcagcaaga ggacctcaca agatctagac gatgctaagg ggaagggagg 37020
aagaaaagag atccagtaac tgtccaacac caggaaaagg aggagataag aggaagggag 37080
aagtcatttt tctatcttgg gccgaaggag ggagaaggaa gaaagaggaa agaacatcct 37140
caaagtcgaa ggaaggaagg aaagagaggg gggaaggggt cacagtcaga tataccagaa 37200
gggatagatc cagtgtcaaa gagagaaaag agagaggaga tcagaaaata aaatttgatg 37260
actgactaat tgtcatgaaa ggctaatgac aactcataaa aaaagtatag tagtaaagag 37320
agggggatag gcttggttag ggaagagatt ccgacaacaa agagaaagaa agagagagag 37380
agagagaacc ggctcccagc caaaaatagc ttgacccacc atcgagaagg accgacaaag 37440
agagagaaag atagaatagg gagaatagct tggcttcgaa tcaaaaatga tctaacacac 37500
tgctgaaaag gactaggaag agagagagag ggggtagggg agtatctcgg ctcgcaatca 37560
gaatcaactg gccaatgcca gaaaagagag gaagagagag atagagaaga tatagcaaaa 37620
gagaagagat ggacaaaagg agagaggaag ggagggagag agagaaaaaa taggagagag 37680
aggggcttgg tggctgactg tcagaagaag cctcgatgct cgaagattag atggaagaaa 37740
aaaaaatttc tcaaaacttc tcttttctat aagagcaaac ctcactatta taaatagggt 37800
tatgtatctc agtttatgat gtgaagaatt aatgaaaaat tggactttag ctctattttt 37860
gtaattcttt catcttctat ttttatgaaa ttcaagttga gccgattaaa agaaataatc 37920
tttctttccg attggatcaa tccattaact agatacttca aaaatcaaaa tgacctatct 37980
aaaatcctaa atcaaataca aaaccaaaat aactaaatta agatagaaca aactacaatt 38040
acaaaaaact ggctaaagtg tttaaatgct tttactccta agtttcttct tgctcaccat 38100
taatgcttga tctttagctg ggatcatatc agccttatga ccactataag accaacataa 38160
caactcactt gtattgctcc tttaaaatta tacaaaacta gtgtctaata tgtaccatgc 38220
gaatgtctgt ttctcaccag aaaatggatg ggcttcttgt gcaagcacct tcttcctaca 38280
aataataaaa tatgcatccc ttctctcatc ttactaaata aaataattaa aggctttact 38340
atcaggaaat ctggctttat ccatataatt ttggaagttt tatttgaaca taacattacg 38400
agtactagat tacatcagga ggtggttcct cttatttcta ttaagagaaa aatcaatttt 38460
cttttaagaa agatcatttc attttcatca ggtagcgtac tctactaata tacttccaca 38520
acaatatata gggattagat tataggatgg actttaaggc ttcttttcga gagccctgat 38580
ttctcaatca cattcccttt tctttctcat gtaatggcat ttaagagtgc atccagggcc 38640
caacaattag tcacaagtgt tctttttata catggtacat atttgctatt ttttagctta 38700
ttttaacttg attgtgaaga tatcatgaga aaattagatt taaagcctag caatcttgaa 38760
cccataattt caagttaaca ggtggaagag tccattatta tgtgagacca acttagactg 38820
caaaactatc tgatattgga ctatttacta acaccctttt tcatgtgcaa tgtttgtaaa 38880
gagaagatat atgatgtagc gagataggat agtttggctc taatattgtg ttaatattca 38940
aaccaaaatc ctaagctaat agatggaaga gaaatgactt atatacatgt gcattattgg 39000
atatatcttt atgggagaaa taatcacatg gatgtttata tcacacatct catatgtgca 39060
tgttgttgta aggcttcaaa agacagacga tgagattggt cttggatcaa attggaatgt 39120
ttcttagttg aatttggaga agtctgcaac aaatcctata aaagaagtcc cgaaattggt 39180
ggggcacctt tcgatccaag acccttcgat ggataagtca aataaagcct tgagaacaga 39240
ttgtggaaat ggaagaatag aaggatgaga aaagagattg tgaacaaatg gagagaggac 39300
tcttgtttcc ttcagtggag gagttgaaaa tgattcaaca aagtctccac tctatctatc 39360
ccgacttacc ttatggaggg tatgttaccc tcctttatat agaggggtga ggaggcttgc 39420
tcaagttgtt aggccgttaa tttattataa tagaatggtc agctatataa agatcatggg 39480
atgtttatcc atgtgatgat tagctatagg atagctagaa aatatctaat gcttaattag 39540
atgatagctg tcagataacc gtctgcattc ttatagtaca tcgatatttt atcgacgtga 39600
ctagcttaaa tcagcaactg actgaactga atattatgat tcttttagtt aacaatcata 39660
ttggttagag accgatgtaa ttcatagtag atcgatcaca agctgagatg agtatcatat 39720
tttaagaaca atactagcaa gttagatcga tcaaatgtca gatgaaaaag tagatcagta 39780
aacgttcgat ggaacctgaa agaatattta tgatttagat aataatctat catcacgtat 39840
ccagataatg agatcatata acatgtacca atatatgccc tccatttttc acaccgaagt 39900
gaagttcttc acatcgggtg tggaaagtct cttcagaaga tctcacctga cctgtattgt 39960
catcataaat gctccatacc acgatggttg gaagtattaa ttttttaatc actcaaagtc 40020
atacacaatt tcttgaaaat gatttgttga acttagtaat gatgagcgct tagaaaatcg 40080
ggagctcaca attatttggg tggctagtcc ctaatgtgta tgtgctaggt gtcatactgt 40140
aattggccac ttcagctatc acatggatcc tgcttgcatg gcttaatcaa gaagaggtgc 40200
gtcgcaacaa ctctctgcag aaccatcgga taactgacaa gtggcattga tctaatggca 40260
tatcaaatgg attgagactg ttagtaaatt ttataaatag gtctatactc tgttcaaaaa 40320
ttactttact atttttttca catgacagtc ttgctgaaat tttttcagag cccctaacat 40380
cattggtatc ggagtagaga ccccccaaag tcattggagc cggagaagaa agaagtaaag 40440
aagtctttta aaagcttcct caaattcctc tttacatatt aggcagactc tttcatcttc 40500
aacttctttt ccatgaacat ctgagatttt aggttttaca atctttattt ttttttttgg 40560
atagttattc ccttttctct cttttttttt ctgtttctct tttcccattc acctttactt 40620
tcttctttcc tttcaaaaat atcttttgat aggactaatg agataagtca ggaccaatgg 40680
atatctcggt caacccaacc actgctcaag tttgagatgg aaaatctatc tcggacaaca 40740
gctgaagtta gtacctcagg ttaggatgat ctagaatctc ctataagaga ttttttagat 40800
tatttcggcc caagtactga acaatctgtc ctgaccaatc tcgatcttta ggaacttaag 40860
aaaaaatatt cgattcagct tataactcca agttgggatg gtaggattat tgaacctcca 40920
gaaggttatg tcgtatttta tgatgaggca cttcgatctg gactttaatt tctcttacat 40980
cctttcttca gtaatgtttt agacttctat aaactccatc caatctaggt tactcccaat 41040
gccattagga tgatcatagt tttcattatc tatcgtaaat tttttgctat agaactaaga 41100
atttctctct ttaggatgct ggtcatccta agaaaacatc cttatgaaaa agactgatgg 41160
tatttcttac cttggcctca atataaattc ggtcccactc ttcctttttc aatacataat 41220
tgaaaaaatc attttttctt tatttcttct aatgtttcgt agggttttat ttgtaaatag 41280
tctaagccta aaaccaaatg gaactcaaat aacaaaatat tatctgagga tgaggagact 41340
tttgtagagc ttttagatat gaaagtatcc aagttgagcc tactggtgtc caatcagtcc 41400
ttgtttgaca ccgacatcag tcagatctct ccttaagata agtctgatgt taattctttt 41460
tctttattgc tttatcattt ttcatcattt ttcttttcta acaatctttt tccttatata 41520
gtagcaataa tgaagttcaa cctacaaagg ctggctaact caaagaagag gaagaaggat 41580
ctaaccgatt gctctcaaga agagtaagga gactgctcct ctaagatcga ttggcccccg 41640
atcatcacct gggccaatat taattgacat agatgctaca tcgatctcca ctataccacc 41700
agcaaaatca actcatcaac ctactaaggt ggcttgtcca cctcctaaag agtctgcaca 41760
tccaaagtag gcatcttccc caacacctcc aacatcggcc aagttagttt ggctgagcaa 41820
tcagcatctg aggtcacaga ctcctgatgt caacccacca actttctcat caaaaaaaaa 41880
ttgacttggc gaaggtatca cttttggaga cacccagact aggcaaggac ttgctctgta 41940
caatgatgcc tcaaaaggac ctagatgctg ataggaggga tctttctttg gagcaaataa 42000
taaattatgg attcaacagt atcatgaacg tgagtcttca ttctcttcca ctctcttctt 42060
tctttttctt tttttttttt acattggcta tttgttgatc tgaatatatc tttctttttg 42120
cagtcggttg tgtatttcaa gttgctcaat gagcacttga catggttctt caaaaataaa 42180
aatttttttg aaagagaggc tcaaggccaa gaaagaggcc aaaaaagcag ttgaggaggt 42240
caagaaggca gtaaagaaga aggctgtcaa agaaagcaaa atgatggagg ggctgaagaa 42300
acagctccaa gaaaaaatag attccattaa ggagactgga caaccaatga cagatgaatg 42360
ataaagatga caagttgtaa aaacagcctg aaaaaaatct caaagttgga ggccaagctg 42420
aaggaggtcg agtcaataat tgaaaagcat gatgaagctc ttgtcccata ttagagacaa 42480
cttgataaag acaaagagtg gatgtcaagg attattgaag attataagaa ttccgacact 42540
tttcaagatg acgttactga ggcctcaaaa ggagctttca attatggctt tttgagctac 42600
aggagtttaa ttatcaagct ctttcctaac cttgatctca gcaaggtcat aatagaagca 42660
gctctagaag tagtagccga agtgacttct gcaacaacta ctgagcttgc ttccacttct 42720
atcattggag tttctccgat cgaagtccca aacagtccaa tcgaggcctc catcatcgaa 42780
gctatttcga aggaatcagt cggcaaagac cttacctcaa ctcctccaac aaataactcc 42840
caagctaagg cctgaattat cttcttcttt tttttctaaa catttgtatt agcccgatgt 42900
gggcttctat aaatactttt tacattaatg aatgagtttt tcaatgtcaa tattttttct 42960
ttttaactaa tactaatctt ggatgatccg atctgggttg gatgtctcaa aaaatatcat 43020
tcacgataga tagttatttt ctgacttcgg ttagatgatt atgagtatat gtaattcaac 43080
cttggttagg taagtaatca aatattaact attctcaaac caagtagata acgaagtcaa 43140
tgtgattaac tttaacaagt aagattgtta tggaatgaaa ttgaatcaga tcaactaact 43200
atagataact taatctctca taattcactg taaaggttct aaaagtacct ttatctaagt 43260
tcgaagtgac aagtcgggtt cttttattcg tggatttatg acccatgctg tctttttgtg 43320
atcttcatta ttaatcacct taaatcgata tagcaaaatc cagtttatag atctgagtgc 43380
tttcttgtca gattgagtct atcctattat ctgtgaaacc tgatctagag atcaagtatt 43440
ttaggttttt tatttaaggt ccaattcgaa gattgagtat ccaatgtcat attgttaggt 43500
ccaatttgga gattggatgt ctcactatca tctcgtgagg tccaatccaa agatcgaata 43560
tctcactatc atctcatgag gtccaatcca gagattggat gtctcacatc atcttgtgag 43620
atccaattcg aagattggat gtctcacatc atctcatcct attgtggttg gaatttttgt 43680
agccttagtt tgactttttc tgacctcatt tggacaccta aatcttatta tcatcgtttg 43740
atcgattttt actaatctac tttggatgaa aaagaattct tcaatggaac ttttgattag 43800
aactttatct tcattgggat agaaatcgaa tgctttattg aaagatttta ttgataatac 43860
attctgagat ttttaatatt tcatgttctc gaaatgatcg taccatctaa atttttaatt 43920
cgataagctc ttggatggat cacctcagta atctgataag gtccttccca attcgggatg 43980
agtttttctt actccattgg ttttgagact tcagctcatt ggagaaccaa atctccttat 44040
aaaaaatttt aggctttacc tgagagttgt aatatctggc tactttttgt ttataaacta 44100
ccatatgaat ctgggctttt tctcgagttt tctcaaataa attgagatca gtcctcagtt 44160
gatctgaatt attttcttca tgaaaatttt ctattctggt tgtaggtaaa ctgatctcga 44220
ctagtattat agcctctgtt ccgaaagtaa gtttaaaaga tatttctcta gttggtctct 44280
gaggtgtagt tctgtatacc cataaaatat tataaaatta ttctaccccg agacttttag 44340
cctcaatgag ttttattttt aggccttgaa agatagttct ataaataaat ttagcttctc 44400
catttgattg tagatgtcca atcgaagtaa atatatgatc tatgtagagc tcagaataaa 44460
tttttttaaa attttgatta tcaaattatt gctcattatt agtaattata actcaaggca 44520
aaccaaaatg gtaaataatt atttttcaca taaaatctca tattttttct cagtgattta 44580
tgtcagaggt tcaatttcta tccattgggt aaaataatca atagtcacaa ctaaaaattt 44640
tctttgctcc atggccatta gaaaggatcc cagaatatcc attctccata tagcaaaagg 44700
ccacagcact gtaatagaaa taagttcagt tgtaggctga tgttatatat tggcgtacct 44760
ttgacactga tcgcagtact tattaataaa gtcggttgaa tctttttgaa tagtaggcca 44820
ataataatct tactgaatta tttcataagc taaaatttta ccccccaaat ggttactaga 44880
gattccttta tgaacttctc gaaggatgta atcagcttcc gatggcctta ggcataggag 44940
cagtgggagt gaatataacc tctgatataa ttgattatct tgaacaacat accatggggc 45000
ctgtctttta attcttgttc cttcgactgg atcaaccggt agaggttctt tagtaatata 45060
ctccattaat gggtcaatgg aacttagctc atattaaatt tggacaatta gtaaggcctc 45120
gatactagac tttttaagaa tatcaataag aacaccttga tttagtttga aaaaatctga 45180
tgtggctaaa tgagataggg catcagctca gacattttgt ccttggtatt tgcatgatct 45240
tcagattttc aaagtttttt aataattctt tcatattata taaatattga aacatcataa 45300
aatctttagc ttcaaattaa tctcatacct gactgacgat aaattgagaa tcaataaaaa 45360
ttttaatttt tttaacatta agctccttag ccattttgag tcctacaatt agcgtttcat 45420
attctactcc attgtttgag tgttaaaatt aaatctcaaa gcacgctcac taacaatgcc 45480
ttctagactc gttagaatta aactagttct actttctttc gaatttgagg ctccatcaat 45540
gtacagtatc aaataagaat ctttgatatt tttcaattct tttaagattg gttcttcatt 45600
aggaatagag cattcaataa taaaatcagc taatacttaa actttcaatg aagatcgagg 45660
cccatattga tatcaaattc atttaattca atagcctatt tgaatatcct tcttaaagta 45720
tcaagctact gtaaaattaa ttttaaaggt tgatcgatca gaattataat agaatgagcc 45780
taaaaatacg atcaaagtca tcttgctaat gcaatgaggg tataaattat cttctcaatt 45840
ttagaatatc gagtttcaac atctctaaat aatttatttg tataataaat ggatctttgt 45900
atccctgcat catttcaagc taaaatcgaa ctaacagcat ttgctgaaat agatagatac 45960
atgaataatt tttgaccttt gatcggcttt gatagtaatg gagctgtgcc gagatatttc 46020
ttgagatcat cgaaggctgc ttgacattca tcttatcaat cgaagtcttt gatctgcctt 46080
agaattttaa agaaaggaag atatttatca gctgatctga aaataaatta actaagcaat 46140
gctactcatc cagtaagttg gtgtacttct ttgatggagc tcggatgctt catttcacat 46200
agagcttgaa ttttcttaag attgacttta attcctcttt gagttacaaa aaaatctaaa 46260
aaaatttttg aagttacttc aaaagcatat ttgttgggat tgagcttcat ttgatatttt 46320
cgtagtctct aaaggcttct tccagattgg caatatactg atctgactca gtatttttta 46380
ctaatatatc atcaacataa actttgatat taatttcaat ttgttactta aaaatcttat 46440
taatcaagta ttagtatgta gcacctacat ttttaagatc aaaagacatc attttataac 46500
aatgcaaatc tttttcagtg atgaaggcca tattttcttc atcctcaagt gccattttga 46560
tctgatataa ccagaaaaag tatccataaa gcttagtaat ttgtgtcttg aagtagcatc 46620
aacaagctga tcaatttttg agagagaaaa actatctttt aggcaagctt tattgagatc 46680
ggtataatca acatagatcc ttcatttttc attagccttt ttaaccatga caacatttac 46740
aatccacttt ggatattatg cttctctgat gaatttgtct ttcaagagtt tgtcgacttc 46800
ctcatctatt attttttatc ttttcggggt gaaacttctt ttcttctgtt gcattggttt 46860
atgctttgga tcaacattca gcttatgtac aataagatca gttaaaatct caggcatatt 46920
agagactgac taaacaaaga catcggcatt catccgaaga aaagatatta atttctccct 46980
cagatcaggc ttcaatagag atccaatttg gacagttttt tttggatcat cacacaaaag 47040
aacagtaata agtttctcga ctggttctcc tcgatttttg atgatatcaa ctttactttc 47100
ttgatcaagt attttaattg gtagagcttc cacagacctt ttcattttta cagctatcag 47160
aaaatactac ttagcaagta tctgatttcc tcatatttct ccaactccat acttagtttg 47220
gaattggatt agtaaatgat aagtgaagac tatagcctta agggcgttga gcctaggtcg 47280
gtcaagaata gcattataag ctgatggtat tttgacaata aaaaaagtga gtcttacagt 47340
tgactggcat ggttctatcc ctgcagtgac ggacaaagtg acctctcctt ccacagctac 47400
aggatttcta gaaaatccaa ttacgggggt accaacctat ttagctaatt tatcatattc 47460
attctttgga atgtatcata gaacaatata ttagcagagc tttcattatc aataagtatt 47520
ctttttatat catatttggc tattgccata aagatgacaa cagcatcatt acgaggagtt 47580
tgaactctaa catcatcatc gaaaaatgaa attatgtgat ccatgcactg atgctttgga 47640
aggctttcag taatctcagc cacctcctca gttccgtcga gatctgagat catattgatg 47700
actgcagcag tagacttgtt gtgatcattc tcattgttgg gcttctatca ttggtcagta 47760
gcttgacttg cccgatctcg aacatattta ctaaagtaac attagtggat caatacttca 47820
attttatctt ttaattatcg atgctcctca gtatcatggc catagtctcg atggaaatga 47880
cagtattttc tcttatctct ctttgctgga ggggctttca taggattagg ttggcgaata 47940
tatcctaaat cctcgatttc tatcagtatc tgagctcgag gagtagatag tgaggtatag 48000
atgtcgaatc accgaggtgg gcttttgaac ttcagattct tctgaggtcg ttcagagtta 48060
tcctgttggt ttttatgatc ttcttcctag ggccactttt ttccatctct ttttttcttc 48120
acctaacgaa gtatgcatgc tctctttctt ttcagcttga gcatacttac aaacctagat 48180
caatatttgt tcataattgt ttgggtagtt cttattaaga gagaagatca ggcgattact 48240
cttgagtcct tgcttcaaag ctgccattgc aatggactca ttgaagttct tcactttcag 48300
tatggcggca ttaaagcatg ccacatattc ttgaagagat tcaccttcct actatttgat 48360
agtaaaaaga ttgctagtat ttttcaaatg aatccattta ttatcaaaat acgtgatgaa 48420
tatttgctaa ctgtgtgaaa gatgaaatag atcatgtctg gaggtcagag aactagattc 48480
ttgcagatgt tttgagagtg attggaaaag tgatgcaaaa tagggcatta gatacccctt 48540
gtagtcttat aatggctctg aagccttcaa gatgatttaa gggattgatg gagccatcga 48600
atgtttccac tgtaggtatc ttgaatcgag gaggaactga tttaccaaga attttttgag 48660
aaaaaagaga tcgtaagttg aaatctcttc taccttgaga atggcttcca atctatatct 48720
ccatcatttt cttctcaaga ttttgaatct tttgtccaag accctcctcc atacatggct 48780
tcttatgtgg agcagatttc acttcccaag agtgatcagt atggtcaaga agatgatcat 48840
gatgaagatc ttgaggagtt ggttgctaag tgtgatgtga ttggactact tggggggcta 48900
ctttttgcta ccgttctgtc gtatactaca gcagtaagag cttggacctg ctgaaccaag 48960
agactaaact attgtggatc aataataatt gaaggttagg tattctcctg aacatcttca 49020
ggagaagatg aagtaggtaa aggatgattt ggtgccttct tgttcaccat ttctactaaa 49080
atattttaag tgcccttcct ctaacactaa tctattactg caaggcttca aaagacaggc 49140
aacgagatgg gtcttgaatc gaactagaat gtttcttggt tgaatttggc gaagtctgta 49200
acaaatcttg caaagaaaat ctcgaaacct acgggtacct tctggttcaa gatcctctga 49260
tggataagtt aggtaaagtc ttgagaatag gttgtgaaaa tagaagaata gaaggatgag 49320
aagagagatt gtcggtaaat ggagagatga ctcttatttc tttcaatggg ggagctgaaa 49380
ataattcagc agagtttcca ctctatcaat cctgacttat tttgtggagg gtaccttggc 49440
cccttcatat ataggggatg aagaggcctg gtaaggttgt tagactatta ggagagtttg 49500
ttagatcgtt aatttattat aatagaatga ccagctatat aaaaatcatg gagtatttac 49560
ccacatggtg attgactgta gtataactga aagatagcta atgcttagct ggatgactgc 49620
tgttagataa ctgtctgcat tcttacggta cattgatatt ttaccaatgt gacatagctt 49680
aaatcggcaa ctggctgaac taaatattat gtatcccttt agttaacaat catgtcggtt 49740
agagatcaat gtaattcgca gcagatcgat cataagctga gatgagtatc atattttaag 49800
aacaacgctg ggcgagttag gccgatcaaa tgtcagactg aaaaagcaga tcaataaacc 49860
tctgatgtga tctgaaagaa tatttatgat ttaaataata atctatcacc acgtatccag 49920
ataatgaggt catataacat gtaccaacag tgcatttttc catctagtta agaggttggt 49980
tagtggcatt tgtcttcgat atgtaatgtt cacataacta atgtgcttag tagcattctt 50040
ttgtaaggtt aaatcttcaa tgatcttaag ttcacataat tgcctttgtg ccctattagt 50100
ttatagttga ccttttaatt caagagacag tcaccttagc aatcgatgtc tgcttagatt 50160
gggccaatta ggtactcaca ttaatatatt gaatcatgtt tgaatataaa ggattagatt 50220
gatttataag tttcctttta ttgtttacat actgatactt agattgactt actacattat 50280
ttgatatgtt atgttctaat ttttggatta aaattgttgt ttctgatttc tccttacatc 50340
taatactttg tataatttat tattttttag catgattgag tgtagaggat tagattgatt 50400
tttaagttta ttttgattat ttacatgccg atacttaaat tgacttacta cattattcaa 50460
tatgttatgt ttcaattatt gagttaaaat ttttatttct gatttctact gatgtccagt 50520
gtgtgtgtgt gtacgtatgt gtgtatatat ttatttacat atatatgtat gtatgtatac 50580
agacatacat acatacatac atacatacgt acacacacac acacacacac acacacacac 50640
acacacacac atatatatat atatatatct gtgtgtgtgt gtgtctctct ctctatatat 50700
gtataagtat gtatgtatgt atgtgtatat atatatatat atatatatat atatctatat 50760
gtgtgtatgc atgtatgtat atgtatgtat gtatatacat atatgtatat atatgtatat 50820
atatgtgtat atatgtatat atatgtgtgt gtgtgtatac atatgtatac atacatatct 50880
atacatacat atgtatacat acatacatat atatgtatat atacatatac atgtatacat 50940
acatgtatac acatacatgt atacatatac atgtatacat atatgtatac atatacatat 51000
atacatatat atatatatat gtatatacgt gtgtgtgtgt gtgtaagtaa ttaagtatgt 51060
agtgtgtgtg tgtgtgtgta tatatattta tatctgtgtg tgtgtgtata tatgtatgta 51120
tgtatgtatg tatatatata taaatacata catacatatt tatacacaca tatctataca 51180
caaatatgta tacatataga cacacacaca cgcgtgcgcg cgcgcgcgca cacacacaca 51240
tatatatata tatatataga tagatagata tatgtatgta tgtatatata tatgtatata 51300
tatgtataca tatgtgtata tatgtatata tatatgtgtg tgtgtgtgtg tgtgtgtaca 51360
tatgtataca tacatatcta tacatatata tatatataca tatatatata catatacata 51420
tatatatata tacataaata tatatacata tacatacata catatatata tatatatata 51480
tatatatata tatatatata tacacataca tacatacata tacatatata catacacaca 51540
cacacataca cacatgtata cgtacatgta tgcatataca tgtatacgta catgtataca 51600
tatacatgta tacatacata tatagatata tatatacaca tatatgtata tatatatata 51660
tatatacaca tatataggtt atttggaacc taagaaactt gcaaagttac tagatgcaat 51720
gttcggaaac catggaccgt aacaactgga gtagtatttg ggtcatgaat tcatggctag 51780
atcatgaatt gagtgggagt caaccgaagt agggccagct cagacacttg tatttaggtc 51840
ccatgcttgc gtgcattctc ttccctgata tcctttggct ttgctgcctc aaatcctcga 51900
gctatcttat catcatcgca ttgagctcca taccttgctc tttcctaact gtcactgtcc 51960
ccatcaaacc tccggagatc ctctttcttc tccaatgttg agatttgttg gagtcttccc 52020
accttctcac ttcaatgggt ggcaatttca agtgccagtt cccttatttg tcccagctat 52080
attgacaatg gggcttattc tagggtttct catggacata gtgataataa taatcaaggg 52140
accaagagag aaaaatcttt ctagtctgtg ttctttaagt ttgagagata ggcagcacat 52200
ttttttaata agcctttttc actcatcgga tcctgatttt cagttgttcg acctgaacag 52260
ttcaagcaat tgaactgctt gggtcactat tttggacgat tttcagccat ttttaagtat 52320
tgtttgactg gatccacgct gcgtagtggg cattgcgttg atcaagtaga cctgtaaggg 52380
tcaacaaggt ctgagaacac tgaatggatg ctccataatc ctcttgttat ctgtcaacca 52440
tttggaatct tttaaaacaa catgtggtga taatatatat gataaactgt gatagattca 52500
tgtatagatt atacatatga aaatgtagag tgcttagtaa aagtgatgaa gagcaatgcg 52560
ttagaatgtg ctagcctttg acctaaaaat tggaatgccc aatgatgagt tatgataaaa 52620
ttgtgacgtg atttatgaag tctaatgttt agttggcttg cagtttcaga tgcgataaag 52680
aattttatga tttagctctt tggtttttta acatgcaaac atttaattgt actgaaaaac 52740
atttatttcg aaacatgtag gagactattg gatattgaaa ttaaaattga ctttttggtg 52800
tttcacaata tttcttaata aacactacga ctatgtaaat aggtggtgga tcaaagggaa 52860
agaaatgttt ggtgattatt tttagaaaag acaagaagta tttgataaat ggttattttt 52920
caaccgatta atgagagaat gactatgaac ctatgaggtg cacctcttat gatgttgcat 52980
ggatgaagca tctaatccat gggtacaatt tactaaaata taggcccaat tctgagacag 53040
gaacatttac aactcatgta caaagaagaa acttaaagta tcatggatgc cgggatattt 53100
ccttcttcaa atctttcaaa agctgtagtt ttcattataa ggaaaaatga ttataactaa 53160
catcttctat aggtgatgag tggacactag aaggctttcc tataataaca gtagagagag 53220
tagaaaagcc tgtcagcatg cggtccataa gtatatatac atattttcag cgcttaaagt 53280
aaattttctt gtaccaaaaa aagataaatt ttcaaaataa gaactaaaat caactgaaat 53340
gtttgaaatc tgattcgtag gtacatggag aagagtgtaa gacagcaaat atcataaagg 53400
cagaataaga gctggtaatc ttgtaacctg gcgcaactat gttatgcatg tctatatgtg 53460
tgcatgttta tgtataacaa gtaatatttc ttttcttatt tactcacttc agttaggaag 53520
tcaatccaat ctccctttgc ttgggtgtgt tcagattatc aagggccata acagtagtgc 53580
tggtaagcac ctgtttaatg gataaatggc gacaaattct ctccccttct gctcactcta 53640
ttatcatacc ttccgtctta cccatctgct atatcttata aggaacataa ggatcgacat 53700
agcttcatgc tatcacatta caagctaaga tcggaataat acctaatctt ttcgatctac 53760
tattaggtat tactataggg ttgtaaattg ggtttaggtt ttgaactata ttatattttg 53820
gtgtaagaat atagtgccac actatcttga accagactag ctgttgcact tttttgcagg 53880
catcaatatt ttgttcatcc aaaaaaaaat attgcacatg cacagatgaa gtatgagggc 53940
tgtaatcatg tgagaggaaa cacagatggt tgtgatccta taatgcttga agaatgtgat 54000
ccctctttta gttagtatac ctttcttgtt tttctccctg ataggaaata tgaaatgaag 54060
gtatatcttt atgaaaaaga tggatgcata gaatatacaa atataaattt atacaggata 54120
agagaaaggc ctccagcaat ttgcacaata atagtgaaaa aagattaaat aaattcccaa 54180
caatggcgcc aatatgtgat atgcaactat gagtaggctt tcctgttgca acaatcaata 54240
aatatgtcat gcgaggcttt taaggtagag cactaacatt ctaatctgaa ggcctaggta 54300
caattttgaa tttaggactt gtttggatga ctgagtacaa aatcccataa gaatcattga 54360
tttgggccaa cacaactacc tacatgaggc ttaacctagt ctaattttat aaataccaag 54420
ggaactatta tagtaggcca gcccaaatgc catagggaat aaaagatgaa gtatggaggt 54480
tttttttatt ccttatggga tttggactag tccactgcaa tgattcttta aatatttcta 54540
aataagtcta acctaacctc atttggacag ttgtattagt ccaaatccgt aatttccata 54600
gaattttggc tacagtcatc ccaggccctt aaatttaaaa gatcatattt aaaacatgct 54660
tgaattctag attttaatct gggcccttta acttccatag ttggtcttga aatagacagc 54720
ccagccccaa gctcatggcc ctactgtatc ttcgtttggc tgtgcccttt agtaggatgt 54780
cttaggtgtg tgaaaagcac ctgaatattt cccacacaat gtgttttttt ttcagtacaa 54840
accggctatc acaccattct aatatgagta cagtccagag aatcagaata caaaatatct 54900
cgtaaggccc aagggtagtc atcgccttca caccaagtcc agtctccgat atgcttcgca 54960
acaaaagagg cagcccaatc catggtgcta ttcgcctccc ggaatacatg ttggacaaac 55020
gacatattgg cgtgatgaag ggacttctag atatcataga acagtgaata ggtttttagg 55080
tgtttcacct tgtcctgaat ccaactaatg accatggccg agtcatcctc gataaagatc 55140
ctctccgctc gtagctcata tcttatgcag atgatgtccg cccaaacaac gtggagctct 55200
gccccatgaa cggatgggtc gaagatcttc tagcaaccaa aagcttgaca tctggatctc 55260
aaataatata gcccgcacca cccctaccat ctctgacact actatcaaag ttgaccttga 55320
caaactccaa ggatggagct tctcaagaaa tgaaaagagt cctcggagtc actgcaggca 55380
tagcaaggga gtcccagaaa ctcatggtgt caagggacgt ggtggcagta ctcctcagct 55440
aagcaacaag ctctccacca ctcgctacac aggcacaatc tcgattttaa aaatcaagct 55500
gtttctgtac agccaaatct gataggcggt gtacgccatc ctaatacccc aaggcaaccc 55560
ctcaaccata ttctgatgga ccgcatcccg aaaaggcaaa agccatgggc cactatcaac 55620
cttctagatt tggccccccg ccatcctcca aatcagatat gccctcgagc aatggagtaa 55680
ggcatactct attgactcat cctctagttc atagatcaag caagcagtag gaagctccgt 55740
gcttctgtct ttgagaagtg tctgagtagg tagtcgatcc caggcaacct tctagaggaa 55800
aagtctgatc ctagagtgga ctagccatgt gtatatatat atatatatat atgtatgtat 55860
gtatgtatgt atgtatgtat gtatgtacgt acatacatac atacacacac atacatacat 55920
atacatacat acatatacat acatacatan nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 55980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56040
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57360
nnntatatat atatagtata ctatatagta tatatatagt atatatagta tatatatata 57420
tatatatata tagtatatat atatatatat atatatatat gtgtgtgtgt gtgtgtgcgc 57480
gtgcgcgcac gcacgtgtgt atctcgatct gtgtgtgtgt ggtccatctt cacacttttc 57540
cctcaaaaaa accccccttg agattttgtt cagctgaaag gggttcataa aacttgccct 57600
tgcttggtcc tagggtttaa gatttatatg caatattcat taagacgtct aaatgtcata 57660
atattttgag gttacaaata ttaacaaaca gccttggata caaacctttt tctcaaagaa 57720
tcttgtatct gttcttcctc agatgacatg tgatttatgc tacggcctag ttctaaggac 57780
ttttctctgt cattaacata aaaaaaaaac agaaatatat tccttagtaa ggaaatagtt 57840
gtgcactatg attgctatgt ctctcaaaat tataccaaac tttttatgat atagagtgaa 57900
aatcaaatca gcatgtatgg tctatttgcc aaatagggtt gagcataggt cgggttcggt 57960
cgagttgaga gaaaaatttc atccgatcaa attcaatcgg attgaagaaa attcaatcca 58020
ctgccaatca ttcattatgc ataaactatc taaaactgaa atgaatagtt tgtagcagga 58080
tcaggtgtta tgtcagtttg gacttcaatg ttaacccaat attgatttta aatccaacat 58140
tggtccactt agacttattt atttattttt atcaatttaa tataaaaaag atctaaacct 58200
cataagtcat aaattttgga tttatttttg aacatgtaca aaataaaaca gaaaaaagaa 58260
aaaattactt atctaaaagt aactatatct gaaaactttc actttagaat tgtcttaaat 58320
taatgtactt ccatcaacaa ttcaatgtta atatttttat gaatccaaat ggatgataga 58380
gtatttttta gaatgaagta ttgaagtcta aatgacatcg tcccaaaata aaagtgaatt 58440
tatgaaatac tacatctgtc ggattcggtt tcatacggat taaaagtgta ggaatagaat 58500
ccgattataa ataattattt ttttataaat tctaattcaa ttttattcga tttatatttt 58560
ttaaccggtc aaaattaata tttattaagt aggattggat ggatttattc gtatctcgat 58620
tatttgctca gcccattgcc aaatctaaac tcttttcaga taggttccat gtgaacatga 58680
tacatgagat gcagtgtgat agtacacacc attgctaaga aaactttgga gtttgcgtaa 58740
caatatctgt ttaccattta aaaaatggca gttttgaatt ttaacacgct ctcctccaga 58800
ttcagcttat gaacttttcg aataaaaata cccctggact atttttccaa aaagtaccag 58860
catcttttga acttgaatgg aaattcggcc aataaaatgt tttcatttat tgaagaaata 58920
aacagggtaa cgcagtagct ctatttcctc tgcttttctt ttctatatta ataacatgat 58980
tattcatctc tctcggatca caaaaaaatt aagctattca agctttattt atatttcatt 59040
tttaaatttt ttacttaaat acaaaatctc ccatcccact actacggcag catgttttct 59100
atgtatgatt attttcattc aaatgatatc attttttata atttatattg tatgtaatta 59160
attcatttat agttcttaca ttttcctgtt tctagtagat acaataaagc ggttttggac 59220
tagtagcttg ttctctgtat cgaagtttaa ctaaagcttt gacaataata tatgaatcca 59280
tatcactggg taggagagga atatgttggg tataaaggat ttaaggaatt agatattttc 59340
atacaattgt attgcattgc agacagtaat tagattacta tgcaattatt ctctctctcc 59400
atgtttgttg cagttgaaga actctaatga agctcacaaa aatttactgc atgaacttgt 59460
aagtggaatt agacgactcc gttgtcctcc attttctttt attttcttta aaatcatctg 59520
ccattcaaat agacagaaaa aaaaggattg attagctatt ggatgcctct tgaattcagg 59580
aaatgaagga cgagcaccca gtttatggtt ttgtggatga tgaccctagc aactacgcag 59640
gtgcactggc tcttgccaat ggggcttccc acatgtatgc tttccgtgtt cagccgagcc 59700
agccgaatct ccatcgaatg gggtttggct cccatgacct gcgccttgct tgattttatt 59760
gtagcttaaa gaccttacaa cttccagagt ggtgttatat attagtatct taagctatat 59820
gacagtggta agcctctcta tccgctactt gttatccttt aggtactttg catgtggtgc 59880
aaggttataa ttgccttgtg tttctattgt cttcctcatg gtacttactg gactgatgat 59940
gtcaagtgaa atggagttgt ttgaatcctg actgaaattt ctcttggtcc atcaagtgca 60000
agagtaagtt tagacatcac ttgcaagctt ttgctaggaa ataagtagtt tcattgcact 60060
aatgatttcg aatttttgtt ttcgggttag agaaacctag attaatgctg ttattggatg 60120
ctggcagtca gatgaagatt atgtttgatt gtacctcgtt ggacagatgc tcatgcgtag 60180
atccataact ctatttcatt tcatttccct gtacacaatt gaaacagggc atatatgaat 60240
aggtatagaa cagatgattc ctgcaatatt ggaggtggct agctcagctt agactaaagt 60300
tggtctagct gggatattct gaacacctga gatgttcaaa taatgtggga taacttggcc 60360
caactcaact aaacattggc tcaaagcata gtcaaggtaa agcttgagca agctcttttg 60420
agcttggttc gagtccgagc tgagcccggg ccgcttgttt agctgatgaa ctgaattcaa 60480
atagccggta ctcagcttgg ctccactcga ttcatgagtt cgaatcccct caagttcaac 60540
ctcgaacttg acggtgtagt cccacaacca tggccacctc ataatgtggg acggccatta 60600
tgcattcctc tagtgcctgc tccatatgac ttttgttctc attataccat gcacctaaat 60660
gagtgctcat agtgacaatg tttagcctcc acgtataatg tgtgccagct aactagaagc 60720
ctaaactttg gtgaaatttc tgcaatgttg tggttgtaaa acgctcctac gttgagacat 60780
gatggtatct aagattatag acaaactatc atgctgaatc aacccaaatc caaggtgaat 60840
aaaacttgat acaaagccga gctccattgc aatagtacaa tggattctgc acttgaagaa 60900
cattacaaaa tcattttttc ccaaaaagaa acattgcgaa cagaccaaag cgtaaagaaa 60960
ttacatgatt caactaattc aagctttcca tgatgtaggc actcgctaga tgtagtaggg 61020
tgataacttg ctttgtgagg gtggatcata agcttaacct caatctatcc caatctatcc 61080
tttcccttga cctatccatg ccaatctagg ccatttctgc ataaatataa cttaatccca 61140
gtggatccgg cctagtttca ctcactccaa cacattccta ctcaatggta gccaatcctt 61200
tctttagccc tcaaatataa tcctaatcta gcatagccaa ccatcaatca tgcctaataa 61260
agcccgacta caccaacccg atcattcctg atcgtacaca atcaagactt atcctaattg 61320
atcctagctt tttttaggcc tctcttatag aacctgtgcc aattctggac aagctaatcc 61380
aatcttagca gccaaaaata ttacatgttt aattagccaa atcgaaccta tcataaaccc 61440
aatatataat cggaccatac caagatcatc atcctatatt tccttctctt gttataacta 61500
cacctaaaaa ggaatttctt catacttatg aggggtatat tatgataaaa attccttcat 61560
tttagccctc catccttgtc tatttttggg accactagcc aagtaacacc ttaagagccc 61620
tccatcttaa tattccctct aactagctcg atttcttctt cattctttct ttgcgatgtg 61680
tcccctccaa tttaattctt acatgttggg atttgagtac tgaaaaataa tagataaaga 61740
gaaagtaaaa actatgctaa tgataatacc aaaggcataa agaaatcaca gcagtcgcaa 61800
aaacatcaaa tttttttatg gttcggccta agcctatatc tacataggga cgagagtaag 61860
aagaagcttc cactataata atagtttaga gtacaaaaac ttctctgaca ccatgtaggg 61920
aacatcgctt ctaatacaag aaagaagaaa tccaagatta aacaaacctc tagaaaaatt 61980
cttctcgatg gaataactct aatctgagat tgaacaatct tctccaatcg atgatctcca 62040
atcttctttt cttaaatgaa gcacccttca agcctctctt cttttctctc ttcctatcct 62100
cttttgtggc tcacaacctc ctctcctttt tatgttctat gttcctcaca tcacatccac 62160
agactcattt ttatagataa aaaattagag tctatttcgg actccttttc cacacacaag 62220
atggcttccc acgccattgg ttccgtgcgc atgacttttt tcatgccaca aaggattccg 62280
tgctgcaaaa gttttccata tccatgcagt ttccacacac cacaaaaact ttcgcacact 62340
tctcgaaggc ttttcatgct cgaccctttt tggttttcaa ttaaattgat ggatcccata 62400
tgaggaggga ccacaccaat aaatctcctc cttctaactc atatggtagg ttccatcaag 62460
cctgtagcac ctttgcattt tatcagtttt gttcctgaag ccggcttcat caatatatta 62520
gaactatttt cttcagtgtc aactttttta agcttgaacc acttcatctc tagcatattg 62580
acatgctttt ggaaagtatg tcaaattgct caaaattaat cttacggttc tctttttcgt 62640
tagattctag tgcatattac gcactttaac ataagatcta aggaaggaag aggactgagg 62700
taaggtgaag tgattttttt ttgagttggt aatggtacaa aagttatact agaccgtggg 62760
tacctaatct cggagattac catttagatt tggttcttga tcatttgtat agtgatgcat 62820
ttaaaaaatt atttgagcaa aacagtgaat gccattgggt ctgagagatc caaaatcaaa 62880
taacctaaag tatatagatg gttcctttag ctaggtcatg tatgagaaaa aatgatctgc 62940
cgactggaga aaatagatct ttgagctcat tgactgttaa gtcatatcta gtctgtgaat 63000
catctctttg aggattaatg atcaagctat cctttatggg ttaaaagaat aggatcactg 63060
aaatacttat cctagtatac atataatgtg catggcctat ttgatgagtc agactagaag 63120
gttatcacta cttcatcacc tttactgatg agcaatcatg atatggatat gtatgtgaga 63180
tacaaatcta aaagattttg aatggttcaa agaattcaga tatgaagtag aaaagataaa 63240
tcaaaaaatt tttaaaggta cttgatcgga tctagaatgc aataccaaat aaaaaatttg 63300
ttgattatct aaaaaaagtg atatagtttc atgatggaat tcttcttgta cacctcagct 63360
caacggtata tatatgagga gcaatagcac tatatgagat atggtccggt ccatcatgaa 63420
tatcactaat ttaattatta tttatttaag agcaagattt aatttttaaa atttaaatta 63480
gattttttct aaaattggtt tcaccgcacc atatgagata tgatttggtg gataagttag 63540
aggatagatc tgtgagaact catttatagg gtatcccaaa aggtatttaa aatattactt 63600
tttctttcca gtagttgaca atatgattgt gagcaatcat actgttttct taaaaatagt 63660
ggaaggatga actcaaaaag aaagtctcta aagaacaacg agtcacaaga cctatacaac 63720
ctatttaaga tgagccagta tatgtagtac ttccttcacc tcatcaattt agtaggatct 63780
cctatctttt agaaagatac tcggtattct tacaaaggat ttagagaaag tgtttcttga 63840
gggagattga gaatataggg atgatctcaa aacctacaat gacataatat aaggaatcat 63900
gtagttacat gaaggtcagt gggagggttc catactgaca tcgattatga tgtggttaca 63960
tatagaattt ttttttcaaa gatctagatc aaacattctg aaaataaaag gtctatagag 64020
ataaatccga aaaggatgtt tgannnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64980
nnnnnnnnnn nnnnnnnnnn nnactatgta tgttggctat gtaggttccg attcgctgtt 65040
tggaatatga tatacctaga tgaaatctat cgatcttgat agaaaaagag aagtcctatg 65100
tgattcgtaa gactgagttc agaaaaatct ctgaccagag taagtgtgaa tattgaaaaa 65160
ttttttttac gaaattcaca aatgaactcg agtcgagcca atgtagcata tgactgatga 65220
tagagtttga cgagttctca atgacctccg tcaaattggg actctcgata gagggattgt 65280
atcacacgat aactgcacct agggattcac ttttctattt tgctagcttg ccactatatg 65340
ttgctagacg tcactggtgg atcgtgagaa ctcactaaaa tcattttcgg atcaacgatc 65400
tttgctgagg taagttggaa tcgtttcagt ccatcgaaaa gagtttcgat gatactgtga 65460
tggagatcac gatatgtctc actatcaaac agaatagaac ctgaggagtc acatacaaaa 65520
agagcttaac ctgatcaatg gcttggatta tatttgaatt atcaattaga ttgatagttt 65580
gaatattaga aactgctaat ttgtaaccgt tacagttttg acaactacta attgttagcg 65640
caaggactta attgcaagta ttataatttt tttgaggctg attaaattat aaattaaatt 65700
ttaattaatt taattcagat ttaatttaat tagacttaat ttaatttaat attaattgga 65760
ttcaattatc caaatcagat ttggatttca agcctgattg gatcaggctt gacagccttt 65820
tcgaatttgg ctcattttag actcgatttg aatccgtttg aggttctatt tggatcagat 65880
aaaccatgac ttagagagct caagtttttt gggactctct ttagaaatca tgtcaaaagg 65940
agaagtagag cnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66600
nnnnnnnnnn nnnnnnnnnn nnnnnnnccc catcgaaaag agtttcgatg atactgtgat 66660
ggagatcacg atatgtctca ctatcaaaca gaatagaacc tgaggagtca tatacaaaag 66720
gagcttaacc tgatcaatgg cttggattat atttgaatta tcaattagat tgatagtttg 66780
aatattagaa actgctaatt tgtaaccgtt acagttttga caactactaa ttgttagcgc 66840
aaggacttaa ttgcaagtat tgtatttttt ttgaggctga ttaaattata aattaaattt 66900
taattaattt aattcagatt taatttaatt agacttaatt taatttaata ttaattaggt 66960
tcaattatcc aaatcagatt tggatttcaa gcctgattgg atcaggcttg acagtctttt 67020
cgaatttggc tcattttaga ctcgatttga atccgtttga ggttctattt ggatcagatg 67080
aaccatgact tagagagctc aagttttttg ggactctctc tagaaatcat gtcaaaagga 67140
gaagtagagt attatttttt tcatccttct ttcttcacac gcatgaaagg agagggggca 67200
ccaatagttg gtgccctgcc ttatctggat gtctttttca tccaattttt tttttaattg 67260
aatttgattt aaaatagaat agaaatatct tagattaagg tatagaagta ctttttttat 67320
gtgataaaaa aaatagagaa agaggacgtg cgctaattat tggcgtgaga catctttcct 67380
tctttcttcc cttatctcaa cgcacatcta tcctttgatt tgtttttgaa caccttggat 67440
taaaagagat gagatctctt gggcattaag aaggagttgt gcgtgggatt tgagatgtgg 67500
tgcgacaaaa aattaaaaga ggatgcatga agggaggtgg cgtgcgttag atgcgagagg 67560
cttctttctt acatctttct ctcctcccca atgcctcttc cttccttctc cacttcacgt 67620
ccatgcccag attcaataaa gatcagatct aagaaaagaa aagagagaga aaaagagaag 67680
aagaagggtt cttcttttct tcatggtgat ctggtataga tcctgttgga tttgtgcgaa 67740
agagtttgag caacgatctg cttctttaag atctgaaaga aaagatcaag atccatggat 67800
gaagagtgag atctgcaagg tgctagcaca ccagtgatct cggtgctccg atcaaatggc 67860
tccgtgtgga tatcagctga ggtcgaacgc gtgcatggct acgatcagaa tctgcgatat 67920
ctgcaggatc cgagatatgg agattcgatc tccattttat ttttctaaca gtttattttt 67980
ctatttcaga tatcagatcg tgggtacata tttgtatcaa gatctttact atggttttca 68040
gatctgattt gatacgtaaa taaattaaaa ttattttaat ttatttattt tcactgtgta 68100
gatgtctaga aaaaatttta aactacacgt acgaaatcga agcattttct aacaactctg 68160
actatcacca tagacgacgt atatctcttg cttcccacca aacttcttta ataagttctt 68220
tagccatagc atttctttat cgacctttgt tatggtgatg tattcaacct ccatcgacga 68280
taatgtgaca cttttatgac tttgattgcc acaacaccgc tccctctgag aatatcatca 68340
gataatctga cgtggatttc tgtatgtcca catcatcgat catgtccgta tctgtgtaag 68400
cctgtagcat aggatctcca ctatcatggc ataaatatat cctggatatc tatttaagat 68460
atcttatttt ccacttcatt gctttccggt gctcctttcc aaagtttgaa agaaaccgat 68520
tgaccatacc atccacttga gcaatattag acctggtgta caccatagca tacataagac 68580
tccccaccac ttagtccttc tcactctttc tgctttgctc tttaatcaat gtaaagtgtc 68640
ctacaagcag acaccaccgg cttcactcta ctcatgttga atcaatccag caccttctca 68700
acataggcct cctatgacaa ccataggacc tggatctcct atctctagca attcttatcc 68760
ttaatatcat tttgacctat cccaagtctt ccgtcataaa tgttcgatcc aactttacct 68820
tcaaatcatt gattttggta atgtggcatc ccacaatcag catgtcatca acatatagca 68880
aaaatttgat aaaattattg tcaaaatatt ttttcatgaa catgcaatgg tcagaactta 68940
ctttcttata tccattctcc attatgatgg aatcaaactt cttgtactac tatcatggtg 69000
cctgcttcag ttcataaaga tttttcttca agcaacacac tatgttctca ttaacctttc 69060
atttcaaact cttctagtta ctctatatat tctcctcctc caagtcgcca tgaaggaatg 69120
ccatcttcac atcaaattgt tccacctcaa catctaaaca gccagcgaga tcgaggataa 69180
ctcgagtaga cgtgagcttt acaacgattg agaaaatctc ttcaaaatcg atactttttc 69240
tctgaccaaa atctttcaca actaatctca tcttgtacct tggttataaa ctattctcct 69300
atggcttcaa tctgaacatc tatttatttt tgagtgcttg ctttttctta ggtatattca 69360
ccaactcata tgtattattt ttctataaag aattcatctc ctctttcatt gccttcatcc 69420
actcctcact atgctggagc tctatggctt cagagtagga ctcaagctct tccacatctg 69480
ttaatagcac ataatcctat ggtggatatc ttatggatgg cgtccactct cttgtgaatc 69540
tctggacctc ttatgcaggt ggttcaacat gcaactcaat ttgaacacca tccgcactct 69600
cctcagcctc atgactatca tatgtaccgt catctgtagt tgctctcctg ttatcaagac 69660
ttctcgaaga ggtatctggg cataagtcta tagggctgct cggggttgac ttcggcttct 69720
taggcttctt aaaatcatcg atcgtctgat cctccaaaaa aataatgtca tagttgcaca 69780
cgatcttcca ctccatagaa tcccacaatc gatagttgaa ctctccgtcc tcactatagc 69840
tcaggaatat gcactgcttc accttgacat ctagtttgga tctctcatct ttaggaatat 69900
gcacgaatgt cctgcatcca aagattttca aataatcata agaaatatct ttctccaaca 69960
atattctcta tagtgtatca cacttaagag tataagaaaa aaaaagatta atgctatgga 70020
tcacagtcat caatgcctcc ctccagaatg ccttcgatag tttagcataa gagcgcatgc 70080
tcccgatcct ctcgcaaatc atcctgttca ccctctcaac aatctcattt tgttgtggca 70140
tcttaggcac tgtcttctct agtctgatgc catttcattg atagtatttt ttgaaagaac 70200
ccctgtattc acccctgttg tccgtccaaa tatacttcag cttttgccca gtctttcttt 70260
caacagagat gtcaaattac ttgaatatta tcgagcactt gatccttcat ttttaaaata 70320
tatgtccaaa ttttttagaa gtgatcatca ataaaagtca tgaagtaaga acatccataa 70380
aaaattttat cactcagaga acaaacatca ctgtgaataa gatctaatgc accaattttt 70440
cttttagaaa aaaattctaa aaagaaactt ggatttgctt acccatcaag caactttcat 70500
atatcttcaa tccaaaacta tgaataggaa gagcattctt cttagtcaaa attgacattc 70560
ctttttggct tatatgtccc agtcgtcaat gccataattc taaggtagaa gattcttcca 70620
ctacattcac ctccccttta ccgagcttgg cttgtatgaa gtagagaaag ccttgcttga 70680
tacttttggc tactactagc gattttttgg ttagcttcta tttgctgtct ccaaatatat 70740
tgtagtagtc ctcctcatct aataccccta tcgataacaa gttcagatga atatctagta 70800
catgtcgaat atttttcaaa aatagcctgt accccaagct cgtgatcagc ataatatctc 70860
caatatcaag gatttttaat tctccatcat tctccatctt tattgtccca aagttactga 70920
aatgacaaga tgagaataat tttcacctca ctgtaacatg atacgaagtg gccaaatcga 70980
tcacccagat agagtctcaa ccaatagtac ttgcaagatc atcatttgtt gtgccacaag 71040
caacgatcat ctctccatcc gtagctactg ctatcatctt attgttcgag ctggagtcat 71100
cacttgatta ttttttgact tctccttttt tagtaatcgg tagtctttct taaagtgatc 71160
ctttttgccg tagttgtaat atctatcact tcgagacttg gatctcttcc gtaatttagt 71220
ggggccatca ttcaagttag attgggagtc cttgtgcttg tttcttccct ttctttctat 71280
gatgagagcc tcatggtggc tcgagacacc ttgctccttt ctcctagcct cctcattaag 71340
catatagtct ttcaccattg ccaaggctat cgaactatct ggtgaagaat tgcttagaga 71400
caccaccaaa gtctcctaac tatcgagtaa gaaacttaac aatagtaaag cctagagctc 71460
ctcatctaac agcatcttca tcacagtaag ctggttcacc acgttctaaa agttgcttag 71520
atgctccacc atataagctc cctccttata tttcatattt atcagtttgt gaattaggaa 71580
caccttgttc tataccatct ctcttgtata gactttttag tttcaaccaa aggccatgag 71640
cattaacctc cattgaaata tggtggaaga tgctatcatc aatccactgt tggataatcc 71700
caacgatttt atgattcaat ttctcccatt ctttatttga catcttatca aactgaataa 71760
taacatcctc gattggatca tgaaaatctt agcagtaaag gaggtcttcc atgtaaggat 71820
tccagattga gtagttagtt aatgtcagct tgatcgtagt gcccgacgaa gattggttct 71880
ccatctatta gcatcttaat ttctttttga atactttaga ttttgtaaaa tttggctctg 71940
ataccactta ttgggatttg agtactaaaa gataatagaa aaagcaaaag caaaaatcac 72000
gccaacgata ataccaaagg cacaaagaat catagcaatc gcaagagcac tagaattttt 72060
tatggctcga tcaaagtcta tgtctgcaca gggatgaaaa taaaaagaaa cttttactat 72120
aataatagtt tagagtataa aaacttctct gacactacgc cgacaatact acttctaata 72180
caagaaagaa gaaattcaag attaaacaaa cctccagaag aatccttttt gatggaatat 72240
gaaagaataa tattctacaa gtcaatcgca tgagtaatgc aataagatat tgttctatat 72300
tttatcttcc aaattcatat atttgatatt aattattaat aaaattagat attttatttc 72360
attatatgct gcattttaat acttgtttaa aattataatg aactccatag gttaggacaa 72420
taattttaag gtcatgatga gatcatacca gtgagattta aatctttgat aaccttaatc 72480
taaaatattc tcaatagtag gatcattaag tcaaaaatca atgatactga taaaactggt 72540
acatcctata tattctcgac agagagggtg gttgatgtca taatcacttg tgtggagaca 72600
ctaatacgaa gatgtggtgc tcattagaga ataagttcat tgaatttact gatcgagaga 72660
atatatgatg caagtgatcc tttgacctaa gatcaccatg gtgccttgta tatatgaatc 72720
tatgttttgg ttcattcttt agcttcattt tttgagcctt gtgtggggtg ctccggacat 72780
ggtgcagtat gtatggaggt tgtgagtggt caacaaaaaa tcaatcactc cttgtaaaag 72840
gagcgaatat cttatgtgat cttataggtt gatccaaaaa atctttgacc aaagcagaat 72900
gataattaga aagagttttt aatatatcat taactgaatc aatatcttct gatcgagata 72960
catataaata agtatttgaa tttgacatga ttttatatcc ataactaatc tgaaatattg 73020
tatgattgaa gaattgaatt gtacaatttt ttaccattga aaaaaatttt tgatattttt 73080
tttcaaattt aatatctttt tgatagtcat gacatgttgc tagacatcaa tcttgacttg 73140
tgggctcaca aaaattaaaa agattttatt tgaaagttaa ttagaaagta ttctgattaa 73200
ttgatgtatt tggactgacc taatctaatt ggattgattt aggtcatgag cttgagccca 73260
ctgctggcta gatgatcgct gtcgtaggca gtcaagaata aaaatcaact caaactatat 73320
agatagggtg agtagggatc atttctatgg agatctagga tgattatctt tttttttaag 73380
aaaaaataaa aagagaattg attgtagaag aattaaaaga aatagaatag caagaattaa 73440
attaaaagta tgaattaatt tatgaaaaaa aataagtcag agaaataact cagaaatttt 73500
gaatccacca tgcaaattag atttattttc ttcttttttt tatgttgcaa cattaattct 73560
tgtgattaag gtattagtat agcttatctc taagagatac ggactgtatc agtagattac 73620
aactcgtcct gttgaagtat aaactatcta aattcaatta caaaatataa gattcaatct 73680
aacatactac gatctatctc tccaaagcac gtatcgtatc tagggatcac gatacgtcaa 73740
tagagggtat aagccgtgta ggctggatca atacctcaaa aaaaaataaa aagatatgaa 73800
ataaaagtat aattttatta cataaaaatt taatataaaa aaaaaccgtt tacaggcttt 73860
atcatatttc tggattgaag agatttagcc acgcatcaag ctctctagct ccataatctc 73920
tcaataattg atccctaaag ctctttaatt ttttttttta ttattttttt gttttttctt 73980
taattttttt ctcttcttat ttttgctgcc atctgctgcc tctgttttct ctgctcctgc 74040
tgcctccttt tatagagcac agcttcttcg aattataagc atctatggac tttcaattcc 74100
cactatcttt tattttgatt gggattttaa aactttatcc gcatcccagc atcttgtttc 74160
acgcgagatc ctagcgtcca catgtgtttt gaattcctta tgggccacag accatttaaa 74220
ccaccaaaga ccactttact attttgattt gaatcccatg gaagccggct gcctctggtc 74280
tcattcaccc ttccagtgct tcacatgggt cccattaatt tgaattccta tgagccacat 74340
ccaagctttt gaatccaagc cttccttatt ttttaaatca attaaaactt tgctttaaat 74400
gccttgtaga ccctcctatt tgcatgctac gtgagaacat tgttaagctc ctcttggccc 74460
acttaagaac ttctatgggc tacatgcttt tggctagctt taaaatggtt ttgggcctaa 74520
ctttggatca ccattcgaag tccattttga attcaattta tttttatttt tttttttaac 74580
ctacaaatcg agctctttta ttggtgatca tttttcctat aaaacaaaaa caaaaagcat 74640
caagtcttaa gaaataaaag ttaattaata tatattttga tacttttatt gggatattta 74700
atgtacttat cactagatat gaaatccaat gggtcacaca ctttgaaatt tgatcttagt 74760
ctaatctaac taggatttat tataaatctt atgggttaaa tttacatgct agcacatgaa 74820
ttaactcaag ttttcaattg gatttagttc taaggtgttt gagctaaccc tatcctgata 74880
ccttaaacct aattagatta gatttgaacc tatggttttc ttgatgcctt atgcttatta 74940
catgaaagag tttcatgtga cttaaattcc tccatgccac cacatcttca tccatgccaa 75000
attaatatgg aacaccccat ttaattgtgc atttaagaag gaatagtcct tcttaaacac 75060
tcctcttaat ttcccacact ttcctttgtt ctacacacca tcaaatggct tttggaaata 75120
tgcgggcgca gaagtggagg tgtcctatat gaaggctctt ccacattata agttatcaca 75180
tggtgaatta aattattgtg tgagaaaatc atgcgccaag agttggcacc ccttgggagt 75240
tttaggcact ccttcttatc ctataaataa ggggcacccc atatggataa atacaaggga 75300
attcaagttt aggcatgaga ttgagaggag aaaaagacac aaaaatctga aaaaaagata 75360
agaaaaaaaa agagagaaaa atagaaagaa aagacgagag aaaacgaaag gcaagggttg 75420
ctaatcctag ggttcaattt ttcaatagtt ggatttctga atcaatttgg ggtggtgaga 75480
ttttttgaga aaaagtttct gatgtggccc tagtagaaga ttgaaggcat tcagatgatg 75540
gtgcaatccg tttttgaaaa agaaaagtga gtagtatact tgtgaagaaa gctgcaacac 75600
tacatcaaat tggaaaggac cttgatcaaa cccatatgga tcaccgttgc aggatatcta 75660
ctttggtatc ttgtgaaggt tatttttttt atcagatcat catcttcaaa aaggtataat 75720
tttctaccta atatgcatgc ttgatttgtt tgattaaaat ctataaagtg ttcataaggt 75780
ttgtgttctg attgtattgt tttaagtatt aaaacttact ttaaaaatat aaaaaaattt 75840
gaaaactatc ttctactgtg caactaaaat ccaacagaat aaccctaata tgagattgag 75900
cgatctccgt caaccgatgt tctctgatct tcttttcttg aatgaagcct cttcaagcct 75960
ttcttcttct ctctctctcc ctatcttctt ttgtggccca cggcctcctc ttctttttat 76020
gttttgtatt tctcatgtca catccataaa ctccctttta tagataaaaa attagagtcc 76080
attttggact ccttttccat gcttcccacg ccattggttc tgtgcacacg actttttcca 76140
tgctacaaaa gtttttcatg tctcacgtag tttccatgcg ccataaaatt ttgcatactt 76200
ctccaagact ttttatgctc gacccttttt ggttttcatt taaatcagtg ggtcccatat 76260
gacgagggat cacaccaaca tcatatgctc tcctcaccat accaaatggt atccccaact 76320
ataagacaaa acattcatca agttgctaac agggttgaag atcagcattc actatagaaa 76380
ttttgttttt ttgctaacag acgaaaagca tcaccaaagg catcaaaacc attggcatag 76440
accctggggt gttttaccga cagacacaaa aagcatcaaa aaatatccct atcagcaaag 76500
agttttgctg atgctttttt tttcatcacc ctttatcgat acttttttac tcgtcgataa 76560
atcatcgaca taactctcaa aaaattgatg atccctattg aatgtcagca taactctaaa 76620
gcctttagtc atgcctgact aaaccatcag caaaaggctt atttttagtg atacctgagc 76680
agtctattac gaaaaatctg aataatatgc tagcaatttt attgtaaatg cacaggagtt 76740
tcatgcatac atttcaaaaa tttttaataa aaaaatatta gattaaatta tttaatctac 76800
aaatgcatgt ataagatctg accttaaaac tactataaat ggatcgatga catgaattta 76860
tatacataaa aatctgaatc taaaatgaca agcatatgaa ccaaaaacag catttagtaa 76920
tagatctaat ctaccacttc tagaattccg aatccaatac ctaagtgtgg gtagttgaac 76980
tccatgatca aaaatgtaga tctgaaaatc ttctctggtc gctcatagcc gcacaagcat 77040
ccgacctcta cggatggttc acacgaagct cctcggacct atcagctctc tgcgggagtg 77100
ctagcttgtg cagtcagttt ctgatggtag attgacttga tctccttctt cgattatctc 77160
gaaccttttt aatgttgaag atggatcaga ggaagatgtt ggatggtaga gaaaaaatag 77220
atgaagactc tcttctcttt gatttttttc ttacccaaaa atctgaaaca gttctaggtc 77280
tctcacccga gaggagaatg gtctcttctt ttgttcatgc caaggaagaa agaaaaccac 77340
ccaaacctta caccccaaag aaaaattttg gcccctcttt ctctctagta tcacacaatg 77400
aaaagttctc tcttgttggc acacaaaatt atggtcattt tatggttgtc gcacaaacca 77460
ggtaagacag gataagagcc agagtttgtt gcaattcaaa ccattttaaa tttcaattta 77520
tcttcaactt tttctcactc ttatctgact taaagagaga cttataagag aaaattgggt 77580
ataaaaaacc atcagaaaga cttccttttc ttacacacaa taggcccctt caaaaataac 77640
caacgtgtgg aaggatatgg ataaggtttt aggttgaaat tcaaatcatt ttgaattcaa 77700
atcaaaatca atcaattcct atccttaatg gatgataaaa gaagggttat cttctaattt 77760
tatcatacat aaactaattt tgtacggtga gaaaagacgt aagataattt gggtggtgca 77820
agggagagag tcccattcat ttaggactct agggtttaac caattgaatt ttttttcaaa 77880
cccaatccaa ttagatccaa ttaaaatatg atgaacctaa tctaattagg ctcctataat 77940
ctttattaaa tttaatcaat caataaatta attgagccat agacctgatc aaattaggat 78000
catttctctt ttaccgatta ggtcatctca taacctaatc agacttgacc tgattgaatc 78060
caattcaatc aaacttgata cagacttcaa tgctcaatca aattaagcta attagtgatc 78120
tattcactaa ttaatcttct attaatgata gtgatccaga ctcttctcta gagtctccgt 78180
ccagtgggac tctccagcag agtcccaatc tagtgggact cttcaccaga gtctccattc 78240
attgggactc ttcagattag ccatgtgatt ggagagaaac ttttaatgtg aatccatcat 78300
ccacatttta tgtgaatgac a 78321
<210> 2
<211> 15569
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (11900)..(12834)
<223> n is a, c, g, or t
<400> 2
actacatttt aacaccaagc tcgataatag tgataaagaa acatctagat cagctttata 60
atcaaaaatt ttgacttaca attttacgtg tgtctcaaaa tcttgaataa atataaataa 120
gatcttttat cttgatccaa aaatagtaat caaggatttc attagtaact tcaacaacaa 180
tggtaaaaaa attttctatc cattgataaa cccaaatttt gaattgaagt ttcatgcata 240
ccatatagcc tttaataaga tctattattt ggatctaaag atagtaatta aaattgttaa 300
tgattccact aagatgaata ctttacaatc tcataattaa tttcttcaat aaaaatagac 360
ttcttgataa tgtctccaat tgtatatttt tttttatttc tacaagaaaa cttcatacat 420
tttttacgtt ccaatataaa tcttaaaaag ttattccaat caaatatcat aaaagatctt 480
cttagtccaa ccttaaataa cttttatgaa tgaatcttta tcttgccact aaataatgaa 540
ttttaaaatc aagagcaaca tcacagcatt ctgtcatgtc aaatttgtgt tagatgtatg 600
tcctagaaat caattagatt gacaatgtaa attttttaag gatataattt atatattttg 660
atttattaat aaaataaaat ttaaattaat ttttattcat atttttttat ctatgaatca 720
tctaaagaat taataagatg atgatacata ttcttaagag ttcaaaattt gaaatatatg 780
tcattgatga ttaatttctg aatacttttg aattcttaag agtttagaag atcttgaccc 840
aagtagtgtg aatagtgaaa aaaagttttc acatacttca catcaaaaat ttaagttgaa 900
taaattgtac atatgacagg tattatagtt tgacgagtaa tctataacct ctatcttatc 960
aaaattctga tagaaagatt gtattgtatg ataactgtac ttagaggttc accttttatt 1020
ttactggatt accactacat gttgctagat gtcactggtg gattgtgaga tctacgaaga 1080
ttatcttgat gatcgataat tctcattgaa aagattgaaa ctattttaat gatgttgtga 1140
tagagatcat aatatatctt attatcagac agaatagaat tctatgggat catacacaat 1200
aggagattaa gactgatcaa atagttgaat gatgattaag aatcattacg gagttcagat 1260
tatcaatata attgataatt agactaactt ataattgtta caagtagcaa ggacttaact 1320
gctaaaggtt aataggttca aaaagaactt atgtataaat gttgtgcatc ttaatttgat 1380
tggatcaaat tagttatggc tgaattcaag atgaatcaaa taggaatttg gttcaattga 1440
atttgggtca agctttaggc ttaggtcaca tatacccaaa atcatttgga tgcatcaggt 1500
gtgtgacacc tgaatcaggc ctttctaaac tattttgagt aagtttgatc aagtcaaaag 1560
gatccacacc ctaaggtttc ttgaataaaa ccttaggcac cacattgagg acctatagga 1620
aactttgacc ctctctcata tggggtggca cactgaggtt ttataaaaac cttaggcacc 1680
cattttagcc ataaaaaaaa agctccaagg gatggggcag tagccatgaa gaatccttgg 1740
ctgtcaggac tctattcaaa agagttctca aggttttgga ctcttatgga gccctaggat 1800
ttgtttgcct ataaatagat ggccacccca aggctttaga taatgttaga gacttgtgaa 1860
gctctcccct ttctcttggt tgccggccca ccctctctcc tctctcttcc atgccccaag 1920
acttctttct tgtctccatc atcttgctga aatttagatt tcagcaagaa aagtcaagta 1980
gaagtcaaag ttctaatgta gctcacaaga tgttgagaac ttcctccatc tggcaaaggt 2040
tctgcaagag agctagcatc ctgagaaaca aaaagattgc tgatcagccc tcatctccat 2100
atggatattt gtagagatca gatgcatgca tagctagaag agaatcttat cacgatcatc 2160
actcgtgaag atcatctacc tgtgcaaagg tatgagataa gaaaaatatt ttttttatca 2220
taattcatga atcctttgct tatattatac tgagattctt ggaatggatt ttttctctag 2280
taaaactcta gagatcagat ctcgaagtct tcttcatata aaggttttga aagttcttta 2340
tattttcgct gctttgattc aaaataaatt agatctattt tgcctttcaa cctttctcat 2400
atttattgac atataaagct ttaattaatg agattaatga aaagcatgtg cgaaatactg 2460
agaaaatcct aacagtgata tcagagctac ttttgtacat aagaaaagga ttcaagttaa 2520
ataaaatctg tttgatttaa gtaaatgaat caatcaaaat ttatcctaac ataagtttgt 2580
cctggtataa tggtcaagac cattatgttg aaaggttatc ctaggacaaa aagtctaagt 2640
aaaatctatt ttatttaagt aaatgaatca attaaagttt attctaatat aagattgcct 2700
tagcataatg gtgaagaccc ttatgttgaa aggttgtcct aggatggaaa gtgattgatg 2760
agacaaatat atcatgaaag tatttttcac agatggaata aaatatatat attttgtttg 2820
tgaaaatgag atttcatgaa tgtgtttgtc attcaatatg tgtggtgatc atcttgaatt 2880
gccacaaatc ctttttggat tagggttgta tcatgactca caaatcctga tggtttgcaa 2940
aattttgcat tctgtagtga tagaaaccaa aagttaatcc agttttggaa taagattgat 3000
caattggtat ctaaggcaag tattttataa tggtggttac ttaattagtt ataaaagtac 3060
gaagagtctc ctaccaatct tacacttatc tagccaattt ggttgattga attctgaatt 3120
tgggttgctt aagtgttaag ttcactacaa atatattgca accatgattc cgacttagtc 3180
aaccaagcct agatctcttg aatagattca tgttaattat ggatttacat aggatataaa 3240
taaataatta aaacttgaag agatctaaat gaaaccttct cgtacatatt aaatcgaatg 3300
atcttccatc attgtagata tacggatact ctactgatgt tgatgatttt cgactagata 3360
tagtactttg gttgcatcga aaaagtacaa ccactttata acatgagatg ttgcagggta 3420
gagatggggt tgggcccaat aattgttagg tgaggatcca aatgatggct gcacttgcgt 3480
gtgaatggcg agtctgactt aattaagaaa tagagctaat aactattaga tgaggcttca 3540
ggacttagag acttatgacc actacaactt acttgagaag caatggataa agagtcgtct 3600
atttatcaac tgacgcatca ccaataacta tcagatggag tgatgtataa ttagtgggac 3660
tatagtatcc acttgaaatc ttaatcgtaa aaatttttgt ttctccacct gaagagcatg 3720
ggagattcga aaaaatagtg ggggtagttt atttttaaaa taaagctcct aaaataaact 3780
aaaataagtt aaatacaaag tctaactaga atcttcttct ctctgtagaa aatatctgct 3840
tccaacctct atttcatatc cttaagacta attgtttgac tagacccagt tataaagatt 3900
gactctaaaa cttaaagata gtcttgagtt ttgaaaagat gagctatgtc ctggatcaag 3960
atatcctctc tctaccagct tgtcccaccc ctaatcaagg ggcatcctat gaaaagtggt 4020
taaacgatga taacaaggct tggtgctgtg tgctgacatc tatgtccatt gaactccaat 4080
gccagcataa gggtacaaac tgtccaaggt atattgactc atctacaaga gttatatagt 4140
gagtagagcc atgtatctca ctaggaagta tttaagagac tcttcaagat gaagaagtat 4200
gatggatagt ctgttaatga tcattgtctg ataatgatca agaacttgaa agaacttgag 4260
aagctcgata tgtctatcaa taagaaattg cagattgatt tgatcctaca attccttact 4320
gattcatatg tgtagtttat tataaactac catatgaata aaatacagtg caccaaggtt 4380
gagttgttaa atatactgat aactactgaa gggacctcga agagttcaag aggcactgtt 4440
cttattatgg agcagacctc atctttcaag aaaaagtcta ctgaaaagaa gaaaaagttt 4500
gtgaagaagc agaagttaga gaataggcca aagaaagaag ttttcaagaa gaaggccaca 4560
aaaaaggaaa agtattttca ctgcaactct gatgaccatt ggaagagaaa ctattctgat 4620
tatgtggcaa gcttgaagaa caaaaaagat agcatacctt ctgaagatat gtctgatctt 4680
ctcgttattg aaactaatct tacaatttct tttactttca gttaggttat agactctagc 4740
tctagtgctc atctatgcac ttctatacag gatctggagg aaagtagaag gctgaggaaa 4800
gaagaaataa tccaacaagt tgaaaatgat gcaagagttg ttactatggc tgtggagatc 4860
tatcctctac gactaccatc tgatcttagt ttaattctta gagactgtta ttttatacct 4920
actgctagca aaaaattgat ctctatttca tctctagcat aggataatta tgtattaaat 4980
tttaataaag attattatac catttatttg aaaaataaaa tggttggacg taatttttta 5040
attgacagtc tctatcattt acatgttgat gtatctatga atgtaaccaa gcagaaagtg 5100
aatgccatag gatctaaaag atctaaagat gaaataaatt atatgtggca cattaggcta 5160
gatcatataa gagaagaaag gattaacaga ttggagaaag atgggctctt gggcttattg 5220
actactgagt tatatccgat ctgtgaattc tgccttcaag aaaaaatgat caagctgccc 5280
tttatgaaac aaggagaaaa gaccattaag atatttgccc tggtacatat tgatatatgt 5340
ggcccattaa ttcgatgcgc tggtcaaaga aggttgtctc tatttcatca tctttatcga 5400
taattattca cagtatggat atgtgtatct tatgagatac aaatatgaag tctttgaaaa 5460
atttaaaaaa tttagaaatg aagtaaaaaa ataaactaaa atttttttaa agatttttca 5520
atcagattga aaagttgaat accttaatgg agaatttcta aattatctca aaaaaaatag 5580
catagtctta taatggactc catttggaat gtcttaactc aatagagttt cgaaatagag 5640
aaatcaaact ttattagata tggttcggtc catgattagt ttcattgacc ttctcttatt 5700
tctttggaga tatagtttac ttaccactaa ttatctattg aatagggttt cctctaaaat 5760
catttctacc acattgtatg agatatggta ttgtagaaaa tcaagtcttg atcatatcaa 5820
gatttaagga tatccgaccc atatcaaaat atttcagacg gacaagttag aggtcagatc 5880
tatgaaagct cggttcaaaa gtatcttaag gagtctttag gatattattt ctacttttca 5940
gaggatcaca atatgattat aagccaacat gctctcttcc ttaaaaaata gttcatgcaa 6000
gatggaagta gtaggaggca gattgagctt gaagagagtc tctgaagagc aatgagtctc 6060
agaacttacg taaaacctat ttaagttgag ccaatacaca cacctcttcc tccatctcgt 6120
agatccagta aaatttttca ttctcctgag agatacttag gtatcatcat agagaatgta 6180
gagaaaatat ttctcgtgaa aaatgagaca tatgaaaatg accccaaaac ctatagcgag 6240
gcaatatcaa atatcgacta taagaaatgg ttagaggcta tgaagttaga aattaactca 6300
atacacttaa accaagtctg aacctttatg gatccgtcag aaggtatggt acctattatg 6360
tataaataga tctacaaaag aaagattggt tttgatggaa aggtagagac ctttaaggta 6420
aagcctgtga ctaaaggtta tagctgacac gaaagcattg actatcaata tattttttca 6480
ctagtagtta tgctaagtcc atttgaacat tacttgcgat tgcagcatat tatgattata 6540
agatatgaca gatagatgtg aaaactattt ttctaaatga atatctttag gaagttatct 6600
atatagagta gactttgtgt ttcacttcca gtgatggcga tcacaaagtt tacaaattgt 6660
aaagatctat ttatgcactc aaacaagcat cttggagctg gaatacttat ttcaatgatg 6720
taatcaaatc atttagtttc atcaaaaatg agaaagaatc gtgtgtgttt aagaaaatca 6780
gtgggagtac tgttactttt cttgtattgt acgtggatga catcctcctg atcgaaaatg 6840
atatttttat gttaatttta gtcaaaatat agttgtctaa gaaattctcc atgaaggatc 6900
ttggggaagc atcctatatt ttggagataa atgtctatag tgataaatct atgaggatgc 6960
caggcctttc acagaagatg tacattaagg aagtgctgaa gaagttcagc atgaaaaact 7020
ccaagtggag acttctatcc ttcaggtatg ggattcatct ctccaagaag gtgtgcctca 7080
acacatctta agagatacag tacatgagca aaatccctta tactgcggct ataggaagtc 7140
tcatgtatgt catgttatgt acatgacctg atatagctta tgttgtgagt gtcacaagta 7200
gatatcagtt gaatgcaggt gaaaaacact ggacatctat gaaatgtatc cttaagtact 7260
tgagaaggat taaggatatg ttcttgatct ttagaggagg agaattaagg gtgcaagaat 7320
ataccgactt aaattttatg tttgatattg atgatcgaaa attgacatca gattatattt 7380
ttttatgcaa cggtggtact gtgagttaga aaagtttcaa gttgcctatc atagcagact 7440
ccattataga agatgagttt ataatcacat tggaagctac caaagaggca ttctggttta 7500
aaaaatttat tacagagctg gatataatgc catcagatgt cataccactc tactgcgaca 7560
acaatagtgc cataactcta gctaaggagc tgaggtctca ccaaaagtct aagcacatag 7620
agcaatgatt taatctcatt cgcaattatc tcgaaaaaaa tatatcaagg tatagaaagt 7680
agatactatg gataatatga cagacccact aactaagtag ctgagtcaat aaaaaatcga 7740
agtccatctt gagaagatgg gacttagatt tgtggccaat tgattttagt gcaaatagga 7800
gattgttaga tgtatactct aaaagtcaat tagactgaca aatataaatt ttctaaggac 7860
ataatttata tattttgact tattaataaa ataaaatttg gattaatttt ttattcatat 7920
tttagtatcc atgaattatc caagagatta atatgataat gatatatatt ctcaagagtt 7980
gaaaatttga aacatacgtc attgatgatt aatttttgaa tgctttcgat taatggatga 8040
tcataaggat agtaattaat ccgatcaatg tacaaatcac ttcttttttg atagacgagt 8100
ctcgagtcta tactatggag acactggagc aagagtgcag gtatttgtta gagaacaaag 8160
gtatcgagcg tgactaatac gagaagtcaa ttggatggct atccactcgt taatgactta 8220
tttgatacta cagtagtatg tctagtcctt agatctgcaa tgcctcaggt gttcataatg 8280
agactgttag agtttgactg tacataaact tgatttctag ccatatggat ctttatagtg 8340
catgttggct acagtaggtt cgttgtagga ataggatgtg cacatagata gaatctatca 8400
tccttgatag acaaaaaaaa tgatcctata taatttatga gactgagttc aaaaaatctt 8460
gactaagaca gtgtgaataa tgaaaagaag tttccacata tatacttcac atcagcaatt 8520
ccagttaaat aaatcctaca tataataggt attgtagttt gatgaataat ctataacctc 8580
catcttattg aaactctgat agaaggactg tatcatatgg taactgtatc aagagattca 8640
tctactattt tgctgaattg tcactacaaa ctgctagatg tcactgatag attgtgggac 8700
ctatgaagat tatcttgatg atcgatgatt ctcatggaga agattgaaac tatttcaatg 8760
atgttgtggt agaaatcaca atatatctta ctactagata gaatagaacc tatgaggtca 8820
cacataataa aaatttgaga ttgatcagat tgttgaatga tgattaagaa ttgttacagg 8880
attcagatta tcaatataat tgataattgg actaacttgt aattattata agtagcaaag 8940
atttaattgc taaaggttag cagattcaag gaggacttat gtgtaaataa tgtacatctt 9000
aatttgattg gatcaactta gttatggcta aatttaagat gaatcaaaca gggatttagt 9060
ttaatcgaat ttgggtcaag ctttgggctt aggtcacatg cactcaaaag ggtttggatg 9120
catcaagtgt gtgacaccca aaccaagcct ccctaaacta ttttgagttg gttttgacca 9180
agtcaaaagg gtccacaccc tagggtttct tgaataaaac cctaggtgcc acattgagga 9240
ccaattagga aactttgaca ttctttcaca cggagcagca cactagggtt tcatgaaaac 9300
cctaggcacc cattttagcc ataaaaggaa agctccaagg gatgggatgg tgccatgaag 9360
aatccctggc cattgggact ccattcaaaa gttctctagg ttttgggctc ttatagagcc 9420
ctagggtttg tttgcctata aataggtcgc taccccaagg ctttagataa tgctagaggc 9480
ttgtgaagct ctctcctttc tcttgtttgc catcccacct tctctcctct ctcctccatg 9540
cctcaagact tctttcttct ctccatcatc ttgttgaaat ttagatttca atgagaagga 9600
tcaagtagag tcagagttct actgcagttc tcaaggtgtt gagaactttc ttcatcaggc 9660
aaagattctg caaaggagtt agcacctcaa agaaccaaga aagttgctaa tctgccctca 9720
tctccatgtg gatacttata gaggccaagc atgacgagaa gagccttatc acgatcatca 9780
ctcgtggaga tcatctaccc gcgcaaaggt atgagataag aaaaaaatat ttttcttatc 9840
atgattcatg aatcctttgc ttatgttaca ttgagactct tggattagat tttttctcta 9900
ataaaatttc aaagattaga tctcgaagtc ttcttcacct aaaggtattg aaagttcttt 9960
atattttcgc tactttgatt caaaatagat tagatttgtt ttgcctttca atttttctca 10020
tatttattga gatatgaagc tttaattaat gagattaata aaaagcatat gtgaaatact 10080
gagaacatcc taacaatttg agcttacaat tcacttaaac aactaatgat caaattaata 10140
atcacaatgc acaataaaaa ttcatgataa atctttttgt tgttacttta gatcaaaatc 10200
caactaatca taacatgatc cacggattgc ctatcatata tcaaaccctc tgaattatta 10260
atcttaaacg atcttttcat tcatgatcat aagatttagt taaaaatcat gaagacaact 10320
tatattgtaa tcatcataga tctgtatctt aacatcctta gtgtttacct acctatactc 10380
atcctatgtt tgattctata tatcataatt tattcactaa tactttgata tcatataaat 10440
tatcgcatcc ccaatctaag atcatattgg tactttaata tttcattagt gggggttatg 10500
cattagtact ttgatacctt atcagttgaa tggttaaaca ctggtacttt gatatcctat 10560
cagtggaggt tatacgctgg tactttaata tcctatcagt aagatggtta aatactgata 10620
ctttgataac ctcccagtgg gtgttgtatg ctagtacttt attatcctac caatggggca 10680
gttaaatgct actactttga tacgctacca atgggatagt taaacgctag taatctaatc 10740
ttagcttgac ataaagtaac gtcgactcga gtttagggtc gactcgagag aatgttaggg 10800
ttagcttgat atgaaagagg gtcgctcgtc aatattttgg agtcaactct tgtttatgga 10860
tgatctagaa agtgtcagag tgagctcgag tactgcatat ttctgataca ttgtctatgc 10920
tagaatgtgc tagaactgat tatcttcttt atcaaagttg atttttgagt aacttgatga 10980
tcaatttttc taggctagac ttgctttgtc aaaatgagca cttgttagtt tagagaatct 11040
tcacctacac atgatctcaa gcattcatta gtaccaaaaa tacttaagta ttttgatatc 11100
atcaaaatca attcttgggt taacacaata cttttcaaat aataagcata cagatataat 11160
cctataacaa tttaaatttt gttcatatat caatttcttt aaaaatatta tattcatctt 11220
gatagctatg aactaaatca aaatacatac tagtatacaa cttttactgg gagagtatta 11280
gattaccagc atttaaccat cccactggca aggtatcaaa ttaccaatac acaaccccta 11340
tttataaagt atcaaagtac cagtgttcaa ctgcctcact ggcaggatat catagtacta 11400
gtatttaact accacattga caggatatgg aattatcagt atttaaccat cattagtaga 11460
attttgatgc atagtcaggc tgcgagtcaa aatctatctc aaatcaaaat attgatcaca 11520
tgtctaattc tgtatcataa ttcattccct tatgctctaa tattatatta attgtcatac 11580
ttctagctcg agatcatgag ccaaggattg cagtaactac cgcatactta tagagaactc 11640
tttctataag catacaagat attctaaata tactatcaat atatcataga gaaattaatt 11700
taaataacta aaagttaata ttcaattaat aaattcaact ggcaaatgta tttaaaaatt 11760
ttacatcaaa taaatcttga ttaataaata ttaattaata acaatagatt taaatcgaaa 11820
caaggttgat attgttagaa tttgatgcct caagattcag cccacattga gtccacagtg 11880
aggttcgcga cgaaaaatgn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnaagata 12840
ttactaaatt ttgcttctaa tctcactctt aaatagtact tacctttgaa actaggcatt 12900
tgaatctgaa aaagaaagag gagattatga gcttgatagt tcagtaaatc atgaataaat 12960
tagctaaata aatctatgaa taatagtata ttaaaaataa atatgtaaga tacaataatt 13020
caaaaatgaa ttcatatata taatactttc caaataataa gtatgtggct gcaatccttt 13080
cgtaattcaa attttgttca ttaattattt ttttcaaaac atcacatgga tagtcatgaa 13140
ctaaatcaaa gtaccagtgc ataaccccta ttgataaaga atcaaataac aagtgtttga 13200
ctgcctcatt atcaggatat caaattatta atgcataacc tccactgcta gggtatcaaa 13260
gtagcaacct caatcacctc actggaaggg catctagttt cagtatttaa ctactccact 13320
ggcaaggtgt taaattatca atatttaacc tccactgata ggattttgat atatagtcag 13380
actgcgagcc aaaattcatt tcaaaccaaa atatttttct caaagacata ttttatgttt 13440
cacattgaaa aattcacaaa aattatgcga tattgaaatc aattggataa aatccacgtc 13500
aaatttagta tattcaatca taaatcattt actattctag aaaaggtata ttaaaagtat 13560
aatgcatcaa tttcataaat cataaatatc tcaatataaa aaatatttta ttatttatta 13620
ataaatctag gagaagtgaa gcattactta tcttgtaagt aaaactaacc aactgatcaa 13680
attaattctg agaatctttc tcaaaactca tcaccactat atcaaaaact tgtgcttctt 13740
gctatgtaag agcatagacc ctttcttcga tctggggttc caagtttcta ttttattttg 13800
ttcaactatc aaattagact gacttttcat ttttttgtgg atattcagct attttatggc 13860
ctttctaaca ataaccaaag tatgtaccaa tattccaaca ataatcattt attgcatgat 13920
tttcaccgca tcgaaatatt tgatattatc aatcaatcca aacttgttat tcactgacct 13980
cttattcaaa cccttagtat atttaatatt ctacctttgt gattcattca atcgatttct 14040
ttttttttat tttctttccc tttctatatg ctcttcatta acttttcttt caattatcaa 14100
tgctttattc aatacatctg tataagtagt taactcatat agtaccattt attttctaat 14160
ttctatcctc aattccaact caaatttatc tactcagtca cattcatctt caaccaatct 14220
cgaagcaaac ttgacaagct ccataaattt agcttcatat tctacaacta ttatatttct 14280
ttatttcaga taaataaatt tttattcttt ctgaatcctc atactctaag aaaaatattt 14340
ttatcataaa atatcttttg aaatcactcc caagcgagtt gttctccatc ttgttcatat 14400
ttaggtttca ttctctatta tcaattaaat gtctcatctt tcaacatgta tgatgcatat 14460
aagatttttt catcatcatg gtatctctta acaataaatg ctttctccat ctccataagc 14520
taatttttag ctcctatttc atagttttct taaaagtcaa tggagacaac ttcttaaatt 14580
ctatgatatt actttattgc tcctattgct cttatgtcct tgtggtgaca atatttattg 14640
ttgcacttgc tgtagaggca gttactgtta ctgcaattgc tattacgatt ccatcaagcc 14700
gactagtgtc tgcattattt ggataatagt tgatttttgc tactttattt agatgttggt 14760
ggcaaaatca atgacttctt tttgctgaga gatgccacca acctactaag tatcatcatc 14820
ttattggttg atacctttag cagcacctcg agtggttctt tttatctgat atggaaccat 14880
cttaatcttg catgaaaaac aaacttcgca aaattttctt ttaaaatcta atatctaata 14940
ttatactttt attaaaattt aattatgatt attttaagaa taaaaaattt aaattttgaa 15000
atcctcacaa ggctggccaa gagataatga ccatcatcct agtcggtttg acgtaggaca 15060
tccaaagatc aactataatt caagcatcat attgagatgc taggatataa tcgatggtga 15120
aatttaatga tgctcgactg atcaagatgg gggccggccc gatggcctgt tcaacaatca 15180
ttgatcaaaa ttttttaacc aaggtctatc aagatcatta aaaagtcttt ctaagatcta 15240
taaattgtaa taaagagaca caatctagag agagacactt tttacataaa gaaagtagaa 15300
attttaggga gagaaattag agagaaaggg gaaagagaga ggaagctgag aggaagaaag 15360
aaaagagaaa gactctctct ctttttcttt tctttctttt ctctcttttc tttttctttt 15420
cttttttttc ttccttttct ttctttcttt ctttggctca ttagaaaaat aggggaccta 15480
ttgatcccct tgtttcctaa ataggggagg aatctcatct tggtagctat ggccggcgat 15540
gtgagccaaa gtggcaaaat catgaatct 15569
<210> 3
<211> 3181
<212> DNA
<213> Elaeis guineensis
<400> 3
ttcaaaatga tgaacagatg catctcaagt cagcactaga ccatcttcta aaataggaag 60
atctatggaa gcaacactcc caaatgcagt ggcttcaaaa tggggattgc aatacgaagt 120
ttatccatgt ttgggcaagt aacaggaaaa aaagaatact atcactgaac tctagcaagg 180
cgatcagaag attatcgaat agcagcaaat ccaatccaca ttctacaact ttttttctac 240
cctactaggc tcgactgagg aatgactcat ccaagctgat tagaagattc tttatccaga 300
aggacctctg gatcttgctg acattgagta tccatttatg gagaaagaaa tccatgatac 360
agtgtatgac ttggctttgg aaaagtcacc cggatgatat tttcccattc tccttctata 420
tgcacttcta gtgtatcatc aaacatgacc tgatgaacct actgtaaaat cagctaatgt 480
agaccatctg aactacttgt tcatcaccct tatcccaaaa aaaaattggt gtgtattcag 540
ttagagactt caggccaata agcctgatta atggagtaat aaaaaatatt tcaaaaactc 600
tatcgaaaag gctctcacag aaaatgaatt tgttaatttt atccacagag cttgctttca 660
acaaaggaag aaatatctct gaatattttg taatgactat ggaaactata cacttctgca 720
aagctgaagt acacaaggat ctcaattata aagtcgactt cgagaaagct tttgacaatg 780
tggattggag ctttctattg aaattgctat ccagcacggg gctttgattc gaggtggtgt 840
caatggatag aatatctgat ttatacagct aaattctcag tccttattaa tggtgataaa 900
ggtaaacttt ttaaattgag gaaagatctc aggcaaggag atcctctatt cgcctagctc 960
tttctcttag ttgttgatat agaatgatca agggagcaag taggttcaat ctttttgttg 1020
gaattggatc atataatatc atgggataac ttcaaagctt ttagttcact gatgacacac 1080
ttatattttg cagatatgat ctaaaataca tcaaaactct taaattttta ctctatagtt 1140
atgagctact gatgggtctc aaaattaact ttgaaaaatt ccaatttttt ggcttgagaa 1200
ttgcaaagat gtcagtacag caagttgcat ctatcctaga aagcaaggtg gctacatttt 1260
ccattactta tttgggtctc ccactccatc attctaaact gaggaaaact tattggaatc 1320
cactccttga gaaggttcag aagaaattga tcgggtagaa aggtaaactt cttaacctct 1380
agggtaggct tatactaact aatgcagtgc ttacagggat cccactactc tggagggata 1440
cattccttct ccctcaattc attatcaaat aaattgataa aatccatcga tcattcattt 1500
ggagaggaaa cgaggagtat aactaagggc actctagaat atgttggtcg aatatttgtc 1560
gatcaaaaaa atttggagga ctgggggttc ctcaatctaa aaattttcaa tacaattctt 1620
ctttgtaaat ggtggtggaa gctctactct aatgctggtg acccgtggtg tagttttatt 1680
gccactatcc acccaacttc acactagaga tctaaaggta tacacaaatc aacctcttca 1740
ttttggaatg gtttacagca cacatgaaat atttctactc ctaatccact ttcaagttag 1800
caactagtat tattttggaa agatagttgg ttacataatc atccactgaa ggatcgattt 1860
cctcaccttt acacaatagc attgaagtgc aacaactcag tggcaaaggt attaagcaat 1920
ctacttgata atagctcttt tagtactcct cttcctcaaa gataccaaga agattttcag 1980
agtctatagg aaagcattga acaaattaca ttaacggaac gacctgatac tatacaatgg 2040
aaatggttta gtagcaatat ttttttggca tgaaggatct actattttct gcaagatgga 2100
ggagtttggc ctctactgag taatattata taaaaactcc taataccaaa gaaagccaag 2160
ttatttgctt ggctaagtgc tcacaacaaa atcccaatga aagctaatct tcttaataga 2220
ggaataattg gaactgatta ctgtacactt tgcgatgact tatcagaaac taatgatcat 2280
ctaatgctca tctatacttt ttcaaaagca atttggaatc aagtactttc agacctgcaa 2340
ttgtcgaaac ttttatgcat gcttaacacc ctatgggata cttggagact catcaatatg 2400
caacacgata gaagacctaa actagctgct ctattcgtaa ttggtcaatg gtgtctttgg 2460
aaggaaagaa ataaaagatt attcgacttc tatacttttt atccacgatc gattgctgaa 2520
actgtgtcac tttttctttc ttgggcatca cacctaacaa cggagcaact aaagatgtta 2580
gctcctgttc gagaagttct cttatctaag aatgaaaaca cacaatcttt agtgagaatt 2640
acagatgcta acaggcgcag atgaatgttt tatgagcatt tttatagctg cagcttatat 2700
gtgatctatg gtgcaaggag ttaattataa ccatggatat tagttaggtt gactatcaga 2760
aatcatctcc aatacattct atgtaaccac tgatcaattc catgttcaac tagataggaa 2820
cctgcctata tacaggtatg tccctgatgt aactatagta tactattatt cataaataaa 2880
taacgaaggt tttaccttct tctcataaaa aaaaagtatc ttcatgtcat cctatatgtc 2940
atgcatctcc tttgctactt cttttattta cttcttaaac ttggttctac catatattat 3000
cagccccttt taaatttgct tttggatatt gcatattcca ctcttcaatc acctcatgcc 3060
aagcaaaaca tttattcaca cttgaaaacc aatataagaa taccaaagaa tttatccatg 3120
aaattctaga aactttggtt ttactccttt ctccatcatt caaaaaggtt caaaatgatg 3180
a 3181
<210> 4
<211> 14184
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic predicted full EgDEF1 cDNA transcript
<400> 4
aggagagaga ggggcttggt ggctgactgt cagaagaagc ctcgatgctc gaagattaga 60
tggaagaaaa aaaaatttct caaaacttct cttttctata agagcaaacc tcactattat 120
aaatagggtt atgtatctca gtttatgatg tgaagaatta atgaaaaatt ggactttagc 180
tctatttttg taattctttc atcttctatt tttatgaaat tcaagttgag ccgattaaaa 240
gaaataatct ttctttccga ttggatcaat ccattaacta gatacttcaa aaatcaaaat 300
gacctatcta aaatcctaaa tcaaatacaa aaccaaaata actaaattaa gatagaacaa 360
actacaatta caaaaaactg gctaaagtgt ttaaatgctt ttactcctaa gtttcttctt 420
gctcaccatt aatgcttgat ctttagctgg gatcatatca gccttatgac cactataaga 480
ccaacataac aactcacttg tattgctcct ttaaaattat acaaaactag tgtctaatat 540
gtaccatgcg aatgtctgtt tctcaccaga aaatggatgg gcttcttgtg caagcacctt 600
cttcctacaa ataataaaat atgcatccct tctctcatct tactaaataa aataattaaa 660
ggctttacta tcaggaaatc tggctttatc catataattt tggaagtttt atttgaacat 720
aacattacga gtactagatt acatcaggag gtggttcctc ttatttctat taagagaaaa 780
atcaattttc ttttaagaaa gatcatttca ttttcatcag gtagcgtact ctactaatat 840
acttccacaa caatatatag ggattagatt ataggatgga ctttaaggct tcttttcgag 900
agccctgatt tctcaatcac attccctttt ctttctcatg taatggcatt taagagtgca 960
tccagggccc aacaattagt cacaagtgtt ctttttatac atggtacata tttgctattt 1020
tttagcttat tttaacttga ttgtgaagat atcatgagaa aattagattt aaagcctagc 1080
aatcttgaac ccataatttc aagttaacag gtggaagagt ccattattat gtgagaccaa 1140
cttagactgc aaaactatct gatattggac tatttactaa cacccttttt catgtgcaat 1200
gtttgtaaag agaagatata tgatgtagcg agataggata gtttggctct aatattgtgt 1260
taatattcaa accaaaatcc taagctaata gatggaagag aaatgactta tatacatgtg 1320
cattattgga tatatcttta tgggagaaat aatcacatgg atgtttatat cacacatctc 1380
atatgtgcat gttgttgtaa ggcttcaaaa gacagacgat gagattggtc ttggatcaaa 1440
ttggaatgtt tcttagttga atttggagaa gtctgcaaca aatcctataa aagaagtccc 1500
gaaattggtg gggcaccttt cgatccaaga cccttcgatg gataagtcaa ataaagcctt 1560
gagaacagat tgtggaaatg gaagaataga aggatgagaa aagagattgt gaacaaatgg 1620
agagaggact cttgtttcct tcagtggagg agttgaaaat gattcaacaa agtctccact 1680
ctatctatcc cgacttacct tatggagggt atgttaccct cctttatata gaggggtgag 1740
gaggcttgct caagttgtta ggccgttaat ttattataat agaatggtca gctatataaa 1800
gatcatggga tgtttatcca tgtgatgatt agctatagga tagctagaaa atatctaatg 1860
cttaattaga tgatagctgt cagataaccg tctgcattct tatagtacat cgatatttta 1920
tcgacgtgac tagcttaaat cagcaactga ctgaactgaa tattatgatt cttttagtta 1980
acaatcatat tggttagaga ccgatgtaat tcatagtaga tcgatcacaa gctgagatga 2040
gtatcatatt ttaagaacaa tactagcaag ttagatcgat caaatgtcag atgaaaaagt 2100
agatcagtaa acgttcgatg gaacctgaaa gaatatttat gatttagata ataatctatc 2160
atcacgtatc cagataatga gatcatataa catgtaccaa tatatgccct ccatttttca 2220
caccgaagtg aagttcttca catcgggtgt ggaaagtctc ttcagaagat ctcacctgac 2280
ctgtattgtc atcataaatg ctccatacca cgatggttgg aagtattaat tttttaatca 2340
ctcaaagtca tacacaattt cttgaaaatg atttgttgaa cttagtaatg atgagcgctt 2400
agaaaatcgg gagctcacaa ttatttgggt ggctagtccc taatgtgtat gtgctaggtg 2460
tcatactgta attggccact tcagctatca catggatcct gcttgcatgg cttaatcaag 2520
aagaggtgcg tcgcaacaac tctctgcaga accatcggat aactgacaag tggcattgat 2580
ctaatggcat atcaaatgga ttgagactgt tagtaaattt tataaatagg tctatactct 2640
gttcaaaaat tactttacta tttttttcac atgacagtct tgctgaaatt ttttcagagc 2700
ccctaacatc attggtatcg gagtagagac cccccaaagt cattggagcc ggagaagaaa 2760
gaagtaaaga agtcttttaa aagcttcctc aaattcctct ttacatatta ggcagactct 2820
ttcatcttca acttcttttc catgaacatc tgagatttta ggttttacaa tctttatttt 2880
tttttttgga tagttattcc cttttctctc tttttttttc tgtttctctt ttcccattca 2940
cctttacttt cttctttcct ttcaaaaata tcttttgata ggactaatga gataagtcag 3000
gaccaatgga tatctcggtc aacccaacca ctgctcaagt ttgagatgga aaatctatct 3060
cggacaacag ctgaagttag tacctcaggt taggatgatc tagaatctcc tataagagat 3120
tttttagatt atttcggccc aagtactgaa caatctgtcc tgaccaatct cgatctttag 3180
gaacttaaga aaaaatattc gattcagctt ataactccaa gttgggatgg taggattatt 3240
gaacctccag aaggttatgt cgtattttat gatgaggcac ttcgatctgg actttaattt 3300
ctcttacatc ctttcttcag taatgtttta gacttctata aactccatcc aatctaggtt 3360
actcccaatg ccattaggat gatcatagtt ttcattatct atcgtaaatt ttttgctata 3420
gaactaagaa tttctctctt taggatgctg gtcatcctaa gaaaacatcc ttatgaaaaa 3480
gactgatggt atttcttacc ttggcctcaa tataaattcg gtcccactct tcctttttca 3540
atacataatt gaaaaaatca ttttttcttt atttcttcta atgtttcgta gggttttatt 3600
tgtaaatagt ctaagcctaa aaccaaatgg aactcaaata acaaaatatt atctgaggat 3660
gaggagactt ttgtagagct tttagatatg aaagtatcca agttgagcct actggtgtcc 3720
aatcagtcct tgtttgacac cgacatcagt cagatctctc cttaagataa gtctgatgtt 3780
aattcttttt ctttattgct ttatcatttt tcatcatttt tcttttctaa caatcttttt 3840
ccttatatag tagcaataat gaagttcaac ctacaaaggc tggctaactc aaagaagagg 3900
aagaaggatc taaccgattg ctctcaagaa gagtaaggag actgctcctc taagatcgat 3960
tggcccccga tcatcacctg ggccaatatt aattgacata gatgctacat cgatctccac 4020
tataccacca gcaaaatcaa ctcatcaacc tactaaggtg gcttgtccac ctcctaaaga 4080
gtctgcacat ccaaagtagg catcttcccc aacacctcca acatcggcca agttagtttg 4140
gctgagcaat cagcatctga ggtcacagac tcctgatgtc aacccaccaa ctttctcatc 4200
aaaaaaaaat tgacttggcg aaggtatcac ttttggagac acccagacta ggcaaggact 4260
tgctctgtac aatgatgcct caaaaggacc tagatgctga taggagggat ctttctttgg 4320
agcaaataat aaattatgga ttcaacagta tcatgaacgt gagtcttcat tctcttccac 4380
tctcttcttt ctttttcttt ttttttttta cattggctat ttgttgatct gaatatatct 4440
ttctttttgc agtcggttgt gtatttcaag ttgctcaatg agcacttgac atggttcttc 4500
aaaaataaaa atttttttga aagagaggct caaggccaag aaagaggcca aaaaagcagt 4560
tgaggaggtc aagaaggcag taaagaagaa ggctgtcaaa gaaagcaaaa tgatggaggg 4620
gctgaagaaa cagctccaag aaaaaataga ttccattaag gagactggac aaccaatgac 4680
agatgaatga taaagatgac aagttgtaaa aacagcctga aaaaaatctc aaagttggag 4740
gccaagctga aggaggtcga gtcaataatt gaaaagcatg atgaagctct tgtcccatat 4800
tagagacaac ttgataaaga caaagagtgg atgtcaagga ttattgaaga ttataagaat 4860
tccgacactt ttcaagatga cgttactgag gcctcaaaag gagctttcaa ttatggcttt 4920
ttgagctaca ggagtttaat tatcaagctc tttcctaacc ttgatctcag caaggtcata 4980
atagaagcag ctctagaagt agtagccgaa gtgacttctg caacaactac tgagcttgct 5040
tccacttcta tcattggagt ttctccgatc gaagtcccaa acagtccaat cgaggcctcc 5100
atcatcgaag ctatttcgaa ggaatcagtc ggcaaagacc ttacctcaac tcctccaaca 5160
aataactccc aagctaaggc ctgaattatc ttcttctttt ttttctaaac atttgtatta 5220
gcccgatgtg ggcttctata aatacttttt acattaatga atgagttttt caatgtcaat 5280
attttttctt tttaactaat actaatcttg gatgatccga tctgggttgg atgtctcaaa 5340
aaatatcatt cacgatagat agttattttc tgacttcggt tagatgatta tgagtatatg 5400
taattcaacc ttggttaggt aagtaatcaa atattaacta ttctcaaacc aagtagataa 5460
cgaagtcaat gtgattaact ttaacaagta agattgttat ggaatgaaat tgaatcagat 5520
caactaacta tagataactt aatctctcat aattcactgt aaaggttcta aaagtacctt 5580
tatctaagtt cgaagtgaca agtcgggttc ttttattcgt ggatttatga cccatgctgt 5640
ctttttgtga tcttcattat taatcacctt aaatcgatat agcaaaatcc agtttataga 5700
tctgagtgct ttcttgtcag attgagtcta tcctattatc tgtgaaacct gatctagaga 5760
tcaagtattt taggtttttt atttaaggtc caattcgaag attgagtatc caatgtcata 5820
ttgttaggtc caatttggag attggatgtc tcactatcat ctcgtgaggt ccaatccaaa 5880
gatcgaatat ctcactatca tctcatgagg tccaatccag agattggatg tctcacatca 5940
tcttgtgaga tccaattcga agattggatg tctcacatca tctcatccta ttgtggttgg 6000
aatttttgta gccttagttt gactttttct gacctcattt ggacacctaa atcttattat 6060
catcgtttga tcgattttta ctaatctact ttggatgaaa aagaattctt caatggaact 6120
tttgattaga actttatctt cattgggata gaaatcgaat gctttattga aagattttat 6180
tgataataca ttctgagatt tttaatattt catgttctcg aaatgatcgt accatctaaa 6240
tttttaattc gataagctct tggatggatc acctcagtaa tctgataagg tccttcccaa 6300
ttcgggatga gtttttctta ctccattggt tttgagactt cagctcattg gagaaccaaa 6360
tctccttata aaaaatttta ggctttacct gagagttgta atatctggct actttttgtt 6420
tataaactac catatgaatc tgggcttttt ctcgagtttt ctcaaataaa ttgagatcag 6480
tcctcagttg atctgaatta ttttcttcat gaaaattttc tattctggtt gtaggtaaac 6540
tgatctcgac tagtattata gcctctgttc cgaaagtaag tttaaaagat atttctctag 6600
ttggtctctg aggtgtagtt ctgtataccc ataaaatatt ataaaattat tctaccccga 6660
gacttttagc ctcaatgagt tttattttta ggccttgaaa gatagttcta taaataaatt 6720
tagcttctcc atttgattgt agatgtccaa tcgaagtaaa tatatgatct atgtagagct 6780
cagaataaat ttttttaaaa ttttgattat caaattattg ctcattatta gtaattataa 6840
ctcaaggcaa accaaaatgg taaataatta tttttcacat aaaatctcat attttttctc 6900
agtgatttat gtcagaggtt caatttctat ccattgggta aaataatcaa tagtcacaac 6960
taaaaatttt ctttgctcca tggccattag aaaggatccc agaatatcca ttctccatat 7020
agcaaaaggc cacagcactg taatagaaat aagttcagtt gtaggctgat gttatatatt 7080
ggcgtacctt tgacactgat cgcagtactt attaataaag tcggttgaat ctttttgaat 7140
agtaggccaa taataatctt actgaattat ttcataagct aaaattttac cccccaaatg 7200
gttactagag attcctttat gaacttctcg aaggatgtaa tcagcttccg atggccttag 7260
gcataggagc agtgggagtg aatataacct ctgatataat tgattatctt gaacaacata 7320
ccatggggcc tgtcttttaa ttcttgttcc ttcgactgga tcaaccggta gaggttcttt 7380
agtaatatac tccattaatg ggtcaatgga acttagctca tattaaattt ggacaattag 7440
taaggcctcg atactagact ttttaagaat atcaataaga acaccttgat ttagtttgaa 7500
aaaatctgat gtggctaaat gagatagggc atcagctcag acattttgtc cttggtattt 7560
gcatgatctt cagattttca aagtttttta ataattcttt catattatat aaatattgaa 7620
acatcataaa atctttagct tcaaattaat ctcatacctg actgacgata aattgagaat 7680
caataaaaat tttaattttt ttaacattaa gctccttagc cattttgagt cctacaatta 7740
gcgtttcata ttctactcca ttgtttgagt gttaaaatta aatctcaaag cacgctcact 7800
aacaatgcct tctagactcg ttagaattaa actagttcta ctttctttcg aatttgaggc 7860
tccatcaatg tacagtatca aataagaatc tttgatattt ttcaattctt ttaagattgg 7920
ttcttcatta ggaatagagc attcaataat aaaatcagct aatacttaaa ctttcaatga 7980
agatcgaggc ccatattgat atcaaattca tttaattcaa tagcctattt gaatatcctt 8040
cttaaagtat caagctactg taaaattaat tttaaaggtt gatcgatcag aattataata 8100
gaatgagcct aaaaatacga tcaaagtcat cttgctaatg caatgagggt ataaattatc 8160
ttctcaattt tagaatatcg agtttcaaca tctctaaata atttatttgt ataataaatg 8220
gatctttgta tccctgcatc atttcaagct aaaatcgaac taacagcatt tgctgaaata 8280
gatagataca tgaataattt ttgacctttg atcggctttg atagtaatgg agctgtgccg 8340
agatatttct tgagatcatc gaaggctgct tgacattcat cttatcaatc gaagtctttg 8400
atctgcctta gaattttaaa gaaaggaaga tatttatcag ctgatctgaa aataaattaa 8460
ctaagcaatg ctactcatcc agtaagttgg tgtacttctt tgatggagct cggatgcttc 8520
atttcacata gagcttgaat tttcttaaga ttgactttaa ttcctctttg agttacaaaa 8580
aaatctaaaa aaatttttga agttacttca aaagcatatt tgttgggatt gagcttcatt 8640
tgatattttc gtagtctcta aaggcttctt ccagattggc aatatactga tctgactcag 8700
tattttttac taatatatca tcaacataaa ctttgatatt aatttcaatt tgttacttaa 8760
aaatcttatt aatcaagtat tagtatgtag cacctacatt tttaagatca aaagacatca 8820
ttttataaca atgcaaatct ttttcagtga tgaaggccat attttcttca tcctcaagtg 8880
ccattttgat ctgatataac cagaaaaagt atccataaag cttagtaatt tgtgtcttga 8940
agtagcatca acaagctgat caatttttga gagagaaaaa ctatctttta ggcaagcttt 9000
attgagatcg gtataatcaa catagatcct tcatttttca ttagcctttt taaccatgac 9060
aacatttaca atccactttg gatattatgc ttctctgatg aatttgtctt tcaagagttt 9120
gtcgacttcc tcatctatta ttttttatct tttcggggtg aaacttcttt tcttctgttg 9180
cattggttta tgctttggat caacattcag cttatgtaca ataagatcag ttaaaatctc 9240
aggcatatta gagactgact aaacaaagac atcggcattc atccgaagaa aagatattaa 9300
tttctccctc agatcaggct tcaatagaga tccaatttgg acagtttttt ttggatcatc 9360
acacaaaaga acagtaataa gtttctcgac tggttctcct cgatttttga tgatatcaac 9420
tttactttct tgatcaagta ttttaattgg tagagcttcc acagaccttt tcatttttac 9480
agctatcaga aaatactact tagcaagtat ctgatttcct catatttctc caactccata 9540
cttagtttgg aattggatta gtaaatgata agtgaagact atagccttaa gggcgttgag 9600
cctaggtcgg tcaagaatag cattataagc tgatggtatt ttgacaataa aaaaagtgag 9660
tcttacagtt gactggcatg gttctatccc tgcagtgacg gacaaagtga cctctccttc 9720
cacagctaca ggatttctag aaaatccaat tacgggggta ccaacctatt tagctaattt 9780
atcatattca ttctttggaa tgtatcatag aacaatatat tagcagagct ttcattatca 9840
ataagtattc tttttatatc atatttggct attgccataa agatgacaac agcatcatta 9900
cgaggagttt gaactctaac atcatcatcg aaaaatgaaa ttatgtgatc catgcactga 9960
tgctttggaa ggctttcagt aatctcagcc acctcctcag ttccgtcgag atctgagatc 10020
atattgatga ctgcagcagt agacttgttg tgatcattct cattgttggg cttctatcat 10080
tggtcagtag cttgacttgc ccgatctcga acatatttac taaagtaaca ttagtggatc 10140
aatacttcaa ttttatcttt taattatcga tgctcctcag tatcatggcc atagtctcga 10200
tggaaatgac agtattttct cttatctctc tttgctggag gggctttcat aggattaggt 10260
tggcgaatat atcctaaatc ctcgatttct atcagtatct gagctcgagg agtagatagt 10320
gaggtataga tgtcgaatca ccgaggtggg cttttgaact tcagattctt ctgaggtcgt 10380
tcagagttat cctgttggtt tttatgatct tcttcctagg gccacttttt tccatctctt 10440
tttttcttca cctaacgaag tatgcatgct ctctttcttt tcagcttgag catacttaca 10500
aacctagatc aatatttgtt cataattgtt tgggtagttc ttattaagag agaagatcag 10560
gcgattactc ttgagtcctt gcttcaaagc tgccattgca atggactcat tgaagttctt 10620
cactttcagt atggcggcat taaagcatgc cacatattct tgaagagatt caccttccta 10680
ctatttgata gtaaaaagat tgctagtatt tttcaaatga atccatttat tatcaaaata 10740
cgtgatgaat atttgctaac tgtgtgaaag atgaaataga tcatgtctgg aggtcagaga 10800
actagattct tgcagatgtt ttgagagtga ttggaaaagt gatgcaaaat agggcattag 10860
ataccccttg tagtcttata atggctctga agccttcaag atgatttaag ggattgatgg 10920
agccatcgaa tgtttccact gtaggtatct tgaatcgagg aggaactgat ttaccaagaa 10980
ttttttgaga aaaaagagat cgtaagttga aatctcttct accttgagaa tggcttccaa 11040
tctatatctc catcattttc ttctcaagat tttgaatctt ttgtccaaga ccctcctcca 11100
tacatggctt cttatgtgga gcagatttca cttcccaaga gtgatcagta tggtcaagaa 11160
gatgatcatg atgaagatct tgaggagttg gttgctaagt gtgatgtgat tggactactt 11220
ggggggctac tttttgctac cgttctgtcg tatactacag cagtaagagc ttggacctgc 11280
tgaaccaaga gactaaacta ttgtggatca ataataattg aaggttaggt attctcctga 11340
acatcttcag gagaagatga agtaggtaaa ggatgatttg gtgccttctt gttcaccatt 11400
tctactaaaa tattttaagt gcccttcctc taacactaat ctattactgc aaggcttcaa 11460
aagacaggca acgagatggg tcttgaatcg aactagaatg tttcttggtt gaatttggcg 11520
aagtctgtaa caaatcttgc aaagaaaatc tcgaaaccta cgggtacctt ctggttcaag 11580
atcctctgat ggataagtta ggtaaagtct tgagaatagg ttgtgaaaat agaagaatag 11640
aaggatgaga agagagattg tcggtaaatg gagagatgac tcttatttct ttcaatgggg 11700
gagctgaaaa taattcagca gagtttccac tctatcaatc ctgacttatt ttgtggaggg 11760
taccttggcc ccttcatata taggggatga agaggcctgg taaggttgtt agactattag 11820
gagagtttgt tagatcgtta atttattata atagaatgac cagctatata aaaatcatgg 11880
agtatttacc cacatggtga ttgactgtag tataactgaa agatagctaa tgcttagctg 11940
gatgactgct gttagataac tgtctgcatt cttacggtac attgatattt taccaatgtg 12000
acatagctta aatcggcaac tggctgaact aaatattatg tatcccttta gttaacaatc 12060
atgtcggtta gagatcaatg taattcgcag cagatcgatc ataagctgag atgagtatca 12120
tattttaaga acaacgctgg gcgagttagg ccgatcaaat gtcagactga aaaagcagat 12180
caataaacct ctgatgtgat ctgaaagaat atttatgatt taaataataa tctatcacca 12240
cgtatccaga taatgaggtc atataacatg taccaacagt gcatttttcc atctagttaa 12300
gaggttggtt agtggcattt gtcttcgata tgtaatgttc acataactaa tgtgcttagt 12360
agcattcttt tgtaaggtta aatcttcaat gatcttaagt tcacataatt gcctttgtgc 12420
cctattagtt tatagttgac cttttaattc aagagacagt caccttagca atcgatgtct 12480
gcttagattg ggccaattag gtactcacat taatatattg aatcatgttt gaatataaag 12540
gattagattg atttataagt ttccttttat tgtttacata ctgatactta gattgactta 12600
ctacattatt tgatatgtta tgttctaatt tttggattaa aattgttgtt tctgatttct 12660
ccttacatct aatactttgt ataatttatt attttttagc atgattgagt gtagaggatt 12720
agattgattt ttaagtttat tttgattatt tacatgccga tacttaaatt gacttactac 12780
attattcaat atgttatgtt tcaattattg agttaaaatt tttatttctg atttctactg 12840
atgtccagtg tgtgtgtgtg tacgtatgtg tgtatatatt tatttacata tatatgtatg 12900
tatgtataca gacatacata catacataca tacatacgta cacacacaca cacacacaca 12960
cacacacaca cacacacaca tatatatata tatatatctg tgtgtgtgtg tgtctctctc 13020
tctatatatg tataagtatg tatgtatgta tgtgtatata tatatatata tatatatata 13080
tatctatatg tgtgtatgca tgtatgtata tgtatgtatg tatatacata tatgtatata 13140
tatgtatata tatgtgtata tatgtatata tatgtgtgtg tgtgtataca tatgtataca 13200
tacatatcta tacatacata tgtatacata catacatata tatgtatata tacatataca 13260
tgtatacata catgtataca catacatgta tacatataca tgtatacata tatgtataca 13320
tatacatata tacatatata tatatatatg tatatacgtg tgtgtgtgtg tgtaagtaat 13380
taagtatgta gtgtgtgtgt gtgtgtgtat atatatttat atctgtgtgt gtgtgtatat 13440
atgtatgtat gtatgtatgt atatatatat aaatacatac atacatattt atacacacat 13500
atctatacac aaatatgtat acatatagac acacacacac gcgtgcgcgc gcgcgcgcac 13560
acacacacat atatatatat atatatagat agatagatat atgtatgtat gtatatatat 13620
atgtatatat atgtatacat atgtgtatat atgtatatat atatgtgtgt gtgtgtgtgt 13680
gtgtgtacat atgtatacat acatatctat acatatatat atatatacat atatatatac 13740
atatacatat atatatatat acataaatat atatacatat acatacatac atatatatat 13800
atatatatat atatatatat atatatatat acacatacat acatacatat acatatatac 13860
atacacacac acacatacac acatgtatac gtacatgtat gcatatacat gtatacgtac 13920
atgtatacat atacatgtat acatacatat atagatatat atatacacat atatgtatat 13980
atatatatat atatacacat atataggtta tttggaacct aagaaacttg caaagttact 14040
agatgcaatg ttcggaaacc atggaccgta acaactggag tagtatttgg gtcatgaatt 14100
catggctaga tcatgaattg agtgggagtc aaccgaagta gggccagctc agacacttgt 14160
atttaggtcc catgcttgcg tgca 14184
<210> 5
<211> 678
<212> DNA
<213> Elaeis guineensis
<400> 5
atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60
tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120
gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180
ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240
agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300
ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360
ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420
catgtgatca ccacgcagac ggatacctac aagaaaaagt tgaagaactc taatgaagct 480
cacaaaaatt tactgcatga acttgaaatg aaggacgagc acccagttta tggttttgtg 540
gatgatgacc ctagcaacta cgcaggtgca ctggctcttg ccaatggggc ttcccacatg 600
tatgctttcc gtgttcagcc gagccagccg aatctccatc gaatggggtt tggctcccat 660
gacctgcgcc ttgcttga 678
<210> 6
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 6
Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn
1 5 10 15
Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala
20 25 30
Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe
35 40 45
Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr
50 55 60
Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp
65 70 75 80
Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu
85 90 95
Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp
100 105 110
Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu
115 120 125
Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr
130 135 140
Thr Gln Thr Asp Thr Tyr Lys Lys Lys Leu Lys Asn Ser Asn Glu Ala
145 150 155 160
His Lys Asn Leu Leu His Glu Leu Glu Met Lys Asp Glu His Pro Val
165 170 175
Tyr Gly Phe Val Asp Asp Asp Pro Ser Asn Tyr Ala Gly Ala Leu Ala
180 185 190
Leu Ala Asn Gly Ala Ser His Met Tyr Ala Phe Arg Val Gln Pro Ser
195 200 205
Gln Pro Asn Leu His Arg Met Gly Phe Gly Ser His Asp Leu Arg Leu
210 215 220
Ala
225
<210> 7
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 7
aaattaatat tgcaaactag ctcaaaataa ttttgatcac tacatttctg ctgtgcattc 60
t 61
<210> 8
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 8
actacatttt aacaccaagc tcgataatag tgataaagaa acatctagat cagctttata 60
a 61
<210> 9
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 9
tgcatgcata gctagaagag aatcttatca cgatcatcac tcgtgaagat catctacctg 60
t 61
<210> 10
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 10
gctcgagtac tgcatatttc tgatacattg tctatgctag aatgtgctag aactgattat 60
c 61
<210> 11
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 11
tatattaatt gtcatacttc tagctcgaga tcatgagcca aggattgcag taactaccgc 60
a 61
<210> 12
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 12
ggaatctcat cttggtagct atggccggcg atgtgagcca aagtggcaaa atcatgaatc 60
t 61
<210> 13
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 13
tataactaat ctccaactct gccgactcct tagtagtatg agcacatgga aagcttgacc 60
t 61
<210> 14
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 14
ataaatgagt gatagattct aatccagaga caaagagcac acctcgaatt cacttgccat 60
c 61
<210> 15
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 15
aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 60
c 61
<210> 16
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 16
ttgatataga atgatcaagg gagcaagtag gttcaatctt tttgttggaa ttggatcata 60
t 61
<210> 17
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 17
ggcgcagatg aatgttttat gagcattttt atagctgcag cttatatgtg atctatggtg 60
c 61
<210> 18
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 18
atttgctttt ggatattgca tattccactc ttcaatcacc tcatgccaag caaaacattt 60
a 61
<210> 19
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 19
cggttgcatg ccctgcagag tttgactcat gaggcatgca aggtattgaa tagtagtcta 60
g 61
<210> 20
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 20
cgtcagctgc tcaatcatgg attctgatag ctcaaatggt ggtaagtaga aagagagaga 60
t 61
<210> 21
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 21
aagattgtgc aactcatgaa gattgtctcc agattgaaga taatttcaat acaagcacaa 60
a 61
<210> 22
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 22
atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 60
c 61
<210> 23
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 23
ttgaggagat taatctgacg caaggaaaaa agaagagctg acaactagcc aatgatcgag 60
a 61
<210> 24
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 24
tgatctcagc aaggtcataa tagaagcagc tctagaagta gtagccgaag tgacttctgc 60
a 61
<210> 25
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 25
atattttcgt agtctctaaa ggcttcttcc agattggcaa tatactgatc tgactcagta 60
t 61
<210> 26
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 26
atagctaatg cttagctgga tgactgctgt tagataactg tctgcattct tacggtacat 60
t 61
<210> 27
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 27
aattattgag ttaaaatttt tatttctgat ttctactgat gtccagtgtg tgtgtgtgta 60
c 61
<210> 28
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 28
tcttcctcag atgacatgtg atttatgcta cggcctagtt ctaaggactt ttctctgtca 60
t 61
<210> 29
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 29
cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 60
t 61
<210> 30
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 30
taaatgagtg ctcatagtga caatgtttag cctccacgta taatgtgtgc cagctaacta 60
g 61
<210> 31
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 31
atcctctttt gtggctcaca acctcctctc ctttttatgt tctatgttcc tcacatcaca 60
t 61
<210> 32
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 32
atcctttcaa tctcataaga agttaaatga catggatgac atgaagcttt gatatgcatc 60
g 61
<210> 33
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 33
accatcaaat ggcttttgga aatatgcggg cgcagaagta gaggtgtcct atatgaaggc 60
t 61
<210> 34
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 34
gacgagggat cacaccaaca tcatatgctc tcctcaccat accaaatggt atccccaact 60
a 61
<210> 35
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 35
aaatctatta gtatctgaca aaagttaaat tagagtcgaa acactaaatg acaattaggg 60
atcaacttga tcaagtagat agagaatatt agaaaagaga gaaattaaca agatagaaca 120
tgattaatta ggtgacatag cccgacaatc caattggtct aagcaagttg atttaatcaa 180
atcacggttg aactaatata tagatagctc aataaaaatc atacataatt gaatctaatg 240
atatttggat ctgaccaaga tggaatttga catgctgtcc gatgatcgtg aatcaagact 300
ctctttgcta attaagatca aattagaatc attgaaagag aatcttttac tggatcaaga 360
gagagaaata tataaagaga gtgaaatagt ctatagaaaa aaattttaga gagagaaatt 420
aagaagaaaa aataaatttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480
agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540
tttttttcct attcttcttt cccttttctg cttaatggaa taggggacct cccattcccc 600
ttctatttct agagttgggg gctcaaaatt gatgatagct atcattgggg atgtaggcta 660
tggtgatgca gtagaggatc accgaccgat gatcgatggt gatgttgcaa tcaaaaaatc 720
aagaaagata gatggaaaat aaaggaaaat aaggagaaat agatctcaac ttgtttggat 780
gctaacccac tcactgacga ctccacttca actatggccg gagcttgcta tggaaaagaa 840
gccaaggcct tcaaggatga acaccaatgg tgaggaagat ggtcgaaaat agaagaatgg 900
ctggcttttc taatcgacaa aatagggtat cgcccttctt agcaaatatt cggcaataaa 960
tatctagaat ccaggatcct aggactatgg aagagggaga ggagggcaag tcaaaggatg 1020
ccagattctt atctagcttc cgacaatgat ggggccctat tttcgataaa cacaattgag 1080
gatgttcgga aaagggtttt ttcgatgatg attctagtga ccaactatga gatttcaaag 1140
ggggtgaggg gggtttaaat aagatgggag ggaagtttga atcctcctta aatctgaacc 1200
tttttcgaca aagccaagag cgtgaaggag actccttcgt gaagtcaaag atggaataga 1260
ctcccttcgg gagtttggtt catcacccaa cttccctagc atgtgcggag tatgtgctag 1320
ccttttctct cttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380
tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440
cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500
tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560
agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620
ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680
cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740
tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800
aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860
gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920
tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980
tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040
tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100
tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160
aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220
attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280
tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340
agtaatatca ataaaaaaaa tttttgatgc tccaataagt tagaacttaa atcaaaatat 2400
ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460
tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520
tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580
aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640
agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700
atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760
accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820
atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880
cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940
ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000
tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060
attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120
gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180
gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240
atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300
gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360
caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420
ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480
caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540
tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600
attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660
atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720
taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780
ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840
tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900
ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960
aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020
tgtgtgacac ctgaatcagg cctttctaaa ctattttgag t 4061
<210> 36
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 36
cttttttctt cttttctttt ttttttccta ttcttctttc ccttttctgc ttaatggaat 60
aggggacctc ccattcccct tctatttcta gagttggggg ctcaaaattg atgatagcta 120
tcattgggga tgtaggctat ggtgatgcag tagaggatca ccgaccgatg atcgatggtg 180
atgttgcaat caaaaaatca agaaagatag atggaaaata aaggaaaata aggagaaata 240
gatctcaact tgtttggatg ctaacccact cactgacgac tccacttcaa ctatggccgg 300
agcttgctat ggaaaagaag ccaaggcctt caaggatgaa caccaatggt gaggaagatg 360
gtcgaaaata gaagaatggc tggcttttct aatcgacaaa atagggtatc gcccttctta 420
gcaaatattc ggcaataaat atctagaatc caggatccta ggactatgga agagggagag 480
gagggcaagt caaaggatgc cagattctta tctagcttcc gacaatgatg gggccctatt 540
ttcgataaac acaattgagg atgttcggaa aagggttttt tcgatgatga ttctagtgac 600
caactatgag atttcaaagg gggtgagggg ggtttaaata agatgggagg gaagtttgaa 660
tcctccttaa atctgaacct ttttcgacaa agccaagagc gtgaaggaga ctccttcgtg 720
aagtcaaaga tggaatagac tcccttcggg agtttggttc atcacccaac ttccctagca 780
tgtgcggagt atgtgctagc cttttctctc tttttttttc attttttttc atcctttaag 840
atccatgcag tttctaggtt gagggattgg ggtatcacat tctctctcct aaaaaaaaat 900
tattttcaaa atttttttac ctatattttc aaaagttggg attcatggtc caaatctcat 960
ccttgaattt ttttgatatt ctaattctcg aaaaaatttc atcgttaaat catttcataa 1020
gagaaaagtc aatacctcaa gagttgatct gaatcaaaat tattatctct agtaatcgaa 1080
atcaatatct taatttcaaa taagaatatc cagtttattg tcaaaattat taactactct 1140
tgacttaatt gatctattac ataatcgtaa ataaattcta acatactctt gaagtgtaga 1200
atataagatt gataaacaat cctatatccg ttctaataga tataaaagca taaactttaa 1260
atattttaaa tccaagatta agaatcaatg atccacttat cctagactca agatattaga 1320
aatttttttt tgtacaatag atagaggatg tactggtgaa aatcatgtag cgatatccaa 1380
aataattttt aattaaaaat attatccttt tcattatcaa tgaattttat ctataagaaa 1440
gatcaaatca tatgatccat cttaaatttt taactcaaaa aattaatatt gcaaactagc 1500
tcaaaataat tttgatcact acatttctgc tgtgcattct aatttaaacc gttcacattt 1560
tttagattca tgaaataatt ttgaccaaag tattactcca tactatagtc aaaaaagatt 1620
aaaatattag attctaatta aagccaaaga taaacttttg attctcatcc ttaattttgc 1680
ctaaagtata attattttga ttaaccctta agcgcaataa cacattcaaa accaacagat 1740
aggtttacta taatccaaat gaattaaatc ttaattcttt tatcaattca tttagacaat 1800
ttcaaatcaa aattctataa gtaatatcaa taaaaaaaat ttttgatgct ccaataagtt 1860
agaacttaaa tcaaaatata taagtaaaat tgatttaatc atctcttcta aagtttcttc 1920
tattaagatc tttaatatct atcaaataca ttccacaata atcatgcaaa ccttttaaaa 1980
attaaattct caatgccttt actacatttt aacaccaagc tcgataatag tgataaagaa 2040
acatctagat cagctttata atcaaaaatt ttgacttaca attttacgtg tgtctcaaaa 2100
tcttgaataa atataaataa gatcttttat cttgatccaa aaatagtaat caaggatttc 2160
attagtaact tcaacaacaa tggtaaaaaa attttctatc cattgataaa cccaaatttt 2220
gaattgaagt ttcatgcata ccatatagcc tttaataaga tctattattt ggatctaaag 2280
atagtaatta aaattgttaa tgattccact aagatgaata ctttacaatc tcataattaa 2340
tttcttcaat aaaaatagac ttcttgataa tgtctccaat tgtatatttt tttttatttc 2400
tacaagaaaa cttcatacat tttttacgtt ccaatataaa tcttaaaaag ttattccaat 2460
caaatatcat aaaagatctt cttagtccaa ccttaaataa cttttatgaa tgaatcttta 2520
tcttgccact aaataatgaa ttttaaaatc aagagcaaca tcacagcatt ctgtcatgtc 2580
aaatttgtgt tagatgtatg tcctagaaat caattagatt gacaatgtaa attttttaag 2640
gatataattt atatattttg atttattaat aaaataaaat ttaaattaat ttttattcat 2700
atttttttat ctatgaatca tctaaagaat taataagatg atgatacata ttcttaagag 2760
ttcaaaattt gaaatatatg tcattgatga ttaatttctg aatacttttg aattcttaag 2820
agtttagaag atcttgaccc aagtagtgtg aatagtgaaa aaaagttttc acatacttca 2880
catcaaaaat ttaagttgaa taaattgtac atatgacagg tattatagtt tgacgagtaa 2940
tctataacct ctatcttatc aaaattctga tagaaagatt gtattgtatg ataactgtac 3000
ttagaggttc accttttatt ttactggatt accactacat gttgctagat gtcactggtg 3060
gattgtgaga tctacgaaga ttatcttgat gatcgataat tctcattgaa aagattgaaa 3120
ctattttaat gatgttgtga tagagatcat aatatatctt attatcagac agaatagaat 3180
tctatgggat catacacaat aggagattaa gactgatcaa atagttgaat gatgattaag 3240
aatcattacg gagttcagat tatcaatata attgataatt agactaactt ataattgtta 3300
caagtagcaa ggacttaact gctaaaggtt aataggttca aaaagaactt atgtataaat 3360
gttgtgcatc ttaatttgat tggatcaaat tagttatggc tgaattcaag atgaatcaaa 3420
taggaatttg gttcaattga atttgggtca agctttaggc ttaggtcaca tatacccaaa 3480
atcatttgga tgcatcaggt gtgtgacacc tgaatcaggc ctttctaaac tattttgagt 3540
aagtttgatc aagtcaaaag gatccacacc ctaaggtttc ttgaataaaa ccttaggcac 3600
cacattgagg acctatagga aactttgacc ctctctcata tggggtggca cactgaggtt 3660
ttataaaaac cttaggcacc cattttagcc ataaaaaaaa agctccaagg gatggggcag 3720
tagccatgaa gaatccttgg ctgtcaggac tctattcaaa agagttctca aggttttgga 3780
ctcttatgga gccctaggat ttgtttgcct ataaatagat ggccacccca aggctttaga 3840
taatgttaga gacttgtgaa gctctcccct ttctcttggt tgccggccca ccctctctcc 3900
tctctcttcc atgccccaag acttctttct tgtctccatc atcttgctga aatttagatt 3960
tcagcaagaa aagtcaagta gaagtcaaag ttctaatgta gctcacaaga tgttgagaac 4020
ttcctccatc tggcaaaggt tctgcaagag agctagcatc c 4061
<210> 37
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 37
tcttttatct tgatccaaaa atagtaatca aggatttcat tagtaacttc aacaacaatg 60
gtaaaaaaat tttctatcca ttgataaacc caaattttga attgaagttt catgcatacc 120
atatagcctt taataagatc tattatttgg atctaaagat agtaattaaa attgttaatg 180
attccactaa gatgaatact ttacaatctc ataattaatt tcttcaataa aaatagactt 240
cttgataatg tctccaattg tatatttttt tttatttcta caagaaaact tcatacattt 300
tttacgttcc aatataaatc ttaaaaagtt attccaatca aatatcataa aagatcttct 360
tagtccaacc ttaaataact tttatgaatg aatctttatc ttgccactaa ataatgaatt 420
ttaaaatcaa gagcaacatc acagcattct gtcatgtcaa atttgtgtta gatgtatgtc 480
ctagaaatca attagattga caatgtaaat tttttaagga tataatttat atattttgat 540
ttattaataa aataaaattt aaattaattt ttattcatat ttttttatct atgaatcatc 600
taaagaatta ataagatgat gatacatatt cttaagagtt caaaatttga aatatatgtc 660
attgatgatt aatttctgaa tacttttgaa ttcttaagag tttagaagat cttgacccaa 720
gtagtgtgaa tagtgaaaaa aagttttcac atacttcaca tcaaaaattt aagttgaata 780
aattgtacat atgacaggta ttatagtttg acgagtaatc tataacctct atcttatcaa 840
aattctgata gaaagattgt attgtatgat aactgtactt agaggttcac cttttatttt 900
actggattac cactacatgt tgctagatgt cactggtgga ttgtgagatc tacgaagatt 960
atcttgatga tcgataattc tcattgaaaa gattgaaact attttaatga tgttgtgata 1020
gagatcataa tatatcttat tatcagacag aatagaattc tatgggatca tacacaatag 1080
gagattaaga ctgatcaaat agttgaatga tgattaagaa tcattacgga gttcagatta 1140
tcaatataat tgataattag actaacttat aattgttaca agtagcaagg acttaactgc 1200
taaaggttaa taggttcaaa aagaacttat gtataaatgt tgtgcatctt aatttgattg 1260
gatcaaatta gttatggctg aattcaagat gaatcaaata ggaatttggt tcaattgaat 1320
ttgggtcaag ctttaggctt aggtcacata tacccaaaat catttggatg catcaggtgt 1380
gtgacacctg aatcaggcct ttctaaacta ttttgagtaa gtttgatcaa gtcaaaagga 1440
tccacaccct aaggtttctt gaataaaacc ttaggcacca cattgaggac ctataggaaa 1500
ctttgaccct ctctcatatg gggtggcaca ctgaggtttt ataaaaacct taggcaccca 1560
ttttagccat aaaaaaaaag ctccaaggga tggggcagta gccatgaaga atccttggct 1620
gtcaggactc tattcaaaag agttctcaag gttttggact cttatggagc cctaggattt 1680
gtttgcctat aaatagatgg ccaccccaag gctttagata atgttagaga cttgtgaagc 1740
tctccccttt ctcttggttg ccggcccacc ctctctcctc tctcttccat gccccaagac 1800
ttctttcttg tctccatcat cttgctgaaa tttagatttc agcaagaaaa gtcaagtaga 1860
agtcaaagtt ctaatgtagc tcacaagatg ttgagaactt cctccatctg gcaaaggttc 1920
tgcaagagag ctagcatcct gagaaacaaa aagattgctg atcagccctc atctccatat 1980
ggatatttgt agagatcaaa tgcatgcata gctagaagag aatcttatca cgatcatcac 2040
tcgtgaagat catctacctg tgcaaaggta tgagataaga aaaatatttt ttttatcata 2100
attcatgaat cctttgctta tattatactg agattcttgg aatggatttt ttctctagta 2160
aaactctaga gatcagatct caaagtcttc ttcacataaa ggttttgaaa gttctttata 2220
tttccgctgc tttgattcaa aataaattag atctattttg cctttcaacc tttctcatat 2280
ttattgacat ataaagcttt aattaatgag attaatgaaa agcatgtgcg aaatactgag 2340
aaaatcctaa cagtgatatc agagctactt ttgtacataa gaaaaggatt caagttaaat 2400
aaaatatgtt tgatttaagt aaatgaatca atcaaaattt atcctaacat aagtttgtcc 2460
tggtataatg gtcaagacca ttatgttgaa aggttatcct aggacaaaaa gtctaagtaa 2520
aatctatttt atttaagtaa atgaatcaat taaagtttat tctaatataa gattgcctta 2580
gcataatggt gaagaccctt atgttgaaag gttgtcctag gatggaaagt gattgatgag 2640
acaaatatat catgaaagta tttttcacag atggaataaa atatatatat tttgtttgtg 2700
aaaatgagat ttcatgaatg tgtttgtcat tcaatatgtg tggtgatcat cttgaattgc 2760
cacaaatcct ttttggatta gggttgtatc atgactcaca aatcctgatg gtttgcaaaa 2820
ttttgcattc tgtagtgata gaaaccaaaa gttaatccaa ttttggaata agattgatca 2880
attggtatct aaggcaagta ttttataatg gtggttactt aattagttat aaaagtacga 2940
agagtctcct accaatctta cacttatcta gccaatttgg ttgattgaat tctgaatttg 3000
ggttgcttaa gtgttaagtt cactacaaat atattgcaac catgattccg acttagtcaa 3060
ccaagcctag atctcttgaa tagattcatg ttaattatgg atttacatag gatataaata 3120
aataattaaa acttgaagag atctaaatga aaccttctcg tacatattaa atcgaatgat 3180
cttccatcat tgtagatata cggatactct actgatgttg atgattttcg actagatata 3240
gtactttggt tgcatcgaaa aagtacaacc actttataac atgagatgtt gcagggtaga 3300
gatggggttg ggcccaataa ttgttaggtg aggatccaaa tgatggctgc acttgcgtgt 3360
gaatggcgag tctgacttaa ttaagaaata gagctaataa ctattagatg aggcttcagg 3420
acttagagac ttatgaccac tacaacttac ttgagaagca atggataaag agtcgtctat 3480
ttatcaactg acgcatcacc aataactatc agatggagtg atgtataatt agtgggacta 3540
tagtatccac ttgaaatctt aatcgtaaaa atttttgttt ctccacctga agagcatggg 3600
agattcgaaa aaatagtggg ggtagtttat ttttaaaata aagctcctaa aataaactaa 3660
aataagttaa atacaaagtc taactagaat cttcttctct ctgtagaaaa tatctgcttc 3720
caacctctat ttcatatcct taagactaat tgtttgacta gacccagtta taaagattga 3780
ctctaaaact taaagatagt cttgagtttt gaaaagatga gctatgtcct ggatcaagat 3840
atcctctctc taccagcttg tcccacccct aatcaagggg catcctatga aaagtggtta 3900
aacgatgata acaaggcttg gtgctgtgtg ctgacatcta tgtccattga actccaatgc 3960
cagcataagg gtacaaactg tccaaggtat attgactcat ctacaagagt tatatagtga 4020
gtagagccat gtatctcact aggaagtatt taagagactc t 4061
<210> 38
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (3017)..(3951)
<223> n is a, c, g, or t
<400> 38
cagattatca atataattga taattggact aacttgtaat tattataagt agcaaagatt 60
taattgctaa aggttagcag attcaaggag gacttatgtg taaataatgt acatcttaat 120
ttgattggat caacttagtt atggctaaat ttaagatgaa tcaaacaggg atttagttta 180
atcgaatttg ggtcaagctt tgggcttagg tcacatgcac tcaaaagggt ttggatacat 240
caagtgtgtg acacccaaac caagcctccc taaactattt tgagttggtt ttgaccaagt 300
caaaagggtc cacaccctag ggtttcttga ataaaaccct aggtgccaca ttgaggacca 360
attaggaaac tttgacattc tttcacacgg agcagcacac tagggtttca tgaaaaccct 420
aggcacccat tttagccata aaaggaaagc tccaagggat gggatggtgc catgaagaat 480
ccctggccat tgggactcca ttcaaaagtt ctctaggttt tgggctctta tagagcccta 540
gggtttgttt gcctataaat aggtcgctac cccaaggctt tagataatgc tagaggcttg 600
tgaagctctc tcctttctct tgtttgccat cccaccttct ctcctctctc ctccatgcct 660
caagacttct ttcttctctc catcatcttg ttgaaattta gatttcaatg agaaggatca 720
agtagagtca gagttctact gcagttctca aggtgttgag aactttcttc atcaggcaaa 780
gattctgcaa aggagttagc acctcaaaga accaagaaag ttgctaatct gccctcatct 840
ccatgtggat acttatagag gccaagcatg acgagaagag ccttatcacg atcatcactc 900
gtggagatca tctacccgcg caaaggtatg agataagaaa aaaatatttt tcttatcatg 960
attcatgaat cctttgctta tgttacattg agactcttgg attagatttt ttctctaata 1020
aaatttcaaa gattagatct cgaagtcttc ttcacctaaa ggtattgaaa gttctttata 1080
ttttcgctac tttgattcaa aatagattag atttgttttg cctttcaatt tttctcatat 1140
ttattgagat atgaagcttt aattaatgag attaataaaa agcatatgtg aaatactgag 1200
aacatcctaa caatttgagc ttacaattca cttaaacaac taatgatcaa attaataatc 1260
acaatgcaca ataaaaattc atgataaatc tttttgttgt tactttagat caaaatccaa 1320
ctaatcataa catgatccac ggattgccta tcatatatca aaccctctga attattaatc 1380
ttaaacgatc ttttcattca tgatcataag atttagttaa aaatcatgaa gacaacttat 1440
attgtaatca tcatagatct gtatcttaac atccttagtg tttacctacc tatactcatc 1500
ctatgtttga ttctatatat cataatttat tcactaatac tttgatatca tataaattat 1560
cgcatcccca atctaagatc atattggtac tttaatattt cattagtggg ggttatgcat 1620
tagtactttg ataccttatc agttgaatgg ttaaacactg gtactttgat atcctatcag 1680
tggaggttat acgctggtac tttaatatcc tatcagtaag atggttaaat actgatactt 1740
tgataacctc ccagtgggtg ttgtatgcta gtactttatt atcctaccaa tggggcagtt 1800
aaatgctact actttgatac gctaccaatg ggatagttaa acgctagtaa tctaatctta 1860
gcttgacata aagtaacgtc gactcgagtt tagggtcgac tcgagagaat gttagggtta 1920
gcttgatatg aaagagggtc gctcgtcaat attttggagt caactcttgt ttatggacga 1980
tctagaaagt gtcagagtga gctcgagtac tgcatatttc tgatacattg tctatgctag 2040
aatgtgctag aactgattat cttctttatc aaagttgatt tttgagtaac ttgatgatca 2100
atttttctag gctagacttg ctttgtcaaa atgagcactt gttagtttag agaatcttca 2160
cctacacatg atctcaagca ttcattagta ccaaaaatac ttaagtattt tgatatcatc 2220
aaaatcaatt cttgggttaa cacaatactt ttcaaataat aagcatacag atataatcct 2280
ataacaattt aaattttgtt catatatcaa tttctttaaa aatattatat tcatcttgat 2340
agctatgaac taaatcaaaa tacatactag tatacaactt ttactgggag agtattagat 2400
taccagcatt taaccatccc actggcaagg tatcaaatta ccaatacaca acccctattt 2460
ataaagtatc aaagtaccag tgttcaactg cctcactggc aggatatcat agtactagta 2520
tttaactacc acattgacag gatatggaat tatcagtatt taaccatcat tagtagaatt 2580
ttgatgcata gtcaggctgc gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt 2640
ctaattctgt atcataattc attcccttat gctctaatat tatattaatt gtcatacttc 2700
tagctcgaga tcatgagcca aggattgcag taactaccgc atacttatag agaactcttt 2760
ctataagcat acaagatatt ctaaatatac tatcaatata tcatagagaa attaatttaa 2820
ataactaaaa gttaatattc aattaataaa ttcaactggc aaatgtattt aaaaatttta 2880
catcaaataa atcttgatta ataaatatta attaataaca atagatttaa atcgaaacaa 2940
ggttgatatt gttagaattt gatgcctcaa gattcagccc acattgagtc cacagtgagg 3000
ttcgcgacga aaaatgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac 3960
taaattttgc ttctaatctc actcttaaat agtacttacc tttgaaacta ggcatttgaa 4020
tctgaaaaag aaagaggaga ttatgagctt gatagttcag t 4061
<210> 39
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (2337)..(3271)
<223> n is a, c, g, or t
<400> 39
catcatcttg ttgaaattta gatttcaatg agaaggatca agtagagtca gagttctact 60
gcagttctca aggtgttgag aactttcttc atcaggcaaa gattctgcaa aggagttagc 120
acctcaaaga accaagaaag ttgctaatct gccctcatct ccatgtggat acttatagag 180
gccaagcatg acgagaagag ccttatcacg atcatcactc gtggagatca tctacccgcg 240
caaaggtatg agataagaaa aaaatatttt tcttatcatg attcatgaat cctttgctta 300
tgttacattg agactcttgg attagatttt ttctctaata aaatttcaaa gattagatct 360
cgaagtcttc ttcacctaaa ggtattgaaa gttctttata ttttcgctac tttgattcaa 420
aatagattag atttgttttg cctttcaatt tttctcatat ttattgagat atgaagcttt 480
aattaatgag attaataaaa agcatatgtg aaatactgag aacatcctaa caatttgagc 540
ttacaattca cttaaacaac taatgatcaa attaataatc acaatgcaca ataaaaattc 600
atgataaatc tttttgttgt tactttagat caaaatccaa ctaatcataa catgatccac 660
ggattgccta tcatatatca aaccctctga attattaatc ttaaacgatc ttttcattca 720
tgatcataag atttagttaa aaatcatgaa gacaacttat attgtaatca tcatagatct 780
gtatcttaac atccttagtg tttacctacc tatactcatc ctatgtttga ttctatatat 840
cataatttat tcactaatac tttgatatca tataaattat cgcatcccca atctaagatc 900
atattggtac tttaatattt cattagtggg ggttatgcat tagtactttg ataccttatc 960
agttgaatgg ttaaacactg gtactttgat atcctatcag tggaggttat acgctggtac 1020
tttaatatcc tatcagtaag atggttaaat actgatactt tgataacctc ccagtgggtg 1080
ttgtatgcta gtactttatt atcctaccaa tggggcagtt aaatgctact actttgatac 1140
gctaccaatg ggatagttaa acgctagtaa tctaatctta gcttgacata aagtaacgtc 1200
gactcgagtt tagggtcgac tcgagagaat gttagggtta gcttgatatg aaagagggtc 1260
gctcgtcaat attttggagt caactcttgt ttatggacga tctagaaagt gtcagagtga 1320
gctcgagtac tgcatatttc tgatacattg tctatgctag aatgtgctag aactgattat 1380
cttctttatc aaagttgatt tttgagtaac ttgatgatca atttttctag gctagacttg 1440
ctttgtcaaa atgagcactt gttagtttag agaatcttca cctacacatg atctcaagca 1500
ttcattagta ccaaaaatac ttaagtattt tgatatcatc aaaatcaatt cttgggttaa 1560
cacaatactt ttcaaataat aagcatacag atataatcct ataacaattt aaattttgtt 1620
catatatcaa tttctttaaa aatattatat tcatcttgat agctatgaac taaatcaaaa 1680
tacatactag tatacaactt ttactgggag agtattagat taccagcatt taaccatccc 1740
actggcaagg tatcaaatta ccaatacaca acccctattt ataaagtatc aaagtaccag 1800
tgttcaactg cctcactggc aggatatcat agtactagta tttaactacc acattgacag 1860
gatatggaat tatcagtatt taaccatcat tagtagaatt ttgatgcata gtcaggctgc 1920
gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt ctaattctgt atcataattc 1980
attcccttat gctctaatat tatattaatt gtcatacttc tagctcgaga tcatgagcca 2040
aggattgcag taactaccgc atacttatag agaactcttt ctataagcat acaagatatt 2100
ctaaatatac tatcaatata tcatagagaa attaatttaa ataactaaaa gttaatattc 2160
aattaataaa ttcaactggc aaatgtattt aaaaatttta catcaaataa atcttgatta 2220
ataaatatta attaataaca atagatttaa atcgaaacaa ggttgatatt gttagaattt 2280
gatgcctcaa gattcagccc acattgagtc cacagtgagg ttcgcgacga aaaatgnnnn 2340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac taaattttgc ttctaatctc 3300
actcttaaat agtacttacc tttgaaacta ggcatttgaa tctgaaaaag aaagaggaga 3360
ttatgagctt gatagttcag taaatcatga ataaattagc taaataaatc tatgaataat 3420
agtatattaa aaataaatat gtaagataca ataattcaaa aatgaattca tatatataat 3480
actttccaaa taataagtat gtggctgcaa tcctttcgta attcaaattt tgttcattaa 3540
ttattttttt caaaacatca catggatagt catgaactaa atcaaagtac cagtgcataa 3600
cccctattga taaagaatca aataacaagt gtttgactgc ctcattatca ggatatcaaa 3660
ttattaatgc ataacctcca ctgctagggt atcaaagtag caacctcaat cacctcactg 3720
gaagggcatc tagtttcagt atttaactac tccactggca aggtgttaaa ttatcaatat 3780
ttaacctcca ctgataggat tttgatatat agtcagactg cgagccaaaa ttcatttcaa 3840
accaaaatat ttttctcaaa gacatatttt atgtttcaca ttgaaaaatt cacaaaaatt 3900
atgcgatatt gaaatcaatt ggataaaatc cacgtcaaat ttagtatatt caatcataaa 3960
tcatttacta ttctagaaaa ggtatattaa aagtataatg catcaatttc ataaatcata 4020
aatatctcaa tataaaaaat attttattat ttattaataa a 4061
<210> 40
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 40
agtatattca atcataaatc atttactatt ctagaaaagg tatattaaaa gtataatgca 60
tcaatttcat aaatcataaa tatctcaata taaaaaatat tttattattt attaataaat 120
ctaggagaag tgaagcatta cttatcttgt aagtaaaact aaccaactga tcaaattaat 180
tctgagaatc tttctcaaaa ctcatcacca ctatatcaaa aacttgtgct tcttgctatg 240
taagagcata gaccctttct tcgatctggg gttccaagtt tctattttat tttgttcaac 300
tatcaaatta gactgacttt tcattttttt gtggatattc agctatttta tggcctttct 360
aacaataacc aaagtatgta ccaatattcc aacaataatc atttattgca tgattttcac 420
cgcatcgaaa tatttgatat tatcaatcaa tccaaacttg ttattcactg acctcttatt 480
caaaccctta gtatatttaa tattctacct ttgtgattca ttcaatcgat ttcttttttt 540
tattttcttt ccctttctat atgctcttca ttaacttttc tttcaattat caatgcttta 600
ttcaatacat ctgtataagt agttaactca tatagtacca tttattttct aatttctatc 660
ctcaattcca actcaaattt atctactcag tcacattcat cttcaaccaa tctcgaagca 720
aacttgacaa gctccataaa tttagcttca tattctacaa ctattatatt tctttatttc 780
agataaataa atttttattc tttctgaatc ctcatactct aagaaaaata tttttatcat 840
aaaatatctt ttgaaatcac tcccaagcga gttgttctcc atcttgttca tatttaggtt 900
tcattctcta ttatcaatta aatgtctcat ctttcaacat gtatgatgca tataagattt 960
tttcatcatc atggtatctc ttaacaataa atgctttctc catctccata agctaatttt 1020
tagctcctat ttcatagttt tcttaaaagt caatggagac aacttcttaa attctatgat 1080
attactttat tgctcctatt gctcttatgt ccttgtggtg acaatattta ttgttgcact 1140
tgctgtagag gcagttactg ttactgcaat tgctattacg attccatcaa gccgactagt 1200
gtctgcatta tttggataat agttgatttt tgctacttta tttagatgtt ggtggcaaaa 1260
tcaatgactt ctttttgctg agagatgcca ccaacctact aagtatcatc atcttattgg 1320
ttgatacctt tagcagcacc tcgagtggtt ctttttatct gatatggaac catcttaatc 1380
ttgcatgaaa aacaaacttc gcaaaatttt cttttaaaat ctaatatcta atattatact 1440
tttattaaaa tttaattatg attattttaa gaataaaaaa tttaaatttt gaaatcctca 1500
caaggctggc caagagataa tgaccatcat cctagtcggt ttgacgtagg acatccaaag 1560
atcaactata attcaagcat catattgaga tgctaggata taatcgatgg tgaaatttaa 1620
tgatgctcga ctgatcaaga tgggggccgg cccgatggcc tgttcaacaa tcattgatca 1680
aaatttttta accaaggtct atcaagatca ttaaaaagtc tttctaagat ctataaattg 1740
taataaagag acacaatcta gagagagaca ctttttacat aaagaaagta gaaattttag 1800
ggagagaaat tagagagaaa ggggaaagag agaggaagct gagaggaaga aagaaaagag 1860
aaagactctc tctctttttc ttttctttct tttctttctt ttctttttct tttctttttt 1920
tcttcctttt ctttctttct ttctttggct cattagaaaa ataggggacc tattgatccc 1980
cttgtttcct aaatagggga ggaatctcat cttggtagct atggccggcg atgtgagcca 2040
aagtggcaaa atcatgaatc tcccaacttg cagccgacat tgacttttgg cactggaaaa 2100
tcaaagaaat ttgacaaaaa atgggaaaaa attgaaacca aaatagggac caaaatccgg 2160
taatagctag ccaaaaatcc ttgatctttg ctcatggagg ataggaaaaa agattattca 2220
agagattaag ggaatcttat ctcatttttt tgctgtgctt cggccatggt ggttgcagaa 2280
atcgtttgtg aaagctcgac aaactctgca atttcctcgg gcttgggcct cgatctttaa 2340
taggagaaga gagaagtcct ctttctttta aatagagtcg gagggaagga gtttgatttc 2400
ctccttatgg tggtttcaaa ctctgatcgg aagtccattg gaaaagaaga ctcccattag 2460
ttttaaaatc taataagatt tattgattag aaaattgata aaaaatgatt attaaaaaag 2520
tagcataatt atttaaatca atgatgctta gattgttgga ggtaaatagt aataaaatca 2580
aaaaattaaa attcatggga ccaaaaaata atgaacaaga tttgaaagaa atgtctataa 2640
ataagaattt atgaaacagg ggaacattga tcaaaggtgt gttaaatagt gtccttaaag 2700
tgttattgtc cctctcacgt agactttgtg tgttgggaga gaacatagta attctctcaa 2760
cctatgcaac ctaaatcttt tgaaaagaaa tttaaaatta tagaaaaatt ggcaaactag 2820
aattttggtc attttcttta ttagtaaaaa atatactaag ttatatgtct ttatttatac 2880
tagtgaggtc tatctttgca caattcagac caaatttata ttctagttaa aagaggtata 2940
gattttttaa aatagatata actagtggaa atagtcatag aaaagttaaa aatcaatgaa 3000
aggtagattt cacttctata ttggctttat ttgtggtcac tttatctaat tctttttttt 3060
gatggagcaa tataccctgt taaaatcttc tcgatttttt tttcacttta agcaacctat 3120
ttcgatgcct aaacaatgga atttagttta accacttaat atgctacact tttaaaagga 3180
gcaccatatt gtagggcttg aaaagttact tgatttaaaa aaagagcatc ttaattggac 3240
atcatacaag taagttatga cctctgaaaa tttgatacat gatttatcat cttgatatgg 3300
taaatcttgt taagatttcc tcatggtgtc taaagtggcc ggttcatact gagtttggtg 3360
attcttctgg tcaatggtta attgctcgaa tatttttaag atataactaa tctccaactc 3420
tgccgactcc ttagtagtat gagcacatgg aaagcttgac ctaattgatt tcttaaattg 3480
cttgaaatca gtacttagaa aatatgcaaa atggatgaaa tgtttattgc agcgagagct 3540
ttctgatctg tacgaccgag agcttactag ttttttatga gctatacgtt ttgcacttaa 3600
gcctaattta aatagtgaaa tagttttgca acaattcaaa acaattaaaa tcaaaagaca 3660
agctgctatg catgttcaac tgactcggct ttcaatcgca atatgtcaca taggctggcc 3720
tagaatgcag atgcgtgcgt ggtgagcatc ctaaaaacct acatatccaa taaattccca 3780
ctagttggtg aagtattaaa tgtaactcgt attaactttt taatgtagga ctaaagttta 3840
ttcgactaat taagaactaa atactttaat aattgaactt ttccaaccag aaatcagaaa 3900
atatttaagt aattaaatat tacataataa ctagatcaaa atatcatggt tcctctctcg 3960
ctcgagatca attgggatgt tggtttatct tggtcatcca tcgagatgac tctatcttag 4020
cctttcaaaa cggcgcggta ccacgggtct caccgcttcg t 4061
<210> 41
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 41
caaaattttc ttttaaaatc taatatctaa tattatactt ttattaaaat ttaattatga 60
ttattttaag aataaaaaat ttaaattttg aaatcctcac aaggctggcc aagagataat 120
gaccatcatc ctagtcggtt tgacgtagga catccaaaga tcaactataa ttcaagcatc 180
atattgagat gctaggatat aatcgatggt gaaatttaat gatgctcgac tgatcaagat 240
gggggccggc ccgatggcct gttcaacaat cattgatcaa aattttttaa ccaaggtcta 300
tcaagatcat taaaaagtct ttctaagatc tataaattgt aataaagaga cacaatctag 360
agagagacac tttttacata aagaaagtag aaattttagg gagagaaatt agagagaaag 420
gggaaagaga gaggaagctg agaggaagaa agaaaagaga aagactctct ctctttttct 480
tttctttctt ttctttcttt tctttttctt ttcttttttt cttccttttc tttctttctt 540
tctttggctc attagaaaaa taggggacct attgatcccc ttgtttccta aataggggag 600
gaatctcatc ttggtagcta tggccggcga tgtgagccaa agtggcaaaa tcatgaatct 660
cccaacttgc agccgacatt gacttttggc actggaaaat caaagaaatt tgacaaaaaa 720
tgggaaaaaa ttgaaaccaa aatagggacc aaaatccggt aatagctagc caaaaatcct 780
tgatctttgc tcatggagga taggaaaaaa gattattcaa gagattaagg gaatcttatc 840
tcattttttt gctgtgcttc ggccatggtg gttgcagaaa tcgtttgtga aagctcgaca 900
aactctgcaa tttcctcggg cttgggcctc gatctttaat aggagaagag agaagtcctc 960
tttcttttaa atagagtcgg agggaaggag tttgatttcc tccttatggt ggtttcaaac 1020
tctgatcgga agtccattgg aaaagaagac tcccattagt tttaaaatct aataagattt 1080
attgattaga aaattgataa aaaatgatta ttaaaaaagt agcataatta tttaaatcaa 1140
tgatgcttag attgttggag gtaaatagta ataaaatcaa aaaattaaaa ttcatgggac 1200
caaaaaataa tgaacaagat ttgaaagaaa tgtctataaa taagaattta tgaaacaggg 1260
gaacattgat caaaggtgtg ttaaatagtg tccttaaagt gttattgtcc ctctcacgta 1320
gactttgtgt gttgggagag aacatagtaa ttctctcaac ctatgcaacc taaatctttt 1380
gaaaagaaat ttaaaattat agaaaaattg gcaaactaga attttggtca ttttctttat 1440
tagtaaaaaa tatactaagt tatatgtctt tatttatact agtgaggtct atctttgcac 1500
aattcagacc aaatttatat tctagttaaa agaggtatag attttttaaa atagatataa 1560
ctagtggaaa tagtcataga aaagttaaaa atcaatgaaa ggtagatttc acttctatat 1620
tggctttatt tgtggtcact ttatctaatt cttttttttg atggagcaat ataccctgtt 1680
aaaatcttct cgattttttt ttcactttaa gcaacctatt tcgatgccta aacaatggaa 1740
tttagtttaa ccacttaata tgctacactt ttaaaaggag caccatattg tagggcttga 1800
aaagttactt gatttaaaaa aagagcatct taattggaca tcatacaagt aagttatgac 1860
ctctgaaaat ttgatacatg atttatcatc ttgatatggt aaatcttgtt aagatttcct 1920
catggtgtct aaagtggccg gttcatactg agtttggtga ttcttctggt caatggttaa 1980
ttgctcgaat atttttaaga tataactaat ctccaactct gccgactcct tagtagtatg 2040
agcacatgga aagcttgacc taattgattt cttaaattgc ttgaaatcag tacttagaaa 2100
atatgcaaaa tggatgaaat gtttattgca gcgagagctt tctgatctgt acgaccgaga 2160
gcttactagt tttttatgag ctatacgttt tgcacttaag cctaatttaa atagtgaaat 2220
agttttgcaa caattcaaaa caattaaaat caaaagacaa gctgctatgc atgttcaact 2280
gactcggctt tcaatcgcaa tatgtcacat aggctggcct agaatgcaga tgcgtgcgtg 2340
gtgagcatcc taaaaaccta catatccaat aaattcccac tagttggtga agtattaaat 2400
gtaactcgta ttaacttttt aatgtaggac taaagtttat tcgactaatt aagaactaaa 2460
tactttaata attgaacttt tccaaccaga aatcagaaaa tatttaagta attaaatatt 2520
acataataac tagatcaaaa tatcatggtt cctctctcgc tcgagatcaa ttgggatgtt 2580
ggtttatctt ggtcatccat cgagatgact ctatcttagc ctttcaaaac ggcgcggtac 2640
cacgggtctc accgcttcgt tacatcgaat gccaccatcc cttttttttt tttttttatt 2700
tatttatgct ttcttgctcc tagattggtg cggcctcatt acaactccac tgctacttga 2760
tgcttccctc tagcatctcc tttgcagctc tctcacttcc accactcttc ggcctaatgt 2820
tgggaaacga cgaaggggcc ttacaaaaat gtcatccatg atggcagtgg agaagaaaac 2880
atcgctgggg ctttccttcg atatccttcg cagccaaagc tcttataggg ttatatggga 2940
gaacgctgca ttatttgggt gatctttttg gatggtgttg ttgactgatg ctagttttgc 3000
ttcatgaatt gaatatttac acaagatgag aatacaatct agtacaattg gtaccaatta 3060
cctgggtttg actcctgctc gcatctgatt gaagcttggt taatgtgcat ctcaattaat 3120
tcagaaagat catcggactt catgtgaatt attttgacta gcatgaatag ggctaaataa 3180
ggctgaaata tgtgttaaat ttttaaaatt ataacttgat catatgatgt ccaattgaga 3240
tgttttcaaa tcaaaaattt ttttcgagat ttatcactta atgttaaact cttagaaggt 3300
cgaaacagac tgaaagtttt cttttcaaga tgtattttga ccgagtatat aacttgatga 3360
tcatatgatg cccaattgag atgttttcaa atgaaaattt tttttgagat ttatgactta 3420
atgttaaact cttaaaaggt cgaaacagac tgaaagtttt cttttcaaga tgtattttga 3480
ccaaatatat ctcataatct ataaagaata tatttcataa tctatgaata attagataga 3540
gcgacagaag ataatgctaa tgtaaaaatc acgatctatt ttttataaaa tttaatattt 3600
ttatataatc acttttacta tagtcatatt tattttaaaa aatttagtta tatttaaaat 3660
atcaaaaaaa tttgacttga attatataag aaaggatctt cctactatta tagatagaag 3720
ctttatatca tagtttacag tgtatggatc atcaatgaaa gaaagaggga tgtaaacctt 3780
acttttgaaa tttttctatt tgtttctaaa ttttttaaag gatccaagtt gagaattgag 3840
agaattcttt ctttctgcaa atcaaatcat tagtataatc cacatggaga cgttgtaata 3900
gaaagtagaa actatatttt atgaataata gaaagggagt tgatttacgc caagcctttt 3960
gtttgcttga ttaattattt atttttatgg tgttagctgg accccatgaa tagcaaccat 4020
cgttgggtca gggtcgtgta tttgttttgg ggtcttcatt a 4061
<210> 42
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 42
caagtactcc agaatcaaaa ttgtgaaaga aaaataggat aaatctggtt aagctgtaat 60
ttatttactt actttctatc tatattaaaa ttattcagat tattttgcaa atttatggat 120
atgcttgaat cacgtatctg atactttctc ttcatctgga tggcagtacc atgtgatcac 180
cacgcagacg gatacctaca agaaaaaggc aaggctaaca tgctttctta ccatcattct 240
ttacggtctt tgatccggtt ttgcgtgtcc acttcttacg tagtcttttt caaacattcc 300
tatctaagac tgaaggtaat gatttgcaaa ggaatagctt tactgttttc ctctaagtag 360
atgaaatatt actcacgtag aaaggagcca tcataattgc agaaagaata aaactgaatg 420
gaatatgagt agaattgtca aaatcttggt ttaagggttt taatagccag atgagaaagc 480
aacctacttt tcttgaacaa cttgtttgtg actgtcttgt tgctcccatc ttgcatctat 540
gattagcaaa atatatgata aatagatatt cagatttgat cgaaaagaag gaagattttc 600
tttaatccat ttaatttgaa tctcacaaaa aaaaagtaga agatttggac acgatcgctg 660
ggggcagcac gctcttaata gaatggtgtc acgttgcaga tctcgaaaaa ttattcaatt 720
ttttttaaaa aaaaagagtc attgaaatta gacgttgtat gaccatgtta tgatctctga 780
aagtttgact tctgactcaa cttcccaatg tagcagattt tactcctgaa ccatgtttaa 840
cctcctgact catagtggcc aaagtatcta catcgagttc actggtcttc ttggatcaca 900
ttcataagaa tacttcccat aattttgctc aacgttgttt ttctcatcaa ccaaaggtat 960
atgcttttta aaattgaaat gcccatgaat attatggcat tcttttattt gacattttgg 1020
ttgatcctat attgtttgtt tggcattcaa cacttcttca tgggaacctt tgaaatgagg 1080
taggtgctag gatttttctt tttacctatc catatcatat ttccaatgtc ttcttttaca 1140
ttaggttctt tagtgacaat aggggaaacg acccaatata atacccttga aaatttgggc 1200
aatatctact aaaactaact tgaataaaat attaacataa aaagggattt agtaacataa 1260
aagcataact caaaatcact caccttgtgt gccacgttct cattgccctt attatttttg 1320
cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt ggaagagagt tgaatggctt 1380
tgttgagtaa ttgttttgag ttactatagc attgctctac taaaattgaa atcttgctgt 1440
gaggctatgt atgagaagca agttcatgct ttttgactgt tgggatggaa gtatgagcaa 1500
tctttttaat agaaaatgga cgaatcatga agtttttcct ttttattgaa aaagatgatc 1560
gaaaaatatg tgcaagatag aaaaacactg aaaagataaa atgagaagta aaagtggaag 1620
tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga ggatgtgtgc accaacaaag 1680
ccaactttca ctaaagaatg taatgactca cctctacttt cttcgaataa ggggttccca 1740
gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa atggagcaat tccttctaag 1800
aaatattatg gcatttctct cccacgaaat ttcaaagcaa agagcagcta gtagttgatc 1860
ctctaatctc ttaattgaag tttggaattt ctcttgcctc tatttggccc aaaggtcatg 1920
aagatctacc ggccaacctc ttaagttgaa ttagatctta atagaagtcc aaatgcttct 1980
tgtagaagaa catctaataa ataaatgagt gatagattct aatccagaga caaagagcac 2040
acctcgaatt cacttgccat ccttttctag ctagaacttc tctagcatga aacttgttcc 2100
ttaaggcaag ccaaataaat actcacattt taggaatgac tgccttccaa ataattttat 2160
aatatggaca aattagacca ccattattga taaacttgca atgaacaatt ataaatgagt 2220
tttcaggttg gcacattagc aatataggat ggtttgatta ttaaaaggat gatatgaagg 2280
gtttcaaggt ggtttgcctc gttcaaatca aaggattttg aagattaata ttccaagata 2340
aggttctcca actccattag gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc 2400
aaacttgaca gatgttttat ttatttagag tgacacagat accctttggc aatactctcc 2460
atccttgtcc gaacaacttc taatcacacc tcacttatct tgcatctaac tcagaggcta 2520
caagttacac ctttcaacaa accttttcgg tttgaaaatt tgtgatttca ttatttagag 2580
ttcgaagagc atatcaagta ttggtcggag ttggcaccca aagcaaacga aacagttact 2640
gacatggtcc aaaagctgag atttctaaga tcccaactta agcactgaat aaagccatta 2700
tgggaaatat cattttaacg aaagaggaat ttagagtaag aattgattct cttgataccg 2760
aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 2820
cactagacca tcttctaaaa taggaagatc tatggaagca acactcccaa atgcagtggc 2880
ttcaaaatgg ggattgcaat acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa 2940
gaatactatc actgaactct agcaaggcga tcagaagatt atcgaatagc agcaaatcca 3000
atccacattc tacaactttt tttctaccct actaggctcg actgaggaat gactcatcca 3060
agctgattgg aagattcttt atccagaagg acctctggat cttgctgaca ttgagtatcc 3120
atttatggag aaagaaatcc atgatacagt gtatgacttg gctttggaaa agtcacccgg 3180
atgatatttt cccattctcc ttctataagc acttctagtg tatcatcaaa catgacctga 3240
tgaacctact gtaaaatcag ctaatgtaga ccatctgaac tacttgttca tcacccttat 3300
cccaaaaaaa aattggtgtg tattcagtta gagacttcag gccaataagc ctgattaatg 3360
gagtaataaa aaatatttca aaaactctat cgaaaaggct cccacagaaa atgaatttgt 3420
taattttatc cacagagctt gctttcaaca gaggaagaaa tatctctgaa tattttgtaa 3480
tgactatgga aactatacac ttctgcaaag ctgaagtaca caaggatctc aattataaag 3540
tcgacttcga gaaagctttt gacaatgtgg attggagctt tctattgaaa ttgctatcca 3600
gcacggggct ttgattcgag gtggtgtcaa tggatagaat atctgattta tacagctaaa 3660
ttctcagtcc ttattaatgg tgataaaggt aaacttttta aattgaggaa agatctcagg 3720
caaggagatc ctctattcgc ctagctcttt ctcttagttg ttgatataga atgatcaagg 3780
gagcaagtag gttcaatctt tttgttggaa ttggatcata taatatcatg ggataacttc 3840
aaagctttta gttcactgat gacacactta tattttgcag atatgatcta aaatacatca 3900
aaactcttaa atttttactc tatagttatg agctactgat gggtctcaaa attaactttg 3960
aaaaattcca attttttggc ttgagaattg caaagatgtc agtacagcaa gttgcatcta 4020
tcctagaaag caaggtggct acattttcca ttacttattt g 4061
<210> 43
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 43
gaccatgtta tgatctctga aagtttgact tctgactcaa cttcccaatg tagcagattt 60
tactcctgaa ccatgtttaa cctcctgact catagtggcc aaagtatcta catcgagttc 120
actggtcttc ttggatcaca ttcataagaa tacttcccat aattttgctc aacgttgttt 180
ttctcatcaa ccaaaggtat atgcttttta aaattgaaat gcccatgaat attatggcat 240
tcttttattt gacattttgg ttgatcctat attgtttgtt tggcattcaa cacttcttca 300
tgggaacctt tgaaatgagg taggtgctag gatttttctt tttacctatc catatcatat 360
ttccaatgtc ttcttttaca ttaggttctt tagtgacaat aggggaaacg acccaatata 420
atacccttga aaatttgggc aatatctact aaaactaact tgaataaaat attaacataa 480
aaagggattt agtaacataa aagcataact caaaatcact caccttgtgt gccacgttct 540
cattgccctt attatttttg cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt 600
ggaagagagt tgaatggctt tgttgagtaa ttgttttgag ttactatagc attgctctac 660
taaaattgaa atcttgctgt gaggctatgt atgagaagca agttcatgct ttttgactgt 720
tgggatggaa gtatgagcaa tctttttaat agaaaatgga cgaatcatga agtttttcct 780
ttttattgaa aaagatgatc gaaaaatatg tgcaagatag aaaaacactg aaaagataaa 840
atgagaagta aaagtggaag tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga 900
ggatgtgtgc accaacaaag ccaactttca ctaaagaatg taatgactca cctctacttt 960
cttcgaataa ggggttccca gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa 1020
atggagcaat tccttctaag aaatattatg gcatttctct cccacgaaat ttcaaagcaa 1080
agagcagcta gtagttgatc ctctaatctc ttaattgaag tttggaattt ctcttgcctc 1140
tatttggccc aaaggtcatg aagatctacc ggccaacctc ttaagttgaa ttagatctta 1200
atagaagtcc aaatgcttct tgtagaagaa catctaataa ataaatgagt gatagattct 1260
aatccagaga caaagagcac acctcgaatt cacttgccat ccttttctag ctagaacttc 1320
tctagcatga aacttgttcc ttaaggcaag ccaaataaat actcacattt taggaatgac 1380
tgccttccaa ataattttat aatatggaca aattagacca ccattattga taaacttgca 1440
atgaacaatt ataaatgagt tttcaggttg gcacattagc aatataggat ggtttgatta 1500
ttaaaaggat gatatgaagg gtttcaaggt ggtttgcctc gttcaaatca aaggattttg 1560
aagattaata ttccaagata aggttctcca actccattag gaaagtgtct tcatgtcatc 1620
ttagagaagc agctcgtacc aaacttgaca gatgttttat ttatttagag tgacacagat 1680
accctttggc aatactctcc atccttgtcc gaacaacttc taatcacacc tcacttatct 1740
tgcatctaac tcagaggcta caagttacac ctttcaacaa accttttcgg tttgaaaatt 1800
tgtgatttca ttatttagag ttcgaagagc atatcaagta ttggtcggag ttggcaccca 1860
aagcaaacga aacagttact gacatggtcc aaaagctgag atttctaaga tcccaactta 1920
agcactgaat aaagccatta tgggaaatat cattttaacg aaagaggaat ttagagtaag 1980
aattgattct cttgataccg aagaagaact aatacagctt tcatcacttc aaaatgatga 2040
acagatgcat ctcaagtcag cactagacca tcttctaaaa taggaagatc tatggaagca 2100
acactcccaa atgcagtggc ttcaaaatgg ggattgcaat acgaagttta tccatgtttg 2160
ggcaagtaac aggaaaaaaa gaatactatc actgaactct agcaaggcga tcagaagatt 2220
atcgaatagc agcaaatcca atccacattc tacaactttt tttctaccct actaggctcg 2280
actgaggaat gactcatcca agctgattgg aagattcttt atccagaagg acctctggat 2340
cttgctgaca ttgagtatcc atttatggag aaagaaatcc atgatacagt gtatgacttg 2400
gctttggaaa agtcacccgg atgatatttt cccattctcc ttctataagc acttctagtg 2460
tatcatcaaa catgacctga tgaacctact gtaaaatcag ctaatgtaga ccatctgaac 2520
tacttgttca tcacccttat cccaaaaaaa aattggtgtg tattcagtta gagacttcag 2580
gccaataagc ctgattaatg gagtaataaa aaatatttca aaaactctat cgaaaaggct 2640
cccacagaaa atgaatttgt taattttatc cacagagctt gctttcaaca gaggaagaaa 2700
tatctctgaa tattttgtaa tgactatgga aactatacac ttctgcaaag ctgaagtaca 2760
caaggatctc aattataaag tcgacttcga gaaagctttt gacaatgtgg attggagctt 2820
tctattgaaa ttgctatcca gcacggggct ttgattcgag gtggtgtcaa tggatagaat 2880
atctgattta tacagctaaa ttctcagtcc ttattaatgg tgataaaggt aaacttttta 2940
aattgaggaa agatctcagg caaggagatc ctctattcgc ctagctcttt ctcttagttg 3000
ttgatataga atgatcaagg gagcaagtag gttcaatctt tttgttggaa ttggatcata 3060
taatatcatg ggataacttc aaagctttta gttcactgat gacacactta tattttgcag 3120
atatgatcta aaatacatca aaactcttaa atttttactc tatagttatg agctactgat 3180
gggtctcaaa attaactttg aaaaattcca attttttggc ttgagaattg caaagatgtc 3240
agtacagcaa gttgcatcta tcctagaaag caaggtggct acattttcca ttacttattt 3300
gggtctccca ctccatcatt ctaaactgag gaaaacttat tggaatccac tccttgagaa 3360
ggttcagaag aaattgatcg ggtagaaagg taaacttctt aacctctagg gtaggcttat 3420
actaactaat gcagtgctta cagggatccc actactctgg agggatacat tccttctccc 3480
tcaattcatt atcaaataaa ttgataaaat ccatcgatca ttcatttgga gaggaaacga 3540
ggagtataac taagggcact ctagaatatg ttggtcgaat atttgtcgat caaaaaaatt 3600
tggaggactg ggggttcctc aatctaaaaa ttttcaatac aattcttctt tgtaaatggt 3660
ggtggaagct ctactctaat gctggtgacc cgtggtgtag ttttattgcc actgtccacc 3720
caacttcaca ctagagatct aaaggtatac acaaatcaac ctcttcattt tggaatggtt 3780
tacagcacac atgaaatatt tctactccta atccactttc aagttagcaa ctagtattat 3840
tttggaaaga tagttggtta cataatcatc cactgaagga tcgatttcct cacctttaca 3900
caatagcatt gaagtgcaac aactcagtgg caaaggtatt aagcaatcta cttgataata 3960
gctcttttag tactcctctt cctcaaagat accaagaaga ttttcagagt ctataggaaa 4020
gcattgaaca aattacatta acggaacgac ctgatactat a 4061
<210> 44
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 44
tcttctgaaa gactgagtaa atggagcaat tccttctaag aaatattatg gcatttctct 60
cccacgaaat ttcaaagcaa agagcagcta gtagttgatc ctctaatctc ttaattgaag 120
tttggaattt ctcttgcctc tatttggccc aaaggtcatg aagatctacc ggccaacctc 180
ttaagttgaa ttagatctta atagaagtcc aaatgcttct tgtagaagaa catctaataa 240
ataaatgagt gatagattct aatccagaga caaagagcac acctcgaatt cacttgccat 300
ccttttctag ctagaacttc tctagcatga aacttgttcc ttaaggcaag ccaaataaat 360
actcacattt taggaatgac tgccttccaa ataattttat aatatggaca aattagacca 420
ccattattga taaacttgca atgaacaatt ataaatgagt tttcaggttg gcacattagc 480
aatataggat ggtttgatta ttaaaaggat gatatgaagg gtttcaaggt ggtttgcctc 540
gttcaaatca aaggattttg aagattaata ttccaagata aggttctcca actccattag 600
gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc aaacttgaca gatgttttat 660
ttatttagag tgacacagat accctttggc aatactctcc atccttgtcc gaacaacttc 720
taatcacacc tcacttatct tgcatctaac tcagaggcta caagttacac ctttcaacaa 780
accttttcgg tttgaaaatt tgtgatttca ttatttagag ttcgaagagc atatcaagta 840
ttggtcggag ttggcaccca aagcaaacga aacagttact gacatggtcc aaaagctgag 900
atttctaaga tcccaactta agcactgaat aaagccatta tgggaaatat cattttaacg 960
aaagaggaat ttagagtaag aattgattct cttgataccg aagaagaact aatacagctt 1020
tcatcacttc aaaatgatga acagatgcat ctcaagtcag cactagacca tcttctaaaa 1080
taggaagatc tatggaagca acactcccaa atgcagtggc ttcaaaatgg ggattgcaat 1140
acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa gaatactatc actgaactct 1200
agcaaggcga tcagaagatt atcgaatagc agcaaatcca atccacattc tacaactttt 1260
tttctaccct actaggctcg actgaggaat gactcatcca agctgattgg aagattcttt 1320
atccagaagg acctctggat cttgctgaca ttgagtatcc atttatggag aaagaaatcc 1380
atgatacagt gtatgacttg gctttggaaa agtcacccgg atgatatttt cccattctcc 1440
ttctataagc acttctagtg tatcatcaaa catgacctga tgaacctact gtaaaatcag 1500
ctaatgtaga ccatctgaac tacttgttca tcacccttat cccaaaaaaa aattggtgtg 1560
tattcagtta gagacttcag gccaataagc ctgattaatg gagtaataaa aaatatttca 1620
aaaactctat cgaaaaggct cccacagaaa atgaatttgt taattttatc cacagagctt 1680
gctttcaaca gaggaagaaa tatctctgaa tattttgtaa tgactatgga aactatacac 1740
ttctgcaaag ctgaagtaca caaggatctc aattataaag tcgacttcga gaaagctttt 1800
gacaatgtgg attggagctt tctattgaaa ttgctatcca gcacggggct ttgattcgag 1860
gtggtgtcaa tggatagaat atctgattta tacagctaaa ttctcagtcc ttattaatgg 1920
tgataaaggt aaacttttta aattgaggaa agatctcagg caaggagatc ctctattcgc 1980
ctagctcttt ctcttagttg ttgatataga atgatcaagg gagcaagtag gttcaatctt 2040
tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 2100
gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 2160
tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 2220
ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 2280
acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 2340
tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 2400
aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 2460
agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 2520
ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 2580
atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 2640
aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 2700
ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 2760
ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 2820
aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 2880
tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 2940
aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 3000
ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 3060
acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 3120
agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 3180
agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 3240
taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 3300
tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 3360
cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 3420
caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 3480
tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 3540
tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 3600
gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 3660
gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 3720
cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 3780
tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 3840
ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 3900
aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 3960
atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 4020
atattatcag ccccttttaa atttgctttt ggatattgca t 4061
<210> 45
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 45
gctttcaaca gaggaagaaa tatctctgaa tattttgtaa tgactatgga aactatacac 60
ttctgcaaag ctgaagtaca caaggatctc aattataaag tcgacttcga gaaagctttt 120
gacaatgtgg attggagctt tctattgaaa ttgctatcca gcacggggct ttgattcgag 180
gtggtgtcaa tggatagaat atctgattta tacagctaaa ttctcagtcc ttattaatgg 240
tgataaaggt aaacttttta aattgaggaa agatctcagg caaggagatc ctctattcgc 300
ctagctcttt ctcttagttg ttgatataga atgatcaagg gagcaagtag gttcaatctt 360
tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 420
gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 480
tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 540
ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 600
acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 660
tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 720
aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 780
agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 840
ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 900
atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 960
aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 1020
ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 1080
ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 1140
aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 1200
tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 1260
aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 1320
ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 1380
acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 1440
agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 1500
agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 1560
taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 1620
tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 1680
cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 1740
caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 1800
tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 1860
tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 1920
gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 1980
gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 2040
cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 2100
tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 2160
ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 2220
aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 2280
atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 2340
atattatcag ccccttttaa atttgctttt ggatattgca tattccactc ttcaatcacc 2400
tcatgccaag caaaacattt attcacactt gaaaaccaat ataagaatac caaagaattt 2460
atccatgaaa ttctagaaac tttggtttta ctcctttctc catcattcaa aaaggttcaa 2520
aatgatgata actctatata gcttatttat caaatttacg aggttggtgt tcaatgtttt 2580
tgtgaaaaaa atatcttgct atccacatag tttgaatcca tacttttgct atcttgagtt 2640
tcaaaaattt taatttgcta caatttgttg ctattagcat atgactactt ttaagaagat 2700
aagccaatat actattttcc taagaattta aaaaatcaaa aataaaaatt tttatttaag 2760
attttttaag ggttgttttc caaatgtgca atggggctta atcttggcat cattttctaa 2820
cttgtagaat tttgacccaa gtaacatttg tccaatcact tagaacttct ataacttcgt 2880
acaatcattt gttaatgttg ttcatctatt tatctatatt atctatctgg aatatagttg 2940
ctcttaatta tttttatata tcgcctatta tccaccctaa gctttcatgt tcatcctcat 3000
gttgttggag gtgcatgtct tattccaaac tatttaccat tgctgtagat tttaaaaaat 3060
ttgctagttt aggacttttt aatcttttga tatcatgttg atgtaagcta accctctaag 3120
gctagtcata atacatttta aggatttatg ttatatgaga ccaaaatttt aacaaaatga 3180
agtgttggaa attggtagaa tggaagtgta aagatgctta gagacataga actagccctg 3240
ggccatgtaa atcttccaaa agaagaagaa aataataaaa ttaagatcat attcaatctc 3300
tacagaaaag ttggtctttg ttgtataata agccatctta acatatgatg gacaataaaa 3360
tatataaact tatgagtttt aatacttaga tggaagaaaa gggacagata tgtcacaccc 3420
catcctacta gcatgagtag gcacatgata cacggttgca tgccctgcag agtttgactc 3480
atgaggcatg caaggtattg aatagtagtc taggtaaaat taaaaaactt ggagcattct 3540
aaaaataaat caagttcatt ttataaaatc aatatttatt atggactcca tcaaatatta 3600
tgcgcataac attttatttg caaatagaag aagataagtc ctagatccta agtctcctac 3660
tcttagtctc ataattcatc caagctatcc accaaatatc taaaacgaaa aagaaaaacg 3720
atagtatgct aatagctttg taagtcacct tttatctcta attagatcaa gcatattaga 3780
tataaaacaa taattttcaa agtatatgat ttgcaattag gaataaatat ttgataaata 3840
cagaataaat tttcataaag catatttact aacattattt ataaaatata taatgcttat 3900
atcaataaat taatttctaa atcaatatat ataaactatc cattctgtct tagccttaca 3960
actattgcta ccattccctg tagcatggtt aggaagagac tagctcttga atactcatgt 4020
catttatcaa catatgcgaa tgatcattcg actaatatag t 4061
<210> 46
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 46
tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 60
gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 120
tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 180
ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 240
acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 300
tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 360
aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 420
agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 480
ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 540
atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 600
aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 660
ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 720
ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 780
aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 840
tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 900
aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 960
ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 1020
acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 1080
agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 1140
agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 1200
taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 1260
tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 1320
cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 1380
caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 1440
tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 1500
tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 1560
gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 1620
gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 1680
cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 1740
tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 1800
ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 1860
aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 1920
atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 1980
atattatcag ccccttttaa atttgctttt ggatattgca tattccactc ttcaatcacc 2040
tcatgccaag caaaacattt attcacactt gaaaaccaat ataagaatac caaagaattt 2100
atccatgaaa ttctagaaac tttggtttta ctcctttctc catcattcaa aaaggttcaa 2160
aatgatgata actctatata gcttatttat caaatttacg aggttggtgt tcaatgtttt 2220
tgtgaaaaaa atatcttgct atccacatag tttgaatcca tacttttgct atcttgagtt 2280
tcaaaaattt taatttgcta caatttgttg ctattagcat atgactactt ttaagaagat 2340
aagccaatat actattttcc taagaattta aaaaatcaaa aataaaaatt tttatttaag 2400
attttttaag ggttgttttc caaatgtgca atggggctta atcttggcat cattttctaa 2460
cttgtagaat tttgacccaa gtaacatttg tccaatcact tagaacttct ataacttcgt 2520
acaatcattt gttaatgttg ttcatctatt tatctatatt atctatctgg aatatagttg 2580
ctcttaatta tttttatata tcgcctatta tccaccctaa gctttcatgt tcatcctcat 2640
gttgttggag gtgcatgtct tattccaaac tatttaccat tgctgtagat tttaaaaaat 2700
ttgctagttt aggacttttt aatcttttga tatcatgttg atgtaagcta accctctaag 2760
gctagtcata atacatttta aggatttatg ttatatgaga ccaaaatttt aacaaaatga 2820
agtgttggaa attggtagaa tggaagtgta aagatgctta gagacataga actagccctg 2880
ggccatgtaa atcttccaaa agaagaagaa aataataaaa ttaagatcat attcaatctc 2940
tacagaaaag ttggtctttg ttgtataata agccatctta acatatgatg gacaataaaa 3000
tatataaact tatgagtttt aatacttaga tggaagaaaa gggacagata tgtcacaccc 3060
catcctacta gcatgagtag gcacatgata cacggttgca tgccctgcag agtttgactc 3120
atgaggcatg caaggtattg aatagtagtc taggtaaaat taaaaaactt ggagcattct 3180
aaaaataaat caagttcatt ttataaaatc aatatttatt atggactcca tcaaatatta 3240
tgcgcataac attttatttg caaatagaag aagataagtc ctagatccta agtctcctac 3300
tcttagtctc ataattcatc caagctatcc accaaatatc taaaacgaaa aagaaaaacg 3360
atagtatgct aatagctttg taagtcacct tttatctcta attagatcaa gcatattaga 3420
tataaaacaa taattttcaa agtatatgat ttgcaattag gaataaatat ttgataaata 3480
cagaataaat tttcataaag catatttact aacattattt ataaaatata taatgcttat 3540
atcaataaat taatttctaa atcaatatat ataaactatc cattctgtct tagccttaca 3600
actattgcta ccattccctg tagcatggtt aggaagagac tagctcttga atactcatgt 3660
catttatcaa catatgcgaa tgatcattcg actaatatag tcaaaaaaaa attactctga 3720
tttatataaa ttaaaaatta gtaaataata tatgctagta atcaccttac cagctaagct 3780
ctaaagaaaa ttagcttttg aatatacatc atgctattga ttattatatg tcagtgcttg 3840
tctcattttg tggcatgcaa gaagactaga tcctaaactt atatgcatag tcagattaaa 3900
gagcaaatgt tgcatctgat tatatgaaca tctattatga tgtagagttt gtatcatgta 3960
tatttaattt aaacacaaat ataattatac ataaataata ttcatatttt aaattttaaa 4020
tatttagata attattctag tgcaggtata aaaataagca a 4061
<210> 47
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 47
ttggcctcta ctgagtaata ttatataaaa actcctaata ccaaagaaag ccaagttatt 60
tgcttggcta agtgctcaca acaaaatccc aatgaaagct aatcttctta atagaggaat 120
aattggaact gattactgta cactttgcga tgacttatca gaaactaatg atcatctaat 180
gctcatctat actttttcaa aagcaatttg gaatcaagta ctttcagacc tgcaattgtc 240
gaaactttta tgcatgctta acaccctatg ggatacttgg agactcatca atatgcaaca 300
cgatagaaga cctaaactag ctgctctatt cgtaattggt caatggtgtc tttggaagga 360
aagaaataaa agattattcg acttctatac tttttatcca cgatcgattg ctgaaactgt 420
gtcacttttt ctttcttggg catcacacct aacaacggag caactaaaga tgttagctcc 480
tgttcgagaa gttctcttat ctaagaatga aaacacacaa tctttagtga gaattacaga 540
tgctaacagg cgcagatgaa tgttttatga gcatttttat agctgcagct tatatgtgat 600
ctatggtgca aggagttaat tataaccatg gatattagtt aggttgacta tcagaaatca 660
tctccaatac attctatgta accactgatc aattccatgt tcaactagat aggaacctgc 720
ctatatacag gtatgtccct gatgtaacta tagtatacta ttattcataa ataaataacg 780
aaggttttac cttcttctca taaaaaaaaa gtatcttcat gtcatcctat atgtcatgca 840
tctcctttgc tacttctttt atttacttct taaacttggt tctaccatat attatcagcc 900
ccttttaaat ttgcttttgg atattgcata ttccactctt caatcacctc atgccaagca 960
aaacatttat tcacacttga aaaccaatat aagaatacca aagaatttat ccatgaaatt 1020
ctagaaactt tggttttact cctttctcca tcattcaaaa aggttcaaaa tgatgataac 1080
tctatatagc ttatttatca aatttacgag gttggtgttc aatgtttttg tgaaaaaaat 1140
atcttgctat ccacatagtt tgaatccata cttttgctat cttgagtttc aaaaatttta 1200
atttgctaca atttgttgct attagcatat gactactttt aagaagataa gccaatatac 1260
tattttccta agaatttaaa aaatcaaaaa taaaaatttt tatttaagat tttttaaggg 1320
ttgttttcca aatgtgcaat ggggcttaat cttggcatca ttttctaact tgtagaattt 1380
tgacccaagt aacatttgtc caatcactta gaacttctat aacttcgtac aatcatttgt 1440
taatgttgtt catctattta tctatattat ctatctggaa tatagttgct cttaattatt 1500
tttatatatc gcctattatc caccctaagc tttcatgttc atcctcatgt tgttggaggt 1560
gcatgtctta ttccaaacta tttaccattg ctgtagattt taaaaaattt gctagtttag 1620
gactttttaa tcttttgata tcatgttgat gtaagctaac cctctaaggc tagtcataat 1680
acattttaag gatttatgtt atatgagacc aaaattttaa caaaatgaag tgttggaaat 1740
tggtagaatg gaagtgtaaa gatgcttaga gacatagaac tagccctggg ccatgtaaat 1800
cttccaaaag aagaagaaaa taataaaatt aagatcatat tcaatctcta cagaaaagtt 1860
ggtctttgtt gtataataag ccatcttaac atatgatgga caataaaata tataaactta 1920
tgagttttaa tacttagatg gaagaaaagg gacagatatg tcacacccca tcctactagc 1980
atgagtaggc acatgataca cggttgcatg ccctgcagag tttgactcat gaggcatgca 2040
aggtattgaa tagtagtcta ggtaaaatta aaaaacttgg agcattctaa aaataaatca 2100
agttcatttt ataaaatcaa tatttattat ggactccatc aaatattatg cgcataacat 2160
tttatttgca aatagaagaa gataagtcct agatcctaag tctcctactc ttagtctcat 2220
aattcatcca agctatccac caaatatcta aaacgaaaaa gaaaaacgat agtatgctaa 2280
tagctttgta agtcaccttt tatctctaat tagatcaagc atattagata taaaacaata 2340
attttcaaag tatatgattt gcaattagga ataaatattt gataaataca gaataaattt 2400
tcataaagca tatttactaa cattatttat aaaatatata atgcttatat caataaatta 2460
atttctaaat caatatatat aaactatcca ttctgtctta gccttacaac tattgctacc 2520
attccctgta gcatggttag gaagagacta gctcttgaat actcatgtca tttatcaaca 2580
tatgcgaatg atcattcgac taatatagtc aaaaaaaaat tactctgatt tatataaatt 2640
aaaaattagt aaataatata tgctagtaat caccttacca gctaagctct aaagaaaatt 2700
agcttttgaa tatacatcat gctattgatt attatatgtc agtgcttgtc tcattttgtg 2760
gcatgcaaga agactagatc ctaaacttat atgcatagtc agattaaaga gcaaatgttg 2820
catctgatta tatgaacatc tattatgatg tagagtttgt atcatgtata tttaatttaa 2880
acacaaatat aattatacat aaataatatt catattttaa attttaaata tttagataat 2940
tattctagtg caggtataaa aataagcaat ataaaatttt aaatcgattt atataacatg 3000
cataataaaa aaaattaagg atagaggtac ttactgctca actcataaaa cataagaaat 3060
ctctttaact aactttagtg caacctagat agaacatatt aatgattaag ttttcatcta 3120
aaataaacat agatatcatt ttaaaatctt aggcatttaa atggtctcat gatttgtgag 3180
gctttcttca gattctacaa ttttgaaatt ttttcaaatt ataatttttt taccttgatt 3240
gataacaaag ccaataatac acctcaaatc caaatgtatt cctaatagtt ttcaataaat 3300
ctaatatcaa taaatcataa ttaagatatc aatccattct atgaatttga ccataaatcc 3360
tacttgtttc tctgaccttc actataaatt aatcatcaaa ctaaataagt gaggggatca 3420
taattctttt acgacaatcc aagaattcaa gtctagcatc cacattagat ggcttcctgt 3480
ccagatattt gcgcctctcc aaaattgaga ttatcagatt aagaaaaata aaataagaga 3540
gagggttaaa ggacaatgcc ttctaggtag tgatgtccga catcataatt ttgatcaaat 3600
ctatggggca accaataata ttagggaaag aggattggat ttgagcaaga atagcaaagt 3660
cattgtcatc aatggcctga ttcattgagt tcaatgaagg attggtggtt gagtggtgga 3720
ggtggcatct aggaaggaga gagaaagaaa aagatagaga gaaagagata agaaaaatag 3780
agagaaggtg gcagttaaga tccctttttg tgattaatat atagccgtaa gatactcaaa 3840
gatctcacct tatcgacctc aaacactaag ggaggtggaa ggagggacta ctacccatga 3900
agctagagaa agggatgatg atgattggag gaaggaagaa ggaaaaatag tagactcgat 3960
gatgataaga ctaaaagaaa agggtttgac ttagccactt ggtatataat gaggtttggt 4020
atggagtcaa tagcttgagt aatagcatgg aaagagagaa g 4061
<210> 48
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 48
aaatatctaa aacgaaaaag aaaaacgata gtatgctaat agctttgtaa gtcacctttt 60
atctctaatt agatcaagca tattagatat aaaacaataa ttttcaaagt atatgatttg 120
caattaggaa taaatatttg ataaatacag aataaatttt cataaagcat atttactaac 180
attatttata aaatatataa tgcttatatc aataaattaa tttctaaatc aatatatata 240
aactatccat tctgtcttag ccttacaact attgctacca ttccctgtag catggttagg 300
aagagactag ctcttgaata ctcatgtcat ttatcaacat atgcgaatga tcattcgact 360
aatatagtca aaaaaaaatt actctgattt atataaatta aaaattagta aataatatat 420
gctagtaatc accttaccag ctaagctcta aagaaaatta gcttttgaat atacatcatg 480
ctattgatta ttatatgtca gtgcttgtct cattttgtgg catgcaagaa gactagatcc 540
taaacttata tgcatagtca gattaaagag caaatgttgc atctgattat atgaacatct 600
attatgatgt agagtttgta tcatgtatat ttaatttaaa cacaaatata attatacata 660
aataatattc atattttaaa ttttaaatat ttagataatt attctagtgc aggtataaaa 720
ataagcaata taaaatttta aatcgattta tataacatgc ataataaaaa aaattaagga 780
tagaggtact tactgctcaa ctcataaaac ataagaaatc tctttaacta actttagtgc 840
aacctagata gaacatatta atgattaagt tttcatctaa aataaacata gatatcattt 900
taaaatctta ggcatttaaa tggtctcatg atttgtgagg ctttcttcag attctacaat 960
tttgaaattt tttcaaatta taattttttt accttgattg ataacaaagc caataataca 1020
cctcaaatcc aaatgtattc ctaatagttt tcaataaatc taatatcaat aaatcataat 1080
taagatatca atccattcta tgaatttgac cataaatcct acttgtttct ctgaccttca 1140
ctataaatta atcatcaaac taaataagtg aggggatcat aattctttta cgacaatcca 1200
agaattcaag tctagcatcc acattagatg gcttcctgtc cagatatttg cgcctctcca 1260
aaattgagat tatcagatta agaaaaataa aataagagag agggttaaag gacaatgcct 1320
tctaggtagt gatgtccgac atcataattt tgatcaaatc tatggggcaa ccaataatat 1380
tagggaaaga ggattggatt tgagcaagaa tagcaaagtc attgtcatca atggcctgat 1440
tcattgagtt caatgaagga ttggtggttg agtggtggag gtggcatcta ggaaggagag 1500
agaaagaaaa agatagagag aaagagataa gaaaaataga gagaaggtgg cagttaagat 1560
ccctttttgt gattaatata tagccgtaag atactcaaag atctcacctt atcgacctca 1620
aacactaagg gaggtggaag gagggactac tacccatgaa gctagagaaa gggatgatga 1680
tgattggagg aaggaagaag gaaaaatagt agactcgatg atgataagac taaaagaaaa 1740
gggtttgact tagccacttg gtatataatg aggtttggta tggagtcaat agcttgagta 1800
atagcatgga aagagagaag gagctgaaga gagtactaag tcttattaga ataaagaaag 1860
atagaatctt agcgaaaaat agggcctcaa atctttcagg tagaggaaaa agagggatca 1920
acgaatgaaa gactaaggaa aaggtgtgga gtaggatata ctctcgatta gtctctcaat 1980
catggattct agtagggctt cgtcagctgc tcaatcatgg attctgatag ctcaaatggt 2040
ggtaagtaga aagagagaga tctaaagaga ttgatagtgg ccttaaaacc agcacggtca 2100
aggataggca tgccttagag agaggaaaag agagagagat taatggaaat aagcgagaaa 2160
aatatattct tagagaatag attggcgata agaagaggag gtggttgggg catgcttaaa 2220
gaaataaaga aaattgagta ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga 2280
gagagagcaa aaaaatgtgg atgatggtca taggataggg aaaggaaaga acaaagaagg 2340
gggtgctaag ctaactcttt ctaccttcct cacaccctga agcaaaggat ttggccaagg 2400
atggacaaat gggcgagggc tttggtggat ccatgcctac cctttctccc tctcacgatg 2460
attctagtca agctatctat ctttgatagc ttgagccaag ccaattgact tgatccaatc 2520
tctctaaatc catacaaact taagagagtg tattgattca cttattctct tctaagttga 2580
taagaaacat aattaagtgg agctcattaa gtatttcagg tagttgctaa cttggcaaaa 2640
tggaagcaat aataaatctt aaaagactat agcttggtat aatctcaacc atccatgatt 2700
tagaaagatc ttcagactca atatagatta ctttggctac tacaggtaag agctaaatag 2760
gatccaaaag taagatccat cacattagta agtcaaatta tatgtcaaat tttagtaggt 2820
atacttagtc ctacgatgcc taattaaaat gatcatcatt tgaaccttaa aatggactag 2880
tcaactaaaa tttttctttt tgaagaagat ttagaccata aaatatcttc taatctgtga 2940
agaattagat agagcgagga atataaaatt gatgtagaaa tcaagatcta tcatatatac 3000
aattttaata tttttttcat aatttttaaa tatttatctt ctttttttat aggtctagtc 3060
ctatttaaac taggaagagg agtccaactt gacttatgca ataggggatg tccttctaga 3120
agataagaat aatttgatca gaattatata agagcaaacc tcattattat aaataggggc 3180
tatatacatc aatttatgag atagagaatc aatgaaacaa aagtagactt aagttttatt 3240
ttcataattc ttctatcttc tacttttttt ctaggagatt caagttgagt ggattgaaga 3300
aaatctttca tcttctcgat cggatcatat tggtattaga gcgttggtct tctatattta 3360
tggagagctt taatgtattg tttaaatacg tgaacaatac aaacaatcaa gagaagtgct 3420
atccatgctt caaatacatc gaaatataaa agcaaatatg gctactaatt ctttttcaat 3480
ggacaatgag ataaaaggat gtcttacaca actcaaggag aagattgtgc aactcatgaa 3540
gattgtctcc agattgaaga taatttcaat acaagcacaa acaccagcaa ctcatgttgt 3600
gaaactgttt cctatgtttg gagatgaaga tcttctatct agtgaggaga ttgaattacc 3660
taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa agcttgaatt gagatcccca 3720
tatataatgg aaccattgat gaaaaaaagc tagataattg gctaaactaa ttacaaacct 3780
attttattat ctatagatat tatggcatct agaagatagc ttttacttat ctcaagcttt 3840
ctagccatgc tcttatctga tgaaattcat atatgagaaa taataatatt tttaatatgg 3900
tgcagagcca attcaaaggt ttaatcaaga agtaatttta tctaattggc cataaggaag 3960
atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 4020
ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt t 4061
<210> 49
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 49
aaagagataa gaaaaataga gagaaggtgg cagttaagat ccctttttgt gattaatata 60
tagccgtaag atactcaaag atctcacctt atcgacctca aacactaagg gaggtggaag 120
gagggactac tacccatgaa gctagagaaa gggatgatga tgattggagg aaggaagaag 180
gaaaaatagt agactcgatg atgataagac taaaagaaaa gggtttgact tagccacttg 240
gtatataatg aggtttggta tggagtcaat agcttgagta atagcatgga aagagagaag 300
gagctgaaga gagtactaag tcttattaga ataaagaaag atagaatctt agcgaaaaat 360
agggcctcaa atctttcagg tagaggaaaa agagggatca acgaatgaaa gactaaggaa 420
aaggtgtgga gtaggatata ctctcgatta gtctctcaat catggattct agtagggctt 480
cgtcagctgc tcaatcatgg attctgatag ctcaaatggt ggtaagtaga aagagagaga 540
tctaaagaga ttgatagtgg ccttaaaacc agcacggtca aggataggca tgccttagag 600
agaggaaaag agagagagat taatggaaat aagcgagaaa aatatattct tagagaatag 660
attggcgata agaagaggag gtggttgggg catgcttaaa gaaataaaga aaattgagta 720
ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga gagagagcaa aaaaatgtgg 780
atgatggtca taggataggg aaaggaaaga acaaagaagg gggtgctaag ctaactcttt 840
ctaccttcct cacaccctga agcaaaggat ttggccaagg atggacaaat gggcgagggc 900
tttggtggat ccatgcctac cctttctccc tctcacgatg attctagtca agctatctat 960
ctttgatagc ttgagccaag ccaattgact tgatccaatc tctctaaatc catacaaact 1020
taagagagtg tattgattca cttattctct tctaagttga taagaaacat aattaagtgg 1080
agctcattaa gtatttcagg tagttgctaa cttggcaaaa tggaagcaat aataaatctt 1140
aaaagactat agcttggtat aatctcaacc atccatgatt tagaaagatc ttcagactca 1200
atatagatta ctttggctac tacaggtaag agctaaatag gatccaaaag taagatccat 1260
cacattagta agtcaaatta tatgtcaaat tttagtaggt atacttagtc ctacgatgcc 1320
taattaaaat gatcatcatt tgaaccttaa aatggactag tcaactaaaa tttttctttt 1380
tgaagaagat ttagaccata aaatatcttc taatctgtga agaattagat agagcgagga 1440
atataaaatt gatgtagaaa tcaagatcta tcatatatac aattttaata tttttttcat 1500
aatttttaaa tatttatctt ctttttttat aggtctagtc ctatttaaac taggaagagg 1560
agtccaactt gacttatgca ataggggatg tccttctaga agataagaat aatttgatca 1620
gaattatata agagcaaacc tcattattat aaataggggc tatatacatc aatttatgag 1680
atagagaatc aatgaaacaa aagtagactt aagttttatt ttcataattc ttctatcttc 1740
tacttttttt ctaggagatt caagttgagt ggattgaaga aaatctttca tcttctcgat 1800
cggatcatat tggtattaga gcgttggtct tctatattta tggagagctt taatgtattg 1860
tttaaatacg tgaacaatac aaacaatcaa gagaagtgct atccatgctt caaatacatc 1920
gaaatataaa agcaaatatg gctactaatt ctttttcaat ggacaatgag ataaaaggat 1980
gtcttacaca actcaaggag aagattgtgc aactcatgaa gattgtctcc agattgaaga 2040
taatttcaat acaagcacaa acaccagcaa ctcatgttgt gaaactgttt cctatgtttg 2100
gagatgaaga tcttctatct agtgaggaga ttgaattacc taaaagtatg aaaaatcttt 2160
cttcaatcat tgaaagttaa agcttgaatt gagatcccca tatataatgg aaccattgat 2220
gaaaaaaagc tagataattg gctaaactaa ttacaaacct attttattat ctatagatat 2280
tatggcatct agaagatagc ttttacttat ctcaagcttt ctagccatgc tcttatctga 2340
tgaaattcat atatgagaaa taataatatt tttaatatgg tgcagagcca attcaaaggt 2400
ttaatcaaga agtaatttta tctaattggc cataaggaag atcggtggat caaatgataa 2460
tacttatgat agaaacataa tcaatccact taggactata ccaccaagtt ccacaaacag 2520
gcaatctgcc ttggaatctt tatcaacaat tatacaattt ttataaagta tgttgaaagt 2580
cttcatgaga gcatctaaaa aaagatgaaa ctctttaagg ttgatgatat cagtaaagct 2640
aacatgaaag tcatagagat tgaggagaaa aatcaaatta gagaagataa ggaaggcaaa 2700
aagcatatca acataactca aaaaaaaaaa ttatgatcat tgaaatcttt gaaaatacat 2760
caaggagaag tattgaaagt ttcatcctga attggagcta aagtagaaga agcccaagga 2820
tgataatttt aagaaaaata aaaagtggtc ctcaattcta tagagattga ggagctatct 2880
gaacttgagt aagcaaactt caaattgagc ttgatggtga gaaaacctaa tacaacaatt 2940
aaaacggatc tagaggtaca tgacaactca cccacttaaa gattcaagtg aagcagagta 3000
tcattaaggc tattataaat ctttgaagct agaagaacct cattttccaa tatttggttc 3060
agaaatcgag gttgtagatc aagcctcatc catatcctta tcctcttagt tggattcaga 3120
aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa gttagccatc actgagaggt 3180
ttatttgtga ggtaactttt gaaatagttt ctttggatat ttgtcaagtt atccttagaa 3240
atgtgtacct ttagaatcaa gatgcaattt tctatagacg atagagaaag tatcatctta 3300
taagggatga gaaaaagttc atgatcaaca cctcaagaac ataaggtaac tttgaccttg 3360
caactgttgc ccaagtgaag tgatttgtta atgtttgtga tgagtgcatg atgatggtat 3420
aaagaaccga tatcactcat gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc 3480
aatagagatt gagattaagg aggagtcact atagtccttg tcgatgagga aggatgacaa 3540
caagcattcc taccatgaag tctagatttg agagcaaatg aaagtaatcc actgagacct 3600
gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat 3660
gagatgggga agtaagtatt ttcccacctt caattctaac tttgtagaaa ctaaatccct 3720
taaacagggg agccctaatt taagaggatc ctcagattca ttgtggacta ctttggctat 3780
tacaataaga gctggatagg aatcgaaagc aaaattcacc acattaggaa gccaaattgt 3840
atggcaaact tcaagagacc ataacttgat cacatgaaat ccaattaaga tgattttatt 3900
tttgaatttg aatatttttt tgagatctat aactttagat ctaaatcaag ctaaaatttt 3960
attgcttatg ccttcaaaat aggctagtca aatcaaaact tttcttttca aaaaagactt 4020
tgactgaaag atatctttca atctatgaag aatcaagtag a 4061
<210> 50
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 50
ctctcgatta gtctctcaat catggattct agtagggctt cgtcagctgc tcaatcatgg 60
attctgatag ctcaaatggt ggtaagtaga aagagagaga tctaaagaga ttgatagtgg 120
ccttaaaacc agcacggtca aggataggca tgccttagag agaggaaaag agagagagat 180
taatggaaat aagcgagaaa aatatattct tagagaatag attggcgata agaagaggag 240
gtggttgggg catgcttaaa gaaataaaga aaattgagta ggcggaaagt ggtgatgctt 300
ggcgatgaga agatttgaga gagagagcaa aaaaatgtgg atgatggtca taggataggg 360
aaaggaaaga acaaagaagg gggtgctaag ctaactcttt ctaccttcct cacaccctga 420
agcaaaggat ttggccaagg atggacaaat gggcgagggc tttggtggat ccatgcctac 480
cctttctccc tctcacgatg attctagtca agctatctat ctttgatagc ttgagccaag 540
ccaattgact tgatccaatc tctctaaatc catacaaact taagagagtg tattgattca 600
cttattctct tctaagttga taagaaacat aattaagtgg agctcattaa gtatttcagg 660
tagttgctaa cttggcaaaa tggaagcaat aataaatctt aaaagactat agcttggtat 720
aatctcaacc atccatgatt tagaaagatc ttcagactca atatagatta ctttggctac 780
tacaggtaag agctaaatag gatccaaaag taagatccat cacattagta agtcaaatta 840
tatgtcaaat tttagtaggt atacttagtc ctacgatgcc taattaaaat gatcatcatt 900
tgaaccttaa aatggactag tcaactaaaa tttttctttt tgaagaagat ttagaccata 960
aaatatcttc taatctgtga agaattagat agagcgagga atataaaatt gatgtagaaa 1020
tcaagatcta tcatatatac aattttaata tttttttcat aatttttaaa tatttatctt 1080
ctttttttat aggtctagtc ctatttaaac taggaagagg agtccaactt gacttatgca 1140
ataggggatg tccttctaga agataagaat aatttgatca gaattatata agagcaaacc 1200
tcattattat aaataggggc tatatacatc aatttatgag atagagaatc aatgaaacaa 1260
aagtagactt aagttttatt ttcataattc ttctatcttc tacttttttt ctaggagatt 1320
caagttgagt ggattgaaga aaatctttca tcttctcgat cggatcatat tggtattaga 1380
gcgttggtct tctatattta tggagagctt taatgtattg tttaaatacg tgaacaatac 1440
aaacaatcaa gagaagtgct atccatgctt caaatacatc gaaatataaa agcaaatatg 1500
gctactaatt ctttttcaat ggacaatgag ataaaaggat gtcttacaca actcaaggag 1560
aagattgtgc aactcatgaa gattgtctcc agattgaaga taatttcaat acaagcacaa 1620
acaccagcaa ctcatgttgt gaaactgttt cctatgtttg gagatgaaga tcttctatct 1680
agtgaggaga ttgaattacc taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa 1740
agcttgaatt gagatcccca tatataatgg aaccattgat gaaaaaaagc tagataattg 1800
gctaaactaa ttacaaacct attttattat ctatagatat tatggcatct agaagatagc 1860
ttttacttat ctcaagcttt ctagccatgc tcttatctga tgaaattcat atatgagaaa 1920
taataatatt tttaatatgg tgcagagcca attcaaaggt ttaatcaaga agtaatttta 1980
tctaattggc cataaggaag atcggtggat caaatgataa tacttatgat agaaacataa 2040
tcaatccact taggactata ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt 2100
tatcaacaat tatacaattt ttataaagta tgttgaaagt cttcatgaga gcatctaaaa 2160
aaagatgaaa ctctttaagg ttgatgatat cagtaaagct aacatgaaag tcatagagat 2220
tgaggagaaa aatcaaatta gagaagataa ggaaggcaaa aagcatatca acataactca 2280
aaaaaaaaaa ttatgatcat tgaaatcttt gaaaatacat caaggagaag tattgaaagt 2340
ttcatcctga attggagcta aagtagaaga agcccaagga tgataatttt aagaaaaata 2400
aaaagtggtc ctcaattcta tagagattga ggagctatct gaacttgagt aagcaaactt 2460
caaattgagc ttgatggtga gaaaacctaa tacaacaatt aaaacggatc tagaggtaca 2520
tgacaactca cccacttaaa gattcaagtg aagcagagta tcattaaggc tattataaat 2580
ctttgaagct agaagaacct cattttccaa tatttggttc agaaatcgag gttgtagatc 2640
aagcctcatc catatcctta tcctcttagt tggattcaga aggatgtcaa gttaaaaatt 2700
atgagatagt gtaccttcaa gttagccatc actgagaggt ttatttgtga ggtaactttt 2760
gaaatagttt ctttggatat ttgtcaagtt atccttagaa atgtgtacct ttagaatcaa 2820
gatgcaattt tctatagacg atagagaaag tatcatctta taagggatga gaaaaagttc 2880
atgatcaaca cctcaagaac ataaggtaac tttgaccttg caactgttgc ccaagtgaag 2940
tgatttgtta atgtttgtga tgagtgcatg atgatggtat aaagaaccga tatcactcat 3000
gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc aatagagatt gagattaagg 3060
aggagtcact atagtccttg tcgatgagga aggatgacaa caagcattcc taccatgaag 3120
tctagatttg agagcaaatg aaagtaatcc actgagacct gagagcaaaa aaaggcgaga 3180
ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat gagatgggga agtaagtatt 3240
ttcccacctt caattctaac tttgtagaaa ctaaatccct taaacagggg agccctaatt 3300
taagaggatc ctcagattca ttgtggacta ctttggctat tacaataaga gctggatagg 3360
aatcgaaagc aaaattcacc acattaggaa gccaaattgt atggcaaact tcaagagacc 3420
ataacttgat cacatgaaat ccaattaaga tgattttatt tttgaatttg aatatttttt 3480
tgagatctat aactttagat ctaaatcaag ctaaaatttt attgcttatg ccttcaaaat 3540
aggctagtca aatcaaaact tttcttttca aaaaagactt tgactgaaag atatctttca 3600
atctatgaag aatcaagtag agtgatgaaa gataaagttg atataaaaat tgagatctat 3660
ctcttataaa attttagtaa ttttattttt tttaatattt atctttattt agagatctat 3720
tcctatttaa actagaaaga attgtccaac ctaacttgtt caatgatcaa catcctccta 3780
aaagataaaa agaagaatct gactcaaatt ataaaagggc ggaccttttt ttttgatgaa 3840
aagggaggaa aaaaatccat caaaatttat taagaaaaaa agagtacaag aaaagaagga 3900
tatgaaagag taagagaagc cccacaacat ccatcaatat ttaaaattta aatttaaatc 3960
tcccccatca ttctatcaat atttgatatt caaatttaaa ttcttcgcag catcccacca 4020
acatttgaaa ttcaaatcct ttcatacaaa caaaataata t 4061
<210> 51
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 51
caaggagaag tattgaaagt ttcatcctga attggagcta aagtagaaga agcccaagga 60
tgataatttt aagaaaaata aaaagtggtc ctcaattcta tagagattga ggagctatct 120
gaacttgagt aagcaaactt caaattgagc ttgatggtga gaaaacctaa tacaacaatt 180
aaaacggatc tagaggtaca tgacaactca cccacttaaa gattcaagtg aagcagagta 240
tcattaaggc tattataaat ctttgaagct agaagaacct cattttccaa tatttggttc 300
agaaatcgag gttgtagatc aagcctcatc catatcctta tcctcttagt tggattcaga 360
aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa gttagccatc actgagaggt 420
ttatttgtga ggtaactttt gaaatagttt ctttggatat ttgtcaagtt atccttagaa 480
atgtgtacct ttagaatcaa gatgcaattt tctatagacg atagagaaag tatcatctta 540
taagggatga gaaaaagttc atgatcaaca cctcaagaac ataaggtaac tttgaccttg 600
caactgttgc ccaagtgaag tgatttgtta atgtttgtga tgagtgcatg atgatggtat 660
aaagaaccga tatcactcat gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc 720
aatagagatt gagattaagg aggagtcact atagtccttg tcgatgagga aggatgacaa 780
caagcattcc taccatgaag tctagatttg agagcaaatg aaagtaatcc actgagacct 840
gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat 900
gagatgggga agtaagtatt ttcccacctt caattctaac tttgtagaaa ctaaatccct 960
taaacagggg agccctaatt taagaggatc ctcagattca ttgtggacta ctttggctat 1020
tacaataaga gctggatagg aatcgaaagc aaaattcacc acattaggaa gccaaattgt 1080
atggcaaact tcaagagacc ataacttgat cacatgaaat ccaattaaga tgattttatt 1140
tttgaatttg aatatttttt tgagatctat aactttagat ctaaatcaag ctaaaatttt 1200
attgcttatg ccttcaaaat aggctagtca aatcaaaact tttcttttca aaaaagactt 1260
tgactgaaag atatctttca atctatgaag aatcaagtag agtgatgaaa gataaagttg 1320
atataaaaat tgagatctat ctcttataaa attttagtaa ttttattttt tttaatattt 1380
atctttattt agagatctat tcctatttaa actagaaaga attgtccaac ctaacttgtt 1440
caatgatcaa catcctccta aaagataaaa agaagaatct gactcaaatt ataaaagggc 1500
ggaccttttt ttttgatgaa aagggaggaa aaaaatccat caaaatttat taagaaaaaa 1560
agagtacaag aaaagaagga tatgaaagag taagagaagc cccacaacat ccatcaatat 1620
ttaaaattta aatttaaatc tcccccatca ttctatcaat atttgatatt caaatttaaa 1680
ttcttcgcag catcccacca acatttgaaa ttcaaatcct ttcatacaaa caaaataata 1740
tttttcaaat tctcaacttt gagtttcaaa attgagaagc ctacatattg tctgctcttc 1800
accaaagagg ggagattgtt ggcttagctt ggcccaagag aagagaagaa ggccaaggcc 1860
caatctgtag cctagagaag gagggtttgg tagctactta ataatcggat ctaaccgata 1920
aagacactat ctctattaga agaaaaggta gagagaaaaa gaggcaattg gttaacttca 1980
gagggggagg aggtaagctg ttgaggagat taatctgacg caaggaaaaa agaagagctg 2040
acaactagcc aatgatcgag aagggctgga gacaatccaa gcccagcacc aagaagcaag 2100
agaaagaatt tggaggtcaa aggaggagtc caggaagaga gagcgaaaca caatgttcgg 2160
atctagccga caacgatacc aattatacta ggaaagaagg taaaaaggga aagagcaatc 2220
gatcatcttc agcaaagaaa aataaaagag gcacccgaca gtcaagccca tggccaaatc 2280
agtcagcaag aggacctcac aagatctaga cggtgctaag gggaagggag gaagaaaaga 2340
gatccagtaa ctgtccaaca ccaggaaaag gaggagataa gaggaaggga gaagtcattt 2400
ttctatcttg ggccgaagga gggagaagga agaaagagga aagaacatcc tcaaagtcga 2460
aggaaggaag gaaagagagg ggggaagggg tcacagtcag atataccaga agggatagat 2520
ccagtgtcaa agagagaaaa gagagaggag atcagaaaat aaaatttgat gactgactaa 2580
ttgtcatgaa aggctaatga caactcataa aaaaagtata gtagtaaaga gagggggata 2640
ggcttggtta gggaagagat tccgacaaca aagagaaaga aagagagaga gagagagaac 2700
cggctcccag ccaaaaatag cttgacccac catcgagaag gaccgacaaa gagagagaaa 2760
gatagaatag ggagaatagc ttggcttcga atcaaaaatg atctaacaca ctgctgaaaa 2820
ggactaggaa gagagagaga gggggtaggg gagtatctcg gctcgcaatc agaatcaact 2880
ggccaatgcc agaaaagaga ggaagagaga gatagagaag atatagcaaa agagaagaga 2940
tggacaaaag gagagaggaa gggagggaga gagagaaaaa ataggagaga gaggggcttg 3000
gtggctgact gtcagaagaa gcctcgatgc tcgaagatta gatggaagaa aaaaaaattt 3060
ctcaaaactt ctcttttcta taagagcaaa cctcactatt ataaataggg ttatgtatct 3120
cagtttatga tgtgaagaat taatgaaaaa ttggacttta gctctatttt tgtaattctt 3180
tcatcttcta tttttatgaa attcaagttg agccgattaa aagaaataat ctttctttcc 3240
gattggatca atccattaac tagatacttc aaaaatcaaa atgacctatc taaaatccta 3300
aatcaaatac aaaaccaaaa taactaaatt aagatagaac aaactacaat tacaaaaaac 3360
tggctaaagt gtttaaatgc ttttactcct aagtttcttc ttgctcacca ttaatgcttg 3420
atctttagct gggatcatat cagccttatg accactataa gaccaacata acaactcact 3480
tgtattgctc ctttaaaatt atacaaaact agtgtctaat atgtaccatg cgaatgtctg 3540
tttctcacca gaaaatggat gggcttcttg tgcaagcacc ttcttcctac aaataataaa 3600
atatgcatcc cttctctcat cttactaaat aaaataatta aaggctttac tatcaggaaa 3660
tctggcttta tccatataat tttggaagtt ttatttgaac ataacattac gagtactaga 3720
ttacatcagg aggtggttcc tcttatttct attaagagaa aaatcaattt tcttttaaga 3780
aagatcattt cattttcatc aggtagcgta ctctactaat atacttccac aacaatatat 3840
agggattaga ttataggatg gactttaagg cttcttttcg agagccctga tttctcaatc 3900
acattccctt ttctttctca tgtaatggca tttaagagtg catccagggc ccaacaatta 3960
gtcacaagtg ttctttttat acatggtaca tatttgctat tttttagctt attttaactt 4020
gattgtgaag atatcatgag aaaattagat ttaaagccta g 4061
<210> 52
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 52
ctttcaaaaa tatcttttga taggactaat gagataagtc aggaccaatg gatatctcgg 60
tcaacccaac cactgctcaa gtttgagatg gaaaatctat ctcggacaac agctgaagtt 120
agtacctcag gttaggatga tctagaatct cctataagag attttttaga ttatttcggc 180
ccaagtactg aacaatctgt cctgaccaat ctcgatcttt aggaacttaa gaaaaaatat 240
tcgattcagc ttataactcc aagttgggat ggtaggatta ttgaacctcc agaaggttat 300
gtcgtatttt atgatgaggc acttcgatct ggactttaat ttctcttaca tcctttcttc 360
agtaatgttt tagacttcta taaactccat ccaatctagg ttactcccaa tgccattagg 420
atgatcatag ttttcattat ctatcgtaaa ttttttgcta tagaactaag aatttctctc 480
tttaggatgc tggtcatcct aagaaaacat ccttatgaaa aagactgatg gtatttctta 540
ccttggcctc aatataaatt cggtcccact cttccttttt caatacataa ttgaaaaaat 600
cattttttct ttatttcttc taatgtttcg tagggtttta tttgtaaata gtctaagcct 660
aaaaccaaat ggaactcaaa taacaaaata ttatctgagg atgaggagac ttttgtagag 720
cttttagata tgaaagtatc caagttgagc ctactggtgt ccaatcagtc cttgtttgac 780
accgacatca gtcagatctc tccttaagat aagtctgatg ttaattcttt ttctttattg 840
ctttatcatt tttcatcatt tttcttttct aacaatcttt ttccttatat agtagcaata 900
atgaagttca acctacaaag gctggctaac tcaaagaaga ggaagaagga tctaaccgat 960
tgctctcaag aagagtaagg agactgctcc tctaagatcg attggccccc gatcatcacc 1020
tgggccaata ttaattgaca tagatgctac atcgatctcc actataccac cagcaaaatc 1080
aactcatcaa cctactaagg tggcttgtcc acctcctaaa gagtctgcac atccaaagta 1140
ggcatcttcc ccaacacctc caacatcggc caagttagtt tggctgagca atcagcatct 1200
gaggtcacag actcctgatg tcaacccacc aactttctca tcaaaaaaaa ttgacttggc 1260
gaaggtatca cttttggaga cacccagact aggcaaggac ttgctctgta caatgatgcc 1320
tcaaaaggac ctagatgctg ataggaggga tctttctttg gagcaaataa taaattatgg 1380
attcaacagt atcatgaacg tgagtcttca ttctcttcca ctctcttctt tctttttctt 1440
ttttttttta cattggctat ttgttgatct gaatatatct ttctttttgc agtcggttgt 1500
gtatttcaag ttgctcaatg agcacttgac atggttcttc aaaaataaaa tttttttgaa 1560
agagaggctc aaggccaaga aagaggccaa aaaagcagtt gaggaggtca agaaggcagt 1620
aaagaagaag gctgtcaaag aaagcaaaat gatggcgggg ctgaagaaac agctccaaga 1680
aaaaatagat tccattaagg agactggaca accaatgaca gatgaatgat aaagatgaca 1740
agttgtaaaa acagcctgaa aaaaatctca aagttggagg ccaagctgaa ggaggtcgag 1800
tcaataattg aaaagcatga tgaagctctt gtcccatatt agagacaact tgataaagac 1860
aaagagtgga tgtcaaggat tattgaagat tataagaatt ccgacacttt tcaagatgac 1920
gttactgagg cctcaaaagg agctttcaat tatggctttt tgagctacag gagtttaatt 1980
atcaagctct ttcctaacct tgatctcagc aaggtcataa tagaagcagc tctagaagta 2040
gtagccgaag tgacttctgc aacaactact gagcttgctt ccacttctat cattggagtt 2100
tctccgatcg aagtcccaaa cagtccaatc gaggcctcca tcatcgaagc tatttcgaag 2160
gaatcagtcg gcaaagacct tacctcaact cctccaacaa ataactccca agctaaggcc 2220
tgaattatct tcttcttttt ttctaaacat ttgtattagc ccgatgtggg cttctataaa 2280
tactttttac attaatgaat gagtttttca atgtcaatat tttttctttt taactaatac 2340
taatcttgga tgatccgatc tgggttggat gtctcaaaaa atatcattca cgatagatag 2400
ttattttctg acttcggtta gatgattatg agtatatgta attcaacctt ggttaggtaa 2460
gtaatcaaat attaactatt ctcaaaccaa gtagataacg aagtcaatgt gattaacttt 2520
aacaagtaag attgttatgg aatgaaattg aatcagatca actaactata gataacttaa 2580
tctctcataa ttcactgtaa aggttctaaa agtaccttta tctaagttcg aagtgacaag 2640
tcgggttctt ttattcgtgg atttatgacc catgctgtct ttttgtgatc ttcattatta 2700
atcaccttaa atcgatatag caaaatccag tttatagatc tgagtgcttt cttgtcagat 2760
tgagtctatc ctattatctg tgaaacctga tctagagatc aagtatttta ggttttttat 2820
ttaaggtcca attcgaagat tgagtatcca atgtcatatt gttaggtcca atttggagat 2880
tggatgtctc actatcatct cgtgaggtcc aatccaaaga tcgaatatct cactatcatc 2940
tcatgaggtc caatccagag attggatgtc tcacatcatc ttgtgagatc caattcgaag 3000
attggatgtc tcacatcatc tcatcctatt gtggttggaa tttttgtagc cttagtttga 3060
ctttttctga cctcatttgg acacctaaat cttattatca tcgtttgatc gatttttact 3120
aatctacttt ggatgaaaaa gaattcttca atggaacttt tgattagaac tttatcttca 3180
ttgggataga aatcgaatgc tttattgaaa gattttattg ataatacatt ctgagatttt 3240
taatatttca tgttctcgaa atgatcgtac catctaaatt tttaattcga taagctcttg 3300
gatggatcac ctcagtaatc tgataaggtc cttcccaatt cgggatgagt ttttcttact 3360
ccattggttt tgagacttca gctcattgga gaaccaaatc tccttataaa aaattttagg 3420
ctttacctga gagttgtaat atctggctac tttttgttta taaactacca tatgaatctg 3480
ggctttttct cgagttttct caaataaatt gagatcagtc ctcagttgat ctgaattatt 3540
ttcttcatga aaattttcta ttctggttgt aggtaaactg atctcgacta gtattatagc 3600
ctctgttccg aaagtaagtt taaaagatat ttctctagtt ggtctctgag gtgtagttct 3660
gtatacccat aaaatattat aaaattattc taccccgaga cttttagcct caatgagttt 3720
tatttttagg ccttgaaaga tagttctata aataaattta gcttctccat ttgattgtag 3780
atgtccaatc gaagtaaata tatgatctat gtagagctca gaataaattt ttttaaaatt 3840
ttgattatca aattattgct cattattagt aattataact caaggcaaac caaaatggta 3900
aataattatt tttcacataa aatctcatat tttttctcag tgatttatgt cagaggttca 3960
atttctatcc attgggtaaa ataatcaata gtcacaacta aaaattttct ttgctccatg 4020
gccattagaa aggatcccag aatatccatt ctccatatag c 4061
<210> 53
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 53
aaaattattc taccccgaga cttttagcct caatgagttt tatttttagg ccttgaaaga 60
tagttctata aataaattta gcttctccat ttgattgtag atgtccaatc gaagtaaata 120
tatgatctat gtagagctca gaataaattt ttttaaaatt ttgattatca aattattgct 180
cattattagt aattataact caaggcaaac caaaatggta aataattatt tttcacataa 240
aatctcatat tttttctcag tgatttatgt cagaggttca atttctatcc attgggtaaa 300
ataatcaata gtcacaacta aaaattttct ttgctccatg gccattagaa aggatcccag 360
aatatccatt ctccatatag caaaaggcca cagcactgta atagaaataa gttcagttgt 420
aggctgatgt tatatattgg cgtacctttg acactgatcg cagtacttat taataaagtc 480
ggttgaatct ttttgaatag taggccaata ataatcttac tgaattattt cataagctaa 540
aattttaccc cccaaatggt tactagagat tcctttatga acttctcgaa ggatgtaatc 600
agcttccgat ggccttaggc ataggagcag tgggagtgaa tataacctct gatataattg 660
attatcttga acaacatacc atggggcctg tcttttaatt cttgttcctt cgactggatc 720
aaccggtaga ggttctttag taatatactc cattaatggg tcaatggaac ttagctcata 780
ttaaatttgg acaattagta aggcctcgat actagacttt ttaagaatat caataagaac 840
accttgattt agtttgaaaa aatctgatgt ggctaaatga gatagggcat cagctcagac 900
attttgtcct tggtatttgc atgatcttca gattttcaaa gttttttaat aattctttca 960
tattatataa atattgaaac atcataaaat ctttagcttc aaattaatct catacctgac 1020
tgacgataaa ttgagaatca ataaaaattt taattttttt aacattaagc tccttagcca 1080
ttttgagtcc tacaattagc gtttcatatt ctactccatt gtttgagtgt taaaattaaa 1140
tctcaaagca cgctcactaa caatgccttc tagactcgtt agaattaaac tagttctact 1200
ttctttcgaa tttgaggctc catcaatgta cagtatcaaa taagaatctt tgatattttt 1260
caattctttt aagattggtt cttcattagg aatagagcat tcaataataa aatcagctaa 1320
tacttaaact ttcaatgaag atcgaggccc atattgatat caaattcatt taattcaata 1380
gcctatttga atatccttct taaagtatca agctactgta aaattaattt taaaggttga 1440
tcgatcagaa ttataataga atgagcctaa aaatacgatc aaagtcatct tgctaatgca 1500
atgagggtat aaattatctt ctcaatttta gaatatcgag tttcaacatc tctaaataat 1560
ttatttgtat aataaatgga tctttgtatc cctgcatcat ttcaagctaa aatcgaacta 1620
acagcatttg ctgaaataga tagatacatg aataattttt gacctttgat cggctttgat 1680
agtaatggag ctgtgccgag atatttcttg agatcatcga aggctgcttg acattcatct 1740
tatcaatcga agtctttgat ctgccttaga attttaaaga aaggaagata tttatcagct 1800
gatctgaaaa taaattaact aagcaatgct actcatccag taagttggtg tacttctttg 1860
atggagctcg gatgcttcat ttcacataga gcttgaattt tcttaagatt gactttaatt 1920
cctctttgag ttacaaaaaa atctaaaaaa atttttgaag ttacttcaaa agcatatttg 1980
ttgggattga gcttcatttg atattttcgt agtctctaaa ggcttcttcc agattggcaa 2040
tatactgatc tgactcagta ttttttacta atatatcatc aacataaact ttgatattaa 2100
tttcaatttg ttacttaaaa atcttattaa tcaagtatta gtatgtagca cctacatttt 2160
taagatcaaa agacatcatt ttataacaat gcaaatcttt ttcagtgatg aaggccatat 2220
tttcttcatc ctcaagtgcc attttgatct gatataacca gaaaaagtat ccataaagct 2280
tagtaatttg tgtcttgaag tagcatcaac aagctgatca atttttgaga gagaaaaact 2340
atcttttagg caagctttat tgagatcggt ataatcaaca tagatccttc atttttcatt 2400
agccttttta accatgacaa catttacaat ccactttgga tattatgctt ctctgatgaa 2460
tttgtctttc aagagtttgt cgacttcctc atctattatt ttttatcttt tcggggtgaa 2520
acttcttttc ttctgttgca ttggtttatg ctttggatca acattcagct tatgtacaat 2580
aagatcagtt aaaatctcag gcatattaga gactgactaa acaaagacat cggcattcat 2640
ccgaagaaaa gatattaatt tctccctcag atcaggcttc aatagagatc caatttggac 2700
agtttttttt ggatcatcac acaaaagaac aataataagt ttctcgactg gttctcctcg 2760
atttttgatg atatcaactt tactttcttg atcaagtatt ttaattggta gagcttccac 2820
agaccttttc atttttacag ctatcagaaa atactactta gcaagtatct gatttcctca 2880
tatttctcca actccatact tagtttggaa ttggattagt aaatgataag tgaagactat 2940
agccttaagg gcgttgagcc taggtcggtc aagaatagca ttataagctg atggtatttt 3000
gacaataaaa aaagtgagtc ttacagttga ctggcatggt tctatccctg cagtgacgga 3060
caaagtgacc tctccttcca cagctacagg atttctagaa aatccaatta cgggggtacc 3120
aacctattta gctaatttat catattcatt ctttggaatg tatcatagaa caatatatta 3180
gcagagcttt cattatcaat aagtattctt tttatatcat atttggctat tgccataaag 3240
atgacaacag catcattacg aggagtttga actctaacat catcatcgaa aaatgaaatt 3300
atgtgatcca tgcactgatg ctttggaagg ctttcagtaa tctcagccac ctcctcagtt 3360
ccgtcgagat ctgagatcat attgatgact gcagcagtag acttgttgtg atcattctca 3420
ttgttgggct tctatcattg gtcagtagct tgacttgccc gatctcgaac atatttacta 3480
aagtaacatt agtggatcaa tacttcaatt ttatctttta attatcgatg ctcctcagta 3540
tcatggccat agtctcgatg gaaatgacag tattttctct tatctctctt tgctggaggg 3600
gctttcatag gattaggttg gcgaatatat cctaaatcct cgatttctat cagtatctga 3660
gctcgaggag tagatagtga ggtatagatg tcgaatcacc gaggtgggct tttgaacttc 3720
agattcttct gaggtcgttc agagttatcc tgttggtttt tatgatcttc ttcctagggc 3780
cacttttttc catctctttt tttcttcacc taacgaagta tgcatgctct ctttcttttc 3840
agcttgagca tacttacaaa cctagatcaa tatttgttca taattgtttg ggtagttctt 3900
attaagagag aagatcaggc gattactctt gagtccttgc ttcaaagctg ccattgcaat 3960
ggactcattg aagttcttca ctttcagtat ggcggcatta aagcatgcca catattcttg 4020
aagagattca ccttcctact atttgatagt aaaaagattg c 4061
<210> 54
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (2978)..(3705)
<223> n is a, c, g, or t
<400> 54
catcatcgaa aaatgaaatt atgtgatcca tgcactgatg ctttggaagg ctttcagtaa 60
tctcagccac ctcctcagtt ccgtcgagat ctgagatcat attgatgact gcagcagtag 120
acttgttgtg atcattctca ttgttgggct tctatcattg gtcagtagct tgacttgccc 180
gatctcgaac atatttacta aagtaacatt agtggatcaa tacttcaatt ttatctttta 240
attatcgatg ctcctcagta tcatggccat agtctcgatg gaaatgacag tattttctct 300
tatctctctt tgctggaggg gctttcatag gattaggttg gcgaatatat cctaaatcct 360
cgatttctat cagtatctga gctcgaggag tagatagtga ggtatagatg tcgaatcacc 420
gaggtgggct tttgaacttc agattcttct gaggtcgttc agagttatcc tgttggtttt 480
tatgatcttc ttcctagggc cacttttttc catctctttt tttcttcacc taacgaagta 540
tgcatgctct ctttcttttc agcttgagca tacttacaaa cctagatcaa tatttgttca 600
taattgtttg ggtagttctt attaagagag aagatcaggc gattactctt gagtccttgc 660
ttcaaagctg ccattgcaat ggactcattg aagttcttca ctttcagtat ggcggcatta 720
aagcatgcca catattcttg aagagattca ccttcctact atttgatagt aaaaagattg 780
ctagtatttt tcaaatgaat ccatttatta tcaaaatacg tgatgaatat ttgctaactg 840
tgtgaaagat gaaatagatc atgtctggag gtcagagaac tagattcttg cagatgtttt 900
gagagtgatt ggaaaagtga tgcaaaatag ggcattagat accccttgta gtcttataat 960
ggctctgaag ccttcaagat gatttaaggg attgatggag ccatcgaatg tttccaatgt 1020
aggtatcttg aatcgaggag gaactgattt accaagaatt ttttgagaaa aaagagatcg 1080
taagttgaaa tctcttctac cttgagaatg gcttccaatc tatatctcca tcattttctt 1140
ctcaagattt tgaatctttt gtccaagacc ctcctccata catggcttct tatgtggagc 1200
agatttcact tcccaagagt gatcagtatg gtcaagaaga tgatcatgat gaagatcttg 1260
aggagttggt tgctaagtgt gatgtgattg gactacttgg ggggctactt tttgctaccg 1320
ttctgtcgta tactacagca gtaagagctt ggacctgctg aaccaagaga ctaaactatt 1380
gtggatcaat aataattgaa ggttaggtat tctcctgaac atcttcagga gaagatgaag 1440
taggtaaagg atgatttggt gccttcttgt tcaccatttc tactaaaata ttttaagtgc 1500
ccttcctcta acactaatct attactgcaa ggcttcaaaa gacaggcaac gagatgggtc 1560
ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa gtctgtaaca aatcttgcaa 1620
agaaaatctc gaaacctacg ggtaccttct ggttcaagat cctctgatgg ataagttagg 1680
taaagtcttg agaataggtt gtgaaaatag aagaatagaa ggatgagaag agagattgtc 1740
ggtaaatgga gagatgactc ttatttcttt caatggggga gctgaaaata attcagcaga 1800
gtttccactc tatcaatcct gacttatttt gtggagggta ccttggcccc ttcatatata 1860
ggggatgaag aggcctggta aggttgttag actattagga gagtttgtta gatcgttaat 1920
ttattataat agaatgacca gctatataaa aatcatggag tatttaccca catggtgatt 1980
gactgtagta taactgaaag atagctaatg cttagctgga tgactgctgt tagataactg 2040
tctgcattct tacggtacat tgatatttta ccaatgtgac atagcttaaa tcggcaactg 2100
gctgaactaa atattatgta tccctttagt taacaatcat gtcggttaga gatcaatgta 2160
attcgcagca gatcgatcat aagctgagat gagtatcata ttttaagaac aacgctgggc 2220
gagttaggcc gatcaaatgt cagactgaaa aagcagatca ataaacctct gatgtgatct 2280
gaaagaatat ttatgattta aataataatc tatcaccacg tatccagata atgaggtcat 2340
ataacatgta ccaacagtgc atttttccat ctagttaaga ggttggttag tggcatttgt 2400
cttcgatatg taatgttcac ataactaatg tgcttagtag cattcttttg taaggttaaa 2460
tcttcaatga tcttaagttc acataattgc ctttgtgccc tattagttta tagttgacct 2520
tttaattcaa gagacagtca ccttagcaat cgatgtctgc ttagattggg ccaattaggt 2580
actcacatta atatattgaa tcatgtttga atataaagga ttagattgat ttataagttt 2640
ccttttattg tttacatact gatacttaga ttgacttact acattatttg atatgttatg 2700
ttctaatttt tggattaaaa ttgttgtttc tgatttctcc ttacatctaa tactttgtat 2760
aatttattat tttttagcat gattgagtgt agaggattag attgattttt aagtttattt 2820
tgattattta catgcccata cttaaattga cttactacat tattcaatat gttatgtttc 2880
aattattgag ttaaaatttt tatttctgat ttctactgat gtccagtgtg tgtgtgtgta 2940
cgtatgtgtg tatatattta tttacatata tatgtatnnn nnnnnnnnnn nnnnnnnnnn 3000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnatgta tacatataca 3720
tgtatacata catatataga tatatatata tacatatatg tatatatata tatatatata 3780
cacatatata ggttatttgg aacctaagaa acttgcaaag ttactagatg caatgttcgg 3840
aaaccatgga ccgtaacaac tggagtagta tttgggtcat gaattcatgg ctagatcatg 3900
aattgagtgg gagtcaaccg aagtagggcc agctcagaca cttgtattta ggtcccatgc 3960
ttgcgtgcat tctcttccct gatatccttt ggctttgctg cctcaaatcc tcgagctatc 4020
ttatcatcat cgcattgagc tccatacctt gctctttcct a 4061
<210> 55
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (2098)..(2825)
<223> n is a, c, g, or t
<400> 55
tagattcttg cagatgtttt gagagtgatt ggaaaagtga tgcaaaatag ggcattagat 60
accccttgta gtcttataat ggctctgaag ccttcaagat gatttaaggg attgatggag 120
ccatcgaatg tttccaatgt aggtatcttg aatcgaggag gaactgattt accaagaatt 180
ttttgagaaa aaagagatcg taagttgaaa tctcttctac cttgagaatg gcttccaatc 240
tatatctcca tcattttctt ctcaagattt tgaatctttt gtccaagacc ctcctccata 300
catggcttct tatgtggagc agatttcact tcccaagagt gatcagtatg gtcaagaaga 360
tgatcatgat gaagatcttg aggagttggt tgctaagtgt gatgtgattg gactacttgg 420
ggggctactt tttgctaccg ttctgtcgta tactacagca gtaagagctt ggacctgctg 480
aaccaagaga ctaaactatt gtggatcaat aataattgaa ggttaggtat tctcctgaac 540
atcttcagga gaagatgaag taggtaaagg atgatttggt gccttcttgt tcaccatttc 600
tactaaaata ttttaagtgc ccttcctcta acactaatct attactgcaa ggcttcaaaa 660
gacaggcaac gagatgggtc ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa 720
gtctgtaaca aatcttgcaa agaaaatctc gaaacctacg ggtaccttct ggttcaagat 780
cctctgatgg ataagttagg taaagtcttg agaataggtt gtgaaaatag aagaatagaa 840
ggatgagaag agagattgtc ggtaaatgga gagatgactc ttatttcttt caatggggga 900
gctgaaaata attcagcaga gtttccactc tatcaatcct gacttatttt gtggagggta 960
ccttggcccc ttcatatata ggggatgaag aggcctggta aggttgttag actattagga 1020
gagtttgtta gatcgttaat ttattataat agaatgacca gctatataaa aatcatggag 1080
tatttaccca catggtgatt gactgtagta taactgaaag atagctaatg cttagctgga 1140
tgactgctgt tagataactg tctgcattct tacggtacat tgatatttta ccaatgtgac 1200
atagcttaaa tcggcaactg gctgaactaa atattatgta tccctttagt taacaatcat 1260
gtcggttaga gatcaatgta attcgcagca gatcgatcat aagctgagat gagtatcata 1320
ttttaagaac aacgctgggc gagttaggcc gatcaaatgt cagactgaaa aagcagatca 1380
ataaacctct gatgtgatct gaaagaatat ttatgattta aataataatc tatcaccacg 1440
tatccagata atgaggtcat ataacatgta ccaacagtgc atttttccat ctagttaaga 1500
ggttggttag tggcatttgt cttcgatatg taatgttcac ataactaatg tgcttagtag 1560
cattcttttg taaggttaaa tcttcaatga tcttaagttc acataattgc ctttgtgccc 1620
tattagttta tagttgacct tttaattcaa gagacagtca ccttagcaat cgatgtctgc 1680
ttagattggg ccaattaggt actcacatta atatattgaa tcatgtttga atataaagga 1740
ttagattgat ttataagttt ccttttattg tttacatact gatacttaga ttgacttact 1800
acattatttg atatgttatg ttctaatttt tggattaaaa ttgttgtttc tgatttctcc 1860
ttacatctaa tactttgtat aatttattat tttttagcat gattgagtgt agaggattag 1920
attgattttt aagtttattt tgattattta catgcccata cttaaattga cttactacat 1980
tattcaatat gttatgtttc aattattgag ttaaaatttt tatttctgat ttctactgat 2040
gtccagtgtg tgtgtgtgta cgtatgtgtg tatatattta tttacatata tatgtatnnn 2100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820
nnnnnatgta tacatataca tgtatacata catatataga tatatatata tacatatatg 2880
tatatatata tatatatata cacatatata ggttatttgg aacctaagaa acttgcaaag 2940
ttactagatg caatgttcgg aaaccatgga ccgtaacaac tggagtagta tttgggtcat 3000
gaattcatgg ctagatcatg aattgagtgg gagtcaaccg aagtagggcc agctcagaca 3060
cttgtattta ggtcccatgc ttgcgtgcat tctcttccct gatatccttt ggctttgctg 3120
cctcaaatcc tcgagctatc ttatcatcat cgcattgagc tccatacctt gctctttcct 3180
aactgccccc atcaaacctc cggagatcct ctttcttctc caatgttgag atttgttgga 3240
gtcttcccac cttctcactt caatgggtgg caatttcaag tgccagttcc cttatttgtc 3300
ccagctatat tgacaatggg gcttattcta gggtttctca tggacatagt gataataata 3360
atcaagggac caagagagaa aaatctttct agtctgtgtt ctttaagttt gagagatagg 3420
cagcacattt ttttaataag cctttttcac tcatcggatc ctgattttca gttgttcgac 3480
ctgaacagtt caagcaattg aactgcttgg gtcactattt tggacgattt tcagccattt 3540
ttaagtattg tttgactgga tccacgctgc gtagtgggca ttgcgttgat caagtagacc 3600
tgtaagggtc aacaaggtct gagaacactg aatggatgct ccataatcct cttgttatct 3660
gtcaaccatt tggaatcttt taaaacaaca tgtggtgata atatatatga taaactgtga 3720
tagattcatg tatagattat acatatgaaa atgtagagtg cttagtaaaa gtgatgaaga 3780
gcaatgcgtt agaatgtgct agcctttgac ctaaaaattg gaatgcccaa tgatgagtta 3840
tgataaaatt gtgacgtgat ttatgaagtc taatgtttag ttggcttgca gtttcagatg 3900
cgataaagaa ttttatgatt tagctctttg gttttttaac atgcaaacat ttaattgtac 3960
tgaaaaacat ttatttcgaa acatgtagga gactattgga tattgaaatt aaaattgact 4020
ttttggtgtt tcacaatatt tcttaataaa cactacgact a 4061
<210> 56
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (218)..(1631)
<223> n is a, c, g, or t
<400> 56
aagctccgtg cttctgtctt tgagaagtgt ctgagtaggt agtcgatccc aggcaacctt 60
ctagaggaaa agtctgatcc tagagtggat agccatgtgt atatatatat atatatatat 120
gtatgtatgt atgtatgtat gtatgtatgt atgtacgtac atacatacat acacacacat 180
acatacatat acatacatac atatacatac atacatannn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1620
nnnnnnnnnn ntatatatat atagtatact atatagtata tatatagtat atatagtata 1680
tatatatata tatatatata gtatatatat atatatatat atatatatgt gtgtgtgtgt 1740
gtgtgcgcgt gcgcgcacgc acgtgtgtat ctcgatctgt gtgtgtgtgg tccatcttca 1800
cacttttccc tcaaaaaaac cccccttgag attttgttca gctgaaaggg gttcataaaa 1860
cttgcccttg cttggtccta gggtttaaga tttatatgca atattcatta agacgtctaa 1920
atgtcataat attttgaggt tacaaatatt aacaaacagc cttggataca aacctttttc 1980
tcgaagaatc ttgtatctgt tcttcctcag atgacatgtg atttatgcta cggcctagtt 2040
ctaaggactt ttctctgtca ttaacataaa aaaaaacaga aatatattcc ttagtaagga 2100
aatagttgtg cactatgatt gctatgtctc tcaaaattat accaaacttt ttatgatata 2160
gagtgaaaat caaatcagca tgtctggtct atttgccaaa tagggttgag cataggtcgg 2220
gttcggtcga gttgagagaa aaatttcatc cgatcaaatt caatcggatt gaagaaaatt 2280
caatccactg ccaatcattc attatgcata aactatctaa aactgaaatg aatagtttgt 2340
agcaggatca ggtgttatgt cagtttggac ttcaatgtta acccaatatt gattttaaat 2400
ccaacattgg tccacttaga cttatttatt tatttttatc aatttaatat aaaaaagatc 2460
taaacctcat aagtcataaa ttttggattt atttttgaac atgtacaaaa taaaacagaa 2520
aaaagaaaaa attacttatc taaaagtaac tatatctgaa aactttcact ttagaattgt 2580
cttaaattaa tgtacttcca tcaacaattc aatgttaata tttttatgaa tccaaatgga 2640
tgatagagta ttttttagaa tgaagtattg aagtctaaat gacatcgtcc caaaataaaa 2700
gtgaatttat gaaatactac atctgtcgga ttcggtttca tacggattaa aagtgtagga 2760
atagaatccg attataaata attatttttt tataaattct aattcaattt tattcgattt 2820
atatttttta accggtcaaa attaatattt attaagtagg attggatgga tttattcgta 2880
tctcgattat ttgctcagcc cattgccaaa tctaaactct tttcagatag gttccatgtg 2940
aacatgatac atgagatgca gtgtgatagt acacaccatt gctaagaaaa ctttggagtt 3000
tgcgtaacaa tatctgttta ccatttaaaa aatggcagtt ttgaatttta acacgctctc 3060
ctccagattc agcttatgaa cttttcgaat aaaaataccc ctggactatt tttccaaaaa 3120
gtaccagcat cttttgaact tgaatggaaa ttcggccaat aaaatgtttt catttattga 3180
agaaataaac agggtaacgc agtagctcta tttcctctgc ttttcttttc tatattaata 3240
acatgattat tcatctctct cggatcacaa aaaaattaag ctattcaagc tttatttata 3300
tttcattttt aaatttttta cttaaataca aaatctccca tcccactact acggcagcat 3360
gttttctatg tatgattatt ttcattcaaa tgatatcatt ttttataatt tatattgtat 3420
gtaattaatt catttatagt tcttacattt tcctgtttct agtagataca ataaagcggt 3480
tttggactag tagcttgttc tctgtatcga agtttaacta aagctttgac aataatatat 3540
gaatccatat cactgggtag gagaggaata tgttgggtat aaaggattta aggaattaga 3600
tattttcata caattgtatt gcattgcaga cagtaattag attactatgc aattattctc 3660
tctctccatg tttgttgcag ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg 3720
aacttgtaag tggaattaga cgactccgtt gtcctccatt ttcttttatt ttctttaaaa 3780
tcatctgcca ttcaaataga cagaaaaaaa aggattgatt agctattgga tgcctcttga 3840
attcaggaaa tgaaggacga gcacccagtt tatggttttg tggatgatga ccctagcaac 3900
tacgcaggtg cactagctct tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag 3960
ccgagccagc cgaatctcca tcgaatgggg tttggctccc atgacctgcg ccttgcttga 4020
ttttattgta gcttaaagac cttacaactt ccagagtggt g 4061
<210> 57
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 57
cagtttggac ttcaatgtta acccaatatt gattttaaat ccaacattgg tccacttaga 60
cttatttatt tatttttatc aatttaatat aaaaaagatc taaacctcat aagtcataaa 120
ttttggattt atttttgaac atgtacaaaa taaaacagaa aaaagaaaaa attacttatc 180
taaaagtaac tatatctgaa aactttcact ttagaattgt cttaaattaa tgtacttcca 240
tcaacaattc aatgttaata tttttatgaa tccaaatgga tgatagagta ttttttagaa 300
tgaagtattg aagtctaaat gacatcgtcc caaaataaaa gtgaatttat gaaatactac 360
atctgtcgga ttcggtttca tacggattaa aagtgtagga atagaatccg attataaata 420
attatttttt tataaattct aattcaattt tattcgattt atatttttta accggtcaaa 480
attaatattt attaagtagg attggatgga tttattcgta tctcgattat ttgctcagcc 540
cattgccaaa tctaaactct tttcagatag gttccatgtg aacatgatac atgagatgca 600
gtgtgatagt acacaccatt gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta 660
ccatttaaaa aatggcagtt ttgaatttta acacgctctc ctccagattc agcttatgaa 720
cttttcgaat aaaaataccc ctggactatt tttccaaaaa gtaccagcat cttttgaact 780
tgaatggaaa ttcggccaat aaaatgtttt catttattga agaaataaac agggtaacgc 840
agtagctcta tttcctctgc ttttcttttc tatattaata acatgattat tcatctctct 900
cggatcacaa aaaaattaag ctattcaagc tttatttata tttcattttt aaatttttta 960
cttaaataca aaatctccca tcccactact acggcagcat gttttctatg tatgattatt 1020
ttcattcaaa tgatatcatt ttttataatt tatattgtat gtaattaatt catttatagt 1080
tcttacattt tcctgtttct agtagataca ataaagcggt tttggactag tagcttgttc 1140
tctgtatcga agtttaacta aagctttgac aataatatat gaatccatat cactgggtag 1200
gagaggaata tgttgggtat aaaggattta aggaattaga tattttcata caattgtatt 1260
gcattgcaga cagtaattag attactatgc aattattctc tctctccatg tttgttgcag 1320
ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg aacttgtaag tggaattaga 1380
cgactccgtt gtcctccatt ttcttttatt ttctttaaaa tcatctgcca ttcaaataga 1440
cagaaaaaaa aggattgatt agctattgga tgcctcttga attcaggaaa tgaaggacga 1500
gcacccagtt tatggttttg tggatgatga ccctagcaac tacgcaggtg cactagctct 1560
tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca 1620
tcgaatgggg tttggctccc atgacctgcg ccttgcttga ttttattgta gcttaaagac 1680
cttacaactt ccagagtggt gttatatatt agtatcttaa gctatgacag tggtaagcct 1740
ctctatccgc tacttgttat cctttaggta ctttgcatgt ggtgcaaggt tataattgcc 1800
ttgtgtttct attgtcttcc tcatggtact tactggactg atgatgtcaa gtgaaatgga 1860
gttgtttgaa tcctgactga aatttctctt ggtccatcaa gtgcaagagt aagtttagac 1920
atcactcgca agcttttgct aggaaataag tagtttcatt gcactaatga tttcgaattt 1980
ttgttttcgg gttagagaaa cctagattaa tgctgttatt ggatgctggc agtcagatga 2040
agattatgtt tgattgtacc tcgttggaca gatgctcatg cgtagatcca taactctatt 2100
tcatttcatt tccctgtaca caattgaaac agggcatata tgaataggta tagaacagat 2160
gattcctgca atattggagg tggctagctc agcttagact aaagttggtc tagctgggat 2220
attctgaaca cctgagatgt tcaaataatg tgggataact tggcccaact caactaaaca 2280
ttggctcaaa gcatagtcaa ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc 2340
cgagctgagc ccgggccgct tgtttagctg atgaactgaa ttcaaatagc cggtactcag 2400
cttggctcca ctcgattcat gagttcgaat cccctcaagt tcaacctcga acttgacggt 2460
gtagtcccac aaccatggcc accttataat gtgggacggc cattatgcat tcctctagtg 2520
cctgctccat atgacttttg ttctcattat accatgcacc taaatgagtg ctcatagtga 2580
caatgtttag cctccacgta taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa 2640
atttctgcaa tgttgtggtt gtaaaacgct cctacgttga gacatgatgg tatctaagat 2700
tatagacaaa ctatcatgct gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa 2760
gccgagctcc attgaaatag tacaatggat tctgcacttg aagaacatta caaaatcatt 2820
ttttcccaaa aagaaacatt gcgaacagac caaagcgtaa agaaattaca tgattcaact 2880
aattcaagct ttccatgatg taggcactcg ctagatgtag tagggtgata acttgctttg 2940
tgagggtgga tcataagctt aacctcaatc tatcccaatc tatcctttcc cttgacctat 3000
ccatgccaat ctaggccatt tctgcataaa tataacttaa tcccagtgga tccggcctag 3060
tttcactcac tccaacacat tcctactcaa tggtagccaa tcctttcttt agccctcaaa 3120
tataatccta atctagcata gccaaccatc aatcatgcct aataaagccc gactacacca 3180
acccgatcat tcctgatcgt acacaatcaa gacttatcct aattgatcct agcttttttt 3240
aggcctctct tatagaacct gtgccaattc tggacaagct aatccaatct tagcagccaa 3300
aaatattaca tgtttaatta gccaaatcga acctatcata aacccaatat ataatcggac 3360
cataccaaga tcatcatcct atatttcctt ctcttgttat aactacacct aaaaaggaat 3420
ttcttcatac ttatgagggg tatattatga taaaaattcc ttcattttag ccctccatcc 3480
ttgtctattt ttgggaccac tagccaagta acaccttaag agccctccat cttaatattc 3540
cctctaacta gctcgatttc ttcttcattc tttctttgcg atgtgtcccc tccaatttaa 3600
ttcttacatg ttgggatttg agtactgaaa aataatagat aaagagaaag taaaaactat 3660
gctaatgata ataccaaagg cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt 3720
ttatggttcg gcctaagcct atatctacat agggacgaga gtaagaagaa gcttccacta 3780
taataatagt ttagagtaca aaaacttctc tgacaccatg tagggaacat cgcttctaat 3840
acaagaaaga agaaatccaa gattaaacaa acctctagaa aaattcttct cgatggaata 3900
actctaatct gagattgaac aatcttctcc aatcgatgat ctccaatctt cttttcttaa 3960
atgaagcacc cttcaagcct ctcttctttt ctctcttcct atcctctttt gtggctcaca 4020
acctcctctc ctttttatgt tctatgttcc tcacatcaca t 4061
<210> 58
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 58
tttcagatag gttccatgtg aacatgatac atgagatgca gtgtgatagt acacaccatt 60
gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta ccatttaaaa aatggcagtt 120
ttgaatttta acacgctctc ctccagattc agcttatgaa cttttcgaat aaaaataccc 180
ctggactatt tttccaaaaa gtaccagcat cttttgaact tgaatggaaa ttcggccaat 240
aaaatgtttt catttattga agaaataaac agggtaacgc agtagctcta tttcctctgc 300
ttttcttttc tatattaata acatgattat tcatctctct cggatcacaa aaaaattaag 360
ctattcaagc tttatttata tttcattttt aaatttttta cttaaataca aaatctccca 420
tcccactact acggcagcat gttttctatg tatgattatt ttcattcaaa tgatatcatt 480
ttttataatt tatattgtat gtaattaatt catttatagt tcttacattt tcctgtttct 540
agtagataca ataaagcggt tttggactag tagcttgttc tctgtatcga agtttaacta 600
aagctttgac aataatatat gaatccatat cactgggtag gagaggaata tgttgggtat 660
aaaggattta aggaattaga tattttcata caattgtatt gcattgcaga cagtaattag 720
attactatgc aattattctc tctctccatg tttgttgcag ttgaagaact ctaatgaagc 780
tcacaaaaat ttactgcatg aacttgtaag tggaattaga cgactccgtt gtcctccatt 840
ttcttttatt ttctttaaaa tcatctgcca ttcaaataga cagaaaaaaa aggattgatt 900
agctattgga tgcctcttga attcaggaaa tgaaggacga gcacccagtt tatggttttg 960
tggatgatga ccctagcaac tacgcaggtg cactagctct tgccaatggg gcttcccaca 1020
tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca tcgaatgggg tttggctccc 1080
atgacctgcg ccttgcttga ttttattgta gcttaaagac cttacaactt ccagagtggt 1140
gttatatatt agtatcttaa gctatgacag tggtaagcct ctctatccgc tacttgttat 1200
cctttaggta ctttgcatgt ggtgcaaggt tataattgcc ttgtgtttct attgtcttcc 1260
tcatggtact tactggactg atgatgtcaa gtgaaatgga gttgtttgaa tcctgactga 1320
aatttctctt ggtccatcaa gtgcaagagt aagtttagac atcactcgca agcttttgct 1380
aggaaataag tagtttcatt gcactaatga tttcgaattt ttgttttcgg gttagagaaa 1440
cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 1500
tcgttggaca gatgctcatg cgtagatcca taactctatt tcatttcatt tccctgtaca 1560
caattgaaac agggcatata tgaataggta tagaacagat gattcctgca atattggagg 1620
tggctagctc agcttagact aaagttggtc tagctgggat attctgaaca cctgagatgt 1680
tcaaataatg tgggataact tggcccaact caactaaaca ttggctcaaa gcatagtcaa 1740
ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc cgagctgagc ccgggccgct 1800
tgtttagctg atgaactgaa ttcaaatagc cggtactcag cttggctcca ctcgattcat 1860
gagttcgaat cccctcaagt tcaacctcga acttgacggt gtagtcccac aaccatggcc 1920
accttataat gtgggacggc cattatgcat tcctctagtg cctgctccat atgacttttg 1980
ttctcattat accatgcacc taaatgagtg ctcatagtga caatgtttag cctccacgta 2040
taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa atttctgcaa tgttgtggtt 2100
gtaaaacgct cctacgttga gacatgatgg tatctaagat tatagacaaa ctatcatgct 2160
gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa gccgagctcc attgaaatag 2220
tacaatggat tctgcacttg aagaacatta caaaatcatt ttttcccaaa aagaaacatt 2280
gcgaacagac caaagcgtaa agaaattaca tgattcaact aattcaagct ttccatgatg 2340
taggcactcg ctagatgtag tagggtgata acttgctttg tgagggtgga tcataagctt 2400
aacctcaatc tatcccaatc tatcctttcc cttgacctat ccatgccaat ctaggccatt 2460
tctgcataaa tataacttaa tcccagtgga tccggcctag tttcactcac tccaacacat 2520
tcctactcaa tggtagccaa tcctttcttt agccctcaaa tataatccta atctagcata 2580
gccaaccatc aatcatgcct aataaagccc gactacacca acccgatcat tcctgatcgt 2640
acacaatcaa gacttatcct aattgatcct agcttttttt aggcctctct tatagaacct 2700
gtgccaattc tggacaagct aatccaatct tagcagccaa aaatattaca tgtttaatta 2760
gccaaatcga acctatcata aacccaatat ataatcggac cataccaaga tcatcatcct 2820
atatttcctt ctcttgttat aactacacct aaaaaggaat ttcttcatac ttatgagggg 2880
tatattatga taaaaattcc ttcattttag ccctccatcc ttgtctattt ttgggaccac 2940
tagccaagta acaccttaag agccctccat cttaatattc cctctaacta gctcgatttc 3000
ttcttcattc tttctttgcg atgtgtcccc tccaatttaa ttcttacatg ttgggatttg 3060
agtactgaaa aataatagat aaagagaaag taaaaactat gctaatgata ataccaaagg 3120
cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt ttatggttcg gcctaagcct 3180
atatctacat agggacgaga gtaagaagaa gcttccacta taataatagt ttagagtaca 3240
aaaacttctc tgacaccatg tagggaacat cgcttctaat acaagaaaga agaaatccaa 3300
gattaaacaa acctctagaa aaattcttct cgatggaata actctaatct gagattgaac 3360
aatcttctcc aatcgatgat ctccaatctt cttttcttaa atgaagcacc cttcaagcct 3420
ctcttctttt ctctcttcct atcctctttt gtggctcaca acctcctctc ctttttatgt 3480
tctatgttcc tcacatcaca tccacagact catttttata gataaaaaat tagagtctat 3540
ttcggactcc ttttccacac acaagatggc ttcccacgcc attggttccg tgcgcatgac 3600
ttttttcatg ccacaaagga ttccgtgctg caaaagtttt ccatatccat gcagtttcca 3660
cacaccacaa aaactttcgc acacttctcg aaggcttttc atgctcgacc ctttttggtt 3720
ttcaattaaa ttgatggatc ccatatgagg agggaccaca ccaataaatc tcctccttct 3780
aactcatatg gtaggttcca tcaagcctgt agcacctttg cattttatca gttttgttcc 3840
tgaagccggc ttcatcaata tattagaact attttcttca gtgtcaactt ttttaagctt 3900
gaaccacttc atctctagca tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa 3960
ttaatcttac ggttctcttt ttcgttagat tctagtgcat attacgcact ttaacataag 4020
atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt t 4061
<210> 59
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (3947)..(4061)
<223> n is a, c, g, or t
<400> 59
cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 60
tcgttggaca gatgctcatg cgtagatcca taactctatt tcatttcatt tccctgtaca 120
caattgaaac agggcatata tgaataggta tagaacagat gattcctgca atattggagg 180
tggctagctc agcttagact aaagttggtc tagctgggat attctgaaca cctgagatgt 240
tcaaataatg tgggataact tggcccaact caactaaaca ttggctcaaa gcatagtcaa 300
ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc cgagctgagc ccgggccgct 360
tgtttagctg atgaactgaa ttcaaatagc cggtactcag cttggctcca ctcgattcat 420
gagttcgaat cccctcaagt tcaacctcga acttgacggt gtagtcccac aaccatggcc 480
accttataat gtgggacggc cattatgcat tcctctagtg cctgctccat atgacttttg 540
ttctcattat accatgcacc taaatgagtg ctcatagtga caatgtttag cctccacgta 600
taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa atttctgcaa tgttgtggtt 660
gtaaaacgct cctacgttga gacatgatgg tatctaagat tatagacaaa ctatcatgct 720
gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa gccgagctcc attgaaatag 780
tacaatggat tctgcacttg aagaacatta caaaatcatt ttttcccaaa aagaaacatt 840
gcgaacagac caaagcgtaa agaaattaca tgattcaact aattcaagct ttccatgatg 900
taggcactcg ctagatgtag tagggtgata acttgctttg tgagggtgga tcataagctt 960
aacctcaatc tatcccaatc tatcctttcc cttgacctat ccatgccaat ctaggccatt 1020
tctgcataaa tataacttaa tcccagtgga tccggcctag tttcactcac tccaacacat 1080
tcctactcaa tggtagccaa tcctttcttt agccctcaaa tataatccta atctagcata 1140
gccaaccatc aatcatgcct aataaagccc gactacacca acccgatcat tcctgatcgt 1200
acacaatcaa gacttatcct aattgatcct agcttttttt aggcctctct tatagaacct 1260
gtgccaattc tggacaagct aatccaatct tagcagccaa aaatattaca tgtttaatta 1320
gccaaatcga acctatcata aacccaatat ataatcggac cataccaaga tcatcatcct 1380
atatttcctt ctcttgttat aactacacct aaaaaggaat ttcttcatac ttatgagggg 1440
tatattatga taaaaattcc ttcattttag ccctccatcc ttgtctattt ttgggaccac 1500
tagccaagta acaccttaag agccctccat cttaatattc cctctaacta gctcgatttc 1560
ttcttcattc tttctttgcg atgtgtcccc tccaatttaa ttcttacatg ttgggatttg 1620
agtactgaaa aataatagat aaagagaaag taaaaactat gctaatgata ataccaaagg 1680
cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt ttatggttcg gcctaagcct 1740
atatctacat agggacgaga gtaagaagaa gcttccacta taataatagt ttagagtaca 1800
aaaacttctc tgacaccatg tagggaacat cgcttctaat acaagaaaga agaaatccaa 1860
gattaaacaa acctctagaa aaattcttct cgatggaata actctaatct gagattgaac 1920
aatcttctcc aatcgatgat ctccaatctt cttttcttaa atgaagcacc cttcaagcct 1980
ctcttctttt ctctcttcct atcctctttt gtggctcaca acctcctctc ctttttatgt 2040
tctatgttcc tcacatcaca tccacagact catttttata gataaaaaat tagagtctat 2100
ttcggactcc ttttccacac acaagatggc ttcccacgcc attggttccg tgcgcatgac 2160
ttttttcatg ccacaaagga ttccgtgctg caaaagtttt ccatatccat gcagtttcca 2220
cacaccacaa aaactttcgc acacttctcg aaggcttttc atgctcgacc ctttttggtt 2280
ttcaattaaa ttgatggatc ccatatgagg agggaccaca ccaataaatc tcctccttct 2340
aactcatatg gtaggttcca tcaagcctgt agcacctttg cattttatca gttttgttcc 2400
tgaagccggc ttcatcaata tattagaact attttcttca gtgtcaactt ttttaagctt 2460
gaaccacttc atctctagca tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa 2520
ttaatcttac ggttctcttt ttcgttagat tctagtgcat attacgcact ttaacataag 2580
atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt ttttttgagt tggtaatggt 2640
acaaaagtta tactagaccg tgggtaccta atctcggaga ttaccattta gatttggttc 2700
ttgatcattt gtatagtgat gcatttaaaa aattatttga gcaaaacagt gaatgccatt 2760
gggtctgaga gatccaaaac caaataacct aaagtatata gatggttcct ttagctagat 2820
catgtatgag aaaaaatgat ctgccgactg gaaaaaatag atctttgagc tcattgattg 2880
ttaagtcata tctagtctgt gaatcatctc tttgaggatt aatgatcaag ctatctttta 2940
tgggttaaaa gaataggatc actgaaatac ttatcctagt atacatataa tgtgcatggc 3000
ctatttgatg agtcagacta gaaggttatc actacttcat cacctttact gatgagcaat 3060
catgatatag atatgtatgt gagatacaaa tctaaaagat tttgaatggt tcaaagaatt 3120
cagatatgaa gtagaaaaga taaatcaaaa aatttttaaa ggtacttgat cggatctaga 3180
atgcaatacc aaataaaaaa tttgttgatt atctaaaaaa agtgatatag tttcatgatg 3240
gaattcttct tgtacacctc agctcaacgg tatatatatg aggagcaata gcactatatg 3300
agatatggtc cggtccatca tgaatatcac taatttaatt attatttatt taagagcaag 3360
atttaatttt taaaatttaa attagatttt ttctaaaatt ggtttcaccg caccatatga 3420
gatatgattt ggtggataag ttagaggata ggtctgtgag aactcattta tagggtatcc 3480
caaaaggtat ttaaaatatt actttttctt tctagtagtt gacaatatga ttgtgagcaa 3540
tcatactgtt ttcttaaaaa cagtggaagg atgaactcaa aaagaaagtc tctaaagaac 3600
aacgagtcac aagacctata caacctattt aagatgagcc agtatatgta gtacttcctt 3660
cacctcatca atttagtagg atctcctatc ctttagaaag atactcggta ttcttacaaa 3720
ggatttagag aaagtgtttc ttgagggaga ttgagaatat agggatgatc tcaaaaccta 3780
caatgacata atataaggaa tcatgtagtt acatgaaggt cagtgggagg gttccatact 3840
gacatcgatt atgatgtggt tacatataga attttttttt caaagatcta gatcaaacat 3900
tctgaaaata aaaggtctat agagataaat ccgaaaagga tgtttgnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn n 4061
<210> 60
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 60
tataccatag atttttctgt taaccacatg tcaattcttc tcctccattg attttcatta 60
caatattcag gaacagctgc tttcatcttc tcaacaaata agtcaacatt aaaatggtta 120
gactttagat cattcttcca atgcctccac atagccccta ttttttccag tagagacttt 180
cttatggcat ccatgtactt agataaaaat ataaatatat cctacaccta gaaactgact 240
tttagaaaaa gtgtatatat acctaaataa aatgatttaa gatgaaaata ttcactatac 300
ctctagttca gctatcatct tttccttgaa gcctgatggc acatcatgcc aagagtcata 360
atcgattgga gcattatcaa attgtcttac cattgactgt atataatttg acaaattagt 420
agcttccacc cggattgatt gtccaagttc acttaggttg gcaacaacat gctctccctc 480
ttttagatca cgtaactcag acatacgtat gtatcctctc cttctaggcc agctagtcga 540
acctacaaat atgtatacac aattaaaaaa atacataaaa tgtaagaaaa tgatccctca 600
aaattaataa ttatcatatg caccatcctt tatttggtta ttagtgatct atttatgcaa 660
ttcattcgaa gaagattata tatgtatacc tagttgactt tcattggtag ctaagggagg 720
tagctcttag gcaactgatt cagttttctc ataattttgg gcttcaagtg actgctccta 780
ttgattatga gatggaggct caccttgatt ctgactttaa gagttttctg taccactaat 840
attgacaatt gtctgcttgt gttttgccat tattaatgta atttgaaaga aaaaaataga 900
attcatatat ctgaatgtta gtgaccaaaa aaacttgcaa gtatctcccc aaccatctaa 960
agattatacg ctattttatt tttcaaatct taaaaggcta acaaggcaca tagcaattac 1020
atgaagcaaa aaaagaaaat aaataaagca ccaaggaaac cattacactg tcattactga 1080
aattacattc aatagtatta tgcattaaaa caaaaactac attgataaaa taaaattgaa 1140
aataagaaac tacaagctcg tgggtgttcc ctcttgatca aaacatatcc tcaaactcta 1200
aatcttcatc gtgttggtgc acttcttgaa caaccacttc tttaaatggc tcttcacctc 1260
gaatcaaatc tgaaggttga agctgatcct catacatttg ttgtggcaca tgatcactaa 1320
caatagagtt cacatctccc aaatcataat tgtctctaac tttaaccgac ttaacaataa 1380
ccacatcttt atgtctagga gtattaatat agaacatctt tgcttgagat gcaaatacga 1440
aaggatcgtc aagcacacct tcaccagtat gtgctaagta agaaaaattc acaagtacaa 1500
taaaatttat ctttcttgca tcctttattg atatcaaccc aatcgcactt gaataaatca 1560
atcttgattt tgcaatgata atttaattga ataatgtcct ttaatatacc ataatactct 1620
attttttctt tcaacaggct acctatctct agtcctagtg taacccattg attcaactat 1680
caccacaacc ccactatttt gagttctcaa cttcctctca agtgcttttg tgtggaatct 1740
aaagccattc ataacgtaac cggtatatca tcgtgcaaca tcaagtggct ttcgagcaag 1800
gcacctaatt tgtttagtaa tatagacatc accttgttga ttcatgcatg caacctaaat 1860
taacatggat ttcaaatagt atattacaag atagaacatt atgaggtaaa tatatggtgt 1920
ttatatattc aaattataaa ttataaagga gcatataaaa cactcattta tgaaaccact 1980
cgaaaaattc ctgactatga atcctttcaa tctcataaga agttaaatga catggatgac 2040
atgaagcttt gatatgcatc gaaacatatt cacatggtta ttaatgagat gagtgatagt 2100
ttggtagact tgccaactta ataactaact taataacaaa atctccttac tctcgaaata 2160
cggtaattgc atcgtagtta aataggatat atctgtgcgc ttgcatcaac tctttctcat 2220
caagatggac ccttggcact cgacttcacc tttctggcct ccatgacttt tgctacttcc 2280
tttctaaaga tttttctggc ctaaacattc ttgaatcgac atcaagttgg tcttcaccat 2340
catcgcctac aagttggtct tcaccatcat ctcctacaag tagatcttcg ctattatcat 2400
tccttcatgg ccaattgaac cttatttgaa tcccacttaa gtgtcgtaag cagaatgtac 2460
attatacatt catttgcaag atatgcttct gctattgagc cctctggagg agctctattg 2520
cacacatata tcttaaggta accaagaagc ctaaataaaa aattgaaaga aatgataaca 2580
taaattaatc atcaaaaaat atcataacac ataatgaacc aaattttaac tataacacat 2640
ccaaaattat acctctcaat aggatacatt catctatgat gaactggatc agtcatctta 2700
gcctcgctcg ctagatgaac cactaagtga accataactg tgaaaaaaga tggtggaaaa 2760
atcttcctat ttgacaaaag gtaagagcag ctcaagattg aagccgctca agattatcca 2820
catccaaaac cttgctataa agttctatga aaaaattgca tagatcaata acagctaaag 2880
aaacatggtc aggaaaagac ccaggggtag caattggaag gatttcttca atcaggacat 2940
gacagtcata cgacttaagg tgagcaagct tgtgttgtct caactacaca cacctctaaa 3000
tgttggatga acactcttct ggaaatttca attccttaat cacattgcaa aaatcatcct 3060
tttcttttgc attcatttga ggcataaact tcaaataagt attgttgggt ataaaatacc 3120
ccccggctga agtctgtaaa agaccgaccc ttccaggact ctttcggctt ccgaccttgt 3180
gtgtggcatc actccaaacc cccatgaccg tccggacttc tccgatagag aacttctgca 3240
ttcgtctacc gagccgcccc aaaatgctct ctgggcctca ccaccagccg accttctaca 3300
gtgatcaact attctccgaa ctccttccga actctgccaa tatccaagct tcttcgacaa 3360
cgagatttct acagtaatca gactccatcc aagtttctac gacggtcgac cgccttcagg 3420
attccaactg ggctcctgtg agagccaaac ttctactacg gacagtctac tccgaactca 3480
tacagtgagc ggtctactct ggatatccac tataagcaaa ctccattcga gcctctgctg 3540
taaacaaatt tcttccaaac tttcgttaca ggtagacttc gatcgagctt cttcgtagcc 3600
ggatcccata cgagcttcta cgatggggca ggatccaccg gccaggtcgt tactccgagc 3660
tcccacgaca accgatcttc gatcgagctc caacaataag tggcttcctt tcggcctccc 3720
acaagaacca gactccgtcc gagcttccac agtggatgga ttctggatga gctttcgcaa 3780
tggacgagct ctagcagctg gatttctaca atgactgatc acctccgacg tctgtcgaac 3840
ctccccagcg ccatccgaag tccatcacca gctgacctcc tgccagatcc ttcatgaaat 3900
caaagttctc caatggatca tcttcagatg agcttccaca tcaggtaaat ctcagacgga 3960
ctcctctagc aatcgaactt ctgttgggct tcaccaacga aaagtctcca tccgagcttc 4020
tacaacagat gactcccacc tgtggtatca gcgcctaagg t 4061
<210> 61
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 61
attttaaaat ttttaatagg ataaaaaatt ttagttagct ttgtgatagg cctagcgaat 60
ccacgagcta ccattctttg cttttggaca aattgcagat gcacgaagcc aatcatgata 120
tagttagcaa aactccttca ataggacagg aatgacaaac tggctggcca aagcctcagt 180
cggtgctttc aaagtgtatc gtcacctaac aataaagtag atattagaat caccacaagg 240
taaaaaattt ttaacgataa aattatttgt gatagataaa atttttatta taaataataa 300
tgtcaatgat ggtaaaaaat tttcatcgat aataaaaaaa tatttacgat gaataaattt 360
tttcattata aataaaagta attaacgacg aaaatattgc ttacgtcgta acaaacagaa 420
tatttgcgat gaaaatttta atcataaata agaaaatatt ttttaaataa aaatatagag 480
atattaccga tgaaattatt tttgttagaa atattaaaag ttttttcgat gaaatcaggt 540
tttgcatcat caataacatt atttacgata aatttttttt gtcactaata aatcaaaaaa 600
aattaaaaat tagatatttt caattatttg tgatgtaaat tttagtcgta aataatttga 660
ctatttgaaa actgagacat acctttaaaa aaaataaata aataaaaatt gatccagctc 720
gagatgatga tatatattta atatattaat tatatctatc tatataacaa taataaaatg 780
atatacaggt attaggggta gcattcttta ttgacacata aagattataa gatgatccct 840
aaagtcttct ttaatttttt ttttatttat tttttgtttt tctttaattt tttctcttct 900
tatttttgct gccatctgct gcctctgttt tctctgctcc tgctgcctcc ttttatagag 960
cacagcttct tcgaattata agcatctatg gactttcaat tcccactatc ttttattttg 1020
attgggattt taaaacttta tccgcatccc agcatcttgt ttcacgcgag atcctagcgt 1080
ccacatgtgt tttgaattcc ttatgggcca cagaccattt aaaccaccaa agaccacttt 1140
actattttga tttgaatccc atggaagccg gctgcctctg gtctcattca cccttccagt 1200
gcttcacatg ggtcccatta atttgaattc ctatgagcca catccaagct tttgaatcca 1260
agccttcctt attttttaaa tcaattaaaa ctttgcttta aatgccttgt agaccctcct 1320
atttgcatgc tacgtgagaa cattgttaag ctcctcttgg cccacttaag aacttctatg 1380
ggctacatgc ttttggctag ctttaaaatg gttttgggcc taactttgga tcaccattcg 1440
aagtccattt tgaattcaat ttatttttat tttttttttt aaccttacaa atcgagctct 1500
tttattggtg atcatttttc ctataaaaca aaaacaaaaa gcatcaagtc ttaagaaata 1560
aaagttaatt aatatatatt ttgatacttt tattgggata tttaatgtac ttatcactag 1620
atatgaaatc caatgggtca cacactttga aatttgatct tagtctaatc taactaggat 1680
ttattataaa tcttatgggt taaatttaca tgctagcaca tgaattaact caagttttca 1740
attggattta gttctaaggt gtttgagcta accctatcct gataccttaa acctaattag 1800
attagatttg aacctatggt tttcttgatg ccttatgctt attacatgaa agagtttcat 1860
gtgacttaaa ttcctccatg ccaccacatc ttcatccatg ccaaattaat atggaacgcc 1920
ccatttaatt gtgcatttaa gaaggaatag tccttcttaa acactcctct taatttccca 1980
cactttcctt tgttctacac accatcaaat ggcttttgga aatatgcggg cgcagaagta 2040
gaggtgtcct atatgaaggc tcttccacat tataagttat cacatggtga attaaatcat 2100
tgtgtgagaa aatcatgcgc caagagttgg caccccttgg gagttttagg cactccttat 2160
cctataaata aggggcaccc catatggata aatacaaggg aattcaagtt taggcatgag 2220
attgagagga gaaaaagaca caaaaatctg agaaaaagat aagaaaaaaa aagagagaaa 2280
aatagaaaga aaagacgaga gaaaatgaaa ggcaagggtt gctaatccta gggttcaatt 2340
tttcaatagt tggatttctg aatcaatttg gggtggtgag attttttgag aaaaagtttc 2400
tgatgtggcc ctagtagaag attgaaggca ttcagatgat ggtgcaatcc gtttttgaaa 2460
aagaaaagtg agtagtatac ttatgaagaa agctgcaaca ctacatcaaa ttggaaagga 2520
ccttgatcaa acccatatgg atcaccgttg caggatatct actttggtat cttgtgaagg 2580
ttattttttt tatcagatca tcatcttcaa aaaggtataa ttttctacct aatatgcatg 2640
cttgatttgt ttgattaaaa tctataaagt gttcataagg tttgtgttct gattgtattg 2700
ttttaagtat taaaacttac tttaaaaata taaaaaaatt tgaaaactat cttctactgt 2760
gcaactaaaa tccaacagaa taaccctaat atgagattga gcgatctccg ccaatgttct 2820
cgatcttctt ttcttgaatg aagccttttc aagcctctct tcttctctct ctctccctat 2880
cttcttttgt ggcccacggc ctcctcttct ttttatgttt tgtgtttctc atgtcacatc 2940
cataaactcc cttttataga taaaaaatta gagtccattt tggactcctt ttccatgcat 3000
aagaaggctt cccacgccat tggttctgtg cacacgactt tttccatgct acaaaagttt 3060
ttcatgtctc acgtagtttc catgcgccat aaaattttgc atacttctcc aagacttttt 3120
atgctcgacc ctttttggtt ttcatttaaa tcagtgggtc ccatatgacg agggatcaca 3180
ccaacatcat atgctctcct caccatacca aatggtatcc ccaactataa gacaaaacat 3240
tcatcaaatt gctaacaggg ttgaggatca gcattcacta tagaaatttt gtttttcaat 3300
ctgtaacccc tcccaccatc ctggcctctt ggatatcgga cccatcaagt gggtcccgcg 3360
agcccgcacg gcactgtcag tccccaaact caattttttt tttaggaaaa atgttacctg 3420
cagtagaaga aagagacctc caaaaaaatt atgaaaaaaa agccttaaaa taaaaatgaa 3480
aaggatgaag attaaaaggg gtgcaacagg aggagttccc agggggtcat ccatccctgt 3540
acgactctcg cccaagcacg ctcgactgtg gagttctgat gggatccggt gcattagtgc 3600
tggtatgatc gcacccatca tgatctcttc gaaattcata gatataacat agcttccgtt 3660
gcacgccatc cataaccctc ccaccgtccg ggcctgcagg gtaccagact catcaagtgg 3720
gctcgcgagc ccgcacgtca ctataggtct ccagacttag ttttttttga tagagaacat 3780
taaccatggt agaagaaaga gatctccata aaaattatga aaaaaaatat tgaaataaaa 3840
ataaaaggct taaaaattat ggaaaaaaag gcttgaaata gaaataaaaa ggacgaagat 3900
taaaagggat gcaacatgag gtcctcccag gggttcatcc atcttagaac tactctcgcc 3960
caagcatgct taactacgaa gttctgatgg gatctgacgt attggtgctg gcatgatctc 4020
ctcgaaattc ttagatataa cgtagcgacc gtcgcacccc a 4061
<210> 62
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 62
gccggctgcc tctggtctca ttcacccttc cagtgcttca catgggtccc attaatttga 60
attcctatga gccacatcca agcttttgaa tccaagcctt ccttattttt taaatcaatt 120
aaaactttgc tttaaatgcc ttgtagaccc tcctatttgc atgctacgtg agaacattgt 180
taagctcctc ttggcccact taagaacttc tatgggctac atgcttttgg ctagctttaa 240
aatggttttg ggcctaactt tggatcacca ttcgaagtcc attttgaatt caatttattt 300
ttattttttt ttttaacctt acaaatcgag ctcttttatt ggtgatcatt tttcctataa 360
aacaaaaaca aaaagcatca agtcttaaga aataaaagtt aattaatata tattttgata 420
cttttattgg gatatttaat gtacttatca ctagatatga aatccaatgg gtcacacact 480
ttgaaatttg atcttagtct aatctaacta ggatttatta taaatcttat gggttaaatt 540
tacatgctag cacatgaatt aactcaagtt ttcaattgga tttagttcta aggtgtttga 600
gctaacccta tcctgatacc ttaaacctaa ttagattaga tttgaaccta tggttttctt 660
gatgccttat gcttattaca tgaaagagtt tcatgtgact taaattcctc catgccacca 720
catcttcatc catgccaaat taatatggaa cgccccattt aattgtgcat ttaagaagga 780
atagtccttc ttaaacactc ctcttaattt cccacacttt cctttgttct acacaccatc 840
aaatggcttt tggaaatatg cgggcgcaga agtagaggtg tcctatatga aggctcttcc 900
acattataag ttatcacatg gtgaattaaa tcattgtgtg agaaaatcat gcgccaagag 960
ttggcacccc ttgggagttt taggcactcc ttatcctata aataaggggc accccatatg 1020
gataaataca agggaattca agtttaggca tgagattgag aggagaaaaa gacacaaaaa 1080
tctgagaaaa agataagaaa aaaaaagaga gaaaaataga aagaaaagac gagagaaaat 1140
gaaaggcaag ggttgctaat cctagggttc aatttttcaa tagttggatt tctgaatcaa 1200
tttggggtgg tgagattttt tgagaaaaag tttctgatgt ggccctagta gaagattgaa 1260
ggcattcaga tgatggtgca atccgttttt gaaaaagaaa agtgagtagt atacttatga 1320
agaaagctgc aacactacat caaattggaa aggaccttga tcaaacccat atggatcacc 1380
gttgcaggat atctactttg gtatcttgtg aaggttattt tttttatcag atcatcatct 1440
tcaaaaaggt ataattttct acctaatatg catgcttgat ttgtttgatt aaaatctata 1500
aagtgttcat aaggtttgtg ttctgattgt attgttttaa gtattaaaac ttactttaaa 1560
aatataaaaa aatttgaaaa ctatcttcta ctgtgcaact aaaatccaac agaataaccc 1620
taatatgaga ttgagcgatc tccgccaatg ttctcgatct tcttttcttg aatgaagcct 1680
tttcaagcct ctcttcttct ctctctctcc ctatcttctt ttgtggccca cggcctcctc 1740
ttctttttat gttttgtgtt tctcatgtca catccataaa ctccctttta tagataaaaa 1800
attagagtcc attttggact ccttttccat gcataagaag gcttcccacg ccattggttc 1860
tgtgcacacg actttttcca tgctacaaaa gtttttcatg tctcacgtag tttccatgcg 1920
ccataaaatt ttgcatactt ctccaagact ttttatgctc gacccttttt ggttttcatt 1980
taaatcagtg ggtcccatat gacgagggat cacaccaaca tcatatgctc tcctcaccat 2040
accaaatggt atccccaact ataagacaaa acattcatca aattgctaac agggttgagg 2100
atcagcattc actatagaaa ttttgttttt caatctgtaa cccctcccac catcctggcc 2160
tcttggatat cggacccatc aagtgggtcc cgcgagcccg cacggcactg tcagtcccca 2220
aactcaattt tttttttagg aaaaatgtta cctgcagtag aagaaagaga cctccaaaaa 2280
aattatgaaa aaaaagcctt aaaataaaaa tgaaaaggat gaagattaaa aggggtgcaa 2340
caggaggagt tcccaggggg tcatccatcc ctgtacgact ctcgcccaag cacgctcgac 2400
tgtggagttc tgatgggatc cggtgcatta gtgctggtat gatcgcaccc atcatgatct 2460
cttcgaaatt catagatata acatagcttc cgttgcacgc catccataac cctcccaccg 2520
tccgggcctg cagggtacca gactcatcaa gtgggctcgc gagcccgcac gtcactatag 2580
gtctccagac ttagtttttt ttgatagaga acattaacca tggtagaaga aagagatctc 2640
cataaaaatt atgaaaaaaa atattgaaat aaaaataaaa ggcttaaaaa ttatggaaaa 2700
aaaggcttga aatagaaata aaaaggacga agattaaaag ggatgcaaca tgaggtcctc 2760
ccaggggttc atccatctta gaactactct cgcccaagca tgcttaacta cgaagttctg 2820
atgggatctg acgtattggt gctggcatga tctcctcgaa attcttagat ataacgtagc 2880
gaccgtcgca ccccatcaat aaccctccca cgtccaggcc tgtagggcac cggacctttc 2940
atgtgcatcc ccataaaaat tgtggaaaaa agtattgaat taaaaataaa atagacaaag 3000
attaaaaaaa atgcaacacg cccatcccag tacaactctc acccaagctc gttcgactgc 3060
ggagttttga tgggatccgg tgcattagtg ctggtatgat cacacccatc acgatctctt 3120
cgaaattcat gtatataacg tagcttcaat tgcacgccat ctgtaaccct cccaccattc 3180
gggcctgtag ggtatcggac ccttcatgcg agctcgtacg gcactgtagg tctccagacc 3240
cagttttttt ttgagagaaa acgttaacct tggcagaaga aagagatctc tataaaaatt 3300
gtagaagaaa gtgtttgaat aaaaataaaa agcataaaaa ttacaaaaaa aatcttgaaa 3360
tagaaataaa aaggatgaag attaaaaggg atgcaacatg tggacctcgc tgggggttac 3420
ccttcctagt tctactctcg atcaagcatg cttaactacg gagttctgat gggatccaat 3480
gtattagtgc tggcatgatc gcacccatca tgatctctta gaaattctta gatataacgt 3540
agcggccgtt gcatgccatc agtaaacctc ccacgtccag gcctgtaggg cactagacct 3600
atcaagtgga tccggtgagg ccgcacggca ctgcctgtct ccagactcaa tttatttttt 3660
taagaattgt ggaaagtgat ccccataaaa attatgaaaa aaagtgttga attaaaaata 3720
aaatagatga agattaaaaa agatgcaaca cgaggacttc ccaggggtag atataacgta 3780
gcggccgttg catgccatca gtaaacctcc cacgtccagg cctgtagggc actagaccta 3840
tcaagtggat cccgcgaggc cgcacggcac tgcctgtctc cagactcaat ttattttttt 3900
aagaattgtg gaaagtgatc cccataaaaa ttatggaaaa aagtgttgaa ttaaaaataa 3960
aatagatgaa gattaaaaaa gatgcaacaa gaggacttcc caggggttca cccatcctaa 4020
tattactctc gtccaagcac gcttaactat agagttctga a 4061
<210> 63
<211> 6704
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 63
aaatctatta gtatctgaca aaagttaaat tagagtcgaa acactaaatg acaattaggg 60
atcaacttga tcaagtagat agagaatatt agaaaagaga gaaattaaca agatagaaca 120
tgattaatta ggtgacatag cccgacaatc caattggtct aagcaagttg atttaatcaa 180
atcacggttg aactaatata tagatagctc aataaaaatc atacataatt gaatctaatg 240
atatttggat ctgaccaaga tggaatttga catgctgtcc gatgatcgtg aatcaagact 300
ctctttgcta attaagatca aattagaatc attgaaagag aatcttttac tggatcaaga 360
gagagaaata tataaagaga gtgaaatagt ctatagaaaa aaattttaga gagagaaatt 420
aagaagaaaa aataaatttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480
agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540
tttttttcct attcttcttt cccttttctg cttaatggaa taggggacct cccattcccc 600
ttctatttct agagttgggg gctcaaaatt gatgatagct atcattgggg atgtaggcta 660
tggtgatgca gtagaggatc accgaccgat gatcgatggt gatgttgcaa tcaaaaaatc 720
aagaaagata gatggaaaat aaaggaaaat aaggagaaat agatctcaac ttgtttggat 780
gctaacccac tcactgacga ctccacttca actatggccg gagcttgcta tggaaaagaa 840
gccaaggcct tcaaggatga acaccaatgg tgaggaagat ggtcgaaaat agaagaatgg 900
ctggcttttc taatcgacaa aatagggtat cgcccttctt agcaaatatt cggcaataaa 960
tatctagaat ccaggatcct aggactatgg aagagggaga ggagggcaag tcaaaggatg 1020
ccagattctt atctagcttc cgacaatgat ggggccctat tttcgataaa cacaattgag 1080
gatgttcgga aaagggtttt ttcgatgatg attctagtga ccaactatga gatttcaaag 1140
ggggtgaggg gggtttaaat aagatgggag ggaagtttga atcctcctta aatctgaacc 1200
tttttcgaca aagccaagag cgtgaaggag actccttcgt gaagtcaaag atggaataga 1260
ctcccttcgg gagtttggtt catcacccaa cttccctagc atgtgcggag tatgtgctag 1320
ccttttctct cttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380
tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440
cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500
tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560
agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620
ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680
cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740
tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800
aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860
gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920
tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980
tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040
tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100
tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160
aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220
attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280
tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340
agtaatatca ataaaaaaaa tttttgatgc tccaataagt tagaacttaa atcaaaatat 2400
ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460
tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520
tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580
aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640
agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700
atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760
accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820
atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880
cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940
ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000
tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060
attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120
gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180
gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240
atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300
gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360
caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420
ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480
caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540
tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600
attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660
atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720
taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780
ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840
tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900
ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960
aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020
tgtgtgacac ctgaatcagg cctttctaaa ctattttgag taagtttgat caagtcaaaa 4080
ggatccacac cctaaggttt cttgaataaa accttaggca ccacattgag gacctatagg 4140
aaactttgac cctctctcat atggggtggc acactgaggt tttataaaaa ccttaggcac 4200
ccattttagc cataaaaaaa aagctccaag ggatggggca gtagccatga agaatccttg 4260
gctgtcagga ctctattcaa aagagttctc aaggttttgg actcttatgg agccctagga 4320
tttgtttgcc tataaataga tggccacccc aaggctttag ataatgttag agacttgtga 4380
agctctcccc tttctcttgg ttgccggccc accctctctc ctctctcttc catgccccaa 4440
gacttctttc ttgtctccat catcttgctg aaatttagat ttcagcaaga aaagtcaagt 4500
agaagtcaaa gttctaatgt agctcacaag atgttgagaa cttcctccat ctggcaaagg 4560
ttctgcaaga gagctagcat cctgagaaac aaaaagattg ctgatcagcc ctcatctcca 4620
tatggatatt tgtagagatc aaatgcatgc atagctagaa gagaatctta tcacgatcat 4680
cactcgtgaa gatcatctac ctgtgcaaag gtatgagata agaaaaatat tttttttatc 4740
ataattcatg aatcctttgc ttatattata ctgagattct tggaatggat tttttctcta 4800
gtaaaactct agagatcaga tctcaaagtc ttcttcacat aaaggttttg aaagttcttt 4860
atatttccgc tgctttgatt caaaataaat tagatctatt ttgcctttca acctttctca 4920
tatttattga catataaagc tttaattaat gagattaatg aaaagcatgt gcgaaatact 4980
gagaaaatcc taacagtgat atcagagcta cttttgtaca taagaaaagg attcaagtta 5040
aataaaatat gtttgattta agtaaatgaa tcaatcaaaa tttatcctaa cataagtttg 5100
tcctggtata atggtcaaga ccattatgtt gaaaggttat cctaggacaa aaagtctaag 5160
taaaatctat tttatttaag taaatgaatc aattaaagtt tattctaata taagattgcc 5220
ttagcataat ggtgaagacc cttatgttga aaggttgtcc taggatggaa agtgattgat 5280
gagacaaata tatcatgaaa gtatttttca cagatggaat aaaatatata tattttgttt 5340
gtgaaaatga gatttcatga atgtgtttgt cattcaatat gtgtggtgat catcttgaat 5400
tgccacaaat cctttttgga ttagggttgt atcatgactc acaaatcctg atggtttgca 5460
aaattttgca ttctgtagtg atagaaacca aaagttaatc caattttgga ataagattga 5520
tcaattggta tctaaggcaa gtattttata atggtggtta cttaattagt tataaaagta 5580
cgaagagtct cctaccaatc ttacacttat ctagccaatt tggttgattg aattctgaat 5640
ttgggttgct taagtgttaa gttcactaca aatatattgc aaccatgatt ccgacttagt 5700
caaccaagcc tagatctctt gaatagattc atgttaatta tggatttaca taggatataa 5760
ataaataatt aaaacttgaa gagatctaaa tgaaaccttc tcgtacatat taaatcgaat 5820
gatcttccat cattgtagat atacggatac tctactgatg ttgatgattt tcgactagat 5880
atagtacttt ggttgcatcg aaaaagtaca accactttat aacatgagat gttgcagggt 5940
agagatgggg ttgggcccaa taattgttag gtgaggatcc aaatgatggc tgcacttgcg 6000
tgtgaatggc gagtctgact taattaagaa atagagctaa taactattag atgaggcttc 6060
aggacttaga gacttatgac cactacaact tacttgagaa gcaatggata aagagtcgtc 6120
tatttatcaa ctgacgcatc accaataact atcagatgga gtgatgtata attagtggga 6180
ctatagtatc cacttgaaat cttaatcgta aaaatttttg tttctccacc tgaagagcat 6240
gggagattcg aaaaaatagt gggggtagtt tatttttaaa ataaagctcc taaaataaac 6300
taaaataagt taaatacaaa gtctaactag aatcttcttc tctctgtaga aaatatctgc 6360
ttccaacctc tatttcatat ccttaagact aattgtttga ctagacccag ttataaagat 6420
tgactctaaa acttaaagat agtcttgagt tttgaaaaga tgagctatgt cctggatcaa 6480
gatatcctct ctctaccagc ttgtcccacc cctaatcaag gggcatccta tgaaaagtgg 6540
ttaaacgatg ataacaaggc ttggtgctgt gtgctgacat ctatgtccat tgaactccaa 6600
tgccagcata agggtacaaa ctgtccaagg tatattgact catctacaag agttatatag 6660
tgagtagagc catgtatctc actaggaagt atttaagaga ctct 6704
<210> 64
<211> 4741
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (3017)..(3951)
<223> n is a, c, g, or t
<400> 64
cagattatca atataattga taattggact aacttgtaat tattataagt agcaaagatt 60
taattgctaa aggttagcag attcaaggag gacttatgtg taaataatgt acatcttaat 120
ttgattggat caacttagtt atggctaaat ttaagatgaa tcaaacaggg atttagttta 180
atcgaatttg ggtcaagctt tgggcttagg tcacatgcac tcaaaagggt ttggatacat 240
caagtgtgtg acacccaaac caagcctccc taaactattt tgagttggtt ttgaccaagt 300
caaaagggtc cacaccctag ggtttcttga ataaaaccct aggtgccaca ttgaggacca 360
attaggaaac tttgacattc tttcacacgg agcagcacac tagggtttca tgaaaaccct 420
aggcacccat tttagccata aaaggaaagc tccaagggat gggatggtgc catgaagaat 480
ccctggccat tgggactcca ttcaaaagtt ctctaggttt tgggctctta tagagcccta 540
gggtttgttt gcctataaat aggtcgctac cccaaggctt tagataatgc tagaggcttg 600
tgaagctctc tcctttctct tgtttgccat cccaccttct ctcctctctc ctccatgcct 660
caagacttct ttcttctctc catcatcttg ttgaaattta gatttcaatg agaaggatca 720
agtagagtca gagttctact gcagttctca aggtgttgag aactttcttc atcaggcaaa 780
gattctgcaa aggagttagc acctcaaaga accaagaaag ttgctaatct gccctcatct 840
ccatgtggat acttatagag gccaagcatg acgagaagag ccttatcacg atcatcactc 900
gtggagatca tctacccgcg caaaggtatg agataagaaa aaaatatttt tcttatcatg 960
attcatgaat cctttgctta tgttacattg agactcttgg attagatttt ttctctaata 1020
aaatttcaaa gattagatct cgaagtcttc ttcacctaaa ggtattgaaa gttctttata 1080
ttttcgctac tttgattcaa aatagattag atttgttttg cctttcaatt tttctcatat 1140
ttattgagat atgaagcttt aattaatgag attaataaaa agcatatgtg aaatactgag 1200
aacatcctaa caatttgagc ttacaattca cttaaacaac taatgatcaa attaataatc 1260
acaatgcaca ataaaaattc atgataaatc tttttgttgt tactttagat caaaatccaa 1320
ctaatcataa catgatccac ggattgccta tcatatatca aaccctctga attattaatc 1380
ttaaacgatc ttttcattca tgatcataag atttagttaa aaatcatgaa gacaacttat 1440
attgtaatca tcatagatct gtatcttaac atccttagtg tttacctacc tatactcatc 1500
ctatgtttga ttctatatat cataatttat tcactaatac tttgatatca tataaattat 1560
cgcatcccca atctaagatc atattggtac tttaatattt cattagtggg ggttatgcat 1620
tagtactttg ataccttatc agttgaatgg ttaaacactg gtactttgat atcctatcag 1680
tggaggttat acgctggtac tttaatatcc tatcagtaag atggttaaat actgatactt 1740
tgataacctc ccagtgggtg ttgtatgcta gtactttatt atcctaccaa tggggcagtt 1800
aaatgctact actttgatac gctaccaatg ggatagttaa acgctagtaa tctaatctta 1860
gcttgacata aagtaacgtc gactcgagtt tagggtcgac tcgagagaat gttagggtta 1920
gcttgatatg aaagagggtc gctcgtcaat attttggagt caactcttgt ttatggacga 1980
tctagaaagt gtcagagtga gctcgagtac tgcatatttc tgatacattg tctatgctag 2040
aatgtgctag aactgattat cttctttatc aaagttgatt tttgagtaac ttgatgatca 2100
atttttctag gctagacttg ctttgtcaaa atgagcactt gttagtttag agaatcttca 2160
cctacacatg atctcaagca ttcattagta ccaaaaatac ttaagtattt tgatatcatc 2220
aaaatcaatt cttgggttaa cacaatactt ttcaaataat aagcatacag atataatcct 2280
ataacaattt aaattttgtt catatatcaa tttctttaaa aatattatat tcatcttgat 2340
agctatgaac taaatcaaaa tacatactag tatacaactt ttactgggag agtattagat 2400
taccagcatt taaccatccc actggcaagg tatcaaatta ccaatacaca acccctattt 2460
ataaagtatc aaagtaccag tgttcaactg cctcactggc aggatatcat agtactagta 2520
tttaactacc acattgacag gatatggaat tatcagtatt taaccatcat tagtagaatt 2580
ttgatgcata gtcaggctgc gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt 2640
ctaattctgt atcataattc attcccttat gctctaatat tatattaatt gtcatacttc 2700
tagctcgaga tcatgagcca aggattgcag taactaccgc atacttatag agaactcttt 2760
ctataagcat acaagatatt ctaaatatac tatcaatata tcatagagaa attaatttaa 2820
ataactaaaa gttaatattc aattaataaa ttcaactggc aaatgtattt aaaaatttta 2880
catcaaataa atcttgatta ataaatatta attaataaca atagatttaa atcgaaacaa 2940
ggttgatatt gttagaattt gatgcctcaa gattcagccc acattgagtc cacagtgagg 3000
ttcgcgacga aaaatgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac 3960
taaattttgc ttctaatctc actcttaaat agtacttacc tttgaaacta ggcatttgaa 4020
tctgaaaaag aaagaggaga ttatgagctt gatagttcag taaatcatga ataaattagc 4080
taaataaatc tatgaataat agtatattaa aaataaatat gtaagataca ataattcaaa 4140
aatgaattca tatatataat actttccaaa taataagtat gtggctgcaa tcctttcgta 4200
attcaaattt tgttcattaa ttattttttt caaaacatca catggatagt catgaactaa 4260
atcaaagtac cagtgcataa cccctattga taaagaatca aataacaagt gtttgactgc 4320
ctcattatca ggatatcaaa ttattaatgc ataacctcca ctgctagggt atcaaagtag 4380
caacctcaat cacctcactg gaagggcatc tagtttcagt atttaactac tccactggca 4440
aggtgttaaa ttatcaatat ttaacctcca ctgataggat tttgatatat agtcagactg 4500
cgagccaaaa ttcatttcaa accaaaatat ttttctcaaa gacatatttt atgtttcaca 4560
ttgaaaaatt cacaaaaatt atgcgatatt gaaatcaatt ggataaaatc cacgtcaaat 4620
ttagtatatt caatcataaa tcatttacta ttctagaaaa ggtatattaa aagtataatg 4680
catcaatttc ataaatcata aatatctcaa tataaaaaat attttattat ttattaataa 4740
a 4741
<210> 65
<211> 5462
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 65
agtatattca atcataaatc atttactatt ctagaaaagg tatattaaaa gtataatgca 60
tcaatttcat aaatcataaa tatctcaata taaaaaatat tttattattt attaataaat 120
ctaggagaag tgaagcatta cttatcttgt aagtaaaact aaccaactga tcaaattaat 180
tctgagaatc tttctcaaaa ctcatcacca ctatatcaaa aacttgtgct tcttgctatg 240
taagagcata gaccctttct tcgatctggg gttccaagtt tctattttat tttgttcaac 300
tatcaaatta gactgacttt tcattttttt gtggatattc agctatttta tggcctttct 360
aacaataacc aaagtatgta ccaatattcc aacaataatc atttattgca tgattttcac 420
cgcatcgaaa tatttgatat tatcaatcaa tccaaacttg ttattcactg acctcttatt 480
caaaccctta gtatatttaa tattctacct ttgtgattca ttcaatcgat ttcttttttt 540
tattttcttt ccctttctat atgctcttca ttaacttttc tttcaattat caatgcttta 600
ttcaatacat ctgtataagt agttaactca tatagtacca tttattttct aatttctatc 660
ctcaattcca actcaaattt atctactcag tcacattcat cttcaaccaa tctcgaagca 720
aacttgacaa gctccataaa tttagcttca tattctacaa ctattatatt tctttatttc 780
agataaataa atttttattc tttctgaatc ctcatactct aagaaaaata tttttatcat 840
aaaatatctt ttgaaatcac tcccaagcga gttgttctcc atcttgttca tatttaggtt 900
tcattctcta ttatcaatta aatgtctcat ctttcaacat gtatgatgca tataagattt 960
tttcatcatc atggtatctc ttaacaataa atgctttctc catctccata agctaatttt 1020
tagctcctat ttcatagttt tcttaaaagt caatggagac aacttcttaa attctatgat 1080
attactttat tgctcctatt gctcttatgt ccttgtggtg acaatattta ttgttgcact 1140
tgctgtagag gcagttactg ttactgcaat tgctattacg attccatcaa gccgactagt 1200
gtctgcatta tttggataat agttgatttt tgctacttta tttagatgtt ggtggcaaaa 1260
tcaatgactt ctttttgctg agagatgcca ccaacctact aagtatcatc atcttattgg 1320
ttgatacctt tagcagcacc tcgagtggtt ctttttatct gatatggaac catcttaatc 1380
ttgcatgaaa aacaaacttc gcaaaatttt cttttaaaat ctaatatcta atattatact 1440
tttattaaaa tttaattatg attattttaa gaataaaaaa tttaaatttt gaaatcctca 1500
caaggctggc caagagataa tgaccatcat cctagtcggt ttgacgtagg acatccaaag 1560
atcaactata attcaagcat catattgaga tgctaggata taatcgatgg tgaaatttaa 1620
tgatgctcga ctgatcaaga tgggggccgg cccgatggcc tgttcaacaa tcattgatca 1680
aaatttttta accaaggtct atcaagatca ttaaaaagtc tttctaagat ctataaattg 1740
taataaagag acacaatcta gagagagaca ctttttacat aaagaaagta gaaattttag 1800
ggagagaaat tagagagaaa ggggaaagag agaggaagct gagaggaaga aagaaaagag 1860
aaagactctc tctctttttc ttttctttct tttctttctt ttctttttct tttctttttt 1920
tcttcctttt ctttctttct ttctttggct cattagaaaa ataggggacc tattgatccc 1980
cttgtttcct aaatagggga ggaatctcat cttggtagct atggccggcg atgtgagcca 2040
aagtggcaaa atcatgaatc tcccaacttg cagccgacat tgacttttgg cactggaaaa 2100
tcaaagaaat ttgacaaaaa atgggaaaaa attgaaacca aaatagggac caaaatccgg 2160
taatagctag ccaaaaatcc ttgatctttg ctcatggagg ataggaaaaa agattattca 2220
agagattaag ggaatcttat ctcatttttt tgctgtgctt cggccatggt ggttgcagaa 2280
atcgtttgtg aaagctcgac aaactctgca atttcctcgg gcttgggcct cgatctttaa 2340
taggagaaga gagaagtcct ctttctttta aatagagtcg gagggaagga gtttgatttc 2400
ctccttatgg tggtttcaaa ctctgatcgg aagtccattg gaaaagaaga ctcccattag 2460
ttttaaaatc taataagatt tattgattag aaaattgata aaaaatgatt attaaaaaag 2520
tagcataatt atttaaatca atgatgctta gattgttgga ggtaaatagt aataaaatca 2580
aaaaattaaa attcatggga ccaaaaaata atgaacaaga tttgaaagaa atgtctataa 2640
ataagaattt atgaaacagg ggaacattga tcaaaggtgt gttaaatagt gtccttaaag 2700
tgttattgtc cctctcacgt agactttgtg tgttgggaga gaacatagta attctctcaa 2760
cctatgcaac ctaaatcttt tgaaaagaaa tttaaaatta tagaaaaatt ggcaaactag 2820
aattttggtc attttcttta ttagtaaaaa atatactaag ttatatgtct ttatttatac 2880
tagtgaggtc tatctttgca caattcagac caaatttata ttctagttaa aagaggtata 2940
gattttttaa aatagatata actagtggaa atagtcatag aaaagttaaa aatcaatgaa 3000
aggtagattt cacttctata ttggctttat ttgtggtcac tttatctaat tctttttttt 3060
gatggagcaa tataccctgt taaaatcttc tcgatttttt tttcacttta agcaacctat 3120
ttcgatgcct aaacaatgga atttagttta accacttaat atgctacact tttaaaagga 3180
gcaccatatt gtagggcttg aaaagttact tgatttaaaa aaagagcatc ttaattggac 3240
atcatacaag taagttatga cctctgaaaa tttgatacat gatttatcat cttgatatgg 3300
taaatcttgt taagatttcc tcatggtgtc taaagtggcc ggttcatact gagtttggtg 3360
attcttctgg tcaatggtta attgctcgaa tatttttaag atataactaa tctccaactc 3420
tgccgactcc ttagtagtat gagcacatgg aaagcttgac ctaattgatt tcttaaattg 3480
cttgaaatca gtacttagaa aatatgcaaa atggatgaaa tgtttattgc agcgagagct 3540
ttctgatctg tacgaccgag agcttactag ttttttatga gctatacgtt ttgcacttaa 3600
gcctaattta aatagtgaaa tagttttgca acaattcaaa acaattaaaa tcaaaagaca 3660
agctgctatg catgttcaac tgactcggct ttcaatcgca atatgtcaca taggctggcc 3720
tagaatgcag atgcgtgcgt ggtgagcatc ctaaaaacct acatatccaa taaattccca 3780
ctagttggtg aagtattaaa tgtaactcgt attaactttt taatgtagga ctaaagttta 3840
ttcgactaat taagaactaa atactttaat aattgaactt ttccaaccag aaatcagaaa 3900
atatttaagt aattaaatat tacataataa ctagatcaaa atatcatggt tcctctctcg 3960
ctcgagatca attgggatgt tggtttatct tggtcatcca tcgagatgac tctatcttag 4020
cctttcaaaa cggcgcggta ccacgggtct caccgcttcg ttacatcgaa tgccaccatc 4080
cctttttttt ttttttttat ttatttatgc tttcttgctc ctagattggt gcggcctcat 4140
tacaactcca ctgctacttg atgcttccct ctagcatctc ctttgcagct ctctcacttc 4200
caccactctt cggcctaatg ttgggaaacg acgaaggggc cttacaaaaa tgtcatccat 4260
gatggcagtg gagaagaaaa catcgctggg gctttccttc gatatccttc gcagccaaag 4320
ctcttatagg gttatatggg agaacgctgc attatttggg tgatcttttt ggatggtgtt 4380
gttgactgat gctagttttg cttcatgaat tgaatattta cacaagatga gaatacaatc 4440
tagtacaatt ggtaccaatt acctgggttt gactcctgct cgcatctgat tgaagcttgg 4500
ttaatgtgca tctcaattaa ttcagaaaga tcatcggact tcatgtgaat tattttgact 4560
agcatgaata gggctaaata aggctgaaat atgtgttaaa tttttaaaat tataacttga 4620
tcatatgatg tccaattgag atgttttcaa atcaaaaatt tttttcgaga tttatcactt 4680
aatgttaaac tcttagaagg tcgaaacaga ctgaaagttt tcttttcaag atgtattttg 4740
accgagtata taacttgatg atcatatgat gcccaattga gatgttttca aatgaaaatt 4800
ttttttgaga tttatgactt aatgttaaac tcttaaaagg tcgaaacaga ctgaaagttt 4860
tcttttcaag atgtattttg accaaatata tctcataatc tataaagaat atatttcata 4920
atctatgaat aattagatag agcgacagaa gataatgcta atgtaaaaat cacgatctat 4980
tttttataaa atttaatatt tttatataat cacttttact atagtcatat ttattttaaa 5040
aaatttagtt atatttaaaa tatcaaaaaa atttgacttg aattatataa gaaaggatct 5100
tcctactatt atagatagaa gctttatatc atagtttaca gtgtatggat catcaatgaa 5160
agaaagaggg atgtaaacct tacttttgaa atttttctat ttgtttctaa attttttaaa 5220
ggatccaagt tgagaattga gagaattctt tctttctgca aatcaaatca ttagtataat 5280
ccacatggag acgttgtaat agaaagtaga aactatattt tatgaataat agaaagggag 5340
ttgatttacg ccaagccttt tgtttgcttg attaattatt tatttttatg gtgttagctg 5400
gaccccatga atagcaacca tcgttgggtc agggtcgtgt atttgttttg gggtcttcat 5460
ta 5462
<210> 66
<211> 8953
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 66
caagtactcc agaatcaaaa ttgtgaaaga aaaataggat aaatctggtt aagctgtaat 60
ttatttactt actttctatc tatattaaaa ttattcagat tattttgcaa atttatggat 120
atgcttgaat cacgtatctg atactttctc ttcatctgga tggcagtacc atgtgatcac 180
cacgcagacg gatacctaca agaaaaaggc aaggctaaca tgctttctta ccatcattct 240
ttacggtctt tgatccggtt ttgcgtgtcc acttcttacg tagtcttttt caaacattcc 300
tatctaagac tgaaggtaat gatttgcaaa ggaatagctt tactgttttc ctctaagtag 360
atgaaatatt actcacgtag aaaggagcca tcataattgc agaaagaata aaactgaatg 420
gaatatgagt agaattgtca aaatcttggt ttaagggttt taatagccag atgagaaagc 480
aacctacttt tcttgaacaa cttgtttgtg actgtcttgt tgctcccatc ttgcatctat 540
gattagcaaa atatatgata aatagatatt cagatttgat cgaaaagaag gaagattttc 600
tttaatccat ttaatttgaa tctcacaaaa aaaaagtaga agatttggac acgatcgctg 660
ggggcagcac gctcttaata gaatggtgtc acgttgcaga tctcgaaaaa ttattcaatt 720
ttttttaaaa aaaaagagtc attgaaatta gacgttgtat gaccatgtta tgatctctga 780
aagtttgact tctgactcaa cttcccaatg tagcagattt tactcctgaa ccatgtttaa 840
cctcctgact catagtggcc aaagtatcta catcgagttc actggtcttc ttggatcaca 900
ttcataagaa tacttcccat aattttgctc aacgttgttt ttctcatcaa ccaaaggtat 960
atgcttttta aaattgaaat gcccatgaat attatggcat tcttttattt gacattttgg 1020
ttgatcctat attgtttgtt tggcattcaa cacttcttca tgggaacctt tgaaatgagg 1080
taggtgctag gatttttctt tttacctatc catatcatat ttccaatgtc ttcttttaca 1140
ttaggttctt tagtgacaat aggggaaacg acccaatata atacccttga aaatttgggc 1200
aatatctact aaaactaact tgaataaaat attaacataa aaagggattt agtaacataa 1260
aagcataact caaaatcact caccttgtgt gccacgttct cattgccctt attatttttg 1320
cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt ggaagagagt tgaatggctt 1380
tgttgagtaa ttgttttgag ttactatagc attgctctac taaaattgaa atcttgctgt 1440
gaggctatgt atgagaagca agttcatgct ttttgactgt tgggatggaa gtatgagcaa 1500
tctttttaat agaaaatgga cgaatcatga agtttttcct ttttattgaa aaagatgatc 1560
gaaaaatatg tgcaagatag aaaaacactg aaaagataaa atgagaagta aaagtggaag 1620
tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga ggatgtgtgc accaacaaag 1680
ccaactttca ctaaagaatg taatgactca cctctacttt cttcgaataa ggggttccca 1740
gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa atggagcaat tccttctaag 1800
aaatattatg gcatttctct cccacgaaat ttcaaagcaa agagcagcta gtagttgatc 1860
ctctaatctc ttaattgaag tttggaattt ctcttgcctc tatttggccc aaaggtcatg 1920
aagatctacc ggccaacctc ttaagttgaa ttagatctta atagaagtcc aaatgcttct 1980
tgtagaagaa catctaataa ataaatgagt gatagattct aatccagaga caaagagcac 2040
acctcgaatt cacttgccat ccttttctag ctagaacttc tctagcatga aacttgttcc 2100
ttaaggcaag ccaaataaat actcacattt taggaatgac tgccttccaa ataattttat 2160
aatatggaca aattagacca ccattattga taaacttgca atgaacaatt ataaatgagt 2220
tttcaggttg gcacattagc aatataggat ggtttgatta ttaaaaggat gatatgaagg 2280
gtttcaaggt ggtttgcctc gttcaaatca aaggattttg aagattaata ttccaagata 2340
aggttctcca actccattag gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc 2400
aaacttgaca gatgttttat ttatttagag tgacacagat accctttggc aatactctcc 2460
atccttgtcc gaacaacttc taatcacacc tcacttatct tgcatctaac tcagaggcta 2520
caagttacac ctttcaacaa accttttcgg tttgaaaatt tgtgatttca ttatttagag 2580
ttcgaagagc atatcaagta ttggtcggag ttggcaccca aagcaaacga aacagttact 2640
gacatggtcc aaaagctgag atttctaaga tcccaactta agcactgaat aaagccatta 2700
tgggaaatat cattttaacg aaagaggaat ttagagtaag aattgattct cttgataccg 2760
aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 2820
cactagacca tcttctaaaa taggaagatc tatggaagca acactcccaa atgcagtggc 2880
ttcaaaatgg ggattgcaat acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa 2940
gaatactatc actgaactct agcaaggcga tcagaagatt atcgaatagc agcaaatcca 3000
atccacattc tacaactttt tttctaccct actaggctcg actgaggaat gactcatcca 3060
agctgattgg aagattcttt atccagaagg acctctggat cttgctgaca ttgagtatcc 3120
atttatggag aaagaaatcc atgatacagt gtatgacttg gctttggaaa agtcacccgg 3180
atgatatttt cccattctcc ttctataagc acttctagtg tatcatcaaa catgacctga 3240
tgaacctact gtaaaatcag ctaatgtaga ccatctgaac tacttgttca tcacccttat 3300
cccaaaaaaa aattggtgtg tattcagtta gagacttcag gccaataagc ctgattaatg 3360
gagtaataaa aaatatttca aaaactctat cgaaaaggct cccacagaaa atgaatttgt 3420
taattttatc cacagagctt gctttcaaca gaggaagaaa tatctctgaa tattttgtaa 3480
tgactatgga aactatacac ttctgcaaag ctgaagtaca caaggatctc aattataaag 3540
tcgacttcga gaaagctttt gacaatgtgg attggagctt tctattgaaa ttgctatcca 3600
gcacggggct ttgattcgag gtggtgtcaa tggatagaat atctgattta tacagctaaa 3660
ttctcagtcc ttattaatgg tgataaaggt aaacttttta aattgaggaa agatctcagg 3720
caaggagatc ctctattcgc ctagctcttt ctcttagttg ttgatataga atgatcaagg 3780
gagcaagtag gttcaatctt tttgttggaa ttggatcata taatatcatg ggataacttc 3840
aaagctttta gttcactgat gacacactta tattttgcag atatgatcta aaatacatca 3900
aaactcttaa atttttactc tatagttatg agctactgat gggtctcaaa attaactttg 3960
aaaaattcca attttttggc ttgagaattg caaagatgtc agtacagcaa gttgcatcta 4020
tcctagaaag caaggtggct acattttcca ttacttattt gggtctccca ctccatcatt 4080
ctaaactgag gaaaacttat tggaatccac tccttgagaa ggttcagaag aaattgatcg 4140
ggtagaaagg taaacttctt aacctctagg gtaggcttat actaactaat gcagtgctta 4200
cagggatccc actactctgg agggatacat tccttctccc tcaattcatt atcaaataaa 4260
ttgataaaat ccatcgatca ttcatttgga gaggaaacga ggagtataac taagggcact 4320
ctagaatatg ttggtcgaat atttgtcgat caaaaaaatt tggaggactg ggggttcctc 4380
aatctaaaaa ttttcaatac aattcttctt tgtaaatggt ggtggaagct ctactctaat 4440
gctggtgacc cgtggtgtag ttttattgcc actgtccacc caacttcaca ctagagatct 4500
aaaggtatac acaaatcaac ctcttcattt tggaatggtt tacagcacac atgaaatatt 4560
tctactccta atccactttc aagttagcaa ctagtattat tttggaaaga tagttggtta 4620
cataatcatc cactgaagga tcgatttcct cacctttaca caatagcatt gaagtgcaac 4680
aactcagtgg caaaggtatt aagcaatcta cttgataata gctcttttag tactcctctt 4740
cctcaaagat accaagaaga ttttcagagt ctataggaaa gcattgaaca aattacatta 4800
acggaacgac ctgatactat acaatggaaa tggtttagta gcaatatttt tttggcatga 4860
aggatctact attttctgca agatggagga gtttggcctc tactgagtaa tattatataa 4920
aaactcctaa taccaaagaa agccaagtta tttgcttggc taagtgctca caacaaaatc 4980
ccaatgaaag ctaatcttct taatagagga ataattggaa ctgattactg tacactttgc 5040
gatgacttat cagaaactaa tgatcatcta atgctcatct atactttttc aaaagcaatt 5100
tggaatcaag tactttcaga cctgcaattg tcgaaacttt tatgcatgct taacacccta 5160
tgggatactt ggagactcat caatatgcaa cacgatagaa gacctaaact agctgctcta 5220
ttcgtaattg gtcaatggtg tctttggaag gaaagaaata aaagattatt cgacttctat 5280
actttttatc cacgatcgat tgctgaaact gtgtcacttt ttctttcttg ggcatcacac 5340
ctaacaacgg agcaactaaa gatgttagct cctgttcgag aagttctctt atctaagaat 5400
gaaaacacac aatctttagt gagaattaca gatgctaaca ggcgcagatg aatgttttat 5460
gagcattttt atagctgcag cttatatgtg atctatggtg caaggagtta attataacca 5520
tggatattag ttaggttgac tatcagaaat catctccaat acattctatg taaccactga 5580
tcaattccat gttcaactag ataggaacct gcctatatac aggtatgtcc ctgatgtaac 5640
tatagtatac tattattcat aaataaataa cgaaggtttt accttcttct cataaaaaaa 5700
aagtatcttc atgtcatcct atatgtcatg catctccttt gctacttctt ttatttactt 5760
cttaaacttg gttctaccat atattatcag ccccttttaa atttgctttt ggatattgca 5820
tattccactc ttcaatcacc tcatgccaag caaaacattt attcacactt gaaaaccaat 5880
ataagaatac caaagaattt atccatgaaa ttctagaaac tttggtttta ctcctttctc 5940
catcattcaa aaaggttcaa aatgatgata actctatata gcttatttat caaatttacg 6000
aggttggtgt tcaatgtttt tgtgaaaaaa atatcttgct atccacatag tttgaatcca 6060
tacttttgct atcttgagtt tcaaaaattt taatttgcta caatttgttg ctattagcat 6120
atgactactt ttaagaagat aagccaatat actattttcc taagaattta aaaaatcaaa 6180
aataaaaatt tttatttaag attttttaag ggttgttttc caaatgtgca atggggctta 6240
atcttggcat cattttctaa cttgtagaat tttgacccaa gtaacatttg tccaatcact 6300
tagaacttct ataacttcgt acaatcattt gttaatgttg ttcatctatt tatctatatt 6360
atctatctgg aatatagttg ctcttaatta tttttatata tcgcctatta tccaccctaa 6420
gctttcatgt tcatcctcat gttgttggag gtgcatgtct tattccaaac tatttaccat 6480
tgctgtagat tttaaaaaat ttgctagttt aggacttttt aatcttttga tatcatgttg 6540
atgtaagcta accctctaag gctagtcata atacatttta aggatttatg ttatatgaga 6600
ccaaaatttt aacaaaatga agtgttggaa attggtagaa tggaagtgta aagatgctta 6660
gagacataga actagccctg ggccatgtaa atcttccaaa agaagaagaa aataataaaa 6720
ttaagatcat attcaatctc tacagaaaag ttggtctttg ttgtataata agccatctta 6780
acatatgatg gacaataaaa tatataaact tatgagtttt aatacttaga tggaagaaaa 6840
gggacagata tgtcacaccc catcctacta gcatgagtag gcacatgata cacggttgca 6900
tgccctgcag agtttgactc atgaggcatg caaggtattg aatagtagtc taggtaaaat 6960
taaaaaactt ggagcattct aaaaataaat caagttcatt ttataaaatc aatatttatt 7020
atggactcca tcaaatatta tgcgcataac attttatttg caaatagaag aagataagtc 7080
ctagatccta agtctcctac tcttagtctc ataattcatc caagctatcc accaaatatc 7140
taaaacgaaa aagaaaaacg atagtatgct aatagctttg taagtcacct tttatctcta 7200
attagatcaa gcatattaga tataaaacaa taattttcaa agtatatgat ttgcaattag 7260
gaataaatat ttgataaata cagaataaat tttcataaag catatttact aacattattt 7320
ataaaatata taatgcttat atcaataaat taatttctaa atcaatatat ataaactatc 7380
cattctgtct tagccttaca actattgcta ccattccctg tagcatggtt aggaagagac 7440
tagctcttga atactcatgt catttatcaa catatgcgaa tgatcattcg actaatatag 7500
tcaaaaaaaa attactctga tttatataaa ttaaaaatta gtaaataata tatgctagta 7560
atcaccttac cagctaagct ctaaagaaaa ttagcttttg aatatacatc atgctattga 7620
ttattatatg tcagtgcttg tctcattttg tggcatgcaa gaagactaga tcctaaactt 7680
atatgcatag tcagattaaa gagcaaatgt tgcatctgat tatatgaaca tctattatga 7740
tgtagagttt gtatcatgta tatttaattt aaacacaaat ataattatac ataaataata 7800
ttcatatttt aaattttaaa tatttagata attattctag tgcaggtata aaaataagca 7860
atataaaatt ttaaatcgat ttatataaca tgcataataa aaaaaattaa ggatagaggt 7920
acttactgct caactcataa aacataagaa atctctttaa ctaactttag tgcaacctag 7980
atagaacata ttaatgatta agttttcatc taaaataaac atagatatca ttttaaaatc 8040
ttaggcattt aaatggtctc atgatttgtg aggctttctt cagattctac aattttgaaa 8100
ttttttcaaa ttataatttt tttaccttga ttgataacaa agccaataat acacctcaaa 8160
tccaaatgta ttcctaatag ttttcaataa atctaatatc aataaatcat aattaagata 8220
tcaatccatt ctatgaattt gaccataaat cctacttgtt tctctgacct tcactataaa 8280
ttaatcatca aactaaataa gtgaggggat cataattctt ttacgacaat ccaagaattc 8340
aagtctagca tccacattag atggcttcct gtccagatat ttgcgcctct ccaaaattga 8400
gattatcaga ttaagaaaaa taaaataaga gagagggtta aaggacaatg ccttctaggt 8460
agtgatgtcc gacatcataa ttttgatcaa atctatgggg caaccaataa tattagggaa 8520
agaggattgg atttgagcaa gaatagcaaa gtcattgtca tcaatggcct gattcattga 8580
gttcaatgaa ggattggtgg ttgagtggtg gaggtggcat ctaggaagga gagagaaaga 8640
aaaagataga gagaaagaga taagaaaaat agagagaagg tggcagttaa gatccctttt 8700
tgtgattaat atatagccgt aagatactca aagatctcac cttatcgacc tcaaacacta 8760
agggaggtgg aaggagggac tactacccat gaagctagag aaagggatga tgatgattgg 8820
aggaaggaag aaggaaaaat agtagactcg atgatgataa gactaaaaga aaagggtttg 8880
acttagccac ttggtatata atgaggtttg gtatggagtc aatagcttga gtaatagcat 8940
ggaaagagag aag 8953
<210> 67
<211> 6021
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 67
aaatatctaa aacgaaaaag aaaaacgata gtatgctaat agctttgtaa gtcacctttt 60
atctctaatt agatcaagca tattagatat aaaacaataa ttttcaaagt atatgatttg 120
caattaggaa taaatatttg ataaatacag aataaatttt cataaagcat atttactaac 180
attatttata aaatatataa tgcttatatc aataaattaa tttctaaatc aatatatata 240
aactatccat tctgtcttag ccttacaact attgctacca ttccctgtag catggttagg 300
aagagactag ctcttgaata ctcatgtcat ttatcaacat atgcgaatga tcattcgact 360
aatatagtca aaaaaaaatt actctgattt atataaatta aaaattagta aataatatat 420
gctagtaatc accttaccag ctaagctcta aagaaaatta gcttttgaat atacatcatg 480
ctattgatta ttatatgtca gtgcttgtct cattttgtgg catgcaagaa gactagatcc 540
taaacttata tgcatagtca gattaaagag caaatgttgc atctgattat atgaacatct 600
attatgatgt agagtttgta tcatgtatat ttaatttaaa cacaaatata attatacata 660
aataatattc atattttaaa ttttaaatat ttagataatt attctagtgc aggtataaaa 720
ataagcaata taaaatttta aatcgattta tataacatgc ataataaaaa aaattaagga 780
tagaggtact tactgctcaa ctcataaaac ataagaaatc tctttaacta actttagtgc 840
aacctagata gaacatatta atgattaagt tttcatctaa aataaacata gatatcattt 900
taaaatctta ggcatttaaa tggtctcatg atttgtgagg ctttcttcag attctacaat 960
tttgaaattt tttcaaatta taattttttt accttgattg ataacaaagc caataataca 1020
cctcaaatcc aaatgtattc ctaatagttt tcaataaatc taatatcaat aaatcataat 1080
taagatatca atccattcta tgaatttgac cataaatcct acttgtttct ctgaccttca 1140
ctataaatta atcatcaaac taaataagtg aggggatcat aattctttta cgacaatcca 1200
agaattcaag tctagcatcc acattagatg gcttcctgtc cagatatttg cgcctctcca 1260
aaattgagat tatcagatta agaaaaataa aataagagag agggttaaag gacaatgcct 1320
tctaggtagt gatgtccgac atcataattt tgatcaaatc tatggggcaa ccaataatat 1380
tagggaaaga ggattggatt tgagcaagaa tagcaaagtc attgtcatca atggcctgat 1440
tcattgagtt caatgaagga ttggtggttg agtggtggag gtggcatcta ggaaggagag 1500
agaaagaaaa agatagagag aaagagataa gaaaaataga gagaaggtgg cagttaagat 1560
ccctttttgt gattaatata tagccgtaag atactcaaag atctcacctt atcgacctca 1620
aacactaagg gaggtggaag gagggactac tacccatgaa gctagagaaa gggatgatga 1680
tgattggagg aaggaagaag gaaaaatagt agactcgatg atgataagac taaaagaaaa 1740
gggtttgact tagccacttg gtatataatg aggtttggta tggagtcaat agcttgagta 1800
atagcatgga aagagagaag gagctgaaga gagtactaag tcttattaga ataaagaaag 1860
atagaatctt agcgaaaaat agggcctcaa atctttcagg tagaggaaaa agagggatca 1920
acgaatgaaa gactaaggaa aaggtgtgga gtaggatata ctctcgatta gtctctcaat 1980
catggattct agtagggctt cgtcagctgc tcaatcatgg attctgatag ctcaaatggt 2040
ggtaagtaga aagagagaga tctaaagaga ttgatagtgg ccttaaaacc agcacggtca 2100
aggataggca tgccttagag agaggaaaag agagagagat taatggaaat aagcgagaaa 2160
aatatattct tagagaatag attggcgata agaagaggag gtggttgggg catgcttaaa 2220
gaaataaaga aaattgagta ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga 2280
gagagagcaa aaaaatgtgg atgatggtca taggataggg aaaggaaaga acaaagaagg 2340
gggtgctaag ctaactcttt ctaccttcct cacaccctga agcaaaggat ttggccaagg 2400
atggacaaat gggcgagggc tttggtggat ccatgcctac cctttctccc tctcacgatg 2460
attctagtca agctatctat ctttgatagc ttgagccaag ccaattgact tgatccaatc 2520
tctctaaatc catacaaact taagagagtg tattgattca cttattctct tctaagttga 2580
taagaaacat aattaagtgg agctcattaa gtatttcagg tagttgctaa cttggcaaaa 2640
tggaagcaat aataaatctt aaaagactat agcttggtat aatctcaacc atccatgatt 2700
tagaaagatc ttcagactca atatagatta ctttggctac tacaggtaag agctaaatag 2760
gatccaaaag taagatccat cacattagta agtcaaatta tatgtcaaat tttagtaggt 2820
atacttagtc ctacgatgcc taattaaaat gatcatcatt tgaaccttaa aatggactag 2880
tcaactaaaa tttttctttt tgaagaagat ttagaccata aaatatcttc taatctgtga 2940
agaattagat agagcgagga atataaaatt gatgtagaaa tcaagatcta tcatatatac 3000
aattttaata tttttttcat aatttttaaa tatttatctt ctttttttat aggtctagtc 3060
ctatttaaac taggaagagg agtccaactt gacttatgca ataggggatg tccttctaga 3120
agataagaat aatttgatca gaattatata agagcaaacc tcattattat aaataggggc 3180
tatatacatc aatttatgag atagagaatc aatgaaacaa aagtagactt aagttttatt 3240
ttcataattc ttctatcttc tacttttttt ctaggagatt caagttgagt ggattgaaga 3300
aaatctttca tcttctcgat cggatcatat tggtattaga gcgttggtct tctatattta 3360
tggagagctt taatgtattg tttaaatacg tgaacaatac aaacaatcaa gagaagtgct 3420
atccatgctt caaatacatc gaaatataaa agcaaatatg gctactaatt ctttttcaat 3480
ggacaatgag ataaaaggat gtcttacaca actcaaggag aagattgtgc aactcatgaa 3540
gattgtctcc agattgaaga taatttcaat acaagcacaa acaccagcaa ctcatgttgt 3600
gaaactgttt cctatgtttg gagatgaaga tcttctatct agtgaggaga ttgaattacc 3660
taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa agcttgaatt gagatcccca 3720
tatataatgg aaccattgat gaaaaaaagc tagataattg gctaaactaa ttacaaacct 3780
attttattat ctatagatat tatggcatct agaagatagc ttttacttat ctcaagcttt 3840
ctagccatgc tcttatctga tgaaattcat atatgagaaa taataatatt tttaatatgg 3900
tgcagagcca attcaaaggt ttaatcaaga agtaatttta tctaattggc cataaggaag 3960
atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 4020
ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt tatcaacaat tatacaattt 4080
ttataaagta tgttgaaagt cttcatgaga gcatctaaaa aaagatgaaa ctctttaagg 4140
ttgatgatat cagtaaagct aacatgaaag tcatagagat tgaggagaaa aatcaaatta 4200
gagaagataa ggaaggcaaa aagcatatca acataactca aaaaaaaaaa ttatgatcat 4260
tgaaatcttt gaaaatacat caaggagaag tattgaaagt ttcatcctga attggagcta 4320
aagtagaaga agcccaagga tgataatttt aagaaaaata aaaagtggtc ctcaattcta 4380
tagagattga ggagctatct gaacttgagt aagcaaactt caaattgagc ttgatggtga 4440
gaaaacctaa tacaacaatt aaaacggatc tagaggtaca tgacaactca cccacttaaa 4500
gattcaagtg aagcagagta tcattaaggc tattataaat ctttgaagct agaagaacct 4560
cattttccaa tatttggttc agaaatcgag gttgtagatc aagcctcatc catatcctta 4620
tcctcttagt tggattcaga aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa 4680
gttagccatc actgagaggt ttatttgtga ggtaactttt gaaatagttt ctttggatat 4740
ttgtcaagtt atccttagaa atgtgtacct ttagaatcaa gatgcaattt tctatagacg 4800
atagagaaag tatcatctta taagggatga gaaaaagttc atgatcaaca cctcaagaac 4860
ataaggtaac tttgaccttg caactgttgc ccaagtgaag tgatttgtta atgtttgtga 4920
tgagtgcatg atgatggtat aaagaaccga tatcactcat gagaggtcaa ggccttgtcc 4980
tttggttcca tcaatcgatc aatagagatt gagattaagg aggagtcact atagtccttg 5040
tcgatgagga aggatgacaa caagcattcc taccatgaag tctagatttg agagcaaatg 5100
aaagtaatcc actgagacct gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta 5160
aagtcaaatg gttcaaccat gagatgggga agtaagtatt ttcccacctt caattctaac 5220
tttgtagaaa ctaaatccct taaacagggg agccctaatt taagaggatc ctcagattca 5280
ttgtggacta ctttggctat tacaataaga gctggatagg aatcgaaagc aaaattcacc 5340
acattaggaa gccaaattgt atggcaaact tcaagagacc ataacttgat cacatgaaat 5400
ccaattaaga tgattttatt tttgaatttg aatatttttt tgagatctat aactttagat 5460
ctaaatcaag ctaaaatttt attgcttatg ccttcaaaat aggctagtca aatcaaaact 5520
tttcttttca aaaaagactt tgactgaaag atatctttca atctatgaag aatcaagtag 5580
agtgatgaaa gataaagttg atataaaaat tgagatctat ctcttataaa attttagtaa 5640
ttttattttt tttaatattt atctttattt agagatctat tcctatttaa actagaaaga 5700
attgtccaac ctaacttgtt caatgatcaa catcctccta aaagataaaa agaagaatct 5760
gactcaaatt ataaaagggc ggaccttttt ttttgatgaa aagggaggaa aaaaatccat 5820
caaaatttat taagaaaaaa agagtacaag aaaagaagga tatgaaagag taagagaagc 5880
cccacaacat ccatcaatat ttaaaattta aatttaaatc tcccccatca ttctatcaat 5940
atttgatatt caaatttaaa ttcttcgcag catcccacca acatttgaaa ttcaaatcct 6000
ttcatacaaa caaaataata t 6021
<210> 68
<211> 5329
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (4258)..(4985)
<223> n is a, c, g, or t
<400> 68
atattttcgt agtctctaaa ggcttcttcc agattggcaa tatactgatc tgactcagta 60
ttttttacta atatatcatc aacataaact ttgatattaa tttcaatttg ttacttaaaa 120
atcttattaa tcaagtatta gtatgtagca cctacatttt taagatcaaa agacatcatt 180
ttataacaat gcaaatcttt ttcagtgatg aaggccatat tttcttcatc ctcaagtgcc 240
attttgatct gatataacca gaaaaagtat ccataaagct tagtaatttg tgtcttgaag 300
tagcatcaac aagctgatca atttttgaga gagaaaaact atcttttagg caagctttat 360
tgagatcggt ataatcaaca tagatccttc atttttcatt agccttttta accatgacaa 420
catttacaat ccactttgga tattatgctt ctctgatgaa tttgtctttc aagagtttgt 480
cgacttcctc atctattatt ttttatcttt tcggggtgaa acttcttttc ttctgttgca 540
ttggtttatg ctttggatca acattcagct tatgtacaat aagatcagtt aaaatctcag 600
gcatattaga gactgactaa acaaagacat cggcattcat ccgaagaaaa gatattaatt 660
tctccctcag atcaggcttc aatagagatc caatttggac agtttttttt ggatcatcac 720
acaaaagaac aataataagt ttctcgactg gttctcctcg atttttgatg atatcaactt 780
tactttcttg atcaagtatt ttaattggta gagcttccac agaccttttc atttttacag 840
ctatcagaaa atactactta gcaagtatct gatttcctca tatttctcca actccatact 900
tagtttggaa ttggattagt aaatgataag tgaagactat agccttaagg gcgttgagcc 960
taggtcggtc aagaatagca ttataagctg atggtatttt gacaataaaa aaagtgagtc 1020
ttacagttga ctggcatggt tctatccctg cagtgacgga caaagtgacc tctccttcca 1080
cagctacagg atttctagaa aatccaatta cgggggtacc aacctattta gctaatttat 1140
catattcatt ctttggaatg tatcatagaa caatatatta gcagagcttt cattatcaat 1200
aagtattctt tttatatcat atttggctat tgccataaag atgacaacag catcattacg 1260
aggagtttga actctaacat catcatcgaa aaatgaaatt atgtgatcca tgcactgatg 1320
ctttggaagg ctttcagtaa tctcagccac ctcctcagtt ccgtcgagat ctgagatcat 1380
attgatgact gcagcagtag acttgttgtg atcattctca ttgttgggct tctatcattg 1440
gtcagtagct tgacttgccc gatctcgaac atatttacta aagtaacatt agtggatcaa 1500
tacttcaatt ttatctttta attatcgatg ctcctcagta tcatggccat agtctcgatg 1560
gaaatgacag tattttctct tatctctctt tgctggaggg gctttcatag gattaggttg 1620
gcgaatatat cctaaatcct cgatttctat cagtatctga gctcgaggag tagatagtga 1680
ggtatagatg tcgaatcacc gaggtgggct tttgaacttc agattcttct gaggtcgttc 1740
agagttatcc tgttggtttt tatgatcttc ttcctagggc cacttttttc catctctttt 1800
tttcttcacc taacgaagta tgcatgctct ctttcttttc agcttgagca tacttacaaa 1860
cctagatcaa tatttgttca taattgtttg ggtagttctt attaagagag aagatcaggc 1920
gattactctt gagtccttgc ttcaaagctg ccattgcaat ggactcattg aagttcttca 1980
ctttcagtat ggcggcatta aagcatgcca catattcttg aagagattca ccttcctact 2040
atttgatagt aaaaagattg ctagtatttt tcaaatgaat ccatttatta tcaaaatacg 2100
tgatgaatat ttgctaactg tgtgaaagat gaaatagatc atgtctggag gtcagagaac 2160
tagattcttg cagatgtttt gagagtgatt ggaaaagtga tgcaaaatag ggcattagat 2220
accccttgta gtcttataat ggctctgaag ccttcaagat gatttaaggg attgatggag 2280
ccatcgaatg tttccaatgt aggtatcttg aatcgaggag gaactgattt accaagaatt 2340
ttttgagaaa aaagagatcg taagttgaaa tctcttctac cttgagaatg gcttccaatc 2400
tatatctcca tcattttctt ctcaagattt tgaatctttt gtccaagacc ctcctccata 2460
catggcttct tatgtggagc agatttcact tcccaagagt gatcagtatg gtcaagaaga 2520
tgatcatgat gaagatcttg aggagttggt tgctaagtgt gatgtgattg gactacttgg 2580
ggggctactt tttgctaccg ttctgtcgta tactacagca gtaagagctt ggacctgctg 2640
aaccaagaga ctaaactatt gtggatcaat aataattgaa ggttaggtat tctcctgaac 2700
atcttcagga gaagatgaag taggtaaagg atgatttggt gccttcttgt tcaccatttc 2760
tactaaaata ttttaagtgc ccttcctcta acactaatct attactgcaa ggcttcaaaa 2820
gacaggcaac gagatgggtc ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa 2880
gtctgtaaca aatcttgcaa agaaaatctc gaaacctacg ggtaccttct ggttcaagat 2940
cctctgatgg ataagttagg taaagtcttg agaataggtt gtgaaaatag aagaatagaa 3000
ggatgagaag agagattgtc ggtaaatgga gagatgactc ttatttcttt caatggggga 3060
gctgaaaata attcagcaga gtttccactc tatcaatcct gacttatttt gtggagggta 3120
ccttggcccc ttcatatata ggggatgaag aggcctggta aggttgttag actattagga 3180
gagtttgtta gatcgttaat ttattataat agaatgacca gctatataaa aatcatggag 3240
tatttaccca catggtgatt gactgtagta taactgaaag atagctaatg cttagctgga 3300
tgactgctgt tagataactg tctgcattct tacggtacat tgatatttta ccaatgtgac 3360
atagcttaaa tcggcaactg gctgaactaa atattatgta tccctttagt taacaatcat 3420
gtcggttaga gatcaatgta attcgcagca gatcgatcat aagctgagat gagtatcata 3480
ttttaagaac aacgctgggc gagttaggcc gatcaaatgt cagactgaaa aagcagatca 3540
ataaacctct gatgtgatct gaaagaatat ttatgattta aataataatc tatcaccacg 3600
tatccagata atgaggtcat ataacatgta ccaacagtgc atttttccat ctagttaaga 3660
ggttggttag tggcatttgt cttcgatatg taatgttcac ataactaatg tgcttagtag 3720
cattcttttg taaggttaaa tcttcaatga tcttaagttc acataattgc ctttgtgccc 3780
tattagttta tagttgacct tttaattcaa gagacagtca ccttagcaat cgatgtctgc 3840
ttagattggg ccaattaggt actcacatta atatattgaa tcatgtttga atataaagga 3900
ttagattgat ttataagttt ccttttattg tttacatact gatacttaga ttgacttact 3960
acattatttg atatgttatg ttctaatttt tggattaaaa ttgttgtttc tgatttctcc 4020
ttacatctaa tactttgtat aatttattat tttttagcat gattgagtgt agaggattag 4080
attgattttt aagtttattt tgattattta catgcccata cttaaattga cttactacat 4140
tattcaatat gttatgtttc aattattgag ttaaaatttt tatttctgat ttctactgat 4200
gtccagtgtg tgtgtgtgta cgtatgtgtg tatatattta tttacatata tatgtatnnn 4260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980
nnnnnatgta tacatataca tgtatacata catatataga tatatatata tacatatatg 5040
tatatatata tatatatata cacatatata ggttatttgg aacctaagaa acttgcaaag 5100
ttactagatg caatgttcgg aaaccatgga ccgtaacaac tggagtagta tttgggtcat 5160
gaattcatgg ctagatcatg aattgagtgg gagtcaaccg aagtagggcc agctcagaca 5220
cttgtattta ggtcccatgc ttgcgtgcat tctcttccct gatatccttt ggctttgctg 5280
cctcaaatcc tcgagctatc ttatcatcat cgcattgagc tccatacct 5329
<210> 69
<211> 6061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (5947)..(6061)
<223> n is a, c, g, or t
<400> 69
cagtttggac ttcaatgtta acccaatatt gattttaaat ccaacattgg tccacttaga 60
cttatttatt tatttttatc aatttaatat aaaaaagatc taaacctcat aagtcataaa 120
ttttggattt atttttgaac atgtacaaaa taaaacagaa aaaagaaaaa attacttatc 180
taaaagtaac tatatctgaa aactttcact ttagaattgt cttaaattaa tgtacttcca 240
tcaacaattc aatgttaata tttttatgaa tccaaatgga tgatagagta ttttttagaa 300
tgaagtattg aagtctaaat gacatcgtcc caaaataaaa gtgaatttat gaaatactac 360
atctgtcgga ttcggtttca tacggattaa aagtgtagga atagaatccg attataaata 420
attatttttt tataaattct aattcaattt tattcgattt atatttttta accggtcaaa 480
attaatattt attaagtagg attggatgga tttattcgta tctcgattat ttgctcagcc 540
cattgccaaa tctaaactct tttcagatag gttccatgtg aacatgatac atgagatgca 600
gtgtgatagt acacaccatt gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta 660
ccatttaaaa aatggcagtt ttgaatttta acacgctctc ctccagattc agcttatgaa 720
cttttcgaat aaaaataccc ctggactatt tttccaaaaa gtaccagcat cttttgaact 780
tgaatggaaa ttcggccaat aaaatgtttt catttattga agaaataaac agggtaacgc 840
agtagctcta tttcctctgc ttttcttttc tatattaata acatgattat tcatctctct 900
cggatcacaa aaaaattaag ctattcaagc tttatttata tttcattttt aaatttttta 960
cttaaataca aaatctccca tcccactact acggcagcat gttttctatg tatgattatt 1020
ttcattcaaa tgatatcatt ttttataatt tatattgtat gtaattaatt catttatagt 1080
tcttacattt tcctgtttct agtagataca ataaagcggt tttggactag tagcttgttc 1140
tctgtatcga agtttaacta aagctttgac aataatatat gaatccatat cactgggtag 1200
gagaggaata tgttgggtat aaaggattta aggaattaga tattttcata caattgtatt 1260
gcattgcaga cagtaattag attactatgc aattattctc tctctccatg tttgttgcag 1320
ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg aacttgtaag tggaattaga 1380
cgactccgtt gtcctccatt ttcttttatt ttctttaaaa tcatctgcca ttcaaataga 1440
cagaaaaaaa aggattgatt agctattgga tgcctcttga attcaggaaa tgaaggacga 1500
gcacccagtt tatggttttg tggatgatga ccctagcaac tacgcaggtg cactagctct 1560
tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca 1620
tcgaatgggg tttggctccc atgacctgcg ccttgcttga ttttattgta gcttaaagac 1680
cttacaactt ccagagtggt gttatatatt agtatcttaa gctatgacag tggtaagcct 1740
ctctatccgc tacttgttat cctttaggta ctttgcatgt ggtgcaaggt tataattgcc 1800
ttgtgtttct attgtcttcc tcatggtact tactggactg atgatgtcaa gtgaaatgga 1860
gttgtttgaa tcctgactga aatttctctt ggtccatcaa gtgcaagagt aagtttagac 1920
atcactcgca agcttttgct aggaaataag tagtttcatt gcactaatga tttcgaattt 1980
ttgttttcgg gttagagaaa cctagattaa tgctgttatt ggatgctggc agtcagatga 2040
agattatgtt tgattgtacc tcgttggaca gatgctcatg cgtagatcca taactctatt 2100
tcatttcatt tccctgtaca caattgaaac agggcatata tgaataggta tagaacagat 2160
gattcctgca atattggagg tggctagctc agcttagact aaagttggtc tagctgggat 2220
attctgaaca cctgagatgt tcaaataatg tgggataact tggcccaact caactaaaca 2280
ttggctcaaa gcatagtcaa ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc 2340
cgagctgagc ccgggccgct tgtttagctg atgaactgaa ttcaaatagc cggtactcag 2400
cttggctcca ctcgattcat gagttcgaat cccctcaagt tcaacctcga acttgacggt 2460
gtagtcccac aaccatggcc accttataat gtgggacggc cattatgcat tcctctagtg 2520
cctgctccat atgacttttg ttctcattat accatgcacc taaatgagtg ctcatagtga 2580
caatgtttag cctccacgta taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa 2640
atttctgcaa tgttgtggtt gtaaaacgct cctacgttga gacatgatgg tatctaagat 2700
tatagacaaa ctatcatgct gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa 2760
gccgagctcc attgaaatag tacaatggat tctgcacttg aagaacatta caaaatcatt 2820
ttttcccaaa aagaaacatt gcgaacagac caaagcgtaa agaaattaca tgattcaact 2880
aattcaagct ttccatgatg taggcactcg ctagatgtag tagggtgata acttgctttg 2940
tgagggtgga tcataagctt aacctcaatc tatcccaatc tatcctttcc cttgacctat 3000
ccatgccaat ctaggccatt tctgcataaa tataacttaa tcccagtgga tccggcctag 3060
tttcactcac tccaacacat tcctactcaa tggtagccaa tcctttcttt agccctcaaa 3120
tataatccta atctagcata gccaaccatc aatcatgcct aataaagccc gactacacca 3180
acccgatcat tcctgatcgt acacaatcaa gacttatcct aattgatcct agcttttttt 3240
aggcctctct tatagaacct gtgccaattc tggacaagct aatccaatct tagcagccaa 3300
aaatattaca tgtttaatta gccaaatcga acctatcata aacccaatat ataatcggac 3360
cataccaaga tcatcatcct atatttcctt ctcttgttat aactacacct aaaaaggaat 3420
ttcttcatac ttatgagggg tatattatga taaaaattcc ttcattttag ccctccatcc 3480
ttgtctattt ttgggaccac tagccaagta acaccttaag agccctccat cttaatattc 3540
cctctaacta gctcgatttc ttcttcattc tttctttgcg atgtgtcccc tccaatttaa 3600
ttcttacatg ttgggatttg agtactgaaa aataatagat aaagagaaag taaaaactat 3660
gctaatgata ataccaaagg cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt 3720
ttatggttcg gcctaagcct atatctacat agggacgaga gtaagaagaa gcttccacta 3780
taataatagt ttagagtaca aaaacttctc tgacaccatg tagggaacat cgcttctaat 3840
acaagaaaga agaaatccaa gattaaacaa acctctagaa aaattcttct cgatggaata 3900
actctaatct gagattgaac aatcttctcc aatcgatgat ctccaatctt cttttcttaa 3960
atgaagcacc cttcaagcct ctcttctttt ctctcttcct atcctctttt gtggctcaca 4020
acctcctctc ctttttatgt tctatgttcc tcacatcaca tccacagact catttttata 4080
gataaaaaat tagagtctat ttcggactcc ttttccacac acaagatggc ttcccacgcc 4140
attggttccg tgcgcatgac ttttttcatg ccacaaagga ttccgtgctg caaaagtttt 4200
ccatatccat gcagtttcca cacaccacaa aaactttcgc acacttctcg aaggcttttc 4260
atgctcgacc ctttttggtt ttcaattaaa ttgatggatc ccatatgagg agggaccaca 4320
ccaataaatc tcctccttct aactcatatg gtaggttcca tcaagcctgt agcacctttg 4380
cattttatca gttttgttcc tgaagccggc ttcatcaata tattagaact attttcttca 4440
gtgtcaactt ttttaagctt gaaccacttc atctctagca tattgacatg cttttggaaa 4500
gtatgtcaaa ttgctcaaaa ttaatcttac ggttctcttt ttcgttagat tctagtgcat 4560
attacgcact ttaacataag atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt 4620
ttttttgagt tggtaatggt acaaaagtta tactagaccg tgggtaccta atctcggaga 4680
ttaccattta gatttggttc ttgatcattt gtatagtgat gcatttaaaa aattatttga 4740
gcaaaacagt gaatgccatt gggtctgaga gatccaaaac caaataacct aaagtatata 4800
gatggttcct ttagctagat catgtatgag aaaaaatgat ctgccgactg gaaaaaatag 4860
atctttgagc tcattgattg ttaagtcata tctagtctgt gaatcatctc tttgaggatt 4920
aatgatcaag ctatctttta tgggttaaaa gaataggatc actgaaatac ttatcctagt 4980
atacatataa tgtgcatggc ctatttgatg agtcagacta gaaggttatc actacttcat 5040
cacctttact gatgagcaat catgatatag atatgtatgt gagatacaaa tctaaaagat 5100
tttgaatggt tcaaagaatt cagatatgaa gtagaaaaga taaatcaaaa aatttttaaa 5160
ggtacttgat cggatctaga atgcaatacc aaataaaaaa tttgttgatt atctaaaaaa 5220
agtgatatag tttcatgatg gaattcttct tgtacacctc agctcaacgg tatatatatg 5280
aggagcaata gcactatatg agatatggtc cggtccatca tgaatatcac taatttaatt 5340
attatttatt taagagcaag atttaatttt taaaatttaa attagatttt ttctaaaatt 5400
ggtttcaccg caccatatga gatatgattt ggtggataag ttagaggata ggtctgtgag 5460
aactcattta tagggtatcc caaaaggtat ttaaaatatt actttttctt tctagtagtt 5520
gacaatatga ttgtgagcaa tcatactgtt ttcttaaaaa cagtggaagg atgaactcaa 5580
aaagaaagtc tctaaagaac aacgagtcac aagacctata caacctattt aagatgagcc 5640
agtatatgta gtacttcctt cacctcatca atttagtagg atctcctatc ctttagaaag 5700
atactcggta ttcttacaaa ggatttagag aaagtgtttc ttgagggaga ttgagaatat 5760
agggatgatc tcaaaaccta caatgacata atataaggaa tcatgtagtt acatgaaggt 5820
cagtgggagg gttccatact gacatcgatt atgatgtggt tacatataga attttttttt 5880
caaagatcta gatcaaacat tctgaaaata aaaggtctat agagataaat ccgaaaagga 5940
tgtttgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6060
n 6061
<210> 70
<211> 14226
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (1949)..(2907)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (3857)..(4532)
<223> n is a, c, g, or t
<400> 70
atcctctttt gtggctcaca acctcctctc ctttttatgt tctatgttcc tcacatcaca 60
tccacagact catttttata gataaaaaat tagagtctat ttcggactcc ttttccacac 120
acaagatggc ttcccacgcc attggttccg tgcgcatgac ttttttcatg ccacaaagga 180
ttccgtgctg caaaagtttt ccatatccat gcagtttcca cacaccacaa aaactttcgc 240
acacttctcg aaggcttttc atgctcgacc ctttttggtt ttcaattaaa ttgatggatc 300
ccatatgagg agggaccaca ccaataaatc tcctccttct aactcatatg gtaggttcca 360
tcaagcctgt agcacctttg cattttatca gttttgttcc tgaagccggc ttcatcaata 420
tattagaact attttcttca gtgtcaactt ttttaagctt gaaccacttc atctctagca 480
tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa ttaatcttac ggttctcttt 540
ttcgttagat tctagtgcat attacgcact ttaacataag atctaaggaa ggaagaggac 600
tgaggtaagg tgaagtgatt tttttttgag ttggtaatgg tacaaaagtt atactagacc 660
gtgggtacct aatctcggag attaccattt agatttggtt cttgatcatt tgtatagtga 720
tgcatttaaa aaattatttg agcaaaacag tgaatgccat tgggtctgag agatccaaaa 780
tcaaataacc taaagtatat agatggttcc tttagctagg tcatgtatga gaaaaaatga 840
tctgccgact ggagaaaata gatctttgag ctcattgact gttaagtcat atctagtctg 900
tgaatcatct ctttgaggat taatgatcaa gctatccttt atgggttaaa agaataggat 960
cactgaaata cttatcctag tatacatata atgtgcatgg cctatttgat gagtcagact 1020
agaaggttat cactacttca tcacctttac tgatgagcaa tcatgatatg gatatgtatg 1080
tgagatacaa atctaaaaga ttttgaatgg ttcaaagaat tcagatatga agtagaaaag 1140
ataaatcaaa aaatttttaa aggtacttga tcggatctag aatgcaatac caaataaaaa 1200
atttgttgat tatctaaaaa aagtgatata gtttcatgat ggaattcttc ttgtacacct 1260
cagctcaacg gtatatatat gaggagcaat agcactatat gagatatggt ccggtccatc 1320
atgaatatca ctaatttaat tattatttat ttaagagcaa gatttaattt ttaaaattta 1380
aattagattt tttctaaaat tggtttcacc gcaccatatg agatatgatt tggtggataa 1440
gttagaggat agatctgtga gaactcattt atagggtatc ccaaaaggta tttaaaatat 1500
tactttttct ttccagtagt tgacaatatg attgtgagca atcatactgt tttcttaaaa 1560
atagtggaag gatgaactca aaaagaaagt ctctaaagaa caacgagtca caagacctat 1620
acaacctatt taagatgagc cagtatatgt agtacttcct tcacctcatc aatttagtag 1680
gatctcctat cttttagaaa gatactcggt attcttacaa aggatttaga gaaagtgttt 1740
cttgagggag attgagaata tagggatgat ctcaaaacct acaatgacat aatataagga 1800
atcatgtagt tacatgaagg tcagtgggag ggttccatac tgacatcgat tatgatgtgg 1860
ttacatatag aatttttttt tcaaagatct agatcaaaca ttctgaaaat aaaaggtcta 1920
tagagataaa tccgaaaagg atgtttgann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2040
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880
nnnnnnnnnn nnnnnnnnnn nnnnnnnact atgtatgttg gctatgtagg ttccgattcg 2940
ctgtttggaa tatgatatac ctagatgaaa tctatcgatc ttgatagaaa aagagaagtc 3000
ctatgtgatt cgtaagactg agttcagaaa aatctctgac cagagtaagt gtgaatattg 3060
aaaaattttt tttacgaaat tcacaaatga actcgagtcg agccaatgta gcatatgact 3120
gatgatagag tttgacgagt tctcaatgac ctccgtcaaa ttgggactct cgatagaggg 3180
attgtatcac acgataactg cacctaggga ttcacttttc tattttgcta gcttgccact 3240
atatgttgct agacgtcact ggtggatcgt gagaactcac taaaatcatt ttcggatcaa 3300
cgatctttgc tgaggtaagt tggaatcgtt tcagtccatc gaaaagagtt tcgatgatac 3360
tgtgatggag atcacgatat gtctcactat caaacagaat agaacctgag gagtcacata 3420
caaaaagagc ttaacctgat caatggcttg gattatattt gaattatcaa ttagattgat 3480
agtttgaata ttagaaactg ctaatttgta accgttacag ttttgacaac tactaattgt 3540
tagcgcaagg acttaattgc aagtattata atttttttga ggctgattaa attataaatt 3600
aaattttaat taatttaatt cagatttaat ttaattagac ttaatttaat ttaatattaa 3660
ttggattcaa ttatccaaat cagatttgga tttcaagcct gattggatca ggcttgacag 3720
ccttttcgaa tttggctcat tttagactcg atttgaatcc gtttgaggtt ctatttggat 3780
cagataaacc atgacttaga gagctcaagt tttttgggac tctctttaga aatcatgtca 3840
aaaggagaag tagagcnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnccccatcg aaaagagttt cgatgatact 4560
gtgatggaga tcacgatatg tctcactatc aaacagaata gaacctgagg agtcatatac 4620
aaaaggagct taacctgatc aatggcttgg attatatttg aattatcaat tagattgata 4680
gtttgaatat tagaaactgc taatttgtaa ccgttacagt tttgacaact actaattgtt 4740
agcgcaagga cttaattgca agtattgtat tttttttgag gctgattaaa ttataaatta 4800
aattttaatt aatttaattc agatttaatt taattagact taatttaatt taatattaat 4860
taggttcaat tatccaaatc agatttggat ttcaagcctg attggatcag gcttgacagt 4920
cttttcgaat ttggctcatt ttagactcga tttgaatccg tttgaggttc tatttggatc 4980
agatgaacca tgacttagag agctcaagtt ttttgggact ctctctagaa atcatgtcaa 5040
aaggagaagt agagtattat ttttttcatc cttctttctt cacacgcatg aaaggagagg 5100
gggcaccaat agttggtgcc ctgccttatc tggatgtctt tttcatccaa tttttttttt 5160
aattgaattt gatttaaaat agaatagaaa tatcttagat taaggtatag aagtactttt 5220
tttatgtgat aaaaaaaata gagaaagagg acgtgcgcta attattggcg tgagacatct 5280
ttccttcttt cttcccttat ctcaacgcac atctatcctt tgatttgttt ttgaacacct 5340
tggattaaaa gagatgagat ctcttgggca ttaagaagga gttgtgcgtg ggatttgaga 5400
tgtggtgcga caaaaaatta aaagaggatg catgaaggga ggtggcgtgc gttagatgcg 5460
agaggcttct ttcttacatc tttctctcct ccccaatgcc tcttccttcc ttctccactt 5520
cacgtccatg cccagattca ataaagatca gatctaagaa aagaaaagag agagaaaaag 5580
agaagaagaa gggttcttct tttcttcatg gtgatctggt atagatcctg ttggatttgt 5640
gcgaaagagt ttgagcaacg atctgcttct ttaagatctg aaagaaaaga tcaagatcca 5700
tggatgaaga gtgagatctg caaggtgcta gcacaccagt gatctcggtg ctccgatcaa 5760
atggctccgt gtggatatca gctgaggtcg aacgcgtgca tggctacgat cagaatctgc 5820
gatatctgca ggatccgaga tatggagatt cgatctccat tttatttttc taacagttta 5880
tttttctatt tcagatatca gatcgtgggt acatatttgt atcaagatct ttactatggt 5940
tttcagatct gatttgatac gtaaataaat taaaattatt ttaatttatt tattttcact 6000
gtgtagatgt ctagaaaaaa ttttaaacta cacgtacgaa atcgaagcat tttctaacaa 6060
ctctgactat caccatagac gacgtatatc tcttgcttcc caccaaactt ctttaataag 6120
ttctttagcc atagcatttc tttatcgacc tttgttatgg tgatgtattc aacctccatc 6180
gacgataatg tgacactttt atgactttga ttgccacaac accgctccct ctgagaatat 6240
catcagataa tctgacgtgg atttctgtat gtccacatca tcgatcatgt ccgtatctgt 6300
gtaagcctgt agcataggat ctccactatc atggcataaa tatatcctgg atatctattt 6360
aagatatctt attttccact tcattgcttt ccggtgctcc tttccaaagt ttgaaagaaa 6420
ccgattgacc ataccatcca cttgagcaat attagacctg gtgtacacca tagcatacat 6480
aagactcccc accacttagt ccttctcact ctttctgctt tgctctttaa tcaatgtaaa 6540
gtgtcctaca agcagacacc accggcttca ctctactcat gttgaatcaa tccagcacct 6600
tctcaacata ggcctcctat gacaaccata ggacctggat ctcctatctc tagcaattct 6660
tatccttaat atcattttga cctatcccaa gtcttccgtc ataaatgttc gatccaactt 6720
taccttcaaa tcattgattt tggtaatgtg gcatcccaca atcagcatgt catcaacata 6780
tagcaaaaat ttgataaaat tattgtcaaa atattttttc atgaacatgc aatggtcaga 6840
acttactttc ttatatccat tctccattat gatggaatca aacttcttgt actactatca 6900
tggtgcctgc ttcagttcat aaagattttt cttcaagcaa cacactatgt tctcattaac 6960
ctttcatttc aaactcttct agttactcta tatattctcc tcctccaagt cgccatgaag 7020
gaatgccatc ttcacatcaa attgttccac ctcaacatct aaacagccag cgagatcgag 7080
gataactcga gtagacgtga gctttacaac gattgagaaa atctcttcaa aatcgatact 7140
ttttctctga ccaaaatctt tcacaactaa tctcatcttg taccttggtt ataaactatt 7200
ctcctatggc ttcaatctga acatctattt atttttgagt gcttgctttt tcttaggtat 7260
attcaccaac tcatatgtat tatttttcta taaagaattc atctcctctt tcattgcctt 7320
catccactcc tcactatgct ggagctctat ggcttcagag taggactcaa gctcttccac 7380
atctgttaat agcacataat cctatggtgg atatcttatg gatggcgtcc actctcttgt 7440
gaatctctgg acctcttatg caggtggttc aacatgcaac tcaatttgaa caccatccgc 7500
actctcctca gcctcatgac tatcatatgt accgtcatct gtagttgctc tcctgttatc 7560
aagacttctc gaagaggtat ctgggcataa gtctataggg ctgctcgggg ttgacttcgg 7620
cttcttaggc ttcttaaaat catcgatcgt ctgatcctcc aaaaaaataa tgtcatagtt 7680
gcacacgatc ttccactcca tagaatccca caatcgatag ttgaactctc cgtcctcact 7740
atagctcagg aatatgcact gcttcacctt gacatctagt ttggatctct catctttagg 7800
aatatgcacg aatgtcctgc atccaaagat tttcaaataa tcataagaaa tatctttctc 7860
caacaatatt ctctatagtg tatcacactt aagagtataa gaaaaaaaaa gattaatgct 7920
atggatcaca gtcatcaatg cctccctcca gaatgccttc gatagtttag cataagagcg 7980
catgctcccg atcctctcgc aaatcatcct gttcaccctc tcaacaatct cattttgttg 8040
tggcatctta ggcactgtct tctctagtct gatgccattt cattgatagt attttttgaa 8100
agaacccctg tattcacccc tgttgtccgt ccaaatatac ttcagctttt gcccagtctt 8160
tctttcaaca gagatgtcaa attacttgaa tattatcgag cacttgatcc ttcattttta 8220
aaatatatgt ccaaattttt tagaagtgat catcaataaa agtcatgaag taagaacatc 8280
cataaaaaat tttatcactc agagaacaaa catcactgtg aataagatct aatgcaccaa 8340
tttttctttt agaaaaaaat tctaaaaaga aacttggatt tgcttaccca tcaagcaact 8400
ttcatatatc ttcaatccaa aactatgaat aggaagagca ttcttcttag tcaaaattga 8460
cattcctttt tggcttatat gtcccagtcg tcaatgccat aattctaagg tagaagattc 8520
ttccactaca ttcacctccc ctttaccgag cttggcttgt atgaagtaga gaaagccttg 8580
cttgatactt ttggctacta ctagcgattt tttggttagc ttctatttgc tgtctccaaa 8640
tatattgtag tagtcctcct catctaatac ccctatcgat aacaagttca gatgaatatc 8700
tagtacatgt cgaatatttt tcaaaaatag cctgtacccc aagctcgtga tcagcataat 8760
atctccaata tcaaggattt ttaattctcc atcattctcc atctttattg tcccaaagtt 8820
actgaaatga caagatgaga ataattttca cctcactgta acatgatacg aagtggccaa 8880
atcgatcacc cagatagagt ctcaaccaat agtacttgca agatcatcat ttgttgtgcc 8940
acaagcaacg atcatctctc catccgtagc tactgctatc atcttattgt tcgagctgga 9000
gtcatcactt gattattttt tgacttctcc ttttttagta atcggtagtc tttcttaaag 9060
tgatcctttt tgccgtagtt gtaatatcta tcacttcgag acttggatct cttccgtaat 9120
ttagtggggc catcattcaa gttagattgg gagtccttgt gcttgtttct tccctttctt 9180
tctatgatga gagcctcatg gtggctcgag acaccttgct cctttctcct agcctcctca 9240
ttaagcatat agtctttcac cattgccaag gctatcgaac tatctggtga agaattgctt 9300
agagacacca ccaaagtctc ctaactatcg agtaagaaac ttaacaatag taaagcctag 9360
agctcctcat ctaacagcat cttcatcaca gtaagctggt tcaccacgtt ctaaaagttg 9420
cttagatgct ccaccatata agctccctcc ttatatttca tatttatcag tttgtgaatt 9480
aggaacacct tgttctatac catctctctt gtatagactt tttagtttca accaaaggcc 9540
atgagcatta acctccattg aaatatggtg gaagatgcta tcatcaatcc actgttggat 9600
aatcccaacg attttatgat tcaatttctc ccattcttta tttgacatct tatcaaactg 9660
aataataaca tcctcgattg gatcatgaaa atcttagcag taaaggaggt cttccatgta 9720
aggattccag attgagtagt tagttaatgt cagcttgatc gtagtgcccg acgaagattg 9780
gttctccatc tattagcatc ttaatttctt tttgaatact ttagattttg taaaatttgg 9840
ctctgatacc acttattggg atttgagtac taaaagataa tagaaaaagc aaaagcaaaa 9900
atcacgccaa cgataatacc aaaggcacaa agaatcatag caatcgcaag agcactagaa 9960
ttttttatgg ctcgatcaaa gtctatgtct gcacagggat gaaaataaaa agaaactttt 10020
actataataa tagtttagag tataaaaact tctctgacac tacgccgaca atactacttc 10080
taatacaaga aagaagaaat tcaagattaa acaaacctcc agaagaatcc tttttgatgg 10140
aatatgaaag aataatattc tacaagtcaa tcgcatgagt aatgcaataa gatattgttc 10200
tatattttat cttccaaatt catatatttg atattaatta ttaataaaat tagatatttt 10260
atttcattat atgctgcatt ttaatacttg tttaaaatta taatgaactc cataggttag 10320
gacaataatt ttaaggtcat gatgagatca taccagtgag atttaaatct ttgataacct 10380
taatctaaaa tattctcaat agtaggatca ttaagtcaaa aatcaatgat actgataaaa 10440
ctggtacatc ctatatattc tcgacagaga gggtggttga tgtcataatc acttgtgtgg 10500
agacactaat acgaagatgt ggtgctcatt agagaataag ttcattgaat ttactgatcg 10560
agagaatata tgatgcaagt gatcctttga cctaagatca ccatggtgcc ttgtatatat 10620
gaatctatgt tttggttcat tctttagctt cattttttga gccttgtgtg gggtgctccg 10680
gacatggtgc agtatgtatg gaggttgtga gtggtcaaca aaaaatcaat cactccttgt 10740
aaaaggagcg aatatcttat gtgatcttat aggttgatcc aaaaaatctt tgaccaaagc 10800
agaatgataa ttagaaagag tttttaatat atcattaact gaatcaatat cttctgatcg 10860
agatacatat aaataagtat ttgaatttga catgatttta tatccataac taatctgaaa 10920
tattgtatga ttgaagaatt gaattgtaca attttttacc attgaaaaaa atttttgata 10980
ttttttttca aatttaatat ctttttgata gtcatgacat gttgctagac atcaatcttg 11040
acttgtgggc tcacaaaaat taaaaagatt ttatttgaaa gttaattaga aagtattctg 11100
attaattgat gtatttggac tgacctaatc taattggatt gatttaggtc atgagcttga 11160
gcccactgct ggctagatga tcgctgtcgt aggcagtcaa gaataaaaat caactcaaac 11220
tatatagata gggtgagtag ggatcatttc tatggagatc taggatgatt atcttttttt 11280
ttaagaaaaa ataaaaagag aattgattgt agaagaatta aaagaaatag aatagcaaga 11340
attaaattaa aagtatgaat taatttatga aaaaaaataa gtcagagaaa taactcagaa 11400
attttgaatc caccatgcaa attagattta ttttcttctt ttttttatgt tgcaacatta 11460
attcttgtga ttaaggtatt agtatagctt atctctaaga gatacggact gtatcagtag 11520
attacaactc gtcctgttga agtataaact atctaaattc aattacaaaa tataagattc 11580
aatctaacat actacgatct atctctccaa agcacgtatc gtatctaggg atcacgatac 11640
gtcaatagag ggtataagcc gtgtaggctg gatcaatacc tcaaaaaaaa ataaaaagat 11700
atgaaataaa agtataattt tattacataa aaatttaata taaaaaaaaa ccgtttacag 11760
gctttatcat atttctggat tgaagagatt tagccacgca tcaagctctc tagctccata 11820
atctctcaat aattgatccc taaagctctt taattttttt ttttattatt tttttgtttt 11880
ttctttaatt tttttctctt cttatttttg ctgccatctg ctgcctctgt tttctctgct 11940
cctgctgcct ccttttatag agcacagctt cttcgaatta taagcatcta tggactttca 12000
attcccacta tcttttattt tgattgggat tttaaaactt tatccgcatc ccagcatctt 12060
gtttcacgcg agatcctagc gtccacatgt gttttgaatt ccttatgggc cacagaccat 12120
ttaaaccacc aaagaccact ttactatttt gatttgaatc ccatggaagc cggctgcctc 12180
tggtctcatt cacccttcca gtgcttcaca tgggtcccat taatttgaat tcctatgagc 12240
cacatccaag cttttgaatc caagccttcc ttatttttta aatcaattaa aactttgctt 12300
taaatgcctt gtagaccctc ctatttgcat gctacgtgag aacattgtta agctcctctt 12360
ggcccactta agaacttcta tgggctacat gcttttggct agctttaaaa tggttttggg 12420
cctaactttg gatcaccatt cgaagtccat tttgaattca atttattttt attttttttt 12480
ttaacctaca aatcgagctc ttttattggt gatcattttt cctataaaac aaaaacaaaa 12540
agcatcaagt cttaagaaat aaaagttaat taatatatat tttgatactt ttattgggat 12600
atttaatgta cttatcacta gatatgaaat ccaatgggtc acacactttg aaatttgatc 12660
ttagtctaat ctaactagga tttattataa atcttatggg ttaaatttac atgctagcac 12720
atgaattaac tcaagttttc aattggattt agttctaagg tgtttgagct aaccctatcc 12780
tgatacctta aacctaatta gattagattt gaacctatgg ttttcttgat gccttatgct 12840
tattacatga aagagtttca tgtgacttaa attcctccat gccaccacat cttcatccat 12900
gccaaattaa tatggaacac cccatttaat tgtgcattta agaaggaata gtccttctta 12960
aacactcctc ttaatttccc acactttcct ttgttctaca caccatcaaa tggcttttgg 13020
aaatatgcgg gcgcagaagt ggaggtgtcc tatatgaagg ctcttccaca ttataagtta 13080
tcacatggtg aattaaatta ttgtgtgaga aaatcatgcg ccaagagttg gcaccccttg 13140
ggagttttag gcactccttc ttatcctata aataaggggc accccatatg gataaataca 13200
agggaattca agtttaggca tgagattgag aggagaaaaa gacacaaaaa tctgaaaaaa 13260
agataagaaa aaaaaagaga gaaaaataga aagaaaagac gagagaaaac gaaaggcaag 13320
ggttgctaat cctagggttc aatttttcaa tagttggatt tctgaatcaa tttggggtgg 13380
tgagattttt tgagaaaaag tttctgatgt ggccctagta gaagattgaa ggcattcaga 13440
tgatggtgca atccgttttt gaaaaagaaa agtgagtagt atacttgtga agaaagctgc 13500
aacactacat caaattggaa aggaccttga tcaaacccat atggatcacc gttgcaggat 13560
atctactttg gtatcttgtg aaggttattt tttttatcag atcatcatct tcaaaaaggt 13620
ataattttct acctaatatg catgcttgat ttgtttgatt aaaatctata aagtgttcat 13680
aaggtttgtg ttctgattgt attgttttaa gtattaaaac ttactttaaa aatataaaaa 13740
aatttgaaaa ctatcttcta ctgtgcaact aaaatccaac agaataaccc taatatgaga 13800
ttgagcgatc tccgtcaacc gatgttctct gatcttcttt tcttgaatga agcctcttca 13860
agcctttctt cttctctctc tctccctatc ttcttttgtg gcccacggcc tcctcttctt 13920
tttatgtttt gtatttctca tgtcacatcc ataaactccc ttttatagat aaaaaattag 13980
agtccatttt ggactccttt tccatgcttc ccacgccatt ggttctgtgc acacgacttt 14040
ttccatgcta caaaagtttt tcatgtctca cgtagtttcc atgcgccata aaattttgca 14100
tacttctcca agacttttta tgctcgaccc tttttggttt tcatttaaat cagtgggtcc 14160
catatgacga gggatcacac caacatcata tgctctcctc accataccaa atggtatccc 14220
caacta 14226
<210> 71
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 71
tttgggtcaa gctttaggct taggtcacat atacccaaaa tcatttggat gcatcaggtg 60
t 61
<210> 72
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 72
ttggctttgc tgcctcaaat cctcgagcta tcttatcatc atcgcattga gctccatacc 60
t 61
<210> 73
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 73
atcaaatcat atgatccatc ttaaattttt aactcaaaaa attaatattg caaactagct 60
caaaataatt ttgatcacta catttctgct gtgcattcta atttaaaccg ttcacatttt 120
ttagattcat gaaataattt tgaccaaagt attactccat actatagtca aaaaagatta 180
aaatattaga ttctaattaa agccaaagat aaacttttga ttctcatcct taattttgcc 240
taaagtataa ttattttgat taacccttaa gcgcaataac acattcaaaa ccaacagata 300
ggtttactat aatccaaatg aattaaatct taattctttt atcaattcat ttagacaatt 360
tcaaatcaaa attctataag taatatcaat aaaaaaaatt tttgatgctc caataagtta 420
gaacttaaat caaaatatat aagtaaaatt gatttaatca tctcttctaa agtttcttct 480
attaagatct ttaatatcta tcaaatacat tccacaataa tcatgcaaac cttttaaaaa 540
ttaaattctc aatgccttta ctacatttta acaccaagct cgataatagt gataaagaaa 600
catctagatc agctttataa tcaaaaattt tgacttacaa ttttacgtgt gtctcaaaat 660
cttgaataaa tataaataag atcttttatc ttgatccaaa aatagtaatc aaggatttca 720
ttagtaactt caacaacaat ggtaaaaaaa ttttctatcc attgataaac ccaaattttg 780
aattgaagtt tcatgcatac catatagcct ttaataagat ctattatttg gatctaaaga 840
tagtaattaa aattgttaat gattccacta agatgaatac tttacaatct cataattaat 900
ttcttcaata aaaatagact tcttgataat gtctccaatt gtatattttt ttttatttct 960
acaagaaaac ttcatacatt ttttacgttc caatataaat cttaaaaagt tattccaatc 1020
aaatatcata aaagatcttc ttagtccaac cttaaataac ttttatgaat gaatctttat 1080
cttgccacta aataatgaat tttaaaatca agagcaacat cacagcattc tgtcatgtca 1140
aatttgtgtt agatgtatgt cctagaaatc aattagattg acaatgtaaa ttttttaagg 1200
atataattta tatattttga tttattaata aaataaaatt taaattaatt tttattcata 1260
tttttttatc tatgaatcat ctaaagaatt aataagatga tgatacatat tcttaagagt 1320
tcaaaatttg aaatatatgt cattgatgat taatttctga atacttttga attcttaaga 1380
gtttagaaga tcttgaccca agtagtgtga atagtgaaaa aaagttttca catacttcac 1440
atcaaaaatt taagttgaat aaattgtaca tatgacaggt attatagttt gacgagtaat 1500
ctataacctc tatcttatca aaattctgat agaaagattg tattgtatga taactgtact 1560
tagaggttca ccttttattt tactggatta ccactacatg ttgctagatg tcactggtgg 1620
attgtgagat ctacgaagat tatcttgatg atcgataatt ctcattgaaa agattgaaac 1680
tattttaatg atgttgtgat agagatcata atatatctta ttatcagaca gaatagaatt 1740
ctatgggatc atacacaata ggagattaag actgatcaaa tagttgaatg atgattaaga 1800
atcattacgg agttcagatt atcaatataa ttgataatta gactaactta taattgttac 1860
aagtagcaag gacttaactg ctaaaggtta ataggttcaa aaagaactta tgtataaatg 1920
ttgtgcatct taatttgatt ggatcaaatt agttatggct gaattcaaga tgaatcaaat 1980
aggaatttgg ttcaattgaa tttgggtcaa gctttaggct taggtcacat atacccaaaa 2040
tcatttggat gcatcaggtg tgtgacacct gaatcaggcc tttctaaact attttgagta 2100
agtttgatca agtcaaaagg atccacaccc taaggtttct tgaataaaac cttaggcacc 2160
acattgagga cctataggaa actttgaccc tctctcatat ggggtggcac actgaggttt 2220
tataaaaacc ttaggcaccc attttagcca taaaaaaaaa gctccaaggg atggggcagt 2280
agccatgaag aatccttggc tgtcaggact ctattcaaaa gagttctcaa ggttttggac 2340
tcttatggag ccctaggatt tgtttgccta taaatagatg gccaccccaa ggctttagat 2400
aatgttagag acttgtgaag ctctcccctt tctcttggtt gccggcccac cctctctcct 2460
ctctcttcca tgccccaaga cttctttctt gtctccatca tcttgctgaa atttagattt 2520
cagcaagaaa agtcaagtag aagtcaaagt tctaatgtag ctcacaagat gttgagaact 2580
tcctccatct ggcaaaggtt ctgcaagaga gctagcatcc tgagaaacaa aaagattgct 2640
gatcagccct catctccata tggatatttg tagagatcaa atgcatgcat agctagaaga 2700
gaatcttatc acgatcatca ctcgtgaaga tcatctacct gtgcaaaggt atgagataag 2760
aaaaatattt tttttatcat aattcatgaa tcctttgctt atattatact gagattcttg 2820
gaatggattt tttctctagt aaaactctag agatcagatc tcaaagtctt cttcacataa 2880
aggttttgaa agttctttat atttccgctg ctttgattca aaataaatta gatctatttt 2940
gcctttcaac ctttctcata tttattgaca tataaagctt taattaatga gattaatgaa 3000
aagcatgtgc gaaatactga gaaaatccta acagtgatat cagagctact tttgtacata 3060
agaaaaggat tcaagttaaa taaaatatgt ttgatttaag taaatgaatc aatcaaaatt 3120
tatcctaaca taagtttgtc ctggtataat ggtcaagacc attatgttga aaggttatcc 3180
taggacaaaa agtctaagta aaatctattt tatttaagta aatgaatcaa ttaaagttta 3240
ttctaatata agattgcctt agcataatgg tgaagaccct tatgttgaaa ggttgtccta 3300
ggatggaaag tgattgatga gacaaatata tcatgaaagt atttttcaca gatggaataa 3360
aatatatata ttttgtttgt gaaaatgaga tttcatgaat gtgtttgtca ttcaatatgt 3420
gtggtgatca tcttgaattg ccacaaatcc tttttggatt agggttgtat catgactcac 3480
aaatcctgat ggtttgcaaa attttgcatt ctgtagtgat agaaaccaaa agttaatcca 3540
attttggaat aagattgatc aattggtatc taaggcaagt attttataat ggtggttact 3600
taattagtta taaaagtacg aagagtctcc taccaatctt acacttatct agccaatttg 3660
gttgattgaa ttctgaattt gggttgctta agtgttaagt tcactacaaa tatattgcaa 3720
ccatgattcc gacttagtca accaagccta gatctcttga atagattcat gttaattatg 3780
gatttacata ggatataaat aaataattaa aacttgaaga gatctaaatg aaaccttctc 3840
gtacatatta aatcgaatga tcttccatca ttgtagatat acggatactc tactgatgtt 3900
gatgattttc gactagatat agtactttgg ttgcatcgaa aaagtacaac cactttataa 3960
catgagatgt tgcagggtag agatggggtt gggcccaata attgttaggt gaggatccaa 4020
atgatggctg cacttgcgtg tgaatggcga gtctgactta a 4061
<210> 74
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<220>
<221> misc_feature
<222> (990)..(1717)
<223> n is a, c, g, or t
<400> 74
tataactgaa agatagctaa tgcttagctg gatgactgct gttagataac tgtctgcatt 60
cttacggtac attgatattt taccaatgtg acatagctta aatcggcaac tggctgaact 120
aaatattatg tatcccttta gttaacaatc atgtcggtta gagatcaatg taattcgcag 180
cagatcgatc ataagctgag atgagtatca tattttaaga acaacgctgg gcgagttagg 240
ccgatcaaat gtcagactga aaaagcagat caataaacct ctgatgtgat ctgaaagaat 300
atttatgatt taaataataa tctatcacca cgtatccaga taatgaggtc atataacatg 360
taccaacagt gcatttttcc atctagttaa gaggttggtt agtggcattt gtcttcgata 420
tgtaatgttc acataactaa tgtgcttagt agcattcttt tgtaaggtta aatcttcaat 480
gatcttaagt tcacataatt gcctttgtgc cctattagtt tatagttgac cttttaattc 540
aagagacagt caccttagca atcgatgtct gcttagattg ggccaattag gtactcacat 600
taatatattg aatcatgttt gaatataaag gattagattg atttataagt ttccttttat 660
tgtttacata ctgatactta gattgactta ctacattatt tgatatgtta tgttctaatt 720
tttggattaa aattgttgtt tctgatttct ccttacatct aatactttgt ataatttatt 780
attttttagc atgattgagt gtagaggatt agattgattt ttaagtttat tttgattatt 840
tacatgccca tacttaaatt gacttactac attattcaat atgttatgtt tcaattattg 900
agttaaaatt tttatttctg atttctactg atgtccagtg tgtgtgtgtg tacgtatgtg 960
tgtatatatt tatttacata tatatgtatn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnatg tatacatata catgtataca 1740
tacatatata gatatatata tatacatata tgtatatata tatatatata tacacatata 1800
taggttattt ggaacctaag aaacttgcaa agttactaga tgcaatgttc ggaaaccatg 1860
gaccgtaaca actggagtag tatttgggtc atgaattcat ggctagatca tgaattgagt 1920
gggagtcaac cgaagtaggg ccagctcaga cacttgtatt taggtcccat gcttgcgtgc 1980
attctcttcc ctgatatcct ttggctttgc tgcctcaaat cctcgagcta tcttatcatc 2040
atcgcattga gctccatacc ttgctctttc ctaactgccc ccatcaaacc tccggagatc 2100
ctctttcttc tccaatgttg agatttgttg gagtcttccc accttctcac ttcaatgggt 2160
ggcaatttca agtgccagtt cccttatttg tcccagctat attgacaatg gggcttattc 2220
tagggtttct catggacata gtgataataa taatcaaggg accaagagag aaaaatcttt 2280
ctagtctgtg ttctttaagt ttgagagata ggcagcacat ttttttaata agcctttttc 2340
actcatcgga tcctgatttt cagttgttcg acctgaacag ttcaagcaat tgaactgctt 2400
gggtcactat tttggacgat tttcagccat ttttaagtat tgtttgactg gatccacgct 2460
gcgtagtggg cattgcgttg atcaagtaga cctgtaaggg tcaacaaggt ctgagaacac 2520
tgaatggatg ctccataatc ctcttgttat ctgtcaacca tttggaatct tttaaaacaa 2580
catgtggtga taatatatat gataaactgt gatagattca tgtatagatt atacatatga 2640
aaatgtagag tgcttagtaa aagtgatgaa gagcaatgcg ttagaatgtg ctagcctttg 2700
acctaaaaat tggaatgccc aatgatgagt tatgataaaa ttgtgacgtg atttatgaag 2760
tctaatgttt agttggcttg cagtttcaga tgcgataaag aattttatga tttagctctt 2820
tggtttttta acatgcaaac atttaattgt actgaaaaac atttatttcg aaacatgtag 2880
gagactattg gatattgaaa ttaaaattga ctttttggtg tttcacaata tttcttaata 2940
aacactacga ctatgtaaat aggtggtgga tcaaagggaa agaaatgttt ggtgattatt 3000
tttagaaaag acaagaagta tttgataaat ggttattttt caaccgatta atgagagaat 3060
gactatgaac ctatgaggtg cacctcttat gatgttgcat ggatgaagca tctaatccat 3120
gggtacaatt tactaaaata taggcccaat tctgagacag gaacatttac aactcatgta 3180
caaagaagaa acttaaagta tcatggatgc cgggatattt ccttcttcaa atctttcaaa 3240
agctgtagtt ttcattataa ggaaaaatga ttataactaa catcttctat aggtgatgag 3300
tggacactag aaggctttcc tataataaca gtagagagag tagaaaagcc tgtcagcatg 3360
cggtccataa gtatatatac atattttcag cgcttaaagt aaattttctt gtaccaaaaa 3420
aagataaatt ttcaaaataa aaactaaaat caactgaaat gtttgaaatc tgattcgtag 3480
gtacatggag aagagtgtaa gacagcaaat atcataaagg cagaataaga gctggtaatc 3540
ttgtaacctg gcgcaactat gttatgcatg tctatatgtg tgcatgttta tgtataacaa 3600
gtaatatttc ttttcttatt tactcacttc agttaggaag tcaatccaat ctccctttgc 3660
ttgggtgtgt tcagattatc aagggccata acagtagtgc tggtaagcac ctgtttaatg 3720
gataaatggc gacaaattct ctccccttct gctcactcta ttatcatacc ttccgtctta 3780
cccatctgct atatcttata aggaacataa ggatcgacat agcttcatgc tatcacatta 3840
caagctaaga tcggaataat acctaatctt ttcgatctac tattaggtat tactataggg 3900
ttgtaaattg ggtttaggtt ttgaactata ttatattttg gtgtaagaat atagtgccac 3960
actatcttga accagactag ctgttgcact ttttttgcag gcatcaatat tttgttcatc 4020
caaaaaaaaa tattgcacat gcacagatga agtatgaggg c 4061
<210> 75
<211> 680
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 75
atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60
tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120
gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180
ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240
agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300
ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360
ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420
catgtgatca ccacgcagac ggatacctac aagaaaaagg caaggctaac atgctttctt 480
accatcattc tttacggtct ttgatccggt tttgcgtgtc cacttcttac gtagtctttt 540
tcaaacattc ctatctaaga ctgaaggtaa tgatttgcaa aggaatagct ttactgtttt 600
cctctaagta gatgaaatat tactcacgta gaaaggagcc atcataattg cagaaagaat 660
aaaactgaat ggaatatgag 680
<210> 76
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic predicted sequence of tDEF1
<400> 76
Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn
1 5 10 15
Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala
20 25 30
Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe
35 40 45
Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr
50 55 60
Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp
65 70 75 80
Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu
85 90 95
Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp
100 105 110
Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu
115 120 125
Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr
130 135 140
Thr Gln Thr Asp Thr Tyr Lys Lys Lys Ala Arg Leu Thr Cys Phe Leu
145 150 155 160
Thr Ile Ile Leu Tyr Gly Leu
165
<210> 77
<211> 1850
<212> DNA
<213> Elaeis guineensis
<400> 77
aaatcagcta atgtagacca tctgaactac ttgttcatca cccttatccc aaaaaaaaat 60
tggtgtgtat tcagttagag acttcaggcc aataagcctg attaatggag taataaaaaa 120
tatttcaaaa actctatcga aaaggctctc acagaaaatg aatttgttaa ttttatccac 180
agagcttgct ttcaacaaag gaagaaatat ctctgaatat tttgtaatga ctatggaaac 240
tatacacttc tgcaaagctg aagtacacaa ggatctcaat tataaagtcg acttcgagaa 300
agcttttgac aatgtggatt ggagctttct attgaaattg ctatccagca cggggctttg 360
attcgaggtg gtgtcaatgg atagaatatc tgatttatac agctaaattc tcagtcctta 420
ttaatggtga taaaggtaaa ctttttaaat tgaggaaaga tctcaggcaa ggagatcctc 480
tattcgccta gctctttctc ttagttgttg atatagaatg atcaagggag caagtaggtt 540
caatcttttt gttggaattg gatcatataa tatcatggga taacttcaaa gcttttagtt 600
cactgatgac acacttatat tttgcagata tgatctaaaa tacatcaaaa ctcttaaatt 660
tttactctat agttatgagc tactgatggg tctcaaaatt aactttgaaa aattccaatt 720
ttttggcttg agaattgcaa agatgtcagt acagcaagtt gcatctatcc tagaaagcaa 780
ggtggctaca ttttccatta cttatttggg tctcccactc catcattcta aactgaggaa 840
aacttattgg aatccactcc ttgagaaggt tcagaagaaa ttgatcgggt agaaaggtaa 900
acttcttaac ctctagggta ggcttatact aactaatgca gtgcttacag ggatcccact 960
actctggagg gatacattcc ttctccctca attcattatc aaataaattg ataaaatcca 1020
tcgatcattc atttggagag gaaacgagga gtataactaa gggcactcta gaatatgttg 1080
gtcgaatatt tgtcgatcaa aaaaatttgg aggactgggg gttcctcaat ctaaaaattt 1140
tcaatacaat tcttctttgt aaatggtggt ggaagctcta ctctaatgct ggtgacccgt 1200
ggtgtagttt tattgccact atccacccaa cttcacacta gagatctaaa ggtatacaca 1260
aatcaacctc ttcattttgg aatggtttac agcacacatg aaatatttct actcctaatc 1320
cactttcaag ttagcaacta gtattatttt ggaaagatag ttggttacat aatcatccac 1380
tgaaggatcg atttcctcac ctttacacaa tagcattgaa gtgcaacaac tcagtggcaa 1440
aggtattaag caatctactt gataatagct cttttagtac tcctcttcct caaagatacc 1500
aagaagattt tcagagtcta taggaaagca ttgaacaaat tacattaacg gaacgacctg 1560
atactataca atggaaatgg tttagtagca atattttttt ggcatgaagg atctactatt 1620
ttctgcaaga tggaggagtt tggcctctac tgagtaatat tatataaaaa ctcctaatac 1680
caaagaaagc caagttattt gcttggctaa gtgctcacaa caaaatccca atgaaagcta 1740
atcttcttaa tagaggaata attggaactg attactgtac actttgcgat gacttatcag 1800
aaactaatga tcatctaatg ctcatctata ctttttcaaa agcaatttgg 1850
<210> 78
<211> 498
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 78
atggggaggg ggaagataga gatcaagaag atagagaatc ctaccaacag gcaggtgacc 60
tactccaaga ggaggacggg gatcatgaag aaggctaagg agctgacggt gctttgcgat 120
gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180
ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240
agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300
ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360
ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420
catgtgatca ccacgcagac ggatacctac aagaaaaaga tgcatctcaa gtcagcacta 480
gaccatcttc taaaatag 498
<210> 79
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 79
Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn
1 5 10 15
Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala
20 25 30
Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe
35 40 45
Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr
50 55 60
Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp
65 70 75 80
Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu
85 90 95
Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp
100 105 110
Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu
115 120 125
Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr
130 135 140
Thr Gln Thr Asp Thr Tyr Lys Lys Lys Met His Leu Lys Ser Ala Leu
145 150 155 160
Asp His Leu Leu Lys
165
<210> 80
<211> 459
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 80
atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60
tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120
gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180
ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240
agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300
ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360
ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420
catgtgatca ccacgcagac ggatacctac aagaaaaag 459
<210> 81
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic
<400> 81
Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn
1 5 10 15
Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala
20 25 30
Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe
35 40 45
Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr
50 55 60
Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp
65 70 75 80
Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu
85 90 95
Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp
100 105 110
Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu
115 120 125
Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr
130 135 140
Thr Gln Thr Asp Thr Tyr Lys Lys Lys
145 150
<210> 82
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 82
tgatatgaag ggtttcaagg t 21
<210> 83
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 83
tcctatttta gaagatggtc tagtg 25
<210> 84
<211> 576
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 84
tgatatgaag ggtttcaagg tggtttgcct cgttcaaatc aaaggatttt gaagattaat 60
attccaagat aaggttctcc aactccatta ggaaagtgtc ttcatgtcat cttagagaag 120
cagctcgtac caaacttgac agatgtttta tttatttaga gtgacacaga taccctttgg 180
caatactctc catccttgtc cgaacaactt ctaatcacac ctcacttatc ttgcatctaa 240
ctcagaggct acaagttaca cctttcaaca aaccttttcg gtttgaaaat ttgtgatttc 300
attatttaga gttcgaagag catatcaagt attggtcgga gttggcaccc aaagcaaacg 360
aaacagttac tgacatggtc caaaagctga gatttctaag atcccaactt aagcactgaa 420
taaagccatt atgggaaata tcattttaac gaaagaggaa tttagagtaa gaattgattc 480
tcttgatacc gaagaagaac taatacagct ttcatcactt caaaatgatg aacagatgca 540
tctcaagtca gcactagacc atcttctaaa atagga 576
<210> 85
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 85
agaattgatt ctcttgatac cg 22
<210> 86
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 86
ttttattact ccattaatca ggct 24
<210> 87
<211> 633
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 87
agaattgatt ctcttgatac cgaagaagaa ctaatacagc tttcatcact tcaaaatgat 60
gaacagatgc atctcaagtc agcactagac catcttctaa aataggaaga tctatggaag 120
caacactccc aaatgcagtg gcttcaaaat ggggattgca atacgaagtt tatccatgtt 180
tgggcaagta acaggaaaaa aagaatacta tcactgaact ctagcaaggc gatcagaaga 240
ttatcgaata gcagcaaatc caatccacat tctacaactt tttttctacc ctactaggct 300
cgactgagga atgactcatc caagctgatt ggaagattct ttatccagaa ggacctctgg 360
atcttgctga cattgagtat ccatttatgg agaaagaaat ccatgataca gtgtatgact 420
tggctttgga aaagtcaccc ggatgatatt ttcccattct ccttctataa gcacttctag 480
tgtatcatca aacatgacct gatgaaccta ctgtaaaatc agctaatgta gaccatctga 540
actacttgtt catcaccctt atcccaaaaa aaaattggtg tgtattcagt tagagacttc 600
aggccaataa gcctgattaa tggagtaata aaa 633
<210> 88
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 88
gcaaggagat cctctattcg 20
<210> 89
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 89
gatcgacaaa tattcgacca 20
<210> 90
<211> 632
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 90
gcaaggagat cctctattcg cctagctctt tctcttagtt gttgatatag aatgatcaag 60
ggagcaagta ggttcaatct ttttgttgga attggatcat ataatatcat gggataactt 120
caaagctttt agttcactga tgacacactt atattttgca gatatgatct aaaatacatc 180
aaaactctta aatttttact ctatagttat gagctactga tgggtctcaa aattaacttt 240
gaaaaattcc aattttttgg cttgagaatt gcaaagatgt cagtacagca agttgcatct 300
atcctagaaa gcaaggtggc tacattttcc attacttatt tgggtctccc actccatcat 360
tctaaactga ggaaaactta ttggaatcca ctccttgaga aggttcagaa gaaattgatc 420
gggtagaaag gtaaacttct taacctctag ggtaggctta tactaactaa tgcagtgctt 480
acagggatcc cactactctg gagggataca ttccttctcc ctcaattcat tatcaaataa 540
attgataaaa tccatcgatc attcatttgg agaggaaacg aggagtataa ctaagggcac 600
tctagaatat gttggtcgaa tatttgtcga tc 632
<210> 91
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 91
ctctagcaag gcgatcagaa gatt 24
<210> 92
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 92
tcaggtgtta tgtcagtttg gact 24
<210> 93
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 93
aagtctccac tctatctatc ccga 24
<210> 94
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 94
gggtcaacaa ggtctgagaa cact 24
<210> 95
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 95
cgcaatcaga atcaactggc caat 24
<210> 96
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 96
atgatacacg gttgcatgcc ctgc 24
<210> 97
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 97
gatctatggt gcaaggagtt aatt 24
<210> 98
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 98
agagagaggg ttaaaggaca atgc 24
<210> 99
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 99
atagggagaa tagcttggct tcga 24
<210> 100
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 100
tcgggttctt ttattcgtgg attt 24
<210> 101
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 101
aggggagatt gttggcttag cttg 24
<210> 102
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 102
agtagactcg atgatgataa gact 24
<210> 103
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 103
accagcacgg tcaaggatag gcat 24
<210> 104
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 104
atagtagact cgatgatgat aaga 24
<210> 105
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 105
cctccaacat cggccaagtt agtt 24
<210> 106
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 106
aaatcctact tgtttctctg acct 24
<210> 107
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 107
catgaggcat gcaaggtatt gaat 24
<210> 108
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 108
aaggctggct aactcaaaga agag 24
<210> 109
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 109
aatgatcgag aagggctgga gaca 24
<210> 110
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 110
tgacccacca tcgagaagga ccga 24
<210> 111
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 111
ataactgaca agtggcattg atct 24
<210> 112
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 112
agaaggatga gaagagagat tgtc 24
<210> 113
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 113
aaagatgtta gctcctgttc gaga 24
<210> 114
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 114
aaaggctggc taactcaaag aaga 24
<210> 115
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 115
agagattgtg aacaaatgga gaga 24
<210> 116
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 116
atattgtctg ctcttcacca aaga 24
<210> 117
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 117
ctcgtaaggc ccaagggtag tcat 24
<210> 118
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 118
aaaatagctt gacccaccat cgag 24
<210> 119
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 119
atagaatagg gagaatagct tggc 24
<210> 120
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 120
tcctgtccag atatttgcgc ctct 24
<210> 121
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 121
acaactagcc aatgatcgag aagg 24
<210> 122
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 122
aacacactgc tgaaaaggac tagg 24
<210> 123
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 123
aaactcatgg tgtcaaggga cgtg 24
<210> 124
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 124
gctacacagg cacaatctcg attt 24
<210> 125
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 125
ctttccgaca ccaagacca 19
<210> 126
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 126
caagtagcgg atagagaggc ttac 24
<210> 127
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 127
gttcgtcaca gaaaatacca tgt 23
<210> 128
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 128
tcttctgatc gccttgctag a 21
<210> 129
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 129
accggatcaa agaccgtaaa g 21
<210> 130
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 130
aaattcttac ttctgagcat actt 24
<210> 131
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 131
cgaggtggtg tcaatggata gaat 24
<210> 132
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 132
ctctttgtta tacaatcacg gtgt 24
<210> 133
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 133
caaggcgatc agaagattat cgaa 24
<210> 134
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 134
gtgccatatg tcatagtcaa ctgt 24
<210> 135
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 135
aatctgatat tggcatccac atga 24
<210> 136
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 136
cctgactttc ggttggctgt ctct 24
<210> 137
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 137
aatcctactt gtttctctga cctt 24
<210> 138
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 138
ctctagcaag gcgatcagaa gatt 24
<210> 139
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 139
aaatggcata ctctggcaat tcga 24
<210> 140
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 140
tctatctcat ccctctcaac caat 24
<210> 141
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 141
gtagcccatg tctttgtttt ccct 24
<210> 142
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 142
tgtggatggc taacgatatg gact 24
<210> 143
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 143
actagcacca tgtgtcgtta tggg 24
<210> 144
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 144
ttcagtcaga gacttcaggc caat 24
<210> 145
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 145
aggctctcac agaaaatgaa tttg 24
<210> 146
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 146
ttatacagct aaattctcag tcct 24
<210> 147
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 147
tatacagcta aattctcagt cctt 24
<210> 148
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 148
acagctaaat tctcagtcct tatt 24
<210> 149
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 149
gctaaattct cagtccttat taat 24
<210> 150
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 150
cattctaaac tgaggaaaac ttat 24
<210> 151
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 151
aggttcagaa gaaattgatc gggt 24
<210> 152
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 152
attgatcggg tagaaaggta aact 24
<210> 153
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 153
tgcagtgctt acagggatcc cact 24
<210> 154
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 154
acgaggagta taactaaggg cact 24
<210> 155
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 155
aagggcactc tagaatatgt tggt 24
<210> 156
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 156
aagggcactt tagaatatgt tggt 24
<210> 157
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 157
tggtttacag cacacatgaa atat 24
<210> 158
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 158
ggcatgaagg atctactatt ttct 24
<210> 159
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 159
ggcatgaagg atctactatt ttct 24
<210> 160
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 160
acttttatgc atgcttaaca ccct 24
<210> 161
<211> 24
<212> DNA
<213> Elaeis guineensis
<400> 161
atgcatgctt aacaccctat ggga 24

Claims (14)

1.一种用于检测或预测油棕植物的Mantle表型的方法,所述方法包括:
a)从所述植物获得生物样品;
b)检测来自所述植物的所述样品中差异甲基化区域(DMR)内至少一个胞嘧啶的甲基化状态相对于对照基因座的增加或减少,其中所述DMR处于与SEQ ID NO:66至少95%一致的DNA序列内;以及
c)基于检测到的甲基化状态,对预测具有Mantle表型的植物与一种或多种预计缺乏Mantle表型的植物进行物理分离。
2.根据权利要求1所述的方法,其特征在于,所述物理分离包括选择预测具有Mantle表型的植物以进行破坏。
3.根据权利要求1所述的方法,其特征在于,所述物理分离包括选择预测缺乏Mantle表型的植物以进行栽培。
4.根据权利要求3所述的方法,其特征在于,种植或移植被选择用于栽培的植物。
5.根据如权利要求3所述的方法,其特征在于,丢弃或破坏未选择用于栽培的植物。
6.根据如权利要求3所述的方法,其特征在于,处理未选择用于栽培的植物以减少Mantle表型的可能性。
7.根据权利要求1所述的方法,其特征在于,所述至少一个胞嘧啶是CHG序列中的第一胞嘧啶,其中H是C、A或T。
8.根据权利要求1所述的方法,其特征在于,DMR在来自植物的样品的DNA区域内,并且其中该DNA区域与SEQ ID NO:43、SEQ ID NO:44、SEQ ID N:45或SEQ ID NO:46至少95%一致。
9.根据权利要求1所述的方法,其特征在于,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态减少时,预测存在Mantle表型。
10.根据权利要求9所述的方法,其特征在于,所述对照基因座是内源对照基因座。
11.根据权利要求9所述的方法,其特征在于,所述对照基因座是外源对照基因座。
12.根据权利要求1所述的方法,其特征在于,检测甲基化状态的增加或减少包括亚硫酸氢盐转化。
13.根据权利要求1所述的方法,其特征在于,检测甲基化状态的增加或减少包括用甲基化依赖性内切核酸酶来消化基因组DNA。
14.根据权利要求1所述的方法,其特征在于,检测甲基化状态的增加或减少包括用甲基化敏感性内切核酸酶来消化基因组DNA。
CN201580036283.8A 2014-05-02 2015-04-30 棕榈Mantle表型检测 Active CN106471008B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461988132P 2014-05-02 2014-05-02
US61/988,132 2014-05-02
US201462091471P 2014-12-12 2014-12-12
US62/091,471 2014-12-12
PCT/US2015/028646 WO2015168470A2 (en) 2014-05-02 2015-04-30 Mantle phenotype detection in palm

Publications (2)

Publication Number Publication Date
CN106471008A CN106471008A (zh) 2017-03-01
CN106471008B true CN106471008B (zh) 2021-04-09

Family

ID=54354832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580036283.8A Active CN106471008B (zh) 2014-05-02 2015-04-30 棕榈Mantle表型检测

Country Status (7)

Country Link
US (2) US9984200B2 (zh)
EP (1) EP3137491A4 (zh)
CN (1) CN106471008B (zh)
CR (1) CR20160513A (zh)
MY (1) MY193347A (zh)
SG (1) SG11201609025TA (zh)
WO (1) WO2015168470A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106471008B (zh) * 2014-05-02 2021-04-09 马来西亚棕榈油协会 棕榈Mantle表型检测
CN106868159B (zh) * 2017-03-20 2020-12-08 西北农林科技大学 一种用于鉴定番茄萼片形态的ssr分子标记、引物及应用
CN108396073B (zh) * 2018-03-23 2021-06-18 中国热带农业科学院椰子研究所 一种鉴别油棕种苗Mantled畸形的方法
CN110276775B (zh) * 2019-07-08 2021-05-04 浙江理工大学 一种基于机器视觉的番茄穴盘苗嫁接切削参数识别方法

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4910146A (en) 1988-07-18 1990-03-20 Hartmans Plants, Inc. Automated plant culture proliferation system
US6033854A (en) 1991-12-16 2000-03-07 Biotronics Corporation Quantitative PCR using blocking oligonucleotides
US5405760A (en) 1992-04-30 1995-04-11 New England Biolabs, Inc. Process for producing recombinant McrBC endonuclease and cleavage of methylated DNA
WO1995006137A1 (en) 1993-08-27 1995-03-02 Australian Red Cross Society Detection of genes
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6307123B1 (en) 1998-05-18 2001-10-23 Dekalb Genetics Corporation Methods and compositions for transgene identification
US6331393B1 (en) 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis
US6180349B1 (en) 1999-05-18 2001-01-30 The Regents Of The University Of California Quantitative PCR method to enumerate DNA copy number
US6646264B1 (en) 2000-10-30 2003-11-11 Monsanto Technology Llc Methods and devices for analyzing agricultural products
US7367155B2 (en) 2000-12-20 2008-05-06 Monsanto Technology Llc Apparatus and methods for analyzing and improving agricultural products
AR032568A1 (es) 2001-02-09 2003-11-12 Monsanto Technology Llc Identificacion de semillas o plantas usando marcadores fenotipicos
DE10130800B4 (de) 2001-06-22 2005-06-23 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
US6673595B2 (en) 2001-08-27 2004-01-06 Biocrystal, Ltd Automated cell management system for growth and manipulation of cultured cells
US6880771B2 (en) 2002-02-01 2005-04-19 Monsanto Technology Llc Axially reciprocating tubular ball mill grinding device and method
BR0309017B1 (pt) 2002-04-04 2015-02-18 Monsanto Technology Llc Máquina automática para manusear e manipular peças individuais de material particulado
CA2486808C (en) 2002-05-24 2013-02-05 Monsanto Technology Llc Seed coring system and method for arranging seed cores for analysis
EP2339025B1 (en) 2002-06-26 2013-10-09 Cold Spring Harbor Laboratory Methods for determining the methylation profiles
GB0222846D0 (en) 2002-10-03 2002-11-06 Choo Yen Cell culture
MX347048B (es) 2003-03-28 2017-04-07 Inguran Llc * Aparato de muestreo digital y métodos para separar partículas.
CA2539935C (en) 2003-09-23 2015-11-17 Monsanto Technology Llc High throughput automated seed analysis system
ES2382780T3 (es) 2003-10-21 2012-06-13 Orion Genomics, Llc Procedimientos para la determinación cuantitativa de la densidad de metilación en un locus de ADN
CN101052295B (zh) 2004-08-26 2014-03-05 孟山都技术有限公司 种子自动检验
US7703238B2 (en) 2004-08-26 2010-04-27 Monsanto Technology Llc Methods of seed breeding using high throughput nondestructive seed sampling
GB2418917C (en) 2004-09-30 2011-01-26 Malayasian Palm Oil Board Novel B-type gene from oil palm.
WO2006121973A2 (en) 2005-05-09 2006-11-16 Monsanto Technology Llc Custom planter and method of custom planting
BRPI0615232A2 (pt) 2005-08-26 2011-05-10 Monsanto Technology Llc mÉtodo automatizado de alto rendimento para determinar a composiÇço de Ácido graxo de uma semente, para a triagem de alto rendimento de sementes oleaginosas e para avolumar uma quantidade de sementes tendo uma caracterÍstica de Ácido graxo desejada
US7998669B2 (en) 2006-03-02 2011-08-16 Monsanto Technology Llc Automated contamination-free seed sampler and methods of sampling, testing and bulking seeds
US8028469B2 (en) 2006-03-02 2011-10-04 Monsanto Technology Llc Automated high-throughput seed sampler and methods of sampling, testing and bulking seeds
US20070224626A1 (en) * 2006-03-09 2007-09-27 Orion Genomics Llc Comprehensive DNA methylation profiling in a human cancer genome identifies novel epigenetic targets
JP5330231B2 (ja) 2006-05-12 2013-10-30 モンサント テクノロジー エルエルシー マーカーフリーのトランスジェニック植物を得るための方法および組成物
CA2656676C (en) 2006-06-28 2016-04-26 Monsanto Technology Llc Small object sorting system and method
US7909276B2 (en) 2007-02-23 2011-03-22 Monsanto Technology Llc Agricultural sample grinder
EP3290520B1 (en) 2007-03-09 2021-07-14 Monsanto Technology LLC Preparation and use of plant embryo explants for transformation
US8452445B2 (en) 2007-04-24 2013-05-28 Pioneer Hi-Bred International, Inc. Method and computer program product for distinguishing and sorting seeds containing a genetic element of interest
US20110079544A1 (en) 2009-10-01 2011-04-07 Pioneer Hi-Bred International, Inc. Method for sorting resistant seed from a mixture with susceptible seed
EP2166830B1 (en) 2007-05-31 2013-08-07 Monsanto Technology, LLC Seed sorter
US9448968B2 (en) 2007-06-27 2016-09-20 Monsanto Technology Llc Automated small object sorting systems and methods
AU2008296436B2 (en) 2007-08-29 2013-11-14 Monsanto Technology Llc Systems and methods for processing hybrid seed
AU2008296419A1 (en) 2007-08-29 2009-03-12 Monsanto Technology Llc Methods for incorporating multiple genes in a crop plant
BRPI0820130A2 (pt) 2007-12-17 2015-05-12 Pioneer Hi Bred Int Aparelho e método para criar, manusear e coletar porções de semente e sistema para criar, manusear, coletar e indexar sementes e porções de semente removidas das sementes de maneira eficente e com alta produtividade
WO2010002754A1 (en) 2008-07-02 2010-01-07 Monsanto Technology Llc High speed counter
US8685321B2 (en) 2008-08-05 2014-04-01 Monsanto Technology Llc Automated multi-station small object analysis
WO2010056107A2 (en) * 2008-11-13 2010-05-20 Malaysian Palm Oil Board Method for identification of a molecular marker linked to the shell gene of oil palm
WO2011119394A1 (en) 2010-03-26 2011-09-29 Monsanto Technology Llc Systems and methods for selection of individual seeds and placement onto seed tape
US9060462B2 (en) 2010-03-26 2015-06-23 Monsanto Technology Llc Systems and method for selection of seed and placement on seed tape
US9357710B2 (en) 2010-03-26 2016-06-07 Monsanto Technology Llc Intelligent selection and remapping of ellepots
EP2595465B1 (en) 2010-07-20 2021-06-02 Monsanto Technology LLC Automated systems for removing tissue samples from seeds, and related methods
CN104486940B (zh) 2012-03-19 2017-11-28 马来西亚棕榈油协会 控制棕榈壳表型的基因
EP2787004A1 (en) * 2013-04-03 2014-10-08 Malaysian Palm Oil Board A method for predicting a "mantled" phenotype in oil palm plants and minimizing the percentage of oil palm plants with a "mantled" phenotype in a culture, and polynucleotide to be used therein
EP2984179B1 (en) 2013-04-08 2019-11-27 Malaysian Palm Oil Board Gene controlling fruit color phenotype in palm
CN106471008B (zh) 2014-05-02 2021-04-09 马来西亚棕榈油协会 棕榈Mantle表型检测

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DNA Methylation and Expression of the EgDEF1 Gene and Neighboring Retrotransposons in mantled Somaclonal Variants of Oil Palm;Estelle Jaligot等;《PLOS ONE》;20140317;摘要,第2-7页 *

Also Published As

Publication number Publication date
EP3137491A2 (en) 2017-03-08
CN106471008A (zh) 2017-03-01
US20150315662A1 (en) 2015-11-05
EP3137491A4 (en) 2018-02-21
US9984200B2 (en) 2018-05-29
CR20160513A (es) 2017-05-16
SG11201609025TA (en) 2016-11-29
US20180314794A1 (en) 2018-11-01
MY193347A (en) 2022-10-06
WO2015168470A3 (en) 2016-01-21
WO2015168470A2 (en) 2015-11-05
US11632922B2 (en) 2023-04-25
BR112016025562A2 (pt) 2018-07-03

Similar Documents

Publication Publication Date Title
AU2020223686B2 (en) Plant regulatory elements and uses thereof
CN104024438B (zh) Snp位点集合及其使用方法与应用
KR102219621B1 (ko) 식물 생성을 위한 형광 활성화 세포 분류 (facs) 강화
KR102147007B1 (ko) Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN113365493B (zh) 对番茄褐色皱果病毒有抗性的番茄植物
KR20170116034A (ko) 성 결정 유전자들 및 육종에 이들의 이용
CN107267524A (zh) 用于基因打靶和性状堆叠的工程化转基因整合平台(etip)
CA2396359A1 (en) Nucleic acid molecules and other molecules associated with soybean cyst nematode resistance
CN106471008B (zh) 棕榈Mantle表型检测
CN111542610A (zh) 精确基因组编辑的新策略
CN111295447A (zh) 玉米优良事件mzir098
KR101760932B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR101760935B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR101760934B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR101832456B1 (ko) 갯무의 오구라 세포질적 웅성 불임성을 부여하는 엽록체 유전자 및 이를 이용하여 제조된 갯무의 오구라 세포질적 웅성 불임성 유전자형 판별용 분자마커
KR101760931B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR102516041B1 (ko) 대량 고효율의 상추 품종 식별을 위한 snp 마커, 프라이머 세트, 및 이의 용도
RU2817119C2 (ru) Растения томата, устойчивые к вирусу бурой морщинистости плодов томата
CN107338301B (zh) 与陆地棉纺纱均匀性指数关联的snp分子标记及其应用
KR101760933B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
CN115135142A (zh) 控制籽粒大小和粒重的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant