CN1836046B - 苔藓表达促进区域 - Google Patents

苔藓表达促进区域 Download PDF

Info

Publication number
CN1836046B
CN1836046B CN2004800229689A CN200480022968A CN1836046B CN 1836046 B CN1836046 B CN 1836046B CN 2004800229689 A CN2004800229689 A CN 2004800229689A CN 200480022968 A CN200480022968 A CN 200480022968A CN 1836046 B CN1836046 B CN 1836046B
Authority
CN
China
Prior art keywords
moss
nucleic acid
acid molecule
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800229689A
Other languages
English (en)
Other versions
CN1836046A (zh
Inventor
M·罗德里格斯-佛朗哥
W·约斯特
A·威斯
G·戈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eleva GmbH
Original Assignee
Greenovation Biotech GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Greenovation Biotech GmbH filed Critical Greenovation Biotech GmbH
Publication of CN1836046A publication Critical patent/CN1836046A/zh
Application granted granted Critical
Publication of CN1836046B publication Critical patent/CN1836046B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

公开的是编码野生型细胞核来源的苔藓表达促进区域(MEPR)的分离核酸分子以及使用这种MEPR制备重组多肽的方法。

Description

苔藓表达促进区域
本发明涉及分离的核酸分子,这些分子促进多肽在遗传修饰的真核宿主细胞中的表达。
蛋白质类物质(蛋白质、肽、多肽及其片段,以及这些分子的翻译后修饰的形式,在此后被称为“多肽”,在例如实施例部分中与“蛋白质”作为同义词一同使用)在遗传修饰的细胞中的表达是提供这些通常是稀缺或者贵重物质制备物的主要来源。为了在遗传修饰的宿主细胞中表达这些多肽,需要有对这一表达有正面控制(“激活”、“促进”)的DNA区域的存在。启动子是这种区域的重要实例,它们使RNA聚合酶结合到DNA上,起始DNA转录为mRNA(Watson等人,″Recombinant DNA″(1992),Chapter I.1和2)。
作为研究植物生理和发育的有用研究对象,苔藓(moss)吸引了越来越多的注意力,因为它们简单的特征(苔藓位于高等植物进化的最底部)为高等植物的复杂生物学提供了信息。苔藓简单的形态学和具有优势的培养可能性使它们成为研究植物生理学和发育生物学流行的模型生物。苔藓可以毫不费力地使用包括纯性培养(axenicculture)在内的体外技术,在控制的条件下培养,不仅仅在培养皿中而且在液体培养基例如生物反应器中。单倍体的配子体可以在无菌的培养基中进行光自养生长,并且很容易在细胞水平观察到。
苔藓的另一个主要优势是它们的转化能力:尽管有很多研究,但是在植物中的靶向整合事件很少达到10-4,这阻碍了植物功能基因组学的基因靶向方法的一般使用。与所有其他至今被检测的植物相比,同源DNA序列在苔藓(特别是已经建立的苔藓模型生物例如小立碗藓(Physcomitrella patens)(其分子遗传学的综述参见Reski,1999))的基因组中的整合主要是以同源重组的方式出现在靶向的位置上。通常使用PEG介导的原生质体摄取质粒DNA、粒子枪法DNA转移、电穿孔以及显微注射(Cove等人,1997)进行苔藓的转化,这些很容易进行。根据转化构建体的设计主要会出现随机或者靶向的整合。尽管使用苔藓作为科学工具用于植物生理学研究,但是至今为止使用苔藓在苔藓细胞中制备异源重组多肽仍然是相当有限,尽管已经具备了有效的制备方法(例如根据EP 1 206 561 A中的描述培养原丝体苔藓组织)。
在真核宿主细胞特别是动物细胞或者高等植物细胞中转化技术的一个主要限制总是缺少有效的启动子用于在这样的宿主细胞中进行外源基因的高的组成型表达。基于这个目的,花椰菜花叶病毒(CaMV)35S启动子已经被广泛地用于许多植物转化系统中(参见例如WO01/25456A),但是在一些植物物种中CaMV 35S启动子活性低(特别是单子叶植物例如水稻(McElroy等人,1991,))。对于单子叶植物的转化,已经使用了水稻肌动蛋白15′区域用于蛋白质的异源表达(McElroy等人,1991,)。但是仍然存在对新型表达促进手段的不断需要用于在遗传修饰的真核宿主细胞中表达重组(外源)多肽。
对于苔藓,特别是小立碗藓至今为止仍然没有发表同源的(在这里同源的定义是苔藓来源的)适当的来自细胞核的表达启动子或者其他来自细胞核的表达启动序列(Holtdorf等人,2002)。研究人员因此已经使用了异源的(在这里异源的定义是非苔藓来源的)启动子用于表达选择标记基因和其他目的基因。但是这些启动子中只有很少能够在某些苔藓中可靠地起作用(例如CaMV 35S启动子;在Holtdorf等人,2002中予以总结;CaMV 35S启动子在某些其他的物种中不起作用(Zeidler等人,1999);TET-启动子(在Reski(1998)中予以综述)。
因此,已经在本领域内开发了用于对苔藓进行遗传操作的其他方法,例如基因捕获和增强子捕获系统(Hiwatashi等人,2001;但是还使用了(缩短的)CaMV 35S启动子;作者在瞬时表达实验中表明这个35S启动子的缩短形式是作为一个弱启动子起作用;实际上,这篇文章涉及了在增强子捕获菌株中表达报告基因,但是没有显示这一表达与任何苔藓的调控元件有任何联系)。
尽管在以上提及的在苔藓中使用同源重组的研究中,异源启动子的使用是必要的(因此不需要同源启动子,而且它们在大多数情况下是没有用的),但是对于用于工业使用苔藓制备重组多肽或者用于过量表达同源多肽的适宜的苔藓来源的表达促进手段的需要仍然存在并且尚未解决。这些表达促进手段应该使得在应用的培养条件下存在稳定和组成型的表达,并且应该优选地使表达与CaMV35S启动子的表达相当或者更高。
因此,本发明提供了编码苔藓表达促进区域(MEPR),即来自野生型苔藓的表达促进区域的分离的核酸分子。本发明中提供了苔藓来源的表达区域(即来自野生型苔藓的细胞核来源的区域),它可以使在遗传修饰的宿主细胞中特别是在苔藓中有组成型的表达,这样就解决了在现有技术中提出的对于这种工具的需要(Holtdorf等人,2002;Schaefer等人,2002)。
根据本发明,MEPR的基本特征还有MEPR的表达促进活性是在特异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达重组多肽的CaMV 35S启动子)表达促进活性的至少30%,优选为至少50%,因为不具有这种表达促进活性的苔藓启动子不能被正确地用于解决本发明的目标,因此不被当做MERP。
因此,根据本发明MEPR从野生型苔藓,即没有通过引入非苔藓物种的启动子(例如高等植物或者(植物)病原的启动子例如CaMV 35S启动子或者TET启动子)被遗传修饰的苔藓,的细胞核中分离。还很清楚,具有微小序列改变(例如在对于表达促进活性没有负面影响(破坏)的区域中有1,2,3,4,或者5个碱基的交换)的MEPR,也被认为是根据本发明的MEPR,它们可能是由于例如天然植株序列变异或者由于在MEPR的分离过程中出现的事件而造成的。用于分析表达促进活性的方法或者用于分析这种微小序列改变对于这一活性的影响的方法是技术人员已知的(例如通过与已知的CaMV 35S构建体进行比较)并且在下面的实施例部分中进行描述。
根据本发明,非孢子体(sphorophyte)特异的MEPR表达促进被定义为组成型MEPR,优选地MEPR促进在来自配子体的细胞中的表达,更为优选地,MEPR促进在原丝体细胞中的表达。
根据本发明,组成型表达优选地被定义为蛋白质的表达导致该蛋白在一般用于光自养生长的苔藓的液体培养条件下(例如摇瓶培养,生物反应器培养(EP 1 206 561 A))以及用于在下面描述的瞬时表达系统的条件下具有可以被检出的量。因此,组成型表达应当给予根据本发明的MERP,优选地不必在培养基中添加特殊培养添加物,还有优选地不必在培养基中添加糖、植物激素或者这些物质混合物。组成型表达应该以稳定的形式进行;尽管它可能是瞬时的。
在本发明的说明中使用的术语“苔藓”包括所有的苔藓类植物(苔类(hepatics)或者地钱(liverworts)、角苔(hornworts)和苔藓)。苔藓的特点是它们的异型世代交替,即两个细胞核DNA含量和形态截然不同的世代的交替。二倍体的孢子体只在其年轻时具有光合活性,它需要从占据优势的绿色的单倍体配子体上获得营养供给。配子体以两种形态显著不同的形式存在:被称为原丝体的年轻配子体以及被称为配子托的成年配子体。与原丝体相反,成年的配子体(配子托)具有性器官。
在本发明的背景下,瞬时表达被定义为如下所述将基于附加体核酸的构建体(例如MEPR和目的基因)引入苔藓的原生质体中,导致或者允许载体的瞬间表达,表达优选地导致细胞外蛋白向培养基中的分泌。原生质体来自苔藓细胞,优选地来自配子体细胞,更为优选地来自原丝体细胞。
尽管根据根据本发明的MEPR可以从任何苔藓物种中取得,优选地,MEPR从通常的模型苔藓物种中分离。因此,MEPR优选地分离自立碗藓属(physcomitrella)、葫芦藓属(Funaria)、泥炭藓属(Sphagnum)、角齿藓属(Ceratodon)、地钱属(Marchantia)和Sphaerocarpos中,特别是小立碗藓(Physcomitrella patens)、葫芦藓(Funaria hygrometrica)和地钱(Marchantia polymorpha)。
根据本发明的适宜MEPR选自序列编号1到27或者它们的表达促进片段。“表达促进片段”是MEPR的片段,其具有的表达促进活性是在特异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达重组多肽的CaMV 35S启动子)的表达促进活性的至少30%,优选为至少50%。
根据本发明的MEPR可以包含特异的区域,例如启动子区域(“启动子”),5′未翻译区域(″5′-UTRs″)、5′内含子或者3′-UTRs。对于一些MEPR,存在只含有5′内含子的表达促进片段。通常启动子总是独自作为表达促进片段而有活性。因此,根据本发明的MEPR优选地包含苔藓的启动子,优选是5′-UTR区域和/或5′内含子和/或3′-UTR。
尽管如果达到某种组成型表达通常就足够了,但是许多情况下最好能够获得高的表达率,特别是对于工业制备重组多肽。已经证明根据本发明的多数MEPR与CaMV 35S启动子相比能够为一个给定的重组多肽提供更高的表达率,特别是在同源系统中(例如立碗藓属的MEPR用于多肽在立碗藓属中的表达)。因此,根据本发明优选的MEPR其表达促进活性至少与花椰菜花叶病毒(CaMV)35S启动子的表达促进活性相同,特别是,但是不止限于在MEPR分离的苔藓物种中。更为优选的MEPR表达促进活性是花椰菜花叶病毒(CaMV)35S启动子的表达促进活性的至少200%、优选地至少500%、特别地至少1000%,特别地,但是不止限于在MEPR分离的苔藓物种中。
根据本发明的分离的核酸分子优选地用于转化特异的宿主细胞,用于制备重组转基因多肽,优选地,但是不止限于,工业规模。因此核酸分子作为适宜的载体提供,使转基因在宿主细胞中转化并表达。在根据本发明的MEPR用于代替苔藓中的天然启动子(这样使同源苔藓多肽在MEPR的控制下表达,MEPR在苔藓中的位置是它通常在野生型植株中不在的位置)的可能性中,本发明MEPR的广泛工业应用性是异源(“外源”)基因在生产性宿主细胞中,特异地是在植物细胞中,特别是在苔藓细胞中的表达的控制。因此,根据本发明的核酸分子还包含重组多肽产物的编码区域,所述的编码区域在MEPR的控制下。
如果根据本发明的分离的核酸分子还包含选择标记和/或其他能够使被选择的适当转化方法进行所需的区域,则这也是有利的(参见例如Cove等人1997;Schaefer,2002)。例如,如果优选靶向整合,则根据本发明的核酸分子还应该包括与将要被转化的物种的基因组序列同源的序列。这样使得分离的核酸分子通过同源重组靶向整合入被转化的物种的基因组中。
而且,根据本发明的分离的酸分子可以用于筛选和确定表达促进区域的共有序列。这种共有序列(区域,盒子,它们对于表达促进活性是重要和/或必需的)的筛选在重组DNA技术中是一笔宝贵的财富,特别是对于使用苔藓进行工业生物技术而言。
根据另一个方面,本发明还涉及在真核宿主细胞中表达重组多肽产物的方法,包括以下的步骤:提供了重组DNA克隆载体,该载体包含根据本发明的编码MEPR的分离核酸分子,以及选择性地包含所述重组多肽产物的编码区域,所述的编码序列在所述的宿主中,在所述核酸分子的MEPR的控制下;转化所述的真核宿主细胞,该细胞在天然情况下不含有在所述的MEPR控制下的所述编码序列;在适宜的培养基中培养转化的真核宿主细胞;表达所述的重组多肽以及分离表达的重组多肽。
如以上所述,根据本发明的MEPR原则上具有在各种不同细胞类型中实现组成型表达的能力,真核宿主细胞优选地选自植物细胞,优选是苔藓细胞,特别是小立碗藓细胞。
对于本发明特别优选的系统是在苔藓原丝体培养(原丝体苔藓组织)中培养。为了这样做,将EP 1 206 561 A中描述的方法以及其优选的实施方案在这里明确引用作为参考,它们可以立即用于本发明。
不需要在培养基中加入各种不同的添加物,特别是没有用于特异分化或者促进不同组织生长的添加物使用根据本发明的方法进行多肽的组成型表达是可能的。因此,除了电解质、选择药剂以及培养基稳定剂以外,培养基优选不含有任何额外的添加物用于供给细胞营养。用于稳定转化植物的培养基优选地没有外加的糖类、植物激素或者其混合物。用于瞬时转化的原生质体的培养基优选地没有外加的植物激素。
优选的苔藓细胞为来自以下苔藓的苔藓细胞:立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos,特别是在原丝体培养物中。
根据另外一个方面,本发明还提供了编码MEPR的分离的核酸分子用于工业上制备多肽,特别是用于提供产生所述多肽的重组细胞。工业制备使得可以在生物反应器中大规模制备给定的目标多肽,达到克的量或者更高(商业产量)。这与制备出足够用于研究用(毫克量)或者分析用途(微克量)的制备不同,用于上面两种目的的制备当然也可以按照本发明进行。在瞬时表达系统中足够用于这种分析目的的蛋白质的量可以很容易地使用现有的DNA分子获得。
所以,本发明还包括了使用编码MEPR的分离的核酸分子表达苔藓多肽(所述苔藓多肽的表达在天然情况下不受所述MEPR的控制),特别用于提供表达所述多肽的重组苔藓细胞。这一使用可以在实际中用于研究目的和用于工业规模的苔藓多肽制备。
根据另一个方面,本发明还提供了编码MEPR的分离的核酸分子的用途,用于表达参与特异的翻译后修饰的蛋白(例如糖基转移酶),特别是用于提供表达多肽的重组苔藓细胞,多肽具有的翻译后修饰通常不存在于未转化的苔藓细胞中,或者以另外一个比例存在。
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸分子表达涉及代谢途径的蛋白,特别是用于提供重组苔藓细胞,这些细胞的代谢物例如次级代谢物的含量改变了。
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸分子表达反义分子、siRNA分子或者核酶,特别是用于提供重组苔藓细胞,这些细胞中特异的蛋白质含量减少,导致出现了改变的表型,例如形态上的或者生化上的。
根据另外一个优选的方面,本发明还涉及根据本发明的编码MEPR的分离的核酸分子用于翻译后修饰蛋白的重组表达,特别是用于制备翻译后修饰的蛋白质。有了这样一项技术,就有可能制备翻译后被特异修饰的蛋白质(与在天然宿主细胞中不同),这样使例如植物细胞或者苔藓培养物以例如哺乳动物或者甚至人类的糖基化型式产生蛋白质。应用于特异的糖基转移酶的这种技术的示例在例如WO 00/49153A和WO 01/64901A中有所描述。
根据本发明的编码MEPR的分离的核酸分子的另外一项优选的用途涉及重组蛋白的体外表达。体外翻译技术使重组产物在更加控制的条件下产生,而不需要承担与宿主细胞相联系的不确定性。
根据本发明的核酸分子的另外一项优选的使用是它们用于代谢修饰蛋白质(例如修饰(翻译后)翻译的氨基酸链修饰的蛋白质)的重组表达(参见例如Berlin等人,1994)。
本发明还通过以下的实施例和附图进行阐述,但是不限于这些实施例和附图。
附图:
图1小立碗藓中的β-微管蛋白基因,
图2小立碗藓中β-微管蛋白的表达促进区域分析,
图3通过瞬时转化rhVEGF构建体分析Pptub1的表达促进区域,
图4通过瞬时转化rhVEGF构建体分析Pptub2的表达促进区域,
图5通过瞬时转化rhVEGF构建体分析Pptub3的表达促进区域,
图6通过瞬时转化rhVEGF构建体分析Pptub4的表达促进区域,
图7小立碗藓肌动蛋白基因的基因组结构
图8不同的5′肌动蛋白区域表达活性的比较
图9Ppact 1构建体
图10Ppact5构建体
图11Ppact7构建体
图12Ppact3::vegf构建体
图13Ppact1启动子:5’内含子替代
图14Ppact1启动子:vegf缺失突变体
图15Ppact3启动子:vegf缺失突变体
图16Ppact5启动子:vegf缺失突变体
图17Ppact7启动子:vegf缺失突变体
图18不同苔藓种中的肌动蛋白基因,以及
图19来自小立碗藓和葫芦藓的同源肌动蛋白基因启动子序列的比较
材料和方法
植物材料
以前已经对小立碗藓(Hedw.)B.S.G.进行了性质研究(Reski等人1994)。它是植株16/14的再培养物,植株16/14由H.L.K.Whitehouse在英国Gransden Wood,Huntingdonshire收集,由Enge1进行增殖(1968;Am J Bot 55,438-446)。
标准培养条件
植物在无菌条件下进行纯培养,使用普通的改进Knop无机液体培养基(1000mg/L Ca(NO3)2x 4H2O 250mg/L KCl,250mg/L KH2PO4,250mg/LMgSO4 x 7H2O和12.5mg/L FeSO4 X 7H2O;pH 5.8(Reski和Abe1(1985)Planta 165,354-358)。植物在含有200毫升培养基的500毫升Erlenmeyer摇瓶中培养,或者在含有固化Knop培养基(10g/L琼脂)的9厘米平皿中培养。摇瓶在Certomat R摇床(B.Braun BiotechInternational,德国)上振荡,转速为120rpm。生长温室的条件是25+/-3℃,光-暗周期是16∶8小时。通过提供35μmol/m-2s-1光强的荧光管(Osram L 58W/25)从上方照射培养物。每周进行一次液体培养物的传代培养(subculturing),使用Ultra-Turrax匀浆器(IKA,Staufen,德国)分界后接种与两个新的含有100毫升新鲜Knop培养基的500毫升Erlenmeyer摇瓶中。此外,在去整合后3或4天过滤培养物,然后转移至新鲜的Knop培养基中。
生物反应器培养物分别生长在Knop培养基或者1/10Knop培养基中,在搅拌的玻璃生物反应器(Aplikon,Schiedam,荷兰)中培养,工作体积是5升(如Hohe and Reski,Plant Sci.2002,163,69-74中所描述)。使用船推进式搅拌器(marine impeller)进行搅拌,搅拌速度是500rpm。培养物通入0.3vvm[(通气体积)/(培养基体积)/分钟]的空气。容器25℃的培养物温度通过双水套冷却系统进行控制。50μmol/m-2s-1的光强由荧光管(Osram L 8W/25)提供,光/暗节律是16/8小时。培养物内的pH值(pH 6.5-7.0)不进行调节。
原生质体分离:
用于小立碗藓的分离原生质体的不同的实验方案已有描述(Grimsley等人1977;Schaefer等人1991;Rother等人1994;Zeidler等人1999;Hohe and Reski 2002;Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合:
苔藓组织在Ca(NO3)2含量降低(10%)的Knop培养基中培养7天。在去整合后3或4天过滤培养物,然后转移至新鲜的Ca(NO3)2含量降低(10%)的Knop培养基中。过滤后在0.5M甘露醇中对苔藓的原丝体进行预孵育。30分钟后向悬液中加入4%的崩溃酶(Sigma,Deisenhofen,德国)。崩溃酶溶解于0.5M甘露醇(pH 5.6-5.8)中,3600rpm离心10分钟,通过0.22微米滤器(MillexGP,MilliporeCorporation,美国)过滤除菌。含有1%崩溃酶(终浓度)的悬液在黑暗中室温孵育并且轻微摇动(2小时孵育后得到最好的原生质体产量)。悬液通过100微米和50微米孔径的筛子(Wilson,CLF,Germany)。悬液在无菌的离心管中离心,室温55g(加速3;减速3;Multifuge 3S-R,Kendro,德国)10分钟沉淀原生质体。将原生质体轻轻地重悬于W5培养基(125mM CaCl2x 2H2O;137mM NaCl;5.5mM葡萄糖;10mM KCl;pH 5.6;660-680mOsm渗透压;无菌过滤;Menczel等人1981)中。悬液再次在室温55g(加速3;减速3;Multifuge 3 S-R,Kendro,德国)10分钟沉淀原生质体。再次将原生质体轻轻地重悬于W5培养基中。将少量的悬液转移到Fuchs Rosenthal小室中对原生质体进行计数。
瞬时转化
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991;Reutter and Reski 1996,Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合:
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温55g(加速3;减速3;Multifuge 3S-R,Kendro)10分钟沉淀原生质体。将原生质体重悬于3M培养基(15mM CaCl2x2H2O;0.1%MES;0.48M甘露醇;pH5.6;540mOsm渗透压;过滤除菌,Schaefer等人(1991)Mol Gen Genet 226,418-424)中,浓度为1.2×106个原生质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中,加入50微升DNA溶液(层析柱(Qiagen,Hilden,德国)纯化的DNA,溶于水);加入10-100微升的含有60微克DNA(最佳量)的溶液,最终加入250微升PEG溶液(40%PEG 4000;0.4M甘露醇;0.1MCa(NO3)2;高压灭菌后pH6)。悬液立即轻轻混和,然后在室温下孵育6分钟,不断轻轻混和。加入1,2,3和4毫升的3M培养基对悬液进行连续稀释。悬液在20摄氏度55g(加速3;减速3;Multifuge3S-R,Kendro)离心10分钟。沉淀重悬于400微升3M培养基中。在48孔培养板(Cellstar,greiner bio-one,Frickenhausen)中培养转化的原生质体。瞬时转化在25摄氏度弱光(4.6μmolm-2s-1)下孵育。在24小时和48小时后分别取样,用新鲜培养基替换培养基的一半(200微升)。培养基不完全被替代,因为原生质体必须在液体中保存。取出的培养基(含有重组蛋白)在-20摄氏度储存。用ELISA测量48小时的样品。
稳定转化
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991;Reutter and Reski 1996,Protocol Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合:
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温55g(加速3;减速3;Multifuge 3S-R,Kendro)10分钟沉淀原生质体。将原生质体重悬于3M培养基(15mMCaCl2x 2H2O;0.1%MES;0.48M甘露醇;pH 5.6;540mOsm渗透压;过滤除菌,Schaefer等人(1991)Mol Gen Genet 226,418-424)中,浓度为1.2×106个原生质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中,加入50微升DNA溶液(层析柱(Qiagen,Hilden,德国)纯化的DNA,溶于水);加入10-100微升的含有60微克DNA(最佳量)的溶液,最终加入250微升PEG溶液(40%PEG 4000;0.4M甘露醇;0.1MCa(NO3)2;高压灭菌后pH 6)。悬液立即轻轻混和,然后在室温下孵育6分钟,不断轻轻混和。加入1,2,3和4毫升的3M培养基对悬液进行连续稀释。悬液在20摄氏度55g(加速3;减速3;Multifuge 3S-R,Kendro)离心10分钟。沉淀重悬于3毫升再生(regeneration)培养基中。根据Strepp等人(1998)的描述进行选择步骤。
ELISA
瞬时转化的苔藓原生质体表达的重组VEGF121用ELISA(R&DSystems,Wiesbaden,德国)进行定量。ELISA根据生产商的说明进行。稀释样品用于定量。
细菌菌株和克隆载体
对于所有的克隆和增殖实验使用大肠杆菌菌株Top10(Invitrogen,Karlsruhe,德国)。使用pCR2.1-TOPO(Invitrogen,Karlsruhe,德国),pCR4-TOPO(Invitrogen,Karlsruhe,德国),pZErO-2(Invitrogen,Karlsruhe,德国)或者pRT101(
Figure S04822968920060223D000141
等人(1987),NAR,15,p5890)作为载体克隆DNA片段。
基因组DNA:制备、消化、连接
使用CTAB实验方案(Schlink and Reski,2002)从13天龄的原丝体提取小立碗藓基因组DNA。
用30单位的不同限制性内切酶(例如BamHI,EcoRI,HindIII,KpnI,NcoI,NdeI,PaeI,PagI,XbaI;所有内切酶来自MBI Fermentas,St.Leon-Rot,德国)切割基因组DNA(3-5微克),总体积为30微升,37摄氏度下消化2小时,每一次消化使用一种内切酶。根据供应商的使用手册,用PCR Purification Columns(Qiagen,Hilden,Germany)纯化消化后的DNA(30微升消化产物+200微升PB缓冲液)。使用50微升洗脱缓冲液(EB;Qiagen,Hilden,德国)进行洗脱。在进一步处理以前,用琼脂糖凝胶(0,5%)分析10微升的洗脱物。剩余的DNA使用5单位的T4连接酶(MBI Fermentas,St.Leon-Rot,德国)连接,总体积为300微升,室温连接2小时后再在4摄氏度连接两天。在加酶之前,将连接混合物置于50摄氏度5分钟然后置于冰上,目的是融化黏性的末端碱基配对。加入0.3M  酸钠(pH4.8)用乙醇沉淀并且使用70%的乙醇洗涤沉淀两次以后,重新连接的DNA用200微升的EB重悬。从该重新连接的基因组DNA中取1-3微升用于I-PCR。
RNA制备
在液氮中研磨植物组织,使用E.Z.N.A.Plant RNA Kit(PeqLab)或者RNeasy Plant Mini Kit(Qiagen,Hilden,德国),根据供应商的操作手册提取小立碗藓的总RNA。总RNA用凝胶进行分析,定量(OD260),分别于-20摄氏度或者-80摄氏度保存。
DNA酶处理和第一链cDNA的合成
根据供应商的使用指南用DNA酶(GIBCO BRL)消化1微克的总RNA,总体积为11微升。根据供应商的使用指南使用Oligo dT(12-18)引物和SUPERSCRIPT II RNase H逆转录酶(GIBCOBRL),用4.5微升该DNA酶处理后的总RNA(~400纳克)制备第一链cDNA。得到的cDNA用无菌ddH2O稀释10倍,保存于-20摄氏度。
普通PCR
如果未特殊说明,使用Advantage cDNA Polymerase Mix(BDBiosciences Clontech,Heidelberg,德国)进行PCR。对于所有其他的PCR方法,使用下面的DNA聚合酶:Taq重组聚合酶(MBI Fermentas,St.Leon-Rot,德国),Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,Germany),Platinum Pfx DNA聚合酶(Invitrogen,Karlsruhe,德国)或者TripleMaster PCR系统(Eppendorf,Hamburg,德国)。注册的温度循环仪是Mastercycler梯度PCR仪(Eppendorf,Hamburg,德国)。所有的引物由MWG Biotech AG,Ebersberg,德国合成。根据供应商的使用指南,使用GFX PCR DNA和Gel Band Purification Kit(Amersham Bioscience,Freiburg,德国)进行PCR产物的纯化或者凝胶洗脱。
重组质粒的构建和克隆
基本上按照Sambrook等人(1989),Molecular Cloning:ALaboratory Manual,第二版.Cold Spring Harbor,NY:Cold SpringHarbor Laboratory Press的描述进行通常的分子生物学实验方案。
反向PCR(I-PCR)和巢式PCR
使用0.25微升Advantage cDNA Polymerase Mix和缓冲液(包括3,5mM  酸镁,均来自BD Biosciences Clontech,Heidelberg,德国)、0.2mM每种引物、0.2mM dNTP和1-3微升基因组重新连接产物(参见上面),总体积25微升进行I-PCR。循环条件是:起始步骤96摄氏度2分钟,第二步是96摄氏度20秒,67摄氏度10秒(之后每一个循环降低0.15摄氏度),68摄氏度10分钟,重复35-40次,最后一步是68摄氏度20分钟,然后在程序结束时冷却至4摄氏度。PCR产物从琼脂糖凝胶上洗脱。用30微升进行洗脱。洗脱的PCR产物或者直接克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中或者作为巢式PCR中重新确证的模板。在巢式PCR中,将凝胶洗脱的巢式PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。巢式PCR的循环条件是:起始步骤96摄氏度1分钟,接下来第二步是94摄氏度20秒,56摄氏度10秒,68摄氏度4分钟,重复25次,最后一步是68摄氏度10分钟。
pRT101new的产生,用于克隆扩增的启动子片段
使用Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国)重新扩增pRT101p21(Gorr 1999),使用引物320和321(对于这些引物和所有接下来的引物参见表1)。引物320(正向)从VEGF信号肽的第二个密码子开始(5′-(atg)aac...)。引物321(反向)从35S启动子之前的多克隆位点以内的HincII位点中央开始(5′-gac...)。使用引物321,又引入了一个XhoI位点。PCR产物的重新连接导致35S启动子的丧失和HincII位点的恢复。通过测序确证VEGF基因的序列。这个新的载体被称为pRT101new,用于分别通过XhoI或者HincII位点将表达促进区域克隆到报告基因之前。
测序
所有的测序反应由SEQLAB Sequence Laboratories,Goettingen,德国进行。
软件
使用Sci Ed Central,Clone Manager Suite用于引物设计、二重以及多重序列比对。使用Lasergene,DNASTAR(第五版)Megalign和SeqMan分析测序数据。使用BLAST 2(Altschul等人,1997)进行同源性搜索。
实施例
通过4个苔藓表达促进区域的实施例阐述本发明:第一个,小立碗藓各种不同的微管蛋白家族成员表达促进区域的分离和分析。在第二个实施例中提供了来自多个不同苔藓的肌动蛋白基因家族的表达促进区域。第三和第四个实施例涉及泛素的表达促进区域以及RBCS表达促进区域。
实施例1:小立碗藓β微管蛋白基因及其表达促进区域的克隆和分析
概述
为了从小立碗藓(Pp)中得到β微管蛋白(tub)的调控/启动子序列,第一步通过聚合酶链式反应(PCR)分离出β微管蛋白同源物的编码序列。为此使用了所有9个发表的拟南芥的β微管蛋白基因组序列(Attub1-9)的比对设计高度保守编码区内的引物(8F,9F和10R;对于这些引物和接下来的所有引物参见表1)。此外,还使用了小立碗藓公共EST数据的序列信息,但是只有三个显示了与β微管蛋白的同源性。使用其中一个设计了预测的编码区上游的基因特异的引物(F7)。对使用提及的引物得到的所有克隆的PCR产物以及EST数据进行序列对比得到3组克隆,这3组克隆的DNA序列在组内是相同的,但是在组间不同,主要(但是不仅仅)是由于内含子的差异。这些β微管蛋白直向同源物(orthologues)被分别命名为Pptub 1,Pptub 2和Pptub 3。
而且,由于在项目进行当中有更多的EST数据(在2002年初在NCBI/dbEST中有50000以上的新条目),所以对所有121个小立碗藓中与β微管蛋白有高度相似性的EST进行了详细的分析,得到了三个新的上游和三个下游EST组,各组序列在组内是相同的但是组间不同且不同于任何其他组,与Pptub 1-3也不同。对每个新的组使用来自预测的非编码上游和下游区域的引物进行PCR(参见下面)并且改变所有引物组合的次序,确定了相应的上游和下游组与特定的基因座(分别命名为Pptub 4,Pptub 5和Pptub 6)之间的联系。克隆所有三个新的基因座的基因组和cDNA扩增产物并且测序,这将小立碗藓中β微管蛋白直向同源物的数目增加到6个。
与Pptub5和6相反,Pptub 1到4在EST数据库中出现得更为频繁。主要使用原丝体和年轻得配子托的RNA制备了相应的cDNA文库。因此,对于这四个基因,根据获得的序列数据,进行反向PCR(I-PCR)方法以获得在基因组上这些序列周围的区域。
Pptub 1
如第一步中已经提到的,使用小立碗藓基因组DNA和引物8F和10R进行两次独立的PCR,克隆Taq(MBI Fermentas,St.Leon-Rot,Germany)PCR片段。对两个PCR中分别得到的一个(2-1)和两个(8-1,8-2)克隆进行部分测序,发现它们的序列是相同的。将相应的基因座命名为Pptub 1。
使用这一初步的序列信息设计引物以进行基因组步移,对重新连接的EcoRI和HindIII基因组消化产物使用I-PCR方法(引物35,36)得到Pptub1的包围区域。通过巢式PCR(引物40,38)对产物进行重新确证。巢式PCR产物PCR产生的两个克隆(E#1和H 1.7)进行完全测序。
Hind III克隆H1.7不含有内部的HindIII位点,很有可能是由于酶的星活性或者是随机双链断裂的连接。但是通过两次独立的基因组DNA PCR(引物113,67和113,90)对第一个EcoRI位点上游的序列进行了确证。此外,克隆了另外一个cDNA PCR产物(引物89,91;Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国))。
所有提及的克隆帮助产生和重新确证了序列数据。总共得到了起始密码子上游~1500bp和终止密码子下游~1500bp的序列。
Pptub 2
如以上已经提到的,使用小立碗藓发表的EST序列信息设计预测编码区域上游基因特异的引物(F7)。对小立碗藓基因组DNA的PCR(引物F7,10R)以及接下来PCR产物的克隆和测序证明了,该PCR产物以及所有三个迄今发表的Pptub EST(Pptub EST 1-3)都属于一个基因座,命名为Pptub2。可以通过比较EST与基因组序列证实内含子的位置。
使用这一初步的序列信息设计内含子内的基因特异引物(引物95和71)以进行Pptub2相邻基因组区域的基因组步移,对重新连接的Pag I,BamH I和Nde I基因组消化产物使用I-PCR方法。通过巢式PCR(引物38,35)对PCR产物进行重新确证。巢式PCR产物产生的两个克隆(C#2Pag和D#2Nde)进行完全测序。Nde I克隆D#2不含有内部的NdeI位点,很有可能是由于酶的星活性或者是随机双链断裂的连接。但是使用C#2Pag和第三个I-PCR克隆(95#8BamHI;引物149和71)确证了序列数据。此外通过两次独立的基因组DNA PCR(引物205,149;Taq(MBI Fermentas,St.Leon-Rot,德国)和引物205,206)确证了产物的长度。克隆了205-206PCR产物和另外的基因组下游PCR产物(引物71,206;Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国))并且帮助证实了序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~1400bp和终止密码子下游~1400bp的序列。
Pptub 3
如第一步中已经提到的,使用小立碗藓基因组DNA和cDNA以及引物9F和10R进行两次独立的PCR,克隆Taq(MBI Fermentas,St.Leon-Ro t,Germany)PCR片段。从两个PCR中分别得到的克隆(#3-3基因组得到的克隆,#4-3cDNA得到的克隆)进行部分测序,发现它们的序列是相同的。将相应的基因座命名为Pptub 3。
使用这一初步的序列信息设计内含子内的基因特异引物(引物69和70)以进行Pptub 3相邻区域的基因组步移,对重新连接的Pag I和Nco I基因组消化产物使用I-PCR方法。通过巢式PCR(引物38,35)对PCR产物进行重新确证。产生的两个克隆(A#1Nco和#4-1Pag)进行完全测序。A#1Nco是巢式PCR产物(38,35)产生的克隆而#4-1PagI是开始I-PCR产物(69,70)产生的克隆。此外克隆了基因组PCR产物(引物203,204)帮助证实序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~1900bp和终止密码子下游~1100bp的序列。
Pptub 4
已经提到,对于Pptub 4使用EST数据设计基因特异的上游和下游引物(297,299)得到基因组和cDNA克隆。使用天然Pfu聚合酶(MBI Fermentas,St.Leon-Rot,德国)得到的其他基因组克隆帮助证实序列数据。
将引物297和299反向(337,383)用于进行Pptub 4相邻基因组区域的基因组步移,对重新连接的Nde I和NCo I基因组消化产物使用I-PCR方法。产生了两个克隆(48#2Nco和A02#3Nde)以及另外的基因组克隆(引物547和374;Advantage cDNA Polymerase Mix(BDBiosciences Clontech,Heidelberg,德国)和Triple Master(Eppendorf,Hamburg,德国))。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~2300bp和终止密码子下游~1100bp的序列。
Pptub 5和6
已经提到,对于Pptub 5和6使用EST数据设计基因特异的上游和下游引物(Pptub 5:298,300和Pptub 6:296,336)得到每一个基因的基因组和cDNA克隆。对于Pptub 5使用天然Pfu聚合酶(MBIFermentas,St.Leon-Rot,德国)得到的其他基因组克隆帮助证实序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了Pptub 5的2031bp基因组序列和Pptub 6的3161bp基因组序列。
克隆策略
使用Taq重组聚合酶产生了最初的Pptub 1(2-1,8-1,8-1;所有都是基因组的)和Pptub 3(3-3基因组的,4-3cDNA的)克隆。将PCR产物连接到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。PCR的条件是:2.5单位的Taq重组聚合酶,酶缓冲液,3.3mMMgCl2(所有均来自MBI Fermentas,St.Leon-Rot,德国),0.4mM每一种引物,100纳克cDNA或者基因组DNA作为模板,总体积是25微升。循环条件是:起始步骤95摄氏度5分钟,然后是第二步95摄氏度45秒,60摄氏度(引物8F)或者65摄氏度(引物9F)10秒,72摄氏度1分钟,重复30-35次,最后一步是72摄氏度5分钟,然后在程序结束时冷却至4摄氏度。
所有其他的基因组和cDNA克隆是
Pptub 1:113-67113-90,89-90,89-91cDNA
PDtub 2:F7/R10205-206,71-206
PDtub 3:203-204
Pptub 4:547-374(+TrippleMaster),297-299cDNA+基因组(+Pfu)
Pptub 5:298-300cDNA+基因组(+Pfu)
Pptub 6:296-336cDNA+基因组
以上加下划线的克隆使用Advantage cDNA Polymerase Mix产生,每20微升PCR体系使用0.25微升酶混合物,缓冲液(包括3,5mM乙酸镁,都来自BD Biosciences Clontech,Heidelberg,德国),0.25mM每一种引物,0.25mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度10秒和68摄氏度2分钟每kb,重复35-40次,最后一步是68摄氏度15分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。
所有其他的克隆,同两个其他的基因组克隆297-299和298-300一样,使用Pfu天然聚合酶聚合酶,每20微升PCR体系使用0.3微升聚合酶(=0.75单位),缓冲液,2-4mM硫酸镁(所有均来自MBIFermentas,St.Leon-Rot,德国),0.25mM每一种引物,0.2mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度10秒和72摄氏度2分钟每kb,重复35-40次,最后一步是72摄氏度10分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到经EcoRV线性化的pZErO-2(Invitrogen,Karlsruhe,德国)中。
使用TripleMaster PCR系统产生了另外一个克隆547-374,每20微升PCR体系使用0.25微升聚合酶混合物(=1.25单位),调整缓冲液(包括2.5mM Mg2+,均来自Eppendorf,Hamburg,德国),0.2mM每一种引物,0.2mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度20秒和72摄氏度3分钟,重复40次,最后一步是72摄氏度10分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。
总之,对小立碗藓基因组DNA的PCR和PCR产物的克隆产生了6个转录的小立碗藓β微管蛋白基因的序列信息。此外,使用了EST和cDNA数据确证了基因组序列数据和内含子/外显子的边界。对于Pptub1到4,反向PCR得到了未转录的5′和3′包围的基因组序列。所有6个基因组区域的一般概括在图1中给出。
基因结构和保守
已经强调了,Pptub 1到4在EST数据库中出现得最多。此外,它们对应的EST中多数来自全长的cDNA文库。这两个事实帮助计算机(in silico)确定Pptub 1到4的转录起始位点(TSS)。5′EST与相应的上游基因组区域的多重比对显示Pptub 1到3的确具有精确的转录起始:27个Pptub 1 5′EST中的20个,20个Pptub 2 5′EST中的16个以及14个Pptub 3 5′EST中的9个都在相同的最上游位置开始,标记为+1(图3-6)。此外所有三个TSS均被共有序列包围(参见下面)。对于Pptub 4而言,23个5′EST表明在100bp以内有多个TSS。最上游的5′EST的起始位点被确定为+1。
3′EST与相应的下游基因组区域的类似多重比对重新确证了植物基因几乎总是携带一个以上poly(A)位点,且该共有序列不象在例如哺乳动物基因中那样非常明确,在哺乳动物中序列AAUAAA几乎是遍布的(综述参见Rothnie等人,1996)。
六个克隆的小立碗藓基因座没有显示任何无义终止密码子而且可以预测与已知β微管蛋白具有高度相似性的适当蛋白。一般在编码区域以外相似性立即并且显著下降。考虑到5′的可能调控元件,对所有4个上游区域进行详细比较后发现在基因家族内部或者没有整体的保守性,或者与其他已知的植物β微管蛋白基因的5′区域也没有保守性。但是可以在基因家族内部检测到一些有趣的保守性匹配。
a)Pptub 1到3中确定的TSS在所有三种情况下都属于共有序列T/C C A(+1)G/C T G T G C,且它们被包含在富含C/T的区域内(与plantProm数据库,网址为http://mendel.cs.rhul.ac.uk/mendel. php?topic=plantprom中171个无关的TATA植物启动子的共有序列T/C C A(+1)N M N比较)
b)Pptub 1到3中可以发现在TSS上游22-24bp--这处于植物TATA启动子的典型距离内(参见plantProm数据库)--有一个弱的8bp TATA盒子,位于一个保守的20-25bp一段序列内部。来自171个无关的植物启动子的TATA盒子共有序列是:T96 A95 T96 A100 A62/T38 A97T61/A38 A73(参见plantProm数据库),对于Pptub 1到3,共有序列是T t T A T c T c/t/A,大写字母表示与共有序列有关。
c)所有四个基因在它们的5′UTR中确实有非常低水平(9-16%)的腺嘌呤。
d)Pptub 4的5′UTR C/T总含量达到74%,此外在最短、最靠下游的5′EST的起始点之后还含有一个C/T一段序列(约50bp)。
e)Pptub 2在TSS上游450bp附近(-450到-489)含有一个40bp的polyA一段序列
f)Pptub1和4上游大约-420位置处开始了非常富含A/T的区域(Pptub 1在大约900bp中有80%以上的A/T;Pptub4 1750bp中有75%的A/T,使得该基因上游可能存在骨架/核基质附着区(S/MARs;(Liebich等人,2002)。
β微管蛋白启动子的功能性鉴定和定量
在瞬时表达系统中使用非再生的小立碗藓原丝体作为表达系统对Pptub 1到4的可能5′调控序列进行功能定量,确定提供最大启动子活性的最小启动子片段。对于每一个启动子将几个包括了上游区域和5′UTR的不同长度的构建体准确地置于报告基因的起始密码子之前。作为报告基因,人蛋白质(重组人血管内皮生长因子121:rhVEGF121;Gorr 1999)通过其自己的信号肽被分泌到培养基中。rhVEGF121在苔藓培养物上清中的量使用ELISA进行定量,它反应了系统中启动子或者启动子片段的强度。数值与使用35S启动子得到的数值相联系。每一个构建体在两到三次不同的转化实验中转化最少6次。分别在24小时和48小时后取样,48小时的样品进行适当稀释用ELISA测定两次。结果的总结在图2中给出。
Pptub 1到4的表达促进区域被公开为序列编号1到8。
将Pptub 1到4的扩增启动子片段克隆到pRT101 new中
Pptub 1:1-0(引物364XhoI,363cat)
1-1(引物219XhoI,363cat)
1-3(引物549XhoI,363cat)
1-4(引物226XhoI,363cat)
1-5(引物550XhoI,363cat)
Pptub 2:2-0(引物291,225cat)
Pptub 3:3-0(引物292,223cat)
Pptub 4:4-0(引物373XhoI,374cat)
4-1(引物548XhoI,374cat)
以上给出的启动子片段使用Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国)用基因组DNA扩增,使用从ATG起始密码子反向互补序列开始的反向引物(cat...)以及部分的含有XhoI位点的正向引物。PCR产物使用XhoI切割并连接入XhoI/HincII中或者不进行切割连接入用HincII打开的pRT101new中。产生的克隆通过测序进行证实。克隆1-2(XhoI/EcoRI),2-1(BglII),2-2(SalI),2-3(EcoRI/SalI),2-4(EcoRI/SalI),3-2(SalI),3-3(Eco147I/HincII),3-4(XhoI/SalI)通过从长克隆内部进行删除而得到。剩余的载体通过凝胶洗脱并且重新连接。如果单链凸出末端不相匹配的话,在根据供应商的使用手册使用Klenow片段(MBI Fermentas,St.Leon-Rot,德国)填平3′凹进端之后进行连接。
Pptub 1
将六个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。所有构建体的数据在图3中给出。(5′UTR=+1(TSS)到+226,+227=ATG)
1-0    -1307bp(Pptub 15′区域1533bp)
1-1    -985bp(Pptub 15′区域1211bp)
1-2    -416bp(Pptub 15′区域642bp)
1-3    -248bp(Pptub 15′区域474bp)
1-4    -83bp(Pptub 15′区域309bp)
1-5    -71bp(Pptub 15′区域297bp)
启动子片段1-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(将其设定为100%)相比,表达率是其大约150%。注意最小启动子片段1-2的上游开始了长的非常富含A/T的区域(在近900bp中有80%以上的A/T)。
Pptub 2
将五个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。所有构建体的数据在图4中给出。(5′UTR=+1(TSS)到+122,+123=ATG)
2-0    -1075bp(Pptub 25′区域1197bp)
2-1    -676bp(Pptub 25′区域798bp)
2-2    -425bp(Pptub 25′区域547bp)
2-3    -245bp(Pptub 25′区域367bp)
2-4    -67bp(Pptub 25′区域189bp)
启动子片段2-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(100%)相当。
Pptub 3
将长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。四个构建体的数据在图5中给出。(5′UTR=+1(TSS)到+112,+113=ATG)
3-0    -1274bp(Pptub 35′区域1386bp)
3-2    -765bp(Pptub 35′区域879bp)
3-3    -272bp(Pptub 35′区域384bp)
3-4    +52bp(Pptub 35′区域60bp)
启动子片段3-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(将其设定为100%)相比,表达率是其大约300%。
Pptub 4
将两个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。数据在图6中给出。(5′UTR=TSSs(+1到+103)到+205,+206=ATG)
4-0    -419bp(Pptub 45′区域624bp)
4-1    -1bp(Pptub 45′区域206bp)
启动子片段4-1提供的表达率是使用与35S启动子得到的表达率(将其设定为100%)的大约250%。注意该最小启动子片段(4-0)的上游开始了长的非常富含A/T的区域(在1750bp中有75%的A/T)。
总之,对Pptub 1到4的基因组上游区域的瞬时启动子活性进行了研究。确定了显示最大启动子活性的最小启动子片段,它们的表达率最高可达35S启动子产生的活性的3倍。
Pptub构建体总结(还请参见:序列表)
Pptub1上游
-1533至-1(+1=起始密码子)
-1533至-644=81%AT
-1533VEGF 1-0(引物364)
-1211VEGF 1-1(引物219)
-642VEGF 1-2(EcoRI/XhoI)
-474VEGF 1-3(引物549)
-309VEGF 1-4(引物226)
-297VEGF 1-5(引物550;无推定的TATA盒子:-304至-295)
-226TSS(5′UTR开始)
Pptub1下游
1至1539(1=终止密码子之后)
332最长的EST结束(3′UTR)
1539引物90的开始
Pptub2上游
-1197至-1(+1=起始密码子)
-1197VEGF 2-0(引物291)
-798VEGF 2-1(BglII)
-547VEGF 2-2(SalI)
-450至-489=poly A 序列
-367VEGF 2-3(EcoRI/SalI)
-189VEGF 2-4(XhoI/SalI)
-122TSS(5′UTR开始)
Pptub2 下游
1至1012(1=终止密码子之后)
297最长的EST结束(3′UTR)
1012引物206开始
Pptub 3上游
-1386至-1(+1=起始密码子)
-1386VEGF 3-0(引物292)
-879VEGF 3-2(SalI)
-384VEGF 3-3(Eco147I/HincII)
-112TSS(5′UTR的开始)
-60VEGF 2-4(XhoI/SalI)
Pptub 3下游
1到997(1=终止密码子之后)
203最长的EST结束(3′UTR)
1012引物204开始
Pptub4上游
-624至-1(+1=起始密码子)
-624VEGF 4-1(引物373)
-206VEGF 4-2(引物548)
-205至-103TSS的区域(5′UTR的开始)
-55至-93CT序列
Pptub4下游
1至1146(1=终止密码子之后)
466最长的EST结束(3′UTR)
1141至1164NcoI
实施例2来自不同苔藓种的肌动蛋白基因及其表达促进区域的克隆和分析
2.1小立碗藓肌动蛋白基因的基因组结构
已经从藓类小立碗藓中分离了四个肌动蛋白基因和启动子区域,从藓类葫芦藓和苔类地钱中分离了三个肌动蛋白基因和启动子区域,构建表达载体用于苔藓中。
使用根据公共数据库中的立碗藓属EST序列设计的特异寡聚核苷酸,通过几轮反向PCR从基因组中分离出了四个肌动蛋白基因(Ppact1,Ppact3,Ppact5和Ppact7)并且测序。
在立碗藓属中分离的基因中的一个(Ppact1)其结构类似于高等植物肌动蛋白基因的保守结构组织。未翻译的前导肽被一个较长(955bp)的内含子打断,该内含子位于起始密码子ATG上游14核苷酸处。编码区域具有三个较小的内含子,它们的位置与其他植物物种肌动蛋白内含子的位置相同。第一个内含子位于密码子20(lys)和21(ala)之间,第二个内含子将密码子152(gly)分开,第三个内含子在密码子356(gln)和357(met)之间。这一一般结构与三个其他的立碗藓属肌动蛋白基因(Ppact3,Ppact5,和Ppact7)看起来不同。在那三个基因中,5′UTR内含子(分别是434bp,1006bp和1055bp)也位于ATG前14核苷酸处,但是编码区域只被一个位于密码子21(lys)和22(ala)之间的内含子打断(图7)。
2.2肌动蛋白基因表达促进区域的活性研究
为了研究不同立碗藓属肌动蛋白表达促进区域(序列编号5到8)的活性以及不同基因5′UTR的作用,设计了不同的载体,在所研究的5′区域控制下表达hVEGF蛋白。
从基因组DNA中通过反向PCR分离转录起始位点上游大约2kb的基因组区域并且测序,构建含有由启动子引导的人VEGF cDNA以及包括5′内含子的准确前导序列的载体,用于瞬时转染苔藓的原生质体。通过校对PCR扩增出完整的5′表达促进区域,使用的引物是395和332用于Ppact1,408和333用于Ppact3,511和334用于Ppact5,以及413和335用于Ppact7。
对于每个待测构建体使用相同数目的分子转化原生质体,同时做一个对照实验,转化携带在CaMV 35S启动子控制下的hVEGF cDNA的构建体。hVEGF蛋白在N端含有26个氨基酸的信号肽,它使得重组蛋白被分泌到培养基中。原生质体转化后孵育48小时后取不同稀释度的原生质体培养基,用ELISA对转化进行分析。
不同的立碗藓属5′肌动蛋白区域引导表达的能力与组成型的35S启动子的活性进行比较。
在所有分析的情况中,肌动蛋白基因的5′区域都比35S启动子的活性高。但是表达水平随不同的肌动蛋白调控序列而有所差异。这样,Ppact3的5′序列只能将VEGF的表达相对于35S启动子提高大约2倍。当含有Ppact1和Ppact7 5′区域的载体用于转化时,测量出了更高水平的VEGF。在那些情况下得到了4-8倍相当于35S的数值。但是在使用Ppact5基因的5′区域时观察到了最显著的差异,在某些情况下,得到了与35S的表达相比高出11倍的表达(图8)。
为了进一步研究高活性的立碗藓属肌动蛋白基因5′UTR的功能,制备了含有5′UTR内含子删除、组合和替代的载体,用于苔藓原生质体的瞬时表达分析。
与使用完整Ppact1 5′区域的表达相比,Ppact1 5′内含子的删除显著降低了瞬时表达的水平。在这种情况下,在原生质体培养基中检测到的分泌出的VEGF蛋白的量非常接近于通过CaMV 35S启动子得到的表达量。这表明Ppact1 5′内含子对于基因从Ppact1启动子的有效表达是必不可少的。当包含前导内含子的5′UTR与35S启动子的下游融合时得到了相同的结果。这一构建体与完整的35S启动子产生了相同量的分泌蛋白,表明5′UTR区域对于非Ppact1启动子的其他启动子的活性没有任何显著的影响。重要的是表明仅仅携带Ppact15′UTR区域的构建体比35S启动子对促进蛋白产生减少了30%。这可能提示在该基因的这个区域具有小的启动子活性,或者剩余的启动子活性存在于载体的主链序列中(图9)。
使用相同的方法研究Ppact5和Ppact7基因中含有的5′UTR区域对启动子活性的影响。分析了5′内含子被删除的构建体,它们得到了与Ppact1相似的结果,即对于Ppact5而言得到的蛋白质量与使用35S启动子得到的蛋白质量大致相同,且对于Ppact7而言得到的蛋白质量还要低一些,表明在5′UTR中内含子的存在对于启动子的有效活性是必不可少的。同样,使用只含有5′转录区域至ATG的构建体进行了转化,也观察到了一些残余的促进活性。而且,对于这两个基因,5′UTR与35S启动子下游的融合,与单独使用35S启动子相比使VEGF蛋白产生了更高的表达率(2到7倍)(图10,11)。对于Ppact3观察到了相似的结果,使用5′UTR自身或者与CaMV 35S的下游融合分别产生相对于35S两倍和三倍的表达(图12)。这些结果提示在这三个基因的5′转录区域中存在增强子的活性,即使将它们置于一个不同的启动子之下。
为了进一步研究Ppact1,Ppact5和Ppact7基因中存在的5′内含子的作用,使用Ppact5和Ppact7的5′内含子替换Ppact1基因的前导内含子,在载体中进行工程操作,用于瞬时转化。同时用Ppact1基因的编码区中存在的内含子替代Ppact1 5′内含子。
用Ppact1基因编码区中的内含子1和3替代Ppact1 5′内含子导致表达水平降低了大约25%。但是检测出的蛋白表达量仍然比使用CaMV 35S启动子的表达高大约2-3倍。奇怪的是,使用编码区的内含子2代替5′内含子使得启动子丧失了活性(图13)。但是在检查了构建体的序列之后,发现内含子的拼接位点不正确。制备了携带正确拼接序列的新构建体,在苔藓转化之后表明内含子2的作用与其他的替代相同。
使用对应于Ppact5和Ppact7基因的5′内含子进行替代,也观察到了蛋白质表达的降低,但是这时降低的程度略小。
2.3.肌动蛋白基因表达促进区域的缺失构建体
制备了肌动蛋白基因启动子的5′未转录区的缺失构建体,通过将这些构建体瞬时转化苔藓原生质体对其进行分析,进一步研究不同肌动蛋白基因启动子的特点。
这样对于Ppact1,制备了携带转录起始(+1)上游不同基因组区域长度(-1823bp,-992bp,-790bp,-569bp,-383bp,-237bp,和-82bp)的构建体。原理上除了-82bp的构建体以外,所有的构建体都应该具有完全的启动子活性。但是-383bp构建体表现出活性的下降,其活性与-82bp构建体达到了相似的水平(图14)。
对Ppact3启动子区域的缺失构建体进行分析发现了一些有趣的特征。如以上所描述的,该启动子与其他肌动蛋白基因启动子比较活性较低,尽管与CaMV 35S启动子相比它的活性略高。这里对下面的5′未转录区域进行检测:-2210bp,-995bp,-821bp,-523bp,-323bp,-182bp和-81bp。奇怪的是构建体中含有启动子区域直至-821bp时,启动子的活性与CaMV 35S启动子的活性大致相同。而含有从-523开始直至转录起始更短区域的构建体产生两倍量的重组蛋白。这可能表明在瞬时转化试验中(图15)位于-523bp上游的顺式作用区域下调了该基因的转录。
对于Ppact5,制备了含有该基因转录起始上游-1872bp,-758bp,-544bp,-355bp,和-121bp片段的构建体。从瞬时试验得到的结果表明启动子的完全活性位于转录起始(+1)的-758和-121之间的区域(图16)。
对以下的Ppact7基因5′未转录区域的缺失构建体进行分析:-1790bp,-1070bp,-854bp,-659bp,-484bp,-299bp,和-66bp。得到的结果表明在-484bp和-299bp之间包含的区域对在瞬时试验分析中启动子的完全活性是必需的(图17)。
为了得到一套立碗藓属肌动蛋白基因的异源启动子,使用另外两个种藓类葫芦藓和苔类地钱分离含有肌动蛋白基因的基因组DNA片段。为此,设计具有不同程度简并性的寡聚核苷酸,使用来自两个种的基因组DNA作为模板进行PCR反应。
2.4来自不同苔藓种小立碗藓、葫芦藓和地钱的不同肌动蛋白基因的比较
小立碗藓
从小立碗藓中分离的四个不同的基因组肌动蛋白序列可能代表了该基因的全部功能性序列,包括5′启动子序列,5′UTR+5′内含子,ORF+内部的内含子以及3′UTR和进一步的3′下游序列。总共分离了Ppact1 5809bp,Ppact3 5633bp,Ppact5 8653bp以及Ppact7 6351bp的基因组序列(图18A)。除了Ppact1的ORF是1134bp以外,分离的立碗藓属肌动蛋白cDNA的编码区域几乎全部都是1137bp长。相对应的蛋白质是378个氨基酸长,Ppact1具有377个氨基酸。在核苷酸水平上编码序列之间的同源性在86.6%到98.9%之间。蛋白质序列的相同性在97.1%和99.7%之间(DNA STAR,MegAlign程序,ClustalV(加权)序列比对软件)。
对于所有四个立碗藓属肌动蛋白基因可以通过反向PCR分离ATG起始位点5′的延伸基因组DNA序列并且进行测序:Ppact1 2973nt,Ppact3 3091nt,Ppact5 3095nt,Ppact7 3069nt。对于Ppact1,Ppact5和Ppact7使用Gene Racer Kit(Invitrogen)进行5′RACE(它只扩增全长的cDNA)确定基因的5′UTR。对于Ppact3,通过数据库中不同EST的长度确定5′UTR。通过比较cDNA与基因组的反向PCR片段,可以显示大的5′内含子的存在。对于Ppact1,Ppact3,Ppact5和Ppact7,所有位于-14位置到ATG起始密码子的5′内含子的长度分别是955bp,434bp,1006bp和1055bp(图18A)。通过比较基因组序列和衍生的蛋白质序列以及来自拟南芥肌动蛋白基因的cDNA序列和蛋白质序列,确定ORF内部的内含子的位置。现有的立碗藓属肌动蛋白基因的5′启动子序列分别有:Ppact1 1824nt,Ppact3 2270nt,Ppact5 1909bp,Ppact7 1805bp(图18A)。
通过对基因组DNA的简并PCR从葫芦藓中总共发现了4个不同的肌动蛋白基因(表达促进区域:序列编号9至12),从地钱中总共发现了3个不同的肌动蛋白基因(表达促进区域:序列编号13至15)。因为目的主要是从不同的苔藓种中分离可能的不同肌动蛋白基因同源物的5′启动子区域,至今为止3′端的大多数序列还是不完整的。(图18B/C)。
葫芦藓
对于葫芦藓属,发现的肌动蛋白基因被命名为Fhact1,Fhact4.4,Fhact5和Fhact5b。通过反向PCR可以分离的不同肌动蛋白基因的基因组序列有:Fhact1 3951bp,Fhact4.4 2417bp,Fhact5 4432bp和Fhact5b 722bp。对于编码序列为1134个核苷酸的Fhact1基因,可以分离完整的编码cDNA序列。对于其他的葫芦藓属肌动蛋白基因目前有部分的序列,没有3′端:Fhact4.4 906bp,Fhact5 965bp以及Fhact5b 722bp(图18B)。分离的编码序列具有的同源性范围在核苷酸水平上是87.4%到99.2%。得到的蛋白质序列有90.8%到99.2%是相同的(DNA STAR,MegAlign程序,ClustalV(weighted加权)序列比对软件)。
除了Fhact5b以外,可以通过反向PCR分离ATG起始密码子5′上游的序列并且测序。已有的序列有Fhact1 1824bp,Fhact4.41333bp,Fhact5 3289bp。使用Gene Racer Kit(Invitrogen)进行5′RACE确定不同5′UTR的长度。通过比较cDNA序列和反向PCR获得的基因组序列以及与立碗藓属的基因比较确定内含子-外显子的结构。对于立碗藓属肌动蛋白基因而言,发现的葫芦藓属肌动蛋白基因含有大的5′内含子,它们位于cDNA的-14位置上,其长度对于Fhact1 Fhact4.4和Fhact5分别是928bp,1015bp和656bp。至今为止已经分离并且测序了Fhact1 700bp,Fhact4.4 145bp以及Fhact5 2515bp的5′启动子序列。对于Fhact1分离了419bp的3′区域。葫芦藓属肌动蛋白基因的5′区域和3′区域通过葫芦藓基因组DNA的PCR产生,使用的引物是:Fhact1 5′区域:引物908和909;Fhact1 3′区域:引物983和984;Fhact4.4 5′区域:引物1000和1001;Fhact5 5′区域引物611和612。
地钱
发现的地钱属的肌动蛋白基因被命名为Mpact1,Mpact4和Mpact15。所有3个序列都缺少3′端。至今为止分离并且测序的序列有:Mpact1 2229bp,Mpact4 3987bp以及Mpact15 2174bp的基团组序列。对于Mpact1,Mpact4和Mpact15分离的编码cDNA序列分别有997nt,962nt和995nt(图18C)。与另外两个苔藓种相比,地钱属肌动蛋白基因内的序列同源性略微低一些,在核苷酸水平上介于78.3%和85.5%之间,在氨基酸水平上介于94.7%和96.1%之间(DNASTAR,MegAlign程序,ClustalV(加权)序列比对软件)。对于所有三个鉴定出的不同的地钱属肌动蛋白基因都通过反向PCR分离了ATG的5′上游序列并且进行了测序:Mpact1 937bp,Mpact4 3025bp以及Mpact15 910bp。地钱属肌动蛋白基因同源物的5′区域通过地钱基因组DNA的PCR产生,使用的引物是:对于Mpact1的5′端使用引物950和951,对于Mpact4使用引物960和961,对于Mpact15使用引物970和971。通过比较来自不同苔藓种的不同肌动蛋白基因序列得到了ORF的内含子外显子结构。分离的Mpact1的5′序列显示在-14位置具有内含子拼接位点的共有序列(aggt),表明与其他立碗藓属和葫芦藓属基因一样存在5′内含子。在Mpact4和Mpact15的5′上游序列中不存在内含子拼接位点共有序列,提示没有5′内含子(图18C)。
小立碗藓、葫芦藓和地钱肌动蛋白基因的比较
如上面提到的,一般情况下来自一个物种内的不同分离肌动蛋白基因的核苷酸和蛋白质序列的同源性非常高,特别是在蛋白质水平上。关系非常密切的两个苔藓种小立碗藓和葫芦藓之间的同源性也非常高。在核苷酸水平上肌动蛋白基因显示的同源性在86.9%到96.3%之间的相同性,而在氨基酸水平上的同源性范围在95.5%到99.7%之间。
相反苔类植物地钱与其他两个种之间更远的关系从在核苷酸水平上基因更低的同源性上可以反映出来。立碗藓属和地钱属肌动蛋白基因之间的同源性范围只有75.2%到78.8%之间而葫芦藓属和地钱属之间的同源性范围是75.5%到80.4%。在氨基酸水平上,地钱属肌动蛋白基因与立碗藓属相比同源性在93.0%到96.1%之间,与葫芦藓属相比同源性在93.4%到96.7%之间。
内含子-外显子结构(图18A/B/C)
如前面所表明的,立碗藓属肌动蛋白基因的内含子-外显子结构与高等植物内含子-外显子结构有一定程度的相似性但是仍然有明显的差异。所有分离的立碗藓属基因都在5′未翻译区域含有一个大的5′内含子,这也是几乎所有被研究的高等植物肌动蛋白基因所具有的。只有Ppact1在ORF中含有3个内部内含子,反映了例如所有拟南芥分离肌动蛋白基因的情况。Ppact1 ORF内部的内含子位置与高等植物肌动蛋白基因相比也是保守的。相反Ppact3,Ppact5和Ppact7在ORF中只含有一个内部内含子。
在分离的葫芦藓属肌动蛋白基因中可以发现相同的基因组结构,在5′UTR中有一个延伸的5′内含子。Fhact1与Ppact1有相同的保守内含子-外显子结构而Fhact4.4和Fhact5在ORF序列中只含有一个内部内含子。分离的Fhact5b序列太短,所以关于它的内含子-外显子结构不能看得很清楚,但是与Fhact1或者Ppact1相比它至少不含有内部内含子2。
在地钱属中分离肌动蛋白基因的基因组结构看起来更为不同。重要的是表明在三个不同苔藓种中不同肌动蛋白基因的数目还不知道,有可能从地钱属中分离出的三个肌动蛋白基因不代表独立的有功能的同源基因。有可能在地钱属中存在三个以上的肌动蛋白基因,在立碗藓属和葫芦藓属中存在四个以上的肌动蛋白基因。
但是Mpact1的内含子外显子结构看起来与Ppact1和Fhact1的结构相同,5′UTR中有一个5′内含子以及ORF内部内含子1和2的保守位置。Mpact15还含有保守的ORF内部内含子1和内含子2,但是在5′UTR中的-14位置或者-10位置上没有如同在立碗藓属或者一些拟南芥肌动蛋白5′内含子中发现的保守内含子拼接位点,显示缺少5′内含子。对于Mpact4也发现了同样的情况,很可能缺少5′内含子。此外Mpact4在ORF中也不具有内含子1或者内含子2,这与目前分离出来的所有苔藓肌动蛋白基因都不同。
推测的同源苔藓肌动蛋白基因
尽管从立碗藓属和葫芦藓属中分离的不同肌动蛋白基因的内含子-外显子结构可能对两个种之间的同源基因提出了推断,但是我们不能从基因组结构中得到这个结论。例如Ppact1和Fhact1具有相同的保守内含子-外显子结构但是正如以上所示,还不清楚在两种植物的基因组中是否存在更多的具有相同基因组结构的基因。为了就同源基因给出一个结论,还需要表达数据以提议功能同源性。而且从蛋白质或者编码的cDNA序列的序列同源性中不能就两个种之间的相应同源基因作出任何假设,因为这两个种太相似了。
但是有趣的是对于立碗藓属和葫芦藓属,还发现在UTR序列、内含子序列和启动子序列等非编码序列中有非常高的序列同源性。因此在Ppact1和Fhact1以及Ppact3和Fhact5之间发现了高的同源性。在两种情况下内含子序列都显示了非常高的保守性。对于Ppact1和Fhact1,同源性如下:5′内含子:58%;内含子1:64%,内含子2:52%以及内含子3:55%。对于Ppact3和Fhact5同源性是对于5′内含子是51%对于内含子1是48%。
在两种情况中分离的5′启动子序列显示了高的同源性。图19A图示了Ppact1和Fhact1的分离的启动子区域的比较。转录起始定为位置1,5′启动子区域的第一个核苷酸定为-1。Fhact1的5′启动子区域分离的267bp与Ppact15′启动子区域的前267bp有58%的总体同源性。在这些序列中可以观察到具有不同同源性的部分。-267和-129之间的序列同源性是51%。后面的29bp有62%的相同性,在-100到-1位置之间同源性几乎是70%。考虑到Ppact1和Fhact1内含子和启动子序列之间的高度序列相同性,有理由将这两个基因作为这两个苔藓中的同源基因。另一个有趣的方面是观察到不同的Ppact1:vegf缺失构建体之间表达的下降(图15)。表达的显著下降出现在-237和-82缺失构建体之间。这显示了5′启动子区域-129和-1之间的重要功能,因为刚刚提到Ppact1和Fhact1的启动子区域序列高度保守,-82缺失构建体不含有所有的高度保守序列而-237缺失构建体含有所有的高度保守序列。
也可以观察到Ppact3和Fhact5启动子内的高度保守区域。这两个基因分离的启动子区域要长得多。因此在两个5′启动子区域之间发现更多的同源区域(图19B)。Ppact3从-1到-2270以及Fhact5从-64到-2325的启动子区域显示了一些有趣的同源性特征。起始位点位置的差异可能是由于Fhact5的5′UTR是由实验确定的而Ppact3的5′UTR是通过分析数据库中的EST确定的。
Ppact3-2270和-1876之间的序列与Fhact5-2325和-1948之间相同的序列区域之间只有很低(29%)的同源性。之后有一个大约1100核苷酸的延伸区域,具有非常高的同源性(82%)。接下来的Ppact314Ont区域和Fhact5启动子的152nt区域“只”显示了53%的同源性。Ppact3-641和-463之间的序列与Fhact5的-705和-528之间的区域再次显示了76%的高度保守性。接下来大约180nt再次显示了较低的同源性(53%)。Ppact3启动子序列的最后288bp与Fhact5后面的280bp之间再次显示较高的同源性73%。两个同源基因之间具有不同同源性程度的这些区域可能显示在5′区域中存在调控性的活性元件。
对于Ppact1和Fhact1,这里对不同Ppact3:vegf缺失构建体的表达分析也是有趣的(图17)。与-523删除构建体相比,-2210,-995,-821缺失构建体的vegf表达水平有显著的升高。这三个缺失构建体至少含有Ppact3和Fhact5中-1876和-779之间发现的延伸同源区域的一部分,它们的表达水平达到了35S启动子的表达水平,而-523缺失构建体与35S启动子或者更长的缺失构建体相比,表达有倍的增加。这可能显示在这个Ppact3和Fhact5之间具有82%同源性的区域中存在负调控因子。
对于地钱属,没有发现与来自立碗藓属和葫芦藓属的不同肌动蛋白基因之间有相当的序列同源性。
对于Fhact5基因,制备了一个含有1157bp 5′未转录区域与hVEGFcDNA融合的构建体,用它在立碗藓属原生质体上进行瞬时转化实验。在这种情况下检测出的蛋白量与使用CaMV35S启动子得到的蛋白量处于相同的范围内但是略高一些(直到两倍)。Fhact5基因与Ppact3基因具有最高的同源性,有趣的是在瞬时试验中两个启动子在立碗藓属原生质体上显示了相似的活性。
2.5稳定的转基因品系
将包含由Ppact1,Ppact5和Ppact7的5′MEPR引导VEGF cDNA表达的盒子引入立碗藓属植物的基因组中。对于每个MEPR得到5-10个稳定的转化植物,并且检测了rhVEGF的表达。对于这三个检测的MEPR,在植物生长的培养基(标准Knop培养基)的上清中检测出了来源于苔藓的表达和分泌的rhVEGF,表明当MEPR整合到基因组的其他部分中时会促进蛋白质在非诱导条件(标准条件)下的表达。在那些表达系中可以测量的蛋白质的量从每毫克苔藓干重7ng VEGF到每毫克苔藓干重53ng VEGF,这取决于构建体和稳定的品系。
使用一个含有Ppact5控制下的VEGF cDNA转基因苔藓株进行生物反应器培养。通过ELISA测定生物反应器培养物上清中来自苔藓的重组VEGF的量是每毫克苔藓干重40-50ng VEGF。
实施例3小立碗藓和葫芦藓泛素基因及其表达促进区域的克隆和分析
利用存在几个对应于立碗藓属聚泛素基因的EST序列,设计特异的寡聚核苷酸分离与数据库中最广泛存在的泛素基因同源序列的EST相对应的基因组序列,将其命名为Ppubq1。通过反向PCR鉴定出Ppubq15′区域的2146bp。通过5′race确定了ORF开始之前有129bp转录了的5′前导序列。使用小立碗藓基因组DNA和引物777与602通过PCR扩增出Ppubq1的5′区域。
构建携带不同部分启动子和引导hVEGF cDNA表达的5′UTR区域的载体,分析立碗藓属原生质体瞬时转化中启动子的活性。
结果表明该启动子与Ppact5启动子有相似的活性(或者更高)。检测的构建体、1.6kb和1.3kb的启动子片段表达水平比CaMV 35S启动子的表达水平高大约4倍和几乎7倍。
通过对葫芦藓属的总RNA进行5′race PCR,使用来自Ppubq1编码序列的引物,发现了来自葫芦藓属的泛素基因Fhubq1。使用分离的5′UTR序列和部分编码序列设计引物对葫芦藓的基因组连接产物进行反向PCR。这样发现了5′UTR 5′上游的序列。使用引物943和944从葫芦藓的基因组DNA中PCR扩增出5′区域。
实施例4小立碗藓RBCS表达促进区域的克隆和分析
作为肌动蛋白、微管蛋白和泛素基因之后的可能候选者,考虑核酮糖-1,5-二磷酸羧化酶/氧化酶的小亚基(rbcS)基因。在核基因组上编码不同的rbcS基因。这些rbcS基因是一个基因家族的成员。rbcS基因主要在能够固定二氧化碳的植物的所有绿色部分中表达。因此该基因家族在从不同苔藓的不同rbcS基因区域得到5′和3′包围的表达促进区域方面是有用的。第一步对立碗藓属的EST数据库进行分析。发现来自小立碗藓的rbcS基因组织成为一个基因家族,由12个基因组成。
将rbcS基因中最广泛存在的EST--Pprbc-S12作为候选的EST查找其5′和3′表达促进序列。从EST序列数据开始,通过反向PCR确定该基因的5′和3′包围区域并且对克隆的5′和3′区域进行测序。使用引物839和858从小立碗藓基因组DNA上PCR扩增出5′区域。使用引物904和901PCR扩增出3′区域。
在所附的序列列表中给出了以下的序列(序列编号/序列名称/相对于蛋白编码区5′或者3′区):
1     Pptub1 5′
2     Pptub1 3′
3     Pptub2 5′
4     Pptub2 3′
5     Pptub3 5′
6     Pptub3 3′
7     Pptub4 5′
8     Pptub4 3′
9     Ppact1 5′
10    Ppact1 3′
11    Ppact3 5′
12    Ppact3 3′
13    Ppact5 5′
14    Ppact5 3′
15    Ppact7 5′
16    Ppact7 3′
17    Fhact1 5′
18    Fhact1 3′
19    Fhact4.4 5′
20    Fhact5 5′
21    Mpact1 5′
22    Mpact4 5′
23    Mpact15 5′
24    Ppubq1 5′
25    Fhubq1 5′
26    PprbcS12 5′
27    PprbcS12 3′
表1:引物列表
No.序列(5′-3′)                           No.序列(5′-3′)
35  ATCCAGGAGATGTTCAGGCG                   363  CATCTTGTCCAACTACCGCGACCCGAACCC
36  CCGMACGCTGTCCATRGTYCC                  364  AATCTCGAGTAGCATAAGATAAAGATGTTCTCTACC
38  ACATTGATGCGCTCCARCTGC                  373  GGTAAAGCTTCTCGAGTGCAGTAGACGACAAAATG
40  GGBATGGACGAGATGGAGTTCAC                374  CATCTTGCTCAAGCTGTGCGAAGCTC
67  AGCACATGCACACCCAATACGCTTGTCGCAATTC     395  ATCTCGAGGATCCATTCAACGGAGGATAAGT
69  GTCGTCATAGACGACAAGACCGGGGATCCACAGC     408  CAACTCGAGATCGGTCTGTAAGCCCTGTATTTG
70  TCAGTGCTGTCCGTGAATCTCTCTCTCTGCTTTG     413  ATTTCTCGAGTTGTTGAATCATGTTAATTGCCAATGGT
71  CTGTGTTCGGATTAGACTCCCCGTAGCCTTTGTG     511  TTACTCGAGACTCTACTAATTGACAAGTATG
89  TCGATTGGCGAGTTGCGAAGGAGGGCAAGG         547  GTCAAGATTGGAGGTTCCTTGAG
90  TGCCTGCTCATCTTGAGTATGGCGTGTTG          548  TCCATCTCGAGTACCTCCGCTGTGTGTTTCAAAG
91  CTGCAAGCAATGCGCACTGAAACAAGATGG         549  GTGCCTCGAGCCACATCCCGACCGCC
95  GACCTGGAAACCTGCACAATCACGCATAGA         550  AGCACCTCGAGTACTGCCCTAGTGCCCTAATC
113 TAGCATAAGATAAAGATGTTCTCTACC            602  CATCCTTACAGGACGTACTGG
149 CTCACCAGCCAATGGCTATGC                  611  ATGCATGGCAAAACATCCCCTG
203 CCGTGGGACTTAGTTGTCTTCACTTC             612  CATGGAGATGAAATGTTCTG
204 GATCGAAATTGCTGCTTGGCCTCCAC             777  TTAACTCGAGATACAAGAGTTATAAATCATATAC
205 TCGCAGGATGTGTCCTTAGTCGAGAA             839  ATATCTCGAGATGCATGTAAGATAATTCCAATTAGA
206 AACTTCACGCATTCCACAAGCCACAC             858  CATTGCTAAAATCTCTCCACACTCGAATC
219 TTGATACTCGAGAAGTCCAAAATAATTTAATGATAC   901  ATATCTGCAGTCATGAAACTTTCATTATGTATC
223 CATCTTCGCTAAGGATGATCTACAACGAG          904  ATATGCGGCCGCGGAACGAATTTGTCGAGCTCTCT
225 CATCTTCAGTGTGCTCTACCTCACG              908  CTTTCGTGTTGCCTCAAGAGTG
226 CTACTCGAGCACATATAATACTGCCCTAGTGCC      909  CATTTCTTAATACGGACCTGCC
291 GACAGATCTCCTTAGTCGAGAAGGCGCGGGACGTG    943  ATATCTCGAGGAATTCATTTCCATTAACGAGAATATGAC
292 GACCCGTGGGACTTAGTTGTCTTCACTTC          944  CATCTTCACAACGCTTTATCACTTC
296 GCTGCTCTTCTCGTGATTGTCT                 950  CATATGCGTACGGAGTTGTGG
297 CATTCCCACCCTTCCTTCTCTTC                951  TTTCGCGAAGTTACCTAACC
298 GTTTTGTGGCTCTTCCTTGG                   960  TCATGATGTTAAGCGTTTTCA
299 ATCGCTTCTCGACTCTTCTTCC                 961  GTTAACGAAGGAGGTGTCCG
300 GTTACGCTCGCAATGCGTACT                  970  AAGCTTAGCAAGCAGCTCTCGCAG
320 AACTTTCTGCTGTCTTGGGTGCATTG             971  ATCGACGATAGACTGCAAGCC
321 GACCTGCAGGCACTCGAGCTTGTAATCATGGTCATAG  983  AGGAGTGTTACACATCTTTTAC
332 CATTTCTTAATACCGACCTGCCCAACCA           984  GGCTAAGACGACGCATTCTGTG
333 CATGGAGAAGAAATACTCTGCACATCAAAAG        1000 GGATCCGAGAGGAAAGAGAGAG
334 CATTATTTAATACGGACCTGCACAACAAC          1001 CGCTTACAATGATCCTGCATAG
335 CATTTTTTAGAATGATCCTACAGGAGTTC          10R  TCDGTGAACTCCATCTCGTCCAT
336 AGATCTGGCAAGTTCCCTTCG                  8F   CGGTACCTACAAGGGCCTCTCG
337 GAAGAGAAGGAAGGGTGGGAATG                9F   TGGGACGTATCAGGGTACGTCT
338 GGAAGAAGAGTCGAGAAGCGAT                 F7   TATCCGGAGGTTCCCGCGACACC
参考文献:
Altschul et al.,Nucleic Acids Research 25(1997),3389-3402.
Berlin et al.,Genetic modification of plant secondary metabol-ism:Alteration of product levels by overexpression of aminoacid decarboxylases,in:Advances in Plant Biology,Studies inPlant Science,Vol.4,pp 57-81,DdY Ryu and S Furasaki(eds),Elsevier,Amsterdam 1994.
Cove et al.Trends Plant Sci.2(1997),99-105
Engel,Am.J.Bot.55(1968),438-446
EP 1 206 561 A
Frahm″Biologie der Moose″(2001),Spektrum Akad.Verlag
Gorr(1999)Biotechnologische Nutzung von Physcomitrella patens(Hedw.)B.S.G..Dissertation,Hamburg.
Grimsley et al.,Mol.Gen.Genet.154(1977),97-100
Hiwatashi et al.,Plant J.28(1)(2001),105-116
Hohe et al.,Plant Sci.163(2002),69-74
Holtdorf et al.,Plant Cell Rep.21(2002),341-346
Liebich et al.,Nucleic Acids Research 30(2002),3433-3442.
McElroy et al.,Mol.Gen.Genet.231(1991),150-160
Reski et al.,Planta 165(1985),354-358
Reski et al.,Mol.Gen.Genet.244(1994),352-359
Reski,Botanica Acta III (1998),1-15
Reski,Planta 208(1999),301-309
Reutter et al.,Plant Tissue Culture and Biotechnology 2(1996),142-147
Richter et al.,Gene 290(2002),95-105
Rothnie et al.,Plant Mol Biol.32(1996),43-61.
Rother et al.,J.Plant Physiol.143(1994),72-77
Sambrook et al.(1989),Molecular Cloning:A Laboratory Manual,2nd edn.
Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press
Schaefer et al.,Mol Gen Genet 226(1991),418-424
Schaefer(2001)Principles and protocols for the moss Physcomitrella
patens.http://www.unil.ch/lpc/docs/PPprotocols2001.pdf
Schaefer,Annu.Rev.Plant Biol.53(2002),477-501
Schlink et al.,Plant Mol.Biol.Rep.20(2002),423a-423f
Strepp et al.,Proc.Natl.Acad.Sci.USA 95(1998),4368-4373
Figure S04822968920060223D000462
et al.,NAR 15(1987),5890
Watson et al.,″Recombinant DNA″(1992),Chapter I.1 and 2
Zeidler et al.,J.Plant Physiol.154(1999),641-650
序列表
<110>greenovation Biotech GmbH
 
<120>苔藓表达促进区域
 
<130>R 42095
 
<160>27
 
<170>PatentIn version 3.1
 
<210>1
<211>1533
<212>DNA
<213>小立碗藓(Physcomitrella patens)
 
<400>1
tagcataaga taaagatgtt ctctacctaa tttattttta tttatcacta ataactcata     60
tcaatctaaa atatataaat gcctttaaca atagaagaat atgattcaac aaacccaatt    120
ctatcattaa aaatatatct aagattagat atgataaaaa tagataataa tattaataaa    180
tcattttaag gttgtaatgc aactataata atttttaata ttataacttt ttagtttttt    240
aaaataaaaa taaaatgtta aaatattata aaataattat actttatata tttatgatca    300
agttagtaca ttgatacatt taaagtccaa aataatttaa tgataccaac ttgcaaaaaa    360
tttaatatta ttaaaatatt ttaaaaagtt aagagcaaga aaaattattc taaatagaat    420
tcataccatg gtattataaa gatacaaaga atcaatgtgt atttatttat tttacataca    480
ttacttgcaa tatatggttt atactacaaa tgactatata ttgaagatac taaccacaaa    540
aataaaaatc cagcactaga taattctaaa aacatgaaat acaataaaac attacattac    600
tagcttatat ggttactaaa tatttttaaa ttatacaaat aaaaaataaa aataaaacaa    660
aaaaatccta tagtgacaag aaataaaata aaataaaaaa attataattg accaatccct    720
aaaacattaa tatttaaggg atattcatat gacaataaag ataatttatt tcatggaacc    780
ttgattattt tatcttttaa aggtggtatt tttaaaattg tttaatggta cttaaaatat    840
tgtatttata tagagaaaat cctccaaaaa aattctctca caagggaata gaattcctca    900
agtttttctc ttgactaaat tgaccaacca ccaaacaacc cacgtcatcc atccatccaa    960
cccccacaca acccaattgt ttctccattg tagacatcga caaatgaaaa tcatccgatg   1020
acgtatacac ttcatcctct ggtccctcca gggtgccatg agccacatcc cgaccgccta   1080
tttcagatcc gacggcacag ggtgacagag cagcggtctc agaccacgcc atttggaact   1140
cgccagccct gccccagcta acagtttcaa agctgcccgc cataacccgg tcctcccagg   1200
gccgttagat cgtccatcct acgggagcac atataatact gccctagtgc cctaatccga   1260
tgggaacggg gagtccttta tctctctcgg aaagcgactc attcgccagt gtgcgcatcg   1320
cccgtgtccc aaggcaccgg gccagactct cgcatcggct ctacccacac tcacccccac   1380
tcaccctgtg ttttctctgc ccccttcgcg ctcttcgtgt gtgtgtgttt tttcacggtc   1440
gattggcgag ttgcgaagga gggcaagggt gctgtggtgc agcatcagct ggtagtaagt   1500
cagtcagggt tcgggtcgcg gtagttggac aag                                1533
 
<210>2
<211>1539
<212>DNA
<213>小立碗藓
 
<400>2
atgtatttcg gagcgatttc gtgtgctgtt ggtgtctttt ggttggaagc gatttaaaca      60
ggagagtctg tttggtggct tagggtaatt cggtggagcc tgaaagatat tgctacgtct     120
tgaaatacca tcttgtttca gtgcgcattg cttgcaaaag cattgatagt tgtagcggga     180
tatggtgctg tttatggttg tatttgagca tatgtttcgt gacatctgtg ttgcttgttg     240
ggcttgccat actggtagtg tcttgttgag tatcatattt actttccaat gtaatattca     300
acattttctc ctagcattac tataccattt ccatctattc ccaatggcgc tatcgtctcc     360
ctgggataca tttaacccat atttgtagtc cagtgcatta aatgcatgtg aaatcgcatt     420
tatagatgcg catatttaat gtcaaattag acatcttcac tcatataata cattttacca     480
aaaaatgaaa tgtacacaca gaatattttc aaactgccga ctatctcaaa aacctataca     540
ttatcaatct cattgacata cctcattgaa atactcctca ttgaaatact acataatttt     600
cattgtcaat attgccaaca ttcaaccatg agaagctgat tattatttct tttatactgc     660
ttactctctt aatgcaaatt caccattcct catgagagca gctgtatcta ctcccctgat     720
caatattact actaacttct caggaatagt actcgatatg ttgcgctggt tcagttacgc     780
aattataaag tccatcgtgt aaaccataat cgtcacaact ggatatctga tgccagaatt     840
tcagcaaatt ttagtgccga tccgaccagt tcaatgcaga agaggaatat aactatctag     900
aggttgttca caatcttttt cattacagtg cagccaaagt tctgcaacga agatacattc     960
gcaacttgca tgcaaggtga agacacatat cgcggctaga tcctcagttc gttgttaata    1020
cctgggaaag aaaatcaaca aatcgaattt ttctgcatca aatagccatg acaaagatta    1080
gtacttccag tgcaagtata gtctgcggaa atatatcgca gtcctcgtac tacagcttca    1140
aaatttgggt acatgacgag gatttcgacg cacaagaaca gaattaaccc gatcgtatcg    1200
agcgttacag taaacgagac gaagtgcctg tgtcttcaaa ccggcagatc tctacgaagt    1260
aagaatctac tcagcagtga gagcgagagc atctggtgtg gcagaatcta ctatgattac    1320
aagtgcccta tactgaatgt agaagcctgt atccacctca tataggaaac gaagtaatcc    1380
ataccgacat gttacatatc tccactgaag cagttccgta tgggcataca ggaaatgatg    1440
aagcacaacg cgtataccaa ttttttatca gatacacaat cacccaattc aaaacgcacg    1500
tttatacaac caacacgcca tactcaagat gagcaggca                           1539
 
<210>3
<211>1197
<212>DNA
<213>小立碗藓
 
<400>3
tccttagtcg agaaggcgcg ggacgtgagt gagctctgaa gataagcttc caatttgcca     60
ctgcaagtgt aacctgctcc atcgggcgcg agtccgtagg gatcatgaac acctcatttc    120
acttggcgtt agtgcactct agcggcattg aagcaatcca tgccctcaga atgagtcgcg    180
gggggcagtg aacgaactag ttaagaaatc cagtaatgac ggcaccacat cggcagatcc    240
agatccattg cagattatcc tcttcagccg gaccgaataa accatgccta aataaccacc    300
ggaatgtgtc ctgtgcggga ctgattgttt tccaaagaaa cactaactaa ttatatccag    360
acagtgggat gtatgcgggt atccgtgaag ccagatatga gatctctgat aaacctgagg    420
aagatgtctt acatggcggc acgggaaaca cgaagaaaag ccgaggagaa ggtattgaaa    480
gctgagcata gccattggct ggtgaggaaa gggcatgcaa caactcatcg aaagcggagt    540
aaactttgaa atcccgtagg cttcatgcga tgttctaaat tcttagcctc gacgacgatt    600
tcaaggtctg attcgaagct tccgagcggg gctccggaac tgtcacttca gtcgactttg    660
aaatgtgaag cgactttgct cacttgtgac acagcaattc aactccacaa tataaaaaaa    720
tcgcgaaaca aaaaaaaaaa aaaaaaaatc tactttactc gtcgatgttc cactcgaaga    780
caaacagctt taaagcgttt acctgtggta gagatagatt tcggcgaagg aattcaaatc    840
cagcaaccct cccactcgta ccgcagacct tgagtttgaa cggttctgtt gctgtttgcg    900
gtgagttcaa aactcgactg acctctctga aaccaaaagt ttaccttgag ctgcccgaga    960
atctccgaac gttcgatata agatccaacg gtctcaagaa attctccctc gaggaacacc   1020
tatgcccagg ggcagggggt tcctttatct ttctccctct gccgcaatcc atttcattgt   1080
gcttgcagga ctgtcatccc tccccttgtt gccagtggta tccggaggtt cccgcgacac   1140
cttctggtgc cggaactaag gtctgttgtt cctttcgtga ggtagagcac actgaag      1197
 
<210>4
<211>1012
<212>DNA
<213>小立碗藓
 
<400>4
atgcgacccg aaggatgagt acacgcgttt tggttttacg ttactgactt ttagctcctc     60
cattcacact gcaggccctg gtttactgtt gaaagcacgg ttataccctc cgtaaactga    120
acattctgtt tcagcgcgtc gtgtcttagt tgtcctttgg ttcacttttt agtttggaag    180
caagtcgttg tatagatgat acttagcaca tatagttgct gtcgatttgt tttaagttca    240
gcattccgct gcctgaattt cagtaaatac cttgtccaac ttcgatgcaa tataagttgg    300
cttcagtatc cagtcttgcc ttactccttc attgcaatct tggtggcggt ctggtgcgcc    360
tcgtccactt tcacgatgta cctcgtcagc ttgtttgaac acttcctttc tcctactgag    420
tatggcgttg gcctcttttt ccaagctctg ttgatgtagg tcctaccttg tcaaaacatc    480
acccacagag atttgacgac aatcgtaatt ttaatccgat tgtatggggt tcctgtcata    540
gtcaatatat taacgcccat cctctcactt accaacgtct gttaccaact ggacaataat    600
gcattcacaa ccaaagtgca atttttgtat gagttggaaa tatcgaaaca gttagtgcca    660
gtaattcacg caaatagttg tgtcatggaa actttttttt aactttctgt tgtccaatca    720
tcgtgctgaa acatttagaa atgtggcaga cagttgcatt tgatgtatca actgctgtgg    780
t agtaacac tgttgaaact gtaagataga catgccaact ttctggtgct atgtgctaat    840
tgtttatatc ttcctgaaga atggtacaat tcaaatgaaa gtgggtggga gaattgatat    900
cattgatagt ggaataggtt attgcaatca gtgagtcctt ttttcagggt agctaatatt    960
ccttactgat tatccattga ccaccagtgt ggcttgtgga atgcgtgaag tt           1012
 
<210>5
<211>1386
<212>DNA
<213>小立碗藓
 
<400>5
ccgtgggact tagttgtctt cacttcatta ggaaatctgt ttgagcctct ttccattcca     60
atcttctcga caaaataggt tttttcagtg actcataact tattgtgctt tgcaaaattc    120
ccactaatcc gaaatgtatg gtgtgatcac cgagctttta aattgattgt gtttgggcag    180
tctacgaaaa atccagacgt ggagccttcg aggaacaggt tgttcgcgca ccgctacttc    240
tgaacttcac aacgccgcgt ctatgtcgct ctaactcaga ggctataaca caagttagcg    300
atgtccatcc ctctagtctt catatttgca acattaggag gaggcacacg ctggtcgaga    360
tgcccgtgga actcttccag attgctacca tcaatgcact cgtagacaga tccaaaagtc    420
attccacatt attcaacatt aagggatccc caactgacca accaagagca ggtgctatga    480
gtggaacttg ttattttcca aatgagcgtc gactacatat gcccaggcag aaggatatgc    540
cgaggtatct gggggggcag gcatgtgttt tgtgtaaagt acccccgagg taagaacttt    600
taagcggcgg cactggattc agaaacagtg gacagatata tccattgcca atgtattgat    660
tggctggcga agaactgttg caaaccacga ccagccgtag gggcgtaaaa tttgaatcca    720
ctgtttaaat ttcaaatttc aaacctcgac ggagtttcct ttagcttttc agatgggcgc    780
agaacggtta ggaaactgtc ccgtcgcccg aatttgaatt taaaaaataa atcaaaacgc    840
tagagcttcg attagtatgg gcttttttca ctcttctgtc caattctttt tgttttttac    900
ctcatgcaag gcggtcggct aaagtgactt acagggagga atattactga gagcaagagt    960
tttaccacgt tgtaggatct ggagaaatcc aacgatgcta ggcctacgca acgagtgtga   1020
ttcaacgcca gctataatct cattcgtgcc gtcgatcccg ccatccaacg gcgcagacgc   1080
tttgcgtggg aattgtacct tgcctacgat tggaatttga ctggcagctc ttgagctgga   1140
atttacttgt ctgcctgaga aagttgaagc gtaagatgct cgatccaacg atgggcagaa   1200
agtgttcgtg ggcaggaacc aaagccctag ggcgggctcc tccttttatc tatctctctg   1260
gcatatctct tctcagtgtg cccccaggga cgtcttcttc tctccttttg ttcagcgtct   1320
cagtgctcga gggacggttt gccgtctttg tttcttcgtt ctcgttgtag atcatcctta   1380
gcgaag                                                              1386
 
<210>6
<211>997
<212>DNA
<213>小立碗藓
 
<400>6
ttgtgacctc tcctctcgtt atcattacgt agcacgctac gaacaggaca ttctgtttca     60
gcgtctaggg tctttcattc agcatttaga accaaatcat tgtatagatt tcacccagca    120
taccaagtag ctattgattt gttgtgagtt cagcatgctg ctgtctgatc cgaagattat    180
ttgtaattga ctgttatatt tgagcatttc tgttcaatca tgtggtgtgg gtttgaattt    240
taattagcag gcactgagtt ccgtgacccg aaaagaattt tctgagaata gccaggtgag    300
ttgcttcctc ttttgctgtc ggggatattt cttccgaaat atgggttatc cagcgctcta    360
tccgcttctg ctctgtgcta tgtgaacatg aatgcaattg atattcttcc aacatccata    420
taactaatgc atacttcata agaaagcaga ccgtcacgga taatgggaga aacattttcc    480
agtcatctcc gtgtccacat ttctctcaca cgctaaccat gttagttaac cgcaaggact    540
gttattaagc aatgaatatg tctgaaaatc gtatgtgatc tgttgtcaaa gtgtcatagt    600
acccgtcatc gccgcattgt gcactgctgt cagatccgca gtaaataccc gctaacgaaa    660
ggaagagaaa gatgagagaa gatgagattg tcaccgggag agaatcagac gcagtcatca    720
gtgatactat tcgacggacc taacctcgtc cgtaaaatgc aagaatttaa cgaggcagta    780
aaatcagctt aaaacctccc cgcacgctta acgtaaccat ggctgtgcta aacatccacc    840
aagagaggaa acaccgcaca tgaacaactc ttctgaacta cacgtgaagc agagattgag    900
gcgaaaagaa agccacagat cgctgctcct caagtggtga atttattttc ccttggaaca    960
aaaatggagg tgtggaggcc aagcagcaat ttcgatc                             997
 
<210>7
<211>624
<212>DNA
<213>小立碗藓
 
<400>7
ctcgagtgca gtagacgaca aaatggaagg atgcgaccag ggatgaacgg gaagagtatc     60
attaatgcga gacccttgga gttgaaggcc acgagtggga cagcgatgcc gagaaaaatt    120
tgaaaatcgc tcatcccaga caaaatatct gtgggccagc cagggtttcc cagccagctg    180
ctctgccgtg ccagccgtag atctgctcat ccgacggcca ctgcgcccca tcctggactt    240
gtaccctccg gcatttggaa agtgtcagcc tctccctgac gaacatttca cctcggctgc    300
ccgggaggcc aggagcgtca gatgggagat ctgacggcgg ggcggaggag agacctgaac    360
cggcgggcag gggaacgatg tcgttgcttg ttcttctggc tgaggcgtcc atccccttta    420
cctccgctgt gtgtttcaaa ggccgatatc tgcgcttccc ttgcggaccg agctctgtcc    480
cgctcgctta cttctctccc accgagcttc cgaggttggg cattcccacc cttccttctc    540
ttctcctctc cttctctgct cttcttctct gttgtctgcg gattaggtct tgtggtcttt    600
cgagcttcgc acagcttgag caag                                           624
 
<210>8
<211>1146
<212>DNA
<213>小立碗藓
 
<400>8
gcgcgcggtt ggctggaaga agagtcgaga agcgatgtgc ggcagcggca gcagcaggag     60
gggcaggcag tcaggtgcag cacgtcgctg gggtgatgcg gagggacttt gccggttggc    120
tggggtacag aagcgagggg taaatatagt aagattacgc gcggcggaag gacgcgatgg    180
ccaacgaggt ggaggggttg gggcggtttt acgtgtacag tatgagactg acactgacgt    240
tgatcctgcg cgaaccaccg gggctagcgg tagtagatag ttggagcgag agttcgggag    300
cgttgttgcg gataagctcc ggcgtttgac cccagggtgc aaccgtagtt gcatgggggt    360
ggtgggggga ttgaaattgg aaccggactt ggagttgaga agttcgggtt gtttttggag    420
gcagttgaaa gacgttttta agaagtttga gctgttggaa atacattgtt accctgagct    480
taagcagtgt gtagtggcga tgtgtttaat tgtctgattc ctgtatgttg gtgtgtgcga    540
ggcgtgtgag tgcgtggttg tgtgcttgac gtggcggtta tgggccgtgc tgtcggaatg    600
atttactgga ttatttggtc cattggtttc gtggactgga gacggtggat gtttgtagtg    660
cttgtgtgaa caaggcgggc atgcagatga tgggctcgca ataaagacag ggtcatgtcg    720
ggtattgccc agatgaaagt ctcttttggt gatgccgata cggaaaatgg aagttggtac    780
agtcgcacgt tcaggcgtca tgggttgcct tggaagtttg cattggaaga gagagttgag    840
ggtgtcctgg atgatgtcca cgaggtggtg tttgaatcga tgttgtgcga agtagacctg    900
agcaccgatg tgtgacaccg gaatggtgag tttgtgtcaa tgaactgtga gcgttttgat    960
tgaggcagac attccaaggg gatggttttt cggttttgtc ttttaaggct ggcgcctgcc   1020
tagcctcctt tgtccttcag cgcatgtttg cttgtgacgt ttgcgttggg attgttagta   1080
ttggtctgga tggaaatttt atcgtttcta tcggcagcaa ctaagtgcgt cttgtcattc   1140
ccatgg                                                              1146
<210>9
<211>2973
<212>DNA
<213>小立碗藓
 
<400>9
ggatccattc aacggaggat aagtatgtag ggtgatactt aggctcattc attcattcaa     60
ggcgtattta attaactact aaagaaaaaa agggggttaa ttggggtgat tgggttatgg    120
aatgaataaa tgaataaatg ggtccccccc ctccccttcc tttcccttcc ctgcattaca    180
tatatatata tatatatggc atgcggtgct gagggtgtgc atgtgggggg gggggtgtgt    240
tgagagtgtc aacggtgcca gccacactct ccggacccct tcccattttc ctttcctttc    300
ctgccctgtt ccctgtccct gctcccaccc actttccatg cccttgaaca cttcctgata    360
aaggccctcc atccctccct ttcccttctc aacccattta attctatggc ttaaacatct    420
aaatcattac attcttatgt actaaaattt tatttataga ttgataattt tcttttaatg    480
aattaagttt gaattttatc tatgttttag ttccacaaga tttgttttat ttattacat c   540
aaacttcaaa agggatttga atatattaaa aatttccatt tataaatgaa tattcgagtg    600
agtttaatta aaattatttt tagcgtatat atatatatat atatagatat ggataaaata    660
caattgaatt aacctaggtt taatttttat aacaatgttg aagtgacctt catgtagtgt    720
gagtgcaagg atgtatttgg atatggatgt acttcaaaaa aaacatgata aataattgca    780
tagtattaaa gtttatgcaa taaagaagct agaaatgact aaaaattatc acaagcttat    840
taactcacaa acaaatcaat gatatttcat atcaagtgaa actgttaaca aaagaaagaa    900
ttacgtgtat atttcatgat catattcttt tgataattaa tggtagggta acactatgaa    960
cataaaatta ttgctctcta caatttatca aaagtataat aaaacaaaaa taaaacagaa   1020
atcataattt atgagtctct acagggattc actgtcaaat attgtaagta aagtgtgtac   1080
tattaattga ggggattgtg gtatgccatt ggaatacgtg gatcaaaagc tgaaacacaa   1140
gaattttgaa actcaaaatt acattaaaat gtttgaaaaa taaacacaaa atacaatttc   1200
ttcagaaaaa aaaaaaaaaa accatcgtca ataatgacag tcaacaaagt cagcatgcat   1260
gacgagctca ttgtatttcc tccaaaaaaa aaaaaaaaaa gaagaaaaag tgggccctca   1320
gttaaatcag agaatgccac atggtgatag gagaagagcc gatcataggt gatacgtggt   1380
catgggatca tcgtttccat gcgcggaaat agatcgaacc cctctcagtg tctgacgggt   1440
caacacgggt gatcgggtgg acccaccctg accagcccaa caaaacgcag ggaggaagag   1500
gtggcaagta agtaagtccc acgtggattc gagacaaaac gttgtacgaa taatatacga    1560
agtgagaaaa aaccacagag cgggtggcag tcacgaagtc gcagacacaa accgggctgc    1620
ttgacacggc gacccgttcc ctgttctgcc gcccgttccg tcgccatctt tgtctcattc    1680
gcacaaggtt ccttttccag tgccttctgc gcgggtccca ccctctccat ctgacccggc    1740
ccgggctaac ccgttccgga gcagatgatg atcgacccgt ctcgcaggct ccttttgtgc    1800
accgcgtggc ttcgtgattg ggccattgtt gctgtttgct gtttgttgct ctgctttctg    1860
tgtccgggcg gcattcctga gaggcgattt gcatgcgcag gctcgttgta gagcagcagc    1920
agcgctgagg gtctcgtcta ggcttagtct gcttctatcc ttcgctgctg tcgcctctgc    1980
ttcatcgtcg ccgtctcttc tcaggttaga gcactttcaa gtgttggcca ggactgagta    2040
taggaaggag ggtttattta tttatttatt tatttattta tttttctgtt atttttattg    2100
ctggctgatg tccatcttcc gacgcgatcg tcgttttttt ttttttgttt gtttgtttca    2160
ttgtgttgga ggagtgtaag atttaatcgg atgcataggt tgtgtgtttt gcatgcgttt    2220
agagcgttta catgtgcgat gcacgagctc tggtgtcgtt tagaggccac tgatttagta    2280
gtttcttgtg cgagggggat tagatcttgt accgcaagat gttgctccgg ggttgtggtg    2340
gcgatggcgt tttataatta acatatagtt caatggtgat gatttaatta gcagtggtgc    2400
atgagttagg tacggatcgg gcgattgtgg atccggactc gtgttcaaca ataggctgga    2460
ttctcttcta ttgcgattgg ccagttctta catgcaatcg ggtacacgat cgctgaagta    2520
gaacaaatta aactcatcga ctgaattttt gccgtctcct gaactgtcga aatagagctt    2580
gaaaatttga ttgatagtga ttgtttagtt ctctgcgaaa tcgttctaca taatctttaa    2640
attctgaatt aatctcaatg tattttgaca tcagctgatc gcttgtccgc tcgctcagtt    2700
caattcgatt gagtattgcc tgcagatttt tcagaaaaat ttaagtaatt tgatagtaag    2760
aacttgactt cctgtggatt ttaaacagta tagcatatga agtgccaggt tttctgaatc    2820
ctccatttct tctaatcgct atttccgaag acttctatac agtatggagg gcgttctgta    2880
ctgtcctgat tgcgagacat gttttacgac gaaaatttac tgctccttag aactaaaatc    2940
ttctgaaatg gttgggcagg tcggtattaa gaa                                 2973
 
<210>10
<211>1128
<212>DNA
<213>小立碗藓
 
<400>10
agcagtgcga cacatctttt gcttttttca gcacgtctct tagctcggct tattgaactt    60
cgattgctaa cgtttgtggc caccgaatta ggcctgctag cgtagatcaa ttagaggtcc    120
atgttgcaga aagcttttgt ttgtaaaaat agctgatatc tggacgcata cgactggctg    180
atataattca gtgccattca cattatttgt taacaggtcc agggttgttt gtagagtcgg    240
acagcatttc tcgtcggaat gttggcgccg ttttgtgaaa tgaaaggtga ttatgggtaa    300
aatgcataca tagtcctgtt gactatggct gagtggataa gatatatttc catcacaggt    360
tagatttcct gcggagtgtg aactgtgacg taaaatcaca gagtgcgtcg tcttagccct    420
agcccccgaa tcatccttta cgatggatgc atgttcggat gttataattt gatttttttt    480
ttttttcgtt gtttacggat ttttgaccag tttaccattt gttgtttcag ttgtgatggt    540
ttggttctgc gtagataagt ttgagttgag tatatttcgt gagacgtcct acgccactgg    600
atatgtatcg ctgaagcaga atactgagta ttgtaattgt atgttccaga cgtttcagta    660
gttagtgaca gtggaatgaa gcaacttggt ttttctcttc tatggtcttg ccaatcgttt    720
ccgtcgcgag attgagcgta cctggtcaag ttgtgttatt ggtgagctca atgtgcttgt    780
gattggtcaa tttccatata taagtgaagc gccattttca aggagacaag gagctctatt    840
ctaggcattc accagtcctc ggctccaggg gcactcggga gatgaggtca agtctcattg    900
ctagagtcgg ttggtgacca ctctgaggtg gctcattact tgggatatat tccatggcga    960
ggtttggttt tgcatgctat cgacgaagcg gctagaactc tgggaatcta attattttgt   1020
ctaatccgtt gcaggacgat cagccgtgaa acagatacct atattttaag aatgtttatt   1080
cttgtgtgcc atgtgtttgt tattgaagaa taatcttcgg tgacggtg                1128
 
<210>11
<211>3035
<212>DNA
<213>小立碗藓
 
<400>11
cgagatcggt ctgtaagccc tgtatttggc atggaatatc ttttaacaaa gaagatccat     60
cttttagttt ctcataatgt tgaacaacgt acttaaggat ttagaaagtg tgtttcgttg    120
cttctcttgt tagaatggcg ttatgagcct gtgctgtgtt cttcttttta gctggatgaa    180
ctgtacaatg tttcacaact gtagcctagt tgatcgtgca tatttgcgtc atgactcccg    240
gcaagttgat gtgttttttt cttgcttttg aatcccttca acctgtattt ggtggctcgg    300
acagtaactg ctacgatata cgtcagtctt tagtaagtaa tatgttcctt tttctctcgc    360
ctcacgtatg tcatatttcc tgagatagtt ttttaatttt cgctctgtgg tttcttgtag    420
tcctttcact gcgtgccgct atcacagctt ggtcatagag gaggccacat ttccagcgga     480
ccaacttgag gttacagcat ggactgagga cgggcttgtg atgggagtcc gtcacaaagt     540
ctacaagcac attcaaggag tgcaatttca tcctgagagc atccgaactc aaaacgggat     600
gcagatcgtc ggaaactttc ttaagatttt agatagaaag gagacggctg acaagaagga     660
gttgaaacac aaattttgga gagtgtttga gtgatgagtg atactgggat ccttttttat     720
gggaaagatt gccagcagca gtaagcttgc ttttgttaga ttcctctccc tacagcgtgt     780
acctcctcga atatgcactc aagcaagcct agaggttgct gctatagatt tctcggtaag     840
acagggtatt attgaggcat tttttgcgct tccagatgga gctactacca caagtatcta     900
tcctattatt atctttaact tcgatggatt tgccatgatc actgaggtac gtcgaagttg     960
tgattggact tgtagtgatc acttccagag cgagctatca aactggtgcc tagaggagca    1020
acgcaaggag tgctgaatta ttctaatgat ctcatttagc ctaagttttc cgtcaaacat    1080
agtgatgttt ttaagttcat ctcgttagtg aaacatctca aagaaggtac accattaaat    1140
tattgcaggg gttgtgatga ctttatttaa tagttgacct cttcaattga gaacgcgttg    1200
ctctcctttt gtatagtttc aatcatatca aagctctatt tgttctctgt accttaagcc    1260
ttgtgtaagg catttaaata atctcttcca cgattaagat ggtagttatg tcgccggttg    1320
caacttccaa gatgtcctaa tgctatagtt ctcattcaca actcaggagg tttgttgttt    1380
tatgtttttg aaagtgacga aggaaattgt ttacttttcg ctttgtgtct gtgtatttta    1440
gaatagtacc ttaacttctt acacaatggt gtctaatttg ttattcttgt gtatcacgag    1500
cgttaatcgg tttggacgtc ggaccctttt aaccaatctc aattgcttct gttctaatcc    1560
acgcgtccca cgaatggcag gtcaaatacc gattattgcc cgactctaat cgtgacagtc    1620
actgagacta ataacgggag gtcactatct tgtgacgttc tcgttatttt aaaatctgta    1680
taatggcaat ccctttctgc accacggcga actcatgatg attcttatcg agtcctgctc    1740
accaacttta tcacaagacc ctacggatct aactatgatg accaaaagct tgttctacgc    1800
atgcatgagt cccttcgttt gggagatttt agaattctta ggaactcaca cgttgtccat    1860
aaattttaac caccgggcaa cataggatgt tgacatgtag tcacaaattt agaaaaaccg    1920
acttcaaaag gttgcccacg tagacaaaac aactcgaacg cagaaatcca ggcgaccggt    1980
gaaattggaa cattcacaac aaagcgagaa gaggttcaaa aaaaccgcag agtaaaccct    2040
atgcgccaga ggggaatggg agatccacgg gattcggaga tgaaaaggca tcgcgcgagt    2100
aaaaacaaag agtgcgggga gcaagggcat ccagaagagt ttcactgaga tctacagtgt    2160
aactcagaaa gggagccact ggtacaaatg ccagctttgc aacgcagaac gaacgcggga    2220
gagctaacag atccgggctc aaaatctcct tcttctacct ctcaagccgt ccacaaccct    2280
cattctccat tctcgcacta ttctcctcaa accagttgca tctgcggttc cctccatctc    2340
caaccctacg gctttcgtgc gagcttattt gttgcctata ctaaggttaa acccactcac   2400
tttgttgcct atactttgct ttgctatttg gttgctttcg tcttcgcttt tgttctttgg   2460
tttatctcaa gtgcacatgt tctcgcgacg ctgtgccgct gtaggggctg gtgggcttat   2520
agacctgagc accgaggcgt gggtttgctt cgactggctg tggttgttag caaggtgttc   2580
tcgtaaggta gttgtgttca gagctagatc ttgtgacggt gatgcgaaaa atgcgttcat   2640
cagagttaag tgatagaggg gcttttcgtg agatctgctt ctgtgatgga tctgctgtga   2700
aagcggtccg cgttctcctt tatcttcagc tctgtgtctg atgtttggga aatgcatcct   2760
ttggatacgg tgcgattcag gctgtatatt gaatccccga gttttggaaa tctttatgac   2820
ctcacttaat ccgaaagcta atgggctgta ttgagtgagg ctaatacaca tctctccata   2880
ccgcgcttcg gtttcgactc gtcttaccga ccacattgat tcacatgcgg agacatcagt   2940
gttggatcac ttacagtctg acctaaatag cacgtgtgct acacatagtt tcaatgccag   3000
taacagtctt ttgatgtgca gagtatttct tctcc                              3035
 
<210>12
<211>1221
<212>DNA
<213>小立碗藓
 
<400>12
gctagtgcat acctgtctcc tgaaatgcta tcacaccttg tcaggtgggg ttatggagtt      60
tatttgtagt agctaagcag ctcgaagagg ccagtgagag actgattttt caggggttgc     120
aagggaatgg ttactcgagt aaagagccag cgctgtcgag accttcttgg tgcaattcca     180
tctttgaaag tatgcatcac aagttagatt cgtggctttt gagcttgtcc tcattatttt     240
gcctaccatt tatgtttttg tggatttagc atccgcggcg tttaagtttt tgttttaaca     300
ttctttcttg taggttcgga tagaatgttg gggacatttt atgcttgaag agcgtcttgc     360
actgtcggac tgtaatgcaa tgcttgtgga cctcagcctg gcctgcaata cttgtatatt     420
cgtgaaaaca atcatagcga ctctgtgtta ttcttcccat gtcattcact ggctctcgaa     480
ctttgtcgaa tacatctgat gggcacgcgt gcagaagccg ttctttaacc tcgatgggat     540
ggattagtac gatttgctgt catttaaaac tatttgctat ccgtatttgt cttctgttcg     600
gaaatttgtg tagcttgtta ttttatggta tgttgtagga aatcagcttt ggtgagaaat     660
ttgtttcata acgacacaat ggaatgatga attaaattgt tgccagacca atatcgtatg     720
tgtcaatctg attcctcaat gcagatatgg ttgtggagcg tctgctgtac ctccttgttt     780
taaccgccgt atctgaacca actcgaacgt agtttgaaaa atgcactaaa tgatgcatat    840
tcaatcggtc aagtcatatt aaacacgcgg ttttgaaagg tagcaggtgt atataatata    900
aacatgtata tcgcaaaggc ccattcctga cattggatgg tgctaattaa gatctaatga    960
accgttcctg gcaatgtatc tatcaagcaa actgaagaca caatgaatcg ttgagtgtat   1020
gtagaaacac aaaacgatct tgtatttcct tttcatgtgc cagagtgagc ctcatcgatg   1080
tacactgata ggactcaact ttgatatttt ttgaagattc ttatgcctga ataaggtact   1140
tggaatcata gttctttgtc tcatggctta acttgattaa gatttgggga tttggaacct   1200
ttgtaaggag gcaatgaatt c                                             1221
 
<210>13
<211>3060
<212>DNA
<213>小立碗藓
 
<220>
<221>misc_特征
 
<222>(1)..(2301)
<223>a,t,g 或c
 
<400>13
agactctact aattgacaag tatgtgacta caaaaggcca caagactctc tctgcactat      60
aactataagg ctcatatttt ttgtccatgt agcttgtata tatatatata tatatatata     120
tgtatattta aatcaaaata tttttattca aaaacaaaat acaataaaaa accaaaaaat     180
attttaaaaa taaataaaaa attattaata cttttatgaa gctattattc aaatttattt     240
ttaatttcta atttaagatt tattattttt tcttaaattt attaaacttt ggaatttatt     300
tttaaaataa ataacaataa aataatttat agtgttttta ttgataagta aaattaagag     360
ctaaatttgg atcattatta caaagttata atacttaaat atttattgag atatatttaa     420
atttaattaa tattttttat taagttatat atatatatat atacacatat tatgaaatta     480
tttaaaagaa gttagtagac ttttaaatat tttttaccat gttttaattc tagtacaatg     540
tatttaaatt atcttattaa gttatggaaa agaagttagt aggttattaa atgttttgtt     600
agattggttg taaaggtttt atgataatct tgtatgataa ggttgtttag catagtttat     660
tttgcttaat taaaaaaaat tacatcttgt tacatttaaa tttaaaaaat acatactata     720
cacatatctg tatttagatt gcttttacaa tttttatctt tttgtttttt gcatatttca     780
aagaaagccc agcatgtgta taataatttg tataaccctt agaaattaat aatatttaag     840
taaataatnc ttatttataa ataaattact gtttggtttt taatncaaga atttaaaaga     900
cccaattgtt tattccaaag taatagtagc ncattaataa aaatccttca aaaatgaaac     960
taaacaaacc aatgcatctc aaatgaaaag gagaagaatg atcttacata gacanccaca    1020
aggagggaca tgacaactta attagactat gggtttagga acatcaacca ttccctacta    1080
ccaaaaaagc ttacatgatt ttaaataaca caatattcct tgtgactttt gtgcattatt    1140
gaggatatcc atctatctag attttggaca atgttttact gcccaaattt caataagaac    1200
cattcacata ttttgaaaca catttgatac actctacatt catgtctaga gtatagggac    1260
ttgggtttaa gattagggtt tcagattagg gcttgcaggg ttacagttaa aagttaggat    1320
taaagattta gatggagtct tggttcagag agaaaaaagg atttggggta aagtttttat    1380
gaaagagaat catcgcccaa acaagtagcg ggactgctga atgccttttg caatgaatga    1440
aaatttatca acgtccgtca atatgtacaa gaccatcaca taatggcccc cctgaccaca    1500
atttgaaaaa cacacacttc ctgcctggaa ccagtaatac aagtcattgt aggggagaga    1560
gagagaggga gagagagctg tagctgcgta taataagggc ctcgcagatt cagtgctacg    1620
tcgtatggat acaccgtatc acttctggtg tacaggttac taaatactac tcgacacggg    1680
gcgggccgat ctgcggaacg cgccggggcc atgtcccagg gccctaggcc cgccatattt    1740
ctctcgtcca cccgggccta cgcaaacttt cccttctcac tttcccagct cacgctctct    1800
gttcaacgca caacaacgcg tagccgagac gggttcggag cacaaagtca cccagcccgg    1860
cccgacccgt gcccgtctgg cgcctatctc tctccgcctc tgggcccgtt tcgctcctgt    1920
ccttgtgtgc tctgtctggc ccttcaccgc gcttcattgc ttcttcgacc gagagcctct    1980
tagctccgtc ttgttcacca ctgccgcggc actccgaccc cttgcatact ctcttctgcg    2040
gtgcctgctt ctccccatct cctgcatcgg tgccctgttg tgtttttttt taaaggtcag    2100
tccctctatc acgtcagtgt ttcgcatttc cgtgaagtgc tcagggtttt ttttgctgcg    2160
aactgtcggt ggagatgtgc tttttgtcgt gtttgatgtg tgtgcggtgc agcgatggtg    2220
ggtttcttgg aggaggaggg agagtcttat tttagtcttg ttgcccggtg tgctcggggc    2280
gcgaatgtgg gtttatggta ncgcacaggt ctgcgtttgc gatatgtgtg tagaaccctg    2340
tgccgagcga tcatcataat agtagtttct cgtttcggag gggctgggct tgtcaagtgg    2400
aacgcagagt cgtagttttg agagttccag acgcgcatcg cgcagctgta gtgagatgta    2460
gcttctcggt gtgtttagtc aaggtttcgc ttttccgatc tcggatcatg tttacgtccg    2520
tcctttaagc tggatctctt gttctttaca gaacttgttc atcgccctga ctaagttgct    2580
ccagtgttgg tctgaagacg acaagcctct ttctttcttg aatagtaaga agaggaattt    2640
aatctgaagg cttgttttgt acagtagttg gtcgtttatt ctttgatgtt taacttagcg   2700
tttcgttgta cttctactaa tgtactcttt agcttggtcc gaggctatta tttaatgagt   2760
catgccctga agtcgggaac agcgggttgc acctacaatc atatggatat gaggattcgg   2820
gtcgagtatt aacttgtagt cctttgttca ttgtttttga ttgcggggtt tagctggtgc   2880
aactgcctga atagcacgca ctgctttccc tgcgttcgaa tcgtcatcaa cattactatt   2940
gtgtaatcca catggctaca gctgctgtaa ggttctgcgt caagggcgtt cttcaagaaa   3000
taacctatgt cttccttgaa attaaatatt ggtggttgtt gtgcaggtcc gtattaaata   3060
 
<210>14
<211>4124
<212>DNA
<213>小立碗藓
 
<400>14
attgtccatg tgcactacta aacatttttc agcacactcc cttccccggg attgagctct      60
tgctgtgtag aactctcgtt gcaagtatca gtgattgcag actttgactg gtgagcacag     120
attcaacaga ggtttatttc gcagatgact atggtttgta aaaatagcag atatctgggc     180
tcaattctaa cggctggtat atgtcagtac ctataaactt aactgtttgt agctctagat     240
cggtgtggta aagtccggta ccaattcttg tcccttttcg tattaaataa agggtatttt     300
atttcatata tcgtcttttc cttttgtcat cacatctcta tcctgtgcat atcatggttg     360
tattctcagt cgtaatggtc tttcaagtgg aatgatggct ttgatgatgt gcacctggtt     420
gtgtctctgg gcgtcatggg cttcacatga gctgcggtta cagatcacgt ccagcctcac     480
acaattaact aggcatgctt tccatttcct tctgacgtaa atgacaggct ctgacaacaa     540
tgcctggcac ttcctgacgt gggacccgtc gattggtgcc gaagtcgagc aaaattctaa     600
cctccacaac tggtatcgtg aatattctag cctcttcctg agaacagtgc cggtcgatct     660
cgaattacct cgtaatagtc gtcaggcatg tatgtatgtt taaaaatact ccatgcggct     720
aaattatttt ttaaaattta tctttggatt tgaaatgaat ttctaccttt ttttacttta     780
agttacgagc tgcgattcca actaatgaag ttttacatac taatcagaag aatgtcgttt     840
tttgaaatta acaggttaag tgttttgaag aattaaagta tgatgattcg tcttttttat     900
atcaaatgag ttttgaatga ttcgtcgttg cattttttaa atcttggaat gaattgcgtg     960
tatgtgacgt gtatggaaag atacaaatct catgtagtcg agtacaagac aattacacct    1020
cttatgttta tggttcattt gtacatagtc tacgttagct taaggtcatc gtgtgtgagt    1080
atagtatatc tcattaccta atttgaagtc cagtaaatgt tagttatgtt accatcgacc    1140
agttatcacc gatgttgctg agaagcaatg tgaatcttag gaaacgagtg atatttgaac    1200
tggatattaa ttcatccgta atctataaac agacatgctc tactagcgtt aaaacataag    1260
ctacagcaca aaatgatcta aaaaaatgtc atcaatcata agctgtgtat aatacatccc    1320
atgaatatca acagtatgag tttgggtgtt tgtgcacacg taaaaacgaa ccctcgaatc    1380
gaaatgtgta ttactgaatt cacatgcaaa tgaattgttt ggatcattta ctgattaggt    1440
ctgtactcta ttaatgaaac atataataga tttaagactg tccagtcagt tttgaattaa    1500
gccttgggat ttgtggtctc ttcctcttcg gccactaaaa gtttaattca cattgatgtg    1560
aaagaaaaag tcacaactca gccttcgctg tgttagaaaa gctgcacgtg tgaggacttc    1620
tcaggcagcc tttccttttt cagttgagtg tcgaagtagg agcacacgtc gtcggtaacc    1680
ggctacagga ggtgtgcact gtccctttac cggatgtggg aagtcaccct atcctgagta    1740
tggctcacac ccaacgttgc tactccatcg cacagacagt tccacatgat agactgctcc    1800
gcgagaagcg tcactctcgt gcggtctcac ggcttctgtt gcggccgatt cagtgcaggg    1860
agtcgttttc gagcttgcga agtggctctc ttgtcattcc cctgcttctt ccggcggcca    1920
ttttgatgca gaattgcgaa ttctgcagaa tatgttgaga actcgtcttg ggggttttcg    1980
gatgaggagc taaaacccta gagggacgga caattctgtg gagcttgctt gtaatcctgc    2040
agtacaatag aataatagag cgacatgtcg acgctttcga ctcatgctcg cgtgtcgtca    2100
ctgtcatcag tgtcgacagc gtcgaatgtg gtggcaaatg tggctgtgag gccgtgtatg    2160
atagtatctc ttctgccggt tgcgagaggg ttgtgctcta ggaaggggtt gatgtcgcgt    2220
ggacctctcc gaagacattc ttgtatgaag agtgtttcag taatgccgag agcttctctc    2280
ggtcaactgc ctgaccctga acaggtggac ttgtacatta atgcgttgtc ccagacgccg    2340
gacgccctgc agggattgct ttcgcggacc gaggggctct ttttcacatt ggcggatgtt    2400
gctgtggcga ctgatcccag ccaggtcacc gacgctgtag tgcagaaaca ggacggaggc    2460
tggcttggag gtgtctcgaa ttctcttgag atagctctta ccgtaagctc tttttatttt    2520
tatttttata tatttttgtt tcttttttga actgtgaatt gtgtatattg ttttcctctg    2580
aaattttctt tcagaatcta ggtggtaaaa cattctgata cttatgctta ttgcacggtt    2640
tatctaattt actaagattt agtgtgaatg tgatgatata attttactaa aatttaagat    2700
ttttctaaaa tttaattgca gctagtgtta tctttcgagt cgatgctaaa acattcctgt    2760
tgacacgatg atcatgaaag ttagatgtgg cttaataaca aatgcaggaa ttaatgaatt    2820
ttatttattt atttattttt gcagtttttg aaggatacca ttgctaagct aggcatacct    2880
tattcgtatg gtttcgcaat tattctttta actattttag tgaaggcagc tacttatcct    2940
cttacaaaaa agcaggtttg ttgttctact gattttctta ttttgtgctt tctttctttc    3000
actttttgcg tacaaatcat ttttgtgata tactaattta ttgtgtaaaa ctaaaagaat    3060
tactatattt ttcagctaaa tatctgtcga tgtcctgtat ttactcataa gttttatggg    3120
tttaagatag tacccagaca ggactgagtt ccattggtag gtcagtactc ctgttagatt    3180
agggaggctt ctattgttgt atatctaatt gaaagtggtt atgtttaaca ggtagaatca    3240
actttagcta tgcaaaactt acaacctaag ataaaagcta ttcagactcg ctatcagggg    3300
gatcaagagc gcattcaatt agagactgca agattgtata agcaggctgg agtcaaccct    3360
ctcgcaggtg caattttgtc gaagtcctcg aagcattaat gttaagaatg cttgcagatc    3420
actttccggt ttttgacgga cacaaaatac agtcgaaggg actaatactc aataacttgg    3480
ttctgtatgg tagctcataa gggttgtggt ttatgatttt acagggtgtc tgcctactct    3540
cgcaacccta ccagtatgga ttggattgta tcgtgctcta tcaaatgttg ctaatgaggt    3600
attgcatcat gaactggagt gcttgaaaca gttgtccttg tgcggcatgt tgttccacct    3660
tagtttattg tgaaacatag gcgtcattag acaatccaca tttagagtaa tacaggaagg    3720
tcttaccata tattcatttc aaagaggttc aacagacatc gtaatgcaaa gttctgtaca    3780
ttttctcttg acttcaacgg gagaatatct attcttaaat gagatatttt ctgtggtact    3840
ggtattcaag tatgaatgta tgtaactatg atttacttat gcagttctgg ctttgcaggg    3900
gctcttgact gaggggttct tctggattcc atccttggca ggccctacaa cgattgctgc    3960
tcgttccagt gggagtggca tttcgtggct atttcccttt gtggttagtt agtcccttca    4020
gatgcttgtc ttcgttattt tttttccata tcaaatgtaa tgatgctggt catacagtaa    4080
catatagtga atttgttgat caaaatggtt gtccatggaa gctt                     4124
 
<210>15
<211>3053
<212>DNA
<213>小立碗藓
 
<400>15
ttgttgaatc atgttaattg ccaatggtta ttaatgacca tcatattgta cctggaatgc     60
attggaaaag taatgttcca ctaaataaaa gttgatccac caaatattgt tgtctagtca    120
tatcgacaaa tagattcaaa ataaattaaa attaaaattg aaaatgtata aacattggca    180
tgaaaatgat attaatttaa aacaattcaa aacttataca attatttaaa atacattagt    240
caccgggtta aaggagacag actgacagaa ttggattgcg gcaatcagta gcactgcaca    300
aataaattta acatgaaaac attatgattg ctaatactct gtttgcatgc acttctacaa    360
caacaaaaac aaaaaataca atcaaacaaa acaagcaaac aataaatgat tttagatttt    420
gcatgataca agcaccagag ataattatga ccatgtgata aatacaattt ggaccattta     480
tatcctacaa aaaaaagaaa aaagaaaaaa gaaaagtttt tgtttgtatt tgatatcttt     540
attttgttac caaaattaga taattgcaag ccttgtattg tctgagatgg aatgtatatg     600
taacacattt gagcaaaaaa ttaaattaaa ttaaattaaa taagattttt ttatatatag     660
taaattgtaa aattgaccca aacatttact aaatcaaccc acccattcta accatcataa     720
gaagaattcc gctatcaaat ccaggttggt tgaaaaccaa tgaaaaaatg gttggcttct     780
caaccaatga taatggatgg gttaatttaa taaattcatg ggtcaattta aaaattccat     840
atatataatt aaaaatcaat tgcaaaaaat attttgacac aatcacacgt gttttgaaaa     900
tcatacatgg acaaaaatac aaagagattt tttaaccaat attttggaaa cacatttagc     960
aaggtgtcca atgcccttcg atacccacaa gaacacacct tactttgccc atatttaccg    1020
atatatgctg cagtcagtta gggttgaatc cctgagggag gggggctccc gtgtgaacaa    1080
agtccaatgt ggggccgccc aggattaggg caccaggtgt gaacgaggct ccacccgagc    1140
gagagccagg aatttgaaac tggcatggga aagggggttg gttccacctg atggcacctg    1200
cccaccacca ctagtaaaga ttcaatgccc accacactgg tttttgaata taggatcttc    1260
cttctccttc taattcttct cttgatggat gaataatata accgatgaat gagtgggcac    1320
atggacgggc ctcgccccct ctctactctc tgcaatacat tacaaaatac atacatgtat    1380
acatagggat ttgatgactt caatacatac acactacaaa accgggtcag gaggggggta    1440
taaccaggca agcccgagtg gcgggcagta acaaatacac acccccaaat cgtatgggcc    1500
ggacacgtct gagcgacacg cgggtgccct gccctcctgc cccttccctc gccccttttc    1560
tctcgaccgc ctgtcgccgg cccggcccag actcctgcca acctgggaac caacccccct    1620
ttttggtgag tgctcttcac ttccctcgca ctcgctgctc aagttgaggg agggagggag    1680
taggagtagt cactcacccg gcctggcccg gtccggttcc ggtccgcggg ggctgcgttg    1740
cgcgacccgt tctcgtgggg ttatctctgg ttctctatcg ctcgctcttg tgcatcgtac    1800
tgctcctact ttttcccatt gttgctatgc tcgctgccct gcgctgcttg gccgtccgtt    1860
gtgcccctcg ctcgtcaacc aagcactgca gttcgctccc gcattccttt ctgcagcacg    1920
gtgtatctct ctctctctct ctctctctcc tcatctgttt agcgctggtg ccggttctct    1980
taaggtgaga gcttctgttc tatcggtgtt ctcggttttg gtatgtgtgg tgaccgacga    2040
tcggtttgtt gtgcacggtc gctggatgta tggtcgtctt tgttcttgtt tagttctgtg    2100
tggcgattaa cgtgttcttg gaggagtatt tttggccttt gtctgctgat gcgctcagca    2160
gcgttgcgtt agtgtaggct tgtgcttcac atgagcgtgc cgcgcgtcta ggcgtggtgt    2220
ttgagttgaa tcttttgccg aatgactata gttattgatt tcttgttatc tgaagatctt    2280
gtgctgagat atgtggtgta gggattcgag aagtgctatc cccttgttgt gatgaacagt    2340
tttcatttga tgtggttatc atactttgga gccttgcatt ccggatcgtc attagcttca    2400
tctacgtggc tggatttttc cgtcaaccgt aggctgaagt gccttaaggg gttacatgtg    2460
ctgagttgac tacatgtaac aatggcatgc aaactgattg cgtgcacttc atacttgtat    2520
tcagttcgtt gtagagtccg ggatatatgt taggtagaat aaagaatctt atctctcggc    2580
attcgaataa aaatttcatc ctttttgaat gcaccttgtt tgaaaggtcg ccccatgccc    2640
acggttgact gagaacaatg tctgcgcatc agttactgat ggtcgcacct gttgtcacta    2700
atttgagtga ttaaggtttc ctaccggctt tttcttttcc actgatttag tttattcttc    2760
atcaagttta caaatattgc tctgtatatc acggtttttg ttagtctttg atgtaatcat    2820
attacctggg tttattatct agtgaactat gactgatatg ctggcgcata ttctcctact    2880
taatttgacc ttattagaag atgttcgtac ttagagtacc ttttacttaa tgtaactgaa    2940
tctatcattg ctttcgttct taatcgtgct acaaaattta actcattctc tcgttaacta    3000
atgtttttga gcacttgcac tgtttttgaa ctcctgtagg atcattctaa aaa           3053
 
<210>16
<211>1879
<212>DNA
<213>小立碗藓
 
<400>16
atctgtactg cacagtttta catttttcag gcttgcattt tgctgggatt gagttcttgt     60
tttgatagaa ctctggacgc aaatgtcttt gactgcttag ttgggctggc gagcacacag    120
taagaagtgg tacatgttgc cgaaactatg gatttgtaaa aatgaaacgt atctgggcgc    180
ataacgaact gcttatatat gtcgctgtct gttaacttca atctctacat gtccagatcg    240
atgcggtaga acccgaccat tttttgatcg atgtttgaac ctttttatgt taaataaaag    300
gtaccatgtt ttcagcgcat taatcatatt tattttggtc actatggact tgatgtacac    360
cggatgttac agctcagttc tacttcacag ttattcactg acttgccctg aaaaagtcgg    420
agtgcagatc tcgttgtgtt ttggtaatct ggttggccag tctcagagct ctattttttg    480
atgaatccag ttgattggca ctcaatgttt ttttttattt tttactttta tcatagtgtc    540
aaggttgcta cgccaggaat gctgtgaggc acattctacc cgtatgaatt tcctcgttcg    600
caatagctgc aagctcaatt taggtttttc tgagcaagtt gtagaactat cgtgtactct    660
caccagattt cagcctctca gtgctgagtg ctttcgtcac gttaactaat tgtggaagat    720
ttggaatcat ggttgcatcc cttagtttga cagaattcac agtcgttagt tgacctctct    780
atcttggtcc accatatgtc aacctgttca agagggctgt gctcggttag gtaatcactc     840
agaagtttct tcctacagaa aacttgtttt gtgggcatca tctacgtgga agaattgttt     900
gagcattaaa tcattcaaca ccttcagtta catgaagtag gttggaagca gtgccttgaa     960
gagatccttc acagaaagcc tctcaattct catgaagtct gcatctaact tcttttgaag    1020
tttgtacacg tgtgggcaga attgaagttg gttttgtgtt gtttgaaaca actgtaattt    1080
aataaatccc aaacaagact aaggccatct aacgttttca catgttttaa aaaattacat    1140
tgaactttgg gctaccgtag ttttagacag atgcaattaa aaataaaaag aaaaaaatga    1200
aaagaaaaaa gtcttgtttg ttttagttgt ctgttttgta cagttttgtg acctatttta    1260
gagtgtcatg tatcgaacat ttgactcaca attataaggt tttatatttt aaatgagtct    1320
tgttgtcttt tattttattt tgttctacat tctgtaatat taaaacttct attgaaaaca    1380
caacaaacat ttaatttcaa gtttttcaaa tttatatatg catattttgt atgtaaattg    1440
tacaaatgtt cataatgcaa attgaaatat ttaatgtaag attatagcac ttaaacctga    1500
tccaaaagat aataattttg ggcaaataat taaaattatg atagacaaag tttagaatgt    1560
tgtaataaaa atttatggta agtgctaaag tatgtaaaac aaatttcata aagaattgct    1620
tgtagcattt tcaagagaaa aaaataaata cttacgacta tttttaaaat gacacaaata    1680
gtaaataaca atatattgat gaggatatat atatataatc aaaattaacc attagtgatt    1740
tttaacctgc atagtattaa tgtatgggac cgcaaggtag acacctacct ctactggata    1800
gcacctctca tatacacaat aaaactttta ccttgctaaa agtccaaggg aatttacaaa    1860
agaaattctt ttaaaaact                                                 1879
 
<210>17
<211>1823
<212>DNA
<213>葫芦藓(Funaria hygrometrica)
 
<400>17
ctttcgtgtt gcctcaagag tgcctcgcga agaaagaagg ttccagcaac aactagagaa     60
tgggtacagc attcataaaa ctacagataa ttatccttca aataagtaag aaaaaagaag    120
gaaggaattg ataaataagc aagaaattaa gcaaagcagc cactcggcta gacaaaagag    180
actgcacacg ggtggccaag gaaagcgccg gtcatagggg atatgcggtc atggggtcac    240
tgtttccggc agccggaatc gattgcaccc tcgcagtggc tgacgagtca gaaccgggtg    300
ccaagtggac ccagctcagt cgcgggcagg ccgaggtggc accgaagcct ggtcaacgtg    360
gaatggatac gaatgtactg gatacgagat acgaatacga tacagtagag aaagaacgcg    420
gcgagggtgg cacgaattcg cagacacaac cgagtcggcc tgacaaggcg ccccgcctgt    480
tctgccgccc cttccatcac ccgctttgtc tcattcatcc acggctcctt tttagtgtct    540
ctgcgcgggt cccaccccct ctcactggac tcgagatgcc gccctgcgct gcctgactcc    600
acctggcccg gcccgacccg ccccgacccg ttccatggca gatgttgatc gccccgtctc    660
gcagctcctt ttgtgcaccg cgtggcttcg tacttggcca ttgttgctgt tgctgttgcc    720
ggtgctctgc tctgtcttcg cgaggcactc ttgaggcgat tttttttgta gtagcgcaag    780
ctcgttgtgg agccgcgccc agtaaatcat ctaggcttag tctgtatcca ctaccctccg    840
ctgcgatcac ccctgcttcg ttgtcggcgt ctatttctca ggttcgagtg tttctgagtg    900
ttggcgagga ttgagtgtag gagcgggagg ggtttgctgt tgtttttgtc gctggcggat    960
gtcgatcttt cgacgcgatc gcatttttct tttgattgtt ctgttttgga gaacggaatc   1020
ttttgattgg atatatagat tgtgtgtttt gcatgcgttt agaacgttta cacgggcgat   1080
gcatgagtcc tggtgtcgtt tggaggccac ggatttagta gtttcttgtg caaggtggct   1140
tagatcttgt actacgagat gtttctccat gattgtggtg gcgatgactt tgtatacttg   1200
acgtgtagtt taatggtgat gattcaatta tcagtggtgc atgattttgt tacggatcgg   1260
atgatcctgg atccctgatg attctttttc aagtaggttt aattctctgc aagcgcgaac   1320
ggttggtcgt ctcattctaa tggtggcatg atcgcttatt aaattacgtc gactgaattt   1380
tctccgtctc ctgaattgtt ggagtagcgc ctggaaattt gttagatgga gatttttcca   1440
ttatccggga aattattcta ttaattcttt tagactcact cgctcataac gcatattgaa   1500
ataaaccaca gatgattgct tgatcactta ttcatttgaa tttgacagaa tacttcccct   1560
tcctgtttcg gtgaattaaa ttatttcgat atttagaatt taatttaata ttatttttac   1620
acagtacaac gaatgcaaag tggaggagtt gtcaggacaa ctgaatccct cagtttttct   1680
agtctatatt tctgaagact tccacacaat atagtagacg ttctgtgcta tcctgactgc   1740
aagacaaaat ttacgacgca aagtaacatc tcctttttta atctgagatc tcttcaaatg   1800
gttgggcagg tccgtattaa gaa                                           1823
 
<210>18
<211>419
<212>DNA
<213>葫芦藓
 
<400>18
aggagtgtta cacatctttt acttttttca gcacgcctct tcgctcggct tattgaactt    60
cgattacaaa cttgtgtggg taccgaacta ggccggctag cgtagatcga gtagaggtcc    120
ttgttgcagg aagttttcgt ttgtaaaaat agctgatatc tggacacata cgagtggctg    180
attggattca gtgacattca cattatttgt taacaggtcc agggttgttc gtagagtctg    240
gccccatttc tcgtcggaat gttggcgccg ttttgtgtga aatgatggtg attatggtta    300
aaatgcatgc gtagtcctgt tgactatggc tgaatggata agatatattt ccatcatagg    360
ttagatttca agcggagcgt gaactgtgac gctcaatcac agaatgcgtc gtcttagcc     419
 
<210>19
<211>1333
<212>DNA
<213>葫芦藓
 
<400>19
ggatccgaga ggaaagagag agaagaggga gcgactcatc tagccaggcc cggtccggtc     60
ctctgccctg cctggcgcga cccgttctcg tgcctatctg tggttctcta tcgctcttgt    120
gcctcgccct gcacctcctt ttcccattgt tgctgctttc tgccctgtgc tgcttggccg    180
ttcgttgtgc ccctcacctg tacactctcg cagccaagca ctgcagtggc agttcgcctc    240
cgcattcctt tcgtggccgc gtatcccccc cgtcatcttt ttcgtcggtg acagttcttt    300
gaaggttaga gcctctgtcc tgctgccgtt ctcgctgtgc ttgtgttgtg gccgacgatc    360
gggtttgttg tgcaaggtcg ctgtgcgcat cgtcttgttt agtattgtat gtcgattact    420
gtgttgtagg agcagtggct aagctttgtc cgctgatgtg gcacccaacg gcgtcgctca    480
agtgtaggct ttttctttac acgagcttgg tccgcgttta tggtgtttgg atgttacttt    540
tttcccgaat gacgatatgt tgtgatttct ttacaacaag agattttgtg acgtgaactg    600
tagtttgtgg attcgaaaag tgttgtttcc tcgtttttga tggacattac ttatgccttt    660
tagttgtcac ggttggtggc tttgcattct tggtcgtcat tagtttcatc cgatgctgga    720
cattcgctac catcccaagc tgaagtgctg aagttgattt catatgttca gtttgctgtg    780
tgcaccagta tgagtcaaaa ctgattggat gtccttcaca acttcattct cttcatctta    840
aagtcgagta caaatcaata ggtacaggac tcctatattt tggtgttccg ccatagttat    900
cgtctttcgt caaaattacc ttattgagag gacttttcct tgcaaaggtc tcatcgagac    960
caatctctca gagtcagata cctatggtcg cagcagaaat ctctagtcaa tgtttctaag   1020
ctctcctaag gattttcgct ctttcatcag atgtattcta tccaactcca agttcgcaac   1080
aatttcttca tacatcattg tcttctggtc tttctgttct gatactgcac cgattcattt   1140
taggatctta taatccgtgc ttgatgtgcg gatatgtgaa ttccctgagt gttcacctca    1200
acgtactcaa agttgttcta ctttcagcat ctttcagcca atgcggcaga tgcgatcact    1260
tccgaggact ttaaaattct gtactgtttc tttaaaacgc ctttttcgat tctatgcagg    1320
atcattgtaa gcg                                                       1333
 
<210>20
<211>3289
<212>DNA
<213>葫芦藓
 
<400>20
atgcatggca aaacatcccc tgtcttccat gatgagaaag gcgaacctgg actgcttgat     60
ggtcttccca ggtatctcat tgtgcttcgg tagttgttga cgtcttcact tctgcttctt    120
tcgcttcctc ttcttcttct tcttcttctt ctttctctct ctctctctct ctctcccaaa    180
ccttccttct gtcttccttc ctcttatttt cctatgtcaa tgaagtttag cacctcctaa    240
aatttttgga tgctgttttt taaatagaag ggacgggatc aaaggacgag tgagtgtcgg    300
cttttgcatt gcttccgttt tataacaacc tattaaggac gtagatcgtg tctgtaaagt    360
catctcttat agccttttat agtcttttta agagagaaga gccacctctg agtttcttat    420
agattcggac aagagatgtg acgacttagg aagtgtcttt cggaattttt cttgtgataa    480
tggcgttgca tttcttgtcc tgtcttattt ttaactgaac agtatgtacc atttttccgt    540
atagtcctta ctttataata tgtcctcttt tctttcgcct cacgttcatc atattctttg    600
atatgtacta ttaactttcg ctatctgttt tcttgtagtc ctttcaccgc gtgccgctat    660
cacagcttgg tcatagagga ggcctcattt ccagctgacc aactcgagat tacagcatgg    720
actgaggacg ggcttgtgat gggggttcgt cacaaagtct acaagcacat ccaaggagtg    780
caatttcatc ctgagagcat ccggactcaa aatgggatgc agatcgttgg aaattttctc    840
aagattttag atagaaaaga ggcggctgac aaggaaggag ctgaaatgaa aattttggag    900
agtgtttgag tgatgagttg tactggtata tcttttcttg tgcaagattg ccagcatttg    960
tcagcttgct tttgttagag tcctgacccc cagcgtataa ctccttgagt atatgcccaa   1020
gcaggcctag atgctgctgc aataaccttc tcggtgagac agggtagttt ttgaggtatt   1080
tttgcacttc cagatggagc tactactaca aatatctatc cttatcttac gttaaactac   1140
gatggaattg ccatgatcac tcaggtacgt ttaagttgtg attggacttt tagtgattac   1200
tttcagagcg agctatcaaa ctggtgcttg gaggagcaac gcaaggaatg ctgaattttt   1260
ctaatgatct aattcagctt aagtttttcg tcaaacttag tgatattttg aagttcatct   1320
cgttagtgaa acatctcaaa gaagtacgcc attaaattat tgcagggctt gtgatgacat    1380
tatttgatag tttacctctt aaactgagaa cgcattgctc tcctttgtat agttccagtc    1440
atttgaaagc tctatttgct ctctgtaact taagccttgt tcaaggcatt taaattccct    1500
cttccacgat aaaaatggta gttatgttgc tggttggaac tttcaagata ccataacatt    1560
gtggttctca ttcacaacgc aggaagtttg ttgacctata tttttgaaag tggcgagtga    1620
aattgtttac tcatcacttt atgtgtgttt ctagtatgtc acttcaattc cttcctcaac    1680
tgtgcctaat ttttcatctc tgtgtgtcac gagcgtaatt tggcttagac gttggaacat    1740
tctaaggttc cagtaaccag ttttcattta ttatttttaa attcacagcg cctcaagtaa    1800
tgaaaggaca aacgccgatc attgcgcaac tctaattgtg acggtcttca agacaactaa    1860
cggcaggtca ctctcttgtg atgttctcgt tgttgtcaaa cctgtataat ggcaattcat    1920
ttcgacatca cggcaaactc atgatggttt ttaacgtgat ttgctcacca cctttcattc    1980
aaagttatca ccgacaccct atgggtttaa ccatgttatc tgaaagcttt ctctacgtat    2040
gtatgaatct gctcattagg gtgaatttgg aacttaaaga atctcacacg atgtccatga    2100
attttgttac tggacaacat atactgttga ccacatagat atgcatgttt agaactgcaa    2160
aaaagtttgt tcacgaagac agaacgacta gaacgcagaa tacctgcgat cggtggaatg    2220
ggatcatttg cagtaaagct agtaaaggat cgaaatagac gcagagtaaa cccgatgcgt    2280
tagaggggaa tgggagatcc acaggactcg gagagaaaat gcaaccctgc gggtaaaaat    2340
agagaacgcg aggaggaagg gtagccagaa gagtttcacc gggatctaca gtataagccg    2400
caaagggagc cacgggtact agtgccagct ttgcagcaga gagcgaacgc gagggagcga    2460
acagatccgg gccccaaatc cccttcttct atctctcaag ccgtccacag ccttcattct    2520
ccatcctcgc actattctcc tcacagcagt tgcatttgtg gttctctcca tcttcaaccc    2580
ttcgactttg gtgcaagccc gcttgttatc tatcccaagg tttcacgcac tccccccttc    2640
gctgtgtgtt tcgttgcaat atttttggct ttagttttta ggtttataca tagtgcacat    2700
gctctcgcaa aaccgtgccg cttcagggga tcgtggttct gtagacttga gcacagagat    2760
gcgggtgaac tcttagtggt cgccgctgca tccccagagt agttatgcta cctaaagaag    2820
cgtgctcgta cggtcgatat gtttagagat ggatatttag acgatggtgc gtgtcctgcg    2880
gtcatcagag taggtgaagg gatttttcgt aagatctgct tttgtgacgg atctgcaatg    2940
caggaggtct gcgtctttct ttttcttcag cttcgtgccc aatgcgtcaa atgcgcaccc    3000
attgcacaga gtgctattaa ggcggcttca tgaagctccc agttttgtga atcatgttaa    3060
cttgtccact gatcagaacg ttcgggctgg catacgtgaa gcgaatacac atttttctac    3120
agcatgttcc ttattttagt cttcatactc actgcttcga ttgccggagg gcctccatgt    3180
tcgaccacat cttcacacgg ggcttatcat ctgacctaaa tcgcacgtgg cctctgtatt   3240
gtgtcaatgc cagtaacagt ctttttgatg cgcagaacat ttcatctcc               3289
 
<210>21
<211>937
<212>DNA
<213>地钱(Marchantia polymorpha)
 
<400>21
catatgcgta cggagttgtg gtccccgatc gccgtagttg ctgttggtgt ctggtcacag      60
aggattcttt gcttcgcttc ctaatgtagg tggccagggg tggatcgtct tcctcctacg     120
cttcgtttgg acacatacat ctggatcttg agaggaacac gtgaattaga gttacatgcg     180
gtattgcgtc atctttgcga ggtaacggcc gcgccgcaga cctagcggtt gcttctgcgc     240
gactcaagga atcttccctc tcctgctcca tcactggaat gagagttgca gtctgatctt     300
tgggaaatct ttcatcttgt tgaccatcga ctctgtcctc tcgatgaggt ctgggatgat     360
tctgcatgtg atactagcgc agtcttcatg attgtcacat gcatccagat gcgacatctg     420
gcgcgctttg tgcttggtca tagccgcctt cttttatctt gatttgccta atgagcccca     480
tttccagacg tggacggcag atcggtcata aggtccaaga gcaggaaatg ctatgaggcc     540
gtttgcgtgg tctacctctg ctggcctgcg aaaagactgc ctgtccgact tcaatatctt     600
taaacattag gctcttcagt tgtctcgctc agaccattat tatgagttat tgttaccgta     660
gtgtgttgct atgtcagccc gtgtagtctc gtcaatttct ggagggtaat gcgaacttgt     720
tcatgacggc acgtatctcg tcgccccgaa gatcaccctt gttgagaagg atttcatgcg     780
tctgcgtcct cgttcatgtt gacatgaatg atagaagccg ttctgaagac acgaaatgtg     840
gttgacatat acattgtgat gctcatgtct tttgtcgagt caccaagatc cgcaaccatc     900
tcatcttctt tcattttggt taggtaactt cgcgaaa                              937
 
<210>22
<211>3025
<212>DNA
<213>地钱
 
<400>22
tcatgatgtt aagcgttttc ataatccaaa gaggttttgt atatagataa aatttacttt      60
ctgaatatgc aagcatcata ttctaaattt aatcgaacat aattttttct gagctttctc     120
tttctttttc tttaaattaa atttccttca ctgcaatttt tttattacga ctcccacgag    180
gagtattttc cgactataga tcttagggta tataactata tatcacgctc gttctaaaca    240
ttttttctaa ttttatgaaa agagataaat atattaataa tataggttat ttagattatt    300
gaaattcaca gaaaatacca tttttgtctc attcgatatg ttctagatgt gtgtgcgtat    360
atggtcatat acttgggata tttttaaatt gtgaatacaa gattataaca aagttatcat    420
tgcaaaatac taaagataag ttatctttgg tgagaagaca tgatatacca tctgcatatt    480
acttattcac caattgacca aagatttaca atctaccttg atgaaccata aatttgagaa    540
ttttatatgc agatatttgc ggatctttcc aatcattatc tagctcttgt ttacattttt    600
gctttcacaa aaatgcaata atgtgaaagt tgatgcaata atccctttag gttttttgac    660
tcataacaat tttctctcca aagcattgag attcaatgtg gacgtgatac ataaattcac    720
atcttgatta gttacatata aatgtggaac tgccgtattt gtcggaaagt tcatacaatt    780
ttttttgttc atttgaagat cataagatag ctgcatatat caccattagt gatgatatga    840
tatatgacat gagaaaaata taacttaata tgaaggaagt cttgatatgc cttgctatcc    900
ctaggttggg gtaggtcttt ctttcatttg cgattattat tactgtgagg aatattcggt    960
agaatggatt ccttggaagt gttgtatttt tgacctctca taattaagca cagattaatc   1020
ccttcatttg tggtctatca atcaagtggt ctacgaatga ctctaatttt aagattattt   1080
ttgtagttgt gtggtgtttt agtagttacc aatcttatac ttgaaagaaa atgaaagcaa   1140
tgattactca tactactcaa tgccaagatc ggaggctaaa tccaatgtat acaagtatag   1200
aaatttgtaa agagttaagc tctttctttg ttcatgtagc tttgaggctt tgtaaaaata   1260
tggacattga ttcggatata gaggtgagtt gtgcacaaga gatgaccata cttggtgtca   1320
aggtgtagca tttttttcag attatttata agaaaataat caggaaagga aaataagtag   1380
tattcatcct agatataaca tttgtcgaga aatctacgag ataaacattt tttcagacga   1440
gaacaattct tcaaattttc agatgcaagg gtacgcattt agcattgcgc tgatattaga   1500
gctagtctcc tattgcatgt ttgatttcat acatgtacca cccattcttg ttactgcagt   1560
gtgtgaaact tgttgaataa gaagttccgc aattatttca aattattgag agtcttctta   1620
cataattttt acttatccaa aattcttaag aaccccacaa taaattcagt gatacgcttt   1680
gaatggctca ccagttactg gactgccaca attcgcagca ttggagactt ggccaactca   1740
accagagaag ggaccacgtc gaacgatcta cctccctccc agtgagtgag tgagtcttcg   1800
ggtgcagtat tgtccaagtc ctggaatgtc gatccagccg caggaccagg aagatcgggc   1860
cgggtacagt aaagttgcca taacaatccg gcaacgaacc acagatccgg gacgatctag   1920
cgggaagttg aagtccaagg ctcggggcac atctccctgg tagaattaga atccatagcc   1980
agaattctat ctcgaaacct tgtttcgcca gcgttatgat tataatcaag cgtccccgtt  2040
aatctgattc ctgtgaaagt tagttagtaa cttcataccc cagcattatg attataatca  2100
agtgtctcag ttagtctgat tcctgtgaat gttagttagt aagttcaggc cttctcgtaa  2160
tagcttcttg cgtataatct gaactgttga taatggttaa actcttgaat tacgacatat  2220
cagtcccggg agattaatct gcttccgcta agctcgagga tgcacagcag taattttggg  2280
tcgtttggga tttgataaaa cggacgggaa tatgcgtcgc gagttccgag taggagtgag  2340
gaggaatgca aaccagcgga ccacgtaaag aggcccacga cagtccagca gcccagctgt  2400
gagacacaag ggggacgaaa gggaccgccc aggccgacca cctgatgtca gggggagctg  2460
gtgcgagcgg cgacggacat ggatcggcgt ttggttgcgg tccagaagcg ggcgaggagg  2520
gatccgcatg agtgacacag tgggggcaga attgggagaa gatcgtgggg gtaattgaga  2580
ggggagattc gggttggggc cgagacaggt aaggaacacc gatgatgctg aggaaaatat  2640
gaggaattcg tgagaatgcg acagggcgag agcactgtgg ggcagaatgg aaggggggcc  2700
agcgatattc gagcaataaa ataagagcgg gggacattcg aaaagaggcc ccatataaag  2760
ccgatcttcc attctgtttt cacagagctc ttcgtcgaac agagcctctc aaactcgctt  2820
tgtgctccca gtgcttctgt ctcggatctg ctctgctcgg cttcgcgctt gttgttcttg  2880
tgaccatcac cgccttcagg acgctcacgc ccaacgcaag aatttcgagt cgaagtaagc  2940
gagcagctca atcgcttcgt taacgcgttt gcggagatct tcgaggtttc gcgttcgaag  3000
ttcttcggac acctccttcg ttaac                                        3025
 
<210>23
<211>909
<212>DNA
<213>地钱
 
<400>23
aagcttagca agcagctctc gcagcggatc tgctcttctg ctgctccctc tgcttcctcg   60
tgctacacgg tcttcgtcct cgcttcctcc acgcttcctc gcgctctctc caggtactcg  120
tcgcctcgcg ctctttcttc ttcctagttc gtccgttcct cgtaccggga tagggcggtc  180
gcgggtctcg tgagggtttt ttcgagcaag gtgcgtgagc aagttcatat cggtgggcaa  240
tgcatggggc gaacctggtc gggccctttt ccgaggccgc cggagagcct agtctccaag  300
ctgtagtatc ggtgttctcg aagatcggtc ggtgtctgca tctctccatc tcgattcgtt  360
tcgtctgagc tgatccgccg gtcgattttg acgatgtcgt gtcctcacct acgcaagttt  420
ggttccgagg attagttttg aagatgctgt caatgggaag tttagctctt ggttcgtgat  480
tagtttggac acggtcacat gaatcgtagg gacccaggtg tcgggcggaa tcttcagcag  540
tcatttcggt ttccgtaacg ctggatttaa gctgaaaacg ttcatcgatg gattgcggat  600
accatgacct aatggatcgt ccagcttatt cttctggaag tatagacgtg tgatggctgt  660
ggcctgtggt agggttggac acgcccgcag tggtctctcc gaatttgaat gtcgcaatgg  720
tcgatgtgct ctgccgattt ggggaatcga agtggcaaac cggtcgttcg gactgtcgag  780
tgtatgcctg ctgcttgtgc gatgtagtgt ggatttttcc tccgatgttt tccaaacgtg  840
gtcgggattg cagttcttca atctaccagc ggagctaatt tcgtctttgg cttgcagtct  900
atcgtcgat                                                          909
 
<210>24
<211>2146
<212>DNA
<213>小立碗藓
 
<400>24
atacaagagt tataaatcat atacaatgat tactttcata taattgttga atattattgt    60
tacaacctaa gtaacaataa cattcaatta aacattcatt gtggttttca agcatattaa   120
tcattctttc ttctctaccc tatagtgatg ggaaattatc ccaaactcaa tgtcatactc   180
caggcaattc agaaatatag tgagatgaat accaggaata tttattcaca tcgaccccta   240
tcgccgggca atgccactcc caccgcggaa tgagaaactc cttgaaaaaa caagtccctt   300
cccagctgcc cgaaatcggc cgcctggtca gcacggcacg acactgccca cgtgcaatcc   360
tgacgtggcc tctacgtccg gaaggcggcg ccgttagcga tgtcctccta tgcaagttcc   420
tcttgtggcg gggcagtgtg cccgccaact tcaccgtcac cctccacccc aacaagtggc   480
ccaaattact caggggcagc ccagcttcga aattttaagc ggtgaccgcc ccttctcatc   540
gtcacgcgtt acttcttttt cactcaatcg agtctgttta ttattggccg ctaggaaatt   600
gcagcttcca actccgcatc accgcgtgca gtacagtgga gatcttcaag agtgtcctca   660
ccaggaattt gcaacttgct ccttgcaatt tgtaataaat ggacagagaa gcctagattc   720
cgcatccaca gtgatgggtc acgtatcaat aagcgaagct gcgttggcaa ctatggcaat   780
tggtttggtg tcttcgttcc tgtcaagttt gaaaagaaga gggagatctg atttcttaat   840
aagtgtcgac ttgtctgggt agtggattgc gtggggcgtg tcgtagtgcg acgcgatcgc   900
atcaaattca tcgcctcaaa atttgtcacg ttgttgggtc aattgcaacg aactgcgatt   960
gaaggattct tctcggtggc cttcaaattt gctttagtat gacagaagtt ttgcagctgt  1020
actcggcgtt tggaaggagt ggaagtgagg tggatcacca cgcaccggag ttggtgaatt  1080
gtttactgca gaaaaaaatg gctttgatca catcagaatg attgatgttt cagcttgaat  1140
ttcacctcaa gatgtgttct catcatgaaa tttttattgg gccaggatgt actttcattg  1200
ttttgaaaga atattttaag acgcttgtgt tttacaacct ttcggaagat gcgtccttga  1260
ttgaaagtgg ttaatgtttt gtacatcatt actggatatg aaaataccaa taaaatgaaa  1320
tacaataaaa tatttttttg aaatgaaaat tggtttaaat aagcatgtaa ataatagacg  1380
gtggagtaaa gaaaaggtaa taaaaaaaaa agtatgaatt ctattactct tcaatataaa  1440
agtaagaggt gtccgtttgc aagcaataaa aattcagtaa ttgctagata aattcaaaag  1500
ccaaccaata cacaccattg ttttgctgca aagctagggt ttctaaggcc acaattcaat  1560
gactagtgac ttacatatta cttccaaacc gaagcaaagc aagggtactc cacgattgta  1620
tatatactca cttgtttatt tttaaaccat ctgaaatcac acaaaaatgt tgtgaccctg  1680
cttcattatg ataattaagt gacgttttaa tctcattaaa tttaatgcca ccgtaggtta  1740
tggacggaaa tggatggatg taaatggaaa gatcggcggc aaaaagacca aattccatac  1800
tactgcccga gtccgataaa gacggaaaca atgcgataaa agtaaaagtg agcagaagaa  1860
agtgcacggt cgaaggcggc gtttgtttac atttacttca ccaaaaccga gcaggatatc  1920
gggcacacgg tcaggaagaa attgttcatg acggtcagaa cattctggat ggttggcgtg  1980
cttgctataa gaacactgct cctccgatct aaacctcgga ttgtgcgctt ctagatactg  2040
aatttgtttc gaccctgcct tgttgagtgg ccgtagaggc tcgacagtta ggatcagtgt  2100
gccgttgaat ttagtgattg tgtagcgacc agtacgtcct gtaagg                 2146
 
<210>25
<211>524
<212>DNA
<213>葫芦藓
 
<400>25
gaattcattt ccattaacga gaatatgaca gtgggaagag cttccacgtc atccaaactc   60
aaagtatccg acgtggtcaa tccaagtgcc agtgccacct cagctccttc accagtccat  120
ctcgcggata agggtgacag caaggcgcgg tattactgga taagagaagc ggccaaggcg  180
gcagccactg tggtccactt tgctgcgtca ctacctactg cgattgtaat gacgagcggc  240
agcgtcgtgt gacaggcttg aaccgaccgc tgcttcagcc gcaggcagac tagaaaagtt  300
tactcgctgt cccactcgtt ttctgggtgt gcatccgaag tttctggatg gttgcccgtc  360
gttcaataaa ttgtcgcgcg tcgagctagc ggacactttt gtcaccgttc ttctctgttt  420
attctggacc agaggtgctg ttagctttgt tgtgtgtgag tccttgggga aatccctgcg    480
cgtcacgaga gtttattgca gggaagtgat aaagcgttgt gaag                     524
 
<210>26
<211>2088
<212>DNA
<213>小立碗藓
 
<400>26
atgcatgtaa gataattcca attagaatct ataaatttct tattataatt ttttaaaaac      60
aaagtaccaa aatattatta ttttaatatc ctctaagtta aatccatata ttaagtagaa     120
acaattattc taataaataa tgataaaaat tagacatctt gcaataaaat ttctttttaa     180
aaatagatac ataacatgaa aaatatccca taaatagcta acaccatcaa aacatttgac     240
caaatatgca cttttagatg tgtcaagaca aaaagaaata tttgcaagat tttggagtat     300
ctaaactaat gtttgtcctc tttgcactat gagtaggatt tcttttattt tgtttagtga     360
aaagatacat tgcaatttgt tttcataata aaaactatac taatgaaata gtgctaaaaa     420
ataacaagat taaaaaaaca taacccttct tacaacctta aatccttcta attagactac     480
ctcaaagttg tgccatttag cacaaaaacc attcttttaa atctacttaa ccctccaatt     540
tccaatgagc ttcatgtgca tacacaagca tgctttcttt ctttctttct tgaagaaaac     600
ttatctgaac aaacgttaat actctacttg ttgatgaaag tggaactttg accacataca     660
ggcttggtga tgtactttgt atatctcctc acagttagtc tggtgcaatc caaccatgca     720
catagaatat gaatggggac atgcttccag ccactcgggt gtgcagaaaa cttgacaagc     780
gagattcaag caacggcgac tacgacgccg atcacgcaat acaaagcatt gttagtatgt     840
gataaaccag agaaagagat cgagtatgtg cacacaaaaa cacacagatc cacaggtatt     900
gtctacggcg ccaccaccat ccgtcaaagc taccatctcg tcgaggaaga atggtatttc     960
taaaactagc aatacaaccg ctgatggaaa caaccgaaag ctatgtcatt ggagagggcg    1020
cacgagttca tggaatacac agtgagaaga gataaagaaa taaaataata taaaatacaa    1080
gtgtgcatca gcaagacatg gccgaaatct aacaactgtc tgcacatgct gtggtgggtt    1140
gtatccacgc gctggaggaa gtaactttcc tacatgcaca gaaaaacatt ttcagattag    1200
aaagctcttc tgttctagct aatctctagt accaagctca gacgtgtagc cgacgaagcc    1260
aatagcagct gggtatgcta gtcactgatt ctgaagcggc cggtgtgtcg attgcgatgt    1320
atctcagttc ggcgaaggcc tgtgtctgga acatgggaag agggtcttct tgcactcgtc    1380
aatctctcac agcaactggg cagggttgta tccgaacgtg gaaaacgcag caaccgttgt    1440
tgaaccaaag gatggtattt ttctccgaga aaaacgccgt ggcttatctg gtgtagacga    1500
tccctaatcc ggacatgacc gccgctgtgc aggtgttggg aaaccacaat gcgcaagaga    1560
tgcgagagat ggaggagtgc aagaagtacg actgcgaagc tacatgcttc atcgagcaat    1620
gaagtctggg ttttctccaa cttccgcatg cacacacttt tctcgacgac atccgtttca    1680
aggtacgcat cgggaaactg acgattctct gcactggtgt tcagactctc cggagaggcg    1740
gtgtcatgtt ctgagctctt tttcgataag gtgctgttga agtccagaat aatggggtct    1800
ggattatcct ctggacggct ccgcttctgg tcgaaaaaat ttcatcccaa aaaaggactt    1860
atctgttgac tgaaaatgtt taattgtggt gaggattgca tgcagcgacg tcgtaaagat    1920
agggtgacaa ggagcgttcc agagctcagc tcggggcatg ccccggcact ccctagcata    1980
taaacatacc gggtggaatt tgtacccacc aggtcttgct cggtgtcccc tgtgcccaag    2040
ctgttggctg cattgccctt gcgattcgag tgtggagaga ttttagca                 2088
 
<210>27
<211>500
<212>DNA
<213>小立碗藓
 
<400>27
ggaacgaatt tgtcgagctc tctggttctg ggtcgggtag cagtagcttt gatggtgagg     60
cactgacagt cagtcgctca cacggcaaag tagcctggat gtgcttcgca acgaactctt    120
gaatttgagt atgtgagttc actttgaaca tcccagaagc aaaagaatgg gttttttcat    180
gtttgaattt tattttgtat agttgtgttg agccgcgatt tctatctgtc acttggcttg    240
atattctgag tttctccgat acgaatagcg aagtccactt gaacatctgt aacggcagca    300
attgcgtcag gtcaatcctc tcagattctt tcggtgcttt tgtcgtaaac tagcttgatt    360
gttgtccatt aagcttggtt gcttttcgtg agaaagcatg aaacttctat gacgaaaccc    420
ggttgattgt aatgtaacta gtttgattgt agtttgaatt tggtaattgc gttgtatgat    480
acataatgaa agtttcatga                                                500

Claims (29)

1.SEQ ID NO:13的序列所示的分离的核酸分子,其是野生型细胞核来源的苔藓表达促进区域。
2.权利要求1的分离的核酸分子,其特征在于它还包含苔藓启动子。
3.权利要求1的分离的核酸分子,其特征在于它还包含5′UTR区域和/或5′内含子和/或3′UTR。
4.分离的核酸分子,其特征在于它包含权利要求1的核酸分子,且还包含重组多肽产物的编码区,所述的编码区在苔藓表达促进区域的控制下。
5.权利要求4的分离的核酸分子,其特征在于它还包含选择标记。
6.权利要求4的分离的核酸分子,其特征在于它还包含与将要用其转化的物种的基因组序列同源的序列,以使在该物种中靶向整合。
7.权利要求1的分离的核酸分子,其特征在于核酸分子以反义或者核酶分子的形式提供。
8.在真核宿主细胞中表达重组多肽产物的方法,包括以下的步骤:
(1)提供重组DNA克隆载体,该载体包含根据权利要求1到7中任何一项的分离的核酸分子;
(2)转化所述的真核宿主细胞,该细胞在天然情况下不含有在苔藓表达促进区域控制下的所述重组多肽产物的编码区域;
(3)在适宜的培养基中培养转化的真核宿主细胞;
(4)表达所述的重组多肽;以及
(5)分离表达的重组多肽。
9.权利要求8的方法,其特征在于所述的真核宿主细胞选自植物细胞。
10.权利要求8的方法,其特征在于所述的真核宿主细胞选自苔藓细胞。
11.权利要求8的方法,其特征在于细胞选自来自立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos的苔藓细胞。
12.权利要求8的方法,其特征在于所述的真核宿主细胞选自小立碗藓细胞。
13.权利要求8的方法,其中所述重组DNA克隆载体还包含所述重组多肽产物的编码区域,所述编码区域在所述宿主中在苔藓表达促进区域的控制下。
14.权利要求13的方法,其特征在于所述真核宿主细胞选自植物细胞。
15.权利要求13的方法,其特征在于所述真核宿主细胞选自苔藓细胞。
16.权利要求13的方法,其特征在于细胞选自来自立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos的苔藓细胞。
17.权利要求13的方法,其特征在于所述真核宿主细胞选自小立碗藓细胞。
18.权利要求8-17中任一项的方法,其特征在于所述的宿主细胞是原丝体苔藓组织细胞。
19.权利要求8-17中任何一项的方法,其特征在于培养基不含有向其中添加的植物激素。
20.权利要求8到17中任何一项的方法,其特征在于宿主细胞瞬时表达所述的重组多肽产物。
21.权利要求1到7中任何一项的分离的核酸分子的用途,用于在工业上制备多肽。
22.权利要求1到7中任何一项的分离的核酸分子的用途,用于在工业上提供制备多肽的重组细胞。
23.权利要求1到7中任何一项的分离的核酸分子的用途,用于表达苔藓多肽,所述苔藓多肽的表达在天然情况下不由苔藓表达促进区域控制。
24.权利要求1到7中任何一项的分离的核酸分子的用途,用于提供表达苔藓多肽的重组苔藓细胞,所述苔藓多肽的表达在天然情况下不由苔藓表达促进区域控制。
25.权利要求1到7中任何一项的分离的核酸分子的用途,用于筛选和确定表达促进区域的共有序列。
26.权利要求1到7中任何一项的分离的核酸分子的用途,用于翻译后修饰蛋白的重组表达。
27.权利要求1到7中任何一项的分离的核酸分子的用途,用于制备翻译后被修饰的蛋白。
28.权利要求1到7中任何一项的分离的核酸分子的用途,用于体外表达重组蛋白。
29.权利要求1到7中任何一项的分离的核酸分子的用途,用于代谢修饰蛋白的重组表达。
CN2004800229689A 2003-08-11 2004-07-30 苔藓表达促进区域 Expired - Fee Related CN1836046B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03450184A EP1510584B1 (en) 2003-08-11 2003-08-11 Expression promoting sequences from mosses and their uses
EP03450184.1 2003-08-11
PCT/EP2004/008580 WO2005014807A2 (en) 2003-08-11 2004-07-30 Moss expressing promoting regions

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN2008101311110A Division CN101555479B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2010102687975A Division CN101962643A (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Publications (2)

Publication Number Publication Date
CN1836046A CN1836046A (zh) 2006-09-20
CN1836046B true CN1836046B (zh) 2011-04-06

Family

ID=34089803

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2010102687975A Pending CN101962643A (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2008101311110A Expired - Fee Related CN101555479B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2004800229689A Expired - Fee Related CN1836046B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN2010102687975A Pending CN101962643A (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2008101311110A Expired - Fee Related CN101555479B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Country Status (11)

Country Link
US (2) US7538259B2 (zh)
EP (2) EP1510584B1 (zh)
JP (1) JP4750028B2 (zh)
KR (1) KR101125448B1 (zh)
CN (3) CN101962643A (zh)
AT (1) ATE426033T1 (zh)
AU (1) AU2004262676B2 (zh)
CA (1) CA2533860C (zh)
DE (1) DE60326716D1 (zh)
ES (1) ES2322140T3 (zh)
WO (1) WO2005014807A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2348857T3 (es) 2005-07-12 2010-12-03 Greenovation Biotech Gmbh Mejoras en o relacionadas con la produccion de proteinas.
CN103709241B (zh) * 2014-01-02 2015-11-18 中国农业科学院生物技术研究所 来源于苔藓植物的抗旱蛋白PpLEA3-25及其编码基因和应用
CA2962852A1 (en) 2017-03-31 2018-09-30 Chuanxin Sun Carbohydrate producing plant material

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947290A1 (de) * 1999-10-01 2001-04-19 Greenovation Pflanzenbiotechno Verfahren zur Herstellung proteinöser Substanzen
CN1295621A (zh) * 1998-04-01 2001-05-16 杰尼克莫根有限公司 病原体诱导型启动子

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6047683A (ja) * 1983-08-24 1985-03-15 Kirin Brewery Co Ltd プロモ−タ−
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1295621A (zh) * 1998-04-01 2001-05-16 杰尼克莫根有限公司 病原体诱导型启动子
DE19947290A1 (de) * 1999-10-01 2001-04-19 Greenovation Pflanzenbiotechno Verfahren zur Herstellung proteinöser Substanzen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Physcomitrella patens subsp. patens cDNAclone:pphb18g08, 5' end, single read.EMBL database accession No.BJ160219.2002,全文. *
Physcomitrella patens subsp. patens cDNAclone:pphb18g10, 5' end, single read.EMBL database accession No.BJ176671.2002,全文. *

Also Published As

Publication number Publication date
CN101555479B (zh) 2010-11-03
CN101555479A (zh) 2009-10-14
KR20060109869A (ko) 2006-10-23
JP2007501619A (ja) 2007-02-01
AU2004262676B2 (en) 2009-03-12
US7834167B2 (en) 2010-11-16
US20060236432A1 (en) 2006-10-19
US20090111187A1 (en) 2009-04-30
CN1836046A (zh) 2006-09-20
CA2533860A1 (en) 2005-02-17
AU2004262676A1 (en) 2005-02-17
CA2533860C (en) 2015-11-03
EP1654369A2 (en) 2006-05-10
ES2322140T3 (es) 2009-06-17
JP4750028B2 (ja) 2011-08-17
EP1510584B1 (en) 2009-03-18
EP1510584A1 (en) 2005-03-02
KR101125448B1 (ko) 2012-07-05
WO2005014807A3 (en) 2005-05-06
DE60326716D1 (de) 2009-04-30
CN101962643A (zh) 2011-02-02
US7538259B2 (en) 2009-05-26
ATE426033T1 (de) 2009-04-15
WO2005014807A2 (en) 2005-02-17

Similar Documents

Publication Publication Date Title
CN1836045B (zh) 用于早期种子发育的新型植物启动子
CN105132425B (zh) 用于增强植物中组成型基因表达的调节性核酸分子
CN107674882A (zh) 植物中经空间修饰的基因表达
CN102575259B (zh) 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
Lu et al. Expression pattern of diacylglycerol acyltransferase-1, an enzyme involved in triacylglycerol biosynthesis, in Arabidopsis thaliana
KR20080093100A (ko) 초기 배아 발달 동안 성장 및/또는 발달 관련 유전자의유전자전이 과발현을 통해 증가된 종자 크기 및 종자 수
KR102273360B1 (ko) 식물 조절 요소 및 그의 용도
ES2584316T3 (es) Promotores preferidos del cámbium/xilema y usos de los mismos
CN103339257A (zh) 用于生产具有定义的特异性的合成的启动子的方法
AU2005222518A1 (en) Constitutive expression cassettes for regulation of plant expression
CN103397021A (zh) 来自蓖麻植物的种子优选性基因启动子
CN1836046B (zh) 苔藓表达促进区域
US20080242545A1 (en) Auxin-Repressed, Dormancy-Associated Promoter and Uses Thereof
US20020173017A1 (en) Wooden leg gene, promoter and uses thereof
AU782957B2 (en) Plant seed endosperm-specific promoter
AU2005229721A1 (en) Expression cassettes for seed-preferential expression in plants
CN115867565A (zh) 用于改善对大豆锈病的抗性的方法
CN105316334B (zh) 植物花药特异表达启动子pTaASG019的鉴定和应用
ES2336550T3 (es) Elementos de regulacion favorables a la inflorescencia precoz y sus usos.
CN104975024B (zh) 植物花药特异表达启动子pTaASG042的鉴定和应用
CN104975021B (zh) 植物花药特异表达启动子的鉴定和应用
CN116322314A (zh) 具有改变的大麻素含量的大麻
CN105274105B (zh) 植物花药特异表达启动子pTaASG050的鉴定和应用
TW538126B (en) 3&#39; untranslated regions of alpha-amylase genes
CN104975025B (zh) 植物花药特异表达启动子pTaASG033的鉴定和应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110406