CN101962643A - 苔藓表达促进区域 - Google Patents

苔藓表达促进区域 Download PDF

Info

Publication number
CN101962643A
CN101962643A CN2010102687975A CN201010268797A CN101962643A CN 101962643 A CN101962643 A CN 101962643A CN 2010102687975 A CN2010102687975 A CN 2010102687975A CN 201010268797 A CN201010268797 A CN 201010268797A CN 101962643 A CN101962643 A CN 101962643A
Authority
CN
China
Prior art keywords
mepr
sequence
nucleic acid
acid molecule
isolated nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102687975A
Other languages
English (en)
Inventor
M·罗德里格斯-佛朗哥
W·约斯特
A·威斯
G·戈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eleva GmbH
Original Assignee
Greenovation Biotech GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Greenovation Biotech GmbH filed Critical Greenovation Biotech GmbH
Publication of CN101962643A publication Critical patent/CN101962643A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

公开的是编码野生型细胞核来源的苔藓表达促进区域(MEPR)的分离核酸分子以及使用这种MEPR制备重组多肽的方法。

Description

苔藓表达促进区域 
本申请是申请号2004800229689,申请日为2004年7月30日的同名专利的分案申请。 
本发明涉及分离的核酸分子,这些分子促进多肽在遗传修饰的真核宿主细胞中的表达。 
蛋白质类物质(蛋白质、肽、多肽及其片段,以及这些分子的翻译后修饰的形式,在此后被称为“多肽”,在例如实施例部分中与“蛋白质”作为同义词一同使用)在遗传修饰的细胞中的表达是提供这些通常是稀缺或者贵重物质制备物的主要来源。为了在遗传修饰的宿主细胞中表达这些多肽,需要有对这一表达有正面控制(“激活”、“促进”)的DNA区域的存在。启动子是这种区域的重要实例,它们使RNA聚合酶结合到DNA上,起始DNA转录为mRNA(Watson等人,″Recombinant DNA″(1992),Chapter I.1和2)。 
作为研究植物生理和发育的有用研究对象,苔藓(moss)吸引了越来越多的注意力,因为它们简单的特征(苔藓位于高等植物进化的最底部)为高等植物的复杂生物学提供了信息。苔藓简单的形态学和具有优势的培养可能性使它们成为研究植物生理学和发育生物学流行的模型生物。苔藓可以毫不费力地使用包括纯性培养(axenicculture)在内的体外技术,在控制的条件下培养,不仅仅在培养皿中而且在液体培养基例如生物反应器中。单倍体的配子体可以在无菌的培养基中进行光自养生长,并且很容易在细胞水平观察到。 
苔藓的另一个主要优势是它们的转化能力:尽管有很多研究,但是在植物中的靶向整合事件很少达到10-4,这阻碍了植物功能基因组学的基因靶向方法的一般使用。与所有其他至今被检测的植物相比,同源DNA序列在苔藓(特别是已经建立的苔藓模型生物例如小立碗藓 (Physcomitrella patens)(其分子遗传学的综述参见Reski,1999))的基因组中的整合主要是以同源重组的方式出现在靶向的位置上。通常使用PEG介导的原生质体摄取质粒DNA、粒子枪法DNA转移、电穿孔以及显微注射(Cove等人,1997)进行苔藓的转化,这些很容易进行。根据转化构建体的设计主要会出现随机或者靶向的整合。 
尽管使用苔藓作为科学工具用于植物生理学研究,但是至今为止使用苔藓在苔藓细胞中制备异源重组多肽仍然是相当有限,尽管已经具备了有效的制备方法(例如根据EP 1 206 561 A中的描述培养原丝体苔藓组织)。 
在真核宿主细胞特别是动物细胞或者高等植物细胞中转化技术的一个主要限制总是缺少有效的启动子用于在这样的宿主细胞中进行外源基因的高的组成型表达。基于这个目的,花椰菜花叶病毒(CaMV)35S启动子已经被广泛地用于许多植物转化系统中(参见例如WO01/25456A),但是在一些植物物种中CaMV 35S启动子活性低(特别是单子叶植物例如水稻(McElroy等人,1991,))。对于单子叶植物的转化,已经使用了水稻肌动蛋白15′区域用于蛋白质的异源表达(McElroy等人,1991,)。但是仍然存在对新型表达促进手段的不断需要用于在遗传修饰的真核宿主细胞中表达重组(外源)多肽。 
对于苔藓,特别是小立碗藓至今为止仍然没有发表同源的(在这里同源的定义是苔藓来源的)适当的来自细胞核的表达启动子或者其他来自细胞核的表达启动序列(Holtdorf等人,2002)。研究人员因此已经使用了异源的(在这里异源的定义是非苔藓来源的)启动子用于表达选择标记基因和其他目的基因。但是这些启动子中只有很少能够在某些苔藓中可靠地起作用(例如CaMV 35S启动子;在Holtdorf等人,2002中予以总结;CaMV 35S启动子在某些其他的物种中不起作用(Zeidler等人,1999);TET-启动子(在Reski(1998)中予以综述)。 
因此,已经在本领域内开发了用于对苔藓进行遗传操作的其他方法,例如基因捕获和增强子捕获系统(Hiwatashi等人,2001;但是还使用了(缩短的)CaMV 35S启动子;作者在瞬时表达实验中表明这个35S启动子的缩短形式是作为一个弱启动子起作用;实际上,这篇文章涉及了在增强子捕获菌株中表达报告基因,但是没有显示这一表达与任何苔藓的调控元件有任何联系)。 
尽管在以上提及的在苔藓中使用同源重组的研究中,异源启动子的使用是必要的(因此不需要同源启动子,而且它们在大多数情况下是没有用的),但是对于用于工业使用苔藓制备重组多肽或者用于过量表达同源多肽的适宜的苔藓来源的表达促进手段的需要仍然存在并且尚未解决。这些表达促进手段应该使得在应用的培养条件下存在稳定和组成型的表达,并且应该优选地使表达与CaMV35S启动子的表达相当或者更高。 
因此,本发明提供了编码苔藓表达促进区域(MEPR),即来自野生型苔藓的表达促进区域的分离的核酸分子。本发明中提供了苔藓来源的表达区域(即来自野生型苔藓的细胞核来源的区域),它可以使在遗传修饰的宿主细胞中特别是在苔藓中有组成型的表达,这样就解决了在现有技术中提出的对于这种工具的需要(Holtdorf等人,2002;Schaefer等人,2002)。 
根据本发明,MEPR的基本特征还有MEPR的表达促进活性是在特异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达重组多肽的CaMV 35S启动子)表达促进活性的至少30%,优选为至少50%,因为不具有这种表达促进活性的苔藓启动子不能被正确地用于解决本发明的目标,因此不被当做MERP。 
因此,根据本发明MEPR从野生型苔藓,即没有通过引入非苔藓物 种的启动子(例如高等植物或者(植物)病原的启动子例如CaMV 35S启动子或者TET启动子)被遗传修饰的苔藓,的细胞核中分离。还很清楚,具有微小序列改变(例如在对于表达促进活性没有负面影响(破坏)的区域中有1,2,3,4,或者5个碱基的交换)的MEPR,也被认为是根据本发明的MEPR,它们可能是由于例如天然植株序列变异或者由于在MEPR的分离过程中出现的事件而造成的。用于分析表达促进活性的方法或者用于分析这种微小序列改变对于这一活性的影响的方法是技术人员已知的(例如通过与已知的CaMV 35S构建体进行比较)并且在下面的实施例部分中进行描述。 
根据本发明,非孢子体(sphorophyte)特异的MEPR表达促进被定义为组成型MEPR,优选地MEPR促进在来自配子体的细胞中的表达,更为优选地,MEPR促进在原丝体细胞中的表达。 
根据本发明,组成型表达优选地被定义为蛋白质的表达导致该蛋白在一般用于光自养生长的苔藓的液体培养条件下(例如摇瓶培养,生物反应器培养(EP 1 206 561 A))以及用于在下面描述的瞬时表达系统的条件下具有可以被检出的量。因此,组成型表达应当给予根据本发明的MERP,优选地不必在培养基中添加特殊培养添加物,还有优选地不必在培养基中添加糖、植物激素或者这些物质混合物。组成型表达应该以稳定的形式进行;尽管它可能是瞬时的。 
在本发明的说明中使用的术语“苔藓”包括所有的苔藓类植物(苔类(hepatics)或者地钱(liverworts)、角苔(hornworts)和苔藓)。苔藓的特点是它们的异型世代交替,即两个细胞核DNA含量和形态截然不同的世代的交替。二倍体的孢子体只在其年轻时具有光合活性,它需要从占据优势的绿色的单倍体配子体上获得营养供给。配子体以两种形态显著不同的形式存在:被称为原丝体的年轻配子体以及被称为配子托的成年配子体。与原丝体相反,成年的配子体(配子 托)具有性器官。 
在本发明的背景下,瞬时表达被定义为如下所述将基于附加体核酸的构建体(例如MEPR和目的基因)引入苔藓的原生质体中,导致或者允许载体的瞬间表达,表达优选地导致细胞外蛋白向培养基中的分泌。原生质体来自苔藓细胞,优选地来自配子体细胞,更为优选地来自原丝体细胞。 
尽管根据根据本发明的MEPR可以从任何苔藓物种中取得,优选地,MEPR从通常的模型苔藓物种中分离。因此,MEPR优选地分离自立碗藓属(physcomitrella)、葫芦藓属(Funaria)、泥炭藓属(Sphagnum)、角齿藓属(Ceratodon)、地钱属(Marchantia)和Sphaerocarpos中,特别是小立碗藓(Physcomitrella patens)、葫芦藓(Funaria hygrometrica)和地钱(Marchantia polymorpha)。 
根据本发明的适宜MEPR选自序列编号1到27或者它们的表达促进片段。“表达促进片段”是MEPR的片段,其具有的表达促进活性是在特异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达重组多肽的CaMV 35S启动子)的表达促进活性的至少30%,优选为至少50%。 
根据本发明的MEPR可以包含特异的区域,例如启动子区域(“启动子”),5′未翻译区域(″5′-UTRs″)、5′内含子或者3′-UTRs。对于一些MEPR,存在只含有5′内含子的表达促进片段。通常启动子总是独自作为表达促进片段而有活性。因此,根据本发明的MEPR优选地包含苔藓的启动子,优选是5′-UTR区域和/或5′内含子和/或3′-UTR。 
尽管如果达到某种组成型表达通常就足够了,但是许多情况下最好能够获得高的表达率,特别是对于工业制备重组多肽。已经证明根 据本发明的多数MEPR与CaMV 35S启动子相比能够为一个给定的重组多肽提供更高的表达率,特别是在同源系统中(例如立碗藓属的MEPR用于多肽在立碗藓属中的表达)。因此,根据本发明优选的MEPR其表达促进活性至少与花椰菜花叶病毒(CaMV)35S启动子的表达促进活性相同,特别是,但是不止限于在MEPR分离的苔藓物种中。更为优选的MEPR表达促进活性是花椰菜花叶病毒(CaMV)35S启动子的表达促进活性的至少200%、优选地至少500%、特别地至少1000%,特别地,但是不止限于在MEPR分离的苔藓物种中。 
根据本发明的分离的核酸分子优选地用于转化特异的宿主细胞,用于制备重组转基因多肽,优选地,但是不止限于,工业规模。因此核酸分子作为适宜的载体提供,使转基因在宿主细胞中转化并表达。在根据本发明的MEPR用于代替苔藓中的天然启动子(这样使同源苔藓多肽在MEPR的控制下表达,MEPR在苔藓中的位置是它通常在野生型植株中不在的位置)的可能性中,本发明MEPR的广泛工业应用性是异源(“外源”)基因在生产性宿主细胞中,特异地是在植物细胞中,特别是在苔藓细胞中的表达的控制。因此,根据本发明的核酸分子还包含重组多肽产物的编码区域,所述的编码区域在MEPR的控制下。 
如果根据本发明的分离的核酸分子还包含选择标记和/或其他能够使被选择的适当转化方法进行所需的区域,则这也是有利的(参见例如Cove等人1997;Schaefer,2002)。例如,如果优选靶向整合,则根据本发明的核酸分子还应该包括与将要被转化的物种的基因组序列同源的序列。这样使得分离的核酸分子通过同源重组靶向整合入被转化的物种的基因组中。 
而且,根据本发明的分离的酸分子可以用于筛选和确定表达促进区域的共有序列。这种共有序列(区域,盒子,它们对于表达促进活性是重要和/或必需的)的筛选在重组DNA技术中是一笔宝贵的财富, 特别是对于使用苔藓进行工业生物技术而言。 
根据另一个方面,本发明还涉及在真核宿主细胞中表达重组多肽产物的方法,包括以下的步骤:提供了重组DNA克隆载体,该载体包含根据本发明的编码MEPR的分离核酸分子,以及选择性地包含所述重组多肽产物的编码区域,所述的编码序列在所述的宿主中,在所述核酸分子的MEPR的控制下;转化所述的真核宿主细胞,该细胞在天然情况下不含有在所述的MEPR控制下的所述编码序列;在适宜的培养基中培养转化的真核宿主细胞;表达所述的重组多肽以及分离表达的重组多肽。 
如以上所述,根据本发明的MEPR原则上具有在各种不同细胞类型中实现组成型表达的能力,真核宿主细胞优选地选自植物细胞,优选是苔藓细胞,特别是小立碗藓细胞。 
对于本发明特别优选的系统是在苔藓原丝体培养(原丝体苔藓组织)中培养。为了这样做,将EP 1 206 561 A中描述的方法以及其优选的实施方案在这里明确引用作为参考,它们可以立即用于本发明。 
不需要在培养基中加入各种不同的添加物,特别是没有用于特异分化或者促进不同组织生长的添加物使用根据本发明的方法进行多肽的组成型表达是可能的。因此,除了电解质、选择药剂以及培养基稳定剂以外,培养基优选不含有任何额外的添加物用于供给细胞营养。用于稳定转化植物的培养基优选地没有外加的糖类、植物激素或者其混合物。用于瞬时转化的原生质体的培养基优选地没有外加的植物激素。 
优选的苔藓细胞为来自以下苔藓的苔藓细胞:立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos,特别是在原 丝体培养物中。 
根据另外一个方面,本发明还提供了编码MEPR的分离的核酸分子用于工业上制备多肽,特别是用于提供产生所述多肽的重组细胞。工业制备使得可以在生物反应器中大规模制备给定的目标多肽,达到克的量或者更高(商业产量)。这与制备出足够用于研究用(毫克量)或者分析用途(微克量)的制备不同,用于上面两种目的的制备当然也可以按照本发明进行。在瞬时表达系统中足够用于这种分析目的的蛋白质的量可以很容易地使用现有的DNA分子获得。 
所以,本发明还包括了使用编码MEPR的分离的核酸分子表达苔藓多肽(所述苔藓多肽的表达在天然情况下不受所述MEPR的控制),特别用于提供表达所述多肽的重组苔藓细胞。这一使用可以在实际中用于研究目的和用于工业规模的苔藓多肽制备。 
根据另一个方面,本发明还提供了编码MEPR的分离的核酸分子的用途,用于表达参与特异的翻译后修饰的蛋白(例如糖基转移酶),特别是用于提供表达多肽的重组苔藓细胞,多肽具有的翻译后修饰通常不存在于未转化的苔藓细胞中,或者以另外一个比例存在。 
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸分子表达涉及代谢途径的蛋白,特别是用于提供重组苔藓细胞,这些细胞的代谢物例如次级代谢物的含量改变了。 
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸分子表达反义分子、siRNA分子或者核酶,特别是用于提供重组苔藓细胞,这些细胞中特异的蛋白质含量减少,导致出现了改变的表型,例如形态上的或者生化上的。 
根据另外一个优选的方面,本发明还涉及根据本发明的编码MEPR的分离的核酸分子用于翻译后修饰蛋白的重组表达,特别是用于制备翻译后修饰的蛋白质。有了这样一项技术,就有可能制备翻译后被特异修饰的蛋白质(与在天然宿主细胞中不同),这样使例如植物细胞或者苔藓培养物以例如哺乳动物或者甚至人类的糖基化型式产生蛋白质。应用于特异的糖基转移酶的这种技术的示例在例如WO 00/49153A和WO01/64901A中有所描述。 
根据本发明的编码MEPR的分离的核酸分子的另外一项优选的用途涉及重组蛋白的体外表达。体外翻译技术使重组产物在更加控制的条件下产生,而不需要承担与宿主细胞相联系的不确定性。 
根据本发明的核酸分子的另外一项优选的使用是它们用于代谢修饰蛋白质(例如修饰(翻译后)翻译的氨基酸链修饰的蛋白质)的重组表达(参见例如Berlin等人,1994)。 
本发明还通过以下的实施例和附图进行阐述,但是不限于这些实施例和附图。 
附图: 
图1小立碗藓中的β-微管蛋白基因, 
图2小立碗藓中β-微管蛋白的表达促进区域分析, 
图3通过rhVEGF构建体瞬时转化对Pptub1的表达促进区域的分析,其中,a-f:不同的转化,SD=标准差,35S的每个转化的平均值(MV)设为100%。 
图4通过rhVEGF构建体的瞬时转化对Pptub2的表达促进区域的分析,其中,a-b,f和g:不同的转化,SD=标准差,每个转化的35S平均值(MV)设为100%。 
图5通过rhVEGF构建体的瞬时转化对Pptub3的表达促进区域的 分析,其中,a-b,d和e:不同的转化,SD=标准差,每个转化的35S平均值(MV)设为100%。 
图6通过rhVEGF构建体的瞬时转化对Pptub4的表达促进区域的分析,其中,a和c:不同的转化,SD=标准差,每个转化的35S平均值(MV)设为100%。 
图7小立碗藓肌动蛋白基因的基因组结构:iPCR产生的5′序列:Ppact1:2973bp直到ATG:1824bp启动子/955bp5′内含子,Ppact3:3091bp直到ATG:2270bp启动子/434bp5′内含子,Ppact5:3095bp直到ATG:1909bp启动子/1006bp5′内含子,Ppact7:3069bp直到ATG:1805bp启动子/1055bp5′内含子。 
图8不同的5′肌动蛋白区域表达活性的比较 
图9Ppact1构建体 
图10Ppact5构建体 
图11Ppact7构建体 
图12Ppact3∷vegf构建体 
图13Ppact1启动子:5’内含子替代 
图14Ppact1启动子:vegf缺失突变体 
图15Ppact3启动子:vegf缺失突变体 
图16Ppact5启动子:vegf缺失突变体 
图17Ppact7启动子:vegf缺失突变体 
图18不同苔藓种中的肌动蛋白基因,以及 
图19来自小立碗藓和葫芦藓的同源肌动蛋白基因启动子序列的比较 
材料和方法 
植物材料 
以前已经对小立碗藓(Hedw.)B.S.G.进行了性质研究(Reski等人1994)。它是植株16/14的再培养物,植株16/14由H.L.K.Whitehouse在英国Gransden Wood,Huntingdonshire收集,由Engel进行增殖(1968;Am J Bot 55,438-446)。 
标准培养条件 
植物在无菌条件下进行纯培养,使用普通的改进Knop无机液体培养基(1000mg/L Ca(NO3)2x 4H2O 250mg/L KCl,250mg/L KH2PO4,250mg/LMgSO4x 7H2O和12.5mg/L FeSO4X 7H2O;pH 5.8(Reski和Abel(1985)Planta 165,354-358)。植物在含有200毫升培养基的500毫升Erlenmeyer摇瓶中培养,或者在含有固化Knop培养基(10g/L琼脂)的9厘米平皿中培养。摇瓶在Certomat R摇床(B.Braun Biotech International,德国)上振荡,转速为120rpm。生长温室的条件是25+/-3℃,光-暗周期是16∶8小时。通过提供35μmol/m-2s-1光强的荧光管(Osram L 58W/25)从上方照射培养物。每周进行一次液体培养 物的传代培养(subculturing),使用Ultra-Turrax匀浆器(IKA,Staufen,德国)分界后接种与两个新的含有100毫升新鲜Knop培养基的500毫升Erlenmeyer摇瓶中。此外,在去整合后3或4天过滤培养物,然后转移至新鲜的Knop培养基中。 
生物反应器培养物分别生长在Knop培养基或者1/10Knop培养基中,在搅拌的玻璃生物反应器(Aplikon,Schiedam,荷兰)中培养,工作体积是5升(如Hohe and Reski,Plant Sci.2002,163,69-74中所描述)。使用船推进式搅拌器(marine impeller)进行搅拌,搅拌速度是500rpm。培养物通入0.3vvm[(通气体积)/(培养基体积)/分钟]的空气。容器25℃的培养物温度通过双水套冷却系统进行控制。50μmol/m-2s-1的光强由荧光管(Osram L 8W/25)提供,光/暗节律是16/8小时。培养物内的pH值(pH 6.5-7.0)不进行调节。 
原生质体分离: 
用于小立碗藓的分离原生质体的不同的实验方案已有描述(Grimsley等人1977;Schaefer等人1991;Rother等人1994;Zeidler等人1999;Hohe and Reski 2002;Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合: 
苔藓组织在Ca(NO3)2含量降低(10%)的Knop培养基中培养7天。在去整合后3或4天过滤培养物,然后转移至新鲜的Ca(NO3)2含量降低(10%)的Knop培养基中。过滤后在0.5M甘露醇中对苔藓的原丝体进行预孵育。30分钟后向悬液中加入4%的崩溃酶(Sigma,Deisenhofen,德国)。崩溃酶溶解于0.5M甘露醇(pH 5.6-5.8)中,3600rpm离心10分钟,通过0.22微米滤器(MillexGP,Millipore Corporation,美国)过滤除菌。含有1%崩溃酶(终浓度)的悬液在黑暗中室温孵育并且轻微摇动(2小时孵育后得到最好的原生质体产量)。悬液通过100微米和50微米孔径的筛子(Wils on,CLF,Germany)。 悬液在无菌的离心管中离心,室温55g(加速3;减速3;Multifuge 3S-R,Kendro,德国)10分钟沉淀原生质体。将原生质体轻轻地重悬于W5培养基(125mM CaCl2x 2H2O;137mM NaCl;5.5mM葡萄糖;10mM KCl;pH 5.6;660-680mOsm渗透压;无菌过滤;Menczel等人1981)中。悬液再次在室温55g(加速3;减速3;Multifuge 3S-R,Kendro,德国)10分钟沉淀原生质体。再次将原生质体轻轻地重悬于W5培养基中。将少量的悬液转移到Fuchs Rosenthal小室中对原生质体进行计数。 
瞬时转化 
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991;Reutter and Reski 1996,Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合: 
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温55g(加速3;减速3;Multifuge 3S-R,Kendro)10分钟沉淀原生质体。将原生质体重悬于3M培养基(15mM CaCl2x2H2O;0.1%MES;0.48M甘露醇;pH5.6;540mOsm渗透压;过滤除菌,Schaefer等人(1991)Mol Gen Genet 226,418-424)中,浓度为1.2x106个原生质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中,加入50微升DNA溶液(层析柱(Qiagen,Hilden,德国)纯化的DNA,溶于水);加入10-100微升的含有60微克DNA(最佳量)的溶液,最终加入250微升PEG溶液(40%PEG 4000;0.4M甘露醇;0.1MCa(NO3)2;高压灭菌后pH 6)。悬液立即轻轻混和,然后在室温下孵育6分钟,不断轻轻混和。加入1,2,3和4毫升的3M培养基对悬液进行连续稀释。悬液在20摄氏度55g(加速3;减速3;Multifuge3S-R,Kendro)离心10分钟。沉淀重悬于400微升3M培养基中。在48孔培养板(Cellstar,greiner bio-one,Frickenhausen)中培养转化的原生质体。瞬时转化在25摄氏度弱光(4.6μmolm-2s-1)下孵育。在24小时和48小时后分别取样,用新鲜培养基替换培养基 的一半(200微升)。培养基不完全被替代,因为原生质体必须在液体中保存。取出的培养基(含有重组蛋白)在-20摄氏度储存。用ELISA测量48小时的样品。 
稳定转化 
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991;Reutter and Reski 1996,Protocol Schaefer 2001)。对于这里提出的工作,使用以前描述的方法的修改/组合: 
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温55g(加速3;减速3;Multifuge 3S-R,Kendro)10分钟沉淀原生质体。将原生质体重悬于3M培养基(15mMCaCl2x 2H2O;0.1%MES;0.48M甘露醇;pH 5.6;540mOsm渗透压;过滤除菌,Schaefer等人(1991)Mol Gen Genet 226,418-424)中,浓度为1.2x106个原生质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中,加入50微升DNA溶液(层析柱(Qiagen,Hilden,德国)纯化的DNA,溶于水);加入10-100微升的含有60微克DNA(最佳量)的溶液,最终加入250微升PEG溶液(40%PEG 4000;0.4M甘露醇;0.1MCa(NO3)2;高压灭菌后pH 6)。悬液立即轻轻混和,然后在室温下孵育6分钟,不断轻轻混和。加入1,2,3和4毫升的3M培养基对悬液进行连续稀释。悬液在20摄氏度55g(加速3;减速3;Multifuge3S-R,Kendro)离心10分钟。沉淀重悬于3毫升再生(regeneration)培养基中。根据Strepp等人(1998)的描述进行选择步骤。 
ELISA 
瞬时转化的苔藓原生质体表达的重组VEGF121用ELISA(R & DSystems,Wiesbaden,德国)进行定量。ELISA根据生产商的说明进行。稀释样品用于定量。 
细菌菌株和克隆载体 
对于所有的克隆和增殖实验使用大肠杆菌菌株Top10(Invitrogen,Karlsruhe,德国)。使用pCR2.1-TOPO(Invitrogen,Karlsruhe,德国),pCR4-TOPO(Invitrogen,Karlsruhe,德国),pZErO-2(Invitrogen,Karlsruhe,德国)或者pRT101( 
Figure BSA00000252020700141
等人(1987),NAR,15,p5890)作为载体克隆DNA片段。 
基因组DNA:制备、消化、连接 
使用CTAB实验方案(Schlink and Reski,2002)从13天龄的原丝体提取小立碗藓基因组DNA。 
用30单位的不同限制性内切酶(例如BamHI,EcoRI,HindIII,KpnI,NcoI,NdeI,PaeI,PagI,XbaI;所有内切酶来自MBI Fermentas,St.Leon-Rot,德国)切割基因组DNA(3-5微克),总体积为30微升,37摄氏度下消化2小时,每一次消化使用一种内切酶。根据供应商的使用手册,用PCR Purification Columns(Qiagen,Hilden,Germany)纯化消化后的DNA(30微升消化产物+200微升PB缓冲液)。使用50微升洗脱缓冲液(EB;Qiagen,Hilden,德国)进行洗脱。在进一步处理以前,用琼脂糖凝胶(0,5%)分析10微升的洗脱物。 
剩余的DNA使用5单位的T4连接酶(MBI Fermentas,St.Leon-Rot,德国)连接,总体积为300微升,室温连接2小时后再在4摄氏度连接两天。在加酶之前,将连接混合物置于50摄氏度5分钟然后置于冰上,目的是融化黏性的末端碱基配对。加入0.3M乙酸钠(pH4.8)用乙醇沉淀并且使用70%的乙醇洗涤沉淀两次以后,重新连接的DNA用200微升的EB重悬。从该重新连接的基因组DNA中取1-3微升用于I-PCR。 
RNA制备 
在液氮中研磨植物组织,使用E.Z.N.A.Plant RNA Kit(PeqLab)或者RNeasy Plant Mini Kit(Qiagen,Hilden,德国),根据供应商的操作手册提取小立碗藓的总RNA。总RNA用凝胶进行分析,定量(OD260),分别于-20摄氏度或者-80摄氏度保存。 
DNA酶处理和第一链cDNA的合成 
根据供应商的使用指南用DNA酶(GIBCO BRL)消化1微克的总RNA,总体积为11微升。根据供应商的使用指南使用Oligo dT(12-18)引物和SUPERSCRIPT II RNase H逆转录酶(GIBCOBRL),用4.5微升该DNA酶处理后的总RNA(~400纳克)制备第一链cDNA。得到的cDNA用无菌ddH2O稀释10倍,保存于-20摄氏度。 
普通PCR 
如果未特殊说明,使用Advantage cDNA Polymerase Mix(BDBiosciences Clontech,Heidelberg,德国)进行PCR。对于所有其他的PCR方法,使用下面的DNA聚合酶:Taq重组聚合酶(MBI Fermentas,St.Leon-Rot,德国),Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,Germany),Platinum Pfx DNA聚合酶(Invitrogen,Karlsruhe,德国)或者TripleMaster PCR系统(Eppendorf,Hamburg,德国)。注册的温度循环仪是Mastercycler梯度PCR仪(Eppendorf,Hamburg,德国)。所有的引物由MWG Biotech AG,Ebersberg,德国合成。根据供应商的使用指南,使用GFX PCR DNA和Gel Band Purification Kit(Amersham Bioscience,Freiburg,德国)进行PCR产物的纯化或者凝胶洗脱。 
重组质粒的构建和克隆 
基本上按照Sambrook等人(1989),Molecular Cloning:A Laboratory Manual,第二版.Cold Spring Harbor,NY:Cold SpringHarbor Laboratory Press的描述进行通常的分子生物学实验方案。 
反向PCR(I-PCR)和巢式PCR 
使用0.25微升Advantage cDNA Polymerase Mix和缓冲液(包括3,5mM乙酸镁,均来自BD Biosciences Clontech,Heidelberg,德国)、0.2mM每种引物、0.2mM dNTP和1-3微升基因组重新连接产物(参见上面),总体积25微升进行I-PCR。循环条件是:起始步骤96摄氏度2分钟,第二步是96摄氏度20秒,67摄氏度10秒(之后每一个循环降低0.15摄氏度),68摄氏度10分钟,重复35-40次,最后一步是68摄氏度20分钟,然后在程序结束时冷却至4摄氏度。PCR产物从琼脂糖凝胶上洗脱。用30微升进行洗脱。洗脱的PCR产物或者直接克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中或者作为巢式PCR中重新确证的模板。在巢式PCR中,将凝胶洗脱的巢式PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。巢式PCR的循环条件是:起始步骤96摄氏度1分钟,接下来第二步是94摄氏度20秒,56摄氏度10秒,68摄氏度4分钟,重复25次,最后一步是68摄氏度10分钟。 
pRT101new的产生,用于克隆扩增的启动子片段 
使用Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国)重新扩增pRT101p21(Gorr 1999),使用引物320和321(对于这些引物和所有接下来的引物参见表1)。引物320(正向)从VEGF信号肽的第二个密码子开始(5′-(atg)aac...)。引物321(反向)从35S启动子之前的多克隆位点以内的HincII位点中央开始(5′-gac...)。使用引物321,又引入了一个XhoI位点。PCR产物的重新连接导致35S启动子的丧失和HincII位点的恢复。通过测序确证VEGF基因的序列。这个新的载体被称为pRT101new,用于分别通过XhoI或者HincII位点将表达促进区域克隆到报告基因之前。 
测序 
所有的测序反应由SEQLAB Sequence Laboratories,Goettingen,德国进行。 
软件 
使用Sci Ed Central,Clone Manager Suite用于引物设计、二重以及多重序列比对。使用Lasergene,DNASTAR(第五版)Megalign和SeqMan分析测序数据。使用BLAST 2(Altschul等人,1997)进行同源性搜索。 
实施例
通过4个苔藓表达促进区域的实施例阐述本发明:第一个,小立碗藓各种不同的微管蛋白家族成员表达促进区域的分离和分析。在第二个实施例中提供了来自多个不同苔藓的肌动蛋白基因家族的表达促进区域。第三和第四个实施例涉及泛素的表达促进区域以及RBCS表达促进区域。 
实施例1:小立碗藓β微管蛋白基因及其表达促进区域的克隆和分析 
概述 
为了从小立碗藓(Pp)中得到β微管蛋白(tub)的调控/启动子序列,第一步通过聚合酶链式反应(PCR)分离出β微管蛋白同源物的编码序列。为此使用了所有9个发表的拟南芥的β微管蛋白基因组序列(Attub1-9)的比对设计高度保守编码区内的引物(8F,9F和10R;对于这些引物和接下来的所有引物参见表1)。此外,还使用了小立碗藓公共EST数据的序列信息,但是只有三个显示了与β微管蛋白的同源性。使用其中一个设计了预测的编码区上游的基因特异的引物(F7)。对使用提及的引物得到的所有克隆的PCR产物以及EST数据进行序列对比得到3组克隆,这3组克隆的DNA序列在组内是相同的,但是在组间不同,主要(但是不仅仅)是由于内含子的差异。这些β微管蛋 白直向同源物(orthologues)被分别命名为Pptub1,Pptub2和Pptub3。 
而且,由于在项目进行当中有更多的EST数据(在2002年初在NCBI/dbEST中有50000以上的新条目),所以对所有121个小立碗藓中与β微管蛋白有高度相似性的EST进行了详细的分析,得到了三个新的上游和三个下游EST组,各组序列在组内是相同的但是组间不同且不同于任何其他组,与Pptub1-3也不同。对每个新的组使用来自预测的非编码上游和下游区域的引物进行PCR(参见下面)并且改变所有引物组合的次序,确定了相应的上游和下游组与特定的基因座(分别命名为Pptub4,Pptub5和Pptub6)之间的联系。克隆所有三个新的基因座的基因组和cDNA扩增产物并且测序,这将小立碗藓中β微管蛋白直向同源物的数目增加到6个。 
与Pptub5和6相反,Pptub1到4在EST数据库中出现得更为频繁。主要使用原丝体和年轻得配子托的RNA制备了相应的cDNA文库。因此,对于这四个基因,根据获得的序列数据,进行反向PCR(I-PCR)方法以获得在基因组上这些序列周围的区域。 
Pptub1 
如第一步中已经提到的,使用小立碗藓基因组DNA和引物8F和10R进行两次独立的PCR,克隆Taq(MBI Fermentas,St.Leon-Rot,Germany)PCR片段。对两个PCR中分别得到的一个(2-1)和两个(8-1,8-2)克隆进行部分测序,发现它们的序列是相同的。将相应的基因座命名为Pptub1。 
使用这一初步的序列信息设计引物以进行基因组步移,对重新连接的EcoRI和HindIII基因组消化产物使用I-PCR方法(引物35,36)得到Pptub1的包围区域。通过巢式PCR(引物40,38)对产物进行重 新确证。巢式PCR产物PCR产生的两个克隆(E#1和H1.7)进行完全测序。 
Hind III克隆H 1.7不含有内部的HindIII位点,很有可能是由于酶的星活性或者是随机双链断裂的连接。但是通过两次独立的基因组DNA PCR(引物113,67和113,90)对第一个EcoRI位点上游的序列进行了确证。此外,克隆了另外一个cDNA PCR产物(引物89,91;Pfu天然聚合酶(MBI Fermentas,St.Leon-RRot,德国))。 
所有提及的克隆帮助产生和重新确证了序列数据。总共得到了起始密码子上游~1500bp和终止密码子下游~1500bp的序列。 
Pptub2 
如以上已经提到的,使用小立碗藓发表的EST序列信息设计预测编码区域上游基因特异的引物(F7)。对小立碗藓基因组DNA的PCR(引物F7,10R)以及接下来PCR产物的克隆和测序证明了,该PCR产物以及所有三个迄今发表的Pptub EST(Pptub EST1-3)都属于一个基因座,命名为Pptub2。可以通过比较EST与基因组序列证实内含子的位置。 
使用这一初步的序列信息设计内含子内的基因特异引物(引物95和71)以进行Pptub2相邻基因组区域的基因组步移,对重新连接的Pag I,BamH I和Nde I基因组消化产物使用I-PCR方法。通过巢式PCR(引物38,35)对PCR产物进行重新确证。巢式PCR产物产生的两个克隆(C#2Pag和D#2Nde)进行完全测序。Nde I克隆D#2不含有内部的NdeI位点,很有可能是由于酶的星活性或者是随机双链断裂的连接。但是使用C#2Pag和第三个I-PCR克隆(95#8BamHI;引物149和71)确证了序列数据。此外通过两次独立的基因组DNA PCR(引物205,149;Taq(MBI Fermentas,St.Leon-Rot,德国)和引物205,206) 确证了产物的长度。克隆了205-206PCR产物和另外的基因组下游PCR产物(引物71,206;Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国))并且帮助证实了序列数据。 
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~1400bp和终止密码子下游~1400bp的序列。 
Pptub3 
如第一步中已经提到的,使用小立碗藓基因组DNA和cDNA以及引物9F和10R进行两次独立的PCR,克隆Taq(MBI Fermentas,St.Leon-Rot,Germany)PCR片段。从两个PCR中分别得到的克隆(#3-3基因组得到的克隆,#4-3cDNA得到的克隆)进行部分测序,发现它们的序列是相同的。将相应的基因座命名为Pptub3。 
使用这一初步的序列信息设计内含子内的基因特异引物(引物69和70)以进行Pptub3相邻区域的基因组步移,对重新连接的Pag I和Nco I基因组消化产物使用I-PCR方法。通过巢式PCR(引物38,35)对PCR产物进行重新确证。产生的两个克隆(A#1Nco和#4-1Pag)进行完全测序。A#1Nco是巢式PCR产物(38,35)产生的克隆而#4-1PagI是开始I-PCR产物(69,70)产生的克隆。此外克隆了基因组PCR产物(引物203,204)帮助证实序列数据。 
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~1900bp和终止密码子下游~1100bp的序列。 
Pptub4 
已经提到,对于Pptub4使用EST数据设计基因特异的上游和下游引物(297,299)得到基因组和cDNA克隆。使用天然Pfu聚合酶(MBI Fermentas,St.Leon-Rot,德国)得到的其他基因组克隆帮助 证实序列数据。 
将引物297和299反向(337,383)用于进行Pptub4相邻基因组区域的基因组步移,对重新连接的Nde I和Nco I基因组消化产物使用I-PCR方法。产生了两个克隆(48#2Nco和A02#3Nde)以及另外的基因组克隆(引物547和374;Advantage cDNA Polymerase Mix(BDBiosciences Clontech,Heidelberg,德国)和Triple Master (Eppendorf,Hamburg,德国))。 
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了起始密码子上游~2300bp和终止密码子下游~1100bp的序列。 
Pptub5和6 
已经提到,对于Pptub5和6使用EST数据设计基因特异的上游和下游引物(Pptub5:298,300和Pptub6:296,336)得到每一个基因的基因组和cDNA克隆。对于Pptub5使用天然Pfu聚合酶(MBIFermentas,St.Leon-Rot,德国)得到的其他基因组克隆帮助证实序列数据。 
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到了Pptub5的2031bp基因组序列和Pptub6的3161bp基因组序列。 
克隆策略 
使用Taq重组聚合酶产生了最初的Pptub1(2-1,8-1,8-1;所有都是基因组的)和Pptub3(3-3基因组的,4-3cDNA的)克隆。将PCR产物连接到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。PCR的条件是:2.5单位的Taq重组聚合酶,酶缓冲液,3.3mMMgCl2(所有均来自MBI Fermentas,St.Leon-Rot,德国),0.4mM每一种引物,100纳克cDNA或者基因组DNA作为模板,总体积是25微升。 循环条件是:起始步骤95摄氏度5分钟,然后是第二步95摄氏度45秒,60摄氏度(引物8F)或者65摄氏度(引物9F)10秒,72摄氏度1分钟,重复30-35次,最后一步是72摄氏度5分钟,然后在程序结束时冷却至4摄氏度。 
所有其他的基因组和cDNA克隆是 
Pptub1:113-67113-9089-90,89-91cDNA 
Pptub2:F7/R10205-206,71-206 
Pptub3:203-204
Pptub4:547-374(+TrippleMaster),297-299cDNA+基因组(+Pfu) 
Pptub5:298-300cDNA+基因组(+Pfu) 
Pptub6:296-336cDNA+基因组
以上加下划线的克隆使用Advantage cDNA Polymerase Mix产生,每20微升PCR体系使用0.25微升酶混合物,缓冲液(包括3,5mM乙酸镁,都来自BD Biosciences Clontech,Heidelberg,德国),0.25mM每一种引物,0.25mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度10秒和68摄氏度2分钟每kb,重复35-40次,最后一步是68摄氏度15分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。 
所有其他的克隆,同两个其他的基因组克隆297-299和298-300一样,使用Pfu天然聚合酶聚合酶,每20微升PCR体系使用0.3微升聚合酶(=0.75单位),缓冲液,2-4mM硫酸镁(所有均来自MBIFermentas,St.Leon-Rot,德国),0.25mM每一种引物,0.2mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后 是第二步96摄氏度20秒,60摄氏度10秒和72摄氏度2分钟每kb,重复35-40次,最后一步是72摄氏度10分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到经EcoRV线性化的pZErO-2(Invitrogen,Karlsruhe,德国)中。 
使用TripleMaster PCR系统产生了另外一个克隆547-374,每20微升PCR体系使用0.25微升聚合酶混合物(=1.25单位),调整缓冲液(包括2.5mM Mg2+,均来自Eppendorf,Hamburg,德国),0.2mM每一种引物,0.2mM dNTP和10-20纳克的模板。循环条件是:起始步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度20秒和72摄氏度3分钟,重复40次,最后一步是72摄氏度10分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到TOPO TA载体(pCR4-TOPO,Invitrogen,Karlsruhe,德国)中。 
总之,对小立碗藓基因组DNA的PCR和PCR产物的克隆产生了6个转录的小立碗藓β微管蛋白基因的序列信息。此外,使用了EST和cDNA数据确证了基因组序列数据和内含子/外显子的边界。对于Pptub1到4,反向PCR得到了未转录的5′和3′包围的基因组序列。所有6个基因组区域的一般概括在图1中给出。 
基因结构和保守 
已经强调了,Pptub1到4在EST数据库中出现得最多。此外,它们对应的EST中多数来自全长的cDNA文库。这两个事实帮助计算机(in silico)确定Pptub1到4的转录起始位点(TSS)。5′EST与相应的上游基因组区域的多重比对显示Pptub1到3的确具有精确的转录起始:27个Pptub1 5′EST中的20个,20个Pptub2 5′EST 中的16个以及14个Pptub3 5′EST中的9个都在相同的最上游位置开始,标记为+1(图3-6)。此外所有三个TSS均被共有序列包围(参见下面)。对于Pptub4而言,23个5′EST表明在100bp以内有多个TSS。最上游的5′EST的起始位点被确定为+1。 
3′EST与相应的下游基因组区域的类似多重比对重新确证了植物基因几乎总是携带一个以上poly(A)位点,且该共有序列不象在例如哺乳动物基因中那样非常明确,在哺乳动物中序列AAUAAA几乎是遍布的(综述参见Rothnie等人,1996)。 
六个克隆的小立碗藓基因座没有显示任何无义终止密码子而且可以预测与已知β微管蛋白具有高度相似性的适当蛋白。一般在编码区域以外相似性立即并且显著下降。考虑到5′的可能调控元件,对所有4个上游区域进行详细比较后发现在基因家族内部或者没有整体的保守性,或者与其他已知的植物β微管蛋白基因的5′区域也没有保守性。但是可以在基因家族内部检测到一些有趣的保守性匹配。 
a)Pptub1到3中确定的TSS在所有三种情况下都属于共有序列T/CCA(+1)G/CTGTGC,且它们被包含在富含C/T的区域内(与plantProm数据库,网址为http://mendel.cs.rhul.ac.uk/mendel.php?topic-plantprom中171个无关的TATA植物启动子的共有序列T/CCA(+1)NMN比较) 
b)Pptub1到3中可以发现在TSS上游22-24bp--这处于植物TATA启动子的典型距离内(参见plantProm数据库)--有一个弱的8bp TATA盒子,位于一个保守的20-25bp一段序列内部。来自171个无关的植物启动子的TATA盒子共有序列是:T96 A95 T96 A100 A62/T38 A97T61/A38 A73(参见plantProm数据库),对于Pptub1到3,共有序列是TtTATcTc/t/A,大写字母表示与共有序列有关。 
c)所有四个基因在它们的5′UTR中确实有非常低水平(9-16%)的 腺嘌呤。 
d)Pptub4的5′UTR C/T总含量达到74%,此外在最短、最靠下游的5′EST的起始点之后还含有一个C/T一段序列(约50bp)。 
e)Pptub2在TSS上游450bp附近(-450到-489)含有一个40bp的polyA一段序列 
f)Pptub1和4上游大约-420位置处开始了非常富含A/T的区域(Pptub1在大约900bp中有80%以上的A/T;Pptub41750bp中有75%的A/T,使得该基因上游可能存在骨架/核基质附着区(S/MARs;(Liebich等人,2002)。 
β微管蛋白启动子的功能性鉴定和定量 
在瞬时表达系统中使用非再生的小立碗藓原丝体作为表达系统对Pptub1到4的可能5′调控序列进行功能定量,确定提供最大启动子活性的最小启动子片段。对于每一个启动子将几个包括了上游区域和5′UTR的不同长度的构建体准确地置于报告基因的起始密码子之前。作为报告基因,人蛋白质(重组人血管内皮生长因子121:rhVEGF121;Gorr 1999)通过其自己的信号肽被分泌到培养基中。rhVEGF121在苔藓培养物上清中的量使用ELISA进行定量,它反应了系统中启动子或者启动子片段的强度。数值与使用35S启动子得到的数值相联系。每一个构建体在两到三次不同的转化实验中转化最少6次。分别在24小时和48小时后取样,48小时的样品进行适当稀释用ELISA测定两次。结果的总结在图2中给出。 
Pptub1到4的表达促进区域被公开为序列编号1到8。 
将Pptub1到4的扩增启动子片段克隆到pRT101new中 
Pptub1:1-0(引物364XhoI,363cat) 
1-1(引物219XhoI,363cat) 
1-3(引物549XhoI,363cat) 
1-4(引物226XhoI,363cat) 
1-5(引物550XhoI,363cat) 
Pptub2:2-0(引物291,225cat) 
Pptub3:3-0(引物292,223ca t) 
Pptub4:4-0(引物373XhoI,374cat) 
4-1(引物548XhoI,374cat) 
以上给出的启动子片段使用Pfu天然聚合酶(MBI Fermentas,St.Leon-Rot,德国)用基因组DNA扩增,使用从ATG起始密码子反向互补序列开始的反向引物(cat...)以及部分的含有XhoI位点的正向引物。PCR产物使用XhoI切割并连接入XhoI/HincII中或者不进行切割连接入用HincII打开的pRT101new中。产生的克隆通过测序进行证实。克隆1-2(XhoI/EcoRI),2-1(BglII),2-2(SalI),2-3(EcoRI/SalI),2-4(EcoRI/SalI),3-2(SalI),3-3(Ecol47I/HincII),3-4(XhoI/SalI)通过从长克隆内部进行删除而得到。剩余的载体通过凝胶洗脱并且重新连接。如果单链凸出末端不相匹配的话,在根据供应商的使用手册使用Klenow片段(MBI Fermentas,St.Leon-Rot,德国)填平3′凹进端之后进行连接。 
Pptub1 
将六个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。所有构建体的数据在图3中给出。(5′UTR=+1(TSS)到+226,+227=ATG) 
1-0    -1307bp(Pptub1 5′区域1533bp) 
1-1    -985bp(Pptub1 5′区域1211bp) 
1-2    -416bp(Pptub1 5′区域642bp) 
1-3    -248bp(Pptub1 5′区域474bp) 
1-4    -83bp(Pptub1 5′区域309bp) 
1-5    -71bp(Pptub1 5′区域297bp) 
启动子片段1-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(将其设定为100%)相比,表达率是其大约150%。注意最小启动子片段1-2的上游开始了长的非常富含A/T的区域(在近900bp中有80%以上的A/T)。 
Pptub2 
将五个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。所有构建体的数据在图4中给出。(5′UTR =+1(TSS)到+122,+123=ATG) 
2-0    -1075bp(Pptub2 5′区域1197bp) 
2-1    -676bp(Pptub2 5′区域798bp) 
2-2    -425bp(Pptub2 5′区域547bp) 
2-3    -245bp(Pptub2 5′区域367bp) 
2-4    -67bp(Pptub2 5′区域189bp) 
启动子片段2-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(100%)相当。 
Pptub3 
将长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。四个构建体的数据在图5中给出。(5′UTR=+1(TSS)到+112,+113=ATG) 
3-0    -1274bp(Pptub 35′区域1386bp) 
3-2    -765bp(Pptub 35′区域879bp) 
3-3    -272bp(Pptub 35′区域384bp) 
3-4    +52bp(Pptub 35′区域60bp) 
启动子片段3-2可以确定为提供高表达率的最短启动子片段。与35S启动子产生的表达率(将其设定为100%)相比,表达率是其大约300%。 
Pptub4 
将两个长度不同的启动子克隆到转化载体pRT101p21中的报告基因之前。数据在图6中给出。(5′UTR=TSSs(+1到+103)到+205,+206=ATG) 
4-0    -419bp(Pptub4 5′区域624bp) 
4-1    -1bp(Pptub4 5′区域206bp) 
启动子片段4-1提供的表达率是使用与35S启动子得到的表达率(将其设定为100%)的大约250%。注意该最小启动子片段(4-0)的上游开始了长的非常富含A/T的区域(在1750bp中有75%的A/T)。 
总之,对Pptub1到4的基因组上游区域的瞬时启动子活性进行了研究。确定了显示最大启动子活性的最小启动子片段,它们的表达率最高可达35S启动子产生的活性的3倍。 
Pptub构建体总结(还请参见:序列表) 
Pptub1上游 
-1533至-1(+1=起始密码子) 
-1533至-644=81%AT 
-1533VEGF1-0(引物364) 
-1211VEGF1-1(引物219) 
-642VEGF1-2(EcoRI/XhoI) 
-474VEGF1-3(引物549) 
-309VEGF1-4(引物226) 
-297VEGF1-5(引物550;无推定的TATA盒子:-304至-295) 
-226TSS(5′UTR开始) 
Pptub1下游 
1至1539(1=终止密码子之后) 
332最长的EST结束(3′UTR) 
1539引物90的开始 
Pptub2上游 
-1197至-1(+1=起始密码子) 
-1197VEGF2-0(引物291) 
-798VEGF2-1(BglII) 
-547VEGF2-2(SalI) 
-450至-489=poly A序列 
-367VEGF2-3(EcoRI/SalI) 
-189VEGF2-4(XhoI/SalI) 
-122TSS(5′UTR开始) 
Pptub2下游 
1至1012(1=终止密码子之后) 
297最长的EST结束(3′UTR) 
1012引物206开始 
Pptub3上游 
-1386至-1(+1=起始密码子) 
-1386VEGF3-0(引物292) 
-879VEGF3-2(SalI) 
-384VEGF3-3(Ecol47I/HincII) 
-112TSS(5′UTR的开始) 
-60VEGF2-4(XhoI/SalI) 
Pptub3下游 
1到997(1=终止密码子之后) 
203最长的EST结束(3′UTR) 
1012引物204开始 
Pptub4上游 
-624至-1(+1=起始密码子) 
-624VEGF4-1(引物373) 
-206VEGF4-2(引物548) 
-205至-103TSS的区域(5′UTR的开始) 
-55至-93CT序列 
Pptub4下游 
1至1146(1=终止密码子之后) 
466最长的EST结束(3′UTR) 
1141至1164NcoI 
实施例2来自不同苔藓种的肌动蛋白基因及其表达促进区域的克隆和分析 
2.1小立碗藓肌动蛋白基因的基因组结构 
已经从藓类小立碗藓中分离了四个肌动蛋白基因和启动子区域,从藓类葫芦藓和苔类地钱中分离了三个肌动蛋白基因和启动子区域,构建表达载体用于苔藓中。 
使用根据公共数据库中的立碗藓属EST序列设计的特异寡聚核苷酸,通过几轮反向PCR从基因组中分离出了四个肌动蛋白基因(Ppact1,Ppact3,Ppact5和Ppact7)并且测序。 
在立碗藓属中分离的基因中的一个(Ppact1)其结构类似于高等植物肌动蛋白基因的保守结构组织。未翻译的前导肽被一个较长(955bp)的内含子打断,该内含子位于起始密码子ATG上游14核苷酸 处。编码区域具有三个较小的内含子,它们的位置与其他植物物种肌动蛋白内含子的位置相同。第一个内含子位于密码子20(lys)和21(ala)之间,第二个内含子将密码子152(gly)分开,第三个内含子在密码子356(gln)和357(met)之间。这一一般结构与三个其他的立碗藓属肌动蛋白基因(Ppact3,Ppact5,和Ppact7)看起来不同。在那三个基因中,5′UTR内含子(分别是434bp,1006bp和1055bp)也位于ATG前14核苷酸处,但是编码区域只被一个位于密码子21(lys)和22(ala)之间的内含子打断(图7)。 
2.2肌动蛋白基因表达促进区域的活性研究 
为了研究不同立碗藓属肌动蛋白表达促进区域(序列编号5到8)的活性以及不同基因5′UTR的作用,设计了不同的载体,在所研究的5′区域控制下表达hVEGF蛋白。 
从基因组DNA中通过反向PCR分离转录起始位点上游大约2kb的基因组区域并且测序,构建含有由启动子引导的人VEGF cDNA以及包括5′内含子的准确前导序列的载体,用于瞬时转染苔藓的原生质体。通过校对PCR扩增出完整的5′表达促进区域,使用的引物是395和332用于Ppact1,408和333用于Ppact3,511和334用于Ppact5,以及413和335用于Ppact7。 
对于每个待测构建体使用相同数目的分子转化原生质体,同时做一个对照实验,转化携带在CaMV 35S启动子控制下的hVEGF cDNA的构建体。hVEGF蛋白在N端含有26个氨基酸的信号肽,它使得重组蛋白被分泌到培养基中。原生质体转化后孵育48小时后取不同稀释度的原生质体培养基,用ELISA对转化进行分析。 
不同的立碗藓属5′肌动蛋白区域引导表达的能力与组成型的35S 启动子的活性进行比较。 
在所有分析的情况中,肌动蛋白基因的5′区域都比35S启动子的活性高。但是表达水平随不同的肌动蛋白调控序列而有所差异。这样,Ppact3的5′序列只能将VEGF的表达相对于35S启动子提高大约2倍。当含有Ppact1和Ppact75′区域的载体用于转化时,测量出了更高水平的VEGF。在那些情况下得到了4-8倍相当于35S的数值。但是在使用Ppact5基因的5′区域时观察到了最显著的差异,在某些情况下,得到了与35S的表达相比高出11倍的表达(图8)。 
为了进一步研究高活性的立碗藓属肌动蛋白基因5′UTR的功能,制备了含有5′UTR内含子删除、组合和替代的载体,用于苔藓原生质体的瞬时表达分析。 
与使用完整Ppact1 5′区域的表达相比,Ppact1 5′内含子的删除显著降低了瞬时表达的水平。在这种情况下,在原生质体培养基中检测到的分泌出的VEGF蛋白的量非常接近于通过CaMV 35S启动子得到的表达量。这表明Ppact1 5′内含子对于基因从Ppact1启动子的有效表达是必不可少的。当包含前导内含子的5′UTR与35S启动子的下游融合时得到了相同的结果。这一构建体与完整的35S启动子产生了相同量的分泌蛋白,表明5′UTR区域对于非Ppact1启动子的其他启动子的活性没有任何显著的影响。重要的是表明仅仅携带Ppact15′UTR区域的构建体比35S启动子对促进蛋白产生减少了30%。这可能提示在该基因的这个区域具有小的启动子活性,或者剩余的启动子活性存在于载体的主链序列中(图9)。 
使用相同的方法研究Ppact 5和Ppact 7基因中含有的5′UTR区域对启动子活性的影响。分析了5′内含子被删除的构建体,它们得到了与Ppact1相似的结果,即对于Ppact5而言得到的蛋白质量与使用 35S启动子得到的蛋白质量大致相同,且对于Ppact7而言得到的蛋白质量还要低一些,表明在5′UTR中内含子的存在对于启动子的有效活性是必不可少的。同样,使用只含有5′转录区域至ATG的构建体进行了转化,也观察到了一些残余的促进活性。而且,对于这两个基因,5′UTR与35S启动子下游的融合,与单独使用35S启动子相比使VEGF蛋白产生了更高的表达率(2到7倍)(图10,11)。对于Ppact3观察到了相似的结果,使用5′UTR自身或者与CaMV 35S的下游融合分别产生相对于35S两倍和三倍的表达(图12)。这些结果提示在这三个基因的5′转录区域中存在增强子的活性,即使将它们置于一个不同的启动子之下。 
为了进一步研究Ppact1,Ppact5和Ppact7基因中存在的5′内含子的作用,使用Ppact5和Ppact7的5′内含子替换Ppact1基因的前导内含子,在载体中进行工程操作,用于瞬时转化。同时用Ppact1基因的编码区中存在的内含子替代Ppact1 5′内含子。 
用Ppact1基因编码区中的内含子1和3替代Ppact1 5′内含子导致表达水平降低了大约25%。但是检测出的蛋白表达量仍然比使用CaMV 35S启动子的表达高大约2-3倍。奇怪的是,使用编码区的内含子2代替5′内含子使得启动子丧失了活性(图13)。但是在检查了构建体的序列之后,发现内含子的拼接位点不正确。制备了携带正确拼接序列的新构建体,在苔藓转化之后表明内含子2的作用与其他的替代相同。 
使用对应于Ppact5和Ppact7基因的5′内含子进行替代,也观察到了蛋白质表达的降低,但是这时降低的程度略小。 
2.3.肌动蛋白基因表达促进区域的缺失构建体 
制备了肌动蛋白基因启动子的5′未转录区的缺失构建体,通过将这些构建体瞬时转化苔藓原生质体对其进行分析,进一步研究不同肌动蛋白基因启动子的特点。 
这样对于Ppact1,制备了携带转录起始(+1)上游不同基因组区域长度(-1823bp,-992bp,-790bp,-569bp,-383bp,-237bp,和-82bp)的构建体。原理上除了-82bp的构建体以外,所有的构建体都应该具有完全的启动子活性。但是-383bp构建体表现出活性的下降,其活性与-82bp构建体达到了相似的水平(图14)。 
对Ppact3启动子区域的缺失构建体进行分析发现了一些有趣的特征。如以上所描述的,该启动子与其他肌动蛋白基因启动子比较活性较低,尽管与CaMV 35S启动子相比它的活性略高。这里对下面的5′未转录区域进行检测:-2210bp,-995bp,-821bp,-523bp,-323bp,-182bp和-81bp。奇怪的是构建体中含有启动子区域直至-821bp时,启动子的活性与CaMV 35S启动子的活性大致相同。而含有从-523开始直至转录起始更短区域的构建体产生两倍量的重组蛋白。这可能表明在瞬时转化试验中(图15)位于-523bp上游的顺式作用区域下调了该基因的转录。 
对于Ppact5,制备了含有该基因转录起始上游-1872bp,-758bp,-544bp,-355bp,和-121bp片段的构建体。从瞬时试验得到的结果表明启动子的完全活性位于转录起始(+1)的-758和-121之间的区域(图16)。 
对以下的Ppact7基因5′未转录区域的缺失构建体进行分析:-1790bp,-1070bp,-854bp,-659bp,-484bp,-299bp,和-66bp。得到的结果表明在-484bp和-299bp之间包含的区域对在瞬时试验分析中启动子的完全活性是必需的(图17)。 
为了得到一套立碗藓属肌动蛋白基因的异源启动子,使用另外两个种藓类葫芦藓和苔类地钱分离含有肌动蛋白基因的基因组DNA片段。为此,设计具有不同程度简并性的寡聚核苷酸,使用来自两个种的基因组DNA作为模板进行PCR反应。 
2.4来自不同苔藓种小立碗藓、葫芦藓和地钱的不同肌动蛋白基因的比较 
小立碗藓 
从小立碗藓中分离的四个不同的基因组肌动蛋白序列可能代表了该基因的全部功能性序列,包括5′启动子序列,5′UTR+5′内含子,ORF+内部的内含子以及3′UTR和进一步的3′下游序列。总共分离了Ppact1 5809bp,Ppact3 5633bp,Ppact5 8653bp以及Ppact7 6351bp的基因组序列(图18A)。除了Ppact1的ORF是1134bp以外,分离的立碗藓属肌动蛋白cDNA的编码区域几乎全部都是1137bp长。相对应的蛋白质是378个氨基酸长,Ppact1具有377个氨基酸。在核苷酸水平上编码序列之间的同源性在86.6%到98.9%之间。蛋白质序列的相同性在97.1%和99.7%之间(DNA STAR,MegAlign程序,ClustalV(加权)序列比对软件)。 
对于所有四个立碗藓属肌动蛋白基因可以通过反向PCR分离ATG起始位点5′的延伸基因组DNA序列并且进行测序:Ppact1 2973nt,Ppact3 3091nt,Ppact5 3095nt,Ppact7 3069nt。对于Ppact1,Ppact5和Ppact7使用Gene Racer Kit(Invitrogen)进行5′RACE(它只扩增全长的cDNA)确定基因的5′UTR。对于Ppact3,通过数据库中不同EST的长度确定5′UTR。通过比较cDNA与基因组的反向PCR片段,可以显示大的5′内含子的存在。对于Ppact1,Ppact3,Ppact5和Ppact7,所有位于-14位置到ATG起始密码子的5′内含子的长度分别是955bp,434bp,1006bp和1055bp(图18A)。通过比较基因组 序列和衍生的蛋白质序列以及来自拟南芥肌动蛋白基因的cDNA序列和蛋白质序列,确定ORF内部的内含子的位置。现有的立碗藓属肌动蛋白基因的5′启动子序列分别有:Ppact1 1824nt,Ppact3 2270nt,Ppact5 1909bp,Ppact7 1805bp(图18A)。 
通过对基因组DNA的简并PCR从葫芦藓中总共发现了4个不同的肌动蛋白基因(表达促进区域:序列编号9至12),从地钱中总共发现了3个不同的肌动蛋白基因(表达促进区域:序列编号13至15)。因为目的主要是从不同的苔藓种中分离可能的不同肌动蛋白基因同源物的5′启动子区域,至今为止3′端的大多数序列还是不完整的。(图18B/C)。 
葫芦藓 
对于葫芦藓属,发现的肌动蛋白基因被命名为Fhact1,Fhact 4.4,Fhact5和Fhact5b。通过反向PCR可以分离的不同肌动蛋白基因的基因组序列有:Fhact1 3951bp,Fhact4.4 2417bp,Fhact5 4432bp和Fhact5b 722bp。对于编码序列为1134个核苷酸的Fhact1基因,可以分离完整的编码cDNA序列。对于其他的葫芦藓属肌动蛋白基因目前有部分的序列,没有3′端:Fhact4.4 906bp,Fhact5 965bp以及Fhact5b 722bp(图18B)。分离的编码序列具有的同源性范围在核苷酸水平上是87.4%到99.2%。得到的蛋白质序列有90.8%到99.2%是相同的(DNA STAR,MegAlign程序,Clustal V(weighted加权)序列比对软件)。 
除了Fhact5b以外,可以通过反向PCR分离ATG起始密码子5′上游的序列并且测序。已有的序列有Fhact1 1824bp,Fhact4.4 1333bp,Fhact5 3289bp。使用Gene Racer Kit(Invitrogen)进行5′RACE确定不同5′UTR的长度。通过比较cDNA序列和反向PCR获得的基因组序列以及与立碗藓属的基因比较确定内含子-外显子的结构。对于立 碗藓属肌动蛋白基因而言,发现的葫芦藓属肌动蛋白基因含有大的5′内含子,它们位于cDNA的-14位置上,其长度对于Fhact1 Fhact4.4和Fhact5分别是928bp,1015bp和656bp。至今为止已经分离并且测序了Fhact1 700bp,Fhact4.4 145bp以及Fhact5 2515bp的5′启动子序列。对于Fhact1分离了419bp的3′区域。葫芦藓属肌动蛋白基因的5′区域和3′区域通过葫芦藓基因组DNA的PCR产生,使用的引物是:Fhact1 5′区域:引物908和909;Fhact1 3′区域:引物983和984;Fhact4.4 5′区域:引物1000和1001;Fhact5 5′区域引物611和612。 
地钱 
发现的地钱属的肌动蛋白基因被命名为Mpact1,Mpact4和Mpact15。所有3个序列都缺少3′端。至今为止分离并且测序的序列有:Mpact1 2229bp,Mpact4 3987bp以及Mpact15 2174bp的基团组序列。对于Mpact1,Mpact4和Mpact15分离的编码cDNA序列分别有997nt,962nt和995nt(图18C)。与另外两个苔藓种相比,地钱属肌动蛋白基因内的序列同源性略微低一些,在核苷酸水平上介于78.3%和85.5%之间,在氨基酸水平上介于94.7%和96.1%之间(DNASTAR,MegAlign程序,Clustal V(加权)序列比对软件)。对于所有三个鉴定出的不同的地钱属肌动蛋白基因都通过反向PCR分离了ATG的5′上游序列并且进行了测序:Mpact1 937bp,Mpact4 3025bp以及Mpact15 910bp。地钱属肌动蛋白基因同源物的5′区域通过地钱基因组DNA的PCR产生,使用的引物是:对于Mpact1的5′端使用引物950和951,对于Mpact4使用引物960和961,对于Mpact15使用引物970和971。通过比较来自不同苔藓种的不同肌动蛋白基因序列得到了ORF的内含子外显子结构。分离的Mpact1的5′序列显示在-14位置具有内含子拼接位点的共有序列(aggt),表明与其他立碗藓属和葫芦藓属基因一样存在5′内含子。在Mpact4和Mpact15的5′上游序列中不存在内含子拼接位点共有序列,提示没有5′内含子(图18C)。 
小立碗藓、葫芦藓和地钱肌动蛋白基因的比较 
如上面提到的,一般情况下来自一个物种内的不同分离肌动蛋白基因的核苷酸和蛋白质序列的同源性非常高,特别是在蛋白质水平上。关系非常密切的两个苔藓种小立碗藓和葫芦藓之间的同源性也非常高。在核苷酸水平上肌动蛋白基因显示的同源性在86.9%到96.3%之间的相同性,而在氨基酸水平上的同源性范围在95.5%到99.7%之间。 
相反苔类植物地钱与其他两个种之间更远的关系从在核苷酸水平上基因更低的同源性上可以反映出来。立碗藓属和地钱属肌动蛋白基因之间的同源性范围只有75.2%到78.8%之间而葫芦藓属和地钱属之间的同源性范围是75.5%到80.4%。在氨基酸水平上,地钱属肌动蛋白基因与立碗藓属相比同源性在93.0%到96.1%之间,与葫芦藓属相比同源性在93.4%到96.7%之间。 
内含子-外显子结构(图18A/B/C) 
如前面所表明的,立碗藓属肌动蛋白基因的内含子-外显子结构与高等植物内含子-外显子结构有一定程度的相似性但是仍然有明显的差异。所有分离的立碗藓属基因都在5′未翻译区域含有一个大的5′内含子,这也是几乎所有被研究的高等植物肌动蛋白基因所具有的。只有Ppact1在ORF中含有3个内部内含子,反映了例如所有拟南芥分离肌动蛋白基因的情况。Ppact1 ORF内部的内含子位置与高等植物肌动蛋白基因相比也是保守的。相反Ppact3,Ppact5和Ppact7在ORF中只含有一个内部内含子。 
在分离的葫芦藓属肌动蛋白基因中可以发现相同的基因组结构,在5′UTR中有一个延伸的5′内含子。Fhact1与Ppact1有相同的保守内含子-外显子结构而Fhact4.4和Fhact5在ORF序列中只含有一个内部内含子。分离的Fhact5b序列太短,所以关于它的内含子-外显 子结构不能看得很清楚,但是与Fhact1或者Ppact1相比它至少不含有内部内含子2。 
在地钱属中分离肌动蛋白基因的基因组结构看起来更为不同。重要的是表明在三个不同苔藓种中不同肌动蛋白基因的数目还不知道,有可能从地钱属中分离出的三个肌动蛋白基因不代表独立的有功能的同源基因。有可能在地钱属中存在三个以上的肌动蛋白基因,在立碗藓属和葫芦藓属中存在四个以上的肌动蛋白基因。 
但是Mpact1的内含子外显子结构看起来与Ppact1和Fhact1的结构相同,5′UTR中有一个5′内含子以及ORF内部内含子1和2的保守位置。Mpact15还含有保守的ORF内部内含子1和内含子2,但是在5′UTR中的-14位置或者-10位置上没有如同在立碗藓属或者一些拟南芥肌动蛋白5′内含子中发现的保守内含子拼接位点,显示缺少5′内含子。对于Mpact4也发现了同样的情况,很可能缺少5′内含子。此外Mpact4在ORF中也不具有内含子1或者内含子2,这与目前分离出来的所有苔藓肌动蛋白基因都不同。 
推测的同源苔藓肌动蛋白基因 
尽管从立碗藓属和葫芦藓属中分离的不同肌动蛋白基因的内含子-外显子结构可能对两个种之间的同源基因提出了推断,但是我们不能从基因组结构中得到这个结论。例如Ppact1和Fhact1具有相同的保守内含子-外显子结构但是正如以上所示,还不清楚在两种植物的基因组中是否存在更多的具有相同基因组结构的基因。为了就同源基因给出一个结论,还需要表达数据以提议功能同源性。而且从蛋白质或者编码的cDNA序列的序列同源性中不能就两个种之间的相应同源基因作出任何假设,因为这两个种太相似了。 
但是有趣的是对于立碗藓属和葫芦藓属,还发现在UTR序列、内 含子序列和启动子序列等非编码序列中有非常高的序列同源性。因此在Ppact1和Fhact1以及Ppact3和Fhact5之间发现了高的同源性。在两种情况下内含子序列都显示了非常高的保守性。对于Ppact1和Fhact1,同源性如下:5′内含子:58%;内含子1:64%,内含子2:52%以及内含子3:55%。对于Ppact3和Fhact5同源性是对于5′内含子是51%对于内含子1是48%。 
在两种情况中分离的5′启动子序列显示了高的同源性。图19A图示了Ppact1和Fhact1的分离的启动子区域的比较。转录起始定为位置1,5′启动子区域的第一个核苷酸定为-1。Fhact1的5′启动子区域分离的267bp与Ppact15′启动子区域的前267bp有58%的总体同源性。在这些序列中可以观察到具有不同同源性的部分。-267和-129之间的序列同源性是51%。后面的29bp有62%的相同性,在-100到-1位置之间同源性几乎是70%。考虑到Ppact1和Fhact1内含子和启动子序列之间的高度序列相同性,有理由将这两个基因作为这两个苔藓中的同源基因。另一个有趣的方面是观察到不同的Ppact1:vegf缺失构建体之间表达的下降(图15)。表达的显著下降出现在-237和-82失构建体之间。这显示了5′启动子区域-129和-1之间的重要功能,因为刚刚提到Ppact1和Fhact1的启动子区域序列高度保守,-82缺失构建体不含有所有的高度保守序列而-237缺失构建体含有所有的高度保守序列。 
也可以观察到Ppact3和Fhact5启动子内的高度保守区域。这两个基因分离的启动子区域要长得多。因此在两个5′启动子区域之间发现更多的同源区域(图19B)。Ppact3从-1到-2270以及Fhact5从-64到-2325的启动子区域显示了一些有趣的同源性特征。起始位点位置的差异可能是由于Fhact5的5′UTR是由实验确定的而Ppact3的5′UTR是通过分析数据库中的EST确定的。 
Ppact3-2270和-1876之间的序列与Fhact5-2325和-1948之间相同的序列区域之间只有很低(29%)的同源性。之后有一个大约1100核苷酸的延伸区域,具有非常高的同源性(82%)。接下来的Ppact3140nt区域和Fhact5启动子的152nt区域“只”显示了53%的同源性。Ppact3-641和-463之间的序列与Fhact5的-705和-528之间的区域再次显示了76%的高度保守性。接下来大约180nt再次显示了较低的同源性(53%)。Ppact3启动子序列的最后288bp与Fhact5后面的280bp之间再次显示较高的同源性73%。两个同源基因之间具有不同同源性程度的这些区域可能显示在5′区域中存在调控性的活性元件。 
对于Ppact1和Fhact1,这里对不同Ppact3:vegf缺失构建体的表达分析也是有趣的(图17)。与-523删除构建体相比,-2210,-995,-821缺失构建体的vegf表达水平有显著的升高。这三个缺失构建体至少含有Ppact3和Fhact5中-1876和-779之间发现的延伸同源区域的一部分,它们的表达水平达到了35S启动子的表达水平,而-523缺失构建体与35S启动子或者更长的缺失构建体相比,表达有 
Figure BSA00000252020700411
倍的增加。这可能显示在这个Ppact3和Fhact5之间具有82%同源性的区域中存在负调控因子。 
对于地钱属,没有发现与来自立碗藓属和葫芦藓属的不同肌动蛋白基因之间有相当的序列同源性。 
对于Fhact5基因,制备了一个含有1157bp 5′未转录区域与hVEGFcDNA融合的构建体,用它在立碗藓属原生质体上进行瞬时转化实验。在这种情况下检测出的蛋白量与使用CaMV 35S启动子得到的蛋白量处于相同的范围内但是略高一些(直到两倍)。Fhact5基因与Ppact3基因具有最高的同源性,有趣的是在瞬时试验中两个启动子在立碗藓属原生质体上显示了相似的活性。 
2.5稳定的转基因品系 
将包含由Ppact1,Ppact5和Ppact7的5′MEPR引导VEGF cDNA表达的盒子引入立碗藓属植物的基因组中。对于每个MEPR得到5-10个稳定的转化植物,并且检测了rhVEGF的表达。对于这三个检测的MEPR,在植物生长的培养基(标准Knop培养基)的上清中检测出了来源于苔藓的表达和分泌的rhVEGF,表明当MEPR整合到基因组的其他部分中时会促进蛋白质在非诱导条件(标准条件)下的表达。在那些表达系中可以测量的蛋白质的量从每毫克苔藓干重7ng VEGF到每毫克苔藓干重53ng VEGF,这取决于构建体和稳定的品系。 
使用一个含有Ppact5控制下的VEGF cDNA转基因苔藓株进行生物反应器培养。通过ELISA测定生物反应器培养物上清中来自苔藓的重组VEGF的量是每毫克苔藓干重40-50ng VEGF。 
实施例3小立碗藓和葫芦藓泛素基因及其表达促进区域的克隆和分析 
利用存在几个对应于立碗藓属聚泛素基因的EST序列,设计特异的寡聚核苷酸分离与数据库中最广泛存在的泛素基因同源序列的EST相对应的基因组序列,将其命名为Ppubq1。通过反向PCR鉴定出Ppubq15′区域的2146bp。通过5′race确定了ORF开始之前有129bp转录了的5′前导序列。使用小立碗藓基因组DNA和引物777与602通过PCR扩增出Ppubq1的5′区域。 
构建携带不同部分启动子和引导hVEGF cDNA表达的5′UTR区域的载体,分析立碗藓属原生质体瞬时转化中启动子的活性。 
结果表明该启动子与Ppact5启动子有相似的活性(或者更高)。检测的构建体、1.6kb和1.3kb的启动子片段表达水平比CaMV 35S启 动子的表达水平高大约4倍和几乎7倍。 
通过对葫芦藓属的总RNA进行5′race PCR,使用来自Ppubq1编码序列的引物,发现了来自葫芦藓属的泛素基因Fhubq1。使用分离的5′UTR序列和部分编码序列设计引物对葫芦藓的基因组连接产物进行反向PCR。这样发现了5′UTR 5′上游的序列。使用引物943和944从葫芦藓的基因组DNA中PCR扩增出5′区域。 
实施例4小立碗藓RBCS表达促进区域的克隆和分析 
作为肌动蛋白、微管蛋白和泛素基因之后的可能候选者,考虑核酮糖-1,5-二磷酸羧化酶/氧化酶的小亚基(rbcS)基因。在核基因组上编码不同的rbcS基因。这些rbcS基因是一个基因家族的成员。rbcS基因主要在能够固定二氧化碳的植物的所有绿色部分中表达。因此该基因家族在从不同苔藓的不同rbcS基因区域得到5′和3′包围的表达促进区域方面是有用的。第一步对立碗藓属的EST数据库进行分析。发现来自小立碗藓的rbcS基因组织成为一个基因家族,由12个基因组成。 
将rbcS基因中最广泛存在的EST--Pprbc-S12作为候选的EST查找其5′和3′表达促进序列。从EST序列数据开始,通过反向PCR确定该基因的5′和3′包围区域并且对克隆的5′和3′区域进行测序。使用引物839和858从小立碗藓基因组DNA上PCR扩增出5′区域。使用引物904和901PCR扩增出3′区域。 
在所附的序列列表中给出了以下的序列(序列编号/序列名称/相对于蛋白编码区5′或者3′区): 
1    Pptub1 5′ 
2    Pptub1 3′ 
3    Pptub2 5′ 
4    Pptub2 3′ 
5    Pptub3 5′ 
6    Pptub3 3′ 
7    Pptub4 5′ 
8    Pptub4 3′ 
9    Ppact1 5′ 
10   Ppact1 3′ 
11   Ppact3 5′ 
12   Ppact3 3′ 
13   Ppact5 5′ 
14   Ppact5 3′ 
15   Ppact7 5′ 
16   Ppact7 3′ 
17   Fhact1 5′ 
18   Fhact1 3′ 
19   Fhact4.4 5′ 
20   Fhact5 5′ 
21   Mpact1 5′ 
22   Mpact4 5′ 
23   Mpact15 5′ 
24   Ppubq1 5′ 
25   Fhubq1 5′ 
26   PprbcS12 5′ 
27   PprbcS12 3′ 
表1:引物列表 
参考文献: 
Altschul et al.,Nucleic Acids Research 25(1997),3389-3402.Berlin et al.,Genetic modification of plant secondary metabol-ism:Alteration of product levels by overexpression of amino acid decarboxylases,in:Advances in Plant Biology,Studies in Plant Science,Vol.4,pp 57-81,DdY Ryu and S Furasaki(eds),Elsevier,Amsterdam 1994. 
Cove et al.Trends Plant Sci.2(1997),99-105 
Engel,Am.J.Bot.55(1968),438-446 
EP 1 206 561 A 
Frahm″Biologie der Moose″(2001),Spektrum Akad.Verlag Gorr(1999)Biotechnologische Nutzung von Physcomitrella patens (Hedw.)B.S.G..Dissertation, 
Figure BSA00000252020700461
Hamburg. 
Grimsley et al.,Mol.Gen.Genet.154(1977),97-100 
Hiwatashi et al.,Plant J.28(1)(2001),105-116 
Hohe et al.,Plant Sci.163(2002),69-74 
Holtdorf et al.,Plant Cell Rep.21(2002),341-346 
Liebich et al.,Nucleic Acids Research 30(2002),3433-3442. 
McElroy et al.,Mol.Gen.Genet.231(1991),150-160 
Reski et al.,Planta 165(1985),354-358 
Reski et al.,Mol.Gen.Genet.244(1994),352-359 
Reski,Botanica Acta III(1998),1-15 
Reski,Planta 208(1999),301-309 
Reutter et al.,Plant Tissue Culture and Biotechnology 2(1996),142-147 
Richter et al.,Gene 290(2002),95-105 
Rothnie et al.,Plant Mol Biol.32(1996),43-61. 
Rother et al.,J.Plant Physiol.143(1994),72-77 
Sambrook et al.(1989),Molecular Cloning:A Laboratory Manual,2nd edn. 
Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press 
Schaefer et al.,Mol Gen Genet 226(1991),418-424 
Schaefer(2001)Principles and protocols for the moss Physcomitrella 
patens.http://www.unil.ch/lpc/docs/PPprotocols2001.pdf
Schaefer,Annu.Rev.Plant Biol.53(2002),477-501 
Schlink et al.,Plant Mol.Biol.Rep.20(2002),423a-423f 
Strepp et al.,Proc.Natl.Acad.Sci.USA 95(1998),4368-4373 
Figure BSA00000252020700462
et al.,NAR 15(1987),5890 
Watson et al.,″Recombinant DNA″(1992),Chapter I.1 and 2Zeidler et al.,J.Plant Physiol.154(1999),641-650 
Figure ISA00000252020900011
Figure ISA00000252020900021
Figure ISA00000252020900031
Figure ISA00000252020900051
Figure ISA00000252020900061
Figure ISA00000252020900071
Figure ISA00000252020900101
Figure ISA00000252020900121
Figure ISA00000252020900131
Figure ISA00000252020900141
Figure ISA00000252020900161
Figure ISA00000252020900181
Figure ISA00000252020900191
Figure ISA00000252020900211
Figure ISA00000252020900221
Figure ISA00000252020900231
Figure ISA00000252020900241
Figure ISA00000252020900261
Figure ISA00000252020900271
Figure ISA00000252020900281
Figure ISA00000252020900291
Figure ISA00000252020900301
Figure ISA00000252020900311
Figure ISA00000252020900321
Figure ISA00000252020900331
Figure ISA00000252020900341

Claims (22)

1.编码野生型细胞核来源的苔藓表达促进区域(MEPR)的分离的核酸分子。
2.根据权利要求1的分离的核酸分子,其特征在于MEPR选自立碗藓属(Physcomitrella)、葫芦藓属(Funaria)、泥炭藓属(Sphagnum)、角齿藓属(Ceratodon)、地钱属(Marchantia)以及Sphaerocarpos的MEPR,优选地选自小立碗藓(Physcomitrella patens)、葫芦藓(Funaria hygrometrica)和地钱(Marchantia polymorpha)的MEPR。
3.根据权利要求1或者2的分离的核酸分子,其特征在于MEPR选自序列编号1到27的序列或者其表达促进片段。
4.根据权利要求1到3中任何一项的分离的核酸分子,其特征在于它包含苔藓启动子以及优选地,5′UTR区域和/或5′内含子和/或3′UTR。
5.根据权利要求1到4中任何一项的分离的核酸分子,其特征在于MEPR具有的表达促进活性至少与花椰菜花叶病毒(CaMV)35S启动子的表达促进活性相等。
6.根据权利要求1到5中任何一项的分离的核酸分子,其特征在于MEPR具有的表达促进活性至少是花椰菜花叶病毒(CaMV)35S启动子表达促进活性的200%,优选至少是500%,特别至少是1000%。
7.根据权利要求1到6中任何一项的分离的核酸分子,其特征在于它还包含重组多肽产物的编码区,所述的编码区在MEPR的控制下。
8.根据权利要求1到7中任何一项的分离的核酸分子,其特征在于它还包含选择标记。
9.根据权利要求1到7中任何一项的分离的核酸分子,其特征在于它还包含与将要用其转化的物种的基因组序列同源的序列,以使在该物种中靶向整合。
10.根据权利要求1到5中任何一项的分离的核酸分子,其特征在于核酸分子以反义或者核酶分子的形式提供。
11.在真核宿主细胞中表达重组多肽产物的方法,包括以下的步骤:提供重组DNA克隆载体,该载体包含根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子,以及选择性地包含所述重组多肽产物的编码区域,所述的编码序列在所述的宿主中,在所述核酸分子的MEPR控制下;转化所述的真核宿主细胞,该细胞在天然情况下不含有在所述的MEPR控制下的所述编码序列;在适宜的培养基中培养转化的真核宿主细胞;表达所述的重组多肽以及分离表达的重组多肽。
12.根据权利要求11的方法,其特征在于所述的真核宿主细胞选自植物细胞,优选是苔藓细胞,特别是小立碗藓细胞。
13.根据权利要求11或者12的方法,其特征在于所述的宿主细胞是原丝体苔藓组织细胞。
14.根据权利要求11到13中任何一项的方法,其特征在于培养基不含有向其中添加的植物激素。
15.根据权利要求11到14中任何一项的方法,其特征在于细胞选自来自立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos的苔藓细胞。
16.根据权利要求11到15中任何一项的方法,其特征在于宿主细胞瞬时表达所述的重组多肽产物。
17.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于在工业上制备多肽,特别是用于提供制备所述多肽的重组细胞。
18.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于表达苔藓多肽,所述苔藓多肽的表达在天然情况下不由所述的MEPR控制,特别用于提供表达所述多肽的重组苔藓细胞。
19.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于筛选和确定表达促进区域的共有序列。
20.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于重组表达翻译后修饰蛋白,特别是制备翻译后被修饰的蛋白。
21.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于体外表达重组蛋白。
22.根据权利要求1到10中任何一项的编码MEPR的分离的核酸分子的用途,用于重组表达代谢修饰蛋白。
CN2010102687975A 2003-08-11 2004-07-30 苔藓表达促进区域 Pending CN101962643A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03450184.1 2003-08-11
EP03450184A EP1510584B1 (en) 2003-08-11 2003-08-11 Expression promoting sequences from mosses and their uses

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2004800229689A Division CN1836046B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Publications (1)

Publication Number Publication Date
CN101962643A true CN101962643A (zh) 2011-02-02

Family

ID=34089803

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2008101311110A Expired - Fee Related CN101555479B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2004800229689A Expired - Fee Related CN1836046B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2010102687975A Pending CN101962643A (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN2008101311110A Expired - Fee Related CN101555479B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域
CN2004800229689A Expired - Fee Related CN1836046B (zh) 2003-08-11 2004-07-30 苔藓表达促进区域

Country Status (11)

Country Link
US (2) US7538259B2 (zh)
EP (2) EP1510584B1 (zh)
JP (1) JP4750028B2 (zh)
KR (1) KR101125448B1 (zh)
CN (3) CN101555479B (zh)
AT (1) ATE426033T1 (zh)
AU (1) AU2004262676B2 (zh)
CA (1) CA2533860C (zh)
DE (1) DE60326716D1 (zh)
ES (1) ES2322140T3 (zh)
WO (1) WO2005014807A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE472605T1 (de) * 2005-07-12 2010-07-15 Greenovation Biotech Gmbh Verbesserungen der proteinproduktion oder in zusammenhang damit
CN103709241B (zh) * 2014-01-02 2015-11-18 中国农业科学院生物技术研究所 来源于苔藓植物的抗旱蛋白PpLEA3-25及其编码基因和应用
CA2962852A1 (en) 2017-03-31 2018-09-30 Chuanxin Sun Carbohydrate producing plant material

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6047683A (ja) * 1983-08-24 1985-03-15 Kirin Brewery Co Ltd プロモ−タ−
US6465636B1 (en) * 1998-04-01 2002-10-15 Zeneca Mogen B.V. Pathogen-inducible promoter
AT408446B (de) 1999-02-18 2001-11-26 Altmann Friedrich Dr Fucosyltransferase-gen
DE19947290A1 (de) 1999-10-01 2001-04-19 Greenovation Pflanzenbiotechno Verfahren zur Herstellung proteinöser Substanzen
AT409381B (de) 2000-03-03 2002-07-25 Gloessl Josef Dr Xylosyltransferase-gen

Also Published As

Publication number Publication date
WO2005014807A2 (en) 2005-02-17
ES2322140T3 (es) 2009-06-17
CN1836046A (zh) 2006-09-20
US20060236432A1 (en) 2006-10-19
US7538259B2 (en) 2009-05-26
US20090111187A1 (en) 2009-04-30
AU2004262676B2 (en) 2009-03-12
CA2533860C (en) 2015-11-03
KR101125448B1 (ko) 2012-07-05
JP2007501619A (ja) 2007-02-01
CN101555479A (zh) 2009-10-14
CA2533860A1 (en) 2005-02-17
ATE426033T1 (de) 2009-04-15
DE60326716D1 (de) 2009-04-30
CN1836046B (zh) 2011-04-06
CN101555479B (zh) 2010-11-03
US7834167B2 (en) 2010-11-16
EP1510584A1 (en) 2005-03-02
WO2005014807A3 (en) 2005-05-06
JP4750028B2 (ja) 2011-08-17
AU2004262676A1 (en) 2005-02-17
EP1510584B1 (en) 2009-03-18
KR20060109869A (ko) 2006-10-23
EP1654369A2 (en) 2006-05-10

Similar Documents

Publication Publication Date Title
CA2549932C (en) Production of heterologous glycosylated proteins in bryophyte cells
CN102482684A (zh) 用于增强植物中组成型基因表达的调节性核酸分子
KR101321890B1 (ko) 인간 엔테로키나아제 경사슬 단백질을 생산하는 식물체 및 이의 용도
CN103421801B (zh) 一种调控稻类结实率的基因及其应用
Chen et al. Expression of thymosin α1 concatemer in transgenic tomato (Solanum lycopersicum) fruits
CN101962643A (zh) 苔藓表达促进区域
WO2011010485A1 (ja) エイコサノイド生産方法、並びにゼニゴケ由来のエイコサノイド生合成系遺伝子及びその利用
KR101918590B1 (ko) 식물의 가뭄 스트레스 내성과 관련된 신규 유전자 및 그의 용도
AU2005229721A1 (en) Expression cassettes for seed-preferential expression in plants
AU2006245701B2 (en) Expression cassettes for seed-preferential expression in plants
KR101574554B1 (ko) 벼 현탁 배양을 이용한 재조합 인간 트립신의 생산방법
JP3305281B2 (ja) α−アミラーゼ遺伝子中の糖応答性エンハンサー
KR101244025B1 (ko) 벼 형질전환용 재조합 벡터 및 이를 이용한 소 트립신의 대량생산방법
JP4373363B2 (ja) 長鎖dna断片導入葉緑体形質転換用ベクター
KR101666680B1 (ko) PNGase A를 생산하는 형질전환 벼 캘러스 및 이의 용도
CN104975025B (zh) 植物花药特异表达启动子pTaASG033的鉴定和应用
Gao Foreign protein production with genetically engineered plant cell cultures
JP2003259868A (ja) イネのα−アミラーゼ転写エンハンサーを有する組換え核酸、ならびにこれを含む安定して形質転換された植物細胞および形質転換植物
KR20100108775A (ko) 아밀라아제 유전자 침묵에 의한 재조합 단백질 증산 방법
JP2001086994A (ja) 転写活性化因子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20110202