附图说明
图1展示说明植物中由蔗糖合酶催化的反应以及UDP-葡萄糖生成与纤维素生物合成途径的偶联。
图2示意性展示本发明的植物表达质粒载体pALELLYX-Susy,其包含驱动本发明蔗糖合酶核苷酸序列表达的形成层/木质部偏好启动子。
图3示意性展示本发明的植物表达质粒载体pALELLYX-SusyN,其包含驱动来自鱼腥蓝细菌的天然蔗糖合酶核苷酸序列表达的形成层/木质部偏好启动子。
图4示意性展示本发明的植物表达质粒载体pALELLYX-SusyCU,其包含驱动编码鱼腥蓝细菌蔗糖合酶的经密码子使用适应性改造的核苷酸序列表达的形成层/木质部偏好启动子。
图5显示转化了本发明植物表达质粒载体pALELLYX-SusyN的若干转基因品系及各自对照非转基因植物中的纤维素含量。星号指示统计学显著更高的纤维素含量平均值(P<0.01,t检验)。
图6显示转化了本发明植物表达质粒载体pALELLYX-SusyCU的若干转基因品系及各自对照非转基因植物中的纤维素含量。星号指示在统计学上显著更高的纤维素含量平均值(P<0.05,t检验)。
图7显示转化了本发明的植物表达质粒载体pALELLYX-SusyCU的T1转基因植物三种基因型中的纤维素含量。星号指示在统计学上显著更高的纤维素含量平均值(P<0.05,t检验)。
发明详述
本发明人发现非植物蔗糖合酶(如可见于蓝细菌中的酶)可能不受经遗传改造以表达该酶的植物调节,其原因包括但不仅限于缺乏调节性磷酸化作用或其它别构位点(如通常可见于植物蔗糖合酶中的那些)。同样,本发明人设想引入这些宿主植物中的非植物蔗糖合酶可影响蔗糖合成,但却不会被宿主植物下调。因此,本发明人通过用编码非植物蔗糖合酶的DNA构建体转化木本树木和其它产生纤维素纤维的作物来实现了这一期望。所述异源酶将提高葡萄糖向UDP-葡萄糖的转换,接着UDP-葡萄糖用作纤维素合成的建造块。
因此,本发明涉及包含非植物蔗糖合酶编码DNA序列和蔗糖合酶多肽的组合物。编码本发明蔗糖合酶的核苷酸序列的实例为SEQ ID NO:1和2。
根据本发明的一个方面,提供了通过控制蔗糖合酶的活性来改变植物组织中纤维素含量的方法,所述植物组织如木本被子植物木质部的纤维细胞、裸子植物木质部的管胞细胞和棉籽的纤维细胞。根据本发明的该方面,用非植物来源(优选鱼腥蓝细菌)的蔗糖合酶编码序列转化植物细胞或完整植物,所述序列在被子植物的木质纤维细胞、裸子植物的木质管胞或棉籽的纤维细胞中表达时致使蔗糖向UDP-葡萄糖的转换提高,引起用于纤维素生物合成的UDP-葡萄糖可用性提高。
除了提高纤维素的生物合成和沉积之外,本发明提供了用于同时降低木质素沉积的方法。树木中高浓度的木质素为造纸工业带来显著的问题,必须消耗可观的资源才能将木质素从纤维素纤维中分离。因此,期望通过遗传工程来降低木本植物中的木质素含量。Hu等,Nature Biotechnology 17:808-812(1999)发现抑制木质素生物合成提高了纤维素沉积,这提示木质素与纤维素生物合成之间负相关。因为本发明人已发现通过表达非植物蔗糖合酶来提高纤维素沉积的策略,所以也可能同时引起木质素沉积的降低。
本文使用的所有技术术语均为普遍用于生物化学、分子生物学和农业的术语,并且可为本发明所属领域的普通技术人员所理解。这些技术术语可见于以下文献:MOLECULAR CLONING:A LABORATORYMANUAL,第三版,1-3卷,Sambrook和Russel编辑,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,2001;CURRENTPROTOCOLS IN MOLECULAR BIOLOGY,Ausubel等编辑,GreenePublishing Associates and Wiley-Interscience,New York,1988(定期更新);SHORT PROTOCOLS IN MOLECULAR BIOLOGY:A COMPENDIUMOF METHODS FROM CURRENT PROTOCOLS IN MOLECULARBIOLOGY,第五版,1-2卷,Ausubel等编辑,John Wiley&Sons,Inc.,2002;GENOME ANALYSIS:A LABORATORY MANUAL,1-2卷,Green等编辑,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1997。涉及植物生物学技术的方法在本文中有所描述,并且在以下著述中详细描述:METHODS IN PLANT MOLECULAR BIOLOGY:ALABORATORY COURSE MANUAL,Maliga等编辑,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,1995。使用PCR的多种技术描述于例如Innis等,PCR PROTOCOLS:A GUIDE TO METHODS ANDAPPLICATIONS,Academic Press,San Diego,1990以及Dieffenbach和Dveksler,PCR PRIMER:A LABORATORY MANUAL,第二版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2003。可利用已知技术从已知序列得到PCR引物对,例如使用旨在用于该目的的计算机程序,例如Primer,0.5版,1991,Whitehead Institute for BiomedicalResearch,Cambridge,MA。用于核酸化学合成的方法描述于例如Beaucage和Caruthers,Tetra.Letts.22:1859-1862(1981)以及Matteucci和Caruthers,J.Am.Chem.Soc.103:3185(1981)。
限制酶消化、磷酸化、连接和转化如Sambrook等,MOLECULARCLONING:A LABORATORY MANUAL,第二版(1989),Cold SpringHarbor Laboratory Press所述进行。除非另有说明,用于培养和维持细菌细胞的所有试剂和材料均得自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、Invitrogen(Gaithersburg,MD)或Sigma Chemical Company(St.Louis,MO)。
术语“编码”指基因通过转录和翻译机制向细胞提供信息的过程,在所述细胞中一系列氨基酸可组装成特定的氨基酸序列以产生活性酶。由于遗传密码的简并性,DNA序列中的某些碱基变化不改变蛋白质的氨基酸序列。因此应当理解,本发明涵盖编码蔗糖合酶的DNA序列中不显著影响蔗糖合酶的功能特性的修饰。
在本说明书中,“表达”指产生基因编码的蛋白质产物。“过表达”是指在转基因生物中产生超过正常或非转化生物中所产生水平的基因产物。
非植物蔗糖合酶序列
已在若干非植物物种中鉴定出蔗糖合酶基因,例如蓝细菌(鱼腥蓝细菌)、变形菌(欧洲亚硝化单胞菌(N.europaea))、绿藻(小球藻(C.vulgaris)和斜生栅藻(S.obliquus))和原生生物(眼虫(E.gracilis))。因此,本文中短语“非植物蔗糖合酶”指从赋予蔗糖合酶活性的非植物物种基因组分离的任何核酸、基因、多核苷酸、DNA、RNA、mRNA或cDNA分子。
适用于本发明的非植物蔗糖合酶可得自多种特征为存在蔗糖合酶基因的生物,所述蔗糖合酶基因较少受到包含和表达该基因的宿主植物调节。例如,植物的蔗糖合酶序列含有调节基因表达的磷酸化结构域,而例如许多蓝细菌的蔗糖合酶序列缺乏磷酸化结构域。与植物蔗糖合酶不同,相信非植物蔗糖合酶在宿主植物中较少受到负反馈抑制。
就本发明目的而言,非植物蔗糖合酶基因优选分离自蓝细菌物种。更优选地,非植物蔗糖合酶基因分离自丝状蓝细菌和异形胞蓝细菌。示例性蓝细菌物种为隐球蓝细菌(Aphanocapsa sp.)、隐杆蓝细菌(Aphanothecesp.)、管孢蓝细菌(Chamaesiphon sp.)、色球蓝细菌(Chroococcus sp.)、Chroogloeocystis sp.、Crocosphaera sp.、蓝细菌(Cyanobacterium sp.)、蓝菌(Cyanobium sp.)、蓝丝菌(Cyanothece sp.)、拟指球菌(Dactylococcopsissp.)、粘球蓝细菌(Gloeocapsa sp.)、粘杆蓝细菌(Gloeothece sp.)、Johannesbaptistia sp.、片菌(Merismopedia sp.)、微囊蓝细菌(Microcystissp.)、杆皮藻(Rhabdoderma sp.)、聚球蓝细菌(Synechococcus sp.)、集胞蓝细菌(Synechocystis sp.)、Thermosynechococcus sp.、鱼腥蓝细菌(Anabaena sp.)、项圈蓝细菌(Anabaenopsis sp.)、蓝束丝蓝细菌(Aphanizomenon sp.)、管链蓝细菌(Aulosira sp.)、蓝螺菌(Cyanospirasp.)、拟柱孢藻(Cylindrospermopsis sp.)、筒孢蓝细菌(Cylindrospermumsp.)、Mojavia sp.、节球蓝细菌(Nodularia sp.)、念珠蓝细菌(Nostoc sp.)、尖头蓝细菌(Raphidiopsis sp.)、Trichormus sp.、眉蓝细菌(Calothrix sp.)、胶刺蓝细菌(Gloeotrichia sp.)、伪枝蓝细菌(Scytonema sp.)、Scytonematopsis sp.、节螺蓝细菌(Arthrospira sp.)、Geitlerinema sp.、Halomicronema sp.、盐螺旋藻(Halospirulina sp.)、Katagnymene sp.、Leptolyngbya sp.、湖生蓝丝藻(Limnothrix sp.)、鞘丝蓝细菌(Lyngbya sp.)、微鞘蓝细菌(Microcoleus sp.)、颤蓝细菌(Oscillatoria sp.)、席蓝细菌(Phormidium sp.)、Planktothricoides sp.、浮游蓝丝藻(Planktothrix sp.)、织线藻(Plectonema sp.)、假鱼腥蓝细菌(Pseudanabaena sp.)、裂须蓝细菌(Schizothrix sp.)、螺旋蓝细菌(Spirulina sp.)、束蓝细菌(Symploca sp.)、束毛蓝细菌(Trichodesmium sp.)、Tychonema sp.、拟色球蓝细菌(Chroococcidiopsis sp.)、皮果蓝细菌(Dermocarpa sp.)、小皮果蓝细菌(Dermocarpella sp.)、粘八叠球菌(Myxosarcina sp.)、宽球蓝细菌(Pleurocapsa sp.)、斯塔尼尔氏菌(Stanieria sp.)、异球蓝细菌(Xenococcussp.)、原绿蓝细菌(Prochloron sp.)、原绿球藻(Prochlorococcus sp.)、原绿丝蓝细菌(Prochlorothrix sp.)、蒴链藻(Capsosira sp.)、拟绿胶蓝细菌(Chlorogloeopsis sp.)、飞氏蓝细菌(Fischerella sp.)、软管蓝细菌(Hapalosiphon sp.)、(Mastigocladopsis sp.)、拟念珠蓝细菌(Nostochopsissp.)、真枝蓝细菌(Stigonema sp.)、聚线藻(Symphyonema sp.)、Umezakiasp.、拟惠氏蓝细菌(Westiellopsis sp.)、Acaryochloris sp.。
例如,根据本发明,分离自鱼腥蓝细菌的蔗糖合酶基因是非植物蔗糖合酶,并可用于改变植物组织和/或器官的纤维素含量。优选地,所述非植物蔗糖合酶得自鱼腥蓝细菌基因组DNA,如SEQ ID NO:1所示序列。SEQID NO:1代表可见于鱼腥蓝细菌基因组DNA中的蔗糖合酶序列,其与编码蔗糖合酶蛋白的植物cDNA的同一性低于55%。应该注意,SEQ ID NO:1缺乏N端附近的保守性磷酸化位点,该磷酸化位点是真核物种中蛋白质磷酸化所必需的。
非植物蔗糖合酶序列可以作为经密码子优化的序列从头开始合成。参阅Young和Dong,Nucleid Acids Res 32:e59(2004)。例如,SEQ ID NO:2提供了编码蔗糖合酶的DNA序列,其中将所有密码子选择成与植物中针对每种氨基酸所使用的平均偏好密码子相匹配。因此,SEQ ID NO:2与编码蔗糖合酶蛋白的植物cDNA的同一性低于55%,但是所编码的蛋白质序列与非密码子优化序列所编码的蛋白质序列相同,因此它也缺乏N端附近的保守性磷酸化位点。
另外,合适的非植物蔗糖合酶序列类别包括由SEQ ID NO:1或SEQID NO:2的变体组成的核酸分子,其缺失、替换、插入或添加了一个或多个碱基,所述变体编码具有蔗糖合酶活性的多肽。因此,“缺失、替换、插入或添加了一个或多个碱基的碱基序列”仍保留生理活性,即便所编码的氨基酸序列中替换、缺失、插入或添加了一个或多个氨基酸。具有这样的修饰并编码蔗糖合酶同工酶的核苷酸序列包括在本发明范围内。例如,可以缺失多腺苷酸尾或者5’或3’末端非翻译区,并且可缺失碱基至使氨基酸缺失的程度。还可以替换碱基,只要不造成移码即可。还可以“添加”碱基至添加氨基酸的程度。然而,任何这样的修饰不得造成蔗糖合酶活性的损失。例如,可以修饰本发明的DNA碱基序列以通过位点特异性诱变而替换、缺失、插入或添加特定位点的氨基酸,从而获得本文中经修饰的DNA。Zoller&Smith,Nucleic Acid Res.10:6487-6500(1982)。
可以由适当的碱基从头开始合成非植物蔗糖合酶序列,例如通过使用本文公开的适当蛋白质序列为指导来产生DNA分子,该DNA分子尽管不同于天然的DNA序列,但却引起产生具有相同或相似氨基酸序列的蛋白质。这类合成DNA分子在向植物中引入编码异源蛋白质的DNA序列时有用,该DNA序列反映不同的(非植物)密码子使用频率,并且如果不加以修饰地使用则可导致宿主植物翻译效率低。例如,SEQ ID NO:2中的DNA序列就是这样经密码子使用优化的分子。
本发明还提供了包含核苷酸序列SEQ ID NO:1和2的核酸分子,其编码活性蔗糖合酶,其中该酶具有对应于SEQ ID NO:3的氨基酸序列,并且其中本发明的蛋白质包含不改变该蔗糖合酶功能的氨基酸替换、添加和缺失。SEQ ID NO.:3与真核蛋白质的序列同源性平均低于40%。
合适的调节元件
本发明提供了可以在转化植物中引起纤维素含量改变的核酸分子。本发明的一个重要方面是DNA构建体的使用,其中蔗糖合酶编码核苷酸序列与一个或多个调节序列有效连接,所述调节序列驱动蔗糖合酶编码序列在某些细胞类型、器官或组织中表达,从而改变转化植物的纤维素含量,而不对其正常发育或生理状况产生不当影响。
维管系统包括木质部和韧皮组织,统称为“维管组织”。维管系统特异性启动子(如木质部偏好启动子)可用于实现本发明的核酸分子的表达,特别是在维管组织(尤其是木质部组织)中表达。因此,“木质部偏好”指本发明的核酸分子在木质部中比在任何其它植物组织中活性更高。根据本发明,所选择的启动子应当引起非植物蔗糖合酶过表达,由此改变木质部的大小、改变宿主植物木质部的化学组成或者二者兼有。
合适的启动子的实例包括但不限于木质部偏好的微管蛋白(TUB)基因启动子、木质部偏好的脂质转移蛋白(LTP)基因启动子和木质部偏好的香豆酸-4-羟化酶(C4H)基因启动子。其它合适的木质部偏好启动子公开于2005年3月28日提交的国际专利申请PCT/BR2005/000041中,其通过参考并入本文。
本发明使用的另一些调节元件描述于以下“DNA构建体”小标题下。
用于遗传改造的植物
本发明包括对植物(特别是树木和产生纤维素纤维的作物如棉花)进行遗传操作从而增强维管组织或种子的纤维细胞中蔗糖合酶的活性,这通过引入非植物蔗糖合酶基因来实现,该基因优选在木质部偏好启动子控制之下。结果为纤维素的合成和沉积增强。
在本说明书中,“植物”指可进行遗传操作的任何含有纤维素的植物材料,包括但不仅限于分化或未分化的植物细胞、原生质体、完整植物、植物组织或植物器官,或者植物的任何组分如叶、茎、根、芽、块茎、果实、根茎等。
可根据本发明进行改造的植物包括但不仅限于树木,如桉属物种(白桉(E.alba)、E.albens、杏仁桉(E.amygdalina)、E.aromaphloia、E.baileyana、E.balladoniensis、双肋桉(E.bicostata)、葡萄桉(E.botryoides)、E.brachyandra、褐斑桉(E.brassiana)、E.brevistylis、E.brockwayi、赤桉(E.camaldulensis)、E.ceracea、大花序桉(E.cloeziana)、聚果桉(E.coccifera)、异心叶桉(E.cordata)、耶桉(E.cornuta)、E.corticosa、常桉(E.crebra)、E.croajingolensis、E.curtisii、山桉(E.dalrympleana)、剥皮桉(E.deglupta)、瑞格楠木(E.delegatensis)、E.delicata、红桉(E.diversicolor)、E.diversifolia、阔叶桉(E.dives)、E.dolichocarpa、E.dundasii、邓恩桉(E.dunnii)、E.elata、E.erythrocorys、E.erythrophloia、E.eudesmoides、E.falcata、E.gamophylla、E.glaucina、蓝桉(E.globulus)、E.globulus subsp.bicostata、E.globulus subsp.globulus、E.gongylocarpa、大桉(E.grandis)、E.grandis x urophylla、E.guilfoylei、加利桉(E.gunnii)、E.hallii、E.houseana、E.jacksonii、E.lansdowneana、E.latisinensis、E.leucophloia、白藓叶桉(E.leucoxylon)、E.lockyeri、E.lucasii、直杆蓝桉(E.maidenii)、赤桉(E.marginata)、E.megacarpa、蜜味桉(E.melliodora)、E.michaeliana、小帽桉(E.microcorys)、E.microtheca、E.muelleriana、亮果桉(E.nitens)、E.nitida、斜叶桉(E.obliqua)、E.obtusiflora、湿地桉(E.occidentalis)、E.optima、卵叶桉(E.ovata)、E.pachyphylla、雪桉(E.pauciflora)、粗皮桉(E.pellita)、E.perriniana、E.petiolaris、E.pilularis、E.piperita、阔叶桉(E.platyphylla)、多花桉(E.polyanthemos)、畅叶桉(E.populnea)、E.preissiana、E.pseudoglobulus、E.pulchella、澳洲尤加利(E.radiata)、E.radiata subsp.radiata、王桉(E.regnans)、E.risdonii、E.robertsonii、E.rodwayi、河红桉(E.rubida)、E.rubiginosa、柳叶桉(E.saligna)、E.salmonophloia、E.scoparia、银顶白蜡桉(E.sieberi)、E.spathulata、E.staeri、E.stoatei、E.tenuipes、E.tenuiramis、细叶桉(E.tereticornis)、E.tetragona、澳大利亚红檀(E.tetrodonta)、E.tindaliae、E.torquata、E.umbra、尾叶桉(E.urophylla)、E.vernicosa、多枝桉(E.viminalis)、E.wandoo、韦塔桉(E.wetarensis)、E.willisii、E.willisii subsp.falciformis、E.willisii subsp.willisii、E.woodwardii);杨属物种(银白杨(P.alba)、银白杨×大齿杨(P.alba xP.grandidentata)、银白杨×欧洲山杨(P.alba x P.tremula)、P.alba x P.tremula var.glandulosa、P.alba x P.tremuloides、小叶杨(P.balsamifera)、P.balsamifera subsp.trichocarpa、P.balsamifera subsp.trichocarpa x P.deltoides、缘毛杨(P.ciliata)、美洲黑杨(P.deltoides)、胡杨(P.euphratica)、欧美杨(P.euramericana)、P.kitakamiensis、大叶杨(P.lasiocarpa)、苦杨(P.laurifolia)、辽杨(P.maximowiczii)、P.maximowiczii x P.balsamiferasubsp.trichocarpa、黑杨(P.nigra)、P.sieboldii x P.grandidentata、甜杨(P.suaveolens)、川杨(P.szechuanica)、毛白杨(P.tomentosa)、欧洲山杨(P.tremula)、(P.tremula x P.tremuloides)、似欧洲山杨(P.tremuloides)、椅杨(P.wilsonii)、加杨(P.canadensis)、滇杨(P.yunnanensis));针叶树如火炬松(Pinus taeda)、湿地松(Pinus elliottii)、西黄松(Pinus ponderosa)、扭叶松(Pinus contorta)和辐射松(Pinus radiata);花旗松(Pseudotsugamenziesii);加拿大铁杉(Tsuga canadensis);美洲云杉(Picea glauca);红杉(北美红杉(Sequoia sempervirens));冷杉如银枞(Abies amabilis)和香脂冷杉(Abies balsamea);以及雪松如北美乔柏(Thuja plicata)和黄扁柏(Chamaecyparis nootkatensis)。
本文还包括产生纤维的植物。示例性作物为棉(Gossypium spp.)、亚麻(Linum usitatissimum)、异株荨麻(Urtica dioica)、啤酒花(Humuluslupulus)、欧椴树(小叶椴(Tilia cordata)、T.x.europaea和大叶椴(T.platyphyllus))、鹰爪豆(spartium junceum)、苎麻(Boehmeria nivea)、构树(Broussonetya papyrifera)、新西兰麻(Phormium tenax)、夹竹桃(Apocynum cannabinum)、鸢尾属物种(道氏鸢尾(I.douglasiana)、I.macrosiphon和I.purdyi)、马利筋(Asclepia species)、菠萝、香蕉等。还考虑了饲料作物,如苜蓿、黑麦草属、羊茅属和三叶草。
在本说明书中,“转基因植物”是指引入了DNA序列的植物,所述DNA序列包括但不限于宿主植物基因组中通常不存在的基因、通常不转录为RNA或翻译为蛋白质(“表达”)的DNA序列或者期望引入未转化植物的任何其他基因或DNA序列,例如通常可存在于未转化植物中但期望对其进行遗传改造或改变其表达的基因。“转基因植物”类别包括原代转化体和谱系中包括转化体的植物,这通过例如标准基因渗入或另一育种方法来实现。
预期在某些情形中,将通过稳定引入转基因使本发明转基因植物的基因组增加。然而,在另一些情形中,所引入的基因将替换内源序列。根据本发明,在这一点上优选的基因为非植物蔗糖合酶DNA序列,尤其是从蓝细菌物种鱼腥蓝细菌获得的序列。
DNA构建体
根据本发明的一个方面,将非植物蔗糖合酶序列引入适用于植物转化的DNA构建体中。如上所述,这样的DNA构建体可用于改变植物中蔗糖合酶基因的表达。
因此,提供了包含非植物蔗糖合酶序列的DNA构建体,所述序列处于在植物中起作用的转录起始区的控制之下,从而该构建体可在宿主植物细胞中产生RNA。优选地,所述转录起始区是维管或木质部偏好启动子(例如任何上述启动子)的一部分。
重组DNA构建体可使用标准技术产生。例如,用于转录的DNA序列可通过用限制酶处理包含所述序列的载体以切出适当的区段来获得。用于转录的DNA序列还可通过退火和连接合成寡聚核苷酸或者通过在聚合酶链式反应(PCR)中使用合成寡聚核苷酸以在每个末端产生适当的限制酶切位点来产生。然后,将所述DNA序列克隆进包含上游启动子和下游终止子序列的载体中。
本发明的表达载体还可包含终止序列,其位于本发明核酸分子的下游,从而终止mRNA转录并添加多聚A序列。这样的终止子的实例为花椰菜花叶病毒(CaMV)35S终止子和胭脂碱合酶基因(Tnos)终止子。表达载体还可包含增强子、起始密码子、剪接信号序列和靶向序列。
本发明的表达载体还可包含选择标记,通过该选择标记可在培养物中鉴定转化植物细胞。所述标记可以与异源核酸分子(即与启动子有效连接的基因)相连。本文使用的术语“标记”是指编码某种性状或表型的基因,该性状或表型允许选择或筛选包含该标记的植物或植物细胞。通常,标记基因将编码抗生素或除草剂抗性。这允许从未转化或转染的细胞中选择转化细胞。
合适的选择标记的实例包括腺苷脱氨酶、二氢叶酸还原酶、潮霉素-B-磷酸转移酶、胸苷激酶、黄嘌冷-鸟嘌呤转磷酸核糖转移酶、草甘膦和草铵膦抗性以及氨基糖苷3′-O-磷酸转移酶(卡那霉素、新霉素和G418抗性)。这些标记包括对G418、潮霉素、博来霉素、卡那霉素和庆大霉素的抗性。所述构建体还可包含选择标记基因Bar,该基因赋予对除草剂膦丝菌素类似物(如草铵膦)的抗性。Thompson等,EMBO J.9:2519-2523(1987)。还已知其它合适的选择标记。
还可包括细菌或病毒起点的复制序列,以使载体可以克隆进细菌或噬菌体宿主中。优选地,使用宽宿主范围的原核复制起点。还可以包括用于细菌的选择标记,以允许选择带有期望构建体的细菌细胞。合适的原核选择标记还包括对抗生素(如卡那霉素或四环素)的抗性。
如本领域所知,载体中还可以存在编码其它功能的其他DNA序列。例如,当宿主为农杆菌属时,可包含T-DNA序列,以便于随后转移并整合到植物染色体中。
植物转化
使用适当的转化技术,本发明的构建体可用于转化任何植物细胞。单子叶和双子叶被子植物或裸子植物的细胞均可使用多种本领域已知方法进行转化。例如,参阅Klein等,Biotechnology 4:583-590(1993);Bechtold等,C.R.Acad.Sci.Paris 316:1194-1199(1993);Bent等,Mol.Gen.Genet.204:383-396(1986);Paszowski等,EMBO J.3:2717-2722(1984);Sagi等,Plant Cell Rep.13:262-266(1994)。
可使用农杆菌属物种如根癌农杆菌(A.tumefaciens)和毛根农杆菌(A.rhizogenes),例如参照Nagel等,Microbiol Lett 61:325(1990)。简言之,可通过如电穿孔用植物表达载体转化农杆菌,然后通过例如熟知的叶盘法将所述农杆菌引入植物细胞中。用于实现此目的的其它方法包括但不仅限于电穿孔、微粒枪轰击、磷酸钙沉淀和聚乙二醇融合、转移至萌发的花粉粒中、直接转化(Lorz等,Mol.Genet.199:179-182(1985))以及本领域已知的其它方法。如果使用选择标记(如卡那霉素抗性),则更易于确定哪些细胞已成功转化。
已知上述农杆菌转化方法可用于转化双子叶植物。另外,de la Pena等,Nature 325:274-276(1987),Rhodes等,Science 240:204-207(1988)和Shimamato等,Nature 328:274-276(1989)已使用农杆菌转化谷类单子叶植物,上述文献均通过参考并入本文中。还参阅Bechtold,等,C.R.Acad.Sci.Paris 316(1994),其显示了真空渗入用于农杆菌所介导转化的用途。
可测量特定细胞中蛋白质、多肽或核酸分子的存在从而确定例如细胞是否已成功转化或转染。进行这些测定的方法是公知的,本文无需赘述。
定量纤维素和木质素含量
本发明的转基因植物的特征在于纤维素含量提高以及优选的木质素含量降低。在遗传改造植物中纤维素含量的提高优选通过提高发生纤维素沉积的植物组织中的蔗糖合酶活性来实现。在描述本发明的植物时,“纤维素含量的提高”是指与野生型植物中的纤维素量相比,植物中纤维素量的定量提高。纤维素的定量提高可通过若干方法测定,例如基于茎磨木(stemmilled wood)中多糖酸水解后的总糖进行的定量。Chiang和Sarkanen,Wood Sci.Technol.,17:217-226(1983);Davis,J.Wood Chem.Technol.,18:235-252(1988)。
本发明改造植物中的纤维素含量可以提高到野生型植物纤维素含量的约105%至约200%的水平,优选约110%至约175%,更优选约115%至约150%。本发明植物的一个最优选的实施方案的纤维素含量为野生型纤维素含量的约120%至约140%。
由于纤维素生物合成的提高可降低木质素含量,因此本发明的转基因植物可具有提高的纤维素含量和降低的木质素含量。参阅Hu等,NatureBiotechnol.17:808-812(1999)。因此,在本说明书中,短语“减少的木质素含量”和“降低的木质素含量”是指与野生型植物中木质素的量相比,植物中木质素量的定量降低。可通过几种方法测定木质素的定量降低,例如Klason木质素测定(Kirk等,Method in Enzymol.161:87-101(1988))或木质素的乙酰溴测定(Iiyama等,Wood Sci Technol.22:271-280(1988))。
本发明的改造植物中的木质素含量可降低至野生型植物中木质素含量的约5%至约90%的水平,优选约10%至约75%,更优选约15%至约65%。本发明植物的一个最优选的实施方案的木质素含量为野生型木质素含量的约20%至约60%。
下文展示了获得蓝细菌蔗糖合酶基因以及通过农杆菌引入靶基因以产生植物转化体的方法的具体实例。它们旨在进行示例,而非限制本发明。
实施例5.在维管组织中过表达蔗糖合酶的转基因植物中纤维素含量的提高
收集5个烟草属转基因事件与非转基因对照植物的主干并风干两周,所述转基因植物转化了包含木质部偏好美洲黑杨微管蛋白启动子控制下的天然鱼腥蓝细菌蔗糖合酶基因的构建体。将干燥的茎切碎并使用30目孔筛在刀式粉碎机中粉碎。然后,对茎的粉末样品进行化学分析,以测定纤维素和木质素的含量。简言之,基于干木中这些多糖酸水解之后的总糖来测定纤维素和半纤维素含量。将木粉末在45℃真空干燥并用H2SO4水解。在高pH阴离子交换层析后,基于水解产物的组成来定量葡聚糖和其它多糖(半纤维素)。Chiang&Sarkanen,Wood Sci.Technol.17:217-226(1983);Davis,J.Wood Chem.Technol.18:235-252(1988)。
两个转基因事件(已知其根据实施例3中详述的方案表达转基因)显示统计学显著的纤维素含量提高(图5)。与对照植物中的48.6%相比,转基因事件25显示54%的纤维素,表明纤维素含量显著提高11%(P<0.01,t检验)。与对照植物中的48.6%相比,转基因事件53显示52%的纤维素,表明纤维素含量提高7%(图5;P<0.01,t检验)。另外,如Klason重量法所测定的,转基因品系25显示木质素含量的明显下降(19.15%,与对照植物的23.3%相比;P<0.01,t检验)。
用构建体转化的11个T0转基因事件中的5个显示统计学显著的纤维素含量提高,所述构建体包含修饰的经密码子使用适应性改造的鱼腥蓝细菌蔗糖合酶基因。与对照植物的平均值相比,转基因事件BIO92-51A、BIO92-11C、BIO92-13B、BIO92-29B和BIO92-16A显示纤维素含量显著提高(P<0.05,t检验)(图6)。例如,与对照非转基因植物中的51.7%相比,转基因事件BIO92-51A显示55.28%的纤维素,表明纤维素含量显著增加约7%。
生长至成熟后,将来自经密码子使用适应性改造的蔗糖合酶基因的T0事件自交以产生T1品系。与纯合隐性植物相比,纯合子显性的植物显示纤维素含量显著提高7%(P<0.05,t检验)(图7)。
序列表
<110>法比奥·帕佩斯
保罗·阿鲁达
<120>用于改变植物纤维素含量的多核苷酸、DNA构建体和方法
<140>
<141>
<150>US 60/728,743
<151>2005-10-21
<160>8
<210>1
<211>2429
<212>DNA
<213>鱼腥蓝细菌(Anabaena sp.)PCC 7120
<220>
<221>DNA
<222>(1)...(2429)
<223>鱼腥蓝细菌蔗糖合酶,基因组克隆
<400>SEQ ID NO:1
catatgtcag aattgatgca agcgatttta gatagtgaag aaaaacatga tttgcgtgga 60
tttattagtg agttgcgtca gcaagataaa aattacctgc tacgcaacga tatactgaat 120
gtgtatgctg aatactgctc taagtgccag aaaccggaaa cttcttataa gttttctaat 180
ctaagtaaac ttatttacta cactcaagaa ataattcaag aagattccaa tttttgcttc 240
attattcgtc ctaagattgc tgctcaagag gtatatcgac tcaccgcaga tttagatgtg 300
gagccgatga ctgtgcagga attgttggat ctgcgcgatc gcctagttaa taaattccat 360
ccttatgaag gcgatatatt agaactagat ttcggcccct tctacgatta caccccaacc 420
atccgcgatc ccaagaatat tggcaagggt gtacaatatc tcaaccgtta tctctccagt 480
aaactttttc aagactcgca acaatggctg gaaagtctgt ttaatttctt gcgcctacat 540
aattacaatg gtattcaact actaataaac catcaaattc aatcacagca acaattatca 600
cagcaagtta aaaacgcgct taactttgtg agcgatcgcc ccaatgatga accctacgaa 660
caattccggc tgcaactaca aactatgggt tttgagccgg ggtggggtaa tacagcttct 720
cgtgtgcggg ataccttaaa cattttggat gaattgattg actctcccga cccccaaacc 780
ctggaagctt ttatctctcg catcccgatg attttcagaa tcgtcttagt ttcagcccac 840
ggttggttcg gacaagaggg ggttttaggt cgtccagata ctggtggtca agtagtgtac 900
gtccttgacc aagctaagaa tttagaaaag caactgcaag aagatgccat acttgcaggt 960
ttagaggtat tgaacgtcca gcccaaggta attatcctca cccgtctgat tcctaatagt 1020
gacggaacgc tttgtaacca aaggttagaa aaagtctacg gtacagagaa cgcctggatt 1080
ttgcgtgtac ctctgcggga gtttaacccc aagatgacgc agaactggat ttctcgattc 1140
gagttttggc cttatctaga aacctttgcc attgactcag aaagagaatt gttggcagaa 1200
ttccaaggta gaccagactt aatcgtgggt aattatactg acgggaactt agttgctttt 1260
ctgttgacgc gacggatgaa agttacccaa tgcaacatcg ctcatgcttt agaaaaatcc 1320
aaatacttgt ttagtaacct ctactggcaa gatttggaag aaaaatatca tttctcttta 1380
caattcacgg ctgatttaat agctatgaat gctgctaact tcgtcatcag cagcacctat 1440
caagaaattg ttggcacacc agacagtata gggcagtatg agtcttacaa atgctttacc 1500
atgccggaac tgtatcatgt ggtcaacggc attgaattat ttagccccaa atttaacgtt 1560
gtaccgcctg gtgtgaatga aaattcctac tttccctaca cacaaactca aaacagaata 1620
gaaagcgatc gcgatcgcct agaggaaatg ctgtttaccc tagaagattc tagccaaatc 1680
ttcggcaaac tcgacgaccc aaataagcgt cctattttct caatggcgcg acttgaccga 1740
attaaaaacc tcacaggttt ggcagaatgc tttggtcaaa gtcaagaatt gcaagaacgt 1800
tgcaacttaa ttttagttgc aggtaagctg cgtatcgaag aatcagaaga taacgaagaa 1860
aaagacgaaa tcgtcaaact ttaccggatt attgacgaat acaacctgca tggcaaaatt 1920
cgctggttag gtgtgcgctt atccaaaaat gactccggtg aaatttatcg cgtcatttgc 1980
gatcgccaag gcatttttgt acagccagca ttatttgaag cctttgggtt gacaatcctg 2040
gagtcaatga tttccggatt gccaacattt gctacccaat ttggggggcc attggagatt 2100
attcaggata agattaatgg cttctacatt aaccctactc atctagaaga aacagccaca 2160
aaaattcttg atttcgtcac caaatgcgaa caaaatccta actattggaa cataatttcc 2220
gagaaagcca ttgacagagt atatagtaca tacacctgga aaatacacac aactaagctg 2280
ttaaccttag ctcggattta cggcttctgg aattttacct cgaaagaaaa acgcgaagat 2340
ttattacgct accttgagtc cctgttctac ttaatttaca agcccagagc gcaacaacta 2400
ttagaacagc ataaatatcg gtaagatct 2429
<210>2
<211>2430
<212>DNA
<213>鱼腥蓝细菌PCC 7120
<220>
<221>合成的
<222>(1)...(2430)
<223>经密码子使用适应性改造的合成鱼腥蓝细菌蔗糖合酶
<400>2
catatgtctg agctcatgca ggctatcctc gattctgagg agaagcacga tctcaggggc 60
ttcatctctg agctcaggca gcaggataag aactacctcc tcaggaacga tatcctcaac 120
gtgtacgctg agtactgctc taagtgccag aagcctgaga cctcttacaa gttctctaac 180
ctctctaagc tcatctacta cacccaggag atcatccagg aggattctaa cttctgcttc 240
atcatcaggc ctaagatcgc tgctcaggag gtgtacaggc tcaccgctga tctcgatgtg 300
gagcctatga ccgtgcagga gctcctcgat ctcagggata ggctcgtgaa caagttccac 360
ccttacgagg gcgatatcct cgagctcgat ttcggccctt tctacgatta cacccctacc 420
atcagggatc ctaagaacat cggcaagggc gtgcagtacc tcaacaggta cctctcttct 480
aagctcttcc aggattctca gcagtggctc gagtctctct tcaacttcct caggctccac 540
aactacaacg gcatccagct cctcatcaac caccagatcc agtctcagca gcagctctct 600
cagcaggtga agaacgctct caacttcgtg tctgataggc ctaacgatga gccttacgag 660
cagttcaggc tccagctcca gaccatgggc ttcgagcctg gctggggcaa caccgcttct 720
agggtgaggg ataccctcaa catcctcgat gagctcatcg attctcctga tcctcagacc 780
ctcgaggctt tcatctctag gatccctatg atcttcagga tcgtgctcgt gtctgctcac 840
ggctggttcg gccaggaggg cgtgctcggc aggcctgata ccggcggcca ggtggtgtac 900
gtgctcgatc aggctaagaa cctcgagaag cagctccagg aggatgctat cctcgctggc 960
ctcgaggtgc tcaacgtgca gcctaaggtg atcatcctca ccaggctcat ccctaactct 1020
gatggcaccc tctgcaacca gaggctcgag aaggtgtacg gcaccgagaa cgcttggatc 1080
ctcagggtgc ctctcaggga gttcaaccct aagatgaccc agaactggat ctctaggttc 1140
gagttctggc cttacctcga gaccttcgct atcgattctg agagggagct cctcgctgag 1200
ttccagggca ggcctgatct catcgtgggc aactacaccg atggcaacct cgtggctttc 1260
ctcctcacca ggaggatgaa ggtgacccag tgcaacatcg ctcacgctct cgagaagtct 1320
aagtacctct tctctaacct ctactggcag gatctcgagg agaagtacca cttctctctc 1380
cagttcaccg ctgatctcat cgctatgaac gctgctaact tcgtgatctc ttctacctac 1440
caggagatcg tgggcacccc tgattctatc ggccagtacg agtcttacaa gtgcttcacc 1500
atgcctgagc tctaccacgt ggtgaacggc atcgagctct tctctcctaa gttcaacgtg 1560
gtgcctcctg gcgtgaacga gaactcttac ttcccttaca cccagaccca gaacaggatc 1620
gagtctgata gggataggct cgaggagatg ctcttcaccc tcgaggattc ttctcagatc 1680
ttcggcaagc tcgatgatcc taacaagagg cctatcttct ctatggctag gctcgatagg 1740
atcaagaacc tcaccggcct cgctgagtgc ttcggccagt ctcaggagct ccaggagagg 1800
tgcaacctca tcctcgtggc tggcaagctc aggatcgagg agtctgagga taacgaggag 1860
aaggatgaga tcgtgaagct ctacaggatc atcgatgagt acaacctcca cggcaagatc 1920
aggtggctcg gcgtgaggct ctctaagaac gattctggcg agatctacag ggtgatctgc 1980
gataggcagg gcatcttcgt gcagcctgct ctcttcgagg ctttcggcct caccatcctc 2040
gagtctatga tctctggcct ccctaccttc gctacccagt tcggcggccc tctcgagatc 2100
atccaggata agatcaacgg cttctacatc aaccctaccc acctcgagga gaccgctacc 2160
aagatcctcg atttcgtgac caagtgcgag cagaacccta actactggaa catcatctct 2220
gagaaggcta tcgatagggt gtactctacc tacacctgga agatccacac caccaagctc 2280
ctcaccctcg ctaggatcta cggcttctgg aacttcacct ctaaggagaa gagggaggat 2340
ctcctcaggt acctcgagtc tctcttctac ctcatctaca agcctagggc tcagcagctc 2400
ctcgagcagc acaagtacag gtgatctaga 2430
<210>3
<211>806
<212>PRT
<213>鱼腥蓝细菌PCC 7120
<400>3
Met Ser Glu Leu Met Gln Ala Ile Leu Asp Ser Glu Glu Lys His Asp
5 10 15
Leu Arg Gly Phe Ile Ser Glu Leu Arg Gln Gln Asp Lys Asn Tyr Leu
20 25 30
Leu Arg Asn Asp Ile Leu Asn Val Tyr Ala Glu Tyr Cys Ser Lys Cys
35 40 45
Gln Lys Pro Glu Thr Ser Tyr Lys Phe Ser Asn Leu Ser Lys Leu Ile
50 55 60
Tyr Tyr Thr Gln Glu Ile Ile Gln Glu Asp Ser Asn Phe Cys Phe Ile
65 70 75 80
Ile Arg Pro Lys Ile Ala Ala Gln Glu Val Tyr Arg Leu Thr Ala Asp
85 90 95
Leu Asp Val Glu Pro Met Thr Val Gln Glu Leu Leu Asp Leu Arg Asp
100 105 110
Arg Leu Val Asn Lys Phe His Pro Tyr Glu Gly Asp Ile Leu Glu Leu
115 120 125
Asp Phe Gly Pro Phe Tyr Asp Tyr Thr Pro Thr Ile Arg Asp Pro Lys
130 135 140
Asn Ile Gly Lys Gly Val Gln Tyr Leu Asn Arg Tyr Leu Ser Ser Lys
145 150 155 160
Leu Phe Gln Asp Ser Gln Gln Trp Leu Glu Ser Leu Phe Asn Phe Leu
165 170 175
Arg Leu His Asn Tyr Asn Gly Ile Gln Leu Leu Ile Asn His Gln Ile
180 185 190
Gln Ser Gln Gln Gln Leu Ser Gln Gln Val Lys Asn Ala Leu Asn Phe
195 200 205
Val Ser Asp Arg Pro Asn Asp Glu Pro Tyr Glu Gln Phe Arg Leu Gln
210 215 220
Leu Gln Thr Met Gly Phe Glu Pro Gly Trp Gly Asn Thr Ala Ser Arg
225 230 235 240
Val Arg Asp Thr Leu Asn Ile Leu Asp Glu Leu Ile Asp Ser Pro Asp
245 250 255
Pro Gln Thr Leu Glu Ala Phe Ile Ser Arg Ile Pro Met Ile Phe Arg
260 265 270
Ile Val Leu Val Ser Ala His Gly Trp Phe Gly Gln Glu Gly Val Leu
275 280 285
Gly Arg Pro Asp Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln Ala
290 295 300
Lys Asn Leu Glu Lys Gln Leu Gln Glu Asp Ala Ile Leu Ala Gly Leu
305 310 315 320
Glu Val Leu Asn Val Gln Pro Lys Val Ile Ile Leu Thr Arg Leu Ile
325 330 335
Pro Asn Ser Asp Gly Thr Leu Cys Asn Gln Arg Leu Glu Lys Val Tyr
340 345 350
Gly Thr Glu Asn Ala Trp Ile Leu Arg Val Pro Leu Arg Glu Phe Asn
355 360 365
Pro Lys Met Thr Gln Asn Trp Ile Ser Arg Phe Glu Phe Trp Pro Tyr
370 375 380
Leu Glu Thr Phe Ala Ile Asp Ser Glu Arg Glu Leu Leu Ala Glu Phe
385 390 395 400
Gln Gly Arg Pro Asp Leu Ile Val Gly Asn Tyr Thr Asp Gly Asn Leu
405 410 415
Val Ala Phe Leu Leu Thr Arg Arg Met Lys Val Thr Gln Cys Asn Ile
420 425 430
Ala His Ala Leu Glu Lys Ser Lys Tyr Leu Phe Ser Asn Leu Tyr Trp
435 440 445
Gln Asp Leu Glu Glu Lys Tyr His Phe Ser Leu Gln Phe Thr Ala Asp
450 455 460
Leu Ile Ala Met Asn Ala Ala Asn Phe Val Ile Ser Ser Thr Tyr Gln
465 470 475 480
Glu Ile Val Gly Thr Pro Asp Ser Ile Gly Gln Tyr Glu Ser Tyr Lys
485 490 495
Cys Phe Thr Met Pro Glu Leu Tyr His Val Val Asn Gly Ile Glu Leu
500 505 510
Phe Ser Pro Lys Phe Asn Val Val Pro Pro Gly Val Asn Glu Asn Ser
515 520 525
Tyr Phe Pro Tyr Thr Gln Thr Gln Asn Arg Ile Glu Ser Asp Arg Asp
530 535 540
Arg Leu Glu Glu Met Leu Phe Thr Leu Glu Asp Ser Ser Gln Ile Phe
545 550 555 560
Gly Lys Leu Asp Asp Pro Asn Lys Arg Pro Ile Phe Ser Met Ala Arg
565 570 575
Leu Asp Arg Ile Lys Asn Leu Thr Gly Leu Ala Glu Cys Phe Gly Gln
580 585 590
Ser Gln Glu Leu Gln Glu Arg Cys Asn Leu Ile Leu Val Ala Gly Lys
595 600 605
Leu Arg Ile Glu Glu Ser Glu Asp Asn Glu Glu Lys Asp Glu Ile Val
610 615 620
Lys Leu Tyr Arg Ile Ile Asp Glu Tyr Asn Leu His Gly Lys Ile Arg
625 630 635 640
Trp Leu Gly Val Arg Leu Ser Lys Asn Asp Ser Gly Glu Ile Tyr Arg
645 650 655
Val Ile Cys Asp Arg Gln Gly Ile Phe Val Gln Pro Ala Leu Phe Glu
660 665 670
Ala Phe Gly Leu Thr Ile Leu Glu Ser Met Ile Ser Gly Leu Pro Thr
675 680 685
Phe Ala Thr Gln Phe Gly Gly Pro Leu Glu Ile Ile Gln Asp Lys Ile
690 695 700
Asn Gly Phe Tyr Ile Asn Pro Thr His Leu Glu Glu Thr Ala Thr Lys
705 710 715 720
Ile Leu Asp Phe Val Thr Lys Cys Glu Gln Asn Pro Asn Tyr Trp Asn
725 730 735
Ile Ile Ser Glu Lys Ala Ile Asp Arg Val Tyr Ser Thr Tyr Thr Trp
740 745 750
Lys Ile His Thr Thr Lys Leu Leu Thr Leu Ala Arg Ile Tyr Gly Phe
755 760 765
Trp Asn Phe Thr Ser Lys Glu Lys Arg Glu Asp Leu Leu Arg Tyr Leu
770 775 780
Glu Ser Leu Phe Tyr Leu Ile Tyr Lys Pro Arg Ala Gln Gln Leu Leu
785 790 795 800
Glu Gln His Lys Tyr Arg
805
<210>4
<211>27
<212>DNA
<213>人工序列
<220>
<223>合成引物/寡核苷酸Susy_s3
<400>4
atccatatgt cagaattgat gcaagcg 27
<210>5
<211>33
<212>DNA
<213>人工序列
<220>
<223>合成引物/寡核苷酸Susy_as3
<400>5
tcagatctta ccgatattta tgctgttcta ata 33
<210>6
<211>20
<212>DNA
<213>人工序列
<220>
<223>Susy_seq3引物
<400>6
caagaattgc aagaacgttg 20
<210>7
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成引物/寡核苷酸SUSY_CU_RT1
<400>7
ctaggctcga taggatcaag aacctcac 28
<210>8
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成引物/寡核苷酸SUSY_CU_RT2
<400>8
gatagccttc tcagagatga tgttccag 28