CN112996916A - 避免藻类中的外源核酸的表观遗传沉默 - Google Patents

避免藻类中的外源核酸的表观遗传沉默 Download PDF

Info

Publication number
CN112996916A
CN112996916A CN201980073721.6A CN201980073721A CN112996916A CN 112996916 A CN112996916 A CN 112996916A CN 201980073721 A CN201980073721 A CN 201980073721A CN 112996916 A CN112996916 A CN 112996916A
Authority
CN
China
Prior art keywords
ala
gly
leu
glu
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980073721.6A
Other languages
English (en)
Inventor
J·E·佩斯
R·斯普雷菲科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viridos Inc
Original Assignee
Synthetic Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synthetic Genomics Inc filed Critical Synthetic Genomics Inc
Publication of CN112996916A publication Critical patent/CN112996916A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H13/00Algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • C12Y201/01037DNA (cytosine-5-)-methyltransferase (2.1.1.37)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请涉及识别包括藻类物种中的包括CHG甲基化的新颖DNA甲基转移酶。本申请涉及藻类突变体,其允许通过缓解外源DNA的CHG和CHH甲基化以及组蛋白3的赖氨酸9(H3K9)的单甲基化和三甲基化的表观遗传机制来表达外源基因。这通过使藻类中的甲基转移酶(MTase)基因突变或减弱来实现。本申请还涉及在藻类物种中有效地表达外源基因的方法。

Description

避免藻类中的外源核酸的表观遗传沉默
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求2018年12月13日提交的美国序列第62/779,364号的优先权,其全部内容通过引用的方式并入本文中。
序列表并入
所附序列表中的材料特此通过引用并入本申请。名称为SGI2210_lWO_Sequence_Listing.txt的所附序列表文本文件于2019年12月11日创建并且大小为79kb。此文件可以在使用Windows OS的计算机上使用Microsoft Word来访问。
技术领域
本申请涉及藻类突变体,其允许通过缓解外源DNA的甲基化的表观遗传机制来表达外源基因。这通过使藻类中的甲基转移酶(MTase)基因突变或减弱来实现。本申请还涉及在藻类物种中有效地表达外源基因的方法。
背景技术
DNA的甲基化是细胞用来将基因锁定在“关闭”位置中的常见的表观遗传信号传导工具。一般来说,DNA甲基化在真核DNA的胞嘧啶碱基处发生,通过DNA甲基转移酶(DNMT)酶将其转化为5-甲基胞嘧啶。DNA甲基化可以根据胞嘧啶的序列情境分类为三种类型,即CG、CHG和CHH(H=A、C或T)。通常,在真核生物中,发现甲基化稀疏地但全局地分布在整个基因组中的确定的CpG序列中,CpG岛除外。
在藻类物种莱茵衣藻(Chlamydomonas reinhardtii)中,胞嘧啶的甲基化在CpG序列中比在CHG或CHH序列中更普遍(Feng等人.,《美国科学院院报(Proc.Natl.Acad.Sci.U.S.A.)》,2010年5月11日;107(19):8689-94)。
除DNA甲基化以外,组蛋白甲基化还可以使基因沉默。例如,已发现组蛋白3中的赖氨酸(H3K9)的单甲基化可标记莱茵衣藻中的转基因串联重复序列。SET3,为H3K9单甲基转移酶,其被标识为于H3K9的甲基化有关。H3K9单甲基化、二甲基化和三甲基化的作用是物种特异性的并且发挥不同功能(Caras-Mollano等人,《核酸研究(Nucleic Acids Res.)》,2007;35(3):939-50)
发明内容
本文提供藻类突变体,其允许通过缓解甲基化外源或外来DNA的表观遗传机制来表达外源基因。在一些实施例中,甲基转移酶为CHG DNA甲基转移酶。在一些实施例中,甲基转移酶为CHH DNA甲基转移酶。还提供在藻类物种中有效表达外源DNA的方法。
当在生物中表达某些外源基因时,已观察到CHG甲基化(和沉默)。此外,靶向MTase基因提供的优势在于其为针对沉默机制的特异性靶向,而不必部署其它工具以用于基因重构。
在一个方面,提供突变体光合生物,其包含编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因。与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体光合微生物具有降低的CHG DNA甲基化。
在一个方面,提供增强光合生物中的外源DNA的表达的方法。所述方法包括a)将外源DNA引入到所述光合生物中;b)使编码具有CHG DNA甲基转移酶活性的多肽的基因突变或减弱,其中与包含所述外源DNA但不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体微生物具有降低的所述外源DNA的CHG DNA甲基化,从而与所述对照光合生物相比,所述外源DNA的表达在所述光合生物中增强。
在一个方面,提供降低光合生物中的组蛋白H3上的赖氨酸9(H3K9)的甲基化(例如单甲基化、三甲基化)的方法。所述方法包括使编码具有CHG DNA甲基转移酶活性的多肽的基因突变或减弱,其中与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体微生物具有降低的CHG DNA甲基化;其中所述光合生物体的组蛋白H3上的赖氨酸9的单甲基化(H3K9me1)或组蛋白H3上的赖氨酸9的三甲基化(H3K9me3)降低。
在一些实施例中,突变体光合生物是基因工程化突变体。在一些实施例中,突变体已通过插入诱变、基因置换、RNAi、反义RNA、大范围核酸酶基因组工程化、一种或多种核酶和/或CRISPR/Cas系统进行基因工程化。在一些实施例中,突变体已通过CRISPR/Cas系统进行基因工程化。在一些实施例中,突变体光合生物已通过UV辐照、γ辐照或化学诱变生成。
在一些实施例中,突变体光合生物包含在编码具有CHG DNA甲基转移酶活性的多肽的基因中的突变或减弱,所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少65%一致性的氨基酸序列。在一些实施例中,具有CHG DNA甲基转移酶活性的多肽包含在基因的突变或减弱之前与SEQ ID NO:1或SEQ IDNO:28的氨基酸序列具有至少80%一致性的氨基酸序列。
在一些实施例中,突变体光合生物包含外源DNA,并且其中降低的CHG DNA甲基化是在外源DNA中。在一些实施例中,外源DNA整合到光合生物的基因组中。
在一些实施例中,降低的CHG DNA甲基化可在光合生物的天然DNA序列中。降低的CHG DNA甲基化可在突变体光合生物的着丝粒或高度重复DNA区中。
在一些实施例中,与对照光合生物相比,外源核酸的表达得到改进(例如提高),其中所述对照组生物包含所述外源核酸但不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因。
在一些实施例中,突变体光合生物具有降低的组蛋白H3的赖氨酸9(H3K9)的甲基化(例如单甲基化、三甲基化)。在一些实施例中,与对照光合生物相比,突变体光合生物具有降低的CHH DNA甲基化,其中所述对照组生物不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因。
在一些实施例中,光合生物是藻类。在一些实施例中,所述藻类属于属:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、波利氏藻属(Bolidomonas)、包特氏菌属(Borodinella)、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、片球藻属(Bracteococcus)、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、球钙板藻属(Cricosphaera)、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、杜氏藻属(Dunaliella)、后棘藻属(Ellipsoidon)、圆石藻属(Emiliania)、独球藻属(Eremosphaera)、衣迪斯藻属(Ernodesmius)、裸虫藻属(Euglena)、真眼点藻属(Eustigmatos)、被刺藻属(Franceia)、脆杆藻属(Fragilaria)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、嗜盐古菌(Halocafeteria)、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微芒藻属(Micractinium)、蒜头藻属(Monodus)、单针藻属(Monoraphidium)、微球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、蚝球藻属(Ostreococcus)、巴夫藻属(Pavlova)、拟小球藻属(Parachlorella)、帕氏藻属(Pascheria)、普莱格门(Pelagomonas)、褐指藻属(Phaeodactylum)、噬菌体属(Phagus)、微绿藻属(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、肋球藻属(Pleurococcus)、原壁菌属(Prototheca)、假小球藻属(Pseudochlorella)、拟新绿藻属(Pseudoneochloris)、假十字趾藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、桑葚藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、骨条藻属(Skeletonema)、螺旋藻属(Spyrogyra)、裂丝藻属(Stichococcus)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、鲜绿球藻属(Viridiella)、魏氏藻属(Vischeria)和团藻属(Volvox)。在一些实施例中,突变体光合生物是绿藻门(Chlorophyte)或轮藻门(Charophyte)藻类。在一些实施例中,生物可以是例如绿藻纲(Chlorophyceae)、共球藻纲(Trebouxiophyceae)、四爿藻纲(Chlorodendrophyceae)、石莼纲(Ulvophyceae)、平藻纲(Pedinophyceae)或青绿藻纲(Prasinophyceae)中的任一种纲类的藻类。生物可以是小球藻科(Chlorellales),或卵胞藻科(Oocystaceae),或绿藻科(Chlorodendraceae)的成员。在一些实施例中,突变体藻类细胞是共球藻纲类的绿藻门藻类细胞,例如,以下的属的物种的藻类细胞,如葡萄藻属、小球藻属、原壳藻属(Auxenochlorella)、胶树小球藻属(Heveochlorella)、海球藻属(Marinichlorella)、拟小球藻属、假小球藻属、四球藻属(Tetrachlorella)、独球藻属、被刺藻属、微芒藻属、微球藻属、卵囊藻属、微绿藻属、或原壁菌属。在一些实施例中,突变体藻类可以是以下的物种的突变体藻类:原壳藻属、小球藻属、胶树小球藻属、海球藻属、拟小球藻属、假小球藻属或四球藻属。在其它实施例中,突变体藻类可以是四爿藻纲的藻类(例如,四爿藻属的藻类)。
在一些实施例中,突变体光合微生物是蓝藻菌(cyanobacterium)。在一些实施例中,所述蓝藻菌是蓝细菌(Acaryochloris)、阿格门氏藻(Agmenellum)、鱼腥藻属(Anabaena)、项圈藻属(Anabaenopsis)、组囊藻属(Anacystis)、束丝藻属(Aphanizomenon)、节旋藻(Arthrospira)、星球藻属(Asterocapsa)、博氏藻属(Borzia)、眉藻属(Calothrix)、管孢藻属(Chamaesiphon)、拟绿胶蓝细菌属(Chlorogloeopsis)、拟甲色球藻属(Chroococcidiopsis)、色球藻属(Chroococcus)、发毛针藻属(Crinalium)、蓝藻菌、蓝菌属(Cyanobium)、蓝囊胞菌属(Cyanocystis)、蓝螺菌属(Cyanospira)、蓝丝菌属(Cyanothece)、拟柱胞藻属(Cylindrospermopsis)、筒孢藻属(Cylindrospermum)、蓝纤维藻属(Dactylococcopsis)、包皮藻属(Dermocarpella)、侧生藻属(Fischerella)、夫列藻属(Fremyella)、盖特勒氏菌属(Geitleria)、盖丝藻属(Geitlerinema)、胶菌藻属(Gloeobacter)、粘球藻属(Gloeocapsa)、粘杆藻属(Gloeothece)、盐螺旋藻属(Halospirulina)、英加藻属(Iyengariella)、细鞘丝藻属(Leptolyngbya)、湖生蓝丝藻属(Limnothrix)、鞘丝藻属(Lyngbya)、微鞘藻属(Microcoleus)、微胞藻属(Microcystis)、粘囊藻属(Myxosarcina)、节球藻属(Nodularia)、念珠藻属(Nostoc)、拟珠藻属(Nostochopsis)、颤藻属(Oscillatoria)、席藻属(Phormidium)、浮丝藻属(Planktothrix)、厚皮藻属(Pleurocapsa)、原绿球藻(Prochlorococcus)、原绿藻属(Prochloron)、原绿发藻属(Prochlorothrix)、伪鱼腥藻属(Pseudanabaena)、胶须藻属(Rivularia)、裂须藻属(Schizothrix)、伪枝藻属(Scytonema)、螺旋藻属(Spirulina)、斯塔尼尔氏菌属(Stanieria)、斯塔尔氏蓝细菌属(Starria)、真枝藻属(Stigonema)、束藻属(Symploca)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、热集胞藻属(thermosynechocystis)、单歧藻属(Tolypothrix)、束毛藻属(Trichodesmium)、常丝藻属(Tychonema)或异球藻属(Xenococcus)物种。
附图说明
图1为展示整合到拟小球藻属基因组中的外源DNA的CpG、CHG和CHH DNA甲基化和H3K9单甲基化和三甲基化以及通过基因敲除CHG甲基转移酶来降低这些甲基化的基因组轨迹。将拟小球藻属基因敲除菌株STR03778和STR03749的外源DNA甲基化和H3K9单甲基化和三甲基化状态与拟小球藻属对照菌株STR00014进行比较。表1进一步识别这些菌株。所有三种菌株包含经整合的杀稻瘟菌素、Cas-9和GFP基因。展示包含描绘DNA甲基化百分比(第一组行)和基因组覆盖度(第二组行)的杀稻瘟菌素、Cas-9和GFP基因的代表性外源DNA基因组轨迹,以及用对H3K9me1和H3K9me3具有特异性的抗体分离的三种拟小球藻属菌株的染色质免疫沉淀(ChIP)的序列信息。缩放轨迹以允许跨越不同样品进行比较。还展示组蛋白3(H3)的覆盖度轨迹。染色体位置展示于顶部,且基因模型提供于底部。
图2展示除天然拟小球藻属DNA的重复和着丝粒区域以外,CHG和CHH DNA甲基化以及H3K9的单甲基化和三甲基化的总体缺失。将拟小球藻属基因敲除菌株STR03778和STR03749的天然DNA甲基化和H3K9单甲基化和三甲基化状态与拟小球藻属对照菌株STR00014进行比较(额外信息参见表1)。展示描绘DNA甲基化百分比(第一组行)和基因组覆盖度(第二组行)的代表性天然DNA基因组轨迹,以及用对H3K9me1和H3K9me3具有特异性的抗体分离的3种拟小球藻属菌株的ChIP的序列信息。缩放轨迹以允许跨越不同样品进行比较。还展示组蛋白3(H3)的覆盖度轨迹。染色体位置展示于顶部,且基因模型提供于底部。
图3展示除在天然拟小球藻属DNA的染色体2的重复区域、转座元件和着丝粒区域以外,CHG和CHH DNA甲基化以及H3K9的单甲基化和三甲基化的总体缺失。将拟小球藻属基因敲除菌株STR03778和STR03749的DNA甲基化和H3K9单甲基化和三甲基化状态与拟小球藻属对照菌株STR00014进行比较。展示描绘DNA甲基化百分比(第一组行)和基因组覆盖度(第二组行)的代表性天然DNA基因组轨迹,以及用对H3K9me1和H3K9me3具有特异性的抗体下拉的3种拟小球藻属菌株的ChIP的测序读数。缩放轨迹以允许跨越不同样品进行比较。还展示组蛋白3(H3)的覆盖度轨迹。染色体位置展示于顶部,且基因模型提供于底部。
图4展示如通过蛋白质印迹法所测量,所选择的拟小球藻属基因敲除菌株STR03749、STR03778、STR03779中的外源基因表达相比于拟小球藻属对照菌株STR00014的比较。
图5展示基因组轨迹,其说明整合到所指示的菌株的卵囊藻属基因组中的外源DNA(杀稻瘟菌素基因)的DNA甲基化(CpG、CHG和CHH)的存在。第一组行展示DNA甲基化的百分比,且第二组行展示基因组覆盖度。STR24194为背景菌株且STR28031为SEQ ID NO:29(编码SEQ ID NO:28)的基因敲除菌株且具有作为选择性标记的杀稻瘟菌素。
图6展示在卵囊藻属基因组的背景菌株(STR24194)中DNA的DNA甲基化(CpG、CHG和CHH)的放大的基因组轨迹分布。展示描绘DNA甲基化百分比(第一组行)和基因组覆盖度(第二组行)的DNA。
图7展示卵囊藻属基因组的天然DNA的DNA甲基化(CpG、CHG、CHH)的放大的基因组轨迹分布。展示描绘DNA甲基化百分比(第一组行)和基因组覆盖度(第二组行)的DNA。STR28031为SEQ ID NO:29(编码SEQ ID NO:28)的基因敲除菌株且具有作为选择性标记的杀稻瘟菌素;STR24194为背景菌株。
图8A和8B展示琼脂糖凝胶,其说明在卵囊藻属中转基因(Cre重组酶和Ble)的表达。图8A展示五个Cre构建体的菌株STR24194(背景菌株)。图8B展示具有编码SEQ ID NO:28(STR29997)的甲基转移酶的序列缺失的卵囊藻属的相同数据。数据展示cre重组酶转基因表达于卵囊藻属背景菌株(STR24194)中。
图9展示在半连续面积培养下,以总有机碳(TOC)作为生产力的指标测量的拟小球藻属(具有SEQ ID NO:2的甲基转移酶的缺失的STR03778)的生产力分析的结果。相比于野生型拟小球藻属菌株(STR0010),数据在细胞的生产力方面未展示缺陷。
图10展示在半连续面积培养下,以总有机碳(TOC)作为生产力的指标测量的卵囊藻属(具有SEQ ID NO:29的甲基转移酶的缺失的STR29997)的生产力分析的结果。相比于改良的且针对生长特征选自野生型的背景菌株(STR24194),数据在细胞的生产力中未展示缺陷。
具体实施方式
本申请公开使外源基因在藻类中的表达沉默的表观遗传机制。本申请识别外源DNA在藻类中的表观遗传沉默中的CHG甲基化的作用。因此,CHG甲基化在外源基因沉默中的作用在藻类中通常是未知的,这是因为CHG甲基化甚至完全不存在于内源元件(衣藻属,团藻属)中,或因为仅检测天然但非外源DNA元件(小球藻属)。另外,本申请还识别组蛋白3赖氨酸9(H3K9)甲基化(例如单甲基化或三甲基化)在藻类物种中外源基因的表观遗传沉默中的作用。
本申请识别共球藻纲藻类中的新颖假定甲基转移酶基因(Pfam PF00145,C-5胞嘧啶特异性DNA甲基转移酶)。通过个别地基因敲除基因分析新识别的基因的活性并且评估基因敲除对天然和外源DNA序列中DNA的甲基化的影响以及外源基因的蛋白表达水平。公开了这些基因敲除对CpG、CHG和CHH DNA序列中胞嘧啶的甲基化的影响,其中H=A、T或C。还公开了天然DNA的染色质区域以及包含外源DNA的染色质区域中的组蛋白3赖氨酸9(H3K9)的甲基化(例如单甲基化、三甲基化)水平。还公开了卵囊藻属中的直系同源CHG DNA甲基转移酶。
本发明人出乎意料地发现突变或减弱DNA甲基转移酶可以降低可通过表观遗传机制发生的外源DNA的CHG和/或CHH甲基化。本发明人还发现,突变或减弱DNA甲基转移酶可增强外源基因的蛋白表达水平。另外,包含外源DNA的染色质区域中的组蛋白3赖氨酸9(H3K9)的单甲基化和三甲基化水平也降低。进一步发现,突变或减弱DNA甲基转移酶可降低外源DNA的CHH甲基化。因此,本发明提供具有至少一种如本文所公开的CHG和/或CHH甲基转移酶减弱的突变体绿藻门藻类。
绿藻门藻类中的外源DNA的DNA甲基化可涉及CHG序列中的DNA甲基化,其中“C”为甲基化胞嘧啶,且“H”为A、T或C。在各种实施例中,本发明的突变体光合生物可具有至少一个编码甲基转移酶的基因的减弱或缺失。在一些实施例中,编码的甲基转移酶是SEQ IDNO:1、3、5、7、28中的任一者,或它们的任何组合或子组合,或编码它们的变体并且与它们中的任一者具有至少80%或至少90%或至少95%或至少97%或至少98%或100%氨基酸序列一致性的序列,或包含整个蛋白的至少50或至少100、至少125、至少150或以上氨基酸残基的连续序列的其片段,或其任何组合或子组合。在其它实施例中,甲基转移酶由本文所公开的任何序列或其变体编码。
本发明还涉及增强本发明的突变体光合生物中的外源DNA的表达的方法。所述方法涉及a)将外源DNA引入到光合生物中;和b)使编码具有CHG和/或CHH DNA甲基转移酶活性的多肽的基因突变、减弱或缺失。引入到生物中的外源DNA可以是含有用于编辑、减弱或缺失编码甲基转移酶活性的基因的序列的DNA构建体。可以通过所属领域的一般技术人员已知的任何适合的方法实现序列的突变、减弱或缺失。例如,可使用CRISPR Cas9基因编辑、Cre-Lox重组或其它基因编辑技术。与具有外源DNA但不具有编码具有CHG和/或CHH DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,通过所述方法产生的突变体光合生物可具有外源DNA的降低的CHG和/或CHH DNA甲基化。因此,与对照生物相比,突变体生物中外源DNA的表达增强。在生物中突变、减弱或缺失的编码甲基转移酶是SEQ ID NO:1、3、5、7、28中的任一者或它们的任何组合或子组合,或它们的(变体)序列并且与它们中的任一者具有至少80%或至少90%或至少95%或至少97%或至少98%或100%序列一致性,或包含整个蛋白或核酸序列的核苷酸的至少50或至少100、至少125、至少150或以上氨基酸残基的连续序列的其片段,或其任何组合或子组合。在其它实施例中,甲基转移酶由本文所公开的任何序列或其变体编码。例如,甲基转移酶可以由SEQ ID NO:2、4、6、8或29中的任一者,或其(变体)序列并且与其中的任一者具有至少80%或至少90%或至少95%或至少97%或至少98%或100%序列一致性,或包含整个核酸序列的至少200、至少300、至少500或以上核苷酸残基的连续序列的其片段,或其任何组合或子组合编码。在一些实施例中,CHG和/或CHH甲基化的降低发生于外源DNA的高度重复区域和/或外源DNA的着丝粒区域处。DNA的高度重复区域或序列通常不编码多肽。在一些实施例中,高度重复区域或序列为5-100或150-300个核苷酸的短序列。在一些实施例中,序列在DNA区域中重复至少10,000次、或至少50,000次、或至少100,000次、或至少500,000次或至少1百万次。所述区域可以是染色体或可以是小于1Mb或小于25Mb或小于50Mb或小于100Mb或小于250Mb的DNA的区段。
定义
除非另外定义,否则本文所使用的所有技术和科学术语均具有与本发明所属领域的一般技术人员通常所理解相同的含义。在冲突的情况下,以本申请(包含定义)为准。除非上下文另有要求,否则单数术语应包括复数,并且复数术语应包括单数。除非另外特别指出,否则本申请内提供的所有范围均包括该范围的上端和下端的值。
本文中所引用的所有公开案、专利和其它参考文献均出于所有目的以全文引用的方式并入,如同每一个别公开案或专利申请特定地且个别地指示以引用的方式并入一般。
在本文中,在短语如“A和/或B”中所使用的术语“和/或”旨在包含“A和B”、“A或B”、“A”和“B”。
“约”意指在所陈述的值的10%内,或在所陈述的值的5%内,或在一些情况下,在所陈述的值的2.5%内,或“约”可意指被舍入至最接近的有效数字。
术语“基因”被广泛地用来指编码多肽或表达的RNA的核酸分子(通常为DNA,但任选为RNA)的任何片段。因此,基因包括编码表达的RNA的序列(其可以包括多肽编码序列或例如功能性RNA,如核糖体RNA、tRNA、反义RNA、微小RNA、短发夹RNA、核酶等)。基因可进一步包含其表达需要或影响其表达的调节序列,以及与处于其天然状态的蛋白或RNA编码序列相关的序列,例如内含子序列、5'或3'非翻译序列等。在一些实例中,“基因”可以仅指DNA或RNA分子的蛋白编码部分,其可以包括或可以不包括内含子。基因的长度优选地大于50个核苷酸,更优选地长度大于100个核苷酸,并且长度可以例如介于50个核苷酸与500,000个核苷酸之间,如长度介于100个核苷酸与100,000个核苷酸之间或长度介于约200个核苷酸与约50,000个核苷酸之间或长度介于约200个核苷酸与约20,000个核苷酸之间。基因可以从多种来源获得,包含从所关注来源克隆或从已知或预测的序列信息合成。
术语“核酸”或“核酸分子”是指DNA或RNA(例如,mRNA)的片段,并且还包含具有经过修饰的主链(例如,肽核酸、锁核酸)或经过修饰的或非天然存在的核碱基的核酸。核酸分子可以是双链的或单链的;包括基因或其部分的单链核酸分子可以是编码(有义)链或非编码(反义)链。
核酸分子或多肽可以“衍生自”所指示的来源的,其包括从所指示的来源分离(完全或部分)核酸片段或多肽。核酸分子也可通过例如直接克隆、PCR扩增或人工合成从所指示的多核苷酸来源或基于与所指示的多核苷酸来源相关联的序列衍生自所指示的来源,所述多核苷酸来源可以是例如生物物种。
衍生自特定来源或物种的基因或核酸分子还包括具有相对于来源核酸分子的序列修饰的基因或核酸分子,即,基因或核酸分子的序列衍生自来自所参考来源或物种的基因或核酸分子的序列但可具有修饰。例如,衍生自来源(例如特定参考基因)的基因或核酸分子可以包括相对于来源基因或核酸分子的一种或多种突变,这些突变是非预期的或有意引入的,并且如果一种或多种突变(包括取代、缺失或插入)是有意引入的,则这些序列改变可以通过细胞或核酸的随机或靶向突变、通过扩增或其它基因合成或分子生物学技术或通过化学合成或其任何组合来引入。衍生自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可以编码功能性RNA或多肽,所述功能性RNA或多肽与参考或来源功能性RNA或多肽或与其功能性片段具有至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列一致性。例如,衍生自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可以编码功能性RNA或多肽,所述功能性RNA或多肽与参考或来源功能性RNA或多肽或与其功能性片段具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列一致性。
类似地,衍生自特定来源或物种的多肽或蛋白包括具有相对于来源多肽的序列修饰的多肽或蛋白,即,多肽衍生自来自参考来源或物种的多肽的序列但可具有修饰。例如,衍生自来源(例如特定参考蛋白)的多肽或蛋白可以包括相对于非故意引入或有意引入(例如通过编码核酸分子的突变)的来源多肽的一种或多种突变(氨基酸差异)。衍生自参考多肽的多肽可以与参考或来源多肽或其功能性片段具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列一致性。例如,衍生自参考多肽的多肽可以具有与参考或来源多肽或其功能性片段至少80%、或至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列一致性。
术语“天然存在的”、“天然”和“野生型”是指在自然界中发现的形式。例如,天然存在的或野生型核酸分子、核苷酸序列或蛋白可以存在于从天然来源中,且从天然来源中分离并且未通过人为操纵有意地修饰。
如本文所用,“减弱”是指数量、程度、强度或浓度降低。减弱的基因表达可以指所讨论的基因的转录显著降低的量和/或速率,或经过编码的蛋白的翻译、折叠或组装的显著降低的量和/或速率。作为非限制性实例,减弱的基因可以是突变或破坏的基因(例如,通过部分或全部缺失、截短、移码或插入突变破坏的基因),其不编码完整的功能性开放阅读框或由于基因调节序列的改变或破坏而具有降低的表达。减弱的基因也可以是由构建体靶向的基因,所述构建体降低基因的表达,例如反义RNA、微小RNA、RNAi分子或核酶。减弱的基因表达可以是被消除(例如到不显著或不可检测的量)的基因表达。减弱的基因表达也可以是引起RNA或蛋白不完全功能性或非功能性的基因表达,例如,减弱的基因表达可以是引起截短的RNA和/或多肽的基因表达。
“外源核酸分子”、“转基因”或“外源基因”是指已被引入(例如转化)到细胞中的核酸分子或基因。转化细胞可以称为重组细胞,其中可以引入另外的外源基因。如果用核酸分子转化的细胞的后代继承了外源核酸分子,则也称为“转化”。“内源”核酸分子、基因或蛋白是当其存在于宿主中或由宿主天然产生时的天然核酸分子、基因或蛋白。
“重组”或“工程化”核酸分子是已经通过人为操纵而改变的核酸分子。作为非限制性实例,重组核酸分子包括以下任何核酸分子:1)已在体外部分或完全合成或修饰,例如,使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子复制、聚合、消化(核酸外切或核酸内切)、连接、逆转录、转录、碱基修饰(包括例如甲基化)、整合或重组(包括同源和位点特异性重组)的酶);2)包括本质上不相连的相连核苷酸序列;3)已使用分子克隆技术进行工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸;和/或4)已使用分子克隆技术进行操作,使得其相对于天然存在的核酸序列具有一个或多个序列改变或重排。作为非限制性实例,cDNA是重组DNA分子,如同通过体外聚合酶反应产生,或已连接接头或已整合到载体如克隆载体或表达载体中的任何核酸分子。
如本文所用,术语“重组蛋白”是指通过基因工程化产生的蛋白,而不管氨基酸是否不同于野生型蛋白的氨基酸。
当应用于生物体时,术语重组、工程化或基因工程化是指已通过将异源或外源重组核酸序列引入生物体而操作的生物体(例如非天然核酸序列),并且包括基因敲除、靶向突变、基因置换和启动子置换、缺失、破坏或插入,以及将转基因或合成基因或核酸序列引入生物体中。即,重组、工程化或基因工程化是指已经被人为干预改变的生物体。重组或基因工程化生物体也可以是已引入基因表达或“基因敲除”构建体的生物体。此类构建体包括但不限于RNAi、微小RNA、shRNA、siRNA、反义和核酶构建体。还包括其基因组已被大范围核酸酶、锌指核酸酶、TALEN或Cas/CRISPR系统的活性改变的生物体。可以将外源或重组核酸分子整合到重组/基因工程化生物体的基因组中,或者在其它情况下,可以不整合到宿主基因组中。如本文所用,“重组微生物”或“重组宿主细胞”包括本发明的重组微生物的后代或衍生物。因为由于突变或环境影响而在后代中可能发生某些修饰,所以后代或衍生物实际上可能与亲本细胞不同,但仍包括在本文所用术语的范围内。
术语“启动子”是指能够结合细胞中的RNA聚合酶并启动下游(3'方向)编码序列的转录的核酸序列。启动子包含以高于背景的可检测水平启动转录所必需的最小数量的碱基或元件。启动子可以包含转录起始位点以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。真核启动子通常但不总是含有“TATA”框和“CAT”框。原核启动子可能含有10和35个原核启动子共有序列。来自多种不同来源的大量启动子(包含组成型、诱导型和阻抑型启动子)是本领域所众所周知的。代表性来源包含例如藻类、病毒、哺乳动物、昆虫、植物、酵母和细菌细胞类型,并且来自这些来源的合适的启动子是容易获得的,或可以基于公开在线获得的序列或例如,从保藏机构(如ATCC)以及其它商业或个体来源合成地制备。启动子可以是单向的(启动一个方向的转录)或双向的(启动任一方向的转录)。启动子可以是组成型启动子、阻抑型启动子或诱导型启动子。除了RNA聚合酶结合以启动转录的基因近端启动子之外,启动子区还可以包括基因上游的额外序列,所述额外序列可以处于基因的转录起始位点的1kb、2kb、3kb、4kb、5kb或更多内,其中所述额外序列可以影响下游基因的转录速率并且任选地影响启动子对发育、环境或生物化学(例如,代谢)条件的反应性。
当关于多核苷酸、基因、核酸、多肽或酶使用时,术语“异源的”是指来自来源或衍生自除宿主生物物种之外的来源的多核苷酸、基因、核酸、多肽或酶。相比而言,“同源的”多核苷酸、基因、核酸、多肽或酶在本文中用于表示衍生自宿主生物物种的多核苷酸、基因、核酸、多肽或酶。当提及基因调控序列或提及用于保持或操纵基因序列的辅助核酸序列时(例如启动子、5'非翻译区、3'非翻译区、poly A添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等),“异源的”意指调控序列或辅助序列不与调控序列或辅助核酸序列与之并置在构建体、基因组、染色体或附加体中的基因天然地缔合。因此,可操作地连接到其在其天然状态下(即,在非基因工程化生物的基因组中)不可操作地连接的基因的启动子在本文中被称为“异源启动子”,即使所述启动子可以源自与其连接的基因相同的物种(或在一些情况下,同一生物)。
如本文所用,术语“蛋白”或“多肽”旨在涵盖单数“多肽”以及多个“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或更多个氨基酸中的任何链或多条链,并且不是指产物的特定长度。因此,肽、二肽、三肽、寡肽、“蛋白”、“氨基酸链”或用于指代两个或更多个氨基酸的一条链或多条链的任何其它术语被包含在“多肽”的定义内,并且术语“多肽”可以代替或与这些术语中的任何一个可互换地使用。
通常在基因或物种名称后的括号中提供的基因和蛋白质登录号是序列记录的唯一标识符,该序列记录可在由美国国立卫生研究院维护的美国国家生物技术信息中心(NCBI)网站(ncbi.nlm.nih.gov)上公开获得。“GenInfo标识符”(GI)序列标识号是特定于核苷酸或氨基酸序列的。如果序列以任何方式改变,则分配新的GI号。序列修订历史记录工具可用于跟踪出现在特定基因库(GenBank)记录中的序列的各种GI号、版本号和更新日期。基于登录号和GI号来检索和获得核酸或基因序列或蛋白序列是在例如细胞生物学、生物化学、分子生物学和分子遗传学领域中众所周知的。
如本文所使用的,相对于核酸或多肽序列的术语“一致性百分比”或“同源性”被定义为在比对序列达到最大一致性百分比并且在必要时引入空位以实现最大同源性百分比之后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N末端或C末端插入或缺失不应被解释为影响同源性,并且多肽序列中少于约30个、少于约20个或少于约10个氨基酸残基的内部缺失和/或插入不应被解释为影响同源性。核苷酸或氨基酸序列水平的同源性或一致性可以使用程序blastp、blastn、blastx、tblastn和tblastx(Altschul(1997),《核酸研究(Nucleic Acids Res.)》25,3389-3402,和Karlin(1990),《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》87,2264-2268)所采用的算法,通过BLAST(基本局部比对搜索工具)分析来确定,其被定制用于序列相似性搜索。BLAST程序所使用的方法是首先考虑查询序列与数据库序列之间具有和不具有缺口的相似片段,然后评估所识别的所有匹配的统计显著性,并且最后仅概括满足预先选择的显著性阈值的那些匹配。有关序列数据库相似性检索中基本问题的讨论,请参见Altschul(1994),《自然遗传学(Nature Genetics)》6,119-129。直方图、描述、对准、期望(即,用于报告与数据库序列匹配的统计显著性阈值)、截止值、矩阵和过滤器(低复杂度)的检索参数可以处于默认设置。blastp、blastx、tblastn和tblastx所使用的默认评分矩阵是BLOSUM62矩阵(Henikoff(1992),《美国国家科学院院刊》89,10915-10919),推荐长度超过85的查询序列(核苷酸碱基或氨基酸)。
对于设计用于比较核苷酸序列的blastn,评分矩阵通过M(即,一对匹配残基的奖励评分)与N(即,错配残基的罚分)的比率来设定,其中M和N的默认值可以分别为+5和-4。四个blastn参数可如以下调整:Q=10(空位产生罚分);R=10(空位延伸罚分);wink=1(在沿着查询的每个winkth位置处生成字命中);和gapw=16(设置其中生成空位对准的窗口宽度)。用于氨基酸序列比较的等效Blastp参数设置可以为:Q=9;R=2;wink=1;以及gapw=32。在GCG软件包10.0版中可用的序列之间的Bestfit比较可以使用DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分),并且蛋白比较中的等效设置可以是GAP=8和LEN=2。
还公开本发明的多肽或核酸序列,所述多肽或核酸序列为本文所公开的任何序列(例如SEQ ID NO:1-29中的任一者)的变体,具有与全长多肽或核酸序列至少约40%、至少约45%、至少约50%、至少约55%、至少70%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%的序列一致性,例如至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列一致性,或包含核酸序列的整个蛋白或核苷酸的至少50或至少100、至少125、至少150或以上氨基酸残基的连续序列的其片段。所公开的序列的变体可以具有至少一个氨基酸残基或核苷酸已经N端和/或C端插入到所公开的含有插入和取代的序列和/或在所公开的含有所述插入和取代的序列内。变体还包括具有氨基酸或核苷酸的至少一个取代的序列,例如在SEQ ID NO:1-29中的任一者中,其可为保守氨基酸取代。变体还可以是编码本文所公开的任何氨基酸序列或其变体的核苷酸序列。所考虑的变体可以另外或替代地包括含有通过例如同源重组或定点或PCR诱变导致的预定突变的那些,和其它物种的相应多肽或核酸,包括但不限于本文所述的那些,含有插入和取代的多肽或核酸家族的等位基因或其它天然存在的变体;和/或衍生物,其中多肽已经通过取代、化学、酶或其它合适的方法用除含有插入和取代的天然存在的氨基酸之外的部分(例如,可检测部分如酶)共价修饰。在任何实施例中,所公开的多肽序列中的任一种可以是本发明的突变体生物中编码的甲基转移酶,或可以是在生物中编码此类甲基转移酶的核酸序列。
如本文所用,短语“保守氨基酸取代”或“保守突变”是指一个氨基酸被具有共有特性的另一氨基酸替代。用于定义单独的氨基酸之间的共同性质的功能性方法是分析同源生物的对应蛋白之间氨基酸变化的归一化频率(Schulz(1979),《蛋白质结构原理(Principles of Protein Structure)》,施普林格出版社(Springer-Verlag))。根据此类分析,可以定义氨基酸基团,其中一个基团内的氨基酸优先地彼此交换,并且因此在其对整体蛋白结构的影响方面彼此最相似(Schulz(1979),《蛋白质结构原理》,施普林格出版社)。以这种方式定义的氨基酸基团的实例可以包括:“带电/极性基团”,包括Glu、Asp、Asn、Gln、Lys、Arg和His;“芳族或环状基团”,包括Pro、Phe、Tyr和Trp;以及“脂族基团”,包括Gly、Ala、Val、Leu、Ile、Met、Ser、Thr和Cys。在每个基团内,也可以识别亚基。例如,带电/极性氨基酸的基团可以细分为亚基,包括:包含Lys、Arg和His的“带正电的亚基”;包含Glu和Asp的“带负电的亚基”;以及包含Asn和Gln的“极性亚基”。在另一个实例中,芳族或环状基团可以细分为亚基,包括:包含Pro、His和Trp的“氮环亚基”;以及包含Phe和Tyr的“苯基亚基”。在另一个进一步的实例中,脂肪族或环状基团可以被细分为亚基,包含:“大脂肪族非极性亚基”,其包括Val、Leu和Ile;“脂肪族微极性亚基”,其包括Met、Ser、Thr和Cys;以及“小残基亚基”,其包括Gly和Ala。保守突变的实例包括上述亚基内的氨基酸的氨基酸取代,例如但不限于:用Arg代替Lys,或反之亦然,使得可以保持正电荷;用Asp代替Glu,或反之亦然,使得可以保持负电荷;用Thr代替Ser,或反之亦然,使得可以保持游离的-OH;和用Asn代替Gln,或反之亦然,使得可以保持游离的-NH2。“保守变体”是包括一个或多个氨基酸的多肽,所述一个或多个氨基酸已被取代以用具有共同特性(例如,属于与上文所描绘的氨基酸基团或亚基相同的氨基酸基团或亚基)的氨基酸置换参考多肽的一个或多个氨基酸(例如,其序列已经在出版物或序列数据库中公开或其序列已经通过核酸测序确定的多肽)。
如本文所使用的,“表达”包含至少在RNA生产水平上的基因表达,并且“表达产物”包括所表达基因的所得产物,例如多肽或功能性RNA(例如,核糖体RNA、tRNA、反义RNA、微RNA、shRNA、核酶等)。术语“增加的表达”包括基因表达的改变以促进mRNA产生的增加和/或多肽表达的增加。“增加的产生”包含与多肽的天然产生或酶活性相比,多肽表达的量、多肽的酶活性水平或两者的组合的增加。
本发明的一些方面包括特定多核苷酸序列的表达的部分、实质或完全减弱、缺失、沉默、失活或下调。可以使基因部分、基本上或完全缺失、沉默、失活,或者它们的表达可以被下调,以影响由它们编码的多肽执行的活性,如酶的活性。通过插入破坏基因的功能和/或表达的核酸序列(例如,病毒插入、转座子诱变、大范围核酸酶工程化、同源重组或本领域已知的其它方法),基因可以部分地、基本上或完全地缺失、沉默、失活或下调。术语“消除(eliminate/elimination)”和“基因敲除”可以与术语“缺失”、“部分缺失”、“实质缺失”或“完全缺失”互换使用。在某些实施例中,所关注的微生物可以使用Cas/CRISPR系统通过严格同源重组或靶向整合或突变工程改造化以基因敲除所关注的特定基因。在仍其它实施例中,可以使用利用cas/CRISPR系统、RNAi或反义DNA(asDNA)构建体的基因调节区域的靶向插入或突变来部分、基本上或完全沉默、失活或下调目标特定基因。
某些核酸分子或特定多核苷酸序列的这些插入、缺失或其它修饰可以被理解为涵盖“一种或多种基因修饰”或“一种或多种转化”,使得这些微生物或宿主细胞的所得菌株可以被理解为“经过基因修饰的”、“基因工程化的”或“转化的”。
如本文所用,“增强表达”包括与未经该等遗传修饰的对照光合生物体中的表达或活性相比,在包含一个或多个遗传修饰的光合生物体中增加所关注的基因或核酸分子的表达或酶的活性。
如本文所用,“突变体”是指在基因中具有突变的生物体,所述突变是传统诱变的结果,例如,使用γ辐照、UV或化学诱变剂。如本文所使用的,“突变体”还指由于基因工程化而具有改变的基因结构或表达的重组细胞,作为非限制性实例,所述基因工程化可以包含过表达,包含在不同的时间、生物、或环境调控下的基因表达和/或与天然发生的程度不同的基因表达和/或在重组细胞中非天然表达的基因的表达;同源重组,包含基因敲除和敲入(例如,用对具有比野生型多肽更高或更低活性的多肽进行编码的基因和/或显性阴性多肽进行基因置换);通过RNAi、反义RNA或核酶等的基因弱化;以及使用大范围核酸酶、TALEN和/或CRISPR技术等的基因组工程化。因此,突变体不是天然存在的生物体。所关注的突变体生物典型地具有与缺少突变的相应野生型或祖代菌株不同的表型,其中以通过生长测定、产物分析、光合特性、生化测定等评估表型。当提及基因时,“突变体”表示该基因相对于天然或野生型基因具有至少一个碱基(核苷酸)变化、缺失或插入。突变(一个或多个核苷酸的改变、缺失和/或插入)可以在基因的编码区中,或可以在内含子、3'UTR、5'UTR或启动子区中,例如转录起始位点的2kb内或翻译起始位点的3kb内。例如,如本文所公开的基因表达减弱的突变体可具有突变,其可为转录起始位点的基因5'区域中的一个或多个核碱基变化和/或一个或多个核碱基缺失和/或一个或多个核碱基插入,例如,在非限制性实例中,在已知或推定的转录起始位点的2kb内、1.5kb内、1kb内或0.5kb内,或在翻译起始位点的3kb内、2.5kb内、2kb内、1.5kb内、1kb内或0.5kb内。作为非限制性实例,突变基因可以是在启动子区域内具有可以增加或降低该基因的表达的突变、插入/或缺失的基因;可以是具有导致产生非功能性蛋白、截短蛋白、显性失活蛋白和/或无蛋白的缺失的基因;和/或可以是具有一个或多个导致所编码蛋白的氨基酸的变化或导致基因转录本的异常剪接的点突变的基因等。
多肽的保守结构域包括在“cd”(保守结构域)数据库、COG数据库、SMART数据库、PRK数据库、TIGRFAM数据库或本领域已知的其它数据库中识别的那些。美国国家生物技术信息中心网站提供保守域数据库(CDD),其称之为“蛋白注释资源,由一组注释良好的古代域和全长蛋白的多序列比对模型组成。这些可用作位置特异性分数矩阵(PSSM),用于经由RPS-BLAST快速识别蛋白序列中的保守域。CDD内容包括NCBI管理域,其使用3D结构信息来明确地定义域边界且提供进入序列/结构/功能关系的洞察,以及从多个外部源数据库(Pfam、SMART、COG、PRK、TIGRFAM)导入的域模型。”这些资源中的任一者可用于识别保守域。
术语“Pfam”是指由Pfam联合体维护的蛋白域和蛋白家族的大型集合,且可在多个赞助的全球网站上获得,包括:Pfam.sanger.ac.uk/(维康信托基金会,桑格研究院(Welcome Trust,Sanger Institute));pfam.sbc.su.se(斯德哥尔摩生物信息中心(Stockholm Bioinformatics Center));pfam.janelia.org/(珍妮莉娅法姆研究学院,霍华德休斯医学研究所(Janelia Farm,Howard Hughes Medical Institute));pfam.jouy.inra.fr/(法国农业科学研究院(Institut national de la RechercheAgronomique));以及pfam.ccbb.re.kr。Pfam的最新版本是Pfam 32.0(2018年9月)。使用多序列比对和隐马尔可夫模型(HMM)来识别Pfam结构域和家族。Pfam-A家族或域分配是使用蛋白家族的代表性成员通过策划的种子比对而产生的高质量分配,并且基于种子比对概述隐马尔可夫模型。(除非另外说明,否则所查询的蛋白与Pfam域或家族的匹配是Pfam-A匹配。)随后使用属于所述家族的所有所识别序列自动产生所述家族的完全比对(Sonnhammer(1998)《核酸研究(Nucleic Acids Research)》26,320-322;Bateman(2000)《核酸研究》26,263-266;Bateman(2004)《核酸研究》32、《数据库期刊(Database Issue)》D138-D141;Finn(2006)《核酸研究数据库期刊》34,D247-251;Finn(2010)《核酸研究数据库期刊》38,D211-222)。通过访问Pfam数据库,例如使用任何上述网站,可以使用HMMER同源性搜索软件(例如,HMMER2、HMMER3或更高版本,hmmer.janelia.org/)针对HMM来查询蛋白序列。将查询的蛋白识别为pfam家族(或具有特定的Pfam域)的显著匹配是位分数大于或等于Pfam域的采集阈值的那些。期望值(e值)也可以用作在Pfam中包含所查询的蛋白或确定所查询的蛋白是否具有特定Pfam域的标准,其中低e值(远小于1.0,例如小于0.1,或小于或等于0.01)表示匹配归因于机会的低概率。
对“大体上相同”或“基本相同”的特性的引用表示对在本发明上下文中被认为重要的特性不重要的微小的和不相关的偏差。在各种实施例中,这可意味着特性在参考值的10%内,且优选地在5%内,或在2.5%内。
“对照细胞”或“对照微生物”是从其直接或间接衍生突变微生物(基因工程化或诱变微生物)的野生型细胞或微生物,或者是与提及的突变细胞或微生物基本相同的细胞或微生物,不同之处在于对照细胞或微生物不具有导致脂质产生增加的突变,例如对照细胞或微生物未经基因工程化或诱变以增加脂质产生。例如,在重组藻类包含编码Cas9基因和基因敲除固有CHG甲基转移酶基因的外源基因的情况下,除对照藻类不包含CHG甲基转移酶基因的基因敲除以外,对照藻类可与重组藻类大体上相同。
本文公开用于操纵、测定、培养和分析微生物的方法。本文阐述的本发明还利用本领域已知的用于细胞培养、微生物转化、基因工程和生化分析的标准方法、技术和试剂。虽然类似于或等同于本文所描述的那些方法和材料的方法和材料可以用于本发明的实践或测试中,但是下面描述了合适的方法和材料。材料、方法和实例仅为说明性的且并不意图为限制性的。本发明的其它特征和优点将从描述和权利要求书显而易见。
实例
实例1.完全渗透CAS9表达的拟小球藻属菌株的建立
使用基本上如PCT申请公开案WO2016109840中所描述的方法,对拟小球藻属菌株进行基因工程化以表达化脓性链球菌(Streptococcus pyogenes)Cas9基因,其以全文引用的方式并入本文中。简言之,拟小球藻属菌株WT-1185用包含以下的载体转化:可操作地连接到拟小球藻属RPS17启动子的化脓性链球菌Cas9基因、来自针对拟小球藻属的土曲霉密码子优化的杀稻瘟菌素抗性基因、可操作地连接到拟小球藻属ACP1启动子以产生拟小球藻属菌株STR00014的GFP报告子表达盒。通过测序、通过流式细胞测量术的荧光偏移和通过蛋白质印迹法的Cas9蛋白表达的展现来确认Cas9基因和GFP基因整合到拟小球藻属基因组中。
实例2.拟小球藻属DNA甲基转移酶的识别
使用Pfam分析、BLAST搜索和HMMER从序列数据库识别在拟小球藻属中包含PfamPF00145(C-5胞嘧啶特异性DNA甲基转移酶)的四种新颖假定DNA甲基转移酶基因。这些4种假定甲基转移酶基因中的每一者包含对应于C-5胞嘧啶特异性DNA甲基转移酶的PfamPF00145。拟小球藻属假定DNA甲基转移酶的氨基酸序列和其相应cDNA序列展示为SEQ IDNO:1-8。
实例3.使用完全渗透拟小球藻属CAS9编辑菌株STR00014基因敲除四种假定DNA甲基转移酶
个别假定DNA甲基转移酶中的每一者使用整合到拟小球藻属Cas9编辑背景菌株STR00014(其为具有Cas9盒的野生型菌株)中的CRISPR Cas9和针对基因中的每一者的嵌合gRNA来进行基因敲除。设计嵌合gRNA并且在体外合成以靶向拟小球藻属中的四种DNA甲基转移酶基因:EMRE3EUKT598198、EMRE3EUKT590754、EMRE3EUKT596408和EMRE3EUKT596208-其相应的嵌合gRNA序列如SEQ ID NO:9-12所示。
将拟小球藻属STR00014通过电穿孔用1-2μg纯化的嵌合引导RNA和1μg选择性标记DNA进行转化,所述选择性标记DNA含有针对拟小球藻属进行密码子优化并且含有来自拟小球藻属内含子的博来霉素抗性“BleR”基因(SEQ ID:13)。BleR基因可操作地连接到拟小球藻属RPS4启动子(SEQ ID:14),并且由拟小球藻属RPS4终止子(SEQ ID:15)终止。
通过以下方式进行电穿孔:对100mL种子培养物进行接种,所述种子培养物在使用转化前六天被接种成1×106个细胞/毫升,以在转化前两天将1L培养物接种成1×106个细胞/毫升。在转化当天,通过在5000×g下离心持续20分钟来沉淀细胞,用0.1um过滤的385mM山梨糖醇洗涤三次,并且在385mM山梨糖醇中重悬到5×109个细胞/毫升。在不同条件下,在
Figure BDA0003051440740000191
Gene Pulser XcellTM中,在0.2cm比色皿中进行100μL浓集细胞的电穿孔。用于优化电穿孔的DNA是线性化的pSG6640,其包括ble和TurboGFP表达盒。TurboGFP盒包括可操作地连接到TurboGFP基因(SEQ ID NO:17)的拟小球藻属ACP启动子(SEQ ID NO:16)和拟小球藻属ACP终止子(SEQ ID NO:18)。紧接在电穿孔预冷却细胞和比色皿之后,添加1mL低温山梨糖醇且将其用于将细胞转移到10mL市售藻类生长培养基中。在过夜回收之后,将细胞浓集并铺展到含有250mg/L zeocin的直径为13cm的生长培养基上,并且在基因枪法(biolistics)部分中所列出的条件下生长。下文展示拟小球藻属ACP启动子、ACP终止子和TurboGFP基因的序列。
在测试一系列电压、电阻和电容之后,将最优电穿孔条件确定为1.0-1.2kV(5000-6000V/cm)、200-300欧姆和25-50μF。使用更大量的DNA增加了所得zeocin抗性菌落的数量,尽管在大于4μg的量下效果达到稳定。
在电穿孔之后,将细胞接种于含有250μg/ml zeocin的琼脂培养基(补充有10mM铵和15mM HEPES pH 8的市售藻类生长培养基)上,以选择并入有bleR盒的转化体。通过使用经设计以跨越天然目标基因座扩增的引物(DNA_oligoST106;SEQ ID:19和DNA_oligoST107;SEQ ID:20)的菌落PCR筛选用于EMRE3EUKT598198基因敲除的转化体。引物经设计以在没有整合到基因座的情况下(例如,“敲入”BleR盒)产生约400bp的条带,或者如果有单个BleR盒整合到目标基因座,则产生约5.1kb的条带,或者如果有多个整合到目标基因座,则可能没有条带。此外,使用侧接目标的上文所描述的引物和经设计以从染色体扩增到选择性标记中的内部BleR引物(DNA_oligoST078;SEQ ID:21)中的每一者进行两次以上菌落PCR反应。不管整合的ble盒的定向,如果目标整合成功,那么约800bp的条带将由侧接引物和内部引物DNA_oligoST078的扩增产生。引物的序列展示于下文中。
DNA_oligoST106
Figure BDA0003051440740000192
DNA_oligoST107
Figure BDA0003051440740000193
DNA_oligoST078
Figure BDA0003051440740000194
所得EMRE3EUKT598198基因敲除菌株称为STR03778。
通过使用经设计以跨越天然目标基因座扩增的引物(DNA_oligoST258;SEQ ID:22和DNA_oligoST259;SEQ ID:23)的菌落PCR筛选用于EMRE3EUKT590754基因敲除的转化体。引物经设计以在没有整合到基因座的情况下(例如,“敲入”BleR盒)产生-400bp的条带,或者如果有单个BleR盒整合到目标基因座,则产生-5.1kb的条带,或者如果有多个整合到目标基因座,则可能没有条带。此外,使用侧接目标的上文所描述的引物和经设计以从染色体扩增到选择性标记中的内部BleR引物(;SEQ ID:21)中的每一者进行两次以上菌落PCR反应。不管整合的ble盒的定向,如果目标整合成功,那么约800bp的条带将由侧接引物和内部引物DNA_oligoST078的扩增产生。引物的序列展示于下文中。
DNA_oligoST258
Figure BDA0003051440740000201
DNA_oligoST259
Figure BDA0003051440740000202
所得EMRE3EUKT590754基因敲除菌株称为STR03826。
通过使用经设计以跨越天然目标基因座扩增的引物(DNA_oligoST108;SEQ ID:24和DNA_oligoST109;SEQ ID:25)的菌落PCR筛选用于EMRE3EUKT596408基因敲除的转化体。引物经设计以在没有整合到基因座的情况下(例如,“敲入”BleR盒)产生-400bp的条带,或者如果有单个BleR盒整合到目标基因座,则产生-5.1kb的条带,或者如果有多个整合到目标基因座,则可能没有条带。此外,使用侧接目标的上文所描述的引物和经设计以从染色体扩增到选择性标记中的内部BleR引物(DNA_oligoST078;SEQ ID:DNA_oligoST078)中的每一者进行两次以上菌落PCR反应。不管整合的ble盒的定向,如果目标整合成功,那么约800bp的条带将由侧接引物和内部引物DNA_oligoST078的扩增产生。
DNA_oligoST108
Figure BDA0003051440740000203
DNA_oligoST109
Figure BDA0003051440740000204
所得EMRE3EUKT596408基因敲除菌株称为STR03749。
通过使用经设计以跨越天然目标基因座扩增的引物(DNA_oligoST110;SEQ ID:26和DNA_oligoST111;SEQ ID:27)的菌落PCR筛选用于EMRE3EUKT596208基因敲除的转化体。引物经设计以在没有整合到基因座的情况下(例如,“敲入”BleR盒)产生-400bp的条带,或者如果有单个BleR盒整合到目标基因座,则产生-5.1kb的条带,或者如果有多个整合到目标基因座,则可能没有条带。此外,使用侧接目标的上文所描述的引物和经设计以从染色体扩增到选择性标记中的内部BleR引物(DNA_oligoST078;SEQ ID:DNA_oligoST078)中的每一者进行两次以上菌落PCR反应。不管整合的ble盒的定向,如果目标整合成功,那么约800bp的条带将由侧接引物和内部引物DNA_oligoST078的扩增产生。引物的序列展示于下文中。
DNA_oligoST110
Figure BDA0003051440740000211
DNA_oligoST111
Figure BDA0003051440740000212
所得EMRE3EUKT596208基因敲除菌株称为STR03779。
下文概述拟小球藻属DNA甲基转移酶基因、氨基酸和DNA序列的SEQ ID NO、用于基因敲除这些基因的对应的gRNA序列以及对应的基因敲除菌株。
表1:拟小球藻属DNA甲基转移酶和对应序列
Figure BDA0003051440740000213
实例4.DNA甲基转移酶活性基因敲除菌株的分析
DNA甲基化状态
针对拟小球藻属DNA甲基转移酶基因敲除菌株STR03749、STR03826、STR03779和STR03778的拟小球藻属天然DNA以及整合到拟小球藻属基因组(杀稻瘟菌素、Cas9和GFPDNA序列)中的外源DNA的CpG、CHG和CHH胱氨酸甲基化状态进行评估,并且与包含整合到对照基因组的杀稻瘟菌素、Cas9和GFP基因和完整DNA甲基转移酶的对照拟小球藻属菌株STR00014进行比较。
简单来说,使用标准技术分离拟小球藻属染色体DNA。使用MethylSeqTM(因美纳公司(Illumina Inc.,加利福尼亚州圣地亚哥市))分析经分离DNA的甲基化状态。
拟小球藻属基因敲除菌株STR03778
与无此类基因敲除的对照拟小球藻属菌株STR00014相比,在拟小球藻属DNA甲基转移酶基因敲除菌株STR03778中,整合到拟小球藻属基因组中的外源基因杀稻瘟菌素、Cas-9和GFP的CHG DNA甲基化水平显著降低(图1)。
另外,与无此类基因敲除的对照拟小球藻属菌株STR00014相比,在拟小球藻属DNA甲基转移酶基因敲除菌株STR03778中,整合到拟小球藻属基因组中的外源基因杀稻瘟菌素、Cas-9和GFP的CHH DNA甲基化水平显著降低(图1)。与无此类基因敲除的对照拟小球藻属菌株STR00014相比,在拟小球藻属DNA甲基转移酶基因敲除菌株STR03778中,整合到拟小球藻属基因组中的外源基因杀稻瘟菌素、Cas-9和GFP的CpG DNA甲基化水平保持相对不变(图1)。
还评估天然拟小球藻属DNA序列的CHG、CHH和CpG DNA甲基化水平。与无此类基因敲除但天然拟小球藻属DNA序列的CHH和CpG DNA甲基化水平保持相对不变的对照拟小球藻属菌株STR00014相比,拟小球藻属DNA甲基转移酶基因敲除菌株STR03778在其基因组的高度重复序列和着丝粒区域展现较低CHG甲基化(图2和3)。
拟小球藻属基因敲除菌株STR03749
与无此类基因敲除的对照拟小球藻属菌株STR00014相比,在拟小球藻属DNA甲基转移酶基因敲除菌株STR03749中,整合到拟小球藻属基因组中的外源基因杀稻瘟菌素、Cas-9和GFP的CHG、CpG和CHH DNA甲基化水平保持相对不变(图1)。
还评估天然拟小球藻属DNA序列的CHG、CHH和CpG DNA甲基化水平。天然拟小球藻属DNA序列的CHG、CHH和CpG DNA甲基化水平保持相对不变(图2和3)。
拟小球藻属基因敲除菌株STR03826和STR03779
拟小球藻属基因敲除菌株STR03826、STR03779展示类似于拟小球藻属基因敲除菌株STR03749(数据未展示)的甲基化模式。
因此,拟小球藻属基因EMRE3EUKT598198负责外源DNA的甲基化。
实例5.H3K9单甲基化和三甲基化基因敲除菌株的分析
使用染色质免疫沉淀技术(ChIP)使用来自Active
Figure BDA0003051440740000221
(加利福尼亚州卡尔斯巴德,目录号53040)的试剂,针对对照拟小球藻属菌株STR00014和DNA甲基转移酶基因敲除菌株STR03749和STR03778以评估组蛋白3的赖氨酸9(H3K9)的单甲基化和三甲基化。针对三甲基化的组蛋白3的赖氨酸9的特异性抗体购自
Figure BDA0003051440740000222
(马萨诸塞州剑桥市)并且用于ChIP分析。
与无此类基因敲除的对照拟小球藻属菌株STR00014相比,拟小球藻属DNA甲基转移酶基因敲除菌株STR03778(编码SEQ ID NO:1的EMRE3EUKT598198基因的基因敲除)展示在包含整合到拟小球藻属基因组中的外源基因杀稻瘟菌素、Cas-9和GFP的染色体部分中H3K9单甲基化和三甲基化显著降低(图1)。
拟小球藻属DNA甲基转移酶基因敲除菌株STR03778(EMRE3EUKT598198基因的基因敲除)展示在天然染色体中H3K9单甲基化和三甲基化略微降低(图2和3)。
拟小球藻属菌株STR03749展示H3K9的单甲基化和三甲基化无显著变化(图1-3)。因此,整合的外源DNA的组蛋白H3K9的单甲基化和三甲基化中间接涉及拟小球藻属基因EMRE3EUKT598198。
图9还展示基因敲除菌株的生产力(以总有机碳形式)的结果。结果展示与野生型菌株相比,生产力无缺陷。
实例6.外源基因蛋白表达的评估
通过蛋白质印迹分析针对三种基因敲除菌株STR03778、STR03749和STR03779的整合到拟小球藻属基因组中的外源基因Cas-9的表达进行评估,并且与对照菌株STR00014进行比较。抗Cas-9抗体用于蛋白质印迹分析。
与存在或不存在杀稻瘟菌素选择性压力的对照菌株STR00014相比,在基因敲除菌株STR03778和STR03749两者中的Cas-9蛋白的表达水平更高(图4)。
因此,使拟小球藻属基因EMRE3EUKT598198突变或减弱会增加拟小球藻属中的外源DNA的表达。
实例7.在其它藻类物种中的直系同源DNA甲基转移酶的识别
使用BLAST分析,拟小球藻属基因EMRE3EUKT598198的氨基酸序列(SEQ ID NO:1)用来识别藻类卵囊藻属中的直系同源DNA甲基转移酶。所识别的DNA甲基转移酶的氨基酸和cDNA序列展示为SEQ ID NO:28-29。
除一些CpG和CHH DNA甲基化以外,识别整合到卵囊藻属基因组中的外源DNA(杀稻瘟菌素基因)的CHG DNA甲基化(图5-7)。此外,本申请识别在重复区域和着丝粒处的卵囊藻属DNA的CHG甲基化(图6-7)。
实例8.卵囊藻属中CHG甲基转移酶的减弱
如上文所描述,识别卵囊藻属中甲基转移酶基因。编码甲基转移酶SEQ ID NO:28的序列的缺失是使用
Figure BDA0003051440740000231
基因枪系统(拜耳雷德(Bio-Rad,美国加利福尼亚州埃库莱斯))用RNP/DNA涂布的子弹生成的。将靶向待基因敲除的基因的选择性标记DNA和Cas9核糖核蛋白质(RNP)沉淀到金粒子上,所述金粒子粘附到管内部,且基因枪通过管燃烧一股氦气,从而将经涂布的金粒子射入到粘附于固体非选择性培养基上的卵囊藻属细胞中。第二天,将细胞移动到用于转化的菌落生长的选择性培养基上。
使用Alt-R CRISPR-Cas9系统(整合DNA技术公司(Intergrated DNATechnologies,Inc.,美国爱荷华州科勒尔维尔))制备Cas9 RNP。将靶向所关注的基因的crRNA XT退火为tracrRNA,并且将所得引导RNA双螺旋与Cas9 V3复合以形成Cas9RNP。从大肠杆菌制备选择性标记DNA并且消化限制以分离主链。使用NAS 16305(编码杀稻瘟菌素抗性的载体)或NAS 15142(编码诺尔丝菌素抗性的载体)。两种标记针对卵囊藻属经密码子优化,含有来自卵囊藻属的内源内含子,并且可操作地连接到内源卵囊藻属启动子并且由内源卵囊藻属终止子终止。
将0.6um金粒子重悬于鱼精蛋白硫酸盐溶液中并且超声处理。DNA标记与Cas9RNP(62pmol Cas9 V3和500pmol引导RNA双螺旋)在PBS中混合,并且将DNA-RNP混合物添加到鱼精蛋白-金溶液中以在冰上沉淀2小时。
将每个样品的7”长度的TefzelTM(乙烯四氟乙烯)(杜邦公司(E.I.du Pont deNemours,特拉华州威明顿))管插入到连接到歧管干燥器的柔性管中(例如,如公开的美国专利申请US 2017-0130238中所描述)。柔性管从鲁尔锁(Leur lock)处的歧管干燥器断开且附接到10mL注射器上。将DNA-RNP/金悬浮液充分混合且通过注射器施加抽吸而抽取到TefzelTM管中。在仍连接到注射器时,将TefzelTM管置于平坦表面上两分钟,同时金从溶液中沉淀且粘附到管的内部。然后用注射器施加压力以将PBS溶液轻轻地从管中推出。立即翻转管以允许剩余金浆料涂抹到TefzelTM管的与其最初沉淀的一侧相对的一侧上。接着从注射器上拆卸TefzelTM管,且在0.5-0.6LPM氮气流动的情况下将其移动回到歧管干燥器上。当金如从深黄色到淡黄色的可见光颜色变化所证明完全干燥时,从柔性管中移出TefzelTM管线且切割成用于Helios基因枪TM的半英寸碎片。
转化
为了制备用于转化的细胞,100mL种子培养物在使用转化前六天被接种成0.05OD730,以在转化前一天将500mL培养物接种成0.2OD730。使培养物在具有一半浓度的盐的市售藻类生长培养基中在25℃下在1%CO2在130rpm的振荡下在16:8的光:暗循环中的植物生长室中生长。
在转化当天,通过在5000×g下离心二十分钟将细胞培养物沉淀。将细胞重悬于50mL渗透剂(0.1um过滤器灭菌的250mM甘露醇/250mM山梨糖醇)中并且在室温下培育1-2小时。在渗透预处理之后,将细胞在渗透剂中浓缩到的20.0OD730/mL,且在含有2%琼脂PM147固体培养基的13cm直径的投掷板中的五个4cm直径的圆环中的每一者中喷涂200uL细胞悬浮液。当细胞完全干燥时,使用基因枪以400psi从距离板3-6cm的距离向每细胞圆环发射两枚子弹。对每个样品,共有10个复制子弹射向20.0OD730个细胞,分到5个细胞圆环中。在黑暗30℃培育箱中将细胞留在投掷板上过夜。
转化之后的当天,通过用液体市售藻类生长培养基洗涤投掷板,将来自复制细胞圆环的细胞汇集在一起。以每13cm直径板10.0OD730的预期密度将回收的细胞接种到含有425mg/L杀稻瘟菌素或80mg/L诺尔丝菌素硫酸盐的生长培养基上。
用DNA涂布子弹转化MTase基因敲除菌株和亲本菌株
卵囊藻属甲基转移酶(MT)基因敲除菌株和亲本菌株使用
Figure BDA0003051440740000251
基因枪系统(拜耳雷德,美国加利福尼亚州埃库莱斯)用DNA进行转化。将DNA沉淀到金粒子上,所述金粒子粘附到管线长度的内部,且基因枪通过管线燃烧一股氦气将经DNA涂布的金粒子射入到粘附于固体非选择性培养基上的卵囊藻属细胞中。第二天,将细胞移动至用于转化的菌落生长的选择性培养基上。
对编码相同的BSD选择性标记的五个DNA载体(CRE1-5),但不同版本的CRE重组酶进行了测试(图8)。CRE的不同版本共享相同针对卵囊藻属经密码子优化的CDS序列,但各自含有来自卵囊藻属的不同内源内含子。所有CRE版本可操作地连接到相同内源卵囊藻属启动子并且由相同内源卵囊藻属终止子终止。从大肠杆菌制备载体DNA并且消化限制以在转化之前分离主链。数据展示基因敲除菌株中的部分或全部两侧加上loxP位点(floxing)。CHG甲基化对于亲本菌株是广泛的并且在基因敲除中不存在,如图5-7中所示。
将DNA(2-10μg)沉淀到金粒子上并且重悬于100%乙醇溶液中。计算体积以制成十枚子弹,不使用PVP,且使用鱼精蛋白硫酸盐溶液。当制备DNA/金悬浮液时,通过插入到附接到歧管干燥器的柔性管中(如在2017年5月11日公布的美国专利申请2017-0130238中所描述)预干燥每各样品的一7”长度的TefzelTM(乙烯四氟乙烯)管,且在0.5-0.6LPM氮气下流动通过至少十五分钟以消除来自TefzelTM管内部的环境湿度累积。
在制备DNA/金悬浮液并且预干燥TefzelTM管之后,将柔性管从鲁尔锁处的歧管干燥器断开且附接到10mL注射器上。将DNA/金悬浮液充分混合且通过注射器施加抽吸而抽取到TefzelTM管线中。在仍连接到注射器时,将TefzelTM管线置于平坦表面上五分钟,同时金从溶液中沉淀且粘附到管线的内部。在五分钟的沉淀时间之后,用注射器施加压力以将乙醇轻轻地从管线中推出。立即翻转管以允许剩余金浆料涂抹到TefzelTM管的与其最初沉淀的侧相对的侧。在2-5分钟的空气干燥时间之后,从注射器上拆卸TefzelTM管,且在0.5-0.6LPM氮气流动的情况下将其移动回到歧管干燥器上。当金如从深色到淡黄色的可见光颜色变化所证明完全干燥时,从柔性管中移出TefzelTM管且切割成用于Helios基因枪TM的半英寸碎片。
为了制备用于转化的细胞,100mL种子培养物在使用转化前六天被接种成0.05OD730,以在转化前一天将500mL培养物接种成0.2OD730。使培养物在市售藻类生长培养基中在25℃下在1%CO2在130rpm的振荡下在16:8的光:暗循环中的ConvironTM培育箱中生长。
在转化当天,通过在5000×g下离心二十分钟将细胞培养物沉淀。将细胞重悬于50mL渗透剂(过滤器灭菌的250mM甘露醇/250mM山梨糖醇0.1um)中并且在室温下培育1-2小时。
在渗透预处理之后,将细胞浓在渗透剂中缩到的20.0OD730/mL,且在含有2%琼脂PM147固体培养基的13cm直径的投掷板中的五个4cm直径的圆环中的每一者中喷涂200uL细胞悬浮液。当细胞完全干燥时,使用
Figure BDA0003051440740000261
基因枪以400psi从距离板3-6cm的距离向每细胞圆环发射两枚子弹。对每个样品,共有10个复制子弹射向20.0OD730个细胞,分到5个细胞圆环中。在黑暗30℃培育箱中将细胞留在投掷板上过夜。
转化之后的当天,通过用液体标准藻类生长培养基洗涤投掷板,将来自复制细胞圆环的细胞汇集在一起。以每13cm直径板10.0OD730的预期密度将回收的细胞接种到选择性培养基(含有425mg/L杀稻瘟菌素的标准藻类生长培养基)上。
具有编码SEQ ID NO:28的甲基转移酶的序列缺失的卵囊藻属菌株被识别为STR28031和STR29997。应注意,这些菌株的不同之处仅在于'031含有BSD作为选择性标记,且'997含有诺尔丝菌素作为选择性标记。注意到缺失菌株的CHG和CHH甲基化显著降低,如图5中所示。背景对照组菌株为STR24194(不同之处在于其具有用于比较转基因处的甲基化的相应选择性标记)。
与背景菌株(STR24194)相比,卵囊藻属(STR29997)的生产力分析(图10)和测量到的TOC展示细胞的生产力无缺陷。
尽管已经参考以上实例描述了本发明,但是应当理解,修改和变型包含在本发明的精神和范围内。因此,本发明仅由所附权利要求限定。
序列表
<110> 合成基因组股份有限公司
J•E•佩斯
R•斯普雷菲科
<120> 避免藻类中的外源核酸的表观遗传沉默
<130> SGI2210-1WO
<150> US 62/779,364
<151> 2018-12-13
<160> 29
<170> PatentIn版本3.5
<210> 1
<211> 1253
<212> PRT
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT598198 甲基转移酶
<400> 1
Met Glu Leu Phe Gly Leu Lys Gly Gln Ala Leu Gln Arg Pro Asp Glu
1 5 10 15
Leu Cys Asn Leu Asp Asp Trp Arg Lys Leu Asn Lys Ala Gly Asp Thr
20 25 30
Ser Trp Leu Gly Ser Pro Ile Pro Lys Asp Leu Ala His Thr Leu Tyr
35 40 45
Pro His Arg Lys Tyr Leu Ala Met Glu Ser Leu Ser Asn Arg Lys Gln
50 55 60
Glu Ile Gln Lys Tyr Glu Glu Glu Asp Asn Gly Ser Asp Pro Lys Trp
65 70 75 80
Thr Asp Ala Lys Ala Val Ala His Phe Trp Gly Ala Glu Leu Asp Ser
85 90 95
Leu Phe Asp Asp Asp Thr Gly Asp Leu Ile Pro Gly Phe Lys Leu Tyr
100 105 110
Val Gly Asp Phe Val Arg Leu Asp Leu Gly Glu Gly Arg Lys Gly Val
115 120 125
Cys Gln Val Leu Glu Leu Tyr Gln Asp Pro Leu Gly Ala His Arg Ile
130 135 140
Ser Ile Lys Trp Phe Phe Ser Met Tyr Asp Asp Glu Val Lys Ile Leu
145 150 155 160
Asp Glu Ile Leu Gly Gly Leu Asp Lys Arg Gln Leu Trp Gly Met Leu
165 170 175
Lys Ala Asp Lys Gln Thr Phe Gly Thr Glu Tyr Glu Leu Asn Val Val
180 185 190
Glu Ala Pro Val Lys Val Val Gln Val Leu Pro Gly Glu Thr Pro Pro
195 200 205
Glu Asp Glu Asp Thr Tyr Trp Trp Glu Ser Val His Gly Pro Thr Cys
210 215 220
Tyr Thr Phe Glu Asn Pro Gly Asp Leu Val Pro Thr Ser Arg Thr Arg
225 230 235 240
His Ser Ser Thr Ala Arg Leu Leu Arg Val Met Asp Leu Tyr Ala Gly
245 250 255
Gly Gly Gly Leu Gly Tyr Leu Asp Thr Arg Thr Glu Lys Val Glu Ile
260 265 270
Arg Thr Asp Trp Ala Val Asp Tyr Glu Gln Asp Met Arg Asn Thr Phe
275 280 285
Lys Cys Asn Phe Gln His Ala His Ala Phe Ala Ser Gly Thr Asp Glu
290 295 300
Ala Leu Gly Leu Phe Lys Met Val Phe Trp Leu Cys Gln Glu Met Gly
305 310 315 320
Val Gly Lys Glu Ala Val Asp Gly Arg Phe Ser Lys Pro Phe Ala Phe
325 330 335
Asp Lys Leu Glu Arg Cys Asp Asp Asp Gln Met Val Ala Pro Pro Cys
340 345 350
Ser Leu Val Leu Gln Asn Arg Ala Cys Gly Arg Gly Arg Ala Gly Arg
355 360 365
Gln Gln Glu Leu Pro Ala Lys Ala Gln Gly Arg Gly Ala Lys Arg Lys
370 375 380
Arg Val Glu Pro Thr Val Gln Ala Ser Arg Leu His Leu Asp Ser Ser
385 390 395 400
Asp His Glu Ala Cys Ala Glu Ala Glu Val Gly Gly His Ser Gln Gly
405 410 415
Ser Ser Ser Gln Gly Thr Leu Phe His Thr Ala Asp Glu Lys Ser Ser
420 425 430
Arg Gly Glu Gly Glu Glu Gly Ala Asp Ala Ser Arg Val Ala Thr Arg
435 440 445
Asn Gly Arg Thr Cys Ala Ala Thr Gly Gly Gly Gln Thr Gly Gly Lys
450 455 460
Val Gln Ala Lys Ser Leu Arg Ala Ser Lys Ser Lys Pro Gly Ala Lys
465 470 475 480
Asp Gly Val Gly Val Ala Ser Pro Lys Ser Ala Lys Ser Asn Lys Met
485 490 495
Val Ser Arg Ala Glu Ala Glu Ala Lys Asn Thr Ala Trp Pro Ala Ala
500 505 510
Ala Pro Ile Pro Lys Ala Gly Glu Leu Glu Ala Ile Leu Gln Val Arg
515 520 525
Leu Cys Glu Lys Gly Ala Arg Leu Pro Lys Asp Ser Asn Val Gly Ala
530 535 540
Ala Gln Leu Ile Arg Glu Ile Arg Pro Glu Glu Met Arg Leu Glu Phe
545 550 555 560
Lys Val Arg Trp Ser Pro Ala Ala Lys Lys Tyr Gly Asp Ser Arg Gly
565 570 575
Glu Ser Trp Leu Pro Arg Ser Ala Leu Gly Ala Tyr Gln Glu Gln Leu
580 585 590
Lys Ser Phe Cys Leu Lys Leu Arg Arg Cys Ser Val Val Pro Phe Pro
595 600 605
Gly Glu Val Asn Leu Ile Cys Gly Gly Pro Pro Cys Gln Gly Val Ser
610 615 620
Gly Asn Asn Arg His Ala Lys Met Arg Asp Ile Leu Gln Asp Val Arg
625 630 635 640
Asn Arg Gln Leu Leu Val Phe Leu Asp Phe Val Lys Trp Phe Lys Pro
645 650 655
Asn Phe Val Leu Met Glu Asn Val Gln Asp Ile Met Lys Lys Glu Glu
660 665 670
Gly Lys Tyr Val Lys Tyr Ala Met Gly His Thr Leu Gln Met Gly Tyr
675 680 685
Gln Ile Arg Leu Gly Leu Leu Ala Ala Gly Asp Phe Gly Val Ser Gln
690 695 700
Gly Arg Trp Arg Cys Phe Met Trp Gly Ala Leu Lys Asn Glu Glu Gln
705 710 715 720
Leu Pro Ala Phe Pro Glu Ala Thr His Asn Cys Arg Asn Phe Lys Thr
725 730 735
Gly Val Cys Thr Leu Gly Lys Asp Cys Gln Gly Gly Phe Leu Ser Asp
740 745 750
Glu Asn Ser Leu Glu Ala His Pro Pro Val Leu Leu Gly Asp Val Met
755 760 765
Ala Asp Leu Pro Glu Val Thr Asn Gly Glu Leu Arg Glu Arg Leu Ser
770 775 780
Tyr Pro Cys Asp Pro Lys Tyr Val Gln Gln Met Trp Tyr Arg Arg Leu
785 790 795 800
Pro Gln Pro Trp Gln Thr Ser Ile Glu Glu Arg Ile Ala Phe Arg Ser
805 810 815
Glu Val Leu Glu Lys Gln Gln Leu Lys Phe Asn Arg Glu Leu Leu Glu
820 825 830
Ser Val Lys Thr Asp Glu Asp Val Thr Gln Leu Gly Leu Arg Ser Leu
835 840 845
Asn Thr Lys Asn Pro Leu Lys Gly Ala Glu Gln Asn Asn Lys Pro Lys
850 855 860
Leu Arg Gln Asp Gly Thr Gln Ala Gly Asn His Pro Phe Glu Thr Ile
865 870 875 880
Thr Ala Ala Leu Arg Met Leu Ser Asn Pro Arg Glu Ala Glu Ile Leu
885 890 895
Lys Leu Glu Met Glu Ala Gly Arg Leu Cys Phe Ala His Glu Arg Gly
900 905 910
Met Gln Ile Tyr Lys Glu Leu Gln Glu Tyr Leu Lys Glu Ser Glu Arg
915 920 925
Gly Leu Gly Ser Gly Gln Val Leu Cys Asp His Arg Pro Leu Ile Leu
930 935 940
Asn Asp Asp Asp Tyr Leu Arg Ile Thr Val Val Pro Lys Arg Thr Arg
945 950 955 960
Tyr Glu Glu Glu Glu Asp Arg Leu Cys Asn Phe Arg Ala Leu Glu Gly
965 970 975
Val Val Asn Asn Ala Asp Gly Thr Cys Cys Tyr Gly Ser Gln His Ala
980 985 990
Glu Arg Arg Lys Asp Gly Thr Ser Gly Cys Lys Gly Gly Gly Thr Tyr
995 1000 1005
Thr Ile Asp Lys Arg Ser Asn Ala His Val Thr Arg Ile Asp Gln
1010 1015 1020
Glu Asp Lys Asn Gly Trp Arg Gly Val Ala Leu Gln Gly Cys Gln
1025 1030 1035
Ala Tyr Val Lys His Leu Pro Thr Met Glu Pro Glu Leu Pro Arg
1040 1045 1050
Trp Cys Val Thr Phe Lys Arg Gly Lys Ser Asp Gly Arg His Gly
1055 1060 1065
Gly Phe Gly Arg Val His Phe Ser Gln Ile Ile Thr Thr Val Ile
1070 1075 1080
Gly Arg Ala Glu Pro His Asn Leu Lys Leu Ala His Pro Thr Gln
1085 1090 1095
Asp Arg Val Met Thr Ile Arg Glu Asn Ala Arg Cys Gln Gly Phe
1100 1105 1110
Pro Asp Tyr His Val Phe Cys Ala Asp Leu Ser Arg Gly Gly Arg
1115 1120 1125
Asn Arg Trp Val Arg Asn Ser Thr Leu Thr Gln Arg Tyr Gln Met
1130 1135 1140
Ile Gly Asn Ala Val Cys Pro Glu Val Ala Ser Ala Leu Gly Arg
1145 1150 1155
Cys Leu Ala Leu Ala Ala Thr Gly Glu Ser Pro Pro Gly Glu Cys
1160 1165 1170
Tyr Ile Gln Val Pro Asn Pro Ala Tyr Leu Gln Val Val Lys Ala
1175 1180 1185
Ala Arg Glu Lys Gly Leu Glu Tyr Phe Phe Glu Glu Tyr Val Arg
1190 1195 1200
Glu His Pro Arg Gly Tyr His Ser Ile Ser Leu Glu Ala Arg Leu
1205 1210 1215
Cys Ala Ala Ala Glu Gly Tyr Ile Pro Gln Gly Gly Ser Ser Gly
1220 1225 1230
Thr Gly Ala Val Asp Asp Glu Asp Glu Val Asp Asp Asp Ser Gln
1235 1240 1245
Gly Glu Glu Gly Asp
1250
<210> 2
<211> 3761
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> EMRE3EUKC598198,SEQ ID 1的甲基转移酶的cDNA
<400> 2
atggaattat tcggccttaa aggtcaagcc ttacagcgtc cagatgagct ttgtaacctg 60
gatgattgga gaaagctgaa taaagcaggc gacacgtcat ggcttggctc acctatcccc 120
aaggaccttg ctcacacctt gtatccacac cgcaagtacc tggccatgga aagcttgagc 180
aatcgcaagc aagaaataca gaaatacgag gaagaagata atggcagcga tccgaaatgg 240
acagatgcaa aagcagtggc tcacttctgg ggcgcggagc tggatagcct gtttgatgat 300
gacaccgggg acctcatccc aggtttcaag ctgtatgttg gcgactttgt caggcttgat 360
cttggggaag gacgaaaagg cgtctgccag gttctcgagc tctaccagga tcccttgggg 420
gcacatcgca tcagcatcaa gtggtttttc agcatgtacg acgatgaggt gaagattcta 480
gatgagattc tgggggggct ggacaagagg cagttgtggg gcatgcttaa ggcagacaaa 540
cagacgtttg ggacggaata cgagctcaat gttgtggagg cacctgttaa agttgttcag 600
gtgcttccgg gagagacccc cccagaggat gaagatacgt actggtggga atcagttcat 660
ggtcccacct gctacacctt tgagaatccc ggggaccttg tccccaccag caggaccaga 720
cactccagca ctgcgaggct gctgcgagtg atggacctgt atgccggagg cggtggcctt 780
ggatacctgg acacgcgcac tgagaaagtg gagatcagga ccgattgggc tgtggactac 840
gagcaagaca tgaggaacac gttcaaatgc aacttccagc atgcccacgc ctttgctagc 900
ggcactgacg aagcactggg gctcttcaaa atggtattct ggctgtgcca agaaatgggt 960
gtgggcaaag aagctgtgga tgggagattc tcaaagccgt ttgcgtttga caagcagagc 1020
gatgcgacga tgaccagatg gtggcccctc cctgctcctt ggttctccag aacagggcgt 1080
gcggcagagg gagggcagga aggcagcagg agctgcctgc aaaggcacaa ggcagggggg 1140
cgaaacgaaa gcgagtggag ccaactgtgc aagcaagcag gctgcacctg gactcctccg 1200
atcatgaggc ctgtgccgag gcagaggtgg gaggtcacag ccaggggagc agctcccagg 1260
ggactttgtt ccacacagct gatgagaaga gcagccgagg cgaaggtgaa gaaggcgccg 1320
atgcgtccag ggtggccaca aggaatggac gcacatgtgc agccacaggt ggaggccaaa 1380
caggggggaa ggtgcaggcc aagagtttaa gagcaagcaa gagcaaacct ggcgcgaaag 1440
atggagttgg tgttgcgtcc cctaaatctg caaagagcaa taagatggtg agcagagctg 1500
aggccgaggc caagaacacg gcatggccag ctgcggcacc catcccgaaa gctggggagt 1560
tggaagcaat cttgcaagtc aggctgtgcg agaagggcgc ccggctacct aaggactcca 1620
acgtgggggc tgcacagctc attagagaga tacggccgga agaaatgcgc ctggaattca 1680
aggtgaggtg gtcgccagct gcgaagaagt atggggacag caggggggaa agctggctac 1740
ctcgcagtgc gcttggcgcc taccaagaac agctcaagag cttctgcctc aagctccgaa 1800
ggtgctccgt ggtgcctttc ccgggggagg tcaacctcat ctgcggaggg cccccctgcc 1860
agggagttag tgggaacaac cggcatgcca agatgcggga catcctgcaa gacgtcagga 1920
atcgccagct gctggtgttt ctggactttg tgaagtggtt caaaccgaac tttgtcctca 1980
tggagaatgt gcaggacatc atgaagaagg aggagggcaa gtatgtcaag tatgctatgg 2040
ggcacacact gcagatgggg taccagatcc gtctggggct gctggctgcg ggcgactttg 2100
gcgtgtccca gggcaggtgg aggtgcttca tgtggggggc tctgaagaat gaggagcagc 2160
tgccggcatt ccccgaggca acgcacaact gccgaaactt caagaccggc gtgtgcacgc 2220
tgggcaagga ctgccaggga ggcttcctgt ctgacgagaa cagcctcgag gcccaccccc 2280
cggttctgtt gggggacgtg atggccgacc tcccagaggt gacaaacggc gagctgcggg 2340
agaggctgag ctacccctgc gaccccaaat atgtgcagca gatgtggtac aggcgtctgc 2400
ctcagccttg gcagacttcc atagaggagc gtattgcctt cagatcggag gttctggaga 2460
agcagcagct gaaattcaac agggaactgc tggaaagtgt gaaaacagac gaagatgtca 2520
cacagctggg cctgcgctcc ctgaacacca agaaccccct aaaaggggcg gagcagaaca 2580
acaagccaaa gctgcggcaa gacggcaccc aagcaggtaa tcaccccttt gagacgatca 2640
ccgctgcgct gcgcatgctg agcaacccca gggaggccga gatcctgaag ctggagatgg 2700
aggctggcag gctgtgcttt gcacacgagc gggggatgca gatctacaag gagttacagg 2760
agtacctgaa ggagtctgag cgtggcctgg ggtctggcca ggttctgtgt gaccaccgac 2820
cactcattct caatgatgac gactacctcc gcatcacggt ggtgcctaaa cggaccaggt 2880
atgaggagga ggaggaccgg ctgtgcaact tcagagcgct cgagggagtc gtgaacaacg 2940
cagatggcac gtgctgctat gggagtcagc atgcggagag gaggaaagac ggcacatctg 3000
ggtgcaaggg agggggcacg tataccattg acaagcggag caatgcccac gtcacccgca 3060
tcgaccagga ggacaagaat gggtggaggg gtgtggcgct acaagggtgc caggcgtacg 3120
tgaagcactt gcccacgatg gagccggagc tgcctcggtg gtgcgtcacc ttcaagcgcg 3180
gcaagtcaga cgggcggcat ggcggctttg gccgtgtgca cttctcgcag atcatcacca 3240
cggtgatagg acgggcagag ccgcacaact tgaagctggc ccaccccacg caagacaggg 3300
tgatgaccat cagggagaac gcacgttgcc agggcttccc tgattaccac gtattctgtg 3360
cggacctctc ccgtggcggc cgcaatcgct gggtccgcaa ctccaccctc acacagcgct 3420
atcagatgat cgggaacgcg gtttgcccgg aggtggcatc tgcacttggc cgctgcctgg 3480
ctcttgctgc cactggggag agcccccccg gggaatgcta catccaggtc cccaaccctg 3540
cgtacctcca ggttgtgaag gcggccaggg agaaggggct ggagtacttc tttgaggagt 3600
atgtgaggga gcacccaagg ggatatcaca gtatttcgct ggaggcaagg ctgtgcgcgg 3660
cggctgaggg gtatattccg cagggaggga gtagtggaac gggtgctgtc gatgatgaag 3720
atgaggtaga cgatgacagt cagggagaag agggtgattg a 3761
<210> 3
<211> 1717
<212> PRT
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 甲基转移酶,蛋白_EMRE3EUKT590754甲基转移酶
<400> 3
Met Pro Ala Asn Lys Gly Lys Ala Tyr Val Glu Val Gly Lys Asp Gly
1 5 10 15
Thr Leu Pro Ala Leu Met Ala Gly Lys Gln Gly Lys Arg Glu Ala Ser
20 25 30
Glu Lys Leu Pro Ala Lys Glu Pro Ala Lys Lys Ala Lys Lys Glu Gln
35 40 45
Pro Ala Lys Glu Ala Asp Gly Glu Val Lys Val Ala Lys Asp Thr Ala
50 55 60
Val Lys Glu Glu Ala Thr Val Val Gly Ser Gly Arg Val Ala Ala Gln
65 70 75 80
Lys Leu Ser Leu Lys Glu Ala Ala Val Lys Val Ser Asn Lys Ala Asp
85 90 95
Lys Ile Ile Ile Lys Glu Glu Val Lys Cys Gly Gly Glu Arg Glu Ala
100 105 110
Leu Glu Ala Thr Ala Gly Thr Thr Pro Ala Asp Tyr Gln Arg Arg Leu
115 120 125
Gly Asp Phe Ser Val Val Asp Asn Glu Gly Lys Ala Glu Pro Ile Asp
130 135 140
Ser Val Gly Leu Gly Ser Lys Asp Leu Phe Ile Ser Gly Val Val Tyr
145 150 155 160
Pro Arg Glu Gly Glu Ala Asn Lys Gln Ser Gly Arg Arg Val Glu Arg
165 170 175
Val Gly Pro Leu Arg Gly Phe Phe Leu Asp Leu Ala Gly Lys Thr Ala
180 185 190
Gln Leu Ile Leu Glu Thr Gln Leu Ala Lys Tyr Val Cys Leu Arg Pro
195 200 205
Ala Pro Thr Tyr Lys Lys Leu His Ala His Leu Ala Glu Gln Ala Asp
210 215 220
Ile Cys Cys Glu Val Phe His Ala Leu Ser Val Gln Asn Gly Gly Ser
225 230 235 240
Pro Gln Thr Ser Leu Glu Glu Val Val Ala Arg Leu Ala Arg Thr Lys
245 250 255
Leu Ser Arg Gly Tyr Pro Ser Ala Arg Glu Ala Val Leu Leu Asn Gly
260 265 270
Lys Phe Leu Ile Ala Gln Leu Gly Lys Gln Met Gly His Lys Gly Phe
275 280 285
Cys Tyr Ala Asp Thr Glu Phe Cys Lys Thr Leu Ala Glu Glu Met Lys
290 295 300
Ser Phe Lys Tyr Val Gly Ser Gln Lys Gln Asn Thr Gly Ile Val Ile
305 310 315 320
Arg Asp Ala Gln Pro Ala Lys Thr Ala Val Ala Ser Glu Ala Asp Ala
325 330 335
Gln Leu Ala Ala Asp Glu Glu Phe Ala Arg Gln Met Gln Ala Lys Glu
340 345 350
Asp Ala Arg Ala Arg Gly Pro Arg Leu Ala Ala Val Pro Lys Gly Ala
355 360 365
Lys Gly Ala Gln Ala Tyr Ile Lys Val Ser Glu Ala Glu Ile Ala Asp
370 375 380
Asp Tyr Pro Ala Pro Thr Pro Tyr Thr Lys Glu Glu Glu Glu Met Asp
385 390 395 400
Glu Leu Leu Leu Phe Asp Glu Glu Leu Met Asp Val Asp Pro Glu Phe
405 410 415
Leu Pro Arg Arg Leu Leu Thr Asp Phe Thr Ile Tyr Asn Ala Glu Gly
420 425 430
Phe Asn Ala Ser Leu Glu Leu Leu Pro Met Trp Ala Gly Leu Asp Ser
435 440 445
Asp Val Glu Leu Tyr Ala Ser Gly Val Val Val Asp Asp Asp Gly Glu
450 455 460
Trp Ala Gly Gly Gln Ala Leu Glu Glu Ala Pro Ala Pro Pro Pro Gly
465 470 475 480
Ala Gly Gly Ser Gly Ser Ser Gly Ala Gly Gly Ser Gly Ala Gly Ser
485 490 495
Ser Ser Ala Thr Ala Gly Gly Ser Ser Ala Glu Ala Ala Pro Glu Gln
500 505 510
Gly Gly Met Arg Met Tyr Leu Ser Gln Ile Arg Glu Trp Ile Val Glu
515 520 525
Cys Ser Cys Asp Gln Leu Phe Ile Ser Ile Arg Thr Asp Val Ala Trp
530 535 540
Tyr Arg Leu Ser Thr Pro Ala Glu Lys Tyr Lys Pro Trp Phe Gly Thr
545 550 555 560
Val Leu Lys Cys Ala Arg Val Ala Val Lys Val Leu Gly Met Leu Ser
565 570 575
Ala Glu Ala Arg Ala Ser Arg Leu Ser Phe Asn Asp Val Ile Lys Arg
580 585 590
Leu Ala Glu Leu Glu Glu Gly Thr Pro Thr Phe Ile Ser Ala Lys Leu
595 600 605
Pro Ala Val Gln Arg Phe Val Val Val His Gly Gln Ile Ile Leu Asn
610 615 620
Gln Phe Gln Asn Tyr Pro Ser Asp Ala Val Arg Arg Ser Ala Phe Val
625 630 635 640
Ser Gly Leu Lys Glu His Met Gln Met Val Arg His Ser Lys Leu Tyr
645 650 655
Lys Ser Ser Ala Lys Val Val Val Arg Arg Ala Val Asn Arg Asn Pro
660 665 670
Met Lys Asp Arg Ala Ala Gly Arg Lys Ser Lys Pro Met Thr Ala Thr
675 680 685
Ala Thr Ser Met Val Lys Ser Ile Trp Gln Ser Tyr Phe Asn Val Gly
690 695 700
Glu Ala Gln Ala Ala Ala Ala Glu Asp Ala Pro Ala Ala Lys Glu Val
705 710 715 720
Glu Glu Asp Glu Asn Glu Glu Glu Asn Glu Glu Glu Val Gln Glu Asp
725 730 735
Ala Leu Ala His Ala Ala Ser Pro Ala Pro Ala Lys Lys Ala Val Gly
740 745 750
Lys Lys Gly Ala Ala Lys Lys Glu Gly Gly Ser Ala Lys Val Ala Trp
755 760 765
Val Gly Gly Val Glu Lys Thr Val Glu Gly Asp Lys Phe Tyr Ala Lys
770 775 780
Ala Lys Val Gly Asp Leu Gln Val Ser Leu Gly Ala Val Val Ala Met
785 790 795 800
Gln Pro Glu Gly Asp Glu Glu Glu Gly Glu Gly Glu Glu Gly Gly Gln
805 810 815
Glu Ala Pro Leu Gly Leu Val Gln Ala Met Trp Gln Ser Lys Lys Gly
820 825 830
Glu Lys Gln Val Gln Val Arg Val Met Val Arg Gly Cys Glu Thr Val
835 840 845
Leu Gly Asp Ala Ala Ser Glu Gly Glu Leu Phe Leu Thr Thr Arg Leu
850 855 860
Glu Thr Arg Ala Leu Gly Gly Val Met Gly Val Ile Asn Ala Arg Gln
865 870 875 880
Leu Thr Arg Gly Thr Glu Ala Thr Met Arg Leu His Tyr Ala Lys Glu
885 890 895
Asp Ala Glu Leu Arg Gln Arg Asn Gln Glu Ala Ala Met Glu Gly Gln
900 905 910
Pro Leu Glu Phe Ile Trp Arg Arg Gln Tyr Val Pro Glu Gln Gly Met
915 920 925
Phe Arg Asp Pro Gln Arg Asp Leu Gln Leu Gly Thr Arg Leu Gln Glu
930 935 940
Glu Ala Gly Ala Gln Lys Gly Val Gln Ala Leu Glu Gly Gly Lys Gly
945 950 955 960
Phe Thr Lys Asp Gly Val Glu Tyr Arg Glu Gly Asp Phe Leu Tyr Val
965 970 975
Ser Pro Gly Val Phe Asp Arg Val Glu Ala Asp Glu Glu Arg Glu Leu
980 985 990
Pro Glu Tyr Leu Ala Asn Ser Arg Phe His Lys Gly Ser His Asp Gly
995 1000 1005
Leu Arg Ala Trp Gly Ile Gly Gln Leu Val Arg Leu Gly Ala Ala
1010 1015 1020
Gly Lys Lys Gly Gly Asp Lys Val Ser Asn Leu Thr Leu Arg Arg
1025 1030 1035
Phe Tyr Arg Pro Glu Asp Val Ser Arg Asp Gln Ala Tyr Arg Ala
1040 1045 1050
Ala Ser Phe His Glu Val Tyr Ala Ser Glu Glu Gln Val Thr Val
1055 1060 1065
Gly Val Glu Asp Val Val Gly Arg Cys Thr Val Val Pro Glu Gly
1070 1075 1080
Arg Pro Ala Gly Gly Asn Thr Phe Val Cys Thr Ala Ser Phe Ser
1085 1090 1095
Arg Lys Gly Lys Lys Phe Gly Pro Ala Pro Lys Ile Glu Ala Pro
1100 1105 1110
Ala Glu Ala Ser Leu Leu Ala Pro Ala Thr Ala Pro Ala Gly Asp
1115 1120 1125
Lys Gly Lys Gly Lys Gly Lys Ala Val Met Ala Val Asp Ser Gly
1130 1135 1140
Lys Ala Ala Pro Ala Leu Lys Lys Phe Ala Gly Asp Asp Gly Ile
1145 1150 1155
Ala Leu Ala Thr Met Asp Ile Phe Ala Gly Cys Gly Gly Leu Ser
1160 1165 1170
Glu Gly Met His Gln Ala Gly Ala Ala Phe Thr Lys Trp Ala Ile
1175 1180 1185
Glu Tyr Glu His Pro Ala Ala Glu Ala Phe Lys Leu Asn Asn Pro
1190 1195 1200
Asp Ala Ala Val Phe Cys Asn Asn Cys Asn Val Leu Leu His Ala
1205 1210 1215
Ala Met Thr Lys Ala Gly Leu Gly Asn Asp Cys Met Ala Ser Pro
1220 1225 1230
Glu Ala Glu Glu Glu Ser Arg Gln Leu Pro Ala Glu Gln Tyr Gly
1235 1240 1245
Asn Leu Pro Ala Pro Gly Glu Val Asp Phe Ile Cys Gly Gly Pro
1250 1255 1260
Pro Cys Gln Gly Tyr Ser Gly Met Asn Arg Phe Asn Lys Gly Asn
1265 1270 1275
Trp Ser Met Val Gln His Gly Arg Ala Ala Gln Cys Ala Ala Val
1280 1285 1290
Leu Gln Cys Ile Leu Lys Ser Gly Thr Val Val Arg Gly Gly Asp
1295 1300 1305
Trp Val Pro Ala Pro Ala Cys Phe Ser Ile Leu Thr Pro Phe Val
1310 1315 1320
Ser Pro Ser Thr Leu Ser Cys Ser Arg Phe Ile Cys Arg Pro Pro
1325 1330 1335
Pro Cys His Val Gln Asn Ser Met Val Met Ala Phe Leu Ser Tyr
1340 1345 1350
Cys Asp Phe Tyr Arg Pro Arg Tyr Phe Leu Leu Glu Asn Val Arg
1355 1360 1365
Asn Phe Val Ser His Asn Lys Ser Phe Thr Phe Arg Leu Thr Leu
1370 1375 1380
Arg Ser Leu Leu Asp Met Gly Tyr Gln Val Arg Phe Gly Val Leu
1385 1390 1395
Asn Ala Gly Asn Phe Gly Val Ala Gln Ser Arg Lys Arg Thr Phe
1400 1405 1410
Ile Trp Ala Ala Ala Pro Gly Glu Leu Leu Pro Asp Trp Pro Gln
1415 1420 1425
Leu Met His Cys Phe Arg Thr Pro Gln Leu Thr Ile Asn Leu Pro
1430 1435 1440
Gly Gly Val Gln Tyr Thr Ala Val Pro Gln Thr Val Gly Ala Pro
1445 1450 1455
Leu Arg Pro Val Thr Val Arg Asp Thr Ile Gly Asp Leu Pro Pro
1460 1465 1470
Ile Gln Asn Gly His Asp Gln Glu Glu Met Asp Tyr Pro Ser Ala
1475 1480 1485
Pro Val Ser Ala Phe Gln Arg Phe Ile Arg Gly Asp Cys Gln Lys
1490 1495 1500
Leu Thr Glu His Ile Cys Lys Thr Met Asn Asp Leu Asn Leu Glu
1505 1510 1515
Arg Cys Arg Cys Ile Pro Lys Asn Val Pro Gly Ala Asp Trp Arg
1520 1525 1530
Val Leu Glu Glu Ile Val Arg Lys Asp Pro Thr Arg Glu Lys Phe
1535 1540 1545
Asn Val Ser Pro Pro Ala Val Pro Val Leu Cys Met Leu Gly Gly
1550 1555 1560
Leu Asp Pro Ala His Gly Gly Gln Gly Cys Thr Cys Val Gly Leu
1565 1570 1575
His Pro Pro Gln Arg Gly Pro Pro Phe Met Cys Arg Ser Leu Gln
1580 1585 1590
Gly Gln Pro Leu Val Pro Trp Cys Leu Pro Asn Thr Ala Asp Arg
1595 1600 1605
His Asn Gly Trp Arg Gly Leu Phe Gly Arg Leu Asp Leu Asn Gly
1610 1615 1620
His Phe Pro Thr Ser Thr Thr Asp Pro Gln Pro Met Gly Lys Val
1625 1630 1635
Gly Gln Val Phe His Pro Glu Gln Asp Arg Ile Val Ser Val Arg
1640 1645 1650
Glu Cys Ala Arg Ala Gln Gly Phe Pro Asp Arg Phe Arg Phe Tyr
1655 1660 1665
Gly Asn Val His Ser Lys His Arg Gln Val Gly Asn Ala Val Pro
1670 1675 1680
Pro Pro Leu Ala Ala Ala Leu Gly Arg Gln Leu Arg Lys Ala Leu
1685 1690 1695
Glu Leu Lys Ala Ser Glu Glu Ala Lys Glu Arg Ile Gln Ala His
1700 1705 1710
Leu Lys Gly Leu
1715
<210> 4
<211> 5839
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT590754,SEQ ID 3的甲基转移酶的cDNA
<400> 4
ggggtggagg acgtggtggg caggtgcacg gtggtgccgg agggacgccc cgcaggtgag 60
gggggggcaa atgggggggc ggcagaggcc tgctgcataa tagggacggg gggagaaggg 120
gtgagtagga ggagggccgg atgcctgtgg tacgcatgtg atgctggggg cctggcaggt 180
tggggtcaac tgtggtggat cgcctgcgca atggggttgc tacaccacat caggagcacg 240
tgtcaggggg gtgcggtcag aggctagcgc cggcaaatgc tccccccttt ggcctgtctg 300
ttgagtgcgc agggggcaac acgtttgtgt gcaccgccag cttcagccgc aagggcaaga 360
agtttgggcc cgcacccaag atcgaggcac cggcagaggc gtccctcctc gccccggcta 420
ctgctcccgc tggcgacaag ggtgcgctgc catcacgagg accgctttga gagggttgat 480
gtggggcaga aacgggggag tttgaggggc acatggggcg cagctgagtg gacgttggat 540
tgatggggtg atggatgggt tgtgagccgt cgccagacga gctgcagctc acggaaaggt 600
gtttagagct tgcggggtgc agggcgcctg ctgggaaaag aggggggggt ccacccctgg 660
ccagccttac acagccctca cctcgacctc cccctccctg gtcacgcatg cgcaggcaag 720
ggcaagggca aggcagtcat ggcggtggac agcggcaagg ctgcccctgc actcaagaag 780
tgagccggca tcattctccc tcccccctcc ctctcttccc ctccccctct ccatcctgct 840
gctgccctct ccgcctgccc ggttgatttc cgttccgcgc gcagcgtgcg cccagtgctg 900
ctccctgttt acagccacct ctgcacgcct cttctgtagt cacactcaca tgtggctgtg 960
gtggggagcg cagtcctcca cctctccttc ctttctgcaa aatctctttt ttgacccatc 1020
tgttgcccac tagttgcata cctccctggc agagtcgtgc tcgatcactc ccgggtgcat 1080
ctgctgaaat tgcatgctga ccaagcccaa acgccggtgg tgcaggtttg ctggcgatga 1140
tggcatcgcc ctggccacca tggacatctt tgccgggtgc ggggggctgt cggagggcat 1200
gcaccaggct ggtgagtcac ccctccaccc gtgccggccc ccccgccccc ccctctacac 1260
cctgtctatc tgtactcatt gctgtgcccc atagcaattg ctgtttcgat actgccaaaa 1320
cccaaattcg taaatttgct gccgaccgtg gctctgccgt gccgatcccg gttgctgtgc 1380
ccgtcacgct gtgctctgct gcactgcgct ccaggtgccg ccttcaccaa gtgggccatc 1440
gagtacgagc accccgcggc agaggcgttc aagctcaaca acccggacgc cgctgtgttc 1500
tgcaacaact gcaacgtgct gctgcacgcc gccatgacca aggcggggct gggcaacgac 1560
tgcatggcgt caccagaggt gagctgccga gtggggaggg aagggatgag aatccaggat 1620
tcaacccctg tggggagcag aggggggagg aggctaggtg atgttgtggc agacgcgcta 1680
cagagtagct ggggggaggg ggcttgtgga tggcacggca gtacacggcg gagggtggcg 1740
gggcagtggc cccatgggtt gctggctgcg tctgcaggga gggctgggac catggggggg 1800
tgtctttgac tatccaccac gtggcagcag gcttcatgat gggctgctgg gtggtgcccc 1860
acctacagtg agccctggag gtgcgtggct ctctcaggcc gcgggcacgc acacacacgc 1920
acgcacacac ttgtgcttcc ggtttcaggc ggaggaggag agcaggcagc tgccagccga 1980
gcagtacggc aacctgccgg cccccggaga ggtggacttc atctgcggcg gccccccctg 2040
ccagggctac tcggggatga accgattcaa caagggcaac tggtcaatgg tgcaggtaag 2100
ggcggggggg ggatggagag gtggtggggc gcagctcttg gcgcaggggc ttctgctcct 2160
gcagcatggc agggcggcgc agtgtgcagc agtgctccag tgtattttga aaagtggcac 2220
agtggtcagg ggaggggact gggtccctgc accagcttgc ttttccatac tgacaccctt 2280
tgtgtcccca tccacgctct cctgctcacg ttttatttgt cggcctcccc cctgtcatgt 2340
gcagaactcc atggtgatgg ccttcctgtc ctactgcgac ttctaccgcc cccgctactt 2400
tctgctggag aacgtgcgca actttgtgtc gcacaacaag tcgttcacct tccgcctcac 2460
gctgcgctcg ctgctggaca tggggtacca ggtgtgtgtg tggtgtcagt gggaagattg 2520
caggggttgg aggggcgggg ggcgaccaga cgcgcttgga gccgtgcaag agcgtggcaa 2580
tgtgcgctgt ccccccctgt gggaggggct gcctgcctgt gcttcgtgtg agcaccccct 2640
ggtgcgcttc atcgaaagat gggagtgtgt gaggaagggg tgtgtgtaaa tgctggtgtg 2700
gagaaggagg ggtgcggtga gggcgtggcc ctgcatgtct ctttacttct atggtgcacc 2760
ctttcttcct ccccggccta cgcatgtcct accaccccct gcacccgccc gcccttcgtt 2820
tcttgtgtac ccatccatgg aggcccagca cacgcctcgc acactcccct aggtgacctt 2880
gttacaacct cctcccctcc ccactccgcc cccaggtggt tttttttttt gcaagatatt 2940
ttcatttatt tatttattta ccctaaacaa ccctcgcaca gcatgcgtgg ctcaattccc 3000
tccccctccc cttgcaggtc cgctttggtg tactgaacgc cggcaacttt ggcgtggccc 3060
agtcccgcaa gcgtaccttc atctgggccg cagcccccgg ggagctgctg ccggactggc 3120
cccagctgat gcactgcttc cgcacccccc agctcaccat caacctgcct ggaggtgggt 3180
gggtgggtgg gtgggtgggc ccgggtgtgt gtgccaaccc gtgtgttgag gagggagggg 3240
ggggggggtc atgtggcttt ggagagatgg gtgggagatg cagacgtggg gggggggggg 3300
gggggatcca atcccctctc ccctcccccc tttccccccc cgctgatatg cctgacagca 3360
agggagtttg aggggtgggc gcatgtccat ggcgccgatg ctggagtacc cgatgctatt 3420
tggccccagg aggcaagtgg cagctgccgg agctgttgca gcgagtgctg agcatgccgc 3480
ctcctgctcg gtatagtgtg tgcggcatga cagaggggtc caggaggtgg gaggcaatcg 3540
agtgccccct gtgcgttgct gcctgcaggc gtgcagtaca ccgccgtacc gcagacggtg 3600
ggtgcaccgc tgcgccccgt caccgtgcgc gacaccattg gcgacctgcc ccccatccag 3660
aacgggcacg accaggagga aatggactat cccagcgcgc cggtgggtca gcccacacct 3720
gtacctgcac ctctgcctgc acagtgccct ctttgcatcc atcatgagcc ggtgcctatc 3780
cagctcaggc tgccaaaccc agcgtggctc ccctagtctg tagcctcctg gtcttgcctc 3840
gaaaccatcg gcacagccac catcaatgtc tgccttctcc cccccccctc acccctccaa 3900
cccccccctt gctggctgct gcaggtgtcg gccttccagc ggttcatccg tggcgactgc 3960
cagaagctga cggagcacat ctgcaagacc atgaacgacc tcaacctgga gaggtgcagg 4020
tgagcggggc ggggtgggag tgggggggag aggagggagg gtccgggggg tgggcagagg 4080
ttggaacact caaggttggc atggtggcag ttgccatgtg gcaggtgcaa gccgacgcag 4140
tgcatgtcca ggagtatgtc agtgggtgtc ttcttggccg tgcaaatatt attcagtgtt 4200
gtaggtgcag ttgccagtgc agctgcatca ggcagcagcc atagtggggg aacggtgcag 4260
gggccagcag tggtccaaga gctgggtgtg agcccgcagg tgcatcccca agaatgtccc 4320
cggcgcagac tggcgcgtgc tggaggagat tgtgcggaag gaccccaccc gcgagaagtt 4380
caacgtgagc ccccccgcgg tacctgtgct ctgcatgctg ggtggtttgg acccagcgca 4440
tggtgggcag ggctgcacgt gcgtgggacg tgatgcgctt gggccaccgc tgcacgtcct 4500
cggtctcgct gcgtgctgca aatcatactc aaatcgtgca gttttggctg cacatggcgt 4560
tttgtaaggg tttcggggtg ttttcaacct ttccttgggt gtgcagtgca tccgccccag 4620
cggggcccac ccttcatgtg ccggtccctg cagggtcagc ccctggtgcc ttggtgcctg 4680
cccaacaccg ctgacaggca caacggctgg cgcggcctgt ttgggcgcct ggacctgaac 4740
gggcacttcc ccacctccac caccgacccc cagcccatgg gcaaggtgag ggggagaggg 4800
gcacagaacg ggggggttcc gggggaggct caaagtctat ggagggtgta ggtgtcaaag 4860
ctgaaccctg gctgaggaga cggaggaggg ggggtggagg agtgcgtgtt caacctggcg 4920
cagtggtaca gctcctgttg tgtgtaccgt gctggggcct gcatgcggcc tcccccaggc 4980
aacagctggg aacgttgcct ggcaccaaag ggcgccactg gaagacggag aggtgcagct 5040
cttgagaggt gcgcagctgt cgtttgccgt gcggatgcgg aggcatgggc gcgcgcgtgg 5100
caacacaggg aacaaagtgg aaggtgtgtc caccacccct cctgcaggtg gggcaggtgt 5160
tccaccccga gcaagatcgc atcgtgtctg tgcgggagtg cgcccgcgca caggtgagac 5220
cagcagcagg cacagcaccg gcggtgccac accatccaca ggccggtgcc ctgggaccac 5280
gctcaattgc tcagcagtgt gcgtgtgtgt gtgtgtgtgt ttgtagggga ggtcgcaggc 5340
cccaccccat ggtcccattc cctggggacg ctcatgcggt cacactcaca gtggcccgca 5400
cacccagtgc tcacctgctg ctggtgctgt ggctgcaggg cttccccgac cgcttccgct 5460
tctacggcaa cgtgcacagc aagcacaggc aggtcggcaa cgcggtgccg ccgcccctgg 5520
ctgccgcgct gggcaggcag ctgcgcaagg tgagtccgcg cagcgcgcac agcacggagg 5580
caagctccac acagtgactg ccgcgcgcga gcgtgtggta cgtgcactgc atgggccgcg 5640
cacggcaagg ccggggttgg tggtgccaat gcatttttgg ttggcggcaa ttgtttcgct 5700
cctgctggtg cttcagtcgc ttttgcggtg cgccgcaaac ataaaggtgc cttctggtgg 5760
gggcgcgctg caggccttgg agctgaaggc ctcggaggag gccaaggaga ggatccaggc 5820
gcatctgaag gggttgtag 5839
<210> 5
<211> 258
<212> PRT
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT596408甲基转移酶
<400> 5
Met Gln Val Ala Gly Gly Glu Gly Gly Gly Gly Ala Ser Ala Arg Gly
1 5 10 15
Leu Leu Glu Ala Arg Arg Glu Arg Ala Ala Ala Gly Val Pro Leu Lys
20 25 30
Trp Arg Ser His Val Lys Val Pro Arg His Ala Pro Leu Pro Arg Leu
35 40 45
Thr Val Arg Asp Val Ile Gly Asp Leu Pro Glu Glu Val Gly Pro Gly
50 55 60
Leu Val Pro Tyr Ala Arg Asp Pro Pro Ser Phe Phe Ala Arg Ser Met
65 70 75 80
Arg Ser Ala Gly Ser Glu Gln Gly Val Ser Asn His Gln Ile Trp Gly
85 90 95
Leu Ser Ala Glu Asn Arg Gln Arg Cys Ala Ala Val Pro Leu Gly Gly
100 105 110
Asp Pro His Tyr Pro Gly Cys Ala Ser Trp Glu Gly Ala Ser Gly Val
115 120 125
Thr Glu Asn Pro Phe Val Pro Ala Arg Ala Gly Asp Trp Arg Asp Leu
130 135 140
Pro Pro Glu Leu Gln Pro Ala Gly Met Gln Gln Gln Leu Ala Arg Asp
145 150 155 160
Gly Lys Asp Phe Ala Gly Val Tyr Gly Arg Leu Ile Trp Gly Gly Gln
165 170 175
Phe Ser Thr Leu Leu Thr Asn Pro Asn Leu Asn Ser Asp Thr Thr Met
180 185 190
Cys Phe Ile His Pro Ser Ala Pro Arg Pro Leu Ser Cys Ser Glu Ala
195 200 205
Ala Arg Val Gln Gly Thr Pro Asp His Val Glu Phe Lys Gly Thr Ile
210 215 220
Ala Glu Val Tyr Arg Gln Ile Gly Asn Ser Val Pro Val Pro Leu Gly
225 230 235 240
Ala Ala Leu Gly Arg Glu Leu Ile Met Ala Leu Lys Gln His Ala Arg
245 250 255
Val Thr
<210> 6
<211> 777
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT596408, SEQ ID 5的cDNA
<400> 6
atgcaggttg ctgggggtga gggcgggggt ggggcttctg caagagggct gctggaggcc 60
aggcgggaga gggcagccgc gggtgtcccc ctcaaatggc gcagccacgt caaggtgccc 120
cgccatgcgc ccctcccccg cctgacagtg cgggacgtga ttggagacct gccggaggag 180
gtgggcccag gcctggtgcc ctacgccagg gatcccccga gcttctttgc tcgcagcatg 240
cgcagcgcgg gatctgagca aggcgtgtcc aaccaccaga tctgggggct cagcgccgag 300
aatcggcagc ggtgtgcggc ggtgccactg gggggagacc cccactaccc gggctgtgcc 360
tcctgggagg gggccagcgg ggtgacagaa aaccccttcg tccctgccag ggcgggagac 420
tggagggatc ttcccccaga gctgcagcct gccggcatgc agcagcagct ggcccgggac 480
ggcaaggatt ttgcaggcgt gtatggccgg ctgatctggg gagggcagtt ctccacgctg 540
ctgaccaacc caaacctgaa cagcgacacg accatgtgct tcatccaccc ttctgcaccg 600
cgcccgctca gctgcagtga ggcagccaga gttcagggta cacctgatca cgtggagttc 660
aaaggcacga ttgcagaggt gtatagacaa atagggaatt ctgtaccggt gccactgggg 720
gccgcgttag gaagggagct gattatggca ctgaagcaac atgcaagagt cacgtga 777
<210> 7
<211> 376
<212> PRT
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT596208甲基转移酶
<400> 7
Met Gln Gly Val Glu Leu Ile Arg Glu Leu Gln Pro Glu Tyr Ile Thr
1 5 10 15
Leu Glu Glu Val Pro Gln Phe Met Phe Val Arg Leu Pro Ala Gln Arg
20 25 30
Ile Ala Ser Gly Cys Ala Arg Gln Leu Gln Gly Pro Ala His Gly Ser
35 40 45
Leu Glu Asp Cys Lys Ser Leu Leu Val Arg Pro Trp Leu Trp Val Val
50 55 60
Pro Gln Leu Leu Met Met Gly Tyr Gln Val Asp Val Arg Ile Leu Asn
65 70 75 80
Ser Ala Arg Tyr Gly Thr Pro Gln Asp Arg Lys Val Thr Pro Arg Ser
85 90 95
Thr Ser Arg Thr Asp Leu Cys Cys Lys Val Arg Lys Asp Ala Ser Gln
100 105 110
Ala Ser Ser Thr Ser Val Ser Gln Gln Ile Arg Arg Asp Gln Leu Tyr
115 120 125
Glu Gln Arg Phe Arg Val Ile Asp His Ala Gln Arg Val Trp Ala Gly
130 135 140
Ile Ser Leu Gln Ile Glu Gly Leu Gln Leu Pro Pro Ala Val Thr Met
145 150 155 160
Trp Glu Ala Ile Gly Asp Leu Pro Pro Leu Ile Lys Ser Asp Pro Cys
165 170 175
Ser Thr Leu Ser Val Leu Ser Leu Pro Ala Trp Gln Pro Gln His Cys
180 185 190
Ala Lys Lys Glu Ala Ala Gly Asp Val Gln Gln Pro Ala Leu Gly Arg
195 200 205
Ser Pro Leu Gln Tyr Arg Pro His Ala Arg Leu Ser Ser Phe Val Gln
210 215 220
Tyr Met Leu Arg Gly Ser Gly Arg Asn Leu Leu His His Gln Thr Arg
225 230 235 240
Lys Trp Lys Gly Arg Val Ser Gln Ser Arg Lys Asp Arg Ala Phe Pro
245 250 255
Thr Ile Cys Thr Val Tyr Asn Pro Ile Val Arg Asp Gly Thr His Pro
260 265 270
Val Glu Pro Arg Leu Phe Ser Leu Ala Glu Arg Lys Arg Ala Gln Gly
275 280 285
Ile Pro Asp Cys Val Gln Trp Ala Gly Ser Leu Ser Asn Gln Glu Arg
290 295 300
Gln Val Gly Asn Ala Val Ala Trp Pro Met Ala Arg Ala Val Ala Cys
305 310 315 320
Ala Ile Leu Ser Ala Ala Thr Gly Asn Val Thr Ser Asp Pro Ile Pro
325 330 335
Thr Leu Asn Gly Ala Arg Arg Val Pro Leu Ile Ser His Val Phe Arg
340 345 350
Val Glu Leu Gly Ser Gln Leu Gly Lys Gln Phe Phe Gln Ser Ala Ala
355 360 365
Lys Cys Gly Met Ser Gly His Asn
370 375
<210> 8
<211> 1131
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 蛋白_EMRE3EUKT596208,SEQ ID 7的cDNA
<400> 8
atgcagggcg tggagcttat cagggagctg cagccagagt acatcactct agaggaggtg 60
ccacagttca tgttcgtccg tctgccagct cagaggatcg catcaggttg tgctcggcag 120
ttgcaaggcc cagcacatgg atcattggag gattgcaaaa gcttgttagt gcggccatgg 180
ctgtgggttg taccacagct gctgatgatg ggttaccagg tggacgtcag gatattgaac 240
tctgcccgtt atggaacccc gcaggacagg aaggttactc ctcgttccac atcgcgtact 300
gatctttgct gcaaggtgcg gaaggatgct tcccaagcct ccagcacctc agtatcacag 360
cagatacgga gggatcagct ttatgagcag cgattcagag taattgatca tgctcagaga 420
gtctgggcag gaatatccct gcagatcgag ggcctgcagc tgcccccagc tgtgaccatg 480
tgggaggcca taggggattt accacccctg atcaagtccg acccttgcag tacgctgtct 540
gtcctgtctc tgcctgcttg gcaaccacag cattgtgcca agaaggaggc agcaggagat 600
gtgcagcagc cggcgcttgg gaggagcccc ttgcaatacc gtccacatgc caggctgagc 660
agctttgtgc aatacatgct acggggctca gggcgcaatc tgctgcacca ccagacacgc 720
aagtggaagg ggcgtgtttc gcagtcgagg aaggacaggg ccttccccac gatctgcaca 780
gtatacaatc ctatagtcag agacggcaca catcctgttg agccaaggtt gttttcatta 840
gctgagcgca agcgtgcaca aggaatacca gactgtgtgc agtgggctgg cagtctctca 900
aatcaggagc gacaagttgg caatgctgta gcatggccca tggcgagggc tgtggcatgt 960
gctattctca gtgcagctac aggcaatgtc acaagtgatc cgataccaac tctaaacgga 1020
gctaggcgtg taccactaat cagccatgtt tttcgagtcg agcttggcag ccagctggga 1080
aagcagtttt tccaaagtgc agctaaatgt ggcatgtctg gacacaattg a 1131
<210> 9
<211> 103
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> EMRE3EUKT598198_嵌合_gRNA
<400> 9
gggauucuca aagguguagc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 10
<211> 103
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> RNA_ EMRE3EUKT590754_嵌合_gRNA
<400> 10
gcuagcgaca gccgucuugg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 11
<211> 103
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> RNA_ EMRE3EUKT596408_嵌合_gRNA
<400> 11
cgugauugga gaccugccgg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 12
<211> 103
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> RNA_ EMRE3EUKT596208_嵌合_gRNA
<400> 12
ggaguaaccu uccuguccug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 13
<211> 2667
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> 带有内含子的博来霉素抗性基因,针对拟小球藻进行了密码子优化
<400> 13
atggccaaac tgacatccgc tgttcctgtg ttgacagcaa gagatgttgc aggtgcagtg 60
gagttttgtg agttctgaga agctgattgt tgtttaactt ctttgaaagc tttatcgaag 120
attctgcaag cgatgaacat tgcttgtcaa gaccgagagc tgcatgccca cttgacatcc 180
agctttgaac ggctcttcat gtttgatttg tttctgattg tagggacaga tagactgggg 240
tttagcaggg actttgtgga ggacgatttt gcaggagtgg tgagggatga tgtgacactg 300
tttatctcag cagtgcagga tcaagtgagt gcagcgtcag ctgtggcagt tgttggcttt 360
cgtctcagtc agtagtttgc tgggattgat tatggagggc acagttgcaa ttttgagttg 420
cacgttgcga caagcgtgtt gacaaagcgt ggtcaagccg gccagtcttg ccggtggcgg 480
gtggcttggt ctaacttccg ctctacagca atcgttttgt tcatggttac ggggctggcg 540
tgccagaaag tcctggtcag ccaccctcgc ttcaaagccg tagcccaaca actttgcgaa 600
tatgttcgat ttgcaggtgg tgcccgataa tacactggca tgggtttggg tgagaggtac 660
agctctgcgt gcaacaggtt gcaagatgca gcgcaggtct tccctggtca aacgatgtat 720
gcagagttga gaggcacttg agctgggtga atggcgtggg ctcgtaggta gtgtgcaggg 780
caggaagggc agccaatttt ggagttgtgg tccggtgtcg ttgcttcgag ccttattagg 840
actcttgctc atcaaagcgt tagttgtgaa taagttgatc tgaaaggatg ttatgtacag 900
caagcagcag cagttaagag tctggggagt agctgcacag ggcgaggtgt caagatggga 960
agggtcctgc ctccttatgt gtttttccct gtaggggagg aagcctctta tgggcaatgg 1020
ttgggcatat tttccagcca gcccttcttt ctataggggc cagggtgggc ccagctcgtc 1080
ttggcttcca ccaccaggag agtgagggca ttgaagggcc ataaatagtc ctcccatcta 1140
cgtgcaccag agggtgtcgt ctaggctgtg catgccacga ggggaaggag ccaagaatga 1200
gtgtatgggt tgttttcatg tttaggctgg gataaaactg ttttcaattg cgcctgccgg 1260
gtgaaaacca cagcagcatc agcaagcttg gagaaggcca gcccgcccag cacaggctca 1320
cgttcccact caggcggtca gtcgggcggg ggtgtgagtc aggcaggcga gggtgtctgt 1380
gcctgacatc agcacctctg cttagccact gcagcccctg gagcagggta gggcgtcatt 1440
tgcagcaatc acctgctgcc tcacacgtcg cagcttggaa tttcaacgac catcagcgct 1500
ggggttgttg agggatcata gcagattttg gtgcagcctg gttgtcatgc tctttgtgga 1560
atggcctcta tgttcgagca attcgttgga tgttgaggtg cttggggaca gagagtcgaa 1620
tgatgggcca gggtcaaaca tgcgagcgtt tggctgagtc agcggttttt gctggtcact 1680
ttttcttttg tttcttattt aggtttgatg gatgtgtttt gtgctgctgc cctgaagctg 1740
cagcagcgtg tctgccctgc gctactgcgg gcaccaaggc tatgtgctgg tgcactcggc 1800
tgcgctgcac ctgtgcacct cgcactccgt ccagcctcca tgcagcacac gtactcacgg 1860
tgtcctcctg acctgtcgta cgctattcca aacttgctct tttgctgccg ctgctctcgt 1920
acacaattgc tgttgattat cgatatctaa tcgagcgcct gctgactgaa ctccgcaggt 1980
ttggatgaac tgtatgcaga gtggtctgaa gtggtgagca ccaactttag gtgggtgggc 2040
tctgaaggag gaggagggag cgggtgatta aacagggcct gcatgaagag gagcaggggc 2100
tgcatggaca gcagggggaa ggtgcagaag ggagggtcaa gcggggttca ggtggctgtg 2160
ggtttctgca cgagcagtga aagaagctgt atccttccac ctgctttcac tggcgaaagg 2220
ttgaaaacag gatgtcgcag ctggaaagat gttgcgctgt caagtgcaag ccatggttga 2280
gggtatgcct gtgtgcatgt gcttcttaaa gttactcctg ttctatggtt ctgggtgctt 2340
gttgtttgtg gtgcagggat gcaagcggac ctgcaatgac agagattgga gaacaacctt 2400
ggggaaggga gtttgcattg agagatcctg caggtgaggg ggcatgtaag caatggcagg 2460
caattcaaga acgaatcatt gctgcaaatg ctgggatggt atgcagctga ggtatctatt 2520
gccttgtatt ttgtctcgca ttgcatcggt ggtgcgttct gtggcctgag gcacagttct 2580
tgctgtttga taagggttcg actgagttgt cgtgtgtgct gtgctgcagg caattgcgtg 2640
cactttgttg cagaagaaca ggactga 2667
<210> 14
<211> 531
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> RPS4启动子
<400> 14
ccaccatggg ggaggtttga agtgtgcgcc tgatataatc atacacctaa aagcaccact 60
tgctgattgt gaagggacta tgtcgtttat gacgggacgt tacgctggcc gatggtttga 120
atttggacgc tgtggtagaa tgttatatgg acgtaaaggt tggcatattg aaaatcgtct 180
tcacaggcaa acttctagac gtgtgaccca ccggtaaaac gacaagcgtg gcgcgtcgat 240
tgcgctttga acgtcgtttg ttggactcca gatgaacctc aaaatcaaag cggtgattga 300
cgaaaatcaa atgacagccc gcaaaatttc atcagccttc ggatcggatt ctcagaatct 360
gattgtccct gctggctaca tttatgaaat ttcgtacatt ttggcagaaa tgtcccaata 420
ccatagcact gccgcctgag ctcacccgag caatgcatac tgggtacctc gcccatctcg 480
ccctctttcc aagcccagtg ctgttgtaaa tagccaaagg gctcagtaac a 531
<210> 15
<211> 546
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> RPS4终止子
<400> 15
gcatagcatc agcctgtggc agggttgtgg tagggctgag tggcagggtt aaaggggttg 60
cctaccccac ccctactctc atgacaccag caacagcagc agctcatgca gtactcaaat 120
cactgatgtc aatggtgtga cacatttggt taaggctgct ttttaaagtg ctgctttggg 180
ggcagtgact gtgcagagct tggagcgtat ccccatgtaa tcagaaccga cgagagttcg 240
gggcaacctt tcatcttcac attttttgtg atcagctaca gagtctgaaa tcaaatagag 300
gctgccatct aaacgcagga gtcacaacga aggcgaaaac tccaattgct gtactcaatg 360
cactaagtga ttgttcaatg gataaataca ctatgctcaa ttcatgccag cagagctgct 420
ccttccagcc agctacaatg gctttttcca cgccttttga agtatgaatg ttcagcttgc 480
tgtgcttgat gcatcaccat aaacacaatt ctacaacatt tcatgccaac aacagtacgg 540
gctttc 546
<210> 16
<211> 572
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> ACP1启动子
<400> 16
agtttgcata gttaagtatg ctggctattg cagtacctta tatgcaaaca agtgctcaat 60
ctgtttcatc attgtctgtg ggcaaattgc ctgccaatat tctccagtta ttgcctgttg 120
tttcaaatga ttgaaattgg aagttgtatt gctctacatt tttgacttgt gattttttca 180
tttgttgata tctgacaact gtgaactgca ctgaacttgc tgtgcttata aatgcatttt 240
tttgttttgg gccacgttga ttccttgtga tactttcctg ctatcaaacc aaaaatatac 300
tctcatgact gacgtgcaac aaatgcatgg aagctttcaa cgttacgaca gctgcttgcc 360
ccccatcagc tattctacat gtgtaaccta ccttgcatgg ccaccacaac gctactgcat 420
gcaagatctg gcgcaactgg atgtcccaat agtagaagta tccggattat ctccgagagt 480
tttacatatg taatcgacgc catttctgtc atcaactata aatccattgc tcctgcattt 540
ctggcactga cattctacca caagcaatac ca 572
<210> 17
<211> 699
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> TurboGFP基因
<400> 17
atgttggaga gcgacgagag cggcctgccc gccatggaga tcgagtgccg catcaccggc 60
accctgaacg gcgtggagtt cgagctggtg ggcggcggag agggcacccc cgagcagggc 120
cgcatgacca acaagatgaa gagcaccaaa ggcgccctga ccttcagccc ctacctgctg 180
agccacgtga tgggctacgg cttctaccac ttcggcacct accccagcgg ctacgagaac 240
cccttcctgc acgccatcaa caacggcggc tacaccaaca cccgcatcga gaagtacgag 300
gacggcggcg tgctgcacgt gagcttcagc taccgctacg aggccggccg cgtgatcggc 360
gacttcaagg tgatgggcac cggcttcccc gaggacagcg tgatcttcac cgacaagatc 420
atccgcagca acgccaccgt ggagcacctg caccccatgg gcgataacga tctggatggc 480
agcttcaccc gcaccttcag cctgcgcgac ggcggctact acagctccgt ggtggacagc 540
cacatgcact tcaagagcgc catccacccc agcatcctgc agaacggggg ccccatgttc 600
gccttccgcc gcgtggagga ggatcacagc aacaccgagc tgggcatcgt ggagtaccag 660
cacgccttca agaccccgga tgcagatgcc ggtgaagaa 699
<210> 18
<211> 869
<212> DNA
<213> 卵囊藻属
<220>
<221> misc_feature
<223> ACP1终止子
<400> 18
gcagcagctt gttatgcctt ccccatgggc atcagcatgc tgcaagctgt ctagatatcc 60
agctttcagt ggaggttgag cgagggtcag cagcggttcc ctggcgatgg cggtcagctt 120
ttctggaagc cttcactagg actgcgccca gcgcatgtga cgccaatcga acttgtgtgc 180
aaggccaaat tttgtgaccc tgtgctgcac ttcatgtatt caagaattga gaagaaattt 240
cattgctgcc cttctttcac tttaatttcc atccctggat ccacctccca ccattgtggt 300
tgatgggtag gggttttggg taggtgcagt tcgttgtgca cgttgacatg tgtaacggtg 360
agcaaaggaa ttgctgggca agtagctatt gcagcttaag ggcatggtga aacacttgtg 420
ctgtatttac agaggaagcc agacaggtaa ggagtgtgtg gcagcttgga acaggagggc 480
tggtcgcaac aagtatgcat atcccatgat tgttgacata agagcagcag gtgcatattg 540
ccagcctttg tgaaagtgga ttgaaaatcg attagttggt gtgatagctg aggctaggca 600
ctgccaacct gcagtgaaat gaggctccaa gaccgggtaa taatacaggc aatcgaatcc 660
agttgaaatt acggcgatta aatccaagcg agcgttgtaa gaacatctgc acctgtctga 720
agtagtgagc ggataatgag cattgcttgc cttctatcac tatacctgac agttacgtgt 780
cacacactct caagcacaac acacagcggc aaagttactt gctaaacctc acagtcaagc 840
tgaaaataaa ggctaaatta cgtgagacc 869
<210> 19
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST106,引物
<400> 19
gtgtgggtgc tctggatcag ccatcgat 28
<210> 20
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST107
<400> 20
tgagaaagca agctgtgcag gagctcagg 29
<210> 21
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST078,引物
<400> 21
gcgtgcactt tgttgcagaa gaacaggact g 31
<210> 22
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST258,引物
<400> 22
gtgtcatctt cagtgccacc ctctttccgc 30
<210> 23
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA oligoST259,引物
<400> 23
ctagcagcag cagcctcaat atgctgctgc 30
<210> 24
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST108,引物
<400> 24
cagaattctt agctgtgccc cagtgcatgg 30
<210> 25
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST109,引物
<400> 25
ctccaagctt gatcacagct cgccacatc 29
<210> 26
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST110,引物
<400> 26
gccgcgcact tcacctgtac agaccgt 27
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> DNA_oligoST111,引物
<400> 27
ctgcaggaca gcagttgctg aacttgcc 28
<210> 28
<211> 1612
<212> PRT
<213> Oocystis sp.
<220>
<221> misc_feature
<223> EMRE3EUKT2030386甲基转移酶
<400> 28
Met Ala Ser Lys Gln Cys Ala Asn Ser Ser Gly Gln Val Ala Ala Gly
1 5 10 15
Arg Gly Ala Ala Ser Ala Phe Glu Ala Ala Ala Ala Ala Ser Gly Ser
20 25 30
Asp Ala Ser Gly Ser Asn Val Pro Leu Pro Met Pro Arg Val Pro Ser
35 40 45
Leu Leu Ser Lys Val Met Thr Leu Gly Gly Gln Ala Leu Ser Lys Val
50 55 60
Val Gly Ser Pro Ala Arg Cys Gly Ser Ala Ser Ser Ala Glu Pro Ala
65 70 75 80
Gly Ser Ala Ala Pro Ile Ala Leu Glu Pro Ala Thr Ser Thr Gln Ala
85 90 95
Ser Ser Pro Glu Gln Cys Pro Gly Arg Ala Ala Lys Arg Lys Ala Ala
100 105 110
Glu Arg Ile Ser Gly Glu Ala Ala Thr Thr Ala Ala Leu Phe Pro Ser
115 120 125
Gly Ser Val Pro Gly Ser Ser Pro Arg Lys Arg Arg His Arg Pro Gly
130 135 140
Ala Gly Ala Ala Gly Glu Glu Gly Gln Ala Gln Gly Gln Ala Gln Gly
145 150 155 160
Gln Ala Arg Pro Pro Arg Ala Pro His Ala Asn Arg Ala Ala Ala Ala
165 170 175
Thr Arg Arg Ala Ala Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
180 185 190
Gln Gln Asp Asp Val Trp Cys Asp Glu Asp Gly Thr Ala Ala Ala Gly
195 200 205
Gly Pro Cys Trp Thr Val Pro Gln Val Glu Arg Arg Leu Lys Glu Thr
210 215 220
Pro Ser Trp Phe Lys Ala Glu Asp Asp Asn Asp Glu Tyr Leu Pro Glu
225 230 235 240
Gln Tyr Met Asp Gln Arg Tyr Arg Ala Leu Gly Gly Pro Ala Gly Val
245 250 255
Ala Phe Met Ala Cys His Trp Leu Asp Arg Glu Val Ala Gly Tyr Thr
260 265 270
Trp Gly Ala Arg Ile Ser Lys Asp Glu Ala Gln Arg Arg Trp Pro Asn
275 280 285
Arg Ala Met Cys Glu Cys Ser Ala Ala Thr Val Lys Glu His Ile Ser
290 295 300
Lys Arg Met Ser Arg Glu Gly Gly Lys Pro Thr Asp Glu His Phe Trp
305 310 315 320
Asp Phe Ala Thr His Gly Ala Phe Pro Ala Met Ala His Phe Glu Glu
325 330 335
Val Thr Ile Arg Arg Glu Gly Glu Gln Pro Phe Thr Ala Arg Leu Gly
340 345 350
Asp Asn Ile Glu Leu Asp Ser Ser Asp Gln Leu Leu Glu Gly His Leu
355 360 365
Gln Arg Leu Gly Ile Ser Arg Gln Gln Leu Ala Gly Met Asp Pro Gln
370 375 380
Asp Arg Pro Ser Thr Lys Trp Val Met Gln Val Asp Glu Leu Phe Gln
385 390 395 400
Asp Ile Thr Gly Gln Arg Val Val Ser Gly Thr Trp Tyr Tyr Ser Pro
405 410 415
Arg His Thr Ala Ile Met Cys Glu Pro Ser Arg Arg Val Thr Lys Ala
420 425 430
Lys Ala Ala Thr Ala Ala Ser Lys Asn Ala Val Gly Lys Thr Ser Thr
435 440 445
Gln Gly Gly His Glu Ser Gly Glu Gly Glu Glu Glu Asp Ala Glu Glu
450 455 460
Glu Glu Tyr Pro Gly Tyr Val Pro Val Asp Phe Asp Pro Arg Leu Leu
465 470 475 480
Phe Arg Ala Thr Val Trp Asp Asn Glu Arg Tyr Gly Met Thr Asp Gln
485 490 495
Leu Leu Glu Val Val Glu Arg Val Val Thr Val Gly Asp Ala Val Pro
500 505 510
Gly Lys Pro Pro Pro Glu Asp Cys Asp Tyr Tyr Cys Ser Met Val His
515 520 525
Asp Arg Arg His Tyr Thr Phe Ala Asp Ser Val Thr Asp Gln Pro Pro
530 535 540
Ser Lys Ala Lys Trp Ala Asn Thr Lys Arg His Leu Tyr Val Leu Asp
545 550 555 560
Leu Tyr Ser Gly Cys Gly Gly Leu Ser Glu Gly Leu Asp Thr Asp Ser
565 570 575
Asp Arg Leu Glu Ile Ser Thr Arg Trp Ala Val Asp Tyr Ala Ala Asp
580 585 590
Met Ala Ala Thr Phe Arg Ala Asn Phe Pro Arg Ala Ala Met Tyr Asn
595 600 605
Thr Gly Thr Asp Glu Phe Leu Leu Met Cys Lys Leu Phe Arg Ser Leu
610 615 620
Tyr Gln Tyr Tyr Val Thr Gln Trp Ala Gly Pro Gly Ser Pro Leu Pro
625 630 635 640
Pro Gly Glu Pro Gly Ala Pro Pro Gly His Arg Val Leu Arg Asp Arg
645 650 655
Thr Asn Gly Gly Asn Ser Arg Asp Asp Asp Val Ala Pro Arg Leu Gly
660 665 670
Leu Glu Leu Glu Gln Asp His Pro Glu Cys His Pro Gly Ala Lys Ala
675 680 685
Gly Thr Gly Gly Lys Ala Gly Gly Gly Gly Lys Ala Ala Arg Gly Ala
690 695 700
Ala Ser Gly Ile Val Arg Asp Pro Ser Pro Leu Gly Gly Asp Ala Tyr
705 710 715 720
Gly Arg Asp Glu Glu Asp Lys Glu Gly Val Val Asp Tyr Ile Ala Asp
725 730 735
Ile Lys Leu Val Asp Arg Gly Gln Arg Gly Thr Ala Gly Gln Gln Lys
740 745 750
Gly Asn Leu Leu Arg Pro Leu Gly Gln Ala Glu Gly Glu Leu Leu Phe
755 760 765
Leu Val Lys Trp Arg Gly Met Pro His Ser Arg Ala Thr Trp Glu Arg
770 775 780
Leu Ser Ser Met Gln His Val Pro His Lys Leu Arg Lys Phe Leu Phe
785 790 795 800
Trp Cys His Ser Ser Lys Lys Ile Pro Leu Pro Gly Asp Val Gly Val
805 810 815
Ile Thr Gly Gly Pro Pro Cys Gln Gly Ile Ser Gly Leu Asn Arg His
820 825 830
Ala Gln Arg Ser Gly Val Leu Ser Asp Ser Arg Asn Arg Gln Leu Ser
835 840 845
Ala Tyr Phe Glu Ala Val Glu Tyr Phe Arg Pro Ala Tyr Val Leu Met
850 855 860
Glu Asn Val Lys Asp Ile Phe Ser Lys Glu Asp Gly Leu Tyr Ala Lys
865 870 875 880
Ala Ala Gln Ala Glu Leu Leu Arg Leu His Tyr Gln Thr Arg Ile Gly
885 890 895
Ile Ile Ser Ala Gly Asp Gln Gly Ala Pro Gln Gly Arg Trp Arg Cys
900 905 910
Phe Phe Trp Gly Ala Lys Ser Gly Glu Glu Gln Leu Pro Pro Phe Pro
915 920 925
Gly Pro Ser His Gln Pro Ile Thr Phe Asp Lys Ala Leu Pro Leu Glu
930 935 940
Ala Gln Leu Tyr Cys Gln Val Lys Val Glu Glu Gln Arg Glu Gly Gln
945 950 955 960
Pro Pro Arg Gln Leu Leu Pro Gly Thr Leu Leu Gly Asp Ser Leu Ser
965 970 975
Asp Leu Pro Glu Val Thr Asn Phe Cys Ala Lys Glu His Ala Arg Tyr
980 985 990
Thr Arg Glu Pro Asp Arg Pro Tyr Gln Ala Leu Met Arg Arg Asp Pro
995 1000 1005
Gln His Trp Gln Thr Ser Arg Glu Glu Arg Asn Arg Leu Ala Arg
1010 1015 1020
Glu Ala Met Gln Asp Asp Tyr Arg Gln Asn Asn Gln Ala Thr Val
1025 1030 1035
Asp Thr Val Glu Met Leu Asn Ala Gln Gln Pro Gly Leu Gly Phe
1040 1045 1050
Val Lys Leu Gly Tyr Thr Tyr Phe Cys Gly Lys Ser Trp Pro Val
1055 1060 1065
Val Arg Leu Gly Gly Lys Asn Gly Lys Gly Lys Gln Val Val Val
1070 1075 1080
Gly Gly Gly Gly Arg Gln Gln Arg Gly Val Lys Arg Ser Ala Ala
1085 1090 1095
Gly Gly Cys Ser Ala Ala Ala Gly His Glu Gln Glu Glu Asp Glu
1100 1105 1110
Asp Glu Glu Asp Asp Glu Glu Asp Ser Ser Asp Asp Asp Asp Glu
1115 1120 1125
Asp Asp Glu Glu Glu Ala Gly Glu Asp Ala Glu Glu Glu Gly Leu
1130 1135 1140
Pro Lys Gly Ser Thr Lys Glu Gln Gln Lys Gln Glu Lys Asp Phe
1145 1150 1155
Ala Arg Gln Val Trp Leu Ala Ala Val Lys Glu Ile Ala Ala Thr
1160 1165 1170
Gln Gly Pro His Ala Ala Ala Leu Ala Gln Val Glu Met Ala Ala
1175 1180 1185
Ser Arg His Ala Leu Ala Trp Ala Leu Gly Val Gln Val Tyr Lys
1190 1195 1200
Glu Leu Ile Ala Ala Leu Glu Glu Pro Asp Cys Ala Pro Leu Arg
1205 1210 1215
Asp His Arg Pro Leu Cys Val Asn Ala Asp Asp Tyr Leu Arg Cys
1220 1225 1230
Ala Ala Val Pro Thr His Lys Gly Ala Asn Phe Arg Asp Met Lys
1235 1240 1245
Gly Val Val Thr His Ser Gly Gly Glu Cys Cys Ala Gly His Thr
1250 1255 1260
His Pro His Ser Lys Ser Gly Gly Gly Ser Lys Gly Thr Lys Leu
1265 1270 1275
Val Cys Pro Gly Gly Gly Thr Phe Trp Tyr Ala Lys Pro Ser Thr
1280 1285 1290
Lys Lys Ser Ser Arg Val Asp His His Asp Lys Ile Gly Glu Arg
1295 1300 1305
Val Thr His Lys Asp Gly Cys Asp Ala Arg Leu Phe Leu Leu Ala
1310 1315 1320
Thr Gly Asp Leu Leu Cys Pro Arg Trp Cys Ile Thr Tyr Lys Lys
1325 1330 1335
Gly Asn Ser Asn Gly Arg His Gly Cys Phe Gly Arg Leu Trp His
1340 1345 1350
Asp Glu Ile Gln Pro Thr Val Val Gly Arg Val Glu Pro His Asn
1355 1360 1365
Leu Lys Val Val His Pro Trp Gln Asp Arg Val Val Thr Met Arg
1370 1375 1380
Glu Asn Met Arg Cys Gln Gly Phe Pro Asp Tyr Phe Val Leu Val
1385 1390 1395
Gly Leu Ser Lys Ala Asn Ala Gly His Ser Trp Val Arg Asn Ala
1400 1405 1410
Ser Phe Lys Gln Arg Tyr Gln Gln Ile Gly Asn Ala Val Cys Pro
1415 1420 1425
Leu Val Ala Gly Ala Leu Gly Arg Cys Leu Ala Leu Ala Ala Leu
1430 1435 1440
Gly Glu Ala Asp Ser Ser Arg Phe Val Leu His Val Pro Asp Pro
1445 1450 1455
Glu Leu Glu Arg Val His Asp Leu Ala Ala Thr Arg Gly Trp Lys
1460 1465 1470
Thr Tyr Ala Gln Glu Ala Gly Leu Leu Pro Ser Gly Val Gly Gly
1475 1480 1485
Gly Leu Gly Arg Gly Leu His Arg Ser Gly Ser Val Gln Gly Ser
1490 1495 1500
Gly Met Asn Leu His Leu Ser Ser Ser Ser Ser Leu Gly Gly Gly
1505 1510 1515
Leu Gly Ser Ser Gly Leu Gly Gly Gly Leu Gly Gly Ser Gly Leu
1520 1525 1530
Gly Asp Gly Ser Gly Gly Arg Gly Ser Thr Gly Ala Gly Ala Ala
1535 1540 1545
Gly Gly Gly Gln Ala Glu Glu Glu Leu Thr Leu Ala Leu Glu Leu
1550 1555 1560
Ser Gly Asp Gly Asp Glu Asp Gly Glu Glu Asp Glu Asp Gly Glu
1565 1570 1575
Glu Asp Glu Asp Gly Asp Gly Glu Glu Gly Glu Glu Glu Pro Arg
1580 1585 1590
Gly Gly Asp Gly Ser Gly Glu Ser Asp Val Asp Glu Asp Glu Ser
1595 1600 1605
Asp Leu Glu Asp
1610
<210> 29
<211> 4839
<212> DNA
<213> Oocystis sp.
<220>
<221> misc_feature
<223> EMRE3EUKT2030386,SEQ ID 28的编码序列
<400> 29
atggcgtcca agcaatgcgc caactccagc ggacaagtgg cggcaggtcg cggcgccgca 60
tcggcgttcg aagctgcagc agcagcaagt gggagtgatg ccagcggaag caatgtgccg 120
ctgccgatgc cccgagtgcc cagcttgctg tccaaggtga tgacactggg aggccaagcg 180
ctgtccaagg tagtagggag cccagcacgc tgcggcagcg catcctcggc agaaccagca 240
gggtcggcag cccctattgc gttggagcct gccaccagca cccaggcctc cagcccagag 300
cagtgtcctg ggcgggcagc caagcgcaag gccgccgagc gcatctcagg cgaagcggcc 360
accaccgccg ctctgttccc aagcggcagc gtccctggct cctcgcctcg taagcgccgc 420
caccggcccg gggccggggc cgctggcgaa gagggtcagg cccagggtca ggcccagggt 480
caggcccgcc cccctcgggc ccctcacgca aaccgggccg ccgccgccac acgccgtgcc 540
gcacaacagc agcagcagca gcagcagcag cagcagcagc aggatgatgt ctggtgtgat 600
gaggacggca ccgctgctgc cggcgggccc tgctggaccg tgccgcaggt ggagcgcagg 660
ctcaaggaga cgccgtcctg gtttaaggcg gaggacgaca acgacgagta cctgcccgag 720
cagtacatgg accagcggta ccgcgccctg ggcggcccgg ccggggtggc gttcatggcc 780
tgccattggc tggacaggga agtggcgggg tacacgtggg gtgcacgcat atccaaggac 840
gaagcgcagc gcaggtggcc aaaccgtgca atgtgcgagt gcagcgctgc tacagtgaaa 900
gagcacatct ccaagcgaat gagccgggag gggggaaagc ctaccgacga gcacttttgg 960
gactttgcca cgcatggcgc gttccctgcc atggcgcact ttgaggaggt gaccatccgc 1020
agggaaggcg agcagccatt cacggcgcgt ctgggcgata acatcgagct cgactccagc 1080
gaccagctcc tggaggggca cctgcagcgg ctggggatta gcaggcagca gctggcgggg 1140
atggacccac aggacaggcc atcgaccaaa tgggtcatgc aggtcgacga gctgttccag 1200
gacattacgg ggcagagggt agtgtccggg acctggtact actctccccg ccacaccgcc 1260
atcatgtgcg agccctctcg tcgcgtgacc aaggccaagg cagcaacggc agcctcgaaa 1320
aacgcggtgg gcaagacaag cacccagggc ggtcatgaga gcggagaggg ggaggaggag 1380
gatgcggagg aggaggaata tcctggctat gtccccgttg actttgaccc gcggctgctg 1440
ttccgggcga ctgtgtggga caacgagcgg tacggcatga cagatcagct actggaggtg 1500
gtggagaggg tggtgaccgt cggcgatgcc gtgcccggca agccaccccc ggaggactgc 1560
gattactact gctccatggt gcacgaccgc aggcactaca cctttgctga ctccgtcacc 1620
gaccagccgc cttcaaaggc caagtgggcg aacacgaagc ggcacctgta cgtgttggac 1680
ctgtactcgg gatgcggcgg cctgtccgag gggctggaca ccgactccga ccgactggag 1740
atcagcacgc ggtgggcggt cgactacgcc gctgacatgg cggccacctt cagggccaat 1800
ttcccccggg ccgcgatgta caacacgggc acggacgagt tcctgctgat gtgcaagctg 1860
ttccgctccc tgtaccagta ctacgtgacg cagtgggccg ggccgggcag cccgctgcct 1920
cccggggagc ccggagcccc ccctggccac agggtgctgc gggaccgcac caacggcggc 1980
aacagccgcg acgatgatgt ggcgcccagg ctgggcctag agctggagca ggaccaccct 2040
gaatgccacc cgggcgccaa agcgggcact ggaggcaagg cgggcggtgg aggcaaggcg 2100
gcaagggggg ccgccagcgg cattgtcaga gacccgtctc ccttgggggg agatgcttac 2160
ggcagggacg aggaagataa agagggcgtg gtggactaca tcgctgacat caagctcgtg 2220
gaccggggcc agcgcggcac tgcagggcag cagaagggca acctgctccg ccccctcggt 2280
caggccgagg gtgagctgct gttccttgtc aagtggcgtg gcatgcccca ctctcgcgcc 2340
acatgggagc gcctgtcaag catgcagcac gtgccgcaca agctgcggaa gttccttttc 2400
tggtgccaca gctccaagaa gatcccgctg cccggcgacg tgggtgtcat cacgggcggg 2460
ccgccctgcc agggcatcag cggcctcaac cgccacgcgc agaggagcgg cgtgctcagc 2520
gacagcagga accgccagct cagcgcgtac tttgaggcgg tggagtactt ccgtcccgcg 2580
tacgtgctga tggagaacgt caaagacata ttcagcaagg aggacggtct gtacgcaaag 2640
gccgcgcagg cggagctgct gcggctgcac taccagacgc gcatcggcat catctctgca 2700
ggcgaccagg gcgcgccgca gggtcgctgg aggtgcttct tctggggcgc caagagcggc 2760
gaggagcagc tgccgccctt cccggggcca agccaccagc ccatcacctt cgacaaggct 2820
ctgcccctgg aggctcagct gtactgccag gtcaaggtgg aggagcagcg ggaggggcag 2880
ccgcccaggc agctgctgcc agggacgctg ctgggcgaca gcctgagcga cctgcccgag 2940
gtgaccaact tctgcgccaa ggagcacgcc cgctacacca gggagccgga caggccctac 3000
caggcactca tgcgcaggga cccgcagcac tggcagacct ccagggagga gcgcaacagg 3060
cttgcgcgtg aggccatgca ggatgactac aggcagaaca accaggcaac ggtagatacg 3120
gtagagatgc tcaacgcaca gcaaccaggc ctgggcttcg tcaagctggg ctacacctac 3180
ttctgcggga agagctggcc agtcgtacgc ctgggcggca agaacggcaa gggcaagcag 3240
gtcgtggtgg gaggaggcgg caggcagcag aggggcgtca agcgctcggc ggctggaggg 3300
tgctcggcgg cggcgggcca cgagcaggag gaggacgagg atgaggagga tgacgaggag 3360
gattccagcg acgacgatga cgaggatgac gaggaggagg cgggagagga cgcggaggag 3420
gaggggctgc ccaaggggag taccaaggag cagcagaagc aggagaaaga ctttgcgcgg 3480
caggtgtggc tggctgctgt caaggagatt gccgccaccc agggcccgca cgctgccgcc 3540
ctggcacagg tggagatggc ggcatccagg cacgcgctgg cctgggcgct gggcgtacag 3600
gtgtacaagg agctgatcgc tgcgctggag gagcccgact gcgcgccgct gcgcgaccac 3660
cgccccctgt gcgtcaacgc ggatgattac ctgcgctgcg cggccgtgcc cactcacaag 3720
ggggcaaact tccgcgacat gaagggggtc gtcacgcaca gcggcggcga gtgctgtgct 3780
ggtcacacgc acccgcactc caagtccggc ggcggcagta agggcaccaa gctggtgtgc 3840
cccggtggtg gcaccttttg gtacgccaag ccatcgacca agaagagcag cagggtggac 3900
caccacgaca agatcggcga acgagtgacg cacaaggacg gctgcgacgc tcgcctgttc 3960
cttctcgcca cgggcgacct gctgtgcccg cgctggtgca tcacctacaa gaagggcaac 4020
agcaacgggc ggcacggctg cttcggccgg ctgtggcacg acgagatcca gcccacggtg 4080
gtcgggcggg tggagccgca caacctcaag gtggtgcacc cctggcagga cagggtggtg 4140
accatgcggg agaacatgcg gtgccagggc ttcccggact actttgtgct ggtcggtttg 4200
agcaaggcaa acgcgggcca cagctgggtg cgcaacgcct ccttcaagca gcgctaccag 4260
cagatcggca acgcggtgtg cccgctggtc gcgggcgccc tgggccgatg cctcgccctg 4320
gcagccctgg gcgaggctga ctcgtccagg tttgtactgc acgtgccgga ccccgagctg 4380
gagagggtgc acgatctggc ggccaccagg gggtggaaaa cgtatgcaca ggaagcgggg 4440
ctgctgccca gcggcgtggg tggcggcctg ggcagaggcc tgcatcgcag cggcagcgtc 4500
cagggcagcg gcatgaacct gcacctcagc agcagcagct ccctgggcgg tggcctgggc 4560
agcagcggcc tgggcggtgg actgggtggg agcggcctgg gcgacggcag tggtgggcgt 4620
ggcagcaccg gggcaggggc agccgggggt gggcaggcgg aggaggagct gacgctggca 4680
ctcgagttgt ctggggatgg ggatgaggat ggggaggagg atgaggatgg ggaggaggat 4740
gaggatgggg atggggagga gggcgaggag gagccacgcg gcggtgacgg cagcggtgag 4800
agtgatgtcg acgaggacga gagtgacttg gaggactga 4839

Claims (37)

1.一种突变体光合生物,其包含编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因,其中与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体光合微生物具有降低的CHG DNA甲基化。
2.根据权利要求1所述的突变体光合生物,其中所述突变体是基因工程化突变体。
3.根据权利要求2所述的突变体光合生物,其中所述突变体已通过插入诱变、基因置换、RNAi、反义RNA、大范围核酸酶基因组工程化、一种或多种核酶和/或CRISPR/Cas系统进行基因工程化。
4.根据权利要求3所述的突变体光合生物,其中所述突变体已通过CRISPR/Cas系统进行基因工程化。
5.根据权利要求1所述的突变体光合生物,其中所述突变体已通过UV辐照、γ辐照或化学诱变生成。
6.根据权利要求1至4中任一项所述的突变体光合生物,其中所述突变或减弱是在编码具有CHG DNA甲基转移酶活性的多肽的基因中,所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1、3、5、7或28的氨基酸序列具有至少80%一致性的氨基酸序列。
7.根据权利要求6所述的突变体光合生物,其中具有CHG DNA甲基转移酶活性的所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少80%一致性的氨基酸序列。
8.根据权利要求1至7中任一项所述的突变体光合生物,其中所述突变体光合生物包含外源DNA,并且其中所述降低的CHG DNA甲基化是在所述外源DNA中。
9.根据权利要求8所述的突变体光合生物,其中所述外源DNA整合到所述光合生物的所述基因组中。
10.根据权利要求1至7中任一项所述的突变体光合生物,其中所述降低的CHG DNA甲基化是在所述光合生物的天然DNA中。
11.根据权利要求10所述的突变体光合生物,其中所述其中所述降低的CHG DNA甲基化是在所述突变体光合生物的着丝粒或高度重复DNA区域中。
12.根据权利要求8至9中任一项所述的突变体光合生物,其中与包含所述外源核酸但不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述外源核酸的表达得到改进。
13.根据权利要求1至12中任一项所述的突变体光合生物,其中所述突变体光合生物具有降低的组蛋白H3的赖氨酸9(H3K9)的单甲基化或三甲基化。
14.根据权利要求1至13中任一项所述的突变体光合生物,其中与不具有编码具有CHGDNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体光合生物具有降低的CHH DNA甲基化。
15.根据权利要求1至14中任一项所述的突变体光合生物,其中所述光合生物是藻类。
16.一种增强光合生物中的外源DNA的表达的方法,其包含:
a)将外源DNA引入到所述光合生物中;
b)使编码具有CHG DNA甲基转移酶活性的多肽的基因突变或减弱,其中与包含所述外源DNA但不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体微生物具有降低的所述外源DNA的CHG DNA甲基化;其中与所述对照光合生物相比,所述外源DNA的表达在所述光合生物中增强。
17.根据权利要求16所述的方法,其中所述编码具有CHG DNA甲基转移酶活性的多肽的基因的突变或减弱是通过基因工程化实现的。
18.根据权利要求17所述的方法,其中所述基因工程化是通过插入诱变、基因置换、RNAi、反义RNA、大范围核酸酶基因组工程化、一种或多种核酶和/或CRISPR/Cas系统进行。
19.根据权利要求18所述的方法,其中所述基因工程化是通过CRISPR/Cas系统进行。
20.根据权利要求16所述的方法,其中所述编码具有CHG DNA甲基转移酶活性的多肽的基因的突变或减弱是通过UV辐照、γ辐照或化学诱变实现的。
21.根据权利要求16至20中任一项所述的方法,其中所述突变或减弱是在编码具有CHGDNA甲基转移酶活性的多肽的基因中,所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少65%一致性的氨基酸序列。
22.根据权利要求21所述的方法,其中具有CHG DNA甲基转移酶活性的所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少80%一致性的氨基酸序列。
23.根据权利要求16至22中任一项所述的方法,其中与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体光合生物具有降低的CHH DNA甲基化。
24.根据权利要求16至23中任一项所述的方法,其中所述外源DNA整合到所述光合生物的所述基因组中。
25.根据权利要求16至24中任一项所述的方法,其中所述光合生物是藻类。
26.一种降低光合生物中的组蛋白H3上的赖氨酸9(H3K9)的单甲基化或三甲基化的方法,其包含:
使编码具有CHG DNA甲基转移酶活性的多肽的基因突变或减弱,其中与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体微生物具有降低的CHG DNA甲基化;其中所述光合生物体的组蛋白H3上的赖氨酸9(H3K9)的单甲基化或三甲基化降低。
27.根据权利要求26所述的方法,其中所述编码具有CHG DNA甲基转移酶活性的多肽的基因的突变或减弱是通过基因工程化实现的。
28.根据权利要求27所述的方法,其中所述基因工程化是通过插入诱变、基因置换、RNAi、反义RNA、大范围核酸酶基因组工程化、一种或多种核酶和/或CRISPR/Cas系统进行。
29.根据权利要求28所述的方法,其中所述基因工程化是通过CRISPR/Cas系统进行。
30.根据权利要求26所述的方法,其中所述编码具有CHG DNA甲基转移酶活性的多肽的基因的突变或减弱是通过UV辐照、γ辐照或化学诱变实现的。
31.根据权利要求26至30中任一项所述的方法,其中所述突变或减弱是在编码具有CHGDNA甲基转移酶活性的多肽的基因中,所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少65%一致性的氨基酸序列。
32.根据权利要求31所述的方法,其中具有CHG DNA甲基转移酶活性的所述多肽包含在所述基因的所述突变或减弱之前与SEQ ID NO:1或SEQ ID NO:28的氨基酸序列具有至少80%一致性的氨基酸序列。
33.根据权利要求26至32中任一项所述的方法,其中与不具有编码具有CHG DNA甲基转移酶活性的多肽的突变或减弱基因的对照光合生物相比,所述突变体光合生物具有降低的CHH DNA甲基化。
34.根据权利要求26至33中任一项所述的方法,其中所述光合生物是藻类。
35.根据权利要求26至34中任一项所述的方法,其中所述光合生物包含外源DNA。
36.根据权利要求35所述的方法,其中所述外源DNA整合到所述光合生物的所述基因组中。
37.根据权利要求36所述的方法,其中所述光合生物的组蛋白H3上的赖氨酸9(H3K9)的单甲基化或三甲基化的所述减少是在包含所述外源DNA的染色体的一部分中。
CN201980073721.6A 2018-12-13 2019-12-12 避免藻类中的外源核酸的表观遗传沉默 Pending CN112996916A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862779364P 2018-12-13 2018-12-13
US62/779,364 2018-12-13
PCT/US2019/065879 WO2020123755A1 (en) 2018-12-13 2019-12-12 Avoiding epigenetic silencing of exogenous nucleic acid in algae

Publications (1)

Publication Number Publication Date
CN112996916A true CN112996916A (zh) 2021-06-18

Family

ID=71071319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980073721.6A Pending CN112996916A (zh) 2018-12-13 2019-12-12 避免藻类中的外源核酸的表观遗传沉默

Country Status (8)

Country Link
US (1) US11578311B2 (zh)
EP (1) EP3894566A4 (zh)
JP (1) JP2022512240A (zh)
CN (1) CN112996916A (zh)
AU (1) AU2019395410A1 (zh)
IL (1) IL283876B1 (zh)
MX (1) MX2021006937A (zh)
WO (1) WO2020123755A1 (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106995820A (zh) * 2013-03-01 2017-08-01 加利福尼亚大学董事会 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2952276A1 (fr) 2009-11-09 2011-05-13 Inst Rech Developpement Ird Induction de l'apomixie chez les plantes cultivees a reproduction sexuee et utilisation pour la reproduction de plantes totalement ou partiellement apomictiques

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106995820A (zh) * 2013-03-01 2017-08-01 加利福尼亚大学董事会 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHARLES J UNDERWOOD等: "Epigenetic activation of meiotic recombination near Arabidopsis thaliana centromeres via loss of H3K9me2 and non-CG DNA methylation", GENOME RESEARCH, 2 April 2018 (2018-04-02), pages 520 *
SARI DEWI KURNIASIH等: "UV-mediated Chlamydomonas mutants with enhanced nuclear transgene expression by disruption of DNA methylationdependent and independent silencing systems", PLANT MOL BIOL, 19 October 2016 (2016-10-19), pages 630 *

Also Published As

Publication number Publication date
MX2021006937A (es) 2021-07-15
US20200190485A1 (en) 2020-06-18
IL283876A (en) 2021-07-29
WO2020123755A1 (en) 2020-06-18
AU2019395410A1 (en) 2021-07-29
EP3894566A4 (en) 2022-08-31
IL283876B1 (en) 2024-03-01
JP2022512240A (ja) 2022-02-02
US11578311B2 (en) 2023-02-14
EP3894566A1 (en) 2021-10-20

Similar Documents

Publication Publication Date Title
US9982272B2 (en) Algal mutants having a locked-in high light acclimated phenotype
US10689676B2 (en) Algal mutants with increased lipid productivity
US20200157558A1 (en) Algal chloroplastic srp54 mutants
CN114262369B (zh) ZmDi19基因及其靶标基因ZmPR10在培育抗灰斑病植物中的应用
US11124798B2 (en) Algal lipid productivity via genetic modification of a TPR domain containing protein
CN107326035A (zh) 一种调控水稻粒型和叶色的去泛素化酶基因ubp5及其应用
CN112996916A (zh) 避免藻类中的外源核酸的表观遗传沉默
US11098328B2 (en) Algal lipid productivity via genetic modification of a signaling protein
CN102718849A (zh) 与叶绿素合成相关的蛋白及其编码基因与应用
CN116003563A (zh) 钙调素结合蛋白CaMBP13在调控植物耐冷性中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination