CN105980561A - Cpmv增强子元件 - Google Patents

Cpmv增强子元件 Download PDF

Info

Publication number
CN105980561A
CN105980561A CN201580007060.9A CN201580007060A CN105980561A CN 105980561 A CN105980561 A CN 105980561A CN 201580007060 A CN201580007060 A CN 201580007060A CN 105980561 A CN105980561 A CN 105980561A
Authority
CN
China
Prior art keywords
sequence
plant
construct
seq
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580007060.9A
Other languages
English (en)
Other versions
CN105980561B (zh
Inventor
皮埃尔-奥利维耶·拉瓦伊
马克-安德烈·蒂奥斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mo Di Kargo Inc
Medicago Inc
Original Assignee
Mo Di Kargo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=53523412&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN105980561(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from PCT/CA2014/050326 external-priority patent/WO2014153674A1/en
Application filed by Mo Di Kargo Inc filed Critical Mo Di Kargo Inc
Publication of CN105980561A publication Critical patent/CN105980561A/zh
Application granted granted Critical
Publication of CN105980561B publication Critical patent/CN105980561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • C12N7/04Inactivation or attenuation; Producing viral sub-units
    • C12N7/045Pseudoviral particles; Non infectious pseudovirions, e.g. genetically engineered

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Nutrition Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pulmonology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了表达增强子,其包含CPMV 5’UTR核苷酸序列,所述CPMV5’UTR核苷酸序列由X个核苷酸组成(CMPVX),其中X=SEQ ID NO:1中的160个、155个、150个或114个,或由包含与CMPVX具有约80%至100%序列相似性的核苷酸序列组成,其中X=SEQ ID NO:1中的160个、155个、150个或114个。所述表达增强子还可以包含与5’UTR核苷酸序列的3’端融合的填充序列(CMPVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个)。所述填充序列可以包含一个或多个植物kozak序列。还描述了包含所述表达增强子的植物以及利用所述表达增强子的方法。

Description

CPMV增强子元件
发明领域
本发明涉及目标蛋白在植物中的表达。本发明还提供了用于在植物中产生目标蛋白的方法和组合物。
发明背景
植物呈现出作为重组蛋白生产系统的巨大潜能。在植物中产生外来蛋白的一种方法是,生成稳定的转基因植物系。然而,这是一个耗时且费力的过程。转基因植物的替代物是使用基于植物病毒的表达载体。基于植物病毒的载体允许蛋白在植物中迅速、高水平、瞬时地表达。
实现在植物中高水平瞬时表达外来蛋白的一个方法涉及使用基于RNA植物病毒的载体,包括豇豆花叶病毒属(comovirus),如豇豆花叶病毒(Cowpea mosaic virus)(CPMV;参见,例如,WO2007/135480;WO2009/087391;US 2010/0287670,Sainsbury F.et al.,2008,Plant Physiology;148:121-1218;Sainsbury F.et al.,2008,PlantBiotechnology Journal;6:82-92;Sainsbury F.et al.,2009,Plant BiotechnologyJournal;7:682-693;Sainsbury F.et al.2009,Methods in Molecular Biology,Recombinant Proteins From Plants,vol.483:25-39)。
豇豆花叶病毒属是具有双分基因组的RNA病毒。豇豆花叶病毒的RNA基因组的片段被称作RNA-1和RNA-2。RNA-1编码VPg、复制酶和蛋白酶蛋白。复制酶是病毒用于复制病毒基因组所必需的。豇豆花叶病毒属的豇豆花叶病毒的RNA-2(CPMV),产生105kDa或95kDa的被加工为4个功能肽的多蛋白。
CPMV RNA-2的5’区在115位、161位、512位和524位包含起始密码子(AUG)。161位和512位处的起始密码子在相同的三联体阅读框中。161位处起始密码子的起始导致105K多蛋白的合成,而512位处起始密码子的起始指导95K多蛋白的合成。CPMV中512位处的起始密码子的翻译起始比161位处的起始更高效,导致产生的95K多蛋白比105K多蛋白多。115位处的起始密码子不是用于病毒复制必需的(Wellink et al.,1993Biochimie.75(8):741-7)。
对于通过RNA-1编码的复制酶来有效复制RNA-2,要求使所述框维持在CPMV RNA-2中的161位和512位处的起始位点之间(Holness et al.,1989;Virology 172,311-320;vanBokhoven et al.1993,Virology 195,377-386;Rohll et al.,1993Virology 193,672-679;Wellink et al.,1993,Biochimie.75(8):741-7)。该要求影响了可被插入复制形式的CPMV RNA-2表达载体的512处起始密码子上游的序列的长度。此外,多接头的使用必须小心,因为它们可以使密码子阅读框(ORF)在这些起始位点之间移动。
CPMV已用作发展适合于在植物中产生异源多肽的载体系统的基础(Liu et al.,2005Vaccine 23,1788-1792;Sainsbury et al.,2007Virus Expression Vectors(Hefferon,K.ed),pp.339-555)。这些系统基于RNA-2的修饰,但区别在于:是使用全长形式还是缺失形式。通过与RNA-1混合接种(co-inoculation)实现被修饰的RNA-2的复制。将外来蛋白与源于RNA-2的多蛋白的C-端融合。通过来自口蹄疫病毒的2A催化肽序列的作用,介导N-端多肽的释放(Gopinath et al.,2000,Virology 267:159-173)。所得到的RNA-2分子在植物内以及植物之间均能够扩散。该策略已被用来在豇豆植物中表达多种重组蛋白,如乙型肝炎核心抗原(HBcAg)和小免疫蛋白(SIP)(Mechtcheriakova etal.J.Virol.Methods 131,10-15;2006;Monger et al.,2006,Plant Biotechnol.J.4,623-631;Alamillo et al.,2006,Biotechnol.J.1,1103-1111)。尽管是成功的,但全长病毒载体的使用限制了插入序列的大小,并且在植物之间的移动引发关于病毒生物控制的担忧。
为了处理生物控制和插入大小的问题,Canizares等人(2006Plant Biotechnol,J4:183-193)用目标序列替换RNA-2的大部分编码区,以产生缺陷形式的CPMV RNA-2(deIRNA-2)。将待表达的序列与RNA-2的512位处的AUG融合(3’非翻译区(UTR)的紧邻上游),以产生模拟RNA-2的分子。在RNA-1和沉默抑制子的存在下,当此类构建体被引入至植物时能够复制,并且指导合成大量异源蛋白(Sainsbury et al.,2008Plant Biotechnol J6:82-92)。
CPMV RNA-2载体(U162C;HT)中161位处起始密码子的突变增加了由插在512位处起始密码子之后的序列所编码的蛋白的表达水平。这允许产生高水平的外来蛋白而不需要病毒的复制,并且被叫作CPMV-HT系统(WO2009/087391;Sainsbury and Lomonossoff,2008,Plant Physiol.148,1212-1218)。在pEAQ表达质粒中(Sainsbury et al.,2009,Plant Biotechnology Journal,7,pp 682-693;US 2010/0287670),待表达的序列位于5'UTR和3'UTR之间。pEAQ系列中的5’UTR携带有U162C(HT)突变。
发明概述
本发明涉及目标蛋白在植物中的表达。本发明还提供了用于在植物中产生目标蛋白的方法和组合物。
如本文所述,提供包含CPMV 5’UTR核苷酸序列的表达增强子,所述CPMV 5’UTR核苷酸序列由X个核苷酸组成(CMPVX),其中X=SEQ ID NO:1中的160个、155个、150个或114个,或者由包含与CMPVX具有约80%至100%序列相似性的核苷酸序列组成,其中X=SEQ IDNO:1中的160个、155个、150个或114个。表达增强子可以包括选自SEQ ID NO:24、27、68、69、70和71的核苷酸序列。
本发明还提供了如上所定义的表达增强子,其中所述表达增强子还包含填充序列(CPMVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个)。所述填充序列可以包括0至约100个核苷酸的长度或者介于两者之间的任意长度、一个或多个植物kozak序列、多克隆位点、一个或多个接头序列、一个或多个重组位点或以上的组合。本发明还提供了如上所定义的表达增强子,其中kozak序列选自SEQ ID NO:5-17中所示的序列。刚刚定义的表达增强子(CPMVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个)可以包含选自SEQ IDNO:2、72、73、74、75、76和77的核苷酸序列。
还提供了植物表达系统,其包含含有以下序列的核酸序列:与如上所定义的表达增强子CPMVX、CPMVX+可操作地连接的调控区,所述表达增强子与目标核苷酸序列可操作地连接。植物表达系统还可以包含豇豆花叶病毒属3’UTR。植物表达系统还可以包含编码沉默抑制子(例如HcPro或p19)的第二核酸序列。
如上所定义的植物表达系统的目标核苷酸序列可以编码病毒蛋白或抗体。例如,所述病毒蛋白可以是流感血凝素,且可以选自:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16以及B型流感血凝素。编码病毒蛋白或抗体的核苷酸序列可以包含天然信号肽序列或非天然信号肽,例如非天然信号肽可以获自蛋白二硫键异构酶(PDI)。
如本文所述,提供在植物或植物的部分中产生目标蛋白的方法,其包括:将包含如上所定义的CPMVX或CPMVX+的植物表达系统引入至植物或植物的部分,并且在允许编码目标蛋白的核苷酸序列表达的条件下培养所述植物或植物的部分。
本发明还提供了被如上所述的植物表达系统瞬时转染或稳定转化的植物或植物的部分。
本文所描述的基于植物的表达系统导致增加或增强编码异源开放阅读框的核苷酸序列的表达,所述核苷酸序列与本文所定义的增强子CPMVX或CPMVX+可操作地连接。通过将利用基于CPMVX或基于CPMVX+的表达增强子获得的表达水平,与编码与现有技术增强子序列(CPMV HT)(如描述于Sainsbury F.,and Lomonossoff G.P.,2008,PlantPhysiol.148:pp.1212-1218;将其通过引用并入本文)可操作地连接的异源开放阅读框的相同核苷酸序列的表达水平比较,可以确定表达的增加,所述现有技术增强子序列包含不完整M蛋白。现有技术CPMV HT序列的实例提供于SEQ ID NO:4中。
本文所描述的基于植物的表达系统还可以具有许多特性,例如,含有用于目标基因或核苷酸序列的便利的克隆位点,可以用具有成本效益的方式容易地感染植物,可以使接种植物发生有效的局部或全身性感染。此外,所述感染将使有用的蛋白材料得到良好的产量。
本发明概述不一定描述了本发明的所有特征。
附图简述
根据参考附图的下述描述,本发明的这些以及其它特征将更加明显,其中:
图1A显示了本文所描述的几种增强子序列的实例CPMVX和CPMVX+(包含CPMVX和填充片段,在该非限制性实例中,其包含多克隆位点和植物kozak序列)的总示意图。CPMVX和CPMVX+各自显示为在其5’端与植物调控区可操作地连接,以及在其3’端,按顺序为目标核苷酸序列(包含ATG起始位点和终止(STOP)位点)、3’UTR和终止子序列。本文所描述的构建体CPMVX的实例是CPMV160。本文所描述的构建体CPMVX+的实例是CPMV160+。图1B显示包含本文所描述的增强子序列(CPMV160,以SEQ ID NO:1提供完整的序列;CPMV155,以SEQ IDNO:24提供完整的序列;CPMV150,以SEQ ID NO:27提供完整的序列;以及CPMV114,以SEQ IDNO:68提供完整的序列)的构建体几种变体的实例,所述增强子序列在其5’端与植物调控区(在这些非限制性实例中为2X35S)可操作地连接,以及在其3’端,为目标核苷酸序列或“GOI”,所述目标核苷酸序列或“GOI”包含与ATG起始位点相邻的植物kozak序列(根据上下文包含方括号内显示的元件,并且它们不是CPMVX或CPMVX+增强子序列的一部分)。图1C显示包含本文所描述的增强子序列(CPMV160+,以SEQ ID NO:2提供完整的序列;CPMV155+,以SEQ ID NO:72提供完整的序列;CPMV150+,以SEQ ID NO:73提供完整的序列;以及CPMV114+,以SEQ ID NO:74提供完整的序列)的构建体几种变体的实例,所述增强子序列在其5’端与植物调控区(在这些非限制性实例中为2X35S)可操作地连接,以及在其3’端为填充片段(在这些非限制性实例中,包含多克隆位点和植物kozak序列),包含ATG起始位点的目标核苷酸序列、“GOI”(根据上下文包含方括号内显示的元件,并且它们不是CPMVX或CPMVX+增强子序列的一部分)。
图2显示在包含CPMV-HT(现有技术)表达构建体和包含基于CPMV160+的表达构建体的植物中产生的蛋白的粗蛋白提取物的相对血凝滴度(HMG),所述表达构建体可操作地连接目标核苷酸序列。显示来自以下的HA表达数据:具有PDI信号肽的H1A/加利福尼亚/07/2009(PDI-H1加利福尼亚;构建体484号,5’UTR:CPMV HT;以及构建体1897号,5’UTR:CPMV160+;参见实施例5)、具有PDI信号肽的H3A/维多利亚(Victoria)/361/2011(PDI-H3维多利亚;构建体1391号,5’UTR:CPMV HT;以及构建体1800号,5’UTR:CMPV160+;分别参见实施例1和2)、来自流感A/印度尼西亚(Indonesia)/5/2005的具有天然信号肽的H5(WtSp-H5Indo;构建体489号,5’UTR:CMPV HT;以及构建体1880号,5’UTR:CMPV160+;参见实施例6),以及具有缺失的蛋白水解环且具有天然信号肽的B/威斯康星(Wisconsin)/1/2010(WtSp-B Wis-PrL;构建体1445号,5’UTR:CMPV HT;以及构建体1975号,5’UTR:CMPV160+,参见实施例13)。PDI:蛋白二硫键异构酶信号肽;PrL-:缺失的蛋白水解环。
图3显示在包含CPMV-HT(现有技术)的表达构建体和包含基于CPMV160+的表达构建体的植物中产生的蛋白的粗蛋白提取物的相对血凝滴度(HMG)。显示了来自以下的HA表达数据:具有PDI信号肽的H1A/加利福尼亚/07/2009(构建体484号,5’UTR:CMPV HT;以及构建体1897号,5’UTR:CMPV160+,参见实施例5);具有PDI信号肽的H3A/维多利亚/361/2011(构建体1391号,5’UTR:CMPV HT;以及构建体1800号,5’UTR:CMPV160+,分别参见实施例1和2);具有缺失的蛋白水解环且具有PDI信号肽的B布里斯班(Brisbane)/60/08(构建体1039号,5’UTR:CMPV HT;以及构建体1937号,5’UTR:CMPV160+;参见实施例9);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区且具有PDI信号肽的B布里斯班/60/08+H1Tm(构建体1067号,5’UTR:CMPV HT;以及构建体1977号,5’UTR:CMPV160+;参见实施例10),所述跨膜结构域和胞质尾区被H1A/加利福尼亚/07/2009的跨膜结构域和胞质尾区替代;具有缺失的蛋白水解环且具有PDI信号肽的B马萨诸塞(Massachusetts)/2/2012 2012(构建体2072号,5’UTR:CMPV HT;以及构建体2050号,5’UTR:CMPV160+;参见实施例11);具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区且具有PDI信号肽的B马萨诸塞/2/2012+H1Tm(构建体2074号,5’UTR:CMPV HT;以及构建体2060号,5’UTR:CMPV160+;参见实施例12),所述跨膜结构域和胞质尾区被H1A/加利福尼亚/07/2009的跨膜结构域和胞质尾区替代;具有缺失的蛋白水解环且具有天然信号肽的B威斯康星/1/2010(构建体1445号,5’UTR:CMPV HT;以及构建体1975号,5’UTR:CMPV160+;参见实施例13);以及具有缺失的蛋白水解环、具有跨膜结构域和胞质尾区且具有天然信号肽的B威斯康星/1/2010+H1Tm(构建体1454号,5’UTR:CMPV HT;以及构建体1893号,5’UTR:CMPV160+;参见实施例14),所述跨膜结构域和胞质尾区被H1A/加利福尼亚/07/2009的跨膜结构域和胞质尾区替代。
图4A显示测试的植物kozak序列变体的实例。显示了CPMVX+的部分序列、植物调控区、填充片段以及目标核苷酸序列(GOI)的构建体。在该非限制性实例中,构建体包含2X35S调控区、CPMV160+、填充片段,所述填充片段包含多克隆位点和植物kozak序列(目标核苷酸序列的5’端还被指示为:“ATG…GOI”;其中所述GOI是H3A/维多利亚/361)。植物kozak序列的变体也在下文序列中显示(也参见图9)。各个变体植物kozak序列与填充片段的3’端融合,且与目标核苷酸序列(在这些非限制性实例中,所述目标核苷酸序列为H3A/维多利亚/361)的5’-ATG位点融合。所述构建体的其它元件仍相同。图4B显示在包含CMPV160+表达构建体以及所指示的不同植物kozak序列的植物中产生的目标核苷酸序列的HA滴度。
图5显示抗体利妥昔单抗(Rituxan)在CPMV-HT(构建体5001号和5002号,参见实施例15和16)或CPMV160(构建体2100号和2109号,参见实施例15和16)控制下的表达,所述利妥昔单抗具有其天然信号肽,或者所述天然信号肽被蛋白二硫键异构酶(PDI)的信号肽替换。
图6显示用来制备构建体1391号(A-2X35S CPMV-HT PDISP H3维多利亚NOS;参见实施例1)的序列组件。构建体1391号包含现有技术的CPMV-HT序列(与编码不完整M蛋白的序列融合的、在161位具有突变起始密码子的CMPV 5’UTR,且在5’UTR和目标核苷酸序列(PDISP/H3维多利亚)之间不包含异源kozak序列)。PDISP:蛋白二硫键异构酶信号肽。NOS:胭脂氨酸合成酶终止子。图6A显示引物序列IF-PDI.S1=3c(SEQ ID NO:67)。图6B显示引物序列IF-H3V36111.s1-4r(SEQ ID NO:17)。图6C显示PDISP/H3维多利亚的序列(SEQ ID NO:18)。图6D显示构建体1191的示意图。图6E显示构建体1191;从左到右t-DNA边界(加下划线)、具有质体蓝素-P19-质体蓝素沉默抑制子表达盒的2X35S CPMV-HT NOS(SEQ ID NO:19)。图6F显示从2X35S启动子至NOS终止子的表达盒1391号。PDISP/H3维多利亚核苷酸序列加下划线;CPMV 5’UTR用粗体显示;不完整M蛋白用斜体显示(SEQ ID NO:20)。图6G显示PDISP/H3维多利亚的氨基酸序列(SEQ ID NO:21)。图6H显示构建体1391号(参照构建体)的示意图。
图7显示用来制备构建体1800号(A-2X35S CPMV160+PDISP H3维多利亚NOS;参见实施例2)的序列组件。构建体1800号包括含160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且是基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽。NOS:胭脂氨酸合成酶终止子。图7A显示引物序列IF**(SacII)-PDI.s1+4c(SEQ ID NO:22)。图7B显示引物序列IF-H3V36111.s1-4r(SEQ ID NO:23)。PDISP/H3维多利亚的序列显示于图6C中(SEQ IDNO:18)。图7C显示构建体2171号的示意图(显示用于质粒线性化的SacII和StuI限制性酶切位点)。图7D显示从左到右t-DNA边界(加下划线)的构建体2171号,具有质体蓝素-P19-质体蓝素沉默抑制子表达盒、H1加利福尼亚跨膜胞质尾区以及CPMV3’UTR的2X35S/CPMV160+/NOS(SEQ ID NO:25)。图7E显示从2X35S启动子至NOS终止子的表达盒1800号。PDISP/H3维多利亚核苷酸序列加下划线;5’UTR用粗体显示;植物kozak序列加双下划线;16个碱基对的填充片段(多克隆位点)位于5’UTR和植物kozak序列之间(SEQ ID NO:26)。PDISP/H3维多利亚的氨基酸序列显示于图6G中(SEQ ID NO:27)。图7F显示构建体1800号的示意图(基于CPMVX+的构建体,其中X=160)。
图8显示用来制备构建体1935号(2X35S/CPMV160/PDISP/H3维多利亚/NOS;参见实施例3)的序列组件。构建体1935号包括含有160个核苷酸的CPMV 5’UTR,并且不包括填充片段(多克隆位点)或植物kozak序列(该构建体还不包含编码不完整M蛋白的序列),并且是基于CPMV160(CPMVX,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽。NOS:胭脂氨酸合成酶终止子。图8A显示引物序列IF-CPMV(fl5'UTR)_SpPDI.c(SEQ ID NO:28)。图8B显示构建体1190的示意图。图8C显示从左到右t-DNA边界(加下划线)的构建体1190的核酸序列,具有质体蓝素-P19-质体蓝素沉默抑制子表达盒和CPMV3’UTR的2X35S/CPMV160/NOS(SEQ ID NO:29)。图8D显示从2X35S启动子至NOS终止子的表达盒1935号。PDISP/H3维多利亚核苷酸序列加下划线,5’UTR用粗体显示(SEQ ID NO:30)。该盒不包含植物kozak序列或填充片段(多克隆位点)。图8E显示构建体1935号的示意图(基于CPMVX的构建体,其中X=160)。
图9显示用来制备选择的基于“CPMV160+”的构建体(构建体1992号至1999号)的包含在植物kozak序列中的变异的序列。显示了2X35S/CPMV160+/NOS表达系统中PDISP/H3维多利亚的SacII限制性位点和ATG之间的序列变异,包括在植物kozak序列中的变异(该序列显示为来自构建体1800的对应序列的变异;参见实施例4)。变异的植物kozak序列加下划线。PDISP:蛋白二硫键异构酶信号肽。图9A显示IF-HT1*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:31;用来制备构建体1992号)。图9B显示IF-HT2*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:32;用来制备构建体1993号)。图9C显示IF-HT3*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:33;用来制备构建体1994号)。图9D显示IF-HT4*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:34;用来制备构建体1995号)。图9E显示IF-HT5*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:35;用来制备构建体1996号)。图9F显示IF-HT6*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:36;用来制备构建体1997号)。图9G显示IF-HT7*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:37;用来制备构建体1998号)。图9H显示IF-HT8*(-Mprot)-PDI.c的核苷酸序列(SEQID NO:38;用来制备构建体1999号)。图9I显示包含利用SEQ ID NO:31的植物kozak序列(Kozak1)(图9A)的构建体1992号的示意图。除了各构建体(1993-1999)分别包含如图9B至9H中所示的修饰的植物Kozak序列(Kozak1)(SEQ ID NO:32至38)之外,构建体1993-1999包含与构建体1992相同的特征。
图10显示用来制备构建体484号和1897号(分别是2X35S/CPMV HT PDISP/H1加利福尼亚NOS和2X35S/CPMV160+PDISP/H1加利福尼亚NOS;参见实施例5)的序列组件。构建体484号掺入有现有技术的CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/H1加利福尼亚)之间不包含异源kozak序列。构建体1897号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且是基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽。NOS:胭脂氨酸合成酶终止子。图10A显示PDISP/H1加利福尼亚的核苷酸序列(SEQ ID NO:39)。图10B显示PDISP/H1加利福尼亚的氨基酸序列(SEQ ID NO:40)。图10C显示构建体484号(2X35S/CPMV HT;参照构建体)的示意图。图10D显示构建体1897号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图11显示用来制备构建体489号、1880号和1885号(分别为2X35S/CPMV HT H5印度尼西亚NOS;CPMV160+H5印度尼西亚NOS和CPMV160H5印度尼西亚NOS;参见实施例6)的序列组件。构建体489号掺入有现有技术的CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/H1加利福尼亚)之间不包含异源kozak序列。构建体1880号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且是基于CPMV160+(CPMVX+,其中X=160)的构建体实例。构建体1885号包含含有160个核苷酸的CPMV 5’UTR,并且不包含填充片段(多克隆位点)或植物kozak序列(该构建体也不包含编码不完整M蛋白的序列),并且其是基于CPMV160(CPMVX,其中X=160)的构建体实例。NOS:胭脂氨酸合成酶终止子。图11A显示天然H5印度尼西亚的核苷酸序列(SEQ ID NO:41)。图11B显示天然H5印度尼西亚的氨基酸序列(SEQ ID NO:42)。图11C显示构建体489号(2X35S/CPMV HT;参照构建体)的示意图。图11D显示构建体1880号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。图11E显示构建体1885号(2X35S/CPMV160,基于CPMVX的构建体,其中X=160)的示意图。
图12显示用来制备构建体1240号和2168号(分别为2X35S/CPMV HT PDISP/H7杭州(Hangzhou)NOS和2X35S/CPMV160+PDISP/H7杭州NOS;参见实施例7)的序列组件。构建体1240号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/H7杭州)之间不包含异源kozak序列。构建体1897号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽。NOS:胭脂氨酸合成酶终止子。图12A显示PDISP/H7杭州的核苷酸序列(SEQ ID NO:43)。图12B显示PDISP/H7杭州的氨基酸序列(SEQ ID NO:44)。图12C显示构建体2140号(2X35S/CPMV HT;参照构建体)的示意图。图12D显示构建体2168号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图13显示用来制备构建体2130号和2188号(分别是2X35S/CPMV HT PDISP/H7杭州+H5印度尼西亚TMCT NOS和2X35S/CPMV160+PDISP/H7杭州+H5印度尼西亚TMCT NOS;参见实施例8)的序列组件。构建体2130号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/H7杭州+H5印度尼西亚TMCT)之间不包含异源kozak序列。构建体1897号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;NOS:胭脂氨酸合成酶终止子;TMCT:跨膜结构域胞质尾区。图13A显示PDISP/H7杭州+H5印度尼西亚TMCT的核苷酸序列(SEQ ID NO:45)。图13B显示PDISP/H7杭州+H5印度尼西亚TMCT的氨基酸序列(SEQ ID NO:46)。图13C显示构建体2130号(2X35S/CPMV HT;参照构建体)的示意图。图13D显示构建体2188号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图14显示用来制备构建体1039号和1937号(分别是2X35S/CPMV HT PDISP/HA B布里斯班(PrL-)NOS和2X35S/CPMV160+PDISP/HA B布里斯班(PrL-)NOS;参见实施例9)的序列组件。构建体1039号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/HA B布里斯班(PrL-))之间不包含异源kozak序列。构建体1937号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;NOS:胭脂氨酸合成酶终止子;PrL-:缺失的蛋白水解环。图14A显示PDISP/HA B布里斯班(PrL-)的核苷酸序列(SEQ ID NO:47)。图14B显示PDISP/HA B布里斯班(PrL-)的氨基酸序列(SEQ ID NO:48)。图14C显示构建体1039号(2X35S/CPMV HT;参照构建体)的示意图。图14D显示构建体1937号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图15显示用来制备构建体1067号和1977号(分别是2X35S/CPMV HT PDISP/HA B布里斯班(Prl-)+H1加利福尼亚TMCT NOS和2X35S/CPMV160+PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT NOS;参见实施例10)的序列组件。构建体1067号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT)之间不包含异源kozak序列。构建体1977号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;NOS:胭脂氨酸合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图15A显示PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT的核苷酸序列(SEQ ID NO:49)。图15B显示PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ ID NO:50)。图15C显示构建体1067号(2X35S/CPMV HT;参照构建体)的示意图。图15D显示构建体1977号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图16显示用来制备构建体2072号和2050号(分别是2X35S/CPMV HT PDISP/HA B马萨诸塞(PrL-)NOS和2X35S/CPMV160+PDISP/HA B马萨诸塞(PrL-)NOS;参见实施例11)的序列组件。构建体2072号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/HA B马萨诸塞(PrL-))之间不包含异源kozak序列。构建体2050号包含含有160个核苷酸的CPMV5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;NOS:胭脂氨酸合成酶终止子;PrL-:缺失的蛋白水解环。图16A显示PDISP/HA B马萨诸塞(PrL-)的核苷酸序列(SEQ ID NO:51)。图16B显示PDISP/HA B马萨诸塞(PrL-)的氨基酸序列(SEQ ID NO:52)。图16C显示构建体2072号(2X35S/CPMV HT;参照构建体)的示意图。图16D显示构建体2050号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图17显示用来制备构建体2074号和2060号(分别是2X35S/CPMV HT PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT NOS和2X35S/CPMV160+PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT NOS;参见实施例12)的序列组件。构建体2074号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT)之间不包含异源kozak序列。构建体2060号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;NOS:胭脂氨酸合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图17A显示PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT的核苷酸序列(SEQ ID NO:53)。图17B显示PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ ID NO:54)。图17C显示构建体2074号(2X35S/CPMV HT;参照构建体)的示意图。图17D显示构建体2060号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图18显示用来制备构建体1445号、1820号和1975号(分别是2X35S/CPMV HT HA B威斯康星(PrL-)NOS、2X35S/CPMV160+HA B威斯康星(PrL-)NOS和2X35S/CPMV160HA B威斯康星(PrL-)NOS;参见实施例13)的序列组件。构建体1445号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(HA B威斯康星(PrL-))之间不包含异源kozak序列。构建体1820号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。构建体1975号包含含有160个核苷酸的CPMV 5’UTR,并且不包含填充片段(多克隆位点)或植物kozak序列(该构建体还不包含编码不完整M蛋白的序列),并且其为基于“CPMV160”(CPMVX)的构建体实例。PrL-:缺失的蛋白水解环;NOS:胭脂氨酸合成酶终止子。图18A显示HA B威斯康星(PrL-)的核苷酸序列(SEQ ID NO:55)。图18B显示HA B威斯康星(PrL-)的氨基酸序列(SEQ ID NO:56)。图18C显示构建体1445号(2X35S/CPMV HT;参照构建体)的示意图。图18D显示构建体1820号(2X35S/CPMV160+;基于CPMVX+的构建体)的示意图。图18E显示构建体1975号(2X35S/CPMV160;基于CPMVX的构建体,其中X=160)的示意图。
图19显示用来制备构建体1454号和1893号(分别是2X35S/CPMV HT HA B威斯康星(PrL-)+H1加利福尼亚TMCT NOS和2X35S/CPMV160+HA B威斯康星(PrL-)+H1加利福尼亚TMCT NOS;参见实施例14)的序列组件。构建体1454号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(HA B威斯康星(PrL-)+H1加利福尼亚TMCT)之间不包含异源kozak序列。构建体1893号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。NOS:胭脂氨酸合成酶终止子;PrL-:缺失的蛋白水解环;TMCT:跨膜结构域胞质尾区。图19A显示HA B威斯康星(PrL-)+H1加利福尼亚TMCT的核苷酸序列(SEQ IDNO:57)。图19B显示PDISP/HA B威斯康星(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ IDNO:58)。图19C显示构建体1454号(2X35S/CPMV HT;参照构建体)的示意图。图19D显示构建体1893号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图20显示用来制备构建体5001号和2100号(分别是2X35S/CPMV HT HC利妥昔单抗(Rituxan)NOS和2X35S/CPMV160+HC利妥昔单抗(Rituxan)NOS;参见实施例15)的序列组件。构建体5001号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(HC利妥昔单抗(Rituxan))之间不包含异源kozak序列。构建体2100号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。HC:重链;NOS:胭脂氨酸合成酶终止子。图20A显示HC利妥昔单抗的核苷酸序列(Rituxan;SEQ ID NO:59)。图20B显示HC利妥昔单抗的氨基酸序列(Rituxan;SEQ ID NO:60)。图20C显示构建体5001号(2X35S/CPMV HT;参照构建体)的示意图。图20D显示构建体2100号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图21显示用来制备构建体5002号和2109号(分别是2X35S/CPMV HT PDISP/HC利妥昔单抗(Rituxan)NOS和2X35S/CPMV160+PDISP/HC利妥昔单抗(Rituxan)NOS;参见实施例16)的序列组件。构建体5001号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/HC Rituzan)之间不包含异源kozak序列。构建体2100号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;HC:重链;NOS:胭脂氨酸合成酶终止子。图21A显示PDISP/HC利妥昔单抗的核苷酸序列(Rituxan;SEQ ID NO:61)。图21B显示PSISP/HC利妥昔单抗的氨基酸序列(Rituxan;SEQ ID NO:62)。图21C显示构建体5002号(2X35S/CPMV HT;参照构建体)的示意图。图21D显示构建体2109号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图22显示用来制备构建体5021号和2120号(分别是2X35S/CPMV HT LC利妥昔单抗(Rituxan)NOS和2X35S/CPMV160+LC利妥昔单抗(Rituxan)NOS;参见实施例17)的序列组件。构建体5021号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(LC利妥昔单抗(Rituxan))之间不包含异源kozak序列。构建体2120号包含含有160个核苷酸的CPMV 5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。LC:轻链;NOS:胭脂氨酸合成酶终止子。图22A显示LC利妥昔单抗的核苷酸序列(Rituxan;SEQ ID NO:63)。图22B显示LC利妥昔单抗的氨基酸序列(Rituxan;SEQ ID NO:64)。图22C显示构建体5021号(2X35S/CPMV HT;参照构建体)的示意图。图22D显示构建体2120号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
图23显示用来制备构建体5022号和2129号(分别是2X35S/CPMV HT PDISP/LC利妥昔单抗(Rituxan)NOS和2X35S/CPMV160+PDISP/LC利妥昔单抗(Rituxan)NOS;参见实施例18)的序列组件。构建体5001号掺入有现有技术CPMV-HT序列(与编码不完整M蛋白的序列融合的在161位处具有突变起始密码子的CMPV 5’UTR),并且在5’UTR和目标核苷酸序列(PDISP/LC利妥昔单抗(Rituxan))之间不包含异源kozak序列。构建体2100号包含含有160个核苷酸的CPMV5’UTR、填充片段(多克隆位点)以及植物kozak序列(该构建体不包含编码不完整M蛋白的序列),并且其为基于CPMV160+(CPMVX+,其中X=160)的构建体实例。PDISP:蛋白二硫键异构酶信号肽;HC:重链;NOS:胭脂氨酸合成酶终止子。图23A显示PDISP/LC利妥昔单抗的核苷酸序列(Rituxan;SEQ ID NO:65)。图23B显示PSISP/LC利妥昔单抗的氨基酸序列(Rituxan;SEQ ID NO:66)。图23C显示构建体5022号(2X35S/CPMV HT;参照构建体)的示意图。图23D显示构建体2129号(2X35S/CPMV160+;基于CPMVX+的构建体,其中X=160)的示意图。
发明详述
本发明涉及目标蛋白在植物中的表达。本发明还提供了用于在植物中产生目标蛋白的方法和组合物。
在以下的描述中,广泛使用大量术语,提供下述定义以便于理解本发明的各个方面。说明书中使用的实例,包括术语的实例,仅出于示例性目的,而不意图限制本发明实施方案的范围和含义。
如本文所用,单词“一个/一种(a/an)”的使用,当在本文结合术语“包含”使用时可意指“一个/一种(one)”,但其还与“一个或多个”、“至少一个”以及“一个或多于一个”的含义一致。术语“约”意为指定值的大约+/-10%的变化。术语“多个”意指多于一个,例如,两个或更多个、三个或更多个、四个或更多个等等。
本发明提供包含CPMV 5’非翻译区(UTR)的表达增强子,“CPMVX”,其包含SEQ IDNO:1中的X个核苷酸,其中X=SEQ ID NO:1中的160个、155个、150个或114个,或包含与CPMVX具有80%至100%序列相似性的序列,其中X=SEQ ID NO:1中的160个、155个、150个或114个。该表达增强子被统称为CPMVX(参见图1A)。
CPMVX增强子序列还可以与填充序列融合,其中CMPVX包含SEQ ID NO:1中的X个核苷酸,其中X=SEQ ID NO:1中的160个、155个、150个或114个,或者包含与CPMVX具有80%至100%序列相似性的序列,其中X=SEQ ID NO:1中的160个、155个、150个或114个,并且所述填充序列包含与CMPVX序列3’端融合的1-100个核苷酸。例如,填充序列可以包含约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸,或者其间任意数目的核苷酸。
如果CMPVX序列包含填充片段,则可以将该表达增强子称作CPMVX+(参见图1A),其中X=SEQ ID NO:1中的160个、155个、150个或114个,还可将其称作包含填充序列的CMPVX,或者当X分别等于160、155、150或114时,可将其称作CPMV160+;CPMV155+;CPMV150+;CPMV114+。可将包含不含填充序列的CPMVX的构建体叫做CPMVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个,并且其中所述填充序列的长度是0个核苷酸。
可以通过截短、缺失或替换天然CMPV 5’UTR序列对填充序列进行修饰,所述填充序列位于核苷酸160的3’端。当与和5’UTR相关的最初或未修饰的(即天然的)填充序列相比时,该修饰的填充序列可以是移除的、替换的、截短的或缩短的(如描述于Sainsbury F.,and Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218)。填充序列可以包含一个或多个限制性位点(多接头、多克隆位点、一个或多个克隆位点),一个或多个植物kozak序列,一个或多个接头序列,一个或多个重组位点或以上的组合。例如,其不应当认为是限制性的,填充序列可以按顺序包含与植物kozak序列融合的期望长度的多克隆位点。填充序列不包含来自天然5’UTR序列的核苷酸序列,其位于天然CPMV 5’UTR的核苷酸160的3’端,例如,如Sainsbury F.,and Lomonossoff G.P.(2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)的图1中所示的核苷酸161至512,或SEQ ID NO:4的核苷酸161-509。即,将现有技术CPMV HT序列中存在的不完整M蛋白(图1;Sainsbury F.,andLomonossoff G.P.,2008的不完整M蛋白)从本发明的5’UTR移除。
表达增强子CPMVX或CPMVX+可以在所述增强子序列的5’端与在植物中有活性的调控区可操作地连接,以及在所述表达增强子的3’端与目标核苷酸序列可操作地连接(图1A),以便促使目标核苷酸序列在植物宿主内表达。
还提供了利用CMPVX或CPMVX+在植物中产生一种或多种目标蛋白的表达系统。本文所描述的表达系统包含含有以下序列的表达盒:CPMVX或与CPMVX具有80%序列相似性的序列,以及任选地,与CMPVX(CPMVX+)融合的填充序列。包含CMPVX或CMPVX+的表达盒还可包含在植物中有活性的调控区,所述调控区与表达增强子的5’端可操作地连接。可将目标核苷酸序列与表达盒的3’端可操作地连接,使得当被引入至植物时,实现目标核苷酸序列在植物宿主内的表达。
还提供了包含编码目标蛋白的目标核苷酸序列、含本文所描述的CPMVX或CPMVX+的表达盒或表达系统的植物细胞、植物组织、整株植物、接种物、核酸、构建体,以及在植物中表达目标蛋白的方法。
参照图1A、1B和1C,提供包含CPMV 5’UTR序列的表达增强子(CPMVX)的非限制性实例,所述CPMV 5’UTR序列包含来自SEQ ID NO:1中的X个核苷酸,其中X=SEQ ID NO:1中的160个、155个、150个或114个。当X分别等于160、155、150或114时,还可将表达增强子CMPVX称作CPMV160;CPMV155;CPMV150;CPMV114。
可以利用多种方法,将目标核苷酸序列与包含植物调控区的增强子序列融合(可操作地连接)。例如,以下不应当被认为是限制性的:
1)可以将编码目标蛋白的目标核苷酸序列与表达增强子的3’端融合,紧接在5’UTR序列之后,例如CPMVX,其中X=SEQ ID NO:1中的160个、155个、150个或114个核苷酸。在该实例中,目标核苷酸序列与5’UTR融合而不含多克隆位点,并且目标核苷酸序列可以在其5’端包含植物kozak序列,所述植物kozak序列紧接在目标核苷酸序列的ATG起始位点的上游(参见图1B)。如果X=160(即CPMV160),则与CPMV160可操作地连接的目标核苷酸序列可以不需要与其5’端融合的植物kozak序列,因为SEQ ID NO:1的核苷酸150-160或155-160包含kozak-样序列。然而,若需要,可以在包含CPMV160的构建体中包含植物kozak序列(参见图1B:“+/-植物kozak”)。如果X等于155、150或114,则为了目标核苷酸序列的最佳表达,推荐在包含CPMV155、CPMV150或CPMV114的构建体中包含植物kozak序列,所述植物kozak序列与目标核苷酸序列的5’端融合。
2)可以将目标核苷酸序列与CMPVX+表达增强子(其中X=SEQ ID NO:1中的160个、155个、150个或114个)融合,所述CMPVX+表达增强子在其3’端包含植物kozak序列,使目标核苷酸序列紧接在植物kozak序列之后。在该实例中,与CPMVX+融合的目标核苷酸序列将不包含多克隆位点或植物kozak序列(所得到的构建体将与图1B中呈现的构建体类似)。
3)利用多克隆位点,可以将目标核苷酸序列与CPMVX+表达增强子(其中X=SEQ IDNO:1中的160个、155个、150个或114个)融合,所述CPMVX+表达增强子在其3’端包含多克隆位点(MCS)。在该实例中,目标核苷酸序列可以在其5’端包含允许与表达增强子的多克隆位点融合的对应序列,并且植物kozak序列紧接在目标核苷酸序列的ATG起始位点上游(参见图1C)。
使用任一上述方法的总结果是,得到包含以下序列的构建体(或表达盒):与包含X个核苷酸(其中X=SEQ ID NO:1中的160个、155个、150个或114个)的CPMV 5’UTR序列(或包含与CPMV 5’UTR序列具有80%序列相似性的增强子序列)可操作地结合(可操作地连接)的植物调控区,CPMV 5’UTR序列的3’端与植物kozak序列的5’端融合,植物kozak序列的3’端与包含ATG起始序列的目标核苷酸序列的5’端融合并相邻。所述构建体在5’UTR和植物kozak序列之间可以包含或可以不包含多克隆位点。所述构建体还可以包含3’非翻译区(UTR)序列(例如,豇豆花叶病毒属3’UTR或质体蓝素3’UTR)和终止子序列(例如NOS终止子),所述3’非翻译区(UTR)序列和终止子序列与目标核苷酸序列的3’端可操作地连接(参见图1A)。
还提供包含含有以下序列的核酸的植物表达系统:调控区、可操作地连接本文所描述的一个或多个表达增强子(如CPMVX)、以及目标核苷酸序列。此外,描述了包含以下序列的核酸:启动子(调控区)序列、可操作地连接含有CPMV 5’UTR和修饰的或缺失的填充序列的表达增强子(如CPMVX+)、以及目标核苷酸序列。所述核酸还可以包含编码3’UTR(例如豇豆花叶病毒属3’UTR或质体蓝素3’UTR)的序列以及终止子序列(例如NOS终止子),以便使目标核苷酸序列被插入3’UTR的上游。
“可操作地连接”意指特定序列直接或间接地相互作用以执行预期的功能,如介导或调整核酸序列的表达。可操作地连接的序列的相互作用,可以被例如与可操作地连接序列相互作用的蛋白介导。
本文提及的“表达增强子”、“增强子序列”或“增强子元件”包括源自来自RNA-2基因组片段的CPMV 5’UTR一部分的序列,或者与来自RNA-2基因组片段的CPMV 5’UTR一部分共享序列相似性的序列。增强子序列可以增强与它们所连接的下游异源开放阅读框(ORF)的表达。
术语“5’UTR”或“5’非翻译区”或“5’前导序列”指未被翻译的mRNA的区域。5’UTR通常开始于转录起始位点,且正好结束于编码区的翻译起始位点或起始密码子(通常,在mRNA中为AUG,在DNA序列中为ATG)之前。通过对5’UTR进行突变(例如,替换、缺失或插入)可以改变5’UTR的长度。可以通过使天然起始密码子或翻译起始位点突变来进一步改变5’UTR,从而使所述密码子的功能不再为起始密码子,且翻译可以在另外的起始位点起始。
来自CPMV RNA-2序列的核苷酸1-160(SEQ ID NO:1)的5’UTR,开始于转录起始位点直至首个框内起始密码子(在161位),所述首个框内起始密码子作为用于产生由野生型豇豆花叶病毒属基因组片段编码的两个羧基共终端蛋白中较长蛋白的起始位点。此外,还可以将位于(或对应于)CPMV RNA-2基因组序列中的115位的’第三个’起始位点进行突变、缺失或另外改变。已表明,当与不完整M蛋白组合时,除移除AUG 161之外,移除AUG 115增强了表达(Sainsbury and Lomonossoff,2008,Plant Physiology;148:1212-1218;WO2009/087391;将其通过引用并入本文)。
表达增强子可以包含CPMV 5’非翻译区(UTR),所述CPMV 5’非翻译区包含SEQ IDNO:1的X个核苷酸(其中X=SEQ ID NO:1中的160个、155个、150个或114个)(CPMVX)或与CPMVX具有80%序列相似性的序列(其中X=SEQ ID NO:1中的160个、155个、150个或114个;参见图1A和1B),并且当与编码可操作地连接包含不完整M蛋白的现有技术CPMV HT增强子序列(如描述于Sainsbury F.,and Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)的异源开放阅读框的相同核苷酸序列的表达相比时,其呈现出增强编码可操作地连接表达增强子的异源开放阅读框的核苷酸序列表达的特性。
还可以将CPMVX增强子序列与填充序列(例如多克隆位点(MCS)或与植物kozak序列连接的MCS)融合,其中CMPVX包含SEQ ID NO:1的X个核苷酸,其中X=SEQ ID NO:1中的160个、155个、150个或114个,或含有与CPMVX(其中X=SEQ ID NO:1中的160个、155个、150个或114个)具有80%序列相似性的序列,并且当与编码可操作地连接包含不完整M蛋白的现有技术CPMV HT增强子序列(如描述于Sainsbury F.,and Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)的异源开放阅读框的相同序列的表达相比时,其呈现出增强编码可操作地连接表达增强子的异源开放阅读框的核苷酸序列的表达的特性。填充序列包含与CMPVX序列3’端融合的0-500个核苷酸。优选地,填充序列包含多克隆位点(MCS),或与植物kozak序列连接的MCS,并且不包含M蛋白。如果CMPVX序列包含填充片段(不含M蛋白),则可将该表达增强子称作:“CPMVX+”(参见图1A和1C)、“包含填充序列和植物kozak序列的CMPVX”,或“包含与植物kozak序列一起的MCS的CMPVX”。
表达增强子CPMVX,其中X=160,由SEQ ID NO:1的核苷酸1-160组成:
如果表达增强子由SEQ ID NO:1的核苷酸1-160组成(CPMV160),则在邻近起始序列(ATG)的5’端含有或不含5’植物kozak序列的目标核苷酸序列,可与5’UTR的3’端融合(在SEQ ID NO:1的核苷酸160之后),从而使整个构建体类似于如图1B中所示的构建体(CPMV160)。包含CPMV160的构建体还可以包含调控区,以及编码3’UTR(例如豇豆花叶病毒属3’非翻译区(UTR)或质体蓝素3’UTR)的序列和终止子序列(例如NOS终止子),所述调控区与表达增强子的5’端可操作地连接,所述编码3’UTR的序列和终止子序列与目标核苷酸序列的3’端融合。不希望受理论束缚,CPMV160可能不需要向目标核苷酸序列的5’端添加植物kozak序列,因为在SEQ ID NO:1的150-155位、155-160位或150-160位的序列可以作为植物中有活性的(天然的)kozak序列。构建体1935号(参见实施例3)和构建体1885号(参见实施例6),是基于CPMV160(CPMVX,其中X=160)的构建体实例。
表达增强子可以包括CPMVX+,其中X=160。此种增强子的非限制性实例是CPMV160+(参见图1C),其包含SEQ ID NO:2序列(5’UTR:核苷酸1-160;用斜体表示多克隆位点,核苷酸161-176;用大写和粗体表示植物kozak序列,核苷酸177-181):
将SEQ ID NO:2用作表达增强子的构建体实例包括:构建体1800、1897、1880、2168、2188、1937、1977、2050、2060、1975、1893、2100、2109、2120、2129(分别参见实施例3,以及实施例5-18)。
对本领域技术人员明显的是,任何多克隆位点(MCS)或不同长度(更短或更长)的MCS均可用于代替位于SEQ ID NO:2的核苷酸161-176的序列。此外,SEQ ID NO:2的植物kozak序列(显示于核苷酸177-181)可以是任何植物kozak序列,其包括但不限于选自SEQID NO:5-17的序列之一(还参见图4A;图4的构建体包括具有如指示的植物kozak序列变异的SEQ ID NO:2,且包含与5’UTR的5’端结合的植物调控区,以及位于植物kozak序列3’的目标核苷酸序列的转录起始位点ATG)。
表达增强子CPMVX可以在115位包含“A”(115A),从而使CMPVX,115A(其中X=160、155或150)包含野生型CPMV RNA2基因组的序列(对于野生型CPMV RNA-2基因组片段的完整序列,参见WO 2009/087391,将其通过引用并入本文)。表达增强子CPMVX,115A的实例,是通过SEQ ID NO:69所定义的“CPMV160,115A”(“A”用粗体且下划线显示):
表达增强子CPMVX+也可以在115位包含“A”(115A),从而使CMPVX+,115A(其中X=160,155或150)包含野生型CPMV RNA2基因组的序列(WO 2009/087391,将其通过引用并入本文)。表达增强子CPMVX+,115A的非限制性实例,是通过SEQ ID NO:75所定义的“CPMV160+,115A”(“A”用粗体且下划线显示):
如上针对SEQ ID NO:2所述,任何MCS或不同长度的MCS可用于代替SEQ ID NO:75中的MCS序列,且所述植物kozak序列可以是任何植物kozak序列。
如果表达增强子由SEQ ID NO:1的核苷酸1-155组成(CPMV155):
则在5’端、邻近起始序列(ATG)具有植物kozak序列的目标核苷酸序列,可以与5’UTR的3’端融合(在SEQ ID NO:1的核苷酸155之后),从而使整个构建体类似于图1B中所示的构建体(CPMV155)。包含CPMV155的构建体还可以包含调控区,以及编码3’UTR(例如豇豆花叶病毒属3’非翻译区(UTR)或质体蓝素3’UTR)的序列和终止子序列(例如NOS终止子),所述调控区与表达增强子的5’端可操作地连接,所述编码3’UTR的序列和终止子序列与目标核苷酸序列的3’端融合。在该实例中,目标核苷酸序列在其5’端包含植物kozak序列,因为天然kozak序列或该序列一部分(SEQ ID NO:1的核苷酸155-160)被移除。
表达增强子可以包含CPMV155+,其包括SEQ ID NO:72的序列(5’UTR:核苷酸1-155;用斜体表示多克隆位点,核苷酸156-171;用大写和粗体表示植物kozak序列,核苷酸172-176):
如上针对CPMV160+(SEQ ID NO:2)所述,任何MCS,包括不同长度的MCS,可用于代替SEQ ID NO:72的MCS序列,并且所述植物kozak序列可以是任何植物kozak序列。
表达增强子CPMV155可以在115位包含“A”(115A),从而使“CMPV155,115A”包含通过SEQ ID NO:70所定义的野生型CPMV RNA2基因组(参见WO 2009/087391,将其通过引用并入本文)的序列(将“A”加粗且加下划线):
表达增强子CPMV155+也可以在115位包含“A”(115A),从而使“CMPV155+,115a”包含通过SEQ ID NO:76所定义的野生型CPMV RNA2基因组(WO 2009/087391,将其通过引用并入本文)的序列(“A”用粗体和下划线显示):
如上文针对SEQ ID NO:2所述,任何MCS或不同长度的MCS可用于代替SEQ ID NO:76的MCS序列,并且所述植物kozak序列可以是任何植物kozak序列。
如果表达增强子由SEQ ID NO:1的核苷酸1-150组成(CPMV150):
则在5’端、邻近起始序列(ATG)具有植物kozak序列的目标核苷酸序列,可以与5’UTR的3’端融合(在SEQ ID NO:1的核苷酸150之后),从而使整个构建体类似于图1B中所示的构建体(CPMV150)。包含CPMV150的构建体还可以包含调控区,以及编码3’UTR(例如豇豆花叶病毒属3’非翻译区(UTR)或质体蓝素3’UTR)的序列和终止子序列(例如NOS终止子),所述调控区与表达增强子的5’端可操作地连接,所述编码3’UTR的序列和终止子序列与目标核苷酸序列的3’端融合。在该实例中,目标核苷酸序列在其5’端包含植物kozak序列,因为位于SEQ ID NO:1的150-160位的天然kozak序列被移除。
表达增强子可以包含CPMV150+,其包括SEQ ID NO:73的序列(5’UTR:核苷酸1-150;用斜体表示多克隆位点,核苷酸156-166;用大写和粗体表示植物kozak序列,核苷酸167-171):
如上文针对CPMV160+(SEQ ID NO:2)所述,任何MCS,包括不同长度的MCS,可用于代替SEQ ID NO:73中的MCS序列,并且所述植物kozak序列可以是任何植物kozak序列。
表达增强子CPMV150可以在115位包含“A”(115A),从而使“CMPV150,115A”包含通过SEQ ID NO:71所定义的野生型CPMV RNA2基因组(参见WO 2009/087391,将其通过引用并入本文)的序列(“A”用粗体和下划线显示):
表达增强子CPMV150+也可以在115位包含“A”(115A),从而使“CMPV150+,115A”包含通过SEQ ID NO:77所定义的野生型CPMV RNA2基因组(WO 2009/087391,将其通过引用并入本文)的序列(“A”用粗体和下划线显示):
如上文针对SEQ ID NO:2所述,任何MCS或不同长度的MCS可用于代替SEQ ID NO:77中的MCS序列,并且所述植物kozak序列可以是任何植物kozak序列。
如果表达增强子由SEQ ID NO:1的核苷酸1-114组成:
则在5’端、邻近起始序列(ATG)具有植物kozak序列的目标核苷酸序列,可以与5’UTR的3’端融合(在SEQ ID NO:1的核苷酸114之后),从而使整个构建体类似于图1B中所示的构建体(CPMV114)。包含CPMV114的构建体还可以包含调控区,以及编码3’UTR(例如豇豆花叶病毒属3’非翻译区(UTR)或质体蓝素3’UTR)的序列和终止子序列(例如NOS终止子),所述调控区与表达增强子的5’端可操作地连接,所述编码3’UTR的序列和终止子序列与目标核苷酸序列的3’端融合。在该实例中,目标核苷酸序列在其5’端包含植物kozak序列,因为在SEQ ID NO:1的核苷酸114的5’存在kozak-样序列。
表达增强子可以包含CPMV114+,其包含SEQ ID NO:74的序列(5’UTR:核苷酸1-114;用斜体表示多克隆位点,核苷酸115-130;用大写和粗体表示植物kozak序列,核苷酸131-135):
如上文针对CPMV160+(SEQ ID NO:2)所述,任何MCS,包括不同长度的MCS,可用于代替SEQ ID NO:73的MCS序列,并且所述植物kozak序列可以是任何植物kozak序列。
表达增强子还可以包含与位于SEQ ID NO:1的160位下游的植物kozak序列融合的SEQ ID NO:1的核苷酸1-160。植物kozak序列可以紧邻SEQ ID NO:1的核苷酸160,或者表达增强子可以包含约0至约500个或其间任意数量核苷酸的填充片段(CPMVX+)以及植物kozak序列,所述填充片段位于直接邻近SEQ ID NO:1的核苷酸160,所述植物kozak序列与填充片段的3’端连接。填充片段可以包含约4至100个或其间任意数量核苷酸的多克隆位点(MCS),并且利用MCS可以将在其5’端包含植物kozak序列和对应克隆位点的目标核苷酸序列与CMPVX表达增强子可操作地连接,或者填充片段可以包含与植物kozak序列融合的约4至100个核苷酸的多克隆位点,并且目标核苷酸序列可以紧接植物kozak序列的下游与表达增强子融合。优选地,填充片段不包含编码M蛋白的序列。
按顺序包含以下序列的构建体实例(其不应当被认为是限制性的)是如图1C中所示的CPMV160+:植物调控区,其与由SEQ ID NO:1的核苷酸1-160组成的CPMV 5’UTR融合,所述CPMV 5’UTR与填充片段融合(在图1C中,为了清楚起见,还显示了目标核苷酸序列“GOI”的ATG起始位点)。在该实例中,填充片段与CPMV 1-160序列的3’端融合,且按顺序包含多克隆位点,其融合植物kozak序列(在该实例中,其不应当被认为是限制性的,植物kozak序列是:AGAAA)。填充片段不包含编码M蛋白的任何序列。如果CPMV160+构建体与目标核苷酸序列融合(如图1C中所示),则植物kozak序列位于目标核苷酸序列的5’,且邻近目标核苷酸序列的ATG起始位点。本领域技术人员将理解,多克隆位点可以包含一个或多于一个合适的限制性位点,并且多克隆位点的序列不限于图1C中所示的实例。此外,所述植物kozak序列可以是任何植物kozak序列,且不限于图1C中所示的序列。构建体1800号、1897号、1880号、2168号、2188号、1937号、1977号、2050号、2060号、1975号、1893号、2100号、2109号、2120号、2129号(分别参见实施例3和实施例5-18)是基于CPMV160+(CPMVX+,其中X=160)的构建体实例。
还在图1C中显示表达增强子CPMV155+、CPMV150+和CPMV114+的实例,其各自分别包含SEQ ID NO:1的核苷酸1-155、1-150或1-114,以如上针对CPMV160+所述的类似方式与填充片段融合。在图1C中,对于CPMV155+、CPMV150+和CPMV114+中的每个,还显示了目标核苷酸序列(GOI)的ATG起始位点。在这些实例中,填充片段与CPMV增强子序列的3’端融合,且按顺序包含与植物kozak序列融合的多克隆位点。填充片段不包含编码M蛋白的任何序列。本领域技术人员将理解,多克隆位点可以包含一个或多于一个合适的限制性位点,且多克隆位点的序列不限于图1C中所示的实例。此外,所述植物kozak序列可以是任何植物kozak序列,且不限于图1C中所示的序列(AGAAA)。
表达增强子还可以包含表达增强子CPMVX,其中X=SEQ ID NO:1中的160个、155个、150个或114个,连同与5’UTR序列的3’端融合的多克隆位点(多接头,限制性位点;克隆位点),且缺少植物kozak序列(即CPMVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个)。在这些实例中,将与增强子结合的编码目标蛋白的核酸序列(目标核苷酸序列),将按顺序包含目标核苷酸序列的5’端至3’端、与植物kozak序列融合的多克隆位点(与填充片段的序列互补;该填充片段不包含编码M蛋白的任何序列),所述植物kozak序列位于目标核苷酸序列的上游且邻近目标核苷酸序列的ATG起始位点(转录起始位点)。
表达增强子还可以包含一个或多个“kozak共有序列”或“kozak序列”。Kozak序列在翻译的起始中发挥重要作用。通过确保以下情形可以优化翻译的速率:从转基因构建体除去任何mRNA不稳定序列,以及翻译开始位点或起始位点匹配植物的Kozak共有区(Gutierrrez,R.A.et al.,1999,Trends Plant Sci.4,429-438;Kawaguchi,R.andBailey-Serres,J.,2002,Curr.Opin.Plant Biol.5,460-465)。在该基序中最高度保守位置是ATG密码子上游的嘌呤(其最常见是A)三核苷酸,其指示翻译的开始(Kozak,M.,1987,J.Mol.Biol.20:947-950,通过引用并入本文)。植物Kozak共有序列是本领域已知的(参见例如Rangan et al.Mol.Biotechnol.,2008,July 39(3),pp.207-213)。天然或合成的Kozak序列可被用于表达增强子中,或者可以与本文所描述的目标核苷酸序列融合。
所述植物kozak序列可以是任何已知的植物kozak序列(参见例如L.Ranganet.al.Mol.Biotechnol.,2008,July 39(3),pp.207-213),其包括但不限于下述植物共有序列:
caA(A/C)a(SEQ ID NO:5;植物界)
aaA(A/C)a(SEQ ID NO:6;双子叶植物)
aa(A/G)(A/C)a(SEQ ID NO:7;拟南芥)
植物kozak序列还可以选自(参见图4):
AGAAA(SEQ ID NO:8)
AGACA(SEQ ID NO:9)
AGGAA(SEQ ID NO:10)
AAAAA(SEQ ID NO:11)
AAACA(SEQ ID NO:12)
AAGCA(SEQ ID NO:13)
AAGAA(SEQ ID NO:14)
AAAGAA(SEQ ID NO:15)
AAAGAA(SEQ ID NO:16)
(A/-)A(A/G)(A/G)(A/C)A.(SEQ ID NO:3;共有序列)
表达增强子还可以包含一个或多个“限制性位点”或“限制性识别位点”、“多克隆位点”、“MCS”、“克隆位点”、“多接头序列”或“多接头”,以促进目标核苷酸插入植物表达系统。限制性位点是被本领域熟知的、由限制性酶识别的特定序列基序。表达增强子可以包含位于5’UTR的下游(3’)的一个或多个限制性位点或克隆位点。一个或多个限制性位点或克隆位点还可以位于一个或多个kozak序列的上游(5’),且位于5’UTR和kozak序列之间。多接头序列(多克隆位点)可以包含用于向5’UTR的3’端添加或移除核酸序列(包括编码目标蛋白的核苷酸序列)的任何核酸序列。多接头序列可以包含4至约100个或其间任意数量的核酸。
表达增强子还可以包含SEQ ID NO:1的序列,其与植物调控区和融合至目标核苷酸序列(GOI)的转录起始位点(ATG)可操作地结合,如图1B中所示(CPMVX;其中X=160,155,150或114)。CPMVX还可以包含任何植物kozak序列,所述植物kozak序列包括但不限于SEQID NO:5-17的序列之一。
用于本文所描述的表达增强子(CPMVX或CPMVX+,其中X=160、155、150或144)的5’UTR,可以源自双分RNA病毒,如源自诸如豇豆花叶病毒属的双分RNA病毒的RNA-2基因组片段,条件是其与SEQ ID NO:1和2中任一个所示的序列呈现100%、99%、98%、97%、96%、95%、90%、85%或80%的同一性。例如增强子序列可以与SEQ ID NO:1和2的序列具有约80%至约100%或其间任意量的同一性、与SEQ ID NO:1和2的序列具有约90%至约100%或其间任意量的同一性、与SEQ ID NO:1和2的序列具有约95%至约100%或其间任意量的同一性、或者与SEQ ID NO:1和2的序列具有约98%至约100%或其间任意量的同一性,其中所述表达增强子,当与本文所描述的植物调控区和植物kozak序列可操作地连接时,与利用相同植物调控区并融合至CMPV HT(SEQ ID NO:4;包含不完整M蛋白的现有技术增强子序列,如描述于Sainsbury F.,and Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)的目标核苷酸序列的表达水平相比,能增加与所述表达增强子可操作地连接的目标核苷酸序列的表达水平。
SEQ ID NO:4包含现有技术已知的CPMV HT表达增强子(如,Sainsbury andLomonossoff 2008,Plant Physiol.148:pp.1212-1218的图1;将其通过引用并入本文)。“CPMV HT”包含5’UTR序列和不完整M蛋白且缺少植物kozak序列,所述5’UTR序列来自SEQID NO:4的核苷酸1-160且在115位(cgt)和162位(acg)具有修饰的核苷酸(5’UTR:核苷酸1-160;不完整M蛋白加下划线,核苷酸161-509)。SEQ ID NO:4还包含未在现有技术CPMV HT序列中存在的多克隆位点(斜体,核苷酸510-528):
包含CPMV HT的构建体在本文被用作参照构建体,从而可以比较目标核苷酸序列的表达水平,或者由利用包含CPMVX或CPMVX+的构建体所产生的目标核苷酸序列所编码的产物。构建体1391、484、489、2140、2130、1039、1067、2072、2074、1445、1454、5001、5002、5021和5022(分别参见实施例1和5-18)包含参照构建体CPMV HT。
如图2-5中所示,当与利用相同启动子以及3’UTR和终止子序列的相同目标核苷酸序列的表达相比时,使用本文所描述的表达增强子导致目标核苷酸序列的表达增加。例如,参照图2、图3和图5,显示了在包含与以下序列可操作地连接的CPMV-HT(现有技术)表达构建体和基于CPMV160+的表达构建体的植物中,所产生的蛋白表达的比较:
H1A/加利福尼亚/07/2009(“PDI-H1加利福尼亚”,或“H1A/加利福尼亚/07/2009”):基于CPMV160+的构建体1897号,基于CPMV HT的构建体484号(参见实施例5);
H3A/维多利亚/361/2011(“PDI-H3维多利亚”,或“H3A/维多利亚/361/2011”):基于CPMV160+的构建体1800号;基于CPMV HT的构建体1391号(分别参见实施例1和2);
来自流感A/印度尼西亚/5/2005的具有天然信号肽的H5(WtSp-H5Indo):基于CPMV160+的构建体1880号;基于CPMV HT的构建体489号(参见实施例6);
具有缺失的蛋白水解环且具有天然信号肽的B/威斯康星/1/2010(“WtSp-B Wis-PrL”,或“B/威斯康星/1/2010”):基于CPMV160+的构建体1975号;基于CPMV HT的构建体1445号(参见实施例13);
具有缺失的蛋白水解环且具有PDI信号肽的B布里斯班/60/08(“B布里斯班/60/08”):基于CPMV160+的构建体1937号;基于CMPV HT的构建体1039号(参见实施例9);
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的B布里斯班/60/08+H1Tm(“B布里斯班/60/08+H1Tm”):基于CPMV160+的构建体1977号;基于CMPVHT的构建体1067(参见实施例10),
具有缺失的蛋白水解环且具有PDI信号肽的B马萨诸塞/2/20122012(“B马萨诸塞/2/2012 2012”):基于CPMV160+的构建体2050号;基于CPMV HT的构建体2072号(参见实施例11),
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有PDI信号肽的B马萨诸塞/2/2012+H1Tm(“B马萨诸塞/2/2012+H1Tm”):基于CPMV160+的构建体2060号;基于CPMV HT的构建体2074(参见实施例12),
具有与跨膜结构域和胞质尾区融合的缺失的蛋白水解环且具有天然信号肽的B威斯康星/1/2010+H1Tm(“B威斯康星/1/2010+H1Tm”):基于CPMV160+的构建体1893号;基于CPMV HT的构建体1454(参见实施例14);
在具有天然或PDI信号肽的CPMV-HT(“CPMV-HT/野生型SP”和“CPMV-HT/PDISP”;分别是构建体5001号和5002号,参见实施例15和16),或CPMV160+(“CPMV160+/野生型SP”和“CPMV160+/PDISP”;分别是构建体2100号和2109号,参见实施例15和16)控制下的利妥昔单抗(Rituxan)。
在各实例中,当与基于现有技术CPMV的构建体相比时,在基于CMPV160+的构建体中,表达(视情况而定,被测定为血凝活性或利妥昔单抗(Rituxan)的表达)是增加的。此外,目标核苷酸序列编码的嵌合的或修饰的蛋白中的几种,例如,包含异源信号肽(如,PDI)、异源跨膜结构域胞质尾区序列(TDCT)和/或包括缺失的蛋白水解环(PrL-)的经修饰序列。
如果在上文的基于CPMV160+的构建体中使用的植物kozak序列,被其它植物kozak序列例如在SEQ ID NO:8-16中所定义的那些植物kozak序列之一代替,则还观察到利用基于CPMV160+的构建体所观察的表达增加。例如,参照图4,显示了在包含基于CPMV160+的表达构建体的植物中,所产生的蛋白表达的比较,所述基于CPMV160+的表达构建体与各自融合至不同植物kozak序列的目标核苷酸序列(H3A/维多利亚/361)可操作地连接。在各实例中,基于CMPV160+的构建体的表达(被测定为血凝滴度),表现出显著的表达水平且,优于基于现有技术CMPV HT的构建体。
当提及具体序列时,例如以威斯康星州大学GCG软件程序所示,或通过人工比对和目视检查,使用术语“百分比相似性”或“百分比同一性”(参见,如,分子生物学实验室指南(Current Protocols in Molecular Biology),Ausubel等人,编著.1995增刊)。用于比较的序列比对方法是本领域熟知的。利用例如Smith&Waterman算法(1981,Adv.Appl.Math.2:482)、通过Needleman&Wunsch的比对算法(1970,J.Mol.Biol.48:4473)、通过Pearson&Lipman的相似性搜索方法(1988,Proc.Nat'l.Acad.Sci.USA 85:2444),通过计算机执行这些算法(例如:Wisconsin遗传软件包,Genetics Computer Group(GCG),575Science Dr.,Madison,Wis.中的GAP、BESTFIT、FASTA和TFASTA),可以对用于比较的序列进行最佳比对。
适于测定百分比序列同一性和序列相似性的算法实例是BLAST和BLAST 2.0算法,其分别描述于Altschul等人(1977,Nuc.Acids Res.25:3389-3402)和Altschul等人(1990,J.Mol.Biol.215:403-410)。与本文所描述的参数一起使用BLAST和BLAST 2.0,以测定本发明的核酸和蛋白的百分比序列同一性。例如BLASTN程序(对于核苷酸序列)可以使用如字长(W)11、期望值(E)10、M=5、N=-4以及比较两条链的默认值。对于氨基酸序列,BLASTP程序可以使用如字长3和期望值(E)10,以及BLOSUM62得分矩阵(参见Henikoff&Henikoff,1989,Proc.Natl.Acad.Sci.USA 89:10915)比对(B)50、期望值(E)10、M=5、N=-4以及比较两条链的默认值。进行BLAST分析的软件,可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开获得(参见URL:ncbi.nlm.nih.gov/)。
编码蛋白的目标核苷酸序列需要在待表达的基因上游存在“翻译起始位点”、或“起始位点”、或“翻译开始位点”、或“开始位点”、或“起始密码子”。此类起始位点可以作为增强子序列一部分或编码目标蛋白的核苷酸序列一部分提供。
“表达盒”指包含目标核酸的核苷酸序列,所述目标核酸在用于在宿主细胞中转录目标核酸的合适启动子或其它调控元件的控制下,且与用于在宿主细胞中转录目标核酸的合适启动子或其它调控元件可操作地(或有效地)连接。
“蛋白水解环”或“切割位点”意指,前体HA0切割中涉及的蛋白水解位点的共有序列。本文使用的“共有区”或“共有序列”意指,基于多个序列例如,特定流感HA0序列的亚型的比对分析,包含相关序列的序列可变性的序列(氨基酸或核苷酸序列)。流感HA0切割位点的共有序列,可以包括流感A共有的血凝素氨基酸序列,包括例如共有的H1、共有的H3、共有的H5,或者流感B共有的血凝素氨基酸序列,例如但不限于B佛罗里达(Florida)、B马来西亚(Malaysia)、B威斯康星和B马萨诸塞。蛋白水解环区序列的非限制性实例,在美国临时专利申请第61/806,227号中的图15和图18B中显示(于2013年3月28日提交,将其通过引用并入本文;还参见Bianchi et al.,2005,Journal of Virology,79:7380-7388;通过引用并入本文)。
蛋白水解环或切割位点中的残基可能是突变的,例如但不限于点突变、替换、插入或缺失。本文所用的术语“氨基酸的突变”或“氨基酸的修饰”意指涵盖了氨基酸的替换、缺失、插入和修饰。如美国临时专利申请第61/806,227号(提交于2013年3月28日,将其通过引用并入本文)中所描述的,可以进行替换、缺失、插入和修饰的任意组合以得到最终的构建体,条件是最终的构建体拥有期望的特性,如被蛋白酶切割的蛋白水解环或切割位点减少或废除。
如本文所述,提供了核酸构建体(表达系统),其包含与编码目标蛋白的目标核苷酸序列可操作地连接的表达增强子序列。还提供了包含如本文所描述的增强子序列的植物表达系统。还提供了包含可操作地与增强子序列结合的植物调控区的植物表达系统,所述增强子序列与目标核苷酸序列(编码目标蛋白的目标核苷酸序列)可操作地连接。增强子序列可以选自SEQ ID NO:1、2、24、27、68、69和70-77中任一个,或者与SEQ ID NO:1、2、24、27、68、69和70-77中任一个所示的序列呈现100%、99%、98%、97%、96%、95%、90%、85%或80%的同一性,其中本文所描述的表达增强子,当与植物调控区和植物kozak序列可操作地连接时,与利用相同植物调控区的融合至CMPV HT(SEQ ID NO:4;包含不完整M蛋白的现有技术增强子序列,如描述于Sainsbury F.,and Lomonossoff G.P.,2008,PlantPhysiol.148:pp.1212-1218;将其通过引用并入本文)的目标核苷酸序列的表达水平相比,能增加与所述表达增强子可操作地连接的目标核苷酸序列的表达水平。
本发明的增强子序列可用来在宿主生物体例如植物中表达目标蛋白。在该实例中,对于所考虑的宿主生物体目标蛋白还可以是异源的,且利用本领域已知的转化技术被引入植物细胞。生物体中的异源基因可以代替内源的等同基因,即正常情况下展现相同或类似功能的基因,或者插入序列可附加于内源基因或其它序列。
与目标核苷酸序列可操作地连接的增强子序列,还可以与启动子或植物调控区,以及3’UTR和终止子序列可操作地连接。可以通过例如SEQ ID NO:1、2、24、27、68、69和70-77中任一个,或者与SEQ ID NO:1、2、24、27、68、69和70-77中任一个所示的序列呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列来定义增强子序列。因此,目标核苷酸序列位于增强子序列和终止序列之间(参见图1A)。表达增强子或目标核苷酸序列可以包含植物kozak序列。
本发明还提供表达盒,所述表达盒按顺序包含启动子或植物调控区、可操作地连接与目标核苷酸序列融合的如本文所描述的表达增强子序列、3’UTR序列以及终止子序列。可以通过例如SEQ ID NO:1、2、24、27、68、69和70-77中任一个,或者与SEQ ID NO:1、2、24、27、68、69和70-77中任一个所示的序列呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列来定义增强子序列。表达增强子或目标核苷酸序列可以包含植物kozak序列。
本领域技术人员将理解,终止(终止子)序列可以是在植物宿主中有活性的任何序列,例如终止序列可以源自例如豇豆花叶病毒属的双分RNA病毒的RNA-2基因组片段,或者终止序列可以是NOS终止子。
本发明的构建体还可包含3’非翻译区(UTR)。3’非翻译区含有聚腺苷酸化信号和能够导致mRNA加工或基因表达的任何其它调控信号。聚腺苷酸化信号的特征通常在于导致向mRNA前体的3’端添加多聚腺苷酸尾巴(track)。尽管变异很常见,通常通过与典型形式5’AATAAA-3’存在同源性来识别聚腺苷酸化信号。合适的3’区的非限制性实例是3’转录的非翻译区,其含有农杆菌(Agrobacterium)肿瘤诱发(Ti)质粒基因(如胭脂氨酸合成酶(Nos基因))以及植物基因(如大豆贮藏蛋白基因)的聚腺苷酸化信号、核酮糖-1,5-二磷酸羧化酶基因的小亚基(ssRUBISCO;US 4,962,028;将其通过引用并入本文)、用于调控质体蓝素表达的启动子(Pwee and Gray 1993;将其通过引用并入本文)。终止(终止子)序列可以获自苜蓿质体蓝素基因的3’UTR。
“目标核苷酸(或核酸)序列”或“目标编码区”,其意指在宿主生物体(例如植物)内待表达的任何核苷酸序列或编码区(这些术语可互换使用),以产生目标蛋白。此类目标核苷酸序列可以编码(但不限于)用于饲料用途、食品用途、或饲料和食品二者用途的天然或修饰的蛋白、工业酶或修饰的工业酶、农业蛋白或修饰的农业蛋白、辅助蛋白、蛋白质补充剂、药学活性蛋白、营养食品、增值产品或以上的片段。
目标蛋白可以包含天然或非天然信号肽;非天然信号肽可以是植物来源的。例如,信号肽可以是蛋白二硫键异构酶信号肽(PDI)。天然信号肽可以对应于待表达的目标蛋白的天然信号肽。
目标核苷酸序列或目标编码区还可以包括编码对免疫、接种疫苗等有益的药学活性蛋白的核苷酸序列,例如生长因子、生长调节剂、抗体、抗原及其片段、或它们的衍生物。此类蛋白包括但不限于这样的蛋白:人类病原体、病毒蛋白,例如但不限于形成VLP的抗原,来自呼吸道合胞体病毒(RSV)、轮状病毒、流感病毒、人类免疫缺陷病毒(HIV)、狂犬病病毒、人乳头状瘤病毒(HPV)、肠病毒71(EV71)的一种或多种蛋白,或白细胞介素(例如IL-1至IL-24、IL-26和IL-27中的一个或多个),细胞因子,红细胞生成素(EPO),胰岛素,G-CSF、GM-CSF、hPG-CSF、M-CSF或其组合,干扰素(例如,干扰素-α、干扰素-β、干扰素-γ),凝血因子(例如,因子VIII、因子IX),或tPA hGH,受体,受体激动剂,抗体(例如但不限于利妥昔单抗(Rituxan)),神经多肽,胰岛素,疫苗,生长因子(例如但不限于表皮生长因子、角化细胞生长因子、转化生长因子),生长调节剂,抗原,自身抗原或其片段,或以上的组合。
目标蛋白还可以包括流感血凝素(HA;参见WO 2009/009876,将其通过引用并入本文)。HA是同源三聚体膜I型糖蛋白,其通常包含信号肽、HA1结构域,和HA2结构域(其包含在C-端的跨膜锚定位点以及小的胞质尾区)。编码HA的核苷酸序列是熟知的且可获得(参见,例如,在URL:biohealthbase.org/GSearch/home.do?decorator=Influenza的生物防御公共卫生数据库(Influenza Research Database;Squires et al.,2008Nucleic AcidsResearch 36:D497-D503);或由美国国家生物技术信息中心(参见URL:ncbi.nlm.nih.gov)维护的数据库,将其二者通过引用并入本文)。
HA蛋白可以是A型流感HA蛋白、B型流感HA蛋白,或者是选自以下的A型流感HA亚型:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16。在本发明的一些方面中,HA可以来自A型流感,其选自:H1、H2、H3、H5、H6、H7和H9。上文所列的HA片段也可被认为是目标蛋白。此外,可以将来自上文所列的HA型或亚型的结构域组合,以产生嵌合的HA(参见例如WO2009/076778,将其通过引用并入本文)。
包含HA蛋白的亚型实例包括:A/新喀里多尼亚(New Caledonia)/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/小鸡/纽约(New York)/1995、A/银鸥/DE/677/88(H2N8)、A/德克萨斯(Texas)/32/2003、A/野鸭/MN/33/00、A/鸭/上海(Shanghai)/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略(Ontario)/6118/68(H8N4)、A/琶嘴鸭/伊朗(Iran)/G54/03、A/小鸡/德国(Germany)/N/1949(H10N7)、A/鸭/英国(England)/56(H11N6)、A/鸭/亚伯达(Alberta)/60/76(H12N5)、A/鸥/马里兰(Maryland)/704/77(H13N6)、A/野鸭/Gurjev/263/82、A/鸭/澳大利亚(Australia)/341/83(H15N8)、A/棕头鸥/瑞典(Sweden)/5/99(H16N3)、B/Lee/40、C/约翰尼斯堡(Johannesburg)/66、A/波多黎各(PuertoRico)/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛(Solomon Islands)3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡(Singapore)/1/57(H2N2)、A/安徽(Anhui)/1/2005(H5N1)、A/越南(Vietnam)/1194/2004(H5N1)、A/短颈野鸭/香港(HongKong)/W312/97(H6N1)、A/马/布拉格(Prague)/56(H7N7)、A/香港/1073/99(H9N2))。
HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。例如,H1蛋白可以来自:A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/加利福尼亚/04/2009(H1N1)或A/加利福尼亚/07/2009(H1N1)毒株。H3蛋白还可以来自:A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/维多利亚/361/2011(H3N2)、A/德克萨斯/50/2012(H3N2)、A/夏威夷(Hawaii)/22/2012(H3N2)、A/纽约/39/2012(H3N2)或A/珀斯(Perth)/16/2009(H3N2)毒株。在本发明的另一方面中,H2蛋白可以来自A/新加坡/1/57(H2N2)毒株。H5蛋白可以来自:A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005毒株。在本发明的方面中,H6蛋白可以来自A/短颈野鸭/香港/W312/97(H6N1)毒株。H7蛋白可以来自:A/马/布拉格/56(H7N7)毒株或H7A/杭州/1/2013、A/安徽/1/2013(H7N9)或A/上海/2/2013(H7N9)毒株。在本发明的一个方面中,H9蛋白来自A/香港/1073/99(H9N2)毒株。在本发明的又一方面中,HA蛋白可以来自B型病毒的流感病毒,其包括B/马来西亚/2506/2004、B/佛罗里达/4/2006、B/布里斯班/60/08、B/马萨诸塞/2/2012-样病毒(Yamagata系)或B/威斯康星/1/2010(Yamagata系)。来自H1、H2、H3、H5、H6、H7、H9或B亚型的HA蛋白的氨基酸序列的非限制性实例,包括如WO 2009/009876、WO2009/076778、WO 2010/003225中所描述的序列(将其通过引用并入本文)。流感病毒HA蛋白可以是H5印度尼西亚。
HA还可以是嵌合的HA,其中HA的天然跨膜结构域被异源跨膜结构域代替。HA蛋白的跨膜结构域是高度保守的(参见例如WO 2010/148511的图1C;将其通过引用并入本文)。异源跨膜结构域可以获自任何HA跨膜结构域,例如但不限于来自以下的跨膜结构域:H1加利福尼亚、B/佛罗里达/4/2006(GenBank登录号ACA33493.1)、B/马来西亚/2506/2004(GenBank登录号ABU99194.1)、H1/Bri(GenBank登录号ADE28750.1)、H1A/所罗门群岛/3/2006(GenBank登录号ABU99109.1)、H1/NC(GenBank登录号AAP34324.1)、H2A/新加坡/1/1957(GenBank登录号AAA64366.1)、H3A/布里斯班/10/2007(GenBank登录号ACI26318.1)、H3A/威斯康星/67/2005(GenBank登录号ABO37599.1)、H5A/安徽/1/2005(GenBank登录号ABD28180.1)、H5A/越南/1194/2004(GenBank登录号ACR48874.1)、H5-印度尼西亚(GenBank登录号ABW06108.1)。跨膜结构域还可以通过下述共有氨基酸序列来定义:
iLXiYystvAiSslXlXXmlagXsXwmcs(SEQ ID NO:78)
HA可以包含天然或非天然信号肽;非天然信号肽可以是植物来源的。天然信号肽可对应于待表达的血凝素的天然信号肽,或可对应于第二血凝素。此外,信号肽可以来自除流感以外的病毒的结构蛋白或血凝素。可使用的信号肽的非限制性实例是苜蓿蛋白二硫键异构酶的信号肽(PDI SP;登录号Z11499的核苷酸32-103),或马铃薯糖蛋白信号肽(PatASP;位于GenBank登录号A08215的核苷酸1738-1806)。该登录号的PatA SP的核苷酸序列是:
ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT(SEQ ID NO:79)
马铃薯糖蛋白A信号肽的氨基酸序列是:
MATTKTFLILFFMILATTSSTCA(SEQ ID NO:80)
本发明还提供了包含编码HA蛋白的序列的核酸分子。所述核酸分子还可以包含与编码HA蛋白的序列可操作地连接的一个或多个调控区。所述核酸分子可以包含编码H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16的序列或来自B型流感的HA的序列。例如,由核酸分子编码的HA蛋白可以是H1、H2、H3、H5、H6、H7、H9亚型或来自B型的HA。由核酸编码的H1蛋白可以来自:A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/加利福尼亚/04/2009(H1N1)或A/加利福尼亚/07/2009(H1N1)毒株。由核酸分子编码的H3蛋白可以来自:A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/维多利亚/361/2011(H3N2)、A/德克萨斯/50/2012(H3N2)、A/夏威夷/22/2012(H3N2)、A/纽约/39/2012(H3N2)、或A/珀斯/16/2009(H3N2)毒株。由核酸分子编码的H2蛋白可以来自A/新加坡/1/57(H2N2)毒株。由核酸分子编码的H5蛋白来自:A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005毒株。由核酸分子编码的H6蛋白可以来自A/短颈野鸭/香港/W312/97(H6N1)毒株。由核酸分子编码的H7蛋白可以来自:A/马/布拉格/56H7N7)毒株、或H7A/杭州/1/2013、A/安徽/1/2013(H7N9)、或A/上海/2/2013(H7N9)毒株。此外,由核酸分子编码的H9蛋白可以来自A/香港/1073/99(H9N2)毒株。由核酸分子编码的HA蛋白可以来自流感病毒B型病毒,所述流感病毒B型病毒包括:B/马来西亚/2506/2004、B/佛罗里达/4/2006、B/布里斯班/60/08、B/马萨诸塞/2/2012-样病毒(Yamagata系)或B/威斯康星/1/2010(Yamagata系)。来自H1、H2、H3、H5、H6、H7、H9或B亚型的HA蛋白的氨基酸序列的非限制性实例,包括如WO 2009/009876、WO2009/076778、WO2010/003225中所描述的序列(将其通过引用并入本文)。流感病毒HA蛋白可以是H5印度尼西亚。
表1:如本文所述制备的构建体实例:
基于CMPV-HT的构建体
(包含SEQ ID NO:4的构建体;现有技术)
基于CPMV160+的构建体
(包含SEQ ID NO:2的构建体)
基于CPMV160的构建体
(包含SEQ ID NO:1的构建体)
1:SP-信号肽
2:PDI-苜蓿蛋白二硫键异构酶
3:WT-野生型或天然
4:TMCT-跨膜结构域和胞质尾区
如果目标核酸序列编码对植物直接或间接有毒的产物,则可以通过在期望的组织内或在植物发育的期望阶段选择性表达目标核苷酸序列来减少此类毒性。
目标编码区或目标核苷酸序列可以在任何合适的植物宿主中表达,所述合适的宿主被本发明的核苷酸序列、或核酸分子、或基因构建体、或载体转化或者包含本发明的核苷酸序列、或核酸分子、或基因构建体、或载体。合适的宿主实例包括但不限于拟南芥,农作物,所述农作物包括例如油菜(canola)、芸苔属(Brassica spp.)、玉米、烟草属(Nicotianaspp.)(烟草)(例如烟草本塞姆氏(Nicotiana benthamiana))、苜蓿、马铃薯、甘薯(金叶甘薯(Ipomoea batatus))、人参、豌豆、燕麦、大米、大豆、小麦、大麦、向日葵、棉花、玉米、黑麦(黑麦(Secale cereale))、高粱(甜杆(Sorghum bicolor)、高粱(Sorghum vulgare))、红花(红花(Carthamus tinctorius))。
本文使用的术语“生物质”和“植物物质”,指源自植物的任何材料。生物质或植物物质可以包括整株植物,或植物的部分,所述植物的部分包括叶、根、茎、花、种子。其还可包括植物的任何组织、植物的任何细胞、或植物的任何部分、部分或植物、组织或细胞。而且,生物质或植物物质可以包含细胞内植物组分,细胞外植物组分、植物的液体或固体提取物、或它们的组合。而且,生物质或植物物质可以包括来自植物叶、茎、果实、根或其组合的植物、植物细胞、组织、液体提取物或其组合。植物的一部分可以包含植物物质或生物质。
“调控区”、“调控元件”或“启动子”意指核酸的一部分,其典型地但不总是位于基因的蛋白编码区的上游,其可以由DNA或RNA、或DNA和RNA二者组成。当调控区有活性且与目标基因可操作地结合或可操作地连接时,可以导致目标基因的表达。调控元件可能能够介导器官特异性,或控制发育基因或时序基因的激活。“调控区”包括启动子元件,展示基本启动子活性的核心启动子元件,可诱导以应答外部刺激的元件,介导启动子活性的元件,如负调控元件或转录增强子。本文使用的“调控区”还包括转录后有活性的元件,例如,调节基因表达的调控元件,如翻译和转录增强子、翻译和转录阻遏物、上游活化序列、以及mRNA不稳定决定簇。这些后面元件中的数种可以位于编码区的近端。
在本公开的上下文中,术语“调控元件”或“调控区”典型地指DNA的序列,其通常但不总是位于结构基因的编码序列上游(5’),其通过为RNA聚合酶和/或转录所需的其它因子提供识别以在特定位点开始转录来控制编码区的表达。然而,应当理解,位于内含子内的其它核苷酸序列,或所述序列的3’还可以有助于调控目标编码区的表达。为RNA聚合酶或其它转录因子提供识别以确保在特定位点起始的调控元件的实例是启动子元件。大多数但不是所有真核启动子元件,均含有TATA盒(由通常位于转录起始位点上游约25个碱基对位置的腺苷和胸苷核苷酸碱基对组成的保守核酸序列)。启动子元件可以包含负责转录起始的基本启动子元件,以及修饰基因表达的其它调控元件(如上文所列)。
存在数种类型的调控区,其包括发育调控型、诱导型或组成型的调控区。在某些器官或器官的组织内,在所述器官或组织的发育期间的特定时间下,将发育调控型的或控制在其控制下的基因差异表达的调控区激活。然而,发育调控型的某些调控区,可以优先地在某些器官或组织的特定发育阶段下有活性,它们还可以以发育调控的方式有活性,或者在植物内的其它器官或组织中处在本底水平。组织特异性调控区(例如种子特异性调控区)的实例包括napin启动子和cruciferin启动子(Rask et al.,1998,J.Plant Physiol.152:595-599;Bilodeau et al.,1994,Plant Cell 14:125-130)。叶特异性启动子的实例包括质体蓝素启动子(参见US 7,125,978,将其通过引用并入本文)。
诱导型调控区是在对诱导物应答时,能够直接或间接地激活一个或多个DNA序列或基因的转录的调控区。缺少诱导物时,DNA序列或基因将不会被转录。典型地,与诱导型调控区特异性地结合以激活转录的蛋白因子,可以以无活性的形式存在,然后通过诱导物将其直接或间接地转化成活性形式。然而,蛋白因子也可以不存在。诱导物可以是化学物质,如蛋白、代谢物、生长调节剂、除草剂或酚类化合物,或者直接通过热、冷、盐或有毒元素或者间接通过诸如病毒的病原体或病原的作用强加的生理应激。通过向细胞或植物外部应用诱导物如通过喷涂、洒水、加热或类似的方法,可以将含有诱导型调控区的植物细胞暴露于诱导物。诱导型调控元件可以源自植物或非植物的基因(如Gatz,C.and Lenk,I.R.P.,1998,Trends Plant Sci.3,352-358;将其通过引用并入)。潜在的诱导型启动子的实例,包括但不限于:四环素诱导型启动子(Gatz,C.,1997,Ann.Rev.Plant Physiol.PlantMol.Biol.48,89-108;将其通过引用并入)、类固醇诱导型启动子(Aoyama,T.and Chua,N.H.,1997,Plant J.2,397-404;将其通过引用并入),以及乙醇诱导型启动子(Salter,M.G.,et al,1998,Plant Journal 16,127-132;Caddick,M.X.,et al,1998,NatureBiotech.16,177-180,将其通过引用并入)、细胞分裂素诱导型IB6和CKI1基因(Brandstatter,I.and Kieber,J.J.,1998,Plant Cell 10,1009-1019;Kakimoto,T.,1996,Science 274,982-985;将其通过引用并入),以及植物生长素诱导型元件DR5(Ulmasov,T.,et al.,1997,Plant Cell 9,1963-1971;将其通过引用并入)。
组成型调控区控制基因在植物的不同部分以及持续地在整个植物发育中的表达。已知的组成型调控元件的实例,包括与以下物质相关的启动子:CaMV 35S转录物(p35S;Odell et al.,1985,Nature,313:810-812)、水稻肌动蛋白1(Zhang et al,1991,PlantCell,3:1155-1165)、肌动蛋白2(An et al.,1996,Plant J.,10:107-121)或tms 2(U.S.5,428,147,将其通过引用并入本文),以及磷酸丙糖异构酶1(Xu et.al.,1994,PlantPhysiol.106:459-467)基因、玉米泛素1基因(Cornejo et al,1993,Plant Mol.Biol.29:637-646)、拟南芥泛素1和6基因(Holtorf et al,1995,Plant Mol.Biol.29:637-646)、烟草翻译起始因子4A基因(Mandel et al,1995Plant Mol.Biol.29:995-1004);以及木薯叶脉花叶病毒启动子,pCAS(Verdaguer et al.,1996);核酮糖二磷酸羧化酶小亚基的启动子,pRbcS:(Outchkourov et al.,2003),pUbi(用于单子叶植物和双子叶植物)。
如本文所述,包含在叶片中表达被证明有效的增强子序列的调控区,已发现在瞬时表达中有效。不希望受理论束缚,通过将光合基因的上游调控元件结合至核基质,可以介导强烈的表达。例如,从豌豆质体蓝素(US 7,125,978,将其通过引用并入本文)的翻译起始位点起多至-784的位置,可以用来介导强的报道基因的表达。
如本文所用,术语“组成型”不一定指示在组成型调控区控制下的核苷酸序列,在所有细胞类型中以相同的水平表达,但是所述序列在宽范的细胞类型中表达,尽管常常观察到丰度的变化。
上文所描述的表达构建体可以在载体中存在。载体可以包含允许表达盒转移并整合进生物体或宿主的基因组内的边界序列。构建体可以是植物二元载体,例如基于pPZP的二元转化载体(Hajdukiewicz,et al.1994)。其它实例构建体包括pBin19(参见Frisch,D.A.,L.W.Harris-Haller,et al.1995,Plant Molecular Biology 27:405-409)。
若需要,可以对本发明的构建体进行进一步操作以包括可选择标志物。然而,这可能是不需要的。有用的可选择标志物包括提供对化学物质有抗性的酶,所述化学物质为诸如庆大霉素、潮霉素、卡那霉素的抗生素,或诸如草胺膦、草甘膦、氯磺隆等的除草剂。同样地,可以使用这样的酶,其提供用于产生通过颜色变化可识别的化合物如GUS(β-葡糖醛酸酶)或用于产生通过发光可识别的化合物(如荧光素酶或GFP)。
载体还可以包括本文所描述的表达增强子。所述表达增强子可以位于T-DNA上,其还含有基因沉默抑制子和NPTII。多接头还可以编码一组或两组6x组氨酸残基,以允许向目标蛋白引入N-端或C-端His-标签从而促进蛋白的纯化。
转录后基因沉默(PTGS)可能涉及转基因在植物中的有限表达,并且来自马铃薯病毒Y(HcPro)的沉默抑制子的共表达可用来中和转基因mRNA的特异性降解(Brigneti etal.,1998,EMBO J.17,6739-6746,将其通过引用并入本文)。可选的沉默抑制子是本领域熟知的,且可如本文所述使用(Chiba et al.,2006,Virology 346:7-14;将其通过引用并入本文),所述沉默抑制子例如但不限于:TEV-p1/HC-Pro(烟草蚀纹病毒-p1/HC-Pro)、BYV-p21、番茄丛矮病毒的p19(TBSV p19;p19的构建描述于WO 2010/0003225、将其通过引用并入本文)、番茄皱缩病毒的衣壳蛋白(TCV-CP)、黄瓜花叶病毒的2b(CMV-2b)、马铃薯病毒X的p25(PVX-p25)、马铃薯病毒M的p11(PVM-p11)、马铃薯病毒S的p11(PVS-p11)、蓝莓枯黄病毒的p16(BScV-p16)、柑橘速衰病毒的p23(CTV-p23)、葡萄卷叶伴随病毒-2的p24(GLRaV-2p24)、葡萄病毒A的p10(GVA-p10)、葡萄病毒B的p14(GVB-p14)、独活潜隐病毒的p10(HLV-p10)、或大蒜普通潜隐病毒的p16(GCLV-p16)。
因此,可以将例如但不限于以下沉默抑制子中的一种或多种:HcPro、TEV-p1/HC-Pro、BYV-p21、TBSV p19、TCV-CP、CMV-2b、PVX-p25、rgscam、来自FHV的B2蛋白、CPMV的小外壳蛋白、以及来自TCV的外壳蛋白、PVM-p11、PVS-p11、BScV-p16、CTV-p23、GLRaV-2p24、GBV-p14、HLV-p10、GCLV-p16、或GVA-p10,与基于豇豆花叶病毒属的表达盒、双粒病毒属来源的扩增元件以及编码目标蛋白的核酸序列一起共表达,以进一步确保在植物内产生高水平的蛋白。
利用Ti质粒、Ri质粒、植物病毒载体、直接的DNA转化、微注射、电穿孔等,可以将本发明的构建体引入植物细胞。为了评述此类技术,参见例如Weissbach and Weissbach,Methods for Plant Molecular Biology,Academy Press,New York VIII,pp.421-463(1988);Geierson and Corey,Plant Molecular Biology,2d Ed.(1988);以及Miki andIyer,Fundamentals of GeneTransfer in Plants.In Plant Metabolism,2dEd.DT.Dennis,DH Turpin,DD Lefebrve,DB Layzell(eds),Addison Wesly,LangmansLtd.London,pp.561-579(1997)。其它方法包括:直接的DNA摄取、利用脂质体、电穿孔例如利用原生质体、微注射、微粒或晶须和真空渗入。参见,例如,Bilang,et al.(1991,Gene100:247-250),Scheid et al.(1991,Mol.Gen.Genet.228:104-112),Guerche et al.(1987,Plant Science 52:111-116),Neuhause et al.(1987,Theor.Appl Genet.75:30-36),Klein et al.,(2987,Nature 327:70-73);Freeman et al.(1984,Plant CellPhysiol.29:1353),Howell et al.(1980,Science 208:1265),Horsch et al.(1985,Science 227:1229-1231),DeBlock et al.,(1989,Plant Physiology 91:694-701),《植物分子生物学方法》(Methods for Plant Molecular Biology)(Weissbach andWeissbach,编著,Academic Press Inc.,1988),《植物分子生物学方法》(Methods inPlant Molecular Biology)(Schuler and Zielinski,编著,Academic Press Inc.,1989),WO 92/09696,WO 94/00583,EP 331083,EP 175966,Liu and Lomonossoff(2002,JVirol Meth,105:343-348),EP 290395;WO 8706614;美国专利第4,945,050号、第5,036,006号和第5,100,792号;于1995年5月10日提交的美国专利申请第08/438,666号和于1992年9月25日提交的美国专利申请第07/951,715号(将其所有在此通过引用并入)。
瞬时表达方法可用来表达本发明的构建体(参见D’Aoust et al.,2009,Methodsin molecular biology,Vol 483,pages41-50;Liu and Lomonossoff,2002,Journal ofVirological Methods,105:343-348;将其通过引用并入本文)。可选地,可以使用基于真空的瞬时表达方法,其描述于Kapila et al.(1997,Plant Sci.122,101-108;将其通过引用并入本文)或WO 00/063400、WO 00/037663(将它们通过引用并入本文)。这些方法可以包括例如但不限于农杆菌接种或农杆菌浸润、注射器浸润的方法,然而,也可以使用如上所述的其它瞬时方法。采用农杆菌接种、农杆菌浸润或注射器浸润,包含期望的核酸的农杆菌混合物进入组织的细胞内空间,例如植物的叶、地上部分(包括茎、叶和花),植物的其它部分(茎、根、花)或整株植物。穿过表皮之后,农杆菌感染细胞并将t-DNA拷贝转移进细胞。t-DNA以游离基因的形式转录,并进行mRNA翻译,导致在感染细胞中产生目标蛋白,然而,t-DNA在核内部的传代是瞬时的。
本发明还考虑的部分是,含有本发明的基因构建体的转基因植物、植物细胞或种子,其可被用作适合于本文所描述的瞬时蛋白表达的平台植物。从植物细胞再生整株植物的方法,也是本领域已知的(例如,参见Guerineau and Mullineaux(1993,Planttransformation and expression vectors.In:Plant Molecular Biology Labfax(CroyRRD ed)Oxford,BIOS Scientific Publishers,pp 121-148)。大体上,将转化的植物细胞培养在合适的培养基中,所述培养基可以含有诸如抗生素的选择剂,其中该可选择标志物用来促进识别转化的植物细胞。一旦愈伤组织形成,根据已知的方法通过采用合适的植物激素可以促进芽的形成,并且将嫩枝转移至生根培养基,用于植物的再生。然后,所述植物可被用来从种子或利用无性繁殖技术建立反复传代。在不利用组织培养的情况下,也可以产生转基因植物。本领域建立了用于稳定转化以及再生这些生物体的方法,并且所述方法对本领域技术人员而言是已知的。可用的技术评述于Vasil et al.,(Cell Culture andSomatic Cell Genetics of Plants,VoI I,Il and III,Laboratory Procedures andTheir Applications,Academic Press,1984)和Weissbach and Weissbach,(Methods forPlant Molecular Biology,Academic Press,1989)。获得转化且再生的植物的方法,对本发明而言不是关键的。
如果植物、植物部分或植物细胞待被转化或待被两种或更多种核酸构建体共转化,则可以将核酸构建体以单一转染事件的形式引入农杆菌,将核酸合并,并如所述进行细菌细胞的转染。可选地,可以连续引入构建体。在该实例中,如所述向农杆菌引入第一构建体,细胞在只有单一转化细菌可以生长的选择性条件(如抗生素的存在)下生长。该第一选择步骤之后,如所述向农杆菌引入第二核酸构建体,并且细胞在只有双转化的细菌可以生长的双重选择条件下生长。然后可用双转化的细菌来转化本文所描述的植物、植物部分或植物细胞,或者可经历进一步的转化步骤来容纳第三核酸构建体。
可选地,如果植物、植物部分或植物细胞待被转化或待被两种或更多种核酸构建体共转化,则通过共浸润农杆菌细胞与植物、植物部分或植物细胞的混合物,可以将核酸构建体引入至植物,各农杆菌细胞可以包含一种或多种待被引入至植物内的构建体。为了改变构建体内的目标核苷酸序列在植物、植物部分或植物细胞内的相对表达水平,在浸润的步骤期间,可以改变包含期望的构建体的不同农杆菌群体的浓度。
本公开还提供了包含本文所定义的表达系统的转基因植物,其中当与缺乏本文所述表达系统的一个或多个组件的其它类似表达系统如CMPV HT(SEQ ID NO:4)相比时,表达盒中的目标异源核酸以增加的水平表达。
本公开还包含用于产生目标蛋白的方法,其包括以下步骤:提供表达本文所描述的表达系统的植物或植物部分,至少收集其中表达目标蛋白的组织,以及任选地将目标蛋白从所述组织分离。
因此,在各个方面中,且并非是限制性的,本发明提供了:
-表达增强子,其包含选自以下序列中任一项的豇豆花叶病毒属5’UTR:SEQ IDNO:1、2、24、27、68、69和70-77,或包含与SEQ ID NO:1、2、24、27、68、69和70-77中任一项呈现100%、99%、98%、97%、96%、95%、90%、85%或80%同一性的核苷酸序列,其中本文所描述的表达增强子,当与植物调控区和植物kozak序列可操作地连接时,与利用相同植物调控区的CMPV HT(SEQ ID NO:4;包含不完整M蛋白的现有技术增强子序列,描述于SainsburyF.,and Lomonossoff G.P.,2008,Plant Physiol.148:pp.1212-1218;将其通过引用并入本文)融合的目标核苷酸序列的表达水平相比,其增加与所述表达增强子可操作地连接的目标核苷酸序列的表达水平。
-一种或多种表达系统,其包含如上定义的基于豇豆花叶病毒属的表达增强子或表达盒、启动子(调控区),任选地包含多接头、kozak序列、编码目标蛋白的核酸以及终止子。
-利用本文所描述的一种或多种表达系统或载体,在宿主生物体如植物中表达目标蛋白的方法。
-表达来自本发明的一种或多种表达系统或载体的目标蛋白的宿主细胞和生物体,以及产生宿主和生物体的方法。
表2:序列的列表
实施例
实施例1
2X35S/CPMV-HT/PDISP/H3维多利亚/NOS(构建体1391号)
利用下述基于PCR的方法,将编码来自流感A/维多利亚/361/2011的其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换的H3的序列(PDISP/H3维多利亚),克隆进2X35S-CPMV-HT-NOS表达系统(原先的CMPV-HT)。利用PDISP/H3维多利亚序列(图6C,SEQ IDNO:18)作为模板,使用引物IF-PDI.s1+3c(图6A,SEQ ID NO:67)和IF-H3V36111.s1-4r(图6B,SEQ ID NO:17),对含有PDISP/H3维多利亚编码序列的片段进行扩增。利用In-Fusion克隆系统(Clontech,Mountain View,CA),将PCR产物在2X35S/CPMV-HT/NOS表达系统中克隆。用SacII和StuI限制性酶消化构建体1191号(图6D),以及将线性化质粒用于In-Fusion组装反应。构建体1191号是受体质粒,用于将在基于CPMV-HT的表达盒中的目标基因进行“InFusion”克隆。其还掺入有用于共表达在苜蓿质体蓝素基因启动子和终止子下的TBSV P19沉默抑制子的基因构建体。骨架是pCAMBIA双元质粒,并且在图6E中呈现从左至右t-DNA边界的序列(SEQ ID NO:19)。得到的构建体被指定为1391号(图6F,SEQ ID NO:20)。图6G中呈现来自流感A/维多利亚/361/2011的与PDISP融合的成熟H3的氨基酸序列(SEQ ID NO:21)。图6H中呈现质粒1391的示意图。
实施例2
2X35S/CPMV160+/PDISP/H3维多利亚/NOS(构建体1800号)
利用下述基于PCR的方法,将编码来自流感A/维多利亚/361/2011的其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换的H3的序列(PDISP/H3维多利亚),克隆进2X35S/CPMV160+/NOS表达系统(CPMV160+)。利用PDISP/H3维多利亚序列(图7C,SEQ ID NO:24)作为模板,使用引物IF**(SacII)-PDI.s1+4c(图7A,SEQ ID NO:22)和IF-H3V36111.s1-4r(图7B,SEQ ID NO:23),对含有PDISP/H3维多利亚编码序列的片段进行扩增。利用In-Fusion克隆系统(Clontech,Mountain View,CA),将PCR产物在2X35S/CPMV160+/NOS表达系统中克隆。用SacII和StuI限制性酶消化构建体2171号(图7D),并且将线性化质粒用于In-Fusion组装反应。构建体2171号是受体质粒,用于将在基于CPMV160+的表达盒中的目标基因进行“In Fusion”克隆。其还掺入有用于共表达在苜蓿质体蓝素基因启动子和终止子下的TBSV P19沉默抑制子的基因构建体。骨架是pCAMBIA双元质粒,以及图7E中呈现从左至右t-DNA边界的序列(SEQ ID NO:25)。得到的构建体被指定为1800号(图7F,SEQ ID NO:26)。图7G中呈现来自流感A/维多利亚/361/2011的与PDISP融合的成熟H3的氨基酸序列(SEQ IDNO:27)。图7H中呈现质粒1800的示意图。
实施例3
2X35S/CPMV160/PDISP/H3维多利亚/NOS(构建体1935号)
利用下述基于PCR的方法,将编码来自流感A/维多利亚/361/2011的其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换的H3的序列(PDISP/H3维多利亚),克隆进2X35S-CPMV160-NOS表达系统中。利用PDISP/H3维多利亚序列(图7C,SEQ ID NO:24)作为模板,使用引物IF-CPMV(fl5'UTR)_SpPDI.c(图8A,SEQ ID NO:28)和IF-H3V36111.s1-4r(图7B,SEQ ID NO:23),对含有PDISP/H3维多利亚编码序列的片段进行扩增。利用In-Fusion克隆系统(Clontech,Mountain View,CA),将PCR产物在2X35S/CPMV160/NOS表达系统中克隆。用SacII和StuI限制性酶消化构建体1190号(图8B),以及将线性化质粒用于In-Fusion组装反应。构建体1190号是受体质粒,用于将在基于CPMV160的表达盒中的目标基因进行“InFusion”克隆。其还掺入有用于共表达在苜蓿质体蓝素基因启动子和终止子下的TBSV P19沉默抑制子的基因构建体。骨架是pCAMBIA双元质粒,以及图8C中呈现从左至右t-DNA边界的序列(SEQ ID NO:29)。得到的构建体被指定为1935号(图8D,SEQ ID NO:30)。图7G中呈现来自流感A/维多利亚/361/2011的与PDISP融合的成熟H3的氨基酸序列(SEQ ID NO:27)。图8E中呈现质粒1935的示意图。
实施例4
2X35S/CPMV160+/NOS表达系统中PDISP/H3维多利亚的SacII限制性位点和ATG之 间的序列变异(构建体1992号至1999号)
利用与用于构建体1800号相同的基于PCR的方法(参见实施例2),利用修饰的正向引物且保持所有其它组分相同,产生八种构建体,所述八种构建体包含在2X35S/CPMV160+/NOS表达系统中PDISP/H3维多利亚的SacII限制性位点和ATG之间的序列变异。利用图9A-9H中所列的引物,引物:
IF-HT1*(-Mprot)-PDI.c(图9A,SEQ ID NO:31)、
IF-HT2*(-Mprot)-PDI.c(图9B,SEQ ID NO:32)、
IF-HT3*(-Mprot)-PDI.c(图9C,SEQ ID NO:33)、
IF-HT4*(-Mprot)-PDI.c(图9D,SEQ ID NO:34)、
IF-HT5*(-Mprot)-PDI.c(图9E,SEQ ID NO:35)、
IF-HT6*(-Mprot)-PDI.c(图9F,SEQ ID NO:36)、
IF-HT7*(-Mprot)-PDI.c(图9G,SEQ ID NO:37)以及
IF-HT8*(-Mprot)-PDI.c(图9H,SEQ ID NO:38);
对变体HT1*至HT8*进行扩增,以分别产生构建体1992号至1999号。图9I中呈现质粒1992的示意图。类似特征被用来制备构建体1993-1999。
实施例5
对PDISP/H1加利福尼亚的2X35S/CPMV HT(构建体484号)和2X35S/CPMV160+(构 建体1897号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/H1加利福尼亚特别设计的修饰的PCR引物,将这样的编码序列(PDISP/H1加利福尼亚)(图10A,SEQ ID NO:39)克隆进原先的CPMV-HT和CPMV160,所述编码序列对应于来自流感A/加利福尼亚/7/2009的H1,其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图10B中呈现来自流感A/加利福尼亚/7/2009的与PDISP融合的成熟H1的氨基酸序列(SEQ ID NO:40)。图10C和10D中呈现质粒484和1897的示意图。
实施例6
针对H5印度尼西亚的2X35S/CPMV HT(构建体489号)、2X35S/CPMV160+(构建体 1880号)和2X35S/CPMV160(构建体1885号)
分别利用与构建体1391(参见实施例1)、1800(参见实施例2)和1935(参见实施例3)相同的基于PCR的方法,但使用为H5印度尼西亚特别设计的修饰的PCR引物,将对应于来自流感A/印度尼西亚/5/2005的天然H5的编码序列(图11A,SEQ ID NO:41),克隆进原先的CPMV-HT、CPMV160+和CPMV160。图11B中呈现来自流感A/印度尼西亚/5/2005的天然H5的氨基酸序列(SEQ ID NO:42)。图11C至图11E中呈现质粒489、1880和1885的示意图。
实施例7
对PDISP-H7杭州的2X35S/CPMV HT(构建体2140号)和2X35S/CPMV160+(构建体 2168号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/H7杭州特别设计的修饰的PCR引物,将这样的编码序列(PDISP/H7杭州)(图12A,SEQ ID NO:43)克隆进原先的CPMV-HT和CPMV160+,所述编码序列对应于来自流感A/杭州/1/2013的H7,其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图12B中呈现来自流感A/杭州/1/2013的与PDISP融合的成熟H7的氨基酸序列(SEQ ID NO:44)。图12C和12D中呈现质粒2140和2168的示意图。
实施例8
对PDISP/H7杭州+H5印度尼西亚TMCT的2X35S/CPMV HT(构建体2130号)和 2X35S/CPMV160+(构建体2188号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/H7杭州+H5印度尼西亚TMCT特别设计的修饰的PCR引物,将这样的嵌合血凝素编码序列(PDISP/H7杭州+H5印度尼西亚TMCT)(图13A,SEQ ID NO:45)克隆进原先的CPMV-HT和CPMV160+,所述嵌合血凝素编码序列对应于与来自流感A/印度尼西亚/5/2005的H5的跨膜结构域和胞质尾区(TMCT)融合且具有苜蓿蛋白二硫键异构酶信号肽的、来自流感A/杭州/1/2013的H7的胞外域。图13B中呈现与PDISP融合的H7杭州+H5印度尼西亚TMCT的氨基酸序列(SEQ ID NO:46)。图13C和13D中呈现质粒2130和2188的示意图。
实施例9
针对PDISP/HA B布里斯班(PrL-)的2X35S/CPMV HT(构建体1039号)和2X35S/ CPMV160+(构建体1937号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/HA B布里斯班(PrL-)特别设计的修饰的PCR引物,将这样的编码序列(PDISP/HA B布里斯班(PrL-))(图14A,SEQ ID NO:47)克隆进原先的CPMV-HT和CPMV160+,所述编码序列对应于来自流感B/布里斯班/60/2008的具有缺失的蛋白水解环(PrL-)的HA(对于其它信息:HA序列中缺失的蛋白水解环区,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文),其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图14B中呈现与PDISP融合的成熟HA B布里斯班(PrL-)的氨基酸序列(SEQ ID NO:48)。图14C和图14D中呈现质粒1039和1937的示意图。
实施例10
对PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT的2X35S/CPMV HT(构建体 1067号)和2X35S/CPMV160+(构建体1977号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT特别设计的修饰的PCR引物,将这样的嵌合血凝素编码序列(PDISP/HA B布里斯班(PrL-)+H1加利福尼亚TMCT)(图15A,SEQ ID NO:49)克隆进原先的CPMV-HT和CPMV160+,所述嵌合血凝素编码序列对应于与来自流感A/加利福尼亚/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合且具有苜蓿蛋白二硫键异构酶信号肽的、来自流感B/布里斯班/60/08的具有缺失蛋白水解环(PrL-)的HA(对于其它信息:HA序列中缺失的蛋白水解环区,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文)的胞外域。图15B中呈现与PDISP融合的成熟HA B布里斯班(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ ID NO:50)。图15C和图15D中呈现质粒1067和1977的示意图。
实施例11
针对PDISP/HA B马萨诸塞(PrL-)的2X35S/CPMVHT(构建体2072号)和2X35S/ CPMV160+(构建体2050)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR方法,但使用为PDISP/HA B马萨诸塞(PrL-)特别设计的修饰的PCR引物,将这样的编码序列(PDISP/HA B马萨诸塞(PrL-))(图16A,SEQ ID NO:51)克隆进原先的CPMV-HT和CPMV160+,所述编码序列对应于来自流感B/马萨诸塞/2/2012的具有缺失的蛋白水解环(PrL-)的HA(对于其它信息:HA序列中缺失的蛋白水解环区,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文),其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图16B中呈现与PDISP融合的成熟HA B马萨诸塞(PrL-)的氨基酸序列(SEQ ID NO:52)。图16C和图16D中呈现质粒2072和2050的示意图。
实施例12
对PDISP/HAB马萨诸塞(PrL-)+H1加利福尼亚TMCT的2X35S/CPMVHT(构建体2074 号)和2X35S/CPMV160+(构建体2060号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT特别设计的修饰的PCR引物,将这样的嵌合血凝素编码序列(PDISP/HA B马萨诸塞(PrL-)+H1加利福尼亚TMCT)(图17A,SEQ ID NO:53)克隆进原先的CPMV-HT和CPMV160+,所述嵌合血凝素编码序列对应于与来自流感A/加利福尼亚/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合且具有苜蓿蛋白二硫键异构酶信号肽的、来自流感B/马萨诸塞/2/2012的具有缺失蛋白水解环(PrL-)的HA(对于其它信息:HA序列中缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文)的胞外域。图17B中呈现与PDISP融合的成熟HAB马萨诸塞(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ ID NO:54)。图17C和17D中呈现质粒2074和2060的示意图。
实施例13
对HA B威斯康星(PrL-)的2X35S/CPMV HT(构建体1445号)、2X35S/CPMV160+(构 建体1820号)和CPMV160(构建体1975号)
分别利用与构建体1391(参见实施例1)、1800(参见实施例2)和1935(参见实施例3)相同的基于PCR方法,但使用为HA B威斯康星(PrL-)特别设计的修饰的PCR引物,将这样的编码序列(HA B威斯康星(PrL-))(图18A,SEQ ID NO:55)克隆进原先的CPMV-HT、CPMV160+和CPMV160,所述编码序列对应于来自流感B/威斯康星/1/2010的具有缺失的蛋白水解环(PrL-)的HA(对于其它信息:HA序列中的缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文),所述HA具有其天然信号肽。图18B中呈现具有其天然信号肽的HA B威斯康星(PrL-)的氨基酸序列(SEQ ID NO:56)。图18C、18D和18E中分别呈现质粒1445、1820和1975的示意图。
实施例14
对HA B威斯康星(PrL-)+H1加利福尼亚TMCT的2X35S/CPMV HT(构建体1454号) 和2X35S/CPMV160+(构建体1893号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为HA B威斯康星(PrL-)+H1加利福尼亚TMCT特别设计的修饰的PCR引物,将这样的嵌合血凝素编码序列(HA B威斯康星(PrL-)+H1加利福尼亚TMCT)(图19A,SEQ ID NO:57)克隆进原先的CPMV-HT和CPMV160+,所述嵌合血凝素编码序列对应于与来自流感A/加利福尼亚/7/2009的H1的跨膜结构域和胞质尾区(TMCT)融合且具有HA B威斯康星的天然信号肽的、来自流感B/威斯康星/2/2012的具有缺失蛋白水解环(PrL-)的HA(对于其它信息:HA序列中的缺失的蛋白水解环区域,参见于2013年3月28日提交的美国临时专利申请第61/806,227号,将其通过引用并入本文)的胞外域。图19B中呈现HA B威斯康星(PrL-)+H1加利福尼亚TMCT的氨基酸序列(SEQ ID NO:58)。图19C和19D中呈现质粒1454和1893的示意图。
实施例15
对HC利妥昔单抗(Rituxan)的2X35S/CPMVHT(构建体5001号)和2X35S/CPMV160+ (构建体2100号)
分别利用与构建体1391(参见实施例1)和1800(参见实施例2)相同的基于PCR的方法,但使用为HC利妥昔单抗(Rituxan)特别设计的修饰的PCR引物,将对应于单克隆IgG1抗体利妥昔单抗的重链的编码序列(HC利妥昔单抗(Rituxan);图20A,SEQ ID NO:59),克隆进原先的CPMV-HT和CPMV160+。图20B中呈现HC利妥昔单抗(Rituxan)的氨基酸序列(SEQ IDNO:60)。图20C和图20D中呈现质粒5001和2100的示意图。
实施例16
对PDISP/HC利妥昔单抗(Rituxan)的2X35S/CPMV HT(构建体5002号)和2X35S/ CPMV160+(构建体2109号)
分别利用与构建体1391和1800相同的基于PCR的方法,但使用为PDISP/HC利妥昔单抗(Rituxan)特别设计的修饰的PCR引物,将这样的编码序列(PDISP/HC利妥昔单抗(Rituxan);图21A,SEQ ID NO:61)克隆进原先的CPMV-HT和CPMV160+,所述编码序列对应于单克隆IgG1抗体利妥昔单抗的重链,其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图21B中呈现与PDISP融合的成熟HC利妥昔单抗(Rituxan)的氨基酸序列(SEQ IDNO:62)。图21C和图21D中呈现质粒5002和2109的示意图。
实施例17
对LC利妥昔单抗(Rituxan)的2X35S/CPMV-HT(构建体5021号)和2X35S/CPMV160 +(构建体2120号)
分别利用与构建体1391和1800相同的基于PCR的方法,但使用为LC利妥昔单抗(Rituxan)特别设计的修饰的PCR引物,将对应于单克隆IgG1抗体利妥昔单抗的轻链的编码序列(LC利妥昔单抗Rituxan;图22A,SEQ ID NO:63),克隆进原先的CPMV-HT和CPMV160+。图22B中呈现LC利妥昔单抗(Rituxan)的氨基酸序列(SEQ ID NO:64)。图22C和图22D中呈现质粒5021和2120的示意图。
实施例18
对PDISP/LC利妥昔单抗(Rituxan)的2X35S/CPMV-HT(构建b5022号)和2X35S/CPMV160+(构建体2129号)
分别利用与构建体1391和1800相同的基于PCR的方法,但使用为PDISP/LC利妥昔单抗(Rituxan)特别设计的修饰的PCR引物,将这样的编码序列(PDISP/LC利妥昔单抗Rituxan;图23A,SEQ ID NO:65)克隆进原先的CPMV-HT和CPMV160+,所述编码序列对应于单克隆IgG1抗体利妥昔单抗的轻链,其中天然信号肽被苜蓿蛋白二硫键异构酶的天然信号肽替换。图23B中呈现与PDISP融合的成熟LC利妥昔单抗(Rituxan)的氨基酸序列(SEQ ID NO:66)。图23C和图23D中呈现质粒5022和2129的示意图。
实施例19
农杆菌转染
利用由D’Aoust et al 2008(Plant Biotechnology Journal 6:930-940)所描述的方法,使用DNA构建体通过电穿孔转染农杆菌菌株AGL1。将转染的农杆菌在补充有10mM2-(N-吗啉代)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素pH5.6的YEB培养基上生长至OD600为0.6至1.6。在使用之前将农杆菌悬浮液离心,并在渗透培养基(10mM MgCl2和10mM MES pH 5.6)中重悬。
制备植物生物质、接种物以及农杆菌渗入
在铺满商购泥煤苔基质的平地上由种子种植烟草本塞姆氏(Nicotianabenthamiana)植物。允许植物在16/8光周期以及25℃白天/20℃夜晚的温度方案的温室中生长。播种后三周,挑选出单个小植株,将其移植在盆中,并在相同环境条件的温室中继续生长另外三周。
被各个构建体转染的农杆菌在补充有10mM 2-(N-吗啉代)乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素pH 5.6的YEB培养基中生长,直到它们达到0.6至1.6的OD600。在使用之前将农杆菌悬浮液离心,并在渗透培养基(10mM MgCl2和10mMMES pH 5.6)中悬浮,且于4℃储存过夜。在渗入当天,将分批培养物在2.5倍的培养体积中稀释,并在使用之前允许加温。将烟草本塞姆氏整株植物在20-40Torr真空下密封不锈钢槽中的细菌悬浮液内倒置放置2分钟。将植物放回温室,持续2-6天培养期直到收集。
叶片的收集和总蛋白的提取
培养之后,收集植物的地上部分,将其于-80℃冷冻并压成碎片。通过使冻碎的植物材料各样本在3体积冷50mM Tris pH 8.0、0.15M NaCl、0.1%Triton X-100和1mM苯甲基磺酰氯中匀浆(Polytron),来提取总的可溶蛋白。匀浆之后,使浆体于4℃在10,000g离心10分钟,并且保留这些澄清的粗提取物(上清液),用于分析。
实施例20
蛋白分析和免疫印迹
利用牛血清白蛋白作为参考标准,通过Bradford分析(Bio-Rad,Hercules,CA)测定澄清的粗提取物的总蛋白含量。通过SDS-PAGE将蛋白分离,并电转移至聚偏二氟乙烯(PVDF)膜(Roche Diagnostics Corporation,Indianapolis,IN),用于免疫检测。在免疫印迹之前,于4℃用5%脱脂乳和0.1%的在Tris缓冲盐水中的吐温-20(TBS-T)将膜封闭16-18小时。
与2μg/ml一抗在0.1%TBS-吐温20的2%脱脂乳溶液中首先孵育(表4显示用于检测各HA的抗体和条件),以进行免疫印迹。用于化学发光检测的二抗在表4中显示,如所示在0.1%TBS-吐温20的2%脱脂乳溶液中稀释。利用鲁米诺作为底物(Roche DiagnosticsCorporation),通过化学发光检测免疫反应复合物。
表4:用于所表达蛋白的免疫印迹的电泳条件、抗体和稀释。
JIR:Jackson ImmunoResearch,West Grove,PA,USA;
CBER:Center for Biologics Evaluation and Research,Rockville,MD,USA.
Sino:Sino Biological inc.,Beijing,China.
TGA:Therapeutic Goods Administration,Australia.
NIBSC:National Institute for Biological Standards and Control,UnitedKingdom
ITC:Immune Technology Corp.,New York,NY,USA
实施例21
血凝分析
基于Nayak and Reichl(2004)所描述的方法,进行血凝分析。简言之,在含有100μL PBS的V形底的96孔微量滴定板中,制备测试样本(100μL)的连续二倍稀释液,每孔留有100μL稀释样本。向每孔内添加一百微升0.25%的火鸡血红细胞悬浮液(Bio Link Inc.,Syracuse,NY;用于所有B毒株、H1、H5和H7)或0.5%的豚鼠血红细胞悬浮液(用于H3),并且将板在室温下孵育2小时。显示出完全血凝反应的最高稀度的倒数,被记录为HA活性。
所有引文通过引用在此并入本文。
根据一个或多个实施方案描述本发明。然而,对本领域技术人员来说明显的是,在不脱离权利要求书中所定义的本发明范围的情况下,可以做出大量变化和修改。

Claims (23)

1.表达增强子,其包含CPMV 5’UTR核苷酸序列,所述CPMV5’UTR核苷酸序列由X个核苷酸组成(CMPVX),其中X=SEQ ID NO:1中的160个、155个、150个或114个,或者由与X个核苷酸的CMPVX具有约80%至100%序列相似性的核苷酸序列组成,其中X=SEQ ID NO:1中的160个、155个、150个或114个。
2.如权利要求1所述的表达增强子,其还包含长度约1至100个核苷酸的填充序列,所述填充序列与CMPV 5’UTR核苷酸序列的3’端融合(CMPVX+,其中X=SEQ ID NO:1中的160个、155个、150个或114个)。
3.如权利要求2所述的表达增强子,其中所述填充序列包含植物kozak序列。
4.如权利要求3所述的表达增强子,其中所述填充序列还包含多克隆位点。
5.如权利要求3所述的表达增强子,其中所述kozak序列选自如SEQ ID NO:5-17中所示的序列。
6.如权利要求2所述的表达增强子,其包含SEQ ID NO:2的核苷酸序列。
7.如权利要求1所述的表达增强子,其包含选自SEQ ID NO:24、27、68、69、70和71的核苷酸序列。
8.如权利要求2所述的表达增强子,其包含选自SEQ ID NO:72、73、74、75、76和77的核苷酸序列。
9.植物表达系统,其包含含有调控区和目标核苷酸序列的核酸序列,所述调控区与权利要求1所述的表达增强子可操作地连接。
10.如权利要求9所述的植物表达系统,其还包含豇豆花叶病毒属3’UTR。
11.如权利要求9所述的植物表达系统,其还包含第二核酸序列,所述第二核酸序列编码沉默抑制子。
12.如权利要求11所述的植物表达系统,其中所述沉默抑制子选自HcPro和p19。
13.如权利要求9所述的植物表达系统,其中所述调控区选自:质体蓝素启动子、CaMV35S启动子、2x CaMV35S启动子、CAS启动子、RbcS启动子、Ubi启动子或肌动蛋白启动子。
14.如权利要求9所述的植物表达系统,其中所述目标核苷酸序列编码病毒蛋白或抗体。
15.如权利要求14所述的植物表达系统,其中所述病毒蛋白是流感血凝素,其选自:H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16和B型流感血凝素。
16.如权利要求14所述的植物表达系统,其中编码所述病毒蛋白或所述抗体的所述核苷酸序列包含天然信号肽序列或非天然信号肽。
17.如权利要求16所述的植物表达系统,其中所述非天然信号肽来自蛋白二硫键异构酶(PDI)。
18.在植物或植物的部分中产生目标蛋白的方法,其包括,将权利要求9所述的植物表达系统引入至所述植物或所述植物的部分,以及在允许编码所述目标蛋白的所述核苷酸序列表达的条件下培养所述植物或所述植物的部分。
19.植物或植物的部分,其被权利要求9所述的植物表达系统瞬时转染或稳定转化。
20.核酸,其包含权利要求1所述的表达增强子,所述表达增强子与目标核苷酸序列可操作地连接。
21.如权利要求20所述的核酸,其中所述目标核苷酸序列是流感血凝素(HA),其选自:BHA、C、H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16。
22.如权利要求21所述的核酸,其中所述HA是嵌合的HA,其中所述HA的天然跨膜结构域被异源跨膜结构域替换。
23.如权利要求22所述的核酸,其中所述异源跨膜结构域获自H1加利福尼亚。
CN201580007060.9A 2014-01-10 2015-01-08 Cpmv增强子元件 Active CN105980561B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461925852P 2014-01-10 2014-01-10
US61/925,852 2014-01-10
CAPCT/CA2014/050326 2014-03-28
PCT/CA2014/050326 WO2014153674A1 (en) 2013-03-28 2014-03-28 Influenza virus-like particle production in plants
PCT/CA2015/050009 WO2015103704A1 (en) 2014-01-10 2015-01-08 Cpmv enhancer elements

Publications (2)

Publication Number Publication Date
CN105980561A true CN105980561A (zh) 2016-09-28
CN105980561B CN105980561B (zh) 2020-06-02

Family

ID=53523412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580007060.9A Active CN105980561B (zh) 2014-01-10 2015-01-08 Cpmv增强子元件

Country Status (12)

Country Link
US (2) US11441150B2 (zh)
EP (1) EP3092309B1 (zh)
JP (1) JP6518257B2 (zh)
CN (1) CN105980561B (zh)
AU (1) AU2015205805B2 (zh)
BR (1) BR112016015875A2 (zh)
CA (1) CA2936350C (zh)
DK (1) DK3092309T3 (zh)
ES (1) ES2864081T3 (zh)
RU (1) RU2699982C2 (zh)
TW (1) TWI714522B (zh)
WO (1) WO2015103704A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112400021A (zh) * 2018-03-14 2021-02-23 麦迪卡格公司 植物表达增强子
CN113677797A (zh) * 2019-03-14 2021-11-19 田边三菱制药株式会社 内源性植物表达增强子

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0800272D0 (en) 2008-01-08 2008-02-13 Plant Bioscience Ltd Protein expression systems
RU2699982C2 (ru) * 2014-01-10 2019-09-11 Медикаго Инк. Энхансерные элементы cpmv

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090181460A1 (en) * 2006-05-22 2009-07-16 George Lomonossoff Bipartite System, Method and Composition for the Constitutive and Inducible Expression of High Levels of Foreign Proteins in Plants
CN101952466A (zh) * 2007-12-19 2011-01-19 生物测定技术研发有限公司 制备热电金属间化合物的方法
CN102272308A (zh) * 2008-07-11 2011-12-07 麦迪卡格公司 包含血凝素的流感病毒样颗粒(vlp)
CN102482328A (zh) * 2009-06-24 2012-05-30 麦迪卡格公司 包含血凝素的嵌合流感病毒样颗粒
WO2013068593A1 (en) * 2011-11-11 2013-05-16 Philip Morris Products S.A. Influenza virus -like particles (vlps) comprising hemagglutinin produced nicotiana tabacum
CN103282501A (zh) * 2010-11-04 2013-09-04 麦迪卡格公司 植物表达系统

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9414118D0 (en) 1994-07-13 1994-08-31 Axis Genetics Ltd Modified plant viruses as vectors of heterologous peptides
US6042832A (en) 1996-08-28 2000-03-28 Thomas Jefferson University Polypeptides fused with alfalfa mosaic virus or ilarvirus capsid proteins
US20010006950A1 (en) 1998-02-11 2001-07-05 Juha Punnonen Genetic vaccine vector engineering
US6489537B1 (en) 1998-08-07 2002-12-03 The Trustees Of The University Of Pennsylvania Phytochelatin synthases and uses therefor
US6287570B1 (en) 1998-11-23 2001-09-11 Patricia L. Foley Vaccine against swine influenza virus
US7125978B1 (en) 1999-10-04 2006-10-24 Medicago Inc. Promoter for regulating expression of foreign genes
EP2287185A3 (en) 1999-12-06 2012-10-10 Board Of Trustees Of The University Of Illinois High affinity TCR proteins and methods
DE10109354A1 (de) 2001-02-27 2002-09-05 Icon Genetics Ag Rekombinante virale Schaltersysteme
MXPA05006983A (es) * 2002-12-27 2006-02-22 Ct Ingenieria Genetica Biotech Promotor artificial para la expresion de secuencias de acido desoxirribonucleico en celulas vegetales.
WO2004098530A2 (en) 2003-05-05 2004-11-18 Dow Agrosciences Llc Stable immunoprophylactic and therapeutic compositions derived from transgenic plant cells and methods for production
US7132291B2 (en) 2003-05-05 2006-11-07 Dow Agro Sciences Llc Vectors and cells for preparing immunoprotective compositions derived from transgenic plants
CA2816222A1 (en) 2003-06-16 2005-03-03 Medimmune Vaccines, Inc. Influenza hemagglutinin and neuraminidase variants
US8080255B2 (en) 2003-07-11 2011-12-20 Novavax Inc. Functional influenza virus like particles (VLPs)
US8592197B2 (en) 2003-07-11 2013-11-26 Novavax, Inc. Functional influenza virus-like particles (VLPs)
EP2374892B1 (en) 2005-04-29 2018-02-14 University of Cape Town Expression of viral proteins in plants
EP1909829A4 (en) 2005-07-19 2009-11-11 Dow Global Technologies Inc RECOMBINANT GRIP VACCINES
PT1937301E (pt) 2005-10-18 2015-09-14 Novavax Inc Partículas idênticas a vírus (vlps) da gripe funcionais
BRPI0707733B1 (pt) 2006-02-13 2019-12-31 Fraunhofer Usa Inc antígeno isolado, composição de vacina, uso da referida composição e método para produção de uma proteína de antígeno
AU2007224034B2 (en) 2006-03-07 2012-03-29 Vaxinnate Corporation Compositions that include hemagglutinin, methods of making and methods of use thereof
US7618815B2 (en) 2006-03-08 2009-11-17 University Of Kentucky Research Foundation Viral vectors useful in soybean and methods of use
US8697088B2 (en) 2007-05-25 2014-04-15 Novavax, Inc. VLPs derived from cells that do not express a viral matrix or core protein
MX2010007962A (es) 2007-11-27 2010-11-10 Medicago Inc Particulas tipo virus de influenza recombinante (vlp) producidas en plantas transgenicas que expresan hemaglutinina.
GB0800272D0 (en) * 2008-01-08 2008-02-13 Plant Bioscience Ltd Protein expression systems
WO2010117786A1 (en) 2009-03-30 2010-10-14 Mount Sinai School Of Medicine Of New York University Influenza virus vaccines and uses thereof
BR112012008106A2 (pt) 2009-09-04 2019-08-20 Syngenta Participations Ag agrupamento de elementos ativadores translacionais para aumentar a expressão de polipeptídeos em plantas
PL2480658T3 (pl) 2009-09-22 2017-12-29 Medicago Inc. Sposób otrzymywania VLP pochodzenia roślinnego
CA2813078A1 (en) 2010-10-04 2012-04-12 Massachusetts Institute Of Technology Hemagglutinin polypeptides, and reagents and methods relating thereto
TWI526539B (zh) 2010-12-22 2016-03-21 苜蓿股份有限公司 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp
TWI620816B (zh) 2011-03-23 2018-04-11 苜蓿股份有限公司 植物衍生蛋白回收方法
CA2839009C (en) 2011-06-13 2015-10-20 Medicago Inc. Rabies virus like particle production in plants
PL220281B1 (pl) 2011-09-23 2015-09-30 Inst Biochemii I Biofizyki Polskiej Akademii Nauk Szczepionka DNA, sposób indukowania odpowiedzi immunologicznej, przeciwciała specyficznie rozpoznające białko hemaglutyniny H5 wirusa grypy i zastosowanie szczepionki DNA
CA2850407C (en) * 2011-09-30 2021-11-23 Medicago Inc. Increasing virus-like particle yield in plants
JP6205359B2 (ja) 2012-07-23 2017-09-27 有限会社生物資源研究所 ワクチン
EP2978848B1 (en) * 2013-03-28 2020-05-06 Medicago Inc. Influenza virus-like particle production in plants
RU2699982C2 (ru) * 2014-01-10 2019-09-11 Медикаго Инк. Энхансерные элементы cpmv
JP6599354B2 (ja) * 2014-03-27 2019-10-30 メディカゴ インコーポレイテッド 改変されたcpmvエンハンサーエレメント

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090181460A1 (en) * 2006-05-22 2009-07-16 George Lomonossoff Bipartite System, Method and Composition for the Constitutive and Inducible Expression of High Levels of Foreign Proteins in Plants
CN101952466A (zh) * 2007-12-19 2011-01-19 生物测定技术研发有限公司 制备热电金属间化合物的方法
CN102272308A (zh) * 2008-07-11 2011-12-07 麦迪卡格公司 包含血凝素的流感病毒样颗粒(vlp)
CN102482328A (zh) * 2009-06-24 2012-05-30 麦迪卡格公司 包含血凝素的嵌合流感病毒样颗粒
CN103282501A (zh) * 2010-11-04 2013-09-04 麦迪卡格公司 植物表达系统
WO2013068593A1 (en) * 2011-11-11 2013-05-16 Philip Morris Products S.A. Influenza virus -like particles (vlps) comprising hemagglutinin produced nicotiana tabacum

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112400021A (zh) * 2018-03-14 2021-02-23 麦迪卡格公司 植物表达增强子
CN113677797A (zh) * 2019-03-14 2021-11-19 田边三菱制药株式会社 内源性植物表达增强子

Also Published As

Publication number Publication date
AU2015205805B2 (en) 2020-11-12
CA2936350C (en) 2023-01-31
JP2017501738A (ja) 2017-01-19
TW201610154A (zh) 2016-03-16
US11441150B2 (en) 2022-09-13
EP3092309A4 (en) 2017-06-28
US20200283784A1 (en) 2020-09-10
TWI714522B (zh) 2021-01-01
EP3092309A1 (en) 2016-11-16
BR112016015875A2 (pt) 2017-09-19
RU2016132865A (ru) 2018-02-14
US20170029832A1 (en) 2017-02-02
JP6518257B2 (ja) 2019-05-22
RU2699982C2 (ru) 2019-09-11
EP3092309B1 (en) 2021-02-24
CA2936350A1 (en) 2015-07-16
DK3092309T3 (da) 2021-04-12
CN105980561B (zh) 2020-06-02
ES2864081T3 (es) 2021-10-13
US11884929B2 (en) 2024-01-30
RU2016132865A3 (zh) 2018-08-28
AU2015205805A1 (en) 2016-08-04
WO2015103704A1 (en) 2015-07-16

Similar Documents

Publication Publication Date Title
AU2011325827B2 (en) Plant expression system
US11884929B2 (en) CPMV enhancer elements
JP6599354B2 (ja) 改変されたcpmvエンハンサーエレメント
JP7423875B6 (ja) 植物発現エンハンサ
WO2024040325A1 (en) Modified influenza b virus hemagglutinin
JP2022534464A (ja) 内因性植物発現エンハンサー

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant