CN107075528A - 用于重组土壤杆菌基因缺陷菌株的方法和组合物 - Google Patents

用于重组土壤杆菌基因缺陷菌株的方法和组合物 Download PDF

Info

Publication number
CN107075528A
CN107075528A CN201580059462.3A CN201580059462A CN107075528A CN 107075528 A CN107075528 A CN 107075528A CN 201580059462 A CN201580059462 A CN 201580059462A CN 107075528 A CN107075528 A CN 107075528A
Authority
CN
China
Prior art keywords
ala
leu
arg
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580059462.3A
Other languages
English (en)
Inventor
M·古普塔
S·班尼特
S·库马尔
D·默洛
N·萨尔德赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN107075528A publication Critical patent/CN107075528A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/743Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Agrobacterium; Rhizobium; Bradyrhizobium

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本公开提供了用于生产和使用相对于亲本菌株在RecA活性中有缺陷的根癌土壤杆菌菌株(例如LBA4404)的新组合物和方法。还公开了与根癌土壤杆菌的其他基因缺陷型菌株的组合。具体地,提供了两个示例性的recA减毒株:UIA777,其中氯霉素抗性基因破坏recA基因;和UIA770,其中卡那霉素抗性基因破坏recA基因。

Description

用于重组土壤杆菌基因缺陷菌株的方法和组合物
相关申请的交叉引用
本申请要求根据2015年9月4日提交的美国临时申请序列号62/045,947在35 USC§119(e)下的权益,其全部内容通过引用并入本文。
对电子提交的序列表的援引
序列表的正式副本通过EFS Web以电子方式提交,其为ASCII格式的序列表,名称为“76018_ST25.txt”,于2015年9月2日创建,大小为73.9千字节,并与本申请同时递交。包含在该ASCII格式化文档中的序列表是说明书的一部分,其全部内容通过引用并入本文。
背景技术
土壤杆菌介导的植物转化导致T链整合在植物细胞的基因组内。T链含有基因表达盒,这些基因表达盒由被精确地设计为将启动子连接到感兴趣的基因和3'非翻译区(UTR)的基因调控元件组成。这些序列相对于彼此被精确地设计,以最佳地驱动目的基因的表达以产生蛋白质。基因调控元件的稳定性对于感兴趣的基因的最佳表达是至关重要的。包含在T链内的多核苷酸序列的些许修饰可能会减少乃至消除感兴趣的基因的表达。
根癌土壤杆菌(LBA4404)菌株通常用于将T链整合到植物细胞的基因组内。参见:Ooms,G.,Hooykaas,P.J.J.,Van Veen,R.J.M.,Van Beelen,P.,Regensburg-Tuienk,T.J.G.,and R.A.Schilperoort(1982)"Octopine Ti-plasmid deletion mutants ofAgrobacterium tumefaciens with emphasis on the right side of the T-region."Plasmid 7:15-29;Hoekema,A.,Hirsch,P.R.,Hooykaas,P.J.J.,and R.A.Schilperoort(1983)"A binary plant vector strategy based on separation of vir-and T-regionof the Agrobacterium tumefaciens Ti-plasmid."Nature 303:179-180;以及deFrammond,A.J.,Barton K.A.,and M-D.Chilton(1983)"Mini-Ti:a new vector strategyfor plant genetic engineering".Biotechnology 1:262-269。
尽管在过去三十年中根癌土壤杆菌(LBA4404)得到了广泛的使用,但人们已经观察到,转化在该种菌株内的质粒在菌株内转化后变得不稳定。已经观察到基因调节元件,特别是那些重复的元件,在根癌土壤杆菌(LBA4404)菌株内重组。这种不稳定性导致植物转化效率降低,需要彻底地筛选潜在转基因植物以寻找未改变的T链序列。鉴于转化在该菌株内的质粒的不稳定性,需要开发不具有重组特性,并且能够稳定地维持质粒而不重排位于质粒内的遗传元件的根癌土壤杆菌(LBA4404)菌株。
因此,对具有改善的质粒稳定性的根癌土壤杆菌菌株仍然存在需求。特别地,开发在遗传重组途径中有缺陷的根癌土壤杆菌菌株可能是令人期望的。
发明概要
本申请提供用于产生和利用相对于亲本菌株RecA活性缺陷的根瘤土壤杆菌菌株(例如LBA4404)的新组合物和方法。还公开了与根瘤土壤杆菌的其他基因缺陷菌株的组合。具体地,提供了两种示例性的s recA-菌株:UIA777,其中氯霉素抗性基因破坏了recA基因;和UIA770,其中卡那霉素抗性基因破坏了recA基因。
在一个方面,提供了根瘤土壤杆菌的修饰菌株,其中所述修饰菌株相对于其亲本菌株在某种遗传重组途径中是有缺陷的。
在一个实施方案中,所述修饰菌株在选自RecA、RecB、RecD、RecF、RecG、RecJ、RecN、RecO、RecQ、RecR、和RecX的至少一种重组途径中是有缺陷的。在另一个实施方案中,所述修饰菌株在RecA途径中有缺陷。在一个进一步的实施方案中,recA基因包含与SEQ IDNO:10或11具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%或100%序列同一性的多核苷酸序列。在另一个实施方案中,所述修饰菌株还在选自下组的活性中有缺陷:RecB、RecD、RecF、RecG、RecJ、RecN、RecO、RecQ、RecR和RecX。
recA基因和RecA蛋白质序列分别如SEQ ID NO:10和12所示。recB基因和RecB蛋白质序列分别如SEQ ID NO:13和14所示。recD基因和RecD蛋白质序列分别如SEQ ID NO:15和16所示。recF基因和RecF蛋白质序列分别如SEQ ID NO:17和18所示。recG基因和RecG蛋白质序列分别如SEQ ID NO:19和20所示。recJ基因和RecJ蛋白质序列分别如SEQ ID NO:21和22所示。recN基因和RecN蛋白质序列分别如SEQ ID NO:23和24所示。recO基因和RecO蛋白质序列分别如SEQ ID NO:25和26所示。recQ基因和RecQ蛋白质序列分别如SEQ ID NO:27和28所示。recR基因和RecR蛋白质序列分别如SEQ ID NO:29和30所示。recX基因和RecX蛋白质序列分别如SEQ ID NO:31和32所示。
在另一个实施方案中,基因组recA基因通过在recA基因中缺失、重组或插入序列而被修饰。在另一个实施方案中,基因组recA基因通过在recA基因内插入序列,从而破坏RecA蛋白的表达而被修饰。在一个进一步的实施方案中,插入的序列包含选择标志物基因。在另一个实施方案中,选择标志物基因包括选自下组的抗生素抗性基因:氯霉素抗性基因、卡那霉素抗性基因、壮观霉素抗性基因、庆大霉素抗性基因、或其组合。在一个进一步的实施方案中,所述抗生素抗性基因包括氯霉素抗性基因或卡那霉素抗性基因。
在所述修饰菌株的一个实施方案中,在从所述菌株制备的提取物中检测不到RecA活性。在另一个实施方案中,使用Western印迹分析检测不到RecA蛋白。在另一个实施方案中,使用Nothern印迹分析检测不到RecA mRNA。在另一个实施方案中,使用Southern印迹分析检测不到recA基因。
在一个实施方案中,recA基因编码SEQ ID NO:12的蛋白质。在另一个实施方案中,所述菌株包含Ti质粒。在一个进一步的实施方案中,所述Ti质粒包括pAL4404Ti质粒,或者是自pAL4404Ti质粒衍生的。
在一个实施方案中,所述菌株包含二元质粒。在一个进一步的实施方案中,所述二元质粒包含选自下组的农艺性状的基因:杀虫抗性性状、除草剂耐性性状、氮利用效率性状、水分利用效率性状、营养品质性状、DNA结合性状、选择标志物性状,及其组合。在另一个实施方案中,所述菌株包含三元质粒。在另一个实施方案中,亲本菌株是根瘤土壤杆菌(LBA4404)。
在另一个方面,提供了质粒,所述质粒包含来自根瘤土壤杆菌的修饰的recA基因,其中该recA基因与修饰之前的SEQ ID NO:10或SEQ ID NO:11具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%或100%序列同一性,且该修饰的recA基因在RecA蛋白的表达中有缺陷。
在一个实施方案中,所述修饰包括在recA基因或SEQ ID NO:10或11内插入供体序列。在一个进一步的实施方案中,所述供体序列包含选择标志物基因。在另一个实施方案中,所述选择标志物基因选自下组的抗生素抗性基因:氯霉素抗性基因、卡那霉素抗性基因、壮观霉素抗性基因、庆大霉素抗性基因、或其组合。在一个进一步的实施方案中,所述抗生素抗性基因包括氯霉素抗性基因或卡那霉素抗性基因。在另一个实施方案中,供体序列的至少一端被SEQ ID NO:10或11的至少43碱基对的片段所侧翼。
在另一个方面,提供了生成这样的根瘤土壤杆菌菌株的方法,所述菌株相对于其亲本菌株在遗传重组途径中有缺陷。所述方法包括
(a)提供针对recA基因的敲除质粒;
(b)将所述敲除质粒导入根瘤土壤杆菌菌株中;
(c)选择并筛选包含基因组突变的菌落;和
(d)鉴定至少一个具有recA基因组突变的突变根瘤土壤杆菌。
在一个实施方案中,所述recA基因与SEQ ID NO:10或11具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%或100%序列同一性。在另一个实施方案中,所述敲除质粒引入选自下组的突变:基因组缺失、基因组重排、基因组插入、及其组合。在一个进一步的实施方案中,基因组插入包含编码选择标志物的序列。在另一个实施方案中,所述选择标志物基因包含选自氯霉素抗性基因、卡那霉素抗性基因、壮观霉素抗性基因、庆大霉素抗性、或其组合的抗生素抗性基因。在一个进一步的实施方案中,所述抗生素抗性基因包括氯霉素抗性基因或卡那霉素抗性基因。
在另一个方面,提供了转基因事件,其包含(a)被上游基因组DNA边界序列侧翼的T链插入序列和(b)下游基因组边界序列,其中所述转基因事件包含来自根瘤土壤杆菌修饰菌株的T链的整合,所述根瘤土壤杆菌修饰菌株相对于其亲本菌株在遗传重组途径中有缺陷。
在一个实施方案中,来自根瘤土壤杆菌的修饰菌株的T链整合在用于再生转基因事件的目标植物细胞的基因组内。在另一个实施方案中,所述转基因事件进一步包含农艺学性状。在一个进一步的实施方案中,所述农艺学性状选自下组:除草剂耐性性状,氮利用效率性状,水分利用效率性状,营养品质性状,DNA结合性状,选择标记物性状,及其组合。在另一个实施方案中,所述转基因事件是双子叶植物或单子叶植物。
在另一个实施方案中,所述双子叶植物或单子叶植物选自下组:大麦、卡诺拉油菜、咖啡、玉米、棉花、亚麻、葡萄、蛇麻草、芥菜、坚果、燕麦、罂粟、油菜、水稻、印度榕(rubber plant)、黑麦、向日葵、高粱、大豆、甘蔗、茶叶、烟草和小麦。在另一个实施方案中,所述双子叶植物或单子叶植物选自玉米、小麦、棉花、水稻、大豆、和卡诺拉油菜。在另一个实施方案中,在另一个实施方案中,所述双子叶植物或单子叶植物选自下组:香蕉,菠萝,柑橘,葡萄,西瓜,网纹瓜(cantaloupe),香瓜(muskmelon)以及其他甜瓜,苹果,桃,梨,樱桃,猕猴桃,芒果,油桃,番石榴,番木瓜,柿子,石榴,鳄梨,无花果,柑橘和浆果。
在另一个方面,提供了产生转基因植物的方法。所述方法包括
(a)使目标植物细胞与根癌土壤杆菌的修饰菌株接触,所述菌株相对于其亲本菌株在遗传重组途径中有缺陷;
(b)选择和筛选包含来自所述土壤杆菌菌株的DNA的植物细胞,其中所述DNA整合在目标植物细胞的基因组中;
(c)从步骤(b)中选择/筛选出的植物细胞再生完整的转基因植物。
在一个实施方案中,选择步骤使用选择标志物进行。在一个进一步的实施方案中,选择标志物基因包括抗生素抗性基因,所述抗生素抗性基因选自氯霉素抗性基因、卡那霉素抗性基因、壮观霉素抗性基因、庆大霉素抗性基因、或其组合。在另一个实施方案中,抗生素抗性基因包括氯霉素抗性基因或卡那霉素抗性基因。
附图说明
图1示出了用于recA诱变的质粒的插入片段图。图1A显示了pWM-RecAnei中的recA基因及其相邻序列。B,PCP-MMSR2中LBA4404的DNA片段的XhoI限制性图谱。C,用编码抗抗生素Cm或Km抗性的盒子代替recA。
图2示出来自根癌土壤杆菌(LBA4404)的recA与来自其他土壤杆菌菌株的recA基因的相关性。该系统发育树系使用phyML(可在万维网phylogeny.fr访问)(Dereeper A,Guignon V,Blanc G,Audic S,Buffet S,Chevenet F,Dufayard JF,Guindon S,Lefort V,Lescot M,Claverie JM,Gascuel O.(2008)Phylogeny.fr:robust phylogeneticanalysis for the non-specialist.Nucleic Acids Research.36(Web Server Issue):W465-9)获得。使用recA的内部969bp片段(34-1005bp)进行该比对分析。其他菌株选自土壤杆菌属的代表性recA基因组型(G-)和如标识的相关分类群(Costechareyre等人,2010)。
图3示出了两种示例性根癌土壤杆菌(LBA4404)突变体recA-菌株:UIA777和UIA770,与野生型和补全型菌株相比的生长速率。对于这些测定,使用MGL培养基。
图4示出了二元质粒pDAB108700的质粒图,显示了构建体设计和构建体内的玉米泛素-1启动子的重复。
具体实施方式
本文公开了用于生产和使用相对于亲本菌株缺乏RecA活性的根癌土壤杆菌(LBA4404)菌株的新型组合物和方法。进一步描述了用于在根癌土壤杆菌(LBA4404)的基因组内整合多核苷酸片段的染色体整合位点。所公开的新型组合物和方法可用于生产具有植物物种的转基因事件。
除非另有定义,本文使用的所有技术和科学术语具有与本公开涉及的本领域普通技术人员通常理解的相同的含义。在发生冲突的情况下,以本申请包括定义在内为准。除非上下文另有要求,单数术语应包括复数,复数词应包括单数。本文提及的所有出版物,专利和其他参考文献的全部内容通过引用并入本文用于所有目的,如同每个单独的出版物或专利申请被具体和单独地指明通过引用并入本文一样,除非仅将专利或专利出版物的特定部分指示为通过引用并入。
为了进一步澄清本公开,提供了以下术语,缩写和定义。
如本文中使用的,术语“包含”、“包括”、“具有”、“含有”、或它们的任何其他变型均旨在是非排他性的或开放式的。例如,包含列出的要素的组合物、混合物、工艺、方法、物品、或装置不一定仅限于那些要素,而是可以包括未明确列出的或此类组合物、混合物、工艺、方法、物品或装置固有的其他要素。此外,除非明确相反地说明,“或”是指包含性的“或”而不是排他性的“或”。例如,通过任何一种以下情况来满足条件A或B:A是真实的(或存在)且B是虚假的(或不存在),A是虚假的(或不存在)且B为真实的(或存在)以及A和B都是真实的(或存在)。
如本文中使用的,“内源序列”定义处于其在生物体或生物体的基因组中的天然位置的多核苷酸、基因或多肽的天然形式。
如本文中使用的,术语“多核苷酸”、“核酸”和“核酸分子”可以互换使用,并可包括单个核酸、多个核酸、核酸片段、变体或其衍生物、和核酸构建体(例如信使RNA(mRNA)和质粒DNA(pDNA))。多核苷酸或核酸可以含有全长cDNA序列、或其片段的核苷酸序列,包括非翻译的5'和/或3'序列和编码序列。多核苷酸或核酸可以由任何多聚核糖核苷酸或多聚脱氧核糖核苷酸组成,其可以包括未修饰的核糖核苷酸或脱氧核糖核苷酸或修饰的核糖核苷酸或脱氧核糖核苷酸。例如,多核苷酸或核酸可以由单链和双链DNA;单链区和双链区混合物DNA;单链和双链RNA;以及单链区和双链区混合物RNA组成。包含DNA和RNA的杂交分子可以是单链的、双链的、或单链区和双链区的混合物。前述术语还包括化学、酶学和代谢修饰形式的多核苷酸或核酸。
应当理解,具体的DNA还指其互补物,其序列根据脱氧核糖核苷酸碱基配对的规则确定。
如本文中使用的,术语“基因”是指编码功能产物(RNA或多肽/蛋白)的核酸。基因可以包含位于编码功能产物的序列之前(5'非编码序列)和/或之后(3'非编码序列)的调节序列。
如本文使用的,术语“编码序列”是指编码特定氨基酸序列的核酸序列。“调节序列”是指位于编码序列上游(例如,5'非编码序列)、内部或下游(例如,3'非编码序列)的核苷酸序列,其影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括,例如但不限于:启动子;翻译前导序列;内含子;多腺苷酸化识别序列;RNA加工位点;效应物结合位点;和茎环结构。
如本文中使用的,术语“多肽”包括单个多肽、多个多肽、和其片段。该术语是指由通过酰胺键(也称作肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸构成的任何链(一个或多个),且不指示产物的具体长度和大小。因此,肽、二肽、三肽、寡肽、蛋白质、氨基酸链、和任何其他用于指示有两个或多个氨基酸的链的术语均包含在“多肽”的定义之内,并且前述术语在本文中可以和“多肽”互换使用。多肽可以是从天然生物源分离的或者通过重组技术产生的,但是具体的多肽不一定是从特定的核酸翻译产生的。多肽可以用任何合适的方式产生,包括例如但不限于,通过化学合成。
相反,术语“异源的”是指在参考(宿主)生物的位置处通常不会发现的多核苷酸、基因或多肽。例如,异源核酸可以是通常在参考生物的不同基因组位置处被发现的核酸。作为进一步的实例,异源核酸可以是通常不会在参考生物中被发现的核酸。含有异源多核苷酸、基因或多肽的宿主生物可以通过将异源多核苷酸、基因或多肽导入到宿主生物内而产生。在特定的实例中,异源多核苷酸包括以不同于相应的天然多核苷酸的形式被重新导入到来源生物内的天然编码序列、或其部分。在特定的实例中,异源基因包括以不同于相应的天然基因的形式被重新导入到来源生物内的天然编码序列或其部分。例如,异源基因可以包括天然编码序列,该天然编码序列是含有非天然调节区的嵌合基因的一部分,该嵌合基因被重新导入到天然宿主内。在特定的实例中,异源多肽是以不同于相应的天然多肽的形式被重新导入到来源生物内的天然多肽。
异源基因或多肽可以是这样的基因或多肽,其包含功能性多肽或编码功能性多肽的核酸序列,该功能性多肽或编码功能性多肽的核酸序列与其他基因或多肽融合从而产生嵌合或融合的多肽或编码它的基因。基因和蛋白质的特定实施方案包括具体例举的全长序列和部分、区段、片段(包括与全长分子相比具有内部和/或末端缺失的连续片段)、变体、突变体、嵌合体、以及这些序列的融合。
如本文所使用的,术语“修饰”可以指本文中公开的多核苷酸内的改变,其导致由该多核苷酸编码的多肽的活性降低、基本上消失、或消失。修饰还指本文中公开的多肽中的改变,其导致该多肽的活性减低、基本上消失、或消失。或者,术语“修饰”可以指本文中公开的多核苷酸中的改变,其导致该多核苷酸编码的多肽的活性增加或提高,以及本文中公开的多肽中的改变,其导致该多肽的活性增加或提高。这样的改变可以通过任何本领域众所周知的方法实现,包括但不限于:缺失、突变(例如自发诱变;随机诱变;增变基因导致的诱变;或转座子诱变)、取代、插入、下调、改变的细胞定位、改变多核苷酸或多肽的状态(例如甲基化、磷酸化或泛素化)、除去辅助因子、导入反义RNA/DNA、导入干扰RNA/DNA、化学修饰、共价修饰、用UV或X射线辐照、同源重组、有丝分裂重组;启动子替换方法;和/或前述的组合。可以通过比较特定多核苷酸或多肽的序列与同源(例如酵母的或细菌的)多核苷酸或多肽的序列,并使高度同源区(保守区)或共有序列中的修饰数目最大化,来找到确定哪些核苷酸或氨基酸残基可以被修饰的指引。
如本文中所用的,术语“衍生物”,是指在本公开中所阐述的序列的修饰。此类修饰的实例可为相对于本文中公开的编码序列的核酸序列取代、插入、和/或缺失一个或多个碱基,而保留、稍微改变、或增加本文所公开的编码序列在作物物种中的功能。这样的衍生物可以由本领域技术人员容易地确定,例如,通过使用用于预测和优化序列结构的计算机建模技术。术语“衍生物”还包括这样的核酸序列,它们与本文中公开的编码序列有实质性的序列同一性,以至于它们能够具有所公开的功能,供用于产生本公开的实施方案。
术语“启动子”指能够控制核酸编码序列或功能RNA的表达的DNA序列。在实例中,受控制的编码序列位于启动子序列的3'。可以从天然基因中整体获得启动子,启动子可以包括来自天然出现的不同启动子的不同元件,或者启动子甚至可以包括合成的DNA片段。本领域的技术人员理解,不同的启动子可以指导基因在不同组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境或生理条件表达。所有上述启动子的实例都是已知的,并且在本领域中用于控制异源核酸的表达。指导基因在大多数细胞类型中在大部分时间里表达的启动子通常称为“组成型启动子”。此外,虽然本领域技术人员已经尝试界定调节序列的确切边界(在许多情况下未成功),但是已经认识到,长度不同的DNA片段可能具有相同的启动子活性。特定核酸的启动子活性可以使用本领域技术人员熟悉的技术进行测定。
术语“可操作连接”是指单一核酸上的多个核酸序列的关联,其中一个核酸序列的功能受到另一个的影响。例如,当启动子能够影响编码序列的表达时(例如,编码序列在启动子的转录控制之下),启动子与编码序列就是可操作连接的。编码序列可以沿着有义和反义方向与调节序列可操作连接。
如本文中使用的,术语“表达”可以指衍生自DNA的有义(mRNA)或反义RNA的转录和稳定积累。表达也可指mRNA翻译成多肽。如本文中使用的,术语“过表达”是指高于相同基因或相关基因的内源表达的表达。因此,如果异源基因的表达高于可比较的内源基因的表达,则该异源基因被“过表达”。
如本文中使用的,术语“转化”(“transformation”)或“转化”(“transforming”)是指核酸或其片段被转移并整合到宿主生物内,导致基因上稳定的遗传。含有转化核酸的宿主生物被称作“转基因”、“重组”或“转化”生物。
如本文中使用的,术语“结合”指大分子(例如,蛋白质和核酸之间)的序列特异的非共价相互作用。结合相互作用的所有组成部分并不需要都是序列特异的(例如,与DNA主链中的磷酸酯基团接触),只要相互作用作为一个总体是序列特异性即可。这类相互作用一般以10-6M-1或更低的解离常数(Kd)为特征。“亲和力”指结合的强度:增加的结合亲和力与更低的Kd相关。
“结合蛋白”是能够非共价地与另一个分子结合的蛋白质。结合蛋白可以与例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。在蛋白质结合蛋白的情况下,它可以与自身结合(以形成同型二聚体、同型三聚体等)和/或它可以与不同的一种或多种蛋白质的一个或多个分子结合。结合蛋白可以具有多于一个类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。
如本文中使用的,术语“质粒”和“载体”是指染色体外元件,其可携带一个或多个非细胞中心代谢部分的基因。质粒和载体通常是环状双链DNA分子。然而,质粒和载体可以是线性或环状核酸,呈单链或双链DNA或RNA,并可以衍生自任何来源,其中若干核苷酸序列被连接或重组成一个独特的构建体,其能够将启动子片段和编码DNA序列与任何合适的3'非翻译序列一起导入到细胞内。在实例中,质粒和载体可以包括自主复制序列、基因组整合序列、和/或噬菌体或核苷酸序列。
多肽和“蛋白质”在本文中可互换使用,并且包括通过肽键连接的两个或更多个氨基酸的分子链。这些术语并非是指产物的具体长度。因此,“肽类”和“寡肽类”被包括在多肽的定义之内。这些术语包括多肽的翻译后修饰,例如糖基化、乙酰化、磷酸化,等。另外,蛋白质片段、类似物、突变或变体蛋白、融合蛋白等被包括在多肽的含义之内。这些术语还包括其中一个或多个氨基酸类似物或非规范性或非天然氨基酸被包括在内的分子,正如可使用已知的蛋白质工程技术合成或重组表达所述分子。另外,可如本文所述通过熟知的有机化学技术衍生本发明的融合蛋白。
术语“融合蛋白”表明所述蛋白质包括从一个以上的亲本蛋白或多肽衍生的多肽组分。典型地,融合蛋白是从融合基因表达的,在所述融合基因中,编码来自一种蛋白质的多肽序列的核苷酸序列与编码来自不同蛋白质的多肽序列的核苷酸序列一起附加在框内,并且任选地由接头分开。然后,融合基因可由重组宿主细胞表达为单一的蛋白质。
表述“调控序列”通指启动子序列、核糖体结合位点、转录终止序列、上游调节域、增强子,等等,它们共同提供编码序列在宿主细胞中的转录和翻译。并不需要所有的这些调控序列总是存在于重组体载体中,只要所期望的基因能转录和翻译即可。
“重组”是指在两个DNA或RNA分子之间DNA或RNA序列片段的再分配(reassortment)。”同源重组”发生在依靠各自DNA分子中存在的同源或互补核苷酸序列杂交的两个DNA分子之间。
术语“严格条件”或者”在严格条件下杂交”是指在该条件下探针会优先与其靶亚序列杂交,而较少程度或者根本不与其它序列杂交。在核酸杂交实验例如Southern杂交和Northern杂交的上下文中,”严格杂交”和”严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下不同。核酸杂交的广泛指导参见Tijssen(1993)Laboratory Techniquesin Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probespart I chapter 2Overview of principles of hybridization and the strategy ofnucleic acid probe assays,Elsevier,New York。一般而言,高严格杂交和洗涤条件选择为比特异性序列在指定的离子强度和pH下的热解链点(Tm)低约5℃。Tm是在指定的离子强度和pH下50%的靶序列杂交至完美匹配的探针的温度。非常严格条件选择为等于针对具体探针的Tm
在Southern或Northern印迹中在滤纸上具有超过100个互补残基的互补核酸的杂交的严格杂交条件的一个实例是50%甲酰胺与1mg肝素在42℃,其中杂交进行过夜。高严格洗涤条件的一个实例是0.15M NaCl,在72℃达约15分钟。严格洗涤条件的一个实例是在65℃用0.2xSSC洗涤持续15分钟(参见Sambrook等人,(1989)Molecular Cloning--ALaboratory Manual(2nd ed.)Vol.1-3,Cold Spring Harbor Laboratory,Cold SpringHarbor Press,NY,就SSC缓冲液描述而言)。常常,在高严格洗涤之前进行低严格洗涤以除去背景探针信号。用于例如超过100个核苷酸的双链体的中等严格洗涤的一个实例是在45℃用1xSSC持续15分钟。用于例如超过100个核苷酸的双链体的低严格洗涤的一个实例是在40℃用4-6xSSC持续15分钟。一般而言,在具体的杂交测定中观察到相对于不相关探针的2x(或更高)的信噪比表明检测到特异性杂交。如果核酸编码的多肽是基本上相同的,那么在严格条件下未彼此杂交的核酸仍然是基本上相同的。这在例如,核酸的拷贝是使用遗传编码所允许的最大密码子简并产生时会发生。
本公开还涉及分离的多核苷酸,其可在严格条件下,优选在高严格条件下,与本公开的多核苷酸杂交。
本申请所用术语“杂交”意在描述用于杂交和洗涤的条件,在该条件下彼此至少约50%、至少约60%、至少约70%、更优选至少约80%、甚至更优选至少约85%~90%、最优选至少95%同源的核苷酸序列通常保持彼此杂交。
在一个实施方案中,本公开的核酸是与本申请所示的核酸序列或其互补物至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同源的。
严格杂交条件的另一个非限制性实例是在约45℃在6x氯化钠/柠檬酸钠(SSC)中杂交,然后在1xSSC,0.1%SDS中在50℃、优选在55℃、更优选在60℃且甚至更优选在65℃进行一次或多次洗涤。
高严格条件可包括使用标记的DNA探针诸如地高辛(DIG)标记的DNA探针,在42℃温育几天诸如2~4天的时间,然后进行一次或多次在2xSSC,0.1%SDS中在室温的洗涤以及一次或多次在0.5xSSC,0.1%SDS或者0.1xSSC,0.1%SDS中在65-68℃的洗涤。具体地,高严格条件包括例如2小时至4天的在42℃的温育,其中使用DIG标记的DNA探针(例如通过使用DIG标记系统制备;Roche Diagnostics GmbH,68298Mannheim,Germany),在溶液诸如包含或者不含100μg/ml鲑精DNA的DigEasyHyb溶液(Roche Diagnostics GmbH),或者包含50%甲酰胺、5xSSC(150mM NaCl、15mM柠檬酸三钠)、0.02%十二烷基硫酸钠、0.1%N-月桂酰肌氨酸和2%封闭剂的溶液(Roche Diagnostics GmbH)中,然后在2xSSC和0.1%SDS中在室温洗涤滤纸两次持续5~15分钟,接着在0.5xSSC和0.1%SDS或者0.1xSSC和0.1%SDS中在65-68℃洗涤两次持续15~30分钟。
在一些实施方案中,在高严格条件下与本发明核苷酸序列杂交的本发明的分离的核酸分子可对应于天然存在的核酸分子。本申请所用的”天然存在的”核酸分子是指具有自然界中存在的核苷酸序列(例如,编码天然蛋白质)的RNA或DNA分子。
技术人员会知道就严格和高严格杂交条件而言适用什么条件。关于所述条件的另外指导在本领域中是易于得到的,例如在Sambrook等人,1989,Molecular Cloning,ALaboratory Manual,Cold Spring Harbor Press,N.Y.;以及Ausubel等人,(eds.),1995,Current Protocols in Molecular Biology,(John Wiley&Sons,N.Y.)中。术语“同源性”或“百分比同一性”在本文可互换使用。就本发明的目的而言,在本文中定义:为了测定两个氨基酸序列或两个核酸序列的同一性百分比,为了最佳比较的目的将序列进行比对(例如可向第一氨基酸或核酸序列中引入缺口以便实现与第二氨基酸或核酸序列的最佳比对)。然后比较相应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中相应位置相同的氨基酸残基或核苷酸占据时,则两个分子在该位置是相同的。两个序列之间的同一性百分比是两序列分享的相同位置数的函数(即同一性%=相同位置数/位置总数(即重叠位置数)×100)。优选地,两个序列长度相同。
技术人员会了解下述事实:有若干种不同的计算机程序可用来测定两个序列之间的同源性。例如,可通过使用数学算法完成两个序列之间序列比较和同一性百分比的测定。在优选的实施方案中,用Needleman与Wunsch(J.Mol.Biol.(48):444-453(1970))算法,该算法已被整合进GCG软件包(可在互联网上的accelrys的万维网accelrys.com访问)的GAP程序中,使用Blossom 62矩阵或PAM250矩阵和16、14、12、10、8、6或4的缺口权重和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分比同一性。技术人员会理解所有这些不同的参数会产生稍微不同的结果,但是使用不同的算法时两个序列之间的总体同一性百分比不会显著改变。
在又一实施方案中,用GCG软件包(可在互联网上的accelrys的万维网accelrys.com访问)中的GAP程序,使用NWSgapdna.CMP矩阵和40、50、60、70或80的缺口权重及1、2、3、4、5或6的长度权重,确定两个核苷酸序列之间的百分比同一性。在另一实施方案中,用E.Meyers与W.Miller(CABIOS,4:11-17(1989)的算法,使用PAM120重量残基表、12的缺口长度罚分和4的缺口罚分来确定两个氨基酸或核苷酸序列之间的同一性百分比,所述算法已被整合进ALIGN程序(2.0版)中(可在互联网上的vega网站访问,更具体地说是在ALIGN–IGH Montpellier,或者更具体地说是在http://vega.igh.cnrs.fr/bin/align-guess.cgi访问)。
本发明的核酸和蛋白质序列可进一步被用作“查询序列”来对公开数据库进行搜索,来例如鉴定其他的家族成员或相关序列。这类搜索可使用例如Altschul,et al.(1990)J.Mol.Biol.215:403-10的BLASTN和BLASTX程序(2.0版)进行。可使用BLASTN程序进行BLAST核苷酸搜索(分值=100,字长=12)来获得与本公开的核酸分子同源的核苷酸序列。可使用BLASTX程序进行BLAST蛋白质搜索(分值=50,字长=3)来获得与本公开的蛋白质分子同源的氨基酸序列。为了获得有缺口的比对用于比较的目的,可以如Altschul et al.,(1997)Nucleic Acids Res.25(17):3389-3402中所述地利用缺口BLAST(Gapped BLAST)。使用BLAST和缺口BLAST程序时,可使用各程序(例如BLASTX和BLASTN)的默认参数(可在互联网上ncbi网站访问,例如万维网ncbi.nlm.nih.gov)。
术语“嵌合的”,如本文中使用的,是指由“重组的”序列构成。例如,序列是“重组的,且在自然界中不一起出现”。
本文所用的术语“重组”是指任何连接多核苷酸的方法。该术语包括端到端(endto end)连接,以及将一个序列插入另一个序列。该术语旨在包括物理连接技术,例如粘性末端连接作用和平末端连接作用。也可以人工或重组合成这些序列使之包含重组序列。
用于本发明的合适植物可以选自花卉、水果、蔬菜、苗圃、草坪和观赏作物。在一个进一步的实施方案中,水果选自杏、苹果、鳄梨、香蕉、浆果(包括草莓、蓝莓、覆盆子、黑莓、醋栗、和其他类型的浆果),杨桃,樱桃,柑橘(包括橙子、柠檬、莱檬、桔子、葡萄柚、及其他柑橘),椰子,无花果,葡萄,番石榴,猕猴桃,芒果,油桃,甜瓜(包括网纹瓜,香瓜,西瓜及其他甜瓜),橄榄,木瓜,西番莲,柿子,菠萝,李子和石榴。在另一个实施方案中,蔬菜选自芦笋、甜菜(例如糖用甜菜和饲料甜菜)、豆类、西兰花、卷心菜、胡萝卜、木薯、花椰菜、芹菜、黄瓜、茄子、大蒜、西印度黄瓜、绿叶蔬菜(莴苣,羽衣甘蓝,菠菜和其他绿叶蔬菜)、韭葱、小扁豆、蘑菇、洋葱、豌豆、辣椒(如甜椒,柿子椒和辣辣椒)、马铃薯、南瓜、甘薯、食荚菜豆、倭瓜、和番茄。在另一个实施方案中,苗圃植物或花或花朵部分选自满天星、康乃馨、大丽花、水仙花、天竺葵、非洲菊、百合、兰花、牡丹、野胡萝卜、玫瑰、金鱼草或其他切枝花或装饰花、盆栽花、花球、灌木、落叶或针叶树。
Ti质粒-在一些实施方案中,在RecA活性中有缺陷的根癌土壤杆菌(LBA4404)包含Ti质粒。Ti质粒(也称为辅助质粒)包含产生和转移T-DNA区域所必需的vir区域。Ti质粒(例如pAL4404,pTiBo542,pTiC58[和常见的衍生物pTi15955],pTiAch5或pTiChry5)包括,除了其他基因特征之外,章鱼碱合成基因、癌基因、毒力基因(下文称vir基因)和不完全重复的位于T-DNA侧翼的T-DNA边界序列。大多数用于植物转化的的土壤杆菌菌株中的Ti质粒是卸甲的。相应地,位于野生型有毒力的土壤杆菌菌株的T链内的vir和onc基因区已被去除或突变。然而,T-DNA边界被保留,并被修饰从而在右侧和左侧T-DNA边界之间包含一多核苷酸序列。卸甲的Ti质粒仍然能够在植物基因组DNA内转化T链,但是该T链被修饰从而减少或去除了在野生型和毒性T链中所见的致癌性质。在一个实施方案中,已被修饰从而重排、突变、缺失、添加、反转或移位了某个多核苷酸序列的野生型和毒性Ti质粒,在本文中称为Ti质粒衍生物。在一个实施方案中,T-DNA区域已经被修饰从而含有至少一种表达农艺性状的基因表达盒。此类具有功能性vir基因、且缺乏全部或基本上全部的T区和相关元件的Ti衍生质粒,在本申请中作为一个实施方案提供。
在后续的实施方案中,Ti质粒是pTiBo542质粒。在一个实施方案中,Ti质粒是pTiBo542质粒的衍生物(Hood,E.E.;Helmer,G.C.;Fraley,R.T.;Chilton,M.D.Thehypovirulence of Agrobacterium tumefaciens A281 is encoded in the region ofPtiB0542 outside the T-DNA.J.Bacteriol.168:1291–1301;1986,在此将其全部援引并入本文)。在后续的实施方案中,Ti质粒是pTiC58质粒(Holsters et al.,The FunctionalOrganization of the Nopaline A.tumefaciens plasmid pTiC58.Plasmid 3(2);212-230,1980,在此将其全部援引并入本文)。在一个实施方案中,Ti质粒是pTiC58质粒的衍生物。在后续的实施方案中,Ti质粒是pTiAch5质粒(Gielen,J.;De Beuckeleer,M.;Seurinck,J.;Deboeck F.;De Greve H.;Lemmers,M.;Van Montagu M.;Schell J.TheComplete Nucleotide Sequence of the TL-DNA of the Agrobacterium tumefaciensplasmid pTiAch5.The EMBO Journal.3(4):835-846;1984,在此将其全部援引并入本文)。在一个实施方案中,Ti质粒是pTiAch5质粒的衍生物。在后续的实施方案中,Ti质粒是pTiChry5质粒(Kovacs L.G.;Pueppke S.G.Mapping and Genetic Organization ofpTiChry5,a Novel Ti Plasmid from a Highly Virulent Agrobacterium tumefaciensStrain,Mol Gen Genet 242(3):327-336,1994,在此将其全部援引并入本文)。在一个实施方案中,Ti质粒是pTiChry5质粒的衍生物。在后续的实施方案中,Ti质粒是pTi15995质粒(Barker,R.F.,Idler,K.B.,Thompson,D.V.and Kemp,J.D.Nucleotide sequence of theT-DNA region from the Agrobacterium tumefaciens octopine Ti plasmid pTi15955,Plant Mol.Biol.2(6),335-350,1983,在此将其全部援引并入本文)。在一个实施方案中,Ti质粒是pTi15995质粒的衍生物。在进一步的实施方案中,Ti质粒是pAL4404质粒的衍生物(van der Fits et al.,(2000)Plant Molec.Biol.43:495-502,在此将其全部援引并入本文)。
二元质粒-在一些实施方案中,在RecA活性中有缺陷的根癌土壤杆菌(LBA4404)包含二元载体。在其它实施方案中,第二质粒是二元载体。二元载体的非限制性实例包括:pBIN二元载体(Bevan M(1984)Binary Agrobacterium vectors for planttransformation.Nucleic Acids Res 12:8711–872,在此将其全部援引并入本文);pGA二元载体(An G(1987)Binary Ti vectors for plant transformation and promoteranalysis.Methods Enzymol 153:292–305An G,Watson BD,Stachel S,Gordon MP,NesterEW(1985)New cloning vehicles for transformation of higher plants.EMBO J 4:277–284,在此将其全部援引并入本文);SEV二元载体(Fraley RT,Rogers SG,Horsch RB,Eichholtz DA,Flick JS,Fink CL,Hoffmann NL,Sanders PR(1985)The SEV system:anew disarmed Ti plasmid vector system for plant transformation.Biotechnology(N Y)3:629–635,在此将其全部援引并入本文);pEND4K二元载体(Klee HJ,Yanofsky MF,Nester EW(1985)Vectors for transformation of higher plants.Biotechnology(N Y)3:637–642,在此将其全部援引并入本文);pBI二元载体(Jefferson RA,Kavanagh TA,BevanMW(1987)GUS fusions:b-glucuronidase as a sensitive and versatile genefusion marker in higher plants.EMBO J 6:3901–3907,在此将其全部援引并入本文);pCIB10二元载体(Rothstein SJ,Lahners KN,Lotstein RJ,Carozzi NB,Jayne SM,RiceDA(1987)Promoter cassettes,antibiotic-resistance genes,and vectors for planttransformation.Gene 53:153–161,在此将其全部援引并入本文);pMRK63二元载体(Vilaine F,Casse-Delbart F(1987)A new vector derived from Agrobacteriumrhizogenes plasmids:a micro-Ri plasmid and its use to construct a mini-Riplasmid.Gene 55:105–114,在此将其全部援引并入本文);pGPTV二元载体(Becker D(1990)Binary vectors which allow the exchange of plant selectable markers andreporter genes.Nucleic Acids Res 18:203,在此将其全部援引并入本文);pCGN1547二元载体(McBride KE,Summerfelt KR(1990)Improved binary vectors forAgrobacterium-mediated plant transformation.Plant Mol Biol 14:269–276,在此将其全部援引并入本文);pART二元载体(Gleave AP(1992)A versatile binary vectorsystem with a T-DNA organizational structure conducive to efficientintegration of cloned DNA into the plant genome.Plant Mol Biol 20:1203–1207,在此将其全部援引并入本文);pGKB5二元载体(Bouchez D,Camilleri C,Caboche M(1993)A binary vector based on Basta resistance for in planta transformation ofArabidopsis thaliana.C R Acad Sci Ser III Sci Vie 316:1188–1193,在此将其全部援引并入本文);pMJD80二元载体(Day MJD,Ashurst JL,Dixon RA(1994)Plantexpression cassettes forenhanced translational efficiency.Plant Mol Biol Rep12:347–357,在此将其全部援引并入本文);pMJD81二元载体(Day MJD,Ashurst JL,DixonRA(1994)Plant expression cassettes forenhanced translational efficiency.PlantMol Biol Rep 12:347–357,在此将其全部援引并入本文);pPZP二元载体(HajdukiewiczP,Svab Z,Maliga P(1994)The small,versatile pPZP family of Agrobacteriumbinary vectors for plant transformation.Plant Mol Biol 25:989–994,在此将其全部援引并入本文);pBINPLUS二元载体(van Engelen FA,Molthoff JW,Conner AJ,Nap JP,Pereira A,StiekemaWJ(1995)pBINPLUS:an improved plant transformation vectorbased on pBIN19.Transgenic Res 4:288–290,在此将其全部援引并入本文);pRT100二元载体(Uberlacker B,Werr W(1996)Vectors with rare-cutter restriction enzymesites for expression of open reading frames in transgenic plants.Mol Breed 2:293–295,在此将其全部援引并入本文);pCB二元载体(Xiang C,Han P,Lutziger I,WangK,Oliver DJ(1999)A mini binary vector series for plant transformation.PlantMol Biol 40:711–717,在此将其全部援引并入本文);pGreen二元载体(Hellens RP,Edwards EA,Leyland NR,Bean S,Mullineaux PM(2000)pGreen:a versatile andflexible binary Ti vector for Agrobacteriummediated planttransformation.Plant Mol Biol 42:819–832,在此将其全部援引并入本文);pPZP-RCS2二元载体(Goderis IJWM,De BolleMFC,Francois IEJA,Wouters PFJ,BroekaertWF,Cammue BPA(2002)A set of modular plant transformation vectors allowingflexible insertion of up to six expression units.Plant Mol Biol 50:17–27,在此将其全部援引并入本文);pMDC二元载体(Curtis MD,Grossniklaus U(2003)A gatewaycloning vector set for highthroughput functional analysis of genes inplanta.Plant Physiol 133:462–469,在此将其全部援引并入本文);pRCS2二元载体(Chung SM,Frankman EL,Tzfira T(2005)A versatile vector system for multiplegene expression in plants.Trends Plant Sci 10:357–361,在此将其全部援引并入本文);pEarleyGate二元载体(Earley KW,Haag JR,Pontes O,Opper K,Juehne T,Song K,Pikaard CS(2006)Gateway-compatible vectors for plant functional genomics andproteomics.Plant J 45:616–629,在此将其全部援引并入本文);pGWTAC二元载体(ChenQJ,Zhou HM,Chen J,Wang XC(2006)A Gateway-based platform for multigene planttransformation.Plant Mol Biol 62:927–936,在此将其全部援引并入本文);pORE二元载体(Coutu C,Brandle J,Brown D,Brown K,Miki B,Simmonds J,Hegedus DD(2007)pORE:Amodular binary vector series suited for both monocot and dicot planttransformation.Transgenic Res 16:771–781,在此将其全部援引并入本文);pSITE二元载体(Chakrabarty R,Banerjee R,Chung SM,Farman M,Citovsky V,Hogenhout SA,Tzfira T,Goodin M(2007)pSITE vectors for stable integration or transientexpression of autofluorescent protein fusions in plants:probing Nicotianabenthamiana-virus interactions.Mol Plant Microbe Interact 20:740–750,在此将其全部援引并入本文);pMSP二元载体(Lee LY,Kononov ME,Bassuner B,Frame BR,Wang K,Gelvin SB(2007)Novel plant transformation vectors containing thesuperpromoter.Plant Physiol 145:1294–1300,在此将其全部援引并入本文);pCAMBIA二元载体(http://www.cambia.org/daisy/cambia/materials/vectors);以及pGD二元载体(Goodin MM,Dietzgen RG,Schichnes D,Ruzin S,Jackson AO(2002)pGD vectors:versatile tools for the expression of green and red fluorescent proteinfusions in agroinfiltrated plant leaves.Plant J 31:375–383,在此将其全部援引并入本文)。参见,在此将其全部援引并入本文。二元载体通常含有许多重要特征,例如:T-DNA边界序列、在大肠杆菌和土壤杆菌菌株中都有功能的复制起点、与由pTi/pRi噬菌体和/或土壤杆菌基因组所携带的其它抗生素抗性相容的抗生素抗性基因、以及其他可提高植物转化效率的特征(例如,过驱动序列)。二元载体的其他特征对于本领域普通技术人员是已知的,例如参见Lee and Gelvin(2008)Plant Physiology,146;325-332(通过引用并入本文),其公开了许多上述二元特征质粒/载体。
三元载体-在一些实施方案中,在RecA活性中有缺陷的根癌土壤杆菌(LBA4404)包含三元载体。已经描述了一种“三元”(即三质粒)载体,其中:来自pTil5955的组成型突变体virGN54D基因的一个拷贝与共存于土壤杆菌菌株LBA4404中pBBR1衍生的质粒上,所述土壤杆菌菌株LBA4404含有卸甲的辅助质粒pAL4404和携带用于植物转化的基因的二元质粒。参见van der Fits et al.,(2000)Plant Molec.Biol.43:495-502,在此将其全部援引并入本文。三元质粒的其他非限制性实例在欧洲专利申请号2042602A1和美国专利申请号2010/0132068A1中有更详细的描述,它们记载了这样的粘粒二元载体和“强化”(booster)质粒,它们当存在于携带Ti辅助质粒的土壤杆菌细胞中时,构成三元质粒系统的进一步实例,在此将上述文献全部并入本文。最后,国际专利申请号2012016222A2描述了一种用于土壤杆菌的三元质粒系统,在此将其全部援引并入本文。
质粒-在一些实施方案中,含有recA基因的质粒是本公开的一个实施方案。基于质粒中含有的序列,将质粒归于不相容组(基因型命名:inc;组命名:Inc)。inc决定子通常发挥以避免相同或有关的不相容组的其它质粒共同存在于相同的宿主中,并且帮助维持该质粒在细胞中的特定拷贝数的作用。参见,例如Fernandez-Lopez,et al.(2006)FEMSMicrobiol.Rev.30:942-66;和Adamczyk and Jagura-Burdzy(2003)ActaBiochim.Pol.50:425-53。如果两个质粒中的任何一个在存在另一个的情况下比其单独存在时更不稳定,那么这两个质粒是不相容的。当在相同细胞中发现同一不相容组的两个质粒时,可能产生对细胞资源的竞争。哪个质粒能够更快地复制或提供一些其它优势,其就会在不相容系统允许的拷贝中以不成比例的程度呈现出来。令人惊讶的是,当多个质粒都具有相同的将其自身分裂到子细胞中的功能时,它们也可能是不相容的。
质粒通常仅落入许多现有的不相容组之一。有超过30种已知的不相容组。人们对属于不相容组IncP的质粒已经进行了透彻的研究,并且已经构建了大量自该IncP组衍生的质粒(Schmidhauser et al.(1988)Biotechnology 10:287-332)。含有IncP不相容组的示例质粒包括:pMP90RK、pRK2013、pRK290、pRK404和pRK415。这些质粒能够在众多细菌物种,包括大肠杆菌和根癌土壤杆菌中维持。其它不相容组的例子包括但不限于:IncN、IncW、IncL/M、IncT、IncU、IncW、IncY、IncB/O、IncFII、IncII、IncK、IncCom9、IncFI、IncFII、IncFIII、IncHIl、IncHI2、IncX、IncA/C、IncD、IncFIV、IncFV/FO、IncFVI、IncHl 3、IncHII、Inc12、IncI、IncJ、IncV、IncQ,等等,包括其变体,例如显示基本的序列或功能关系的变体。
另外,使用本文中描述的方法用于转化植物细胞的合适的载体可以含有选择标志物基因,其编码的蛋白质可赋予转化的植物细胞对抗生素或除草剂抗性。各别采用的选择标志物基因可以相应地允许对转化细胞的选择,而不含有插入DNA的细胞的生长可能受到该选择性化合物的抑制。特定的选择标志物基因(一种或多种)的使用可以取决于实验设计或偏好,但可以使用以下任一种选择标志物以及任何未在本文中列出但可以充当选择标志物的其它基因。选择标志物的例子包括但不限于,提供对抗生素诸如卡那霉素、G418、潮霉素、博来霉素、和甲氨蝶呤的抗性或耐受的基因,或提供对除草剂诸如膦丝菌素(双丙氨膦(Bialaphos))、草甘膦、咪唑啉酮、磺酰脲、三唑嘧啶(Triazolopyrimidine)、氯磺隆(Chlorosulfuron)、溴草腈(Bromoxynil)、和茅草枯(Dalapon)的抗性或耐受性的基因。
编码农艺性状的基因表达盒-在随后的实施方案中,选择植物细胞从所述细胞再生植物。在本公开的另外的实施方案中,T-DNA含有编码农艺性状的基因表达盒。在另外的实施方案中,农艺性状产生商业产品。
在一个实施方案中,本发明涉及引入插入植物基因组内的一种或多种基因表达盒。在一些实施方案中,基因表达盒包含编码序列。编码序列可以编码例如赋予农艺性状的基因。在进一步的实施方案中,农艺性状选自杀虫抗性性状,除草剂耐受性状,氮利用效率性状,水分利用效率性状,营养品质性状,DNA结合性状和选择标志物性状。在另外的实施方案中,农艺性状在植物中表达。本发明公开的实施方案包括包含一种或多种农艺性状的植物。
在一些实施方案中,转基因植物包含基因表达盒。如本文中使用的用于构建基因表达盒的标准重组DNA和分子克隆技术是本领域公知的,在例如下列文献中描述:Sambrooket al.,Molecular Cloning:A Laboratory Manual,Second Edition,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY(1989);和Silhavy et al.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY(1984);以及Ausubel et al.,Current Protocols in Molecular Biology,由Greene Publishing Assoc.和Wiley-Interscience出版(1987)。
基因表达盒中可以使用多种在植物中指导基因表达的启动子。这些启动子可以从组成型、化学调节型、诱导型、组织特异型、和种子优选型启动子中选择。由于指导核酸表达的启动子根据具体的应用而定。例如,适合于宿主细胞的强组成型启动子一般用于表达和纯化表达的蛋白质。
植物启动子的非限制性优选实例包括来自如下来源的启动子序列:拟南芥泛素-10(ubi 10)(Callis,et al.,1990,J.Biol.Chem.,265:12486-12493);根癌土壤杆菌甘露碱合酶(Amas)(Petolino et al.,美国专利6,730,824);和/或木薯叶脉花叶病毒(CsVMV)(Verdaguer et al.,1996,Plant Molecular Biology 31:1129-1139)。其他组成型启动子包括,例如,核心花椰菜花叶病毒35S启动子(Odell et al.(1985)Nature 313:810-812);水稻肌动蛋白质启动子(McElroy et al.(1990)Plant Cell 2:163-171);玉米泛素启动子(美国专利号5,510,474;Christensen et al.(1989)Plant Mol.Biol.12:619-632;及Christensen et al.(1992)Plant Mol.Biol.18:675-689);pEMU启动子(Last et al.(1991)Theor.Appl.Genet.81:581-588);ALS启动子(美国专利号5,659,026);玉米组蛋白启动子(Chaboutéet al.Plant Molecular Biology,8:179-191(1987))等。
其他有用的植物启动子包括组织特异性和诱导型启动子。诱导型启动子是能够响应诱导剂而直接或间接激活一种或多种DNA序列或基因的转录的启动子。在没有诱导物时,上述DNA序列或基因将不被转录。通常,特异性结合诱导型调控元件从而激活转录的蛋白质因子以无活性的形式存在,随后会被诱导剂直接或间接地转化为活性形式。诱导物可以是化学剂,例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或由热、冷、盐、或有毒元素所直接施加的生理胁迫,或通过病原体或致病剂如病毒而间接施加的生理胁迫。典型地,特异性结合诱导型调控元件从而激活转录的蛋白质因子以无活性的形式存在,随后会被诱导剂直接或间接地转化为活性形式。可以通过从外部将诱导物施用给细胞或植物,例如通过喷雾、浇水、加热或类似的方法,而将含有诱导型调控元件的植物细胞暴露于诱导物。
在本文的实施方案中可以使用任何诱导型启动子。见Ward et al.PlantMol.Biol.22:361 366(1993)。诱导型启动子包括,例如但不限于:蜕皮激素受体启动子(美国专利号6,504,082);来自ACE1系统的响应铜的启动子(Mett et al.,Proc.Natl.Acad.Sci.90:4567-4571(1993));来自玉米的响应苯磺酰胺除草剂安全剂的In2-1和In2-2基因(美国专利号5,364,780;Hershey et al.,Mol.Gen.Genetics 227:229-237(1991)and Gatz et al.,Mol.Gen.Genetics 243:32-38(1994));来自Tn10的Tet阻遏物(Gatz et al.,Mol.Gen.Genet.227:229-237(1991);或来自类固醇激素基因的启动子,其转录活性受到糖皮质激素的诱导,Schena et al.,Proc.Natl.Acad.Sci.U.S.A.88:10421(1991)和McNellis et al.,(1998)Plant J.14(2):247-257;玉米GST启动子,其被用作苗前除草剂的疏水亲电子化合物激活(参见美国专利No.5,965,387和国际专利申请公开No.WO 93/001294);和烟草PR-1a启动子,其被水杨酸激活(见Ono S,Kusama M,Ogura R,Hiratsuka K.,“Evaluation of the Use of the Tobacco PR-1a Promoter to MonitorDefense Gene Expression by the Luciferase Bioluminescence Reporter System,”Biosci Biotechnol Biochem.2011Sep 23;75(9):1796-800))。其他受化学调控的感兴趣的启动子包括四环素诱导型和四环素抑制型的启动子(参见,例如,Gatz et al.,(1991)Mol.Gen.Genet.227:229-237,和美国专利号5,814,618及5,789,156)。
其它可调节的感兴趣启动子包括冷应答调控元件或热激调控元件,其转录分别受到冷或热暴露的影响(Takahashi et al.,Plant Physiol.99:383-390,1992);可被厌氧条件诱导的醇脱氢酶基因的启动子(Gerlach et al.,PNAS USA 79:2981-2985(1982);Walker et al.,PNAS 84(19):6624-6628(1987)),来自豌豆rbcS基因或豌豆psaDb基因的光诱导型启动子(Yamamoto et al.(1997)Plant J.12(2):255-265);光诱导型调节元件(Feinbaum et al.,Mol.Gen.Genet.226:449,1991;Lam and Chua,Science 248:471,1990;Matsuoka et al.(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590;Orozco etal.(1993)Plant Mol.Bio.23(6):1129-1138);植物激素诱导型调节元件(Yamaguchi-Shinozaki et al.,Plant Mol.Biol.15:905,1990;Kares et al.,Plant Mol.Biol.15:225,1990),等等。诱导型调控元件还可以是玉米In2-1或In2-2基因,它们响应苯磺酰胺除草剂安全剂(Hershey et al.,Mol.Gen.Gene.227:229-237,1991;Gatz et al.,Mol.Gen.Genet.243:32-38,1994),and the Tet repressor of transposon Tn10(Gatzet al.,Mol.Gen.Genet.227:229-237,1991)。胁迫诱导型启动子包括盐/水胁迫诱导型启动子,如P5CS(Zang et al.(1997)Plant Sciences 129:81-89);冷诱导型启动子,如cor15a(Hajela et al.(1990)Plant Physiol.93:1246-1252)、cor15b(Wilhelm et al.,(1993)Plant Mol Biol 23:1073-1077)、wsc1(Ouellet et al.,(1998)FEBS Lett.423-324-328)、ci7(Kirch et al.,(1997)Plant Mol Biol.33:897-909)、ci21A(Schneider etal.,(1997)Plant Physiol.113:335-45);干旱诱导型启动子,如Trg_31(Chaudhary etal.(1996)Plant Mol.Biol.30:1247-57)和rd29(Kasuga et al.(1999)NatureBiotechnology 18:287-291)。渗透压诱导型启动子,如Rab17(Vilardell et al.,(1991)Plant Mol.Biol.17:985-93)和渗压素(osmotin)(Raghothama et al.(1993)Plant MolBiol 23:1117-28);以及热诱导型启动子,如热激蛋白(Barros et al.(1992)PlantMol.19:665-75;Marrs et al.(1993)Dev.Genet.14:27-41)、smHSP(Waters et al.(1996)J.Experimental Botany 47:325-338);和来自欧芹泛素启动子的热激诱导型元件(WO 03/102198)。其它胁迫诱导型启动子包括rip2(美国专利号5,332,808和美国公开号No.2003/0217393)和rd29a(Yamaguchi Shinozaki et al.(1993)Mol.Gen.Genetics 236:331-340)。某些启动子可以被创伤诱导,包括土壤杆菌属的pMAS启动子(Guevara Garcia etal.(1993)Plant J.4(3):495-505)和土壤杆菌ORF13启动子(Hansen et al.,(1997)Mol.Gen-Genet.254(3):337-343)。
组织优选的启动子可用于在特定植物组织内靶向增强转录和/或表达。当提到优先表达时,意指在该特定在植物组织中的表达高于在其他植物组织中的表达。这些类型启动子的实例包括种子优选(seed-preferred)的表达,例如由菜豆蛋白(phaseolin)启动子(Bustos et al.,(1989)The Plant Cell Vol.1,839-853)和玉米球蛋白-1基因(Belanger,et al.(1991)Genetics 129:863-972)提供的种子优选表达。对于双子叶植物,种子优选的启动子包括,但不限于,菜豆的β-菜豆蛋白(β-phaseolin)、油菜籽蛋白(napin)、β-伴大豆球蛋白(β-conglycinin)、大豆凝集素(soybean lectin)、十字花科蛋白(cruciferin),等等。对于单子叶植物,种子优选的启动子包括但不限于:玉米的15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、γ-玉米醇溶蛋白、糯质蛋白质(waxy)、超甜素(shrunken)1和超甜素2、球蛋白1,等等。种子优选的启动子还包括那些指导基因主要在种子内的特定组织中表达的启动子,例如,γ-玉米醇溶蛋白的胚乳优选的启动子,来自烟草的隐藏(cryptic)启动子(Fobert et al.,(1994)T-DNA tagging of a seedcoat-specific cryptic promoter in tobacco.Plant J.4:567-577),来自玉米的P-基因启动子(Chopra et al.,(1996)Alleles of the maize P gene with distinct tissuespecificities encode Myb-homologous proteins with C-terminalreplacements.Plant Cell 7:1149-1158,Erratum in Plant Cell.1997,1:109),来自玉米的球蛋白-1启动子(Belenger and Kriz(1991)Molecular basis for AllelicPolymorphism of the maize Globulin-1gene.Genetics129:863-972),和指导在玉米粒的种皮或果壳上表达的启动子,例如果皮特异性谷氨酰胺合成酶启动子(Muhitch et al.,(2002)Isolation of a Promoter Sequence From the Glutamine Synthetase1-2 GeneCapable of Conferring Tissue-Specific Gene Expression in TransgenicMaize.Plant Science 163:865-872)。
除了启动子之外,基因表达盒(其可以例如处于载体中)通常还含有转录单元或表达盒,其含有用于在宿主细胞(无论是原核还是真核)内表达核酸所需的全部其它元件。因此,典型的表达盒含有,例如,与编码基因产物(例如蛋白质)的核酸序列可操作连接的启动子。基因表达盒还可以包括根据本领域已知方法可操作连接的其他元件:高效进行转录本多聚腺苷酸化、转录终止、核糖体结合位点、或翻译终止所需的信号。此外,表达盒可包含增强子和/或异源剪接信号。
提供基因表达盒的其他成分作为实施方案。实例包括选择标志物、靶向序列或调控序列,转运肽序列如优化的转运肽序列(见美国专利号5,510,471),稳定化序列如RB7MAR(见Thompson and Myatt,(1997)Plant Mol.Biol.,34:687-692,和国际专利公布号WO9727207),或前导序列、内含子等。植物表达载体和报告基因的一般描述和实例可以参见“Vectors for Plant Transformation”,录自Methods in Plant Molecular Biology andBiotechnology,Glick et al eds;CRC Press pp.89-119(1993)。合适的表达载体的选择将取决于宿主和将表达载体导入宿主内的方法。基因表达盒还会在感兴趣的异源核苷酸序列3'端包括在植物中发挥功能的转录和翻译终止区。终止区可以是感兴趣的DNA序列天然具有的,或者可以来自其他的来源。易用的终止区可以从根癌土壤杆菌的Ti质粒获得,例如章鱼碱合酶和胭脂碱合酶(nos)终止区(Depicker et al.,Mol.and Appl.Genet.1:561-573(1982)and Shaw et al.(1984)Nucleic Acids Research vol.12,No.20pp7831-7846(nos));see also Guerineau et al.Mol.Gen.Genet.262:141-144(1991);Proudfoot,Cell 64:671-674(1991);Sanfacon et al.Genes Dev.5:141-149(1991);Mogen etal.Plant Cell 2:1261-1272(1990);Munroe et al.Gene 91:151-158(1990);Ballas etal.,Nucleic Acids Res.17:7891-7903(1989);Joshi et al.Nucleic Acid Res.15:9627-9639(1987)。
基因表达盒还可以含有5'前导序列。这些前导序列可以发挥增强翻译的作用。翻译前导序列是本领域已知的,并包括例如小核糖核酸病毒(picornavirus)的前导序列、EMCV前导序列(脑心肌炎5'非编码区),Elroy-Stein et al.Proc.Nat.Acad.Sci.USA 86:6126-6130(1989);马铃薯Y病毒前导序列,例如,TEV前导序列(烟草蚀纹病毒)Carringtonand Freed Journal of Virology,64:1590-1597(1990),MDMV前导序列(玉米矮花叶病毒),Allison et al.,Virology 154:9-20(1986);人免疫球蛋白质重链结合蛋白(BiP),Macejak et al.Nature 353:90-94(1991);来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导序列(AMV RNA4),Jobling et al.Nature 325:622-625(1987);烟草花叶病毒前导序列(TMV),Gallie et al.(1989)Molecular Biology of RNA,237-256;和玉米绿斑驳病毒前导序列Lommel et al.,Virology 81:382-385(1991)。另见Della-Cioppa et al.,PlantPhysiology 84:965-968(1987)。
基因表达盒构建体还包含可增强翻译和/或mRNA稳定性的序列,例如内含子。这种内含子的一个实例是拟南芥组蛋白H3.III变体的基因II的第一内含子。Chaubet et al.,Journal of Molecular Biology,225:569-574(1992)。
在期望基因表达盒表达的基因产物被引导到特定的细胞器,特别是质体、造粉体,或到内质网,或者分泌在细胞表面或细胞外的场合,表达盒可以进一步包括转运肽编码序列。这样的转运肽是本领域公知的,并且包括但不限于:酰基载体蛋白、RUBISCO的小亚基、植物EPSP合酶和向日葵的转运肽(美国专利5,510,417),玉米Brittle-1叶绿体转运肽(Nelson et al.,Plant Physiol 117(4):1235-1252(1998);Sullivan et al.,PlantCell 3(12):1337-48;Sullivan et al.,Planta(1995)196(3):477-84;Sullivan et al.,J.Biol.Chem.(1992)267(26):18999-9004)等。此外,嵌合的叶绿体转运肽是本领域已知的,例如优化的转运肽(参见美国专利号5,510,471)。其它的如叶绿体转运肽先前已经在美国专利号5,717,084;5,728,925中有描述。本领域的技术人员将很容易意识到,有许多种选项可用于将产物表达到特定的细胞器中。例如,大麦α淀粉酶序列常被用于指导向内质网的表达。(Rogers,J.Biol.Chem.260:3731-3738(1985))。
本领域的技术人员会意识到,使用重组DNA技术能够提高被转染核酸分子的表达控制,例如通过操纵宿主细胞内核酸分子的拷贝数、核酸分子转录的效率、所得的转录本翻译的效率、和翻译后修饰的效率。此外,可以对启动子序列进行基因工程改造,使其与天然启动子相比表达水平提高。可用于控制核酸分子表达的重组技术包括,但不限于,将核酸分子稳定整合到一个或多个宿主细胞染色体中,向质粒添加载体稳定性序列,替换或修饰转录控制信号(例如启动子、操纵基因、增强子),替换或修饰翻译控制信号(例如,核糖体结合位点、Shine-Dalgarno或Kozak序列),修饰核酸分子使其与宿主细胞的密码子利用率对应、和删除导致转录物不稳定的序列。
转化载体中可以包含用于筛选被转化的细胞或组织或植物部分或植物的报告基因或标志物基因。选择标志物的实例包括那些可赋予针对抗代谢物(例如除草剂或抗生素)的耐受性的标志物,例如:二氢叶酸还原酶,其赋予对氨甲喋呤的抗性(Reiss,PlantPhysiol.(Life Sci.Adv.)13:143-149,1994;另见Herrera Estrella et al.,Nature303:209-213,1983;Meijer et al.,Plant Mol.Biol.16:807-820,1991);新霉素磷酸转移酶,其赋予对氨基糖苷类新霉素、卡那霉素和巴龙霉素的抗性(Herrera-Estrella,EMBOJ.2:987-995,1983和Fraley et al.,Proc.Natl.Acad.Sci USA 80:4803(1983));和潮霉素磷酸转移酶,其赋予潮霉素抗性(Marsh,Gene 32:481-485,(1984);另见Waldron etal.,Plant Mol.Biol.5:103-108,(1985);Zhijian et al.,Plant Science 108:219-227,(1995));trpB,其允许细胞利用吲哚代替色氨酸;hisD,其允许细胞利用组氨醇代替组氨酸(Hartman,Proc.Natl.Acad.Sci.,USA 85:8047,(1988));甘露糖-6-磷酸异构酶,其允许细胞利用甘露糖(国际专利申请号WO94/20627);鸟氨酸脱羧酶,其赋予对鸟氨酸脱羧酶抑制剂2-(二氟甲基)-DL-鸟氨酸的抗性(DFMO;McConlogue,1987,录自:CurrentCommunications in Molecular Biology,Cold Spring Harbor Laboratory ed.);和来自土曲霉的脱氨酶,其赋予对稻痕菌素S的抗性(Tamura,Biosci.Biotechnol.Biochem.59:2336-2338,(1995))。
其它的选择标志物包括,例如,突变体乙酰乳酸合酶,其赋予咪唑啉酮或磺酰脲抗性(Lee et al.,EMBO J.7:1241-1248,(1988)),突变体psbA,其赋予阿特拉津(atrazine)抗性(Smeda et al.,Plant Physiol.103:911-917,(1993)),或突变体原卟啉原氧化酶(见美国专利No.5,767,373),其它赋予对除草剂(例如草胺膦)抗性的标志物。合适的选择标志物基因的实例包括,但不限于,编码氯霉素抗性(Herrera Estrella et al.,EMBO J.2:987-992,(1983));链霉素抗性(Jones et al.,Mol.Gen.Genet.210:86-91,(1987));壮观霉素抗性(Bretagne-Sagnard et al.,Transgenic Res.5:131-137,(1996));博来霉素抗性(Hille et al.,Plant Mol.Biol.7:171-176,(1990));磺酰胺抗性(Guerineau et al.,Plant Mol.Biol.15:127-136,(1990));溴苯腈抗性(Stalker et al.,Science 242:419-423,1988);草甘膦抗性(Shaw et al.,Science 233:478-481,(1986));膦丝菌素(phosphinothricin)抗性(DeBlock et al.,EMBO J.6:2513-2518,(1987)),等的基因。
供选择基因使用的一个选项是编码草胺膦抗性的DNA,并且在一个实施方案中,可以是处于木薯叶脉花叶病病毒启动子控制之下的草铵膦乙酰转移酶(pat)、玉米优化的pat基因或bar基因这些基因赋予对双丙氨膦(bioalaphos)的抗性。见(见Wohlleben et al.,(1988)Gene 70:25-37);Gordon-Kamm et al.,Plant Cell 2:603;1990;Uchimiya etal.,BioTechnology 11:835,1993;White et al.,Nucl.Acids Res.18:1062,1990;Spencer et al.,Theor.Appl.Genet.79:625-631,1990;and Anzai et al.,Mol.Gen.Gen.219:492,1989)。pat基因的一个版本是玉米优化的pat基因,其在美国专利No.6,096,947中有描述。
此外,可以使用这样的标志物,其有助于鉴定含有编码该标志物的多核苷酸的植物细胞。当序列的存在产生可测量的产物,并且能够产生产物而不会破坏植物细胞时,可以使用可评分的(scorable)或可筛选的(screenable)标志物。实例包括β-葡糖醛酸酶或uidA基因(GUS),其编码一种酶,该酶有多种发色底物是已知的(例如,美国专利5,268,463和5,599,670);氯霉素乙酰转移酶(Jefferson et al.The EMBO Journal vol.6No.13pp.3901-3907);和碱性磷酸酶。在一个优选的实施方案中,所用的标志物是β-胡萝卜素或维生素原A(Ye et al.,Science 287:303-305(2000))。该基因已被用于提高稻米的营养,但在这里是使用它作为可筛选标志物,利用所提供的金黄色来检测与感兴趣基因连锁的该基因的存在。与使用该基因为植物贡献营养的情况不同的是,更小量的蛋白质足以实现该目的。其它可筛选标志物包括一般的花青素/类黄酮的基因(见Taylor and Briggs,The Plant Cell(1990)2:115-127中所讨论的),包括例如,R-座位基因,其编码的产物可以调节植物组织中花青素色素(红色)的产生(Dellaporta et al.,录自Chromosome Structure andFunction,Kluwer Academic Publishers,Appels and Gustafson eds.,pp.263-282(1988));控制类黄酮色素生物合成的基因,如玉米C1基因(Kao et al·,Plant Cell(1996)8:1171-1179;Scheffler et al·,Mol.Gen.Genet.(1994)242:40-48)和玉米C2基因(Wienand et al·,Mol.Gen.Genet.(1986)203:202-207);B基因(Chandler et al·,Plant Cell(1989)1:1175-1183),p1基因(Grotewold et al.,Proc.Natl.Acad.Sci USA(1991)88:4587-4591;Grotewold et al.,Cell(1994)76:543-553;Sidorenko et al.,Plant Mol.Biol.(1999)39:11-19);青铜色(bronze)座位基因(Ralston et al.,Genetics(1988)119:185-197;Nash et al.,Plant Cell(1990)2(11):1039-1049),等等。
合适标志物的其他实例包括青色荧光蛋白质(CYP)基因(Bolte et al.,(2004)J.Cell Science 117:943-54和Kato et al.,(2002)Plant Physiol 129:913-42),黄色荧光蛋白质基因(来自Evrogen的PHIYFPTM;见Bolte et al.,(2004)J.Cell Science 117:943-54);lux基因,其编码一种荧光素酶,该荧光素酶的存在可以通过使用,例如,X射线胶片、闪烁计数、荧光光度法、低光度摄像机、光子计数摄像机或多孔发光法等进行检测(Teeri et al.(1989)EMBO J.8:343);绿色荧光蛋白质(GFP)基因(Sheen et al.,PlantJ.(1995)8(5):777-84);和DsRed2,用该标志物基因转化的植物细胞呈红色,因此可以通过目测选择(Dietrich et al.,(2002)Biotechniques 2(2):286-293)。其它的实例包括β-内酰胺酶基因(Sutcliffe,Proc.Nat'l.Acad.Sci.U.S.A.(1978)75:3737),其编码各种发色底物已知的酶(例如PADAC,一种发色头孢菌素);xylE基因(Zukowsky et al.,Proc.Nat'l.Acad.Sci.U.S.A.(1983)80:1101),其编码邻苯二酚双加氧酶,该酶能够转化发色儿茶酸;α-淀粉酶基因(Ikuta et al.,Biotech.(1990)8:241);和酪氨酸酶基因(Katz et al.,J.Gen.Microbiol.(1983)129:2703),其编码的酶能够将酪氨酸氧化成DOPA和多巴醌,后者进一步缩合形成容易检测的化合物黑色素。显然,许多这样的标志物是本领域技术人员可用并且知晓的。
在某些实施方案中,编码表达盒中的基因产物的转基因的核苷酸序列可以任选地与盒和/或植物中的另一个感兴趣的核苷酸序列组合。例如,在某些实施方案中,转基因可以与提供对草甘膦或另一种除草剂的额外抗性或耐受性,和/或提供对选择的昆虫或疾病和/或营养增强的抗性,以及/或改良的农艺特征,和/或可用于饲料,食品,工业,制药或其它用途的蛋白质或其它产品的另一核苷酸序列组合或“堆叠”。在植物基因组内的两个或多个感兴趣的核酸序列的“堆叠”可以例如通过使用两个或更多个事件的常规植物育种,用含有感兴趣序列的构建体转化植物,转基因植物的再转化,或通过同源重组整合来添加新的性状来完成。
此类感兴趣的核苷酸序列包括,但不限于,那些赋予(1)对害虫或疾病的抗性;(2)对除草剂的抗性;和(3)如下所述的增值性状的基因或编码序列实例:
赋予害虫或疾病抗性的基因或编码序列(例如iRNA)
(A)植物疾病抗性基因。植物防御经常通过植物中疾病抗性基因(R)的产物与病原体中相应的无毒性(Avr)基因的产物的特异相互作用而被激活。可以用克隆的抗性基因转化植物品种,从而工程构建对特定病原体株有抗性的植物。这些基因的实例包括:提供黄枝孢霉(Cladosporium fulvum)抗性的番茄Cf-9基因(Jones et al.,1994Science 266:789);,提供丁香假单胞杆菌番茄致病变种抗性的番茄Pto基因,其编码一种蛋白激酶(Martin et al.,1993Science 262:1432),和提供丁香假单胞菌抗性的拟南芥RSSP2基因(Mindrinos et al.,1994Cell 78:1089)。
(B)苏云金芽孢杆菌蛋白质、其衍生物或以其为模本的人造多肽,例如Btδ-内毒素基因的多核苷酸序列(Geiser et al.,1986Gene 48:109)和植物杀虫(VIP)基因(见,例如,Estruch et al.(1996)Proc.Natl.Acad.Sci.93:5389-94)。此外,编码δ-内毒素基因的DNA分子可以从美国典型培养物保藏中心(Rockville,Md.)购得,ATCC登录号为40098,67136,31995和31998。
(C)植物凝集素,例如,多种君子兰(Clivia miniata)甘露糖结合性植物凝集素基因的核苷酸序列(Van Damme et al.,1994Plant Molec.Biol.24:825)。
(D)维生素结合蛋白质,例如亲和素及亲和素同源物,其可用作针对昆虫类害虫的杀幼虫剂。见美国专利No.5,659,026。
(E)酶抑制剂,例如蛋白酶抑制剂或淀粉酶抑制剂。这些基因的实例包括水稻半胱氨酸蛋白质酶抑制剂(Abe et al.,1987J.Biol.Chem.262:16793),烟草蛋白酶抑制剂I(Huub et al.,1993Plant Molec.Biol.21:985),和α-淀粉酶抑制剂(Sumitani et al.,1993Biosci.Biotech.Biochem.57:1243)。
(F)昆虫特异性激素或信息素,例如蜕皮激素和保幼激素或其变体、基于它们的模拟物,或其拮抗剂或激动剂,例如杆状病毒表达的克隆保幼激素酯酶,保幼激素的失活子(Hammock et al.,1990Nature 344:458)。
(G)昆虫特异性肽或神经肽,其在表达时会扰乱受影响的害虫的生理机能(J.Biol.Chem.269:9)。这些基因的实例包括昆虫利尿激素受体(Regan,1994),在太平洋折翅蠊(Diploptera punctata)中鉴定的咽侧体抑制素(allostatin)(Pratt,1989),和昆虫特异性麻痹神经毒素(美国专利No.5,266,361)。
(H)在自然界中由蛇、马蜂等产生的昆虫特异性毒液,例如蝎子昆虫毒性肽(Pang,1992Gene 116:165)。
(I)负责超富集单萜、倍半萜、甾体、异羟肟酸、苯丙烷衍生物或其它具有杀虫活性的非蛋白质分子的酶。
(J)参与生物活性分子修饰(包括翻译后修饰)的酶;例如糖酵解酶、蛋白质水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是人造的。这些基因的实例包括马蹄莲(callas)基因(PCT公开的申请WO 93/02197),几丁质酶编码序列(其可以从例如ATCC以登录号3999637和67152获得),烟草钩虫几丁质酶(Kramer et al.,1993InsectMolec.Biol.23:691),和欧芹ubi4-2多聚泛素基因(Kawalleck et al.,1993PlantMolec.Biol.21:673)。
(K)刺激信号转导的分子。这些分子的实例包括绿豆钙调蛋白cDNA克隆的核苷酸序列(Botella et al.,1994Plant Molec.Biol.24:757),和玉米钙调蛋白cDNA克隆的核苷酸序列(Griess et al.,1994Plant Physiol.104:1467)。
(L)疏水矩肽(hydrophobic moment peptide)。见例如美国专利Nos.5,659,026和5,607,914,后者教导了赋予疾病抗性的人造抗微生物肽。
(M)膜透性酶,通道形成剂或通道阻断剂,例如杀菌肽-β裂解肽类似物(Jaynes etal.,1993Plant Sci.89:43),其使转基因烟草植物对青枯病有抗性。
(N)病毒侵袭性蛋白质或由其衍生的复杂毒素。例如,在经转化的植物细胞中,病毒衣壳蛋白的积累可赋予针对该衣壳蛋白所来源的病毒以及相关病毒所致的病毒感染和/或疾病发展的抗性。已经给转化植物赋予了衣壳蛋白介导的,针对苜蓿花叶病毒、黄瓜花叶病毒、烟草条纹病毒、马铃薯X病毒、马铃薯Y病毒、烟草蚀纹病毒、烟草脆裂病毒和烟草花叶病毒的抗性。参见,例如,Beachy et al.(1990)Ann.Rev.Phytopathol.28:451。
(O)昆虫特异性抗体或由其衍生的免疫毒素。因此,靶向昆虫肠道关键代谢功能的抗体可以使受影响的酶失活,杀死昆虫。例如,Taylor等人(1994),在第七届国际分子植物-微生物相互作用研讨会(Seventh Int'l.Symposium on Molecular Plant MicrobeInteractions)上的第497号摘要显示了转基因烟草中通过产生单链抗体片段的酶失活。
(P)病毒特异性抗体。见例如Tavladoraki et al.(1993)Nature 266:469,其显示了表达重组抗体基因的转基因植物被保护免于病毒攻击。
(Q)由病原体或寄生物自然产生的发育阻滞(developmental-arrestive)蛋白质。因此,真菌内切α-1,4-D多聚半乳糖醛酸酶通过溶解植物细胞壁的均聚-α-1,4-D-半乳糖醛酸而促进真菌定殖和植物营养素释放(Lamb et al.,1992)Bio/Technology 10:1436。Toubart等(1992Plant J.2:367)描述了豆类内切多聚半乳糖醛酸酶抑制蛋白的编码基因的克隆和表征。
(R)由植物自然产生的发育阻滞(developmental-arrestive)蛋白质,例如大麦核糖体失活基因,其提供了增加的针对真菌疾病的抗性(Longemann et al.,1992).Bio/Technology 10:3305。
(S)RNA干扰,其中用编码RNA分子的DNA多核苷酸抑制靶基因的表达。一个实施例中的RNA分子是部分或完全双链的,其触发沉默响应,导致dsRNA被切割成小的干扰RNA,它们随后被纳入到靶向复合体中,靶向复合体破坏同源的mRNA。见例如Fire等人,美国专利6,506,559;Graham等人,美国专利6,573,099。
赋予除草剂抗性的基因或编码序列
(A)编码针对抑制生长点或分生组织的除草剂,例如咪唑啉酮类(imidazalinone)、磺酰苯胺类(sulfonanilide)或磺酰脲类除草剂的抗性或耐受性的基因。这类基因的实例编码一种突变ALS酶(Lee et al.,1988EMBOJ.7:1241),其也称AHAL酶(Miki et al.,1990Theor.Appl.Genet.80:449)。
(B)一种或多种额外的编码针对草甘膦抗性或耐受性的基因,所述抗性或耐受性是由突变体EPSP合酶和aroA基因赋予的,或者是通过一些基因如GAT(草甘膦乙酰转移酶)或GOX(草甘膦氧化酶)和其它膦酰基化合物,如草胺膦(pat和bar基因,DSM-2),和芳氧基苯氧基丙酸和环己二酮(ACC酶抑制剂编码基因)所致的代谢失活而获得的。见例如美国专利No.4,940,835,其公开了可赋予草甘膦抗性的EPSP形式的核苷酸序列。编码突变体aroA基因的DNA分子能够以ATCC登录号39256获得,突变体基因的核苷酸序列在美国专利No.4,769,061中公开。欧洲专利申请No.0 333 033和美国专利No.4,975,374公开了可赋予除草剂如L-草铵膦抗性的谷氨酰胺合酶基因的核苷酸序列。欧洲专利申请No.0 242 246提供了草铵膦乙酰转移酶基因的核苷酸序列。De Greef et al.(1989)Bio/Technology 7:61中描述了表达编码草铵膦乙酰转移酶活性的嵌合bar基因的转基因植物的产生。赋予针对芳氧基苯氧基丙酸和环己二酮如稀禾定和甲禾灵(haloxyfop)的抗性的示例性基因是Accl-S1,Accl-S2和Accl-S3基因,如Marshall et al.(1992)Theor.Appl.Genet.83:435所述。
(C)编码针对可抑制光合作用的除草剂例如三嗪(psbA和gs+基因)和苄腈(腈水解酶基因)的抗性的基因。Przibilla et al.(1991)Plant Cell 3:169描述了使用编码突变体psbA基因的质粒转化衣藻。在美国专利No.4,810,648中腈水解酶基因的核苷酸序列,含有这些基因的DNA分子可以通过ATCC登录号53435、67441和67442获得。Hayes et al.(1992)Biochem.J.285:173中描述了编码谷胱甘肽S-转移酶的DNA的克隆和表达。
(D)编码针对可结合羟基苯基丙酮酸二加氧酶(HPPD)的除草剂的抗性基因,HPPD是催化对-羟基苯基丙酮酸(HPP)转化形成尿黑酸的反应的酶。这包括例如异噁唑(欧洲专利418175,欧洲专利470856,欧洲专利487352,欧洲专利527036,欧洲专利560482,欧洲专利682659,美国专利5,424,276),特别是异噁唑草酮,其是玉米的选择性除草剂,二酮腈(diketonitrile)(欧洲专利496630,欧洲专利496631),特别是2-氰基-3-环丙基-1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-3-环丙基-1-(2-SO2CH3-4-2,3Cl2苯基)丙烷-1,3-二酮,三酮类(欧洲专利625505,欧洲专利625508,美国专利5,506,195),特别是磺草酮、和pyrazolinate等除草剂。在植物中产生过量HPPD的基因能够提供针对这些除草剂的耐受性或抗性,包括例如美国专利Nos.6,268,549和6,245,968和美国专利公开No.20030066102中描述的基因。
(E)编码针对苯氧基生长素除草剂,如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因,其也可以赋予针对芳氧基苯氧基丙酸类(AOPP)除草剂的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖性的双加氧酶(aad-1)基因,如美国专利No.7,838,733所述。
(F)编码针对苯氧基生长素除草剂如2,4-二氯苯氧基乙酸(2,4-D)的抗性或耐受性的基因,其也可以赋予针对吡啶基氧基生长素除草剂,如氟草烟或绿草定的抗性或耐受性。这些基因的实例包括α-酮戊二酸依赖性的双加氧酶(aad-12)基因,如WO2007/053482-A2所述。
(G)编码针对麦草畏的抗性或耐受性的基因(见例如美国专利公开No.20030135879)。
(H)编码针对抑制原卟啉原氧化酶(PPO)的除草剂的抗性或耐受性的基因(见美国专利No.5,767,373)。
(I)提供针对可结合光系统II反应中心(PS II)核心蛋白质的三嗪除草剂(例如莠去津)和尿素衍生物(如敌草隆)除草剂的抗性或耐受性的基因。见Brussian et al.,(1989)EMBO J.1989,8(4):1237-1245。
可赋予或贡献增值性状(Value Added Trait)的基因
(A)修饰的脂肪酸代谢,例如通过用反义基因或硬脂酰-ACP去饱和酶转化玉米或芸苔属植物从而增加植物的硬脂酸含量(Knultzon et al.,1992)Proc.Nat.Acad.Sci.USA89:2624。
(B)降低的植酸含量
(1)引入植酸酶编码基因,如黑曲霉植酸酶基因(Van Hartingsveldt et al.,1993Gene 127:87),提高植酸降解,向被转化植物添加更多游离磷酸盐。
(2)可引入降低植酸含量的基因。在玉米中,这可以通过,例如,克隆然后重新导入如下所述的单个等位基因的相关DNA来实现:该单个等位基因导致以植酸水平低为特征的玉米突变体的原因(Raboy et al.,1990Maydica 35:383)。
(C)改良的碳水化合物组成,例如通过用编码改变淀粉的分支模式的酶的基因转化植物而实现。这些酶的实例包括,粘液链球菌(Streptococcus mucus)果糖基转移酶基因(Shiroza et al.,1988)J.Bacteriol.170:810,枯草芽孢杆菌果聚糖蔗糖酶基因(Steinmetz et al.,1985Mol.Gen.Genel.200:220),地衣芽孢杆菌α-淀粉酶(Pen et al.,1992Bio/Technology 10:292),番茄转化酶基因(Elliot et al.,1993),大麦淀粉酶基因(Sogaard et al.,1993J.Biol.Chem.268:22480),和玉米胚乳淀粉分支酶II(Fisher etal.,1993Plant Physiol.102:10450)。
商业产品-在本发明的另外的实施方案中,转基因植物产生商业产品。在一个实施方案中,商业产品选自蛋白质浓缩物,蛋白质分离物,谷物,粗粉或粕(meal),面粉,油或纤维。
商业产品是指任何由源自植物或植物种子的材料组成、并被出售给消费者的产品。作物植物是消费的蛋白质,碳水化合物和植物油的最大来源。转基因植物可用于制造商业产品。植物和/或植物种子可以加工成粗粉或粕、面粉或油,以及用作陆生动物和水生动物的动物饲料中的蛋白质或油源。大豆和大豆油可用于制造许多不同的产品,但不限于,全种子或加工种子、动物饲料、植物油、膳食、面粉、无毒塑料、印刷油墨、润滑剂、蜡、液压油、电力变压器流体、溶剂、化妆品、护发产品、纳豆,天贝,蛋白质浓缩物,蛋白质分离物,组织化蛋白质(textured protein)和水解蛋白质,以及生物柴油。
植物分类-在另外的实施方案中,本公开涉及转基因植物,其中所述转基因植物选自双子叶植物或单子叶植物。在进一步的实施方案中,本公开涉及可消费植物,包括作物植物以及油用、蛋白质用或糖用植物。因此,可以选择任何植物物种或植物细胞,如下文进一步描述的那样。
在一些实施方案中,根据本公开的遗传修饰的植物(例如,植物宿主细胞)包括但不限于任何高等植物,包括双子叶植物和单子叶植物,特别是可消费植物,包括作物植物。这样的植物可以包括但不限于例如:苜蓿,大豆,棉花,油菜(也称为卡诺拉油菜),亚麻,玉米,稻,臂形草(brachiaria),小麦,红花,高粱,糖用甜菜,向日葵,烟草和草坪草。因此,可以选择任何植物物种或植物细胞。在实施方案中,本文使用的植物细胞和从其生长或衍生的植物包括但不限于可从油菜籽(Brassica napus);印度芥(Brassica juncea);埃塞俄比亚芥(Brassica carinata);萝卜(Brassica rapa);卷心菜(Brassica oleracea);大豆(Glycine max);亚麻(Linum usitatissimum);玉米(也称玉蜀黍)(Zea mays);红花(Carthamus tinctorius);向日葵(Helianthus annuus);烟草(Nicotiana tabacum);拟南芥;巴西坚果(Betholettia excelsa);蓖麻(Ricinus communis);椰子(Cocus nucifera);香菜(Coriandrum sativum);棉花(Gossypium spp.);花生(Arachis hypogaea);霍霍巴(Simmondsia chinensis);油棕(Elaeis guineeis);橄榄(Olea eurpaea);水稻(Oryzasativa);南瓜(Cucurbita maxima);大麦(Hordeum vulgare);甘蔗(Saccharumofficinarum);水稻(Oryza sativa);小麦(Triticum spp.,包括硬粒小麦(Triticumdurum)和(Triticum aestivum);和浮萍(Lemnaceae sp.)获得的细胞。在一些实施方案中,植物物种内的遗传背景可以变化。
引入植物细胞的核酸可用于在基本上任何植物上赋予所需的性状。可以使用本公开的基因表达构建体和上述各种转化方法工程改造各种植物和植物细胞系统以实现用于本文所述的所需生理和农艺特征。在实施方案中,用于工程改造的目标植物和植物细胞包括但不限于单子叶植物和双子叶植物,例如包括谷类作物(例如小麦,玉米,水稻,小米,大麦)的作物,水果作物(例如番茄苹果,梨,草莓,橙子),饲料作物(如苜蓿),根用蔬菜作物(如胡萝卜,马铃薯,甜菜,山药),绿叶蔬菜类作物(如莴苣,菠菜);开花植物(例如矮牵牛,玫瑰,菊花),针叶树和松树(例如松杉,云杉);用于植物修复的植物(例如,重金属积聚植物);油料作物(例如向日葵,油菜籽)和用于实验目的的植物(例如,拟南芥)。因此,所公开的方法和组合物已经在广泛的植物上使用,包括但不限于来自天门冬属(Asparagus)、燕麦属(Avena)、臂形草属(Brachiaria)、芸苔属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、飞蓬属(Erigeron)、大豆属(Glycine)、棉属(Gossypium)、大麦属(Hordeum)、莴苣属(Lactuca)、黑麦草属(Lolium)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、烟草属(Nicotiana)、诸葛菜属(Orychophragmus)、稻属(Oryza)、鳄梨属(Persea)、菜豆属(Phaseolus)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、黑麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、小麦属(Triticum)、葡萄属(Vitis)、豇豆属(Vigna)和玉蜀黍(Zea mays)。
在本公开的进一步方面,本文公开的系统,组合物和方法涉及转基因植物或植物细胞。在其他实施方案中,转基因植物或植物细胞通过使植物细胞与缺乏RecA活性的根癌土壤杆菌(LBA4404)菌株接触而产生。
体外测定-在一个实施方案中,本发明涉及用于评估根癌土壤杆菌(LBA4404)菌株内的RecA活性的体外测定。各种体外测定法是本领域技术人员已知的。下面进一步描述几个示例性方法。
已经描述了分子信标(Molecular Beacon)在序列检测中使用。简言之,设计与侧翼基因组和插入DNA接合部重叠的FRET寡核苷酸探针。FRET探针的独特结构导致其含有使荧光和淬灭模块保持极其接近的二级结构。在存在热稳定性聚合酶和dNTP的情况中循环FRET探针和PCR引物(在插入DNA序列中的一条引物和在侧翼基因组序列中的一条)。在成功的PCR扩增后,FRET探针与靶序列的杂交导致探针二级结构的去除和荧光模块与淬灭模块的空间分离。由于成功扩增和杂交,荧光信号指示侧翼基因组/转基因插入序列的存在。此类用于检测扩增反应的分子信标测定是本主题公开的一个实施方案。
水解探针测定法,亦称作(Life Technologies,Foster City,Calif.),是一种检测和量化DNA序列的存在的方法。简言之,设计与基因组侧翼和插入DNA接合部重叠的FRET寡核苷酸探针。在热稳定性聚合酶和dNTP存在下循环FRET探针和PCR引物(一个引物在插入DNA序列中,一个在侧翼基因组序列中)。FRET探针的杂交导致FRET探针上的荧光模块从淬灭模块切割并释放。荧光信号表明由于成功的扩增和杂交所致的侧翼/转基因插入序列的存在。此类用于检测扩增反应的水解探针测定是本主题公开的一个实施方案。
测定是一种检测并定量DNA序列之存在的方法。简而言之,使用一种基于聚合酶链式反应(PCR)的测定,名为测定系统,来筛选包含整合的基因表达盒多核苷酸的基因组DNA样品。在本主题公开的实施中使用的测定可W使用PCR测定混合物,该混合物包含多种引物。在PCR测定混合物中使用的引物可包括至少一种正向引物和至少一种反向引物。正向引物含有对应于供体DNA多核苷酸的特定区域的序列,而反向引物含有对应于基因组序列的特定区域的序列。此外,在PCR测定混合物中使用的引物可以包括至少一种正向引物和至少一种反向引物。例如,PCR测定混合物可以使用对应于两个不同等位基因的两种正向引物以及一种反向引物。其中一种正向引物含有对应于内源性基因组序列的特定区域的序列。第二种正向引物含有对应于供体DNA多核苷酸的特定区域的序列。反向引物含有对应于基因组序列的特定区域的序列。这样的用于检测扩增反应的测定法是本公开的实施方案。
在一些实施方案中,荧光信号或荧光染料选自下组:HEX荧光染料,FAM荧光染料,JOE荧光染料,TET荧光染料,Cy 3荧光染料,Cy 3.5荧光染料Cy 5荧光染料,Cy 5.5荧光染料,Cy7荧光染料,和ROX荧光染料。
在其它实施方案中,使用合适的第二荧光DNA染料进行扩增反应,所述第二荧光DNA染料能够以可通过流式细胞术检测的浓度范围染色细胞DNA,并且具有可由实时热循环仪检测的荧光发射光谱。本领域普通技术人员应当理解,其他核酸染料是已知的并且不断被鉴定。可以使用任何具有适当激发和发射光谱的合适的核酸染料,例如SYTOX SYBR Green在一个实施方案中,第二种荧光DNA染料是以小于10μM,小于4μM或小于2.7μM使用。
在进一步的实施方案中,可以利用下一代测序(NGS)确认基因组修饰。如Brautigma等人,2010所述,DNA序列分析可以用于测定分离和扩增的片段的核苷酸序列。可以分离扩增的片段并亚克隆到载体中,并使用链终止法(也称为Sanger测序)或染料终止剂测序来测序。此外,可以用下一代测序对扩增子进行测序。NGS技术不需要亚克隆步骤,并且可以在单个反应中完成多个测序读取。有三种NGS平台已商品化:来自454Life Sciences/Roche的Genome Sequencer FLXTM,来自Solexa的Illumina Genome Sequencer和AppliedBiosystems的SOLiDTM(首字母缩写词,代表:“寡聚物连接和检测测序(Sequencing byOligo Ligation and Detection)”)。此外,目前正在开发两种单分子测序方法。这些包括来自Helicos BioscienceTM的真实单分子测序(tSMS)和来自Pacific Biosciences的Single Molecule Real TimeTM(单分子实时)(SMRT)测序。
由454Life Sciences/Roche推出的Genome Sequencer FLXTM是长读段NGS,其使用乳液PCR和焦磷酸测序来生成测序读段。可以使用300-800bp的DNA片段或含有3-20kbp片段的文库。反应每次运行可以生成超过100万个约250至400个碱基的读段,总产量为250至400兆碱基。与其它NGS技术相比,此技术生成的读段最长,但每次运行的总序列输出较低。
由SolexaTM推出的Illumina Genome AnalyserTM是一种短读段NGS,其利用荧光染料标记的可逆终止剂核苷酸边合成边测序,并且以固相桥式PCR为基础。可以使用含有高达10kb的DNA片段的配对末端测序文库的构建。反应生成长度为35-76个碱基的超过1亿个短读段。此数据可以每次运行生成3-6千兆碱基。
由Applied BiosystemsTM推出的寡聚物连接和检测测序(SOLiD)系统是一种短读段技术。此NGS技术使用长度最多可达10kbp的片段化双链DNA。该系统使用通过染料标记的寡核苷酸引物的连接和乳液PCR测序以生成10亿个短读段,其导致每次运行高达30千兆碱基的总序列输出。
Helicos BioscienceTM的tSMS和Pacific BiosciencesTM的SMRT应用使用单个DNA分子进行序列反应的不同方法。tSMS HelicosTM系统生成高达8亿个短读段,每次运行导致21千兆碱基。这些反应使用荧光染料标记的虚拟终止剂核苷酸完成,其被描述为“边合成边测序”方法。
由Pacific BiosciencesTM上市的SMRT下一代测序系统使用通过合成的实时测序。由于不受可逆终止剂限制,此技术可以生成长度高达1,000bp的读段。使用此技术每天可以生成相当于二倍体人类基因组的一倍覆盖度的原始读取通量。
在另一个实施方案中,可以使用印迹法测定法完成基因组修饰的确认,包括Western印迹,Northern印迹和Southern印迹。此类印迹法测定法是用于生物样品的鉴定和量化的生物研究中常用的技术。这些测定法包括首先通过电泳手段分离凝胶中的样品组分,接着将电泳分离的组分从凝胶转移到转移膜,诸如用硝化纤维,聚偏二氟乙烯(PVDF)或尼龙的材料制成的转移膜。分析物也可以直接点样在这些支持物上,或通过施加真空,毛细管作用或压力而定向到支持物上的特定区域,而不需要在先分离。然后通常对转移膜进行转移后处理,以增强分析物彼此区分的能力,和通过检视或通过自动读取器检测的能力。
在进一步的实施方案中,可以使用ELI SA测定法来完成基因组修饰的确认,所述ELISA测定法使用固相酶免疫测定法检测液体样品或湿样品中物质(通常是抗原)的存在。将来自样品的抗原附着于平板的表面。然后,将另外的特异性抗体施加在表面上,使得其可以结合所述抗原。此抗体是与酶连接的,并且在最后的步骤中,添加含有酶底物的物质。随后的反应生成可检测的信号,最常见的是底物中的颜色变化。
转化-用本文公开的载体转化根癌土壤杆菌LBA(4404)宿主细胞可以使用本领域已知的任何转化方法实施,并且细菌宿主细胞可以作为完整细胞或者作为原生质体(即,包含细胞质)被转化。转化方法包括穿孔方法,例如,电穿孔,原生质体融合,细菌接合,和二价阳离子处理,例如氯化钙处理或CaCl2/Mg2+处理),以及其它本领域已知的方法。参见,例如Morrison,J.Bact.,132:349-351(1977);Clark-Curtiss&Curtiss,Methods inEnzymology,101:347-362(Wu et al.,eds,1983),Sambrook et al.,Molecular Cloning,A Laboratory Manual(2nd ed.1989);Kriegler,Gene Transfer and Expression:ALaboratory Manual(1990);and Current Protocols in Molecular Biology(Ausubel etal.,eds.,1994)).Other known transformation methods specific are described atby Guerout-Fleury,A.M.,Frandsen,N.and Stragier,P.(1996)Plasmids for ectopicintegration in Bacillus subtilis.Gene 180(1-2),57-61。
整合位点-本公开的实施方案包括用于鉴定和整合根癌土壤杆菌(LBA4404)的基因组基因座内的多核苷酸片段的方法。本文提供了recA基因组座位内的整合,或recA基因组座位的直接上游或下游的多核苷酸片段内的整合。用于整合多聚核苷酸片段的基因组座位如SEQ ID NO:11所示。本领域普通技术人员将理解,在根癌土壤杆菌的SEQ ID NO:11(LBA4404)中可以观察到所公开的基因组多核苷酸序列的等位基因变异。因此,本公开涉及与SEQ ID NO:11具有80%,82.5%,85%,87.5%,90%,92.5%,95%,97.5%,99%,99.5%或99.9%的序列同一性的多核苷酸序列。
本发明的其他实施方案可以包括将含有基因表达盒的多核苷酸整合入根癌土壤杆菌(LBA4404)基因组的recA基因组座位,并且随后在相同位置整合堆叠第二个多核苷酸。其中,根癌土壤杆菌(LBA4404)基因组内的基因组位点被用作引入另外的多核苷酸的优选基因座。在一个实施方案中,SEQ ID NO:11中的任何位置充当中和整合位点供多核苷酸整合到根癌土壤杆菌(LBA4404)基因组中。
本发明另外的实施方案包括将含有基因表达盒的多核苷酸整合入根癌土壤杆菌(LBA4404)基因组的recA基因组座位,并随后从整合的多核苷酸中去除选择标记表达盒。其中,用于去除选择标志物表达盒的方法是双交换方法,使用CRE-LOX的切除方法,使用FLP-FRT的切除方法,或使用RED/ET 试剂盒(Genebridges,Heidelberg,Germany)的切除方法,以及本领域已知的其它切除方法。
本公开的其它实施方案可以包括将多核苷酸整合到根癌土壤杆菌(LBA4404)基因组中recA基因组座位处,作为使用外来复制质粒的替代方法。其中,由于存在相似的起源或复制,不相容群,冗余选择标志物或其他基因元件,一种或多种外来复制质粒是不相容的。其中,由于根癌土壤杆菌(LBA4404)限制性修饰系统的特异性,一种或多种外来复制质粒在根癌土壤杆菌(LBA4404)中不起作用。其中,一个或多个外来复制质粒不可用、不起作用、或不易于转化在根癌土壤杆菌(LBA4404)基因组内。
本发明的其他实施方案可以包括在原核细胞中增加同源重组效率的方法。依赖于引入的酶介导的同源重组的方法,如λ-red“重组工程化”和类似方法,在数量有限的细菌种类中是有用的,尤其是埃希氏菌属(Escherichia)(Datsenko and Wanner(2000)Proc NatlAcad Sci U S A.97:6640-5)和沙门氏菌属(Salmonella)。也可以使用依赖于引入的酶(如噬菌体整合酶、FLP/FRT或Cre/LoxP)介导的位点特异性重组的方法,但它们依赖于靶DNA中事先存在的位点的存在(Wirth et al(2007)Current Opinions in Biotechnology 18,411-419)。体外方法采用病毒或可动因子(mobile element),或它们的组分(例如噬菌体、转座子或可动内含子)。
然而,依赖于宿主介导的同源重组的方法是目前最常使用的染色体DNA修饰类型。在宿主介导的同源重组的典型微生物应用中,通过单交换整合将具有与染色体有序列同一性的单个区域的质粒整合入染色体,有时称作坎贝尔式整合(Campbell-likeintegration)。在这样的事件后,在引入的质粒上的基因作为染色体的一部分复制,这可以比质粒复制更迅速。相应地,在带有针对质粒携带的选择性标志基因的选择的培养基中生长可为整合提供选择压力。坎贝尔式整合能够通过下述方式用于失活染色体基因:将目的基因的内部片段置于质粒上,使得在整合之后,染色体将不含该基因的全长拷贝。坎贝尔式整合体细胞的染色体是不稳定的,因为整合的质粒侧翼是引导该整合的同源序列。这些序列间的进一歩同源重组事件导致质粒的切除,和染色体逆转为野生型。因为这个原因,可能有必要保持对质粒携带的选择性标志基因的选择以保持整合体克隆。
对染色体修饰的基本单交换整合方法的改进可以包括双交换同源重组,也称作等位基因交换,其涉及两个重组事件。将期望的经修饰的等位基因置于质粒上,其侧翼是与染色体中靶等位基因侧翼的区域具有同源性的区域(“同源臂”)。第一整合事件可以发生在任一一对同源臂中,导致质粒以与坎贝尔式整合相同的方式整合入染色体。在第一交换事件之后,染色体含有能够引导第二重组事件的两组可供选择的同源序列。如果与引导第一事件的相同的序列重组,那么质粒会被切除,并且细胞会回复成野生型。如果第二重组事件由另ー同源臂引导,质粒会被切除,但原有的染色体等位基因会替换为质粒上引入的经修饰的等位基因;会实现期望的染色体修饰。与坎贝尔式整合一样,通常检测第一重组事件,并且使用通过质粒携带的选择性标志基因的整合所赋予的选择优势来分离整合体。
在下面的实施例中进一步举例说明本发明的实施方案。应当理解这些权利要求仅是为了举例说明的目的给出的。
实施例
实施例1.根癌土壤杆菌(LBA4404)基因组文库的构建和recA+粘粒克隆的分离
构建基因组DNA文库以分离和鉴定来自根癌土壤杆菌(LBA4404)的先前未表征的recA基因。将来自根癌土壤杆菌(LBA4404)的基因组DNA用限制酶Sau3A1(New EnglandBiolabs,Ipswich,MA)部分消化,并通过在缓冲液(20mM Tris-HCl,pH 8.0;10mM EDTA;和50mM NaCl)中的10-40%不连续蔗糖梯度上离心加以分级。合并含有大小在约20-40kb范围内的基因组DNA片段的级分,并连接到宽宿主范围的粘粒载体pCP13/B(四环素抗性)(Dessaux Y,TempéJ,Farrand SK.1987.Genetic analysis of mannityl opinecatabolism in octopine-type Agrobacterium tumefaciens strain 15955.Mol GenGenet.208(1-2):301-8)。该粘粒载体在用于连接反应之前用BamHI和碱性磷酸酶处理。使用Promega的Lambda DNA包装系统(Promega,Madison,WI)处理连接混合物并转染到大肠杆菌(HB101)中。得到的文库含有大约5,000个抗四环素的粘粒转导子,代表了根癌土壤杆菌(LBA4404)基因组的大约二十倍覆盖率。
为了分离携带根癌土壤杆菌(LBA4404)的recA基因的粘粒克隆,从文库中分离出大肠杆菌(HB101)细菌菌株,并涂布到含有0.01%甲磺酸甲酯(MMS)的Luria肉汤平板上。因为大肠杆菌(HB101)是一种recA突变体,因此其对MMS敏感,故在培养基上生长的MMS抗性菌落被假设为含有编码根癌土壤杆菌recA基因(LBA4404)(Farrand SK,O'Morchoe SP,McCutchan J.1989.Construction of an Agrobacterium tumefaciens C58recAmutant.J Bacteriol.171(10):5314-21)。获得数百个抗MMS的粘粒克隆,将其中24个进一步纯化,并用XhoI进行限制酶消化分析。将九个享有共同的XhoI片段子集的菌落交付末端测序,使用下述引物:pCP13/B和pCP13/B右(表1)。在假设根癌土壤杆菌染色体(LBA4404)和根癌土壤杆菌(C58)的经测序菌株之间具有同线性的条件下,对各粘粒搜索这样的接合部序列:该序列预示recA会位于插入序列的中间。对一种这样的粘粒——pCP-MMSR2进行进一步测序确认假设性鉴定的recA基因的存在,以使用如表1中进一步描述的引物。
实施例2来自根癌土壤杆菌(LBA4404)的recA基因的克隆、表征和序列分析
为了构建根癌土壤杆菌(LBA4404)的recA基因敲除菌株,评估recA基因的位置以确定recA基因的位置是否存在于与其他recA基因分离物相同的基因组背景中,土壤杆菌属和根瘤菌属物种(Goodner B et al.,2001.Genome sequence of the plant pathogenand biotechnology agent Agrobacterium tumefaciens C58.Science 2942323-2328;以及Slater SC et al.,2009.Genome sequences of three Agrobacterium biovars helpelucidate the evolution of multi-chromosome genomes in bacteria.JBacteriol.191(8):2501-11)。因此,对于来自根癌土壤杆菌(C58)、葡萄土壤杆菌(A.visis)(S4),放射土壤杆菌(A.radiobactor)(K84)、豆科根瘤菌(Rhizobiumleguminosarum)和根瘤菌属(Rhizobium sp.)NGR234的位于recA的上游和下游的相邻序列搜索高度保守的序列,以设计引物(表1中的F-recAnei和R-RecAnei)。这些序列位于recA基因上游和下游约1.5kb处。使用与来自根癌土壤杆菌(LBA4404)的包含recA基因的区域结合的引物,通过PCR扩增这些序列。将得到的3.7kb PCR片段克隆到pWM91质粒中以产生一个新质粒,标记为pWM-recAnei(参见图1)(Metcalf WW,Jiang W,Daniels LL,Kim SK,Haldimann A,Wanner BL.1996.Conditionally replicative and conjugative plasmidscarrying lacZ alpha for cloning,mutagenesis,and allele replacement inbacteria.Plasmid.35(1):1-13)。将PCR扩增的recA基因片段使用如表1所示的recAnei引物进行测序。测序数据鉴定了来自根癌土壤杆菌(LBA4404)的recA基因,其如SEQ ID NO:10所示。此外,测序数据表明来自根瘤土壤杆菌的recA基因含有与其他亲缘菌株相同的基因组背景;在下游方向侧翼是alaS,在上游方向侧翼是Atu1875(含有recA基因及其上游和下游侧翼序列的基因组序列也作为SEQ ID NO:11示出)。
根癌土壤杆菌(LBA4404)的recA基因的序列与来自生物群1土壤杆菌菌株的基因组型1分离株如377,TT111和ATCC4720的recA基因的序列几乎相同。此外,根癌土壤杆菌(LBA4404)的recA基因在核酸序列上与基因组型-8株即C58的recA基因(Costechareyre等人,2010)享有92%的同一性。可以比较根癌土壤杆菌(LBA4404)recA基因与其他土壤杆菌菌株和相关分类群的recA基因相比的总体相关性,该比较的系统发育树如图2所示。根癌土壤杆菌(LBA4404)recA基因的序列比较结果表明,根癌土壤杆菌(LBA4404)基因组的相当多的区域含有与根癌土壤杆菌(C58)无关的基因组DNA序列。进一步的序列比较表明,在土壤杆菌属密切近缘的生物群1分离株中甚至存在染色体多态性。
实施例3用卡那霉素或氯霉素抗性盒替代和破坏MMS抗性粘粒中的recA基因
使用基于噬菌体λ的red重组将抗生素抗性盒引入到pCP-MMSR2上携带的根癌土壤杆菌(LBA4404)的recA基因中(Datsenko KA,Wanner BL.2000。One-step inactivation ofchromosomal genes in Escherichia coli K-12using PCR products.Proc Natl AcadSci USA.97(12):6640-5)。简言之,使用表1中列出的引物F-recA-frt和R-RecA-frt,分别从pKD3和pKD4扩增编码氯霉素和卡那霉素抗生素抗性基因的DNA片段。这些扩增出的编码抗生素盒的PCR片段被recA基因上游和下游的43bp序列所侧翼。序列还包括来自recA基因的每个末端的9bp。将所得到的线性PCR扩增产物电穿孔到携带MMS抗性粘粒pCP-MMSR2和pKD20的大肠杆菌(HB101)菌株,以进行red介导的重组。质粒pKD20提供red重组酶,该质粒可以通过在重组后在42℃下培养转化的菌株而加以清除。接下来,通过测试其不能恢复大肠杆菌(HB101)的MMS抗性,并通过使用引物F3-recAnei和R2-RecAnei(表1)分析序列,来证实粘粒内recA基因的破坏。几种这样的构建体满足了不能补全大肠杆菌(HB101)中的recA突变的要求。保留每种抗生素抗性类别中的一种,即pCP-MMSRΔrecAkan和pCP-MMSRΔrecACm,用于构建根癌土壤杆菌recA敲除菌株(LBA4404)。
实施例4用卡那霉素或氯霉素抗性盒替换和破坏根癌土壤杆菌(LBA4404)染色体中的recA基因
将上述两个recA已被破坏的粘粒克隆转化到根癌土壤杆菌(LBA4404)中,以图将粘粒的破坏recA基因标记物交换(marker-change)到根癌土壤杆菌(LBA4404)染色体recA基因中。简单地说,在将recA已被破坏的粘粒电穿孔到根癌土壤杆菌(LBA4404)中后,在含有四环素和卡那霉素或氯霉素的营养琼脂平板上选择和纯化转化体。接下来,将转化体接种在仅含有卡那霉素或氯霉素的液体培养基中。将这些培养物亚培养3次以提高双交换事件和粘粒克隆丢失的可能性。将50微升体积的1000倍稀释的培养物涂布在含有适当抗生素的平板上,挑选约100-200个菌落,通过测试对卡那霉素或氯霉素的抗性以及对四环素和MMS二者的敏感性来筛选双重交换。将如此得到的候选recA敲除土壤杆菌菌株分离,并标记为UIA777(Cm)和UIA770(Kan)。通过使用表1中列出的引物的PCR和序列分析进一步确认分离的recA敲除菌株。构建根癌土壤杆菌中recA基因敲除的完整过程如图1所示。
实施例5根瘤土壤杆菌(LBA4404)菌株的recA敲除株的生长特性的表征
观察两种根癌土壤杆菌(LBA4404)敲除recA菌株——UIA777和UIA770的细菌生长速率。观察到,当接种到MGL液体培养基中时,与野生型菌株相比,recA敲除菌株显示出1小时的生长延迟(参见图3)。进一步的观察结果表明,在固体营养琼脂平板上,两种recA敲除菌株都生长得更慢。例如,观察到,recA敲除菌株的菌落直径达到约1-2mm需要三天以上,而野生型菌株在约两天内生长至相同大小。
观察两种根癌土壤杆菌(LBA4404)敲除recA菌株——UIA777和UIA770,对甲磺酸甲酯(MMS)和紫外(UV)辐照的敏感性。对MMS和紫外线辐照的敏感性是细菌recA敲除菌株的常见特征(Farrand SK,O'Morchoe SP,McCutchan J.1989.Construction of aAgrobacterium tumefaciens C58recA mutant.J Bacteriol.171(10):5314-21)。将根癌土壤杆菌(LBA4404)recA敲除菌株的过夜培养物稀释100倍至3ml MGL培养基中,并摇动培养至早稳定期。然后将得到的培养物在0.9%NaCl中十倍连续稀释,并将5-μl样品点样到营养琼脂平板的表面上。对于MMS处理,培养基中包含0.01%的MMS。对于UV辐照,将板暴露于UV光源(Amersham-Pharmacia Biotech,Pittsburgh,PA),以通过内部UV剂量计测量来提供精确剂量的UV。暴露后立即将板盖上并在28℃的防光黑盒中孵育24小时。利用培养物在零稀释时的效价来确定在存在MMS的情况下或在暴露于各种剂量的UV辐照后细胞的存活。如表2所示,与野生型根癌土壤杆菌(LBA4404)相比,两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770对MMS和UV辐照都是敏感的。
实施例6 recA敲除根癌土壤杆菌(LBA4404)菌株的补全
质粒pSOM301是pCP13/B的衍生物,含有来自C58的recA基因(Farrand SK,O'Morchoe SP,McCutchan J.1989.Construction of an Agrobacterium tumefaciensC58recA mutant.J Bacteriol.171(10):5314-21),测试了pSOM301补全根癌土壤杆菌(LBA4404)recA敲除菌株UIA770的缓慢生长、MMS及UV敏感性的能力。pSOM301质粒恢复了UIA770的生长延迟和小集落表型(图3)。它还可以将UIA770对MMS和UV辐照的抗性恢复到与野生型根癌土壤杆菌(LBA4404)所示的水平相似的水平(表2)。
实施例7来自recA敲除的根瘤土壤杆菌(LBA4404)菌株的分离质粒的表征
野生型根癌土壤杆菌(LBA4404)菌株携带vir辅助质粒pAL4404(Hoekema A,Hirsch PR,Hooykaas PJJJ,Schilperoort,1983.A binary plant vector strategybased on separation of vir and T-region of the Agrobacterium tumefaciens Ti-plasmid.Nature 303:179-180)。从recA敲除菌株中分离pAL4404辅助质粒(即Ti质粒)。接下来,对该辅助质粒进行凝胶电泳分析。所得的凝胶分析表明,来自根癌土壤杆菌(LBA4404)UIA777和UIA770菌株的分离的质粒均含有以与pAL4404相同的迁移率迁移的单个质粒。
实施例8来自recA敲除根瘤土壤杆菌(LBA4404)菌株三元质粒的导入
用三元质粒(pDAB9292)转化两个根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770;该质粒先前在国际专利申请PCT/US2011/046028(通过引用并入本文)中描述。通过分子确认测定(即限制酶消化和测序)证实该三元质粒被导入了土壤杆菌菌株中。
实施例9含有重复基因元件的二元质粒在recA敲除根癌土壤杆菌(LBA4404)菌株中的稳定性
测试根癌土壤杆菌(LBA4404)recA敲除菌株以评估含有重复的基因元件的二元质粒的稳定性。在先前的实验中观察到,当二元质粒克隆到根癌土壤杆菌(LBA4404)中时,二元质粒中重复基因元件的使用将重新排列。该二元质粒,pDAB108700(SEQ ID NO:12),在图1中示出。如图所示,pDAB108700含有两个由相同启动子驱动的基因表达盒。第一个基因表达盒含有与phi-yellow荧光蛋白(PhiYPF v3)基因序列连接的玉米泛素-1启动子(Zm Ubi1启动子v2),并以玉米过氧化物酶5'3'UTR(ZmPer5 3'UTR v2)终止。第二个基因表达盒含有与膦丝菌素乙酰转移酶(PAT v9)基因序列连接的玉米泛素-1启动子(Zm Ubi1启动子v2),并以玉米脂肪酶3'UTR(ZmLip 3'UTR v1)终止。
将该二元质粒,pDAB108700,转化到表3的根癌土壤杆菌菌株中。转化后,从每个细菌菌株的转化中分离出两个细菌菌落。让每个菌落长大,并且通过用一系列限制酶消化(即NotI,EcoRI,FsoI和PstI消化)分离二元质粒DNA用于验证。接下来,从第一实验选择一个特定菌落,在固体培养基上划线。挑选十个在固体培养基上生长的菌落让其长大。通过一系列限制酶消化(即NotI,EcoRI,FsoI和PstI消化物)分离二元质粒DNA用于另一轮验证。观察限制酶消化的条带图案,看是否产生预期大小的质粒-DNA片段。将产生具有异常和预料之外的大小的质粒DNA片段的条带图案的菌落鉴定为不稳定的。将产生具有预期大小的质粒DNA片段的条带图案的菌落鉴定为稳定的。对于每个不同菌株,计算未显示任何重排的质粒的总百分比,结果示于表3中。
实施例10根癌土壤杆菌(LBA4404)recA敲除菌株的植物介导的转化
使用本领域已知的技术,根据本发明的实施方案转化植物物种。使用含有二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770进行植物介导的转化。作为转化的结果,含有选择标志物的基因表达盒作为T链整合到植物染色体内的基因组基因座中。T链在上游和下游基因组侧翼序列中的整合导致稳定整合在转基因植物的基因组内的转基因事件。
可以通过利用先前在WO 2007/053482的实施例8中所述的相同技术,使用含有二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种来转化玉米植物。转化的结果是,含有农艺性状(作为T链整合)的基因表达盒被纳入到植物染色体内的基因组基因座中。
可以通过利用先前在WO2007/053482的实施例#11或实施例#13中描述的相同技术,使用含有二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种来转化大豆植物。转化的结果是,含有农艺性状(作为T链整合)的基因表达盒被纳入到植物染色体内的基因组基因座中。
棉花植物可以通过利用先前在专利申请美国专利号7,838,733中的实施例14、或WO 2007/053482(Wright等人)的实施例12中描述过的相同技术,用两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种进行转化。转化的结果是,含有农艺性状(作为T链整合)的基因表达盒被纳入到植物染色体内的基因组基因座中。
卡诺拉油菜植物可以通过利用先前在美国专利号7,838,733的实施例26或WO2007/053482的实施例22(Wright等人)中所述的相同技术,用两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种进行转化。转化的结果是,含有农艺性状(作为T链整合)的基因表达盒被纳入到植物染色体内的基因组基因座中。
对于土壤杆菌介导的黑麦转化,参见例如Popelka JC,Xu J,Altpeter F.,“Generation of rye with low transgene copy number after biolistic genetransfer and production of(Secale cereale L.)plants instantly marker-freetransgenic rye,”Transgenic Res.2003Oct;12(5):587-96.)。对于土壤杆菌介导的高粱转化,参见例如Zhao et al.,“Agrobacterium-mediated sorghum transformation,”Plant Mol Biol.2000Dec;44(6):789-98。对于土壤杆菌介导的大麦转化,参见例如Tingayet al.,“Agrobacterium tumefaciens-mediated barley transformation,”The PlantJournal,(1997)11:1369–1376。对于土壤杆菌介导的小麦转化,参见例如Cheng et al.,“Genetic Transformation of Wheat Mediated by Agrobacterium tumefaciens,”PlantPhysiol.1997Nov;115(3):971-980。对于土壤杆菌介导的水稻转化,参见例如Hiei etal.,“Transformation of rice mediated by Agrobacterium tumefaciens,”PlantMol.Biol.1997Sep;35(1-2):205-18。
这些和其他植物的拉丁名称如下。应该清楚的是,植物可以用包含二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种进行转化。因此,两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770都可以用于将农艺性状转化成这些和其他植物。例子包括但不限于:玉米(Zea mays),小麦(Triticum spp.),稻(Oryza spp.和Zizania spp.),大麦(Hordeum spp.),棉花(Abroma augusta和Gossypium spp.),大豆(Glycine max),糖用和菜用甜菜(Beta spp.),甘蔗(Arenga pinnata),番茄(Lycopersicon esculentum)等其他物种,茜草(Physalis ixocarpa),黄水茄(Solanumincanum)和其他物种以及树番茄(Cyphomandra betacea),马铃薯(Solanum tuberosum),甘薯(Ipomoea batatas),黑麦(Secale spp.),辣椒(Capsicum annuum,Capsicumchinense,和Capsicum frutescens),莴苣(Lactuca sativa,Lactuca perennis和Lactucapulchella),甘蓝(Brassica spp.),芹菜(Apium graveolens),茄子(Solanum melongena)(Arachis hypogea),高粱(Sorghum spp.),苜蓿(Medicago sativa),胡萝卜(Juucuscarota),豆类(Phaseolus spp.等),燕麦(Avena sativa和strigosa),豌豆(Pisum,Vigna和Tetragonolobus(Helianthus annuus),倭瓜(Cucurbita spp.),黄瓜(Cucumissativa),烟草(Nicotiana spp.),拟南芥(Arabidopsis thaliana),草坪草(Lolium,Agrostis,Poa,Cynodon等),三叶草(Trifolium),蚕豆(Vicia)。作为本公开的一个实施方案,考虑了使用含有二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种对上述植物进行转化。
含有二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770可用于许多落叶和常绿木材种植系统的转化。转基因木材物种将增加这些除草剂的超量(over-the-top)使用的灵活性,而不会造成人身伤害。这些物种包括但不限于:白桦(Alnusspp.),梣(Fraxinus spp.),山毛榉(Fagus spp.),桦树(Betula spp.),樱桃(Prunusspp.),桉树(Eucalyptus spp.),山核桃(Carya spp.),枫树(Acer spp.),橡树(Quercusspp.)和松树(Pinus spp.))。
包含用于转化观赏和含果物种的二元质粒的两种根癌土壤杆菌(LBA4404)recA敲除菌株UIA777和UIA770中的任一种的用途也在本公开的实施方案的范围内。例子包括但不限于:玫瑰(Rosa spp.),卫矛(Euonymus spp.),矮牵牛(Petunia spp.),秋海棠(Begoniaspp.),杜鹃(Rhododendron spp.),野苹果或苹果(Malus spp.),梨(Pyrus spp.),桃(Prunus spp.)和万寿菊(Tagetes spp.)。尽管已经在某些实施例中描述了本发明的各方面,但是可以在本公开的精神和范围内进一步修改本发明。
因此,本申请旨在覆盖使用其一般原理的本发明的实施例的任何变化、使用或修改。此外,本申请意图涵盖与本公开有所不同,但属于本发明所属领域的已知或惯例实践、且属于所附权利要求的范围之物。
序列表
<110> 美国陶氏益农公司
M·古普塔
S·班尼特
S·库马尔
D·默洛
N·萨尔德赛
<120> 用于重组土壤杆菌基因缺陷菌株的方法和组合物
<130> 14764-240069
<150> 62/045947
<151> 2014-09-04
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 1
ggcattcttg gcatagtggt 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 2
gctgaagcca gttaccttcg 20
<210> 3
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 3
ccggatcccc gcgttccagc gtcttgcgga aacg 34
<210> 4
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 4
ccggatccgg atagggcatg ccgtgggtga tgatgg 36
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 5
cgttccagcg tcttgcggaa acg 23
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 6
ccgtttcagt ctcgatcatg c 21
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 7
gcattggtga acatcagtgt cgg 23
<210> 8
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 8
ccaccggacg cgaacgcccg gaccttcgaa tgcatcagcc ctcgtgtagg ctggagctgc 60
ttc 63
<210> 9
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 用于从根癌土壤杆菌鉴定并分离recA基因的引物
<400> 9
cctgtgcggc ttcaataacc taaaggtgga tcggatggca caacatatga atatcctcct 60
tag 63
<210> 10
<211> 1092
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 10
atggcacaaa attctttgcg tctcgtagag gataaatcgg tggataaaag caaggcactg 60
gaagcggcgc tctcccagat cgaacggtcg ttcggcaagg gatcgatcat gaagctcggt 120
tccaatgaaa acgtggttga agtagagacc atttcgacgg gttctctcag cctggatata 180
gcgctcggta tcggcggcct gccgaagggg cgtatcgttg agatttacgg cccggaaagc 240
tccggtaaga cgacgcttgc gttgcagacg atcgcggaag cccagaaaaa gggcggcatc 300
tgcgccttcg tggatgccga gcacgcgctc gatccggtct atgcccgcaa gctcggtgtg 360
gatttgcaga accttctgat ctcgcagccg gatacgggcg agcaggcgct tgaaatcacc 420
gatacgctgg tgcgctccgg tgccgtcgac attctggtcg tggactcggt tgcggcgctg 480
acgccgcgtg ccgaaatcga aggcgagatg ggtgacagcc tgccgggcct tcaggcacgt 540
ctgatgagcc aggcgctgcg caagctgacc gcctcgatct ccaagtcgaa gtgcatggtg 600
atcttcatca accagatccg catgaagatc ggcgtcatgt tcggttcgcc ggaaacgacg 660
acgggcggta atgcgcttaa attctacgcc tcggtgcgtc tcgacattcg ccgtatcggc 720
gccgtcaagg agcgtgaaga ggttgtcggc aaccagaccc gcgtcaaggt cgtcaagaac 780
aagatggcac cgcctttcaa gcaggtggaa ttcgacatca tgtatggtga aggcgtttcc 840
aagaccggcg agcttgtcga tctcggcgtg aaagccggta tcgtcgagaa atccggtgca 900
tggttctcct ataacagcca gcgtttgggg caggggcgtg aaaatgccaa gactttcctg 960
cgcgacaatc cggaaatggc aagcgagatc gaactggcgc tgcgccagaa cgccggtctg 1020
atcgccgatc ggttcctgca gaatggcggc ccggaagctg gcgaaagcga cgacggtccc 1080
gacgagggct ga 1092
<210> 11
<211> 3680
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 11
agcgcgacga tcggcgcgcc gcgctgtttg gcagcggcaa cctcttgcga atagatgatg 60
gttaggagcg gggagatggg gcgggtcatt ctgtttgttc cagactataa aaaaacgggt 120
tcatgccagc atttcggcct tggggacaag ccccaacatg gtctcgacac tgtcttttga 180
caggtcttgg gcggtggcga aaggcgattg cacggtgatg gcggccgccg cggcacccaa 240
tcgcagggcc tcagtgatgg ctttgccctc cgtaatcgcc gcgagataac ctgacgccat 300
ggcgtctccg gccccggtta cgtctttcac ctcgcggatg atgggtgggt ggaggcttgc 360
ggtttgcgtc gcgttgaagg ctaccacttc gcttgcgcca cgggtgatga cgccgccggc 420
aaggcctgcc ctgcggagaa tgcccggcca gtcgcgaaca ttgtctgccg tctgtccggt 480
cagcgcgcgc gcctctgcct ggttcatgaa gagaatgtcg atatcggcga gcatgtcctt 540
cagcttcacc gccttggcgg gcgaaatggc gatggccgcg agcggctttt ggcaggcgcg 600
ggcaatgaga ccgagcgcct tcaacgtatc ctccggcaga ttggcatcgc aaagcagaag 660
gtcgctcgcg gtaatcgctt cacgcaccgc gcgaactttg aggcggcgcg gcgaaaacag 720
cttgtaaagg tccatatccg caagtgcgat gacaagattg ccgtcgcgct ccagaatggc 780
ggtgtagctt ggcgtgcggc gatcgaggaa aacgaagggc gtatcttcca cgcccgcctg 840
ccttgctgcc tctgccaccg cttcgccggt cacgtcgccg ccgcgcggtg cgatgatacg 900
gacggcaaaa ccgagccggg aaagattgcg cgccgcattg aaaccgccgc cgccagcctc 960
ttccatccat gagccaggat tgctgggcgc cgggcgccgt ttcagtctcg atcatgccgc 1020
gcctgtcata tgcgcgccgc ccagaacgag tatcttcttc acgcttgtgt ttccctcttt 1080
cgcggatgga aaaggtggac gattcgtccc aatcttctgt ttgttcccct tcacatccgg 1140
ttcgcagcga taggccggac acggaaaaac gaaagcagaa caaaccactt atcgctattt 1200
gttttcaata tgctggctgc gccttgcgat atgagaacaa atagagtaca tcctatttcc 1260
atactgcttc attgcctgtg cggcttcaat aacctaaagg tggatcggat ggcacaaaat 1320
tctttgcgtc tcgtagagga taaatcggtg gataaaagca aggcactgga agcggcgctc 1380
tcccagatcg aacggtcgtt cggcaaggga tcgatcatga agctcggttc caatgaaaac 1440
gtggttgaag tagagaccat ttcgacgggt tctctcagcc tggatatagc gctcggtatc 1500
ggcggcctgc cgaaggggcg tatcgttgag atttacggcc cggaaagctc cggtaagacg 1560
acgcttgcgt tgcagacgat cgcggaagcc cagaaaaagg gcggcatctg cgccttcgtg 1620
gatgccgagc acgcgctcga tccggtctat gcccgcaagc tcggtgtgga tttgcagaac 1680
cttctgatct cgcagccgga tacgggcgag caggcgcttg aaatcaccga tacgctggtg 1740
cgctccggtg ccgtcgacat tctggtcgtg gactcggttg cggcgctgac gccgcgtgcc 1800
gaaatcgaag gcgagatggg tgacagcctg ccgggccttc aggcacgtct gatgagccag 1860
gcgctgcgca agctgaccgc ctcgatctcc aagtcgaagt gcatggtgat cttcatcaac 1920
cagatccgca tgaagatcgg cgtcatgttc ggttcgccgg aaacgacgac gggcggtaat 1980
gcgcttaaat tctacgcctc ggtgcgtctc gacattcgcc gtatcggcgc cgtcaaggag 2040
cgtgaagagg ttgtcggcaa ccagacccgc gtcaaggtcg tcaagaacaa gatggcaccg 2100
cctttcaagc aggtggaatt cgacatcatg tatggtgaag gcgtttccaa gaccggcgag 2160
cttgtcgatc tcggcgtgaa agccggtatc gtcgagaaat ccggtgcatg gttctcctat 2220
aacagccagc gtttggggca ggggcgtgaa aatgccaaga ctttcctgcg cgacaatccg 2280
gaaatggcaa gcgagatcga actggcgctg cgccagaacg ccggtctgat cgccgatcgg 2340
ttcctgcaga atggcggccc ggaagctggc gaaagcgacg acggtcccga cgagggctga 2400
tgcattcgaa ggtccgggcg ttcgcgtccg gtggctttgc cggcatgagc cggtatggat 2460
caaaagggtc gtgcgatttt cctcgcgtgg ccctttttct ttgcctagac gccttggtgc 2520
gcctccatgg ctggacaggg caggatgcgg acgataaaag cctttgattt tgcaagatag 2580
ccatcattcg ggatggcggt gatggactcc agctgtgagc ggtgtgtggg catgagcggt 2640
gtgaatgaaa ttcggtcgac ctttctcgac tacttcaaga agaacggaca cgagattgtg 2700
ccctccagcc cgctggtgcc gcgcaacgat ccgacgctga tgttcaccaa tgccggcatg 2760
gtgcagttca agaacgtctt caccggtctc gaaagccgtc cttattccac cgccgcctcg 2820
gcgcagaaat gcgtgcgcgc cggtggcaag cataacgacc tggacaatgt cggttatacg 2880
gcccgtcacc atacgttctt cgaaatgctc ggcaatttct cctttggcga ctatttcaag 2940
gaagaggcga ttacccatgc ctggaacctg atcaccaagg aattcggcat cgaccgcaac 3000
cgtctgctgg tcacggtcta tcacaccgac gacgaggctt ttaatctctg gaagaagatc 3060
gccggtttct ccgacgatcg catcatccgt attccgacca gcgataattt ctgggccatg 3120
ggcgataccg gtccgtgcgg tccctgctcg gaaatcttct atgaccacgg cgatcatatc 3180
tggggcggac cgcccggttc gccggaagag gatggcgacc gtttcatcga aatctggaac 3240
ctcgtcttca tgcaatatga gcagctgacg aaggaagagc gcatcgatct gccgcgcccg 3300
tctatcgaca ccggcatctc gagcgcattt cggcgttgtt gcagggcaaa cacgacaatt 3360
acgacaccga tctgttccgg gcgctgattt cggcctccgt cgaagcgacc ggcgttccgg 3420
cagagggcga gaagcgcgcc agccatcgcg tcattgccga tcatctgcgc tcctccgctt 3480
tcctgatcgc cgatggcgtc ctgccgtcaa atgagggccg tggttacgtt ctgcgccgca 3540
tcatgcgccg cgccatgcgc catgccgagc ttctcggttc gcgcgagccg ctgatctaca 3600
agctgctgcc ggcgctgata cagcagatgg gccgcgccta tccggaactg gttcgcgccg 3660
aggcgctgat ctccgagacg 3680
<210> 12
<211> 363
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 12
Met Ala Gln Asn Ser Leu Arg Leu Val Glu Asp Lys Ser Val Asp Lys
1 5 10 15
Ser Lys Ala Leu Glu Ala Ala Leu Ser Gln Ile Glu Arg Ser Phe Gly
20 25 30
Lys Gly Ser Ile Met Lys Leu Gly Ser Asn Glu Asn Val Val Glu Val
35 40 45
Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu Asp Ile Ala Leu Gly Ile
50 55 60
Gly Gly Leu Pro Lys Gly Arg Ile Val Glu Ile Tyr Gly Pro Glu Ser
65 70 75 80
Ser Gly Lys Thr Thr Leu Ala Leu Gln Thr Ile Ala Glu Ala Gln Lys
85 90 95
Lys Gly Gly Ile Cys Ala Phe Val Asp Ala Glu His Ala Leu Asp Pro
100 105 110
Val Tyr Ala Arg Lys Leu Gly Val Asp Leu Gln Asn Leu Leu Ile Ser
115 120 125
Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu Ile Thr Asp Thr Leu Val
130 135 140
Arg Ser Gly Ala Val Asp Ile Leu Val Val Asp Ser Val Ala Ala Leu
145 150 155 160
Thr Pro Arg Ala Glu Ile Glu Gly Glu Met Gly Asp Ser Leu Pro Gly
165 170 175
Leu Gln Ala Arg Leu Met Ser Gln Ala Leu Arg Lys Leu Thr Ala Ser
180 185 190
Ile Ser Lys Ser Lys Cys Met Val Ile Phe Ile Asn Gln Ile Arg Met
195 200 205
Lys Ile Gly Val Met Phe Gly Ser Pro Glu Thr Thr Thr Gly Gly Asn
210 215 220
Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu Asp Ile Arg Arg Ile Gly
225 230 235 240
Ala Val Lys Glu Arg Glu Glu Val Val Gly Asn Gln Thr Arg Val Lys
245 250 255
Val Val Lys Asn Lys Met Ala Pro Pro Phe Lys Gln Val Glu Phe Asp
260 265 270
Ile Met Tyr Gly Glu Gly Val Ser Lys Thr Gly Glu Leu Val Asp Leu
275 280 285
Gly Val Lys Ala Gly Ile Val Glu Lys Ser Gly Ala Trp Phe Ser Tyr
290 295 300
Asn Ser Gln Arg Leu Gly Gln Gly Arg Glu Asn Ala Lys Thr Phe Leu
305 310 315 320
Arg Asp Asn Pro Glu Met Ala Ser Glu Ile Glu Leu Ala Leu Arg Gln
325 330 335
Asn Ala Gly Leu Ile Ala Asp Arg Phe Leu Gln Asn Gly Gly Pro Glu
340 345 350
Ala Gly Glu Ser Asp Asp Gly Pro Asp Glu Gly
355 360
<210> 13
<211> 3186
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 13
atgactttca cccatcacgc aaagcgcgtc ctgacgatcg ctgcgggaac accgttcctc 60
aaaacgctcg cggaaacgct gtgtgacggg acactgacag ccggctataa atacgaccct 120
gcggatccgc tttcgcttgc caaggtgacg atctatgttc cgacccggcg ctccgcccgc 180
gtgctgcgct cagagtttgt cgatcttctg ggcggccgtt ccgccatttt gccactgatc 240
cggccgctcg gcgaaaccga tgacgacagc ggcttcttcg agatcgaaaa tcctgagatc 300
atggatctgg cgccgccgat ttccggcacc ggccggcaaa tcgagctggc gcgcctcatt 360
ctggcatggc gcaacagcct gcccgacgcc atcagggcca tccattcgga ctcaccactt 420
gtcgcccccg ccagccctgc cgacgccata tggctggcgc gcgcgcttgg cgaagtgatc 480
gatgcgatgg atacggaaga aaaagaatgg gaggcgctcg cgcatctcga taccggcgat 540
cacgcccaat ggtggcagct gacggcggat ttcctgaaaa tcgccagcgt gttctggccc 600
gcccgtcttg ccgaactcaa tcgaacttcc gcaggccgac atcgcaacgg catcctgagg 660
gcagaggcga accggcttgc caacctgccg gacaccggac caatcatcgt tgcgggctcc 720
acgggctcaa ttccggcagc agcagacctt atcgcctctg tcgcctccct gccccagggc 780
gtcgtcgtgc ttccgggcct cgatcttacg atgccggagg aacaatggga ggctattgcc 840
gaggacccta ccgatccttc aagccgcacc cattcgcaat acggactcta catgctgttg 900
cagaagctcg atatcatgcg agacgatgtc gttcagattg gcgctatcga tagcgatctt 960
gaaaaacgcg cggcggtttt ttcggcagca cttgctcctg ccaaatccac cagcgactgg 1020
aaccgctggc gtgaggacaa gcaacccgga tttttcgacg atgcttttgc ggcagcgacc 1080
ctgatagaag ctgcaaacga gcgcgaagag gcaaccgcaa ttgcggtggc gctgcggctg 1140
gcgcttgaag cgccgggcgc tggccgcccg tctcaggccg cgctgatcac gcccgatcgc 1200
ggactggcca ggcgcgtggc gacggaattg caacgcttcg gtatcgaagc cgacgattcc 1260
gccggtacgc cgctttccgc cacgccgcag gccggactga cgcaactcgc actggaagct 1320
atcctcaggc ccggagatcc ggtgccggtc atttcccttc tgaaacatcc gctcagccgt 1380
ttcgggcttt cgctggaggc ttttacaaaa gcatcaaagg cgctggaatt gatcgcactt 1440
agaggcggcc gcgtcgaaac ggaaatcggc aatctggagg cggttctcga tgcgcaactg 1500
gcggcgcagc gtgatgaccg gcatccgcct gcctggaggc tggcactgcc cgagggaagc 1560
gtagacgccg cgcgcgatct ggcacgccgg atcgccgttt cgacagagcc gcttggcagc 1620
gcattcgttc gtagcgaccg ctcaggccgg tctttcacgg acaaattgcc gctttccgat 1680
tgggccgagc ggacgggccg ggtgatcgaa gccatctgcg cggatgacaa caacgatctt 1740
gccactctct ggtccggcga ggcaggcgac aagctttccg gcctgtttgg cgaattgatg 1800
gaaagcggcg aaatcctgga tgcggatggt ccgcaatggg ctgatatctt cgcggcactg 1860
gtggctggcg aatcgatcaa gccgcgatcc atgcgccatc cgcgcatttt cattttcggt 1920
gcccttgagg cacgactgca aagcgtcgac actgtcgtga tcggcggtct caatgaaggg 1980
ctttggccgg gccagacggc aaacaacccg tttctgtccc gcaacatgaa gacagccatc 2040
ggtctggaac cgccggagcg gcgcatcggc cagctggcgc acgatttcga gatggcgaac 2100
gggacacggc agattttcta cagccgcgcg ctcagacagg gctcgacacc cgcagtcgca 2160
tcgcgctggc tgcagcgatt gctggcactc ggcggcgagg attttgccga acagctgaag 2220
aagcgcggcg agacctatcg ccactgggca gccctgatgg atgcgaccat cgaccaggaa 2280
gcagcaaagc gccctgcccc caaaccgccg gccgacttgc agccgaagag ctattccttc 2340
agcgaagtgg gcaggctgcg ccgtgacccc tattcgatct acgcgcggcg tatcctgaag 2400
ctcaacccgc ttgatggctt caaccgcgat cccaatgccg ccgaccgtgg cacgctctat 2460
catgcaatca ttgagcgcta ttcccgcgag gggcatattc ccggcacacc ggcatcgctc 2520
gaggccatgc agcgtattct ggatgagagt ttcgacgcgg aagatcttcc tgcacatgtc 2580
gatgtcatct ggcgcccgcg attcgaggcg gtggcacgcg cctttatcga ctgggagaaa 2640
gaacgacatc catccatccg ccgcagcttt ttcgaggcgc gtgccggaca ggaaatcccc 2700
gaggcaggca taaggctgac cggcatcgcc gaccgcatag atatcaagac cggcggtcag 2760
gcggatatta tcgactacaa aacggggctt gcgccttcag tcaatcaggc gcgcgcgctg 2820
ctcgacccgc agctcgcgct ggaagcggca gcactgatgc ggggcgcctt ccgcgaggcg 2880
ggttcgcaga caccggaaaa ccttatctat gtgcgcctgc ggccgggtac ccgttttttt 2940
gccgaccagg tgaataacga acactccaac cggggtggca aaaaagcacc gaaatcggca 3000
attgagctgg caaccgaatc aatcgatcag ctggccaagt tcgtgcgttc gctgcgtgat 3060
ggcgagaacg gttttgcctc gcggctggtg ccggaggagc agcagtccta tgggggggaa 3120
tatgaccacc tcgcccgcgt ttcggaatgg tcgacggcag aaccgggaga cggcgatgat 3180
gattga 3186
<210> 14
<211> 1061
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 14
Met Thr Phe Thr His His Ala Lys Arg Val Leu Thr Ile Ala Ala Gly
1 5 10 15
Thr Pro Phe Leu Lys Thr Leu Ala Glu Thr Leu Cys Asp Gly Thr Leu
20 25 30
Thr Ala Gly Tyr Lys Tyr Asp Pro Ala Asp Pro Leu Ser Leu Ala Lys
35 40 45
Val Thr Ile Tyr Val Pro Thr Arg Arg Ser Ala Arg Val Leu Arg Ser
50 55 60
Glu Phe Val Asp Leu Leu Gly Gly Arg Ser Ala Ile Leu Pro Leu Ile
65 70 75 80
Arg Pro Leu Gly Glu Thr Asp Asp Asp Ser Gly Phe Phe Glu Ile Glu
85 90 95
Asn Pro Glu Ile Met Asp Leu Ala Pro Pro Ile Ser Gly Thr Gly Arg
100 105 110
Gln Ile Glu Leu Ala Arg Leu Ile Leu Ala Trp Arg Asn Ser Leu Pro
115 120 125
Asp Ala Ile Arg Ala Ile His Ser Asp Ser Pro Leu Val Ala Pro Ala
130 135 140
Ser Pro Ala Asp Ala Ile Trp Leu Ala Arg Ala Leu Gly Glu Val Ile
145 150 155 160
Asp Ala Met Asp Thr Glu Glu Lys Glu Trp Glu Ala Leu Ala His Leu
165 170 175
Asp Thr Gly Asp His Ala Gln Trp Trp Gln Leu Thr Ala Asp Phe Leu
180 185 190
Lys Ile Ala Ser Val Phe Trp Pro Ala Arg Leu Ala Glu Leu Asn Arg
195 200 205
Thr Ser Ala Gly Arg His Arg Asn Gly Ile Leu Arg Ala Glu Ala Asn
210 215 220
Arg Leu Ala Asn Leu Pro Asp Thr Gly Pro Ile Ile Val Ala Gly Ser
225 230 235 240
Thr Gly Ser Ile Pro Ala Ala Ala Asp Leu Ile Ala Ser Val Ala Ser
245 250 255
Leu Pro Gln Gly Val Val Val Leu Pro Gly Leu Asp Leu Thr Met Pro
260 265 270
Glu Glu Gln Trp Glu Ala Ile Ala Glu Asp Pro Thr Asp Pro Ser Ser
275 280 285
Arg Thr His Ser Gln Tyr Gly Leu Tyr Met Leu Leu Gln Lys Leu Asp
290 295 300
Ile Met Arg Asp Asp Val Val Gln Ile Gly Ala Ile Asp Ser Asp Leu
305 310 315 320
Glu Lys Arg Ala Ala Val Phe Ser Ala Ala Leu Ala Pro Ala Lys Ser
325 330 335
Thr Ser Asp Trp Asn Arg Trp Arg Glu Asp Lys Gln Pro Gly Phe Phe
340 345 350
Asp Asp Ala Phe Ala Ala Ala Thr Leu Ile Glu Ala Ala Asn Glu Arg
355 360 365
Glu Glu Ala Thr Ala Ile Ala Val Ala Leu Arg Leu Ala Leu Glu Ala
370 375 380
Pro Gly Ala Gly Arg Pro Ser Gln Ala Ala Leu Ile Thr Pro Asp Arg
385 390 395 400
Gly Leu Ala Arg Arg Val Ala Thr Glu Leu Gln Arg Phe Gly Ile Glu
405 410 415
Ala Asp Asp Ser Ala Gly Thr Pro Leu Ser Ala Thr Pro Gln Ala Gly
420 425 430
Leu Thr Gln Leu Ala Leu Glu Ala Ile Leu Arg Pro Gly Asp Pro Val
435 440 445
Pro Val Ile Ser Leu Leu Lys His Pro Leu Ser Arg Phe Gly Leu Ser
450 455 460
Leu Glu Ala Phe Thr Lys Ala Ser Lys Ala Leu Glu Leu Ile Ala Leu
465 470 475 480
Arg Gly Gly Arg Val Glu Thr Glu Ile Gly Asn Leu Glu Ala Val Leu
485 490 495
Asp Ala Gln Leu Ala Ala Gln Arg Asp Asp Arg His Pro Pro Ala Trp
500 505 510
Arg Leu Ala Leu Pro Glu Gly Ser Val Asp Ala Ala Arg Asp Leu Ala
515 520 525
Arg Arg Ile Ala Val Ser Thr Glu Pro Leu Gly Ser Ala Phe Val Arg
530 535 540
Ser Asp Arg Ser Gly Arg Ser Phe Thr Asp Lys Leu Pro Leu Ser Asp
545 550 555 560
Trp Ala Glu Arg Thr Gly Arg Val Ile Glu Ala Ile Cys Ala Asp Asp
565 570 575
Asn Asn Asp Leu Ala Thr Leu Trp Ser Gly Glu Ala Gly Asp Lys Leu
580 585 590
Ser Gly Leu Phe Gly Glu Leu Met Glu Ser Gly Glu Ile Leu Asp Ala
595 600 605
Asp Gly Pro Gln Trp Ala Asp Ile Phe Ala Ala Leu Val Ala Gly Glu
610 615 620
Ser Ile Lys Pro Arg Ser Met Arg His Pro Arg Ile Phe Ile Phe Gly
625 630 635 640
Ala Leu Glu Ala Arg Leu Gln Ser Val Asp Thr Val Val Ile Gly Gly
645 650 655
Leu Asn Glu Gly Leu Trp Pro Gly Gln Thr Ala Asn Asn Pro Phe Leu
660 665 670
Ser Arg Asn Met Lys Thr Ala Ile Gly Leu Glu Pro Pro Glu Arg Arg
675 680 685
Ile Gly Gln Leu Ala His Asp Phe Glu Met Ala Asn Gly Thr Arg Gln
690 695 700
Ile Phe Tyr Ser Arg Ala Leu Arg Gln Gly Ser Thr Pro Ala Val Ala
705 710 715 720
Ser Arg Trp Leu Gln Arg Leu Leu Ala Leu Gly Gly Glu Asp Phe Ala
725 730 735
Glu Gln Leu Lys Lys Arg Gly Glu Thr Tyr Arg His Trp Ala Ala Leu
740 745 750
Met Asp Ala Thr Ile Asp Gln Glu Ala Ala Lys Arg Pro Ala Pro Lys
755 760 765
Pro Pro Ala Asp Leu Gln Pro Lys Ser Tyr Ser Phe Ser Glu Val Gly
770 775 780
Arg Leu Arg Arg Asp Pro Tyr Ser Ile Tyr Ala Arg Arg Ile Leu Lys
785 790 795 800
Leu Asn Pro Leu Asp Gly Phe Asn Arg Asp Pro Asn Ala Ala Asp Arg
805 810 815
Gly Thr Leu Tyr His Ala Ile Ile Glu Arg Tyr Ser Arg Glu Gly His
820 825 830
Ile Pro Gly Thr Pro Ala Ser Leu Glu Ala Met Gln Arg Ile Leu Asp
835 840 845
Glu Ser Phe Asp Ala Glu Asp Leu Pro Ala His Val Asp Val Ile Trp
850 855 860
Arg Pro Arg Phe Glu Ala Val Ala Arg Ala Phe Ile Asp Trp Glu Lys
865 870 875 880
Glu Arg His Pro Ser Ile Arg Arg Ser Phe Phe Glu Ala Arg Ala Gly
885 890 895
Gln Glu Ile Pro Glu Ala Gly Ile Arg Leu Thr Gly Ile Ala Asp Arg
900 905 910
Ile Asp Ile Lys Thr Gly Gly Gln Ala Asp Ile Ile Asp Tyr Lys Thr
915 920 925
Gly Leu Ala Pro Ser Val Asn Gln Ala Arg Ala Leu Leu Asp Pro Gln
930 935 940
Leu Ala Leu Glu Ala Ala Ala Leu Met Arg Gly Ala Phe Arg Glu Ala
945 950 955 960
Gly Ser Gln Thr Pro Glu Asn Leu Ile Tyr Val Arg Leu Arg Pro Gly
965 970 975
Thr Arg Phe Phe Ala Asp Gln Val Asn Asn Glu His Ser Asn Arg Gly
980 985 990
Gly Lys Lys Ala Pro Lys Ser Ala Ile Glu Leu Ala Thr Glu Ser Ile
995 1000 1005
Asp Gln Leu Ala Lys Phe Val Arg Ser Leu Arg Asp Gly Glu Asn
1010 1015 1020
Gly Phe Ala Ser Arg Leu Val Pro Glu Glu Gln Gln Ser Tyr Gly
1025 1030 1035
Gly Glu Tyr Asp His Leu Ala Arg Val Ser Glu Trp Ser Thr Ala
1040 1045 1050
Glu Pro Gly Asp Gly Asp Asp Asp
1055 1060
<210> 15
<211> 1128
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 15
atgttatttt caccgcaaca ggacgaagcg ctcaaggctg tttcccgctg gctgaaggaa 60
ggccggacgc cggtttttcg gttgttcggt tatgccggaa ccggcaagac gacgcttgcc 120
aaacatttcg cggaaaatgt cgatggcgaa gtgctgtttg cggccttcac cggcaaggcg 180
gcgcaggtgc tgcgctcgcg cggggcgacc aatgcccgca ccatccattc gctgatctac 240
cgcccgcgcg gcgaagagac cgtggaagac gaggagaccg gcaagacctc ggtcgcgcca 300
atgttttcca tcaaccgcca gagcccgctc gccaaggcgg cactcatcat catcgatgaa 360
tgttcgatgg tggatgagca gctcggcaag gatctgatga gcttcggcac gcctatcctg 420
gtgctcggcg atcccgggca gttgccgcca gtttcaggcg gtggcttctt cacggagcag 480
gagcctgatt acctgctctc cgaaattcat cggcaggcca aggacaatcc catcatccac 540
cttgccatgg atgtgcggga aggccgcgag atcatgcgtg gcgattacgg tgccgcgcag 600
gtgatttcca agtccgaggt gacacagtcg ctcgtgctcg atgccgatca ggtgctcgtc 660
ggcacaaatc gcacgcgacg ccgttataac cagcggcttc gcgagctgaa gggatttacg 720
gccgattatc cgcaatccgg cgacaagctg gtttgcttga ggaacgatcc ggccaagggc 780
ctgctgaacg gctctctctg gcaggtcatg agttcgtcgc gcgagacggt gaaacccggc 840
atcaacctga tgatccggcc tgaagacgac gatatggatc ggggcgcggc caagatcaaa 900
ttgctgaagg cggctttcga ggatgtggaa acggaaattc cgtggaccac ccgcaagcgt 960
tatgacgagt tcgatttcgg ctatgcgctg accgtgcaca aggcgcaggg ttcgcagtgg 1020
aacaatgtgg ttctctttga cgagagctat gccttccgcg attcgcgcga gcggtggctt 1080
tacaccgcca tcacccgcgc cgcagaaaca ctcacaatcg ttcgctga 1128
<210> 16
<211> 375
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 16
Met Leu Phe Ser Pro Gln Gln Asp Glu Ala Leu Lys Ala Val Ser Arg
1 5 10 15
Trp Leu Lys Glu Gly Arg Thr Pro Val Phe Arg Leu Phe Gly Tyr Ala
20 25 30
Gly Thr Gly Lys Thr Thr Leu Ala Lys His Phe Ala Glu Asn Val Asp
35 40 45
Gly Glu Val Leu Phe Ala Ala Phe Thr Gly Lys Ala Ala Gln Val Leu
50 55 60
Arg Ser Arg Gly Ala Thr Asn Ala Arg Thr Ile His Ser Leu Ile Tyr
65 70 75 80
Arg Pro Arg Gly Glu Glu Thr Val Glu Asp Glu Glu Thr Gly Lys Thr
85 90 95
Ser Val Ala Pro Met Phe Ser Ile Asn Arg Gln Ser Pro Leu Ala Lys
100 105 110
Ala Ala Leu Ile Ile Ile Asp Glu Cys Ser Met Val Asp Glu Gln Leu
115 120 125
Gly Lys Asp Leu Met Ser Phe Gly Thr Pro Ile Leu Val Leu Gly Asp
130 135 140
Pro Gly Gln Leu Pro Pro Val Ser Gly Gly Gly Phe Phe Thr Glu Gln
145 150 155 160
Glu Pro Asp Tyr Leu Leu Ser Glu Ile His Arg Gln Ala Lys Asp Asn
165 170 175
Pro Ile Ile His Leu Ala Met Asp Val Arg Glu Gly Arg Glu Ile Met
180 185 190
Arg Gly Asp Tyr Gly Ala Ala Gln Val Ile Ser Lys Ser Glu Val Thr
195 200 205
Gln Ser Leu Val Leu Asp Ala Asp Gln Val Leu Val Gly Thr Asn Arg
210 215 220
Thr Arg Arg Arg Tyr Asn Gln Arg Leu Arg Glu Leu Lys Gly Phe Thr
225 230 235 240
Ala Asp Tyr Pro Gln Ser Gly Asp Lys Leu Val Cys Leu Arg Asn Asp
245 250 255
Pro Ala Lys Gly Leu Leu Asn Gly Ser Leu Trp Gln Val Met Ser Ser
260 265 270
Ser Arg Glu Thr Val Lys Pro Gly Ile Asn Leu Met Ile Arg Pro Glu
275 280 285
Asp Asp Asp Met Asp Arg Gly Ala Ala Lys Ile Lys Leu Leu Lys Ala
290 295 300
Ala Phe Glu Asp Val Glu Thr Glu Ile Pro Trp Thr Thr Arg Lys Arg
305 310 315 320
Tyr Asp Glu Phe Asp Phe Gly Tyr Ala Leu Thr Val His Lys Ala Gln
325 330 335
Gly Ser Gln Trp Asn Asn Val Val Leu Phe Asp Glu Ser Tyr Ala Phe
340 345 350
Arg Asp Ser Arg Glu Arg Trp Leu Tyr Thr Ala Ile Thr Arg Ala Ala
355 360 365
Glu Thr Leu Thr Ile Val Arg
370 375
<210> 17
<211> 1128
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 17
atgacgaata aggtgtcgct tttacggctg aaactcacgg acttccgcaa ctatgcggcg 60
gcgtcgcttg cgctggatga ccgccacgtg gtgctgacgg gtgacaacgg ttccggcaag 120
accaatctcc tggaggctgt ttcgtttctg tcgcccggaa ggggcctgcg ccgcgccacc 180
ctgtccgatg tgacgcgagt gggggcggag gccgccggtt tttcgatttt tgcggatgtc 240
gacggcatgg acggcgaggt cgccatcgga accgggatcg agggtgacgg cgaggtagtg 300
tcgcgccgcc tgaggctgaa cgggacatcg gtgaagtcgg tcgatgaatt gacggatcat 360
ctgcgggtgc tgtggctgac gcctgccatg gatgggcttt ttaccggttc atcctcggat 420
cgccggcgtt ttctcgatcg gttggtgctc tcgctcgatc ccgcgcatgg gcggcgggca 480
agcgacttcg aaaaggccat gcgcggccgc aaccgtctgc tttcggaagg ccgtttcgat 540
ccggtctggc tggacggtat cgagaagcag atggcggaac tcggcatttc catggcgctc 600
gcgcgctatg aaatgttggg tcttttgaaa agcctcatcg aaggccgttc cggcaatgct 660
gccttcccct ctgcagcgct ggcgctctcg ggtttcatgg acgacacgct caaccggccg 720
gctgtcgatc tggaagacga gtataggctt atgctgcgcg aaggccggta tcgagacgcg 780
gcggcgggcc gcacgcttga tggaccgcac cgtgtcgatc tgttcgtgcg ccatgcggaa 840
aagaacatgg aggcagagcg ttgctcgacc ggagaacaga aggcgctgct ggtgggattg 900
gtgcttgcgc atgcccagct caccgccaac atgaccggcc atgcgccggt tctgctgctc 960
gacgaaattg ccgcgcatct ggatgagggc aggcgggcgg ctctgttcga tctcattcac 1020
gcgctcggtg gtcagagttt catgaccgga acggatgcgg caatgttctc cgcccttggc 1080
gacagggcgc aattcttcaa tgtctcccac gggggcatca cggcatga 1128
<210> 18
<211> 375
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 18
Met Thr Asn Lys Val Ser Leu Leu Arg Leu Lys Leu Thr Asp Phe Arg
1 5 10 15
Asn Tyr Ala Ala Ala Ser Leu Ala Leu Asp Asp Arg His Val Val Leu
20 25 30
Thr Gly Asp Asn Gly Ser Gly Lys Thr Asn Leu Leu Glu Ala Val Ser
35 40 45
Phe Leu Ser Pro Gly Arg Gly Leu Arg Arg Ala Thr Leu Ser Asp Val
50 55 60
Thr Arg Val Gly Ala Glu Ala Ala Gly Phe Ser Ile Phe Ala Asp Val
65 70 75 80
Asp Gly Met Asp Gly Glu Val Ala Ile Gly Thr Gly Ile Glu Gly Asp
85 90 95
Gly Glu Val Val Ser Arg Arg Leu Arg Leu Asn Gly Thr Ser Val Lys
100 105 110
Ser Val Asp Glu Leu Thr Asp His Leu Arg Val Leu Trp Leu Thr Pro
115 120 125
Ala Met Asp Gly Leu Phe Thr Gly Ser Ser Ser Asp Arg Arg Arg Phe
130 135 140
Leu Asp Arg Leu Val Leu Ser Leu Asp Pro Ala His Gly Arg Arg Ala
145 150 155 160
Ser Asp Phe Glu Lys Ala Met Arg Gly Arg Asn Arg Leu Leu Ser Glu
165 170 175
Gly Arg Phe Asp Pro Val Trp Leu Asp Gly Ile Glu Lys Gln Met Ala
180 185 190
Glu Leu Gly Ile Ser Met Ala Leu Ala Arg Tyr Glu Met Leu Gly Leu
195 200 205
Leu Lys Ser Leu Ile Glu Gly Arg Ser Gly Asn Ala Ala Phe Pro Ser
210 215 220
Ala Ala Leu Ala Leu Ser Gly Phe Met Asp Asp Thr Leu Asn Arg Pro
225 230 235 240
Ala Val Asp Leu Glu Asp Glu Tyr Arg Leu Met Leu Arg Glu Gly Arg
245 250 255
Tyr Arg Asp Ala Ala Ala Gly Arg Thr Leu Asp Gly Pro His Arg Val
260 265 270
Asp Leu Phe Val Arg His Ala Glu Lys Asn Met Glu Ala Glu Arg Cys
275 280 285
Ser Thr Gly Glu Gln Lys Ala Leu Leu Val Gly Leu Val Leu Ala His
290 295 300
Ala Gln Leu Thr Ala Asn Met Thr Gly His Ala Pro Val Leu Leu Leu
305 310 315 320
Asp Glu Ile Ala Ala His Leu Asp Glu Gly Arg Arg Ala Ala Leu Phe
325 330 335
Asp Leu Ile His Ala Leu Gly Gly Gln Ser Phe Met Thr Gly Thr Asp
340 345 350
Ala Ala Met Phe Ser Ala Leu Gly Asp Arg Ala Gln Phe Phe Asn Val
355 360 365
Ser His Gly Gly Ile Thr Ala
370 375
<210> 19
<211> 2106
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 19
atgcgtcccg ccattctcga tccgctattt gcttccgtct ccacccttgc cggtgtgggg 60
ccgaagcttg ccgaccttct ggccaaactg ctgagccggg aaaatgccga cgacacccgc 120
gtgatcgatc ttctgttcca cgcgccatca aacgtcatcg accggcgcaa ccgcccgggc 180
atcgcgcttg ccgctcccgg cgccattgtc accatccagg gacgtgtcga ccggcatcag 240
ccagctccac caggcaatcg ttccgcgccc taccgtgttt tcctgcatga cgagaccggg 300
gaactggcgc tgaccttctt ccgcgccaag ggagactggc tttccaaggc cttacccgtc 360
gatgaagagg ttctcgtcag cggcaaggtg gactggttca acggccgcgc ctccatggtg 420
catccggatt tcatggtgaa gctctccgag gccgagaacc tgccgctggt cgaagccgtt 480
tatccgatga cagccgggct gtctccgaag gtgctgcggc gggcaattga aggcgggctt 540
tcgaaactgc cggtctttcc cgaatggatc gacgaaacgc tcaagacccg tcagggtttc 600
ggcgacgtgg catcgagctt ccgtgagttg cacgatccgc gcgacagcgc cgatatcgat 660
cctcaggccc cggcacgcag acggctcgcc tacgacgaat tcctggccgg gcagctgtca 720
ctggcgctgg tgcggcaaag actgcgcaag gtcgcgggcc agccgatccg cgccaagggg 780
gacattgctg caaaaatcct gtcgcaactg cccttctccc tgacgccgag ccagaatgcc 840
tcggtgaaag atatcctgac cgatatggcc agcgaggacc gtatgttgcg gctgttgcaa 900
ggcgatgtcg gcgcgggcaa gacgctggtg gcgctgatgg ctatggcaac cgccgtcgag 960
gccggagggc aggcggtgtt gatggccccg accgaaattc ttgcccggca gcatttcgcc 1020
accatctcca aactcgccaa tgccgtgggc attacggttg aggtgctgac cggccgcacc 1080
aagggcaagg agcgtcgcga gatcgaagaa cgcgtggcct ccggtgaggc acagatcgtc 1140
atcggcaccc acgcgctgtt ccaggacagc gtgagttaca agaacctcgt gctggccgtg 1200
gtggatgagc agcaccgttt cggcgtacac cagcgcctgc gtctcaccgc caagggcatc 1260
acgccgcata tgcttgttat gaccgccacg cccattccgc gcacgctggt gctggccgcc 1320
ttcggcgaca tggatgtgtc gaaactcacc gaaaaaccgg ccggccgaaa accgatccag 1380
accgtgacaa tccccacaga gcgcatcggc gacatcgtcg agcggctgcg cgccgcgctg 1440
aaggagggca agaaggccta ctggatctgc ccgctggtgg aggagacgga agagtccgac 1500
ctgatgtcgg cggaagaacg acatgcggtt ctctcgcaga tgctcggtgc caatatcggt 1560
ctcatccatg ggcgcatgag cggccctgag aaggacgccg ccatgctggc tttcaagaac 1620
ggcgaaaccc ggctgctggt tgcaacgaca gtggtggaag tgggtgtcga cgttccggac 1680
gccacgatca tggtcatcga acatgccgaa cgtttcggcc tggcccagct tcaccagctg 1740
cgtggccggg ttggacgcgg tgacgaggcc tccacctgca tcctgctcta taaggggccg 1800
ctcagcgaaa acggccgcgc ccgactttcc atcctgcgcg acagcgagga cggcttcctg 1860
attgccgaag aggatttgaa gctgcgcggc gaaggcgaac tcctcggcac ccgccagtcc 1920
ggaaccccgg gcttccgcat cgccagcctc gaagcccatg ccgatctcct ggaaatcgcc 1980
cgcaaggacg ccgcctatgt catcgagcgc gaccccgaac tgaccggccc gcgcggcgaa 2040
agcctgcgca ccctgctcta tctgcaccgc cgcgacgaag ctatccgctt cctgcacgcc 2100
ggctga 2106
<210> 20
<211> 701
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 20
Met Arg Pro Ala Ile Leu Asp Pro Leu Phe Ala Ser Val Ser Thr Leu
1 5 10 15
Ala Gly Val Gly Pro Lys Leu Ala Asp Leu Leu Ala Lys Leu Leu Ser
20 25 30
Arg Glu Asn Ala Asp Asp Thr Arg Val Ile Asp Leu Leu Phe His Ala
35 40 45
Pro Ser Asn Val Ile Asp Arg Arg Asn Arg Pro Gly Ile Ala Leu Ala
50 55 60
Ala Pro Gly Ala Ile Val Thr Ile Gln Gly Arg Val Asp Arg His Gln
65 70 75 80
Pro Ala Pro Pro Gly Asn Arg Ser Ala Pro Tyr Arg Val Phe Leu His
85 90 95
Asp Glu Thr Gly Glu Leu Ala Leu Thr Phe Phe Arg Ala Lys Gly Asp
100 105 110
Trp Leu Ser Lys Ala Leu Pro Val Asp Glu Glu Val Leu Val Ser Gly
115 120 125
Lys Val Asp Trp Phe Asn Gly Arg Ala Ser Met Val His Pro Asp Phe
130 135 140
Met Val Lys Leu Ser Glu Ala Glu Asn Leu Pro Leu Val Glu Ala Val
145 150 155 160
Tyr Pro Met Thr Ala Gly Leu Ser Pro Lys Val Leu Arg Arg Ala Ile
165 170 175
Glu Gly Gly Leu Ser Lys Leu Pro Val Phe Pro Glu Trp Ile Asp Glu
180 185 190
Thr Leu Lys Thr Arg Gln Gly Phe Gly Asp Val Ala Ser Ser Phe Arg
195 200 205
Glu Leu His Asp Pro Arg Asp Ser Ala Asp Ile Asp Pro Gln Ala Pro
210 215 220
Ala Arg Arg Arg Leu Ala Tyr Asp Glu Phe Leu Ala Gly Gln Leu Ser
225 230 235 240
Leu Ala Leu Val Arg Gln Arg Leu Arg Lys Val Ala Gly Gln Pro Ile
245 250 255
Arg Ala Lys Gly Asp Ile Ala Ala Lys Ile Leu Ser Gln Leu Pro Phe
260 265 270
Ser Leu Thr Pro Ser Gln Asn Ala Ser Val Lys Asp Ile Leu Thr Asp
275 280 285
Met Ala Ser Glu Asp Arg Met Leu Arg Leu Leu Gln Gly Asp Val Gly
290 295 300
Ala Gly Lys Thr Leu Val Ala Leu Met Ala Met Ala Thr Ala Val Glu
305 310 315 320
Ala Gly Gly Gln Ala Val Leu Met Ala Pro Thr Glu Ile Leu Ala Arg
325 330 335
Gln His Phe Ala Thr Ile Ser Lys Leu Ala Asn Ala Val Gly Ile Thr
340 345 350
Val Glu Val Leu Thr Gly Arg Thr Lys Gly Lys Glu Arg Arg Glu Ile
355 360 365
Glu Glu Arg Val Ala Ser Gly Glu Ala Gln Ile Val Ile Gly Thr His
370 375 380
Ala Leu Phe Gln Asp Ser Val Ser Tyr Lys Asn Leu Val Leu Ala Val
385 390 395 400
Val Asp Glu Gln His Arg Phe Gly Val His Gln Arg Leu Arg Leu Thr
405 410 415
Ala Lys Gly Ile Thr Pro His Met Leu Val Met Thr Ala Thr Pro Ile
420 425 430
Pro Arg Thr Leu Val Leu Ala Ala Phe Gly Asp Met Asp Val Ser Lys
435 440 445
Leu Thr Glu Lys Pro Ala Gly Arg Lys Pro Ile Gln Thr Val Thr Ile
450 455 460
Pro Thr Glu Arg Ile Gly Asp Ile Val Glu Arg Leu Arg Ala Ala Leu
465 470 475 480
Lys Glu Gly Lys Lys Ala Tyr Trp Ile Cys Pro Leu Val Glu Glu Thr
485 490 495
Glu Glu Ser Asp Leu Met Ser Ala Glu Glu Arg His Ala Val Leu Ser
500 505 510
Gln Met Leu Gly Ala Asn Ile Gly Leu Ile His Gly Arg Met Ser Gly
515 520 525
Pro Glu Lys Asp Ala Ala Met Leu Ala Phe Lys Asn Gly Glu Thr Arg
530 535 540
Leu Leu Val Ala Thr Thr Val Val Glu Val Gly Val Asp Val Pro Asp
545 550 555 560
Ala Thr Ile Met Val Ile Glu His Ala Glu Arg Phe Gly Leu Ala Gln
565 570 575
Leu His Gln Leu Arg Gly Arg Val Gly Arg Gly Asp Glu Ala Ser Thr
580 585 590
Cys Ile Leu Leu Tyr Lys Gly Pro Leu Ser Glu Asn Gly Arg Ala Arg
595 600 605
Leu Ser Ile Leu Arg Asp Ser Glu Asp Gly Phe Leu Ile Ala Glu Glu
610 615 620
Asp Leu Lys Leu Arg Gly Glu Gly Glu Leu Leu Gly Thr Arg Gln Ser
625 630 635 640
Gly Thr Pro Gly Phe Arg Ile Ala Ser Leu Glu Ala His Ala Asp Leu
645 650 655
Leu Glu Ile Ala Arg Lys Asp Ala Ala Tyr Val Ile Glu Arg Asp Pro
660 665 670
Glu Leu Thr Gly Pro Arg Gly Glu Ser Leu Arg Thr Leu Leu Tyr Leu
675 680 685
His Arg Arg Asp Glu Ala Ile Arg Phe Leu His Ala Gly
690 695 700
<210> 21
<211> 1809
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 21
atggcaatga tggagccggc cgataccgtg gtccgcgcat ttcttagcgt ggagcggtcg 60
gcgacagagc aacgttgggt ttcgcggctg gatcaggccg cacagaaccg tgcgctggcc 120
atgtcccaga tccatgccat tcccgaactg attgcccggg tgctggccgg gcgaggggtg 180
ggggtggatg aggctctcgc tttcctcgat ccgaccattc gctcattgat gcccgacccg 240
catgtgctga cagattgcga aaaggctgcc gaaaggctgg tccgcgccat tgagaccggc 300
gagaaggtgg cgatcttcgg cgattatgac gttgatggcg ccgcgtcttc cgcgctgatg 360
tatcggtttc tcgcacattt cgggctgacg ccggaaatct atattccaga tcgtattttc 420
gagggttatg ggccgaaccc ggcggcgatg cagcagcttg ccgccaatgg cgcgaccctg 480
atcgtgacgg ttgattgcgg ctccaccagc catgaatcgc tgaatgccgc aaaggatgcg 540
ggaacagatg tggtggtgat cgatcaccac caggtcggtt cggaactgcc gccggcggtg 600
gcgttggtca atcccaaccg cgaagacgat ctttcggggc aggggcatct ctgcgccgca 660
ggcgtggtgt ttctggttct ggtcgccacc ctcaggctgt tgaaggacag gcgcaacaga 720
caggcgttca cgatcgatct gctggcgctg ctggatatag tcgcactcgc aaccgtatgc 780
gacgtggtgc ccttgaaggg gctgaaccgc gcctatgtgg taaaggggtt gattgccgcg 840
cgccatatga acaacgccgg gctggcggcg ctgttcagaa aggcggggtt gggcgggccg 900
gtgacaccgt atcatttcgg tttcctgatc gggccacgca tcaatgccgg tggccgtatt 960
ggcgatgccg cactgggtag ccgtctgctt acactcgacg actcgtcaca ggcggacgtg 1020
attgccgaaa agctggatga gctcaaccgc gagcgacagg cgatggaagc cgtgatgctg 1080
gcggaagccg aagcggaagc gctttatgag tatggcgacg gctctggcgc tggcgtcatc 1140
gttaccgcac gggaaaactg gcatccgggg atcgttggcc tgcttgcctc acgcctcaag 1200
gaccgtttcc gccgcccggc ctttgcaatc gctttcgatc cctctggcaa gggcacaggc 1260
tccggccgct cgatcaatgg tttcgatatg ggcagaatgg tccgcgccgc tgtggatgcc 1320
ggcctgctgg tcaagggtgg cggtcacgcc atggccgcgg gcctgacggt ggaacgcgcc 1380
aatctcggca aactccggac cttcttcgag gaagccgccg caaagacggt gagcgagctg 1440
gtggaaagca gcgtgcttaa gatcgacggc gcaatcggcg cgtccggtgc gaccctgcag 1500
cttgtcgatc agctggaaca ggctggtcct tatggctccg gccattctca gcccattttt 1560
gccgtgcctg cccaccggct gcgcgatgtg cgtctggtcg gcacctccca cgtcaagatc 1620
acgctggagg ccatggatgg ctcacggctg gacggcatcg cattccgcgc cgcagaggcc 1680
cctctggggc agatgctgct gaatgcgcgt ggcaggtcta tccacgtggc aggcaccgtg 1740
ggtgccgatc tctggcaggg ccagaggcgt gtgcagctgc gtgttctgga cgcggctttc 1800
gcgccctga 1809
<210> 22
<211> 602
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 22
Met Ala Met Met Glu Pro Ala Asp Thr Val Val Arg Ala Phe Leu Ser
1 5 10 15
Val Glu Arg Ser Ala Thr Glu Gln Arg Trp Val Ser Arg Leu Asp Gln
20 25 30
Ala Ala Gln Asn Arg Ala Leu Ala Met Ser Gln Ile His Ala Ile Pro
35 40 45
Glu Leu Ile Ala Arg Val Leu Ala Gly Arg Gly Val Gly Val Asp Glu
50 55 60
Ala Leu Ala Phe Leu Asp Pro Thr Ile Arg Ser Leu Met Pro Asp Pro
65 70 75 80
His Val Leu Thr Asp Cys Glu Lys Ala Ala Glu Arg Leu Val Arg Ala
85 90 95
Ile Glu Thr Gly Glu Lys Val Ala Ile Phe Gly Asp Tyr Asp Val Asp
100 105 110
Gly Ala Ala Ser Ser Ala Leu Met Tyr Arg Phe Leu Ala His Phe Gly
115 120 125
Leu Thr Pro Glu Ile Tyr Ile Pro Asp Arg Ile Phe Glu Gly Tyr Gly
130 135 140
Pro Asn Pro Ala Ala Met Gln Gln Leu Ala Ala Asn Gly Ala Thr Leu
145 150 155 160
Ile Val Thr Val Asp Cys Gly Ser Thr Ser His Glu Ser Leu Asn Ala
165 170 175
Ala Lys Asp Ala Gly Thr Asp Val Val Val Ile Asp His His Gln Val
180 185 190
Gly Ser Glu Leu Pro Pro Ala Val Ala Leu Val Asn Pro Asn Arg Glu
195 200 205
Asp Asp Leu Ser Gly Gln Gly His Leu Cys Ala Ala Gly Val Val Phe
210 215 220
Leu Val Leu Val Ala Thr Leu Arg Leu Leu Lys Asp Arg Arg Asn Arg
225 230 235 240
Gln Ala Phe Thr Ile Asp Leu Leu Ala Leu Leu Asp Ile Val Ala Leu
245 250 255
Ala Thr Val Cys Asp Val Val Pro Leu Lys Gly Leu Asn Arg Ala Tyr
260 265 270
Val Val Lys Gly Leu Ile Ala Ala Arg His Met Asn Asn Ala Gly Leu
275 280 285
Ala Ala Leu Phe Arg Lys Ala Gly Leu Gly Gly Pro Val Thr Pro Tyr
290 295 300
His Phe Gly Phe Leu Ile Gly Pro Arg Ile Asn Ala Gly Gly Arg Ile
305 310 315 320
Gly Asp Ala Ala Leu Gly Ser Arg Leu Leu Thr Leu Asp Asp Ser Ser
325 330 335
Gln Ala Asp Val Ile Ala Glu Lys Leu Asp Glu Leu Asn Arg Glu Arg
340 345 350
Gln Ala Met Glu Ala Val Met Leu Ala Glu Ala Glu Ala Glu Ala Leu
355 360 365
Tyr Glu Tyr Gly Asp Gly Ser Gly Ala Gly Val Ile Val Thr Ala Arg
370 375 380
Glu Asn Trp His Pro Gly Ile Val Gly Leu Leu Ala Ser Arg Leu Lys
385 390 395 400
Asp Arg Phe Arg Arg Pro Ala Phe Ala Ile Ala Phe Asp Pro Ser Gly
405 410 415
Lys Gly Thr Gly Ser Gly Arg Ser Ile Asn Gly Phe Asp Met Gly Arg
420 425 430
Met Val Arg Ala Ala Val Asp Ala Gly Leu Leu Val Lys Gly Gly Gly
435 440 445
His Ala Met Ala Ala Gly Leu Thr Val Glu Arg Ala Asn Leu Gly Lys
450 455 460
Leu Arg Thr Phe Phe Glu Glu Ala Ala Ala Lys Thr Val Ser Glu Leu
465 470 475 480
Val Glu Ser Ser Val Leu Lys Ile Asp Gly Ala Ile Gly Ala Ser Gly
485 490 495
Ala Thr Leu Gln Leu Val Asp Gln Leu Glu Gln Ala Gly Pro Tyr Gly
500 505 510
Ser Gly His Ser Gln Pro Ile Phe Ala Val Pro Ala His Arg Leu Arg
515 520 525
Asp Val Arg Leu Val Gly Thr Ser His Val Lys Ile Thr Leu Glu Ala
530 535 540
Met Asp Gly Ser Arg Leu Asp Gly Ile Ala Phe Arg Ala Ala Glu Ala
545 550 555 560
Pro Leu Gly Gln Met Leu Leu Asn Ala Arg Gly Arg Ser Ile His Val
565 570 575
Ala Gly Thr Val Gly Ala Asp Leu Trp Gln Gly Gln Arg Arg Val Gln
580 585 590
Leu Arg Val Leu Asp Ala Ala Phe Ala Pro
595 600
<210> 23
<211> 1674
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 23
atgctggtcc agctctcgat tcgtgacatc gttctgattg aaaggctcga cctcggcttt 60
gaggcgggcc tttccgtgtt gacgggtgag acgggcgcgg gcaaatccat tctgcttgac 120
agcctgtcgc tggccctcgg gggccgcggc gatggcggtc tggtgcgcca cggtgaagag 180
aagggacagg tcactgccac tttcgaagtt ccgaacagcc accccacacg gcatctcctg 240
cgcgaaaacg gcctcgatga cgatggcgac ctgattttcc gccgcgtgca atccgcagac 300
ggacgcacca aggcctatat caacgatcag gccatcagcg tgcagatgat gcgtcagctg 360
gggcagctat tggtcgaaat tcacggccag cacgacgacc gcgctcttgt cgataccgat 420
gcccaccgca cgctgctgga tgctttcgcc gggctgagcg acgatgcccg tgccgttcag 480
ggtttctacc gcacatggaa ggacgccgag cgggcattga aaactcatcg tgccaaggtt 540
gaggctgctg cccgagaggc ggactatctg cgttcctccg tcgaggagct tgaggtgctc 600
tcgccgcgcg acggcgagga ggaggagctt gccgaacgtc gggcggtgat gcagaaatcc 660
gaacgtattg ccggtgatat cgccgaagcg agcgagttcc tgaacggcaa cgcctcgcca 720
gtgcccatga tcgcatccat gatgcggcgc ctggaacgca agagccacga ggcgccggga 780
ttgctggaag acaccgtgca attgttggat gccgcgctcg acagcctttc caacgcgcag 840
atggaagtgg aggccgcact tcgccgcacc gagttcgatc cacgcgagct ggagcgggtg 900
gaggaacggc tgtttgcgct acgcgccgcc ggacgcaaat ataatgtcgc ggtgcctgat 960
ctgccggcga ttgcggaaaa aatggtcgcg gatcttgccg acctcgatgc gggcgaagaa 1020
aagctcggca aacttgaagc caatctcggc gttgtgaaag ccaatttcga ccacgcggcc 1080
aaatcgcttt ccgaaaaacg ccacaatgcg gcgaacgcgc tttccgaagc tgtcatggcg 1140
gagcttccgg cgctcaagct ggagcgggca cgttttaccg tcgaagtcag ctccgacccg 1200
gagcaagcga cggctgacgg tatcgacatc gtggaattcc acgttcagac caatcctgga 1260
acgcggcccg gcccgatcat gaaagtcgct tctggcggcg aattgtcccg tttcctgctg 1320
gcgcttaaag tcgcgctggc ggatcgtggt tcggcaccga cactggtgtt cgacgaaatc 1380
gacacgggcg ttggcggcgc tgtggcagat gccattggcc aaaggctgcg tcgtctgtcg 1440
aaaaccgtgc aggttctgtc cgtcacccac gcgccccagg tggccgcgcg ggcggccaca 1500
catcttctca tttccaaagg cccctccggc gacggcaccg agcgcatcgc cacgcgtgtc 1560
gctaccatgg agccgaaaca tcgcaccgaa gaaatcgccc gcatgcttgc cggtgcctcg 1620
gtgacagatg aggcgagggc tgctgccgcc cgcctgcttg ccgccaagga ttaa 1674
<210> 24
<211> 557
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 24
Met Leu Val Gln Leu Ser Ile Arg Asp Ile Val Leu Ile Glu Arg Leu
1 5 10 15
Asp Leu Gly Phe Glu Ala Gly Leu Ser Val Leu Thr Gly Glu Thr Gly
20 25 30
Ala Gly Lys Ser Ile Leu Leu Asp Ser Leu Ser Leu Ala Leu Gly Gly
35 40 45
Arg Gly Asp Gly Gly Leu Val Arg His Gly Glu Glu Lys Gly Gln Val
50 55 60
Thr Ala Thr Phe Glu Val Pro Asn Ser His Pro Thr Arg His Leu Leu
65 70 75 80
Arg Glu Asn Gly Leu Asp Asp Asp Gly Asp Leu Ile Phe Arg Arg Val
85 90 95
Gln Ser Ala Asp Gly Arg Thr Lys Ala Tyr Ile Asn Asp Gln Ala Ile
100 105 110
Ser Val Gln Met Met Arg Gln Leu Gly Gln Leu Leu Val Glu Ile His
115 120 125
Gly Gln His Asp Asp Arg Ala Leu Val Asp Thr Asp Ala His Arg Thr
130 135 140
Leu Leu Asp Ala Phe Ala Gly Leu Ser Asp Asp Ala Arg Ala Val Gln
145 150 155 160
Gly Phe Tyr Arg Thr Trp Lys Asp Ala Glu Arg Ala Leu Lys Thr His
165 170 175
Arg Ala Lys Val Glu Ala Ala Ala Arg Glu Ala Asp Tyr Leu Arg Ser
180 185 190
Ser Val Glu Glu Leu Glu Val Leu Ser Pro Arg Asp Gly Glu Glu Glu
195 200 205
Glu Leu Ala Glu Arg Arg Ala Val Met Gln Lys Ser Glu Arg Ile Ala
210 215 220
Gly Asp Ile Ala Glu Ala Ser Glu Phe Leu Asn Gly Asn Ala Ser Pro
225 230 235 240
Val Pro Met Ile Ala Ser Met Met Arg Arg Leu Glu Arg Lys Ser His
245 250 255
Glu Ala Pro Gly Leu Leu Glu Asp Thr Val Gln Leu Leu Asp Ala Ala
260 265 270
Leu Asp Ser Leu Ser Asn Ala Gln Met Glu Val Glu Ala Ala Leu Arg
275 280 285
Arg Thr Glu Phe Asp Pro Arg Glu Leu Glu Arg Val Glu Glu Arg Leu
290 295 300
Phe Ala Leu Arg Ala Ala Gly Arg Lys Tyr Asn Val Ala Val Pro Asp
305 310 315 320
Leu Pro Ala Ile Ala Glu Lys Met Val Ala Asp Leu Ala Asp Leu Asp
325 330 335
Ala Gly Glu Glu Lys Leu Gly Lys Leu Glu Ala Asn Leu Gly Val Val
340 345 350
Lys Ala Asn Phe Asp His Ala Ala Lys Ser Leu Ser Glu Lys Arg His
355 360 365
Asn Ala Ala Asn Ala Leu Ser Glu Ala Val Met Ala Glu Leu Pro Ala
370 375 380
Leu Lys Leu Glu Arg Ala Arg Phe Thr Val Glu Val Ser Ser Asp Pro
385 390 395 400
Glu Gln Ala Thr Ala Asp Gly Ile Asp Ile Val Glu Phe His Val Gln
405 410 415
Thr Asn Pro Gly Thr Arg Pro Gly Pro Ile Met Lys Val Ala Ser Gly
420 425 430
Gly Glu Leu Ser Arg Phe Leu Leu Ala Leu Lys Val Ala Leu Ala Asp
435 440 445
Arg Gly Ser Ala Pro Thr Leu Val Phe Asp Glu Ile Asp Thr Gly Val
450 455 460
Gly Gly Ala Val Ala Asp Ala Ile Gly Gln Arg Leu Arg Arg Leu Ser
465 470 475 480
Lys Thr Val Gln Val Leu Ser Val Thr His Ala Pro Gln Val Ala Ala
485 490 495
Arg Ala Ala Thr His Leu Leu Ile Ser Lys Gly Pro Ser Gly Asp Gly
500 505 510
Thr Glu Arg Ile Ala Thr Arg Val Ala Thr Met Glu Pro Lys His Arg
515 520 525
Thr Glu Glu Ile Ala Arg Met Leu Ala Gly Ala Ser Val Thr Asp Glu
530 535 540
Ala Arg Ala Ala Ala Ala Arg Leu Leu Ala Ala Lys Asp
545 550 555
<210> 25
<211> 765
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 25
atgcagtggc aggacgaggc aatcattctc ggcgtaaagc gtcatggcga gaccagcgtc 60
atcgccgagg tgatgacccg tttgcgcggc cgccatctgg ggatggtgcg cggcgggcgc 120
tcccgcagca tgcagccggt gctgcaggcg ggaaaccggg tggatgtgat ctggcgggcg 180
cggcttgacg accatctcgg cgaattccgc attgagcctt tgcagttgcg ggcagcgcaa 240
ttgatggaaa cggcaaccgc cgtgtatggc gtgcaggcca tgggcgcgct gctgcggctt 300
ctgccggagc gtgacccgca tccgcatctc tatcaggcgc tcgacgtcat tctcgacaat 360
ctccatgatc cggtcgatgc tggcgaattg ttcgtacggt tcgagctggc ggtgctgaac 420
gatcttggtt tcggtctcga tctcacggaa tgcgcggcaa cgggcctgcg caccgatctc 480
atctatgtat cgcccaaaac gggcagggcg gtctgtagta cggcgggcgc gccctatgcg 540
gcgcgtatgc tttcgcttcc cgctttcctg agcgaaggtc agtcgaaggc ggccgaccgc 600
gacagcctcg cggcagcctt tcgcctgacc ggccattttc tccaccggca tgtctatgat 660
ccgcgcggcc tcaatgaaaa cgccgcccgc gacggtttcg tgcaggcggc gttgaaggca 720
ctggagcgca aggcggtgct gcctgcgctc gataaggcgg tatag 765
<210> 26
<211> 254
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 26
Met Gln Trp Gln Asp Glu Ala Ile Ile Leu Gly Val Lys Arg His Gly
1 5 10 15
Glu Thr Ser Val Ile Ala Glu Val Met Thr Arg Leu Arg Gly Arg His
20 25 30
Leu Gly Met Val Arg Gly Gly Arg Ser Arg Ser Met Gln Pro Val Leu
35 40 45
Gln Ala Gly Asn Arg Val Asp Val Ile Trp Arg Ala Arg Leu Asp Asp
50 55 60
His Leu Gly Glu Phe Arg Ile Glu Pro Leu Gln Leu Arg Ala Ala Gln
65 70 75 80
Leu Met Glu Thr Ala Thr Ala Val Tyr Gly Val Gln Ala Met Gly Ala
85 90 95
Leu Leu Arg Leu Leu Pro Glu Arg Asp Pro His Pro His Leu Tyr Gln
100 105 110
Ala Leu Asp Val Ile Leu Asp Asn Leu His Asp Pro Val Asp Ala Gly
115 120 125
Glu Leu Phe Val Arg Phe Glu Leu Ala Val Leu Asn Asp Leu Gly Phe
130 135 140
Gly Leu Asp Leu Thr Glu Cys Ala Ala Thr Gly Leu Arg Thr Asp Leu
145 150 155 160
Ile Tyr Val Ser Pro Lys Thr Gly Arg Ala Val Cys Ser Thr Ala Gly
165 170 175
Ala Pro Tyr Ala Ala Arg Met Leu Ser Leu Pro Ala Phe Leu Ser Glu
180 185 190
Gly Gln Ser Lys Ala Ala Asp Arg Asp Ser Leu Ala Ala Ala Phe Arg
195 200 205
Leu Thr Gly His Phe Leu His Arg His Val Tyr Asp Pro Arg Gly Leu
210 215 220
Asn Glu Asn Ala Ala Arg Asp Gly Phe Val Gln Ala Ala Leu Lys Ala
225 230 235 240
Leu Glu Arg Lys Ala Val Leu Pro Ala Leu Asp Lys Ala Val
245 250
<210> 27
<211> 1809
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 27
gtgaccaccg atcccttgca gattctcaag accgtgtatg gctacgatac gtttcgtgga 60
cagcaggccg aaatcatccg gcatgtgatg gcaggcaaca atgcatttgt attgatgcca 120
acagggggcg ggaagtcgct ttgttaccag attccggcgc tcgcccgtaa gggaatgggg 180
ctggttgttt cgcccctgat cgcgctgatg gttgatcagg tcgccgcctt gcgtcaggca 240
ggtgtgcggg cagaagctct caactccgat ctttccccag aagagcggcg gatactctgg 300
caggatatgc gggctggcaa ggtcgatatt ctctatgccg cgccggagac ccttctcaag 360
ccggatgttc tggatgcgct tcaacctatc agcctgtcgc tgatcgccat cgacgaagct 420
cattgcctgt cgcagtgggg gcacgatttc cgtccccctt accgccagct agacacgttg 480
atcgagcgct ttccggatac gccacgcatg gcgctcacgg cgactgcgga cgagccaacc 540
cgcgccgaaa ttctgggtca tctcgggatc aacggaagcg acgccttcat agccggattc 600
gatcggccaa atatccgcta tgcgatcatg gaaaaggata atccacgtac gcagctgaag 660
cgcttcctga cgggtcgcga ggacgaaagc ggcatcgtct attgcctttc caaacgcaag 720
gtagatgaga cggcggcctg gctgcgtgag gaggggcgcg atgcgctgcc ctatcacgcc 780
ggcatggaca aggccgcccg cgaggcgaac cagacccact tccagcatgg tgaagctgtc 840
atcatggttg caaccgtggc tttcggtatg ggcatcgaca aaccggatgt gcgcttcgtt 900
gtgcatatcg atctgcccag cagcatcgaa gcctattatc aggaaaccgg ccgtgccggc 960
cgtgacggtc tgccgtccga cgtgcttatg ctttacggtt atgaagacat cgcattgcgc 1020
aaccgcttta tcgaagagtc ggatgcgggc gaccagcgca agaacatgga gcgccggaag 1080
ctcgatgcgt tgcttggcct cgcggaaaca gccggttgcc gtcggcgggt gcttttgtct 1140
tatttcggcg accattgtga gccctgcggc aattgcgaca cctgtgcgga gccgccggac 1200
ctgtttgatg gtgccattgc cgcgcagaag ttgctgtcct gcatttaccg cacgggagaa 1260
cgtttcggcc aggcctatgt catccgcgta ttgctgggca tggaagatga acggatatcg 1320
aactttggtc acgatcggat cacgacctac ggcatcggca aagagcacga caatcgcacc 1380
tggcgggcca tcctgcgcca gatggttgcg ctgcgcctga tcgaggttga tctggccggt 1440
cacgggggat tgtccatttc cgaagaaggg aggcggttcc tgcgcgaaaa gccgtccctg 1500
atgttgagga taccgtccgc tccccgttcg gcgcgacaac agacgaatcg caagcccacc 1560
gccattgttc taccggatgc cgatcgtagt ctctttgagg cgctgcgtgc gaagcgcatg 1620
gaaattgccc gcgcacagaa cgttccgccc tatgtgattt ttcacgacaa gacactcatt 1680
gagcttgcgg catcaagacc ggcctctgtg ggggaaatgg cgcagatacc tggagtggga 1740
gacacaaagc tggaacgata cggccctgct tttctggcgg cgatcatgga acatgccgcc 1800
agcgagtga 1809
<210> 28
<211> 602
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 28
Val Thr Thr Asp Pro Leu Gln Ile Leu Lys Thr Val Tyr Gly Tyr Asp
1 5 10 15
Thr Phe Arg Gly Gln Gln Ala Glu Ile Ile Arg His Val Met Ala Gly
20 25 30
Asn Asn Ala Phe Val Leu Met Pro Thr Gly Gly Gly Lys Ser Leu Cys
35 40 45
Tyr Gln Ile Pro Ala Leu Ala Arg Lys Gly Met Gly Leu Val Val Ser
50 55 60
Pro Leu Ile Ala Leu Met Val Asp Gln Val Ala Ala Leu Arg Gln Ala
65 70 75 80
Gly Val Arg Ala Glu Ala Leu Asn Ser Asp Leu Ser Pro Glu Glu Arg
85 90 95
Arg Ile Leu Trp Gln Asp Met Arg Ala Gly Lys Val Asp Ile Leu Tyr
100 105 110
Ala Ala Pro Glu Thr Leu Leu Lys Pro Asp Val Leu Asp Ala Leu Gln
115 120 125
Pro Ile Ser Leu Ser Leu Ile Ala Ile Asp Glu Ala His Cys Leu Ser
130 135 140
Gln Trp Gly His Asp Phe Arg Pro Pro Tyr Arg Gln Leu Asp Thr Leu
145 150 155 160
Ile Glu Arg Phe Pro Asp Thr Pro Arg Met Ala Leu Thr Ala Thr Ala
165 170 175
Asp Glu Pro Thr Arg Ala Glu Ile Leu Gly His Leu Gly Ile Asn Gly
180 185 190
Ser Asp Ala Phe Ile Ala Gly Phe Asp Arg Pro Asn Ile Arg Tyr Ala
195 200 205
Ile Met Glu Lys Asp Asn Pro Arg Thr Gln Leu Lys Arg Phe Leu Thr
210 215 220
Gly Arg Glu Asp Glu Ser Gly Ile Val Tyr Cys Leu Ser Lys Arg Lys
225 230 235 240
Val Asp Glu Thr Ala Ala Trp Leu Arg Glu Glu Gly Arg Asp Ala Leu
245 250 255
Pro Tyr His Ala Gly Met Asp Lys Ala Ala Arg Glu Ala Asn Gln Thr
260 265 270
His Phe Gln His Gly Glu Ala Val Ile Met Val Ala Thr Val Ala Phe
275 280 285
Gly Met Gly Ile Asp Lys Pro Asp Val Arg Phe Val Val His Ile Asp
290 295 300
Leu Pro Ser Ser Ile Glu Ala Tyr Tyr Gln Glu Thr Gly Arg Ala Gly
305 310 315 320
Arg Asp Gly Leu Pro Ser Asp Val Leu Met Leu Tyr Gly Tyr Glu Asp
325 330 335
Ile Ala Leu Arg Asn Arg Phe Ile Glu Glu Ser Asp Ala Gly Asp Gln
340 345 350
Arg Lys Asn Met Glu Arg Arg Lys Leu Asp Ala Leu Leu Gly Leu Ala
355 360 365
Glu Thr Ala Gly Cys Arg Arg Arg Val Leu Leu Ser Tyr Phe Gly Asp
370 375 380
His Cys Glu Pro Cys Gly Asn Cys Asp Thr Cys Ala Glu Pro Pro Asp
385 390 395 400
Leu Phe Asp Gly Ala Ile Ala Ala Gln Lys Leu Leu Ser Cys Ile Tyr
405 410 415
Arg Thr Gly Glu Arg Phe Gly Gln Ala Tyr Val Ile Arg Val Leu Leu
420 425 430
Gly Met Glu Asp Glu Arg Ile Ser Asn Phe Gly His Asp Arg Ile Thr
435 440 445
Thr Tyr Gly Ile Gly Lys Glu His Asp Asn Arg Thr Trp Arg Ala Ile
450 455 460
Leu Arg Gln Met Val Ala Leu Arg Leu Ile Glu Val Asp Leu Ala Gly
465 470 475 480
His Gly Gly Leu Ser Ile Ser Glu Glu Gly Arg Arg Phe Leu Arg Glu
485 490 495
Lys Pro Ser Leu Met Leu Arg Ile Pro Ser Ala Pro Arg Ser Ala Arg
500 505 510
Gln Gln Thr Asn Arg Lys Pro Thr Ala Ile Val Leu Pro Asp Ala Asp
515 520 525
Arg Ser Leu Phe Glu Ala Leu Arg Ala Lys Arg Met Glu Ile Ala Arg
530 535 540
Ala Gln Asn Val Pro Pro Tyr Val Ile Phe His Asp Lys Thr Leu Ile
545 550 555 560
Glu Leu Ala Ala Ser Arg Pro Ala Ser Val Gly Glu Met Ala Gln Ile
565 570 575
Pro Gly Val Gly Asp Thr Lys Leu Glu Arg Tyr Gly Pro Ala Phe Leu
580 585 590
Ala Ala Ile Met Glu His Ala Ala Ser Glu
595 600
<210> 29
<211> 606
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 29
atggcaaaac gagtcaccgg tcccgaaatc gaaaaactga tccagctgct tgcaaaagtg 60
ccggggcttg ggccccgctc ggcgcggcgg gcggcgctgc atctcatcaa gaagaaggaa 120
cagcttcttg gaccgctggg ccacgcgatg ggtgaagcct atgacaaggt gaagatctgc 180
tcgtgctgcg gcaatgtcga taccatcgat ccctgcacgg tctgcgccga tgatagacgt 240
gaccagtcgg tcatcatcgt ggtggaagac gtgtcggatc tgtgggcgct ggagcgagca 300
ggcgcaatga ataccgcata tcatgtgctt ggtggcacgc tatcgccgct cgatggcgtc 360
gggccggaag atctgaacat caagggactg atcgatcgcg tcagcgccgg cggtattcgc 420
gagctcatca tcgccgtcaa tgcgacggtg gagggacagg caacagccca ttacatcacc 480
gaccgcctgg ccgatctcgg catcaagatc acccggcttg cgcatggcgt gcctgttggc 540
ggcgagctgg actatctcga cgagggcaca ttgacggcgg cgctgcgcgc tcgcacaacg 600
atctga 606
<210> 30
<211> 201
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 30
Met Ala Lys Arg Val Thr Gly Pro Glu Ile Glu Lys Leu Ile Gln Leu
1 5 10 15
Leu Ala Lys Val Pro Gly Leu Gly Pro Arg Ser Ala Arg Arg Ala Ala
20 25 30
Leu His Leu Ile Lys Lys Lys Glu Gln Leu Leu Gly Pro Leu Gly His
35 40 45
Ala Met Gly Glu Ala Tyr Asp Lys Val Lys Ile Cys Ser Cys Cys Gly
50 55 60
Asn Val Asp Thr Ile Asp Pro Cys Thr Val Cys Ala Asp Asp Arg Arg
65 70 75 80
Asp Gln Ser Val Ile Ile Val Val Glu Asp Val Ser Asp Leu Trp Ala
85 90 95
Leu Glu Arg Ala Gly Ala Met Asn Thr Ala Tyr His Val Leu Gly Gly
100 105 110
Thr Leu Ser Pro Leu Asp Gly Val Gly Pro Glu Asp Leu Asn Ile Lys
115 120 125
Gly Leu Ile Asp Arg Val Ser Ala Gly Gly Ile Arg Glu Leu Ile Ile
130 135 140
Ala Val Asn Ala Thr Val Glu Gly Gln Ala Thr Ala His Tyr Ile Thr
145 150 155 160
Asp Arg Leu Ala Asp Leu Gly Ile Lys Ile Thr Arg Leu Ala His Gly
165 170 175
Val Pro Val Gly Gly Glu Leu Asp Tyr Leu Asp Glu Gly Thr Leu Thr
180 185 190
Ala Ala Leu Arg Ala Arg Thr Thr Ile
195 200
<210> 31
<211> 591
<212> DNA
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 31
atgaccgatg attccagccc cttcctgacc gacgacatgg cactggatgg cgaaacgcag 60
gctatcgaac ccaccagccg catgctgtca tgggcgcgca attccgctct ctaccggctg 120
gaacagcgca tgatgacgga aaagcagctg cgcgatgcga tcacccgcaa ggcgcgggaa 180
aaattcgagg atatcagccc cgctcagata aaggcgcttg gcgaattcgc cgtgaccttc 240
gcctatggca tcaaggcgct cgacgatacg gcttatgcag aaattgccgt gcgaagtggc 300
cagcgcagcg gcaagtcgaa gcgcgggctt gcgcagaaac ttcagatcaa gggcattgat 360
cgggaaacgg ccgcagtcgc actgcaggaa accaacgatc tggtggcggc cgtcatcttt 420
gcgcgcaagc gcgccttcgg tccctttcgc cgtgtcgagc ttgatgaaaa acgcaagtcg 480
aaggaatttt ctgccttcgc ccgcaacggc ttcggcttcg aaatcggcgc gaaggtgatg 540
gcgatgacgg tggaagaggc agaagagatc gtctcggaag caccgcttta a 591
<210> 32
<211> 196
<212> PRT
<213> 根癌土壤杆菌(Agrobacterium tumefaciens)
<400> 32
Met Thr Asp Asp Ser Ser Pro Phe Leu Thr Asp Asp Met Ala Leu Asp
1 5 10 15
Gly Glu Thr Gln Ala Ile Glu Pro Thr Ser Arg Met Leu Ser Trp Ala
20 25 30
Arg Asn Ser Ala Leu Tyr Arg Leu Glu Gln Arg Met Met Thr Glu Lys
35 40 45
Gln Leu Arg Asp Ala Ile Thr Arg Lys Ala Arg Glu Lys Phe Glu Asp
50 55 60
Ile Ser Pro Ala Gln Ile Lys Ala Leu Gly Glu Phe Ala Val Thr Phe
65 70 75 80
Ala Tyr Gly Ile Lys Ala Leu Asp Asp Thr Ala Tyr Ala Glu Ile Ala
85 90 95
Val Arg Ser Gly Gln Arg Ser Gly Lys Ser Lys Arg Gly Leu Ala Gln
100 105 110
Lys Leu Gln Ile Lys Gly Ile Asp Arg Glu Thr Ala Ala Val Ala Leu
115 120 125
Gln Glu Thr Asn Asp Leu Val Ala Ala Val Ile Phe Ala Arg Lys Arg
130 135 140
Ala Phe Gly Pro Phe Arg Arg Val Glu Leu Asp Glu Lys Arg Lys Ser
145 150 155 160
Lys Glu Phe Ser Ala Phe Ala Arg Asn Gly Phe Gly Phe Glu Ile Gly
165 170 175
Ala Lys Val Met Ala Met Thr Val Glu Glu Ala Glu Glu Ile Val Ser
180 185 190
Glu Ala Pro Leu
195

Claims (38)

1.根癌土壤杆菌的修饰菌株,其中所述修饰的菌株相对于其亲本菌株在遗传重组途径中有缺陷。
2.权利要求1的修饰菌株,其中所述菌株在至少一种选自下组的重组途径中有缺陷:RecA,RecB,RecD,RecF,RecG,RecJ,RecN,RecO,RecQ,RecR和RecX。
3.权利要求2的修饰菌株,其中所述菌株在RecA活性中有缺陷。
4.权利要求2的修饰菌株,其中所述recA基因包含与SEQ ID NO:10或11具有至少85%序列同一性的多核苷酸序列。
5.权利要求3的修饰菌株,其中所述菌株还在选自下组的活性中有缺陷:RecB,RecD,RecF,RecG,RecJ,RecN,RecO,RecQ,RecR和RecX。
6.权利要求3的修饰菌株,其中基因组recA基因通过该recA基因中的序列的缺失、重排或插入而被修饰。
7.权利要求3的修饰菌株,其中基因组recA基因通过缺失包含该recA基因的基因组序列而被修饰。
8.权利要求3的修饰菌株,其中基因组recA基因通过在该recA基因内插入序列而被修饰,从而破坏RecA蛋白的表达。
9.权利要求8的修饰菌株,其中插入的序列包含选择标志物基因。
10.权利要求9的修饰菌株,其中所述选择标志物包含抗生素抗性基因,所述抗生素抗性基因选自下组:氯霉素抗性基因,卡那霉素抗性基因,壮观霉素抗性基因,庆大霉素抗性,或其组合。
11.权利要求3的修饰菌株,其中在从该菌株制备的提取物中检测不到RecA活性。
12.权利要求3的修饰菌株,其中使用Western印迹分析检测不到RecA蛋白。
13.权利要求3的修饰菌株,其中使用Northern印迹分析检测不到RecA mRNA。
14.权利要求3的修饰菌株,其中使用Southern印迹分析检测不到recA基因。
15.权利要求4的修饰菌株,其中所述recA基因编码SEQ ID NO:的蛋白质。
16.权利要求1的修饰菌株,其中所述菌株包含Ti质粒。
17.权利要求16的修饰菌株,其中所述Ti质粒包含pAL4404Ti质粒,或衍生自pAL4404Ti质粒。
18.权利要求1的修饰菌株,其中所述菌株包含二元质粒。
19.权利要求18的修饰菌株,其中所述二元质粒包含农艺性状的基因,所述农艺性状选自下组:杀虫抗性性状、除草剂耐受性状、氮利用效率性状、水分利用效率性状、营养品质性状、DNA结合性状、选择标志物性状、及其组合。
20.权利要求1的修饰菌株,其中所述菌株包含三元质粒。
21.权利要求1的修饰菌株,其中所述亲本菌株是根癌土壤杆菌(LBA4404)。
22.一种包含来自根癌土壤杆菌的经修饰的recA基因的质粒,其中所述recA基因在修饰前与SEQ ID NO:10或11具有至少85%序列同一性,并且所述经修饰的recA基因在RecA蛋白的表达中有缺陷。
23.权利要求22的质粒,其中所述修饰包括在recA基因或SEQ ID NO:10或11内插入供体序列。
24.权利要求23的质粒,其中所述供体序列包含选择标志物基因。
25.权利要求24的质粒,其中所述选择标志物基因包含抗生素抗性基因,所述抗生素抗性基因选自下组:氯霉素抗性基因,卡那霉素抗性基因,壮观霉素抗性基因,庆大霉素抗性,或其组合。
26.权利要求23的质粒,其中所述供体序列的至少一个末端至少被SEQ ID NO:10或11的43个碱基对的片段所侧翼。
27.一种产生相对于其亲本菌株在基因重组途径有缺陷的根癌土壤杆菌菌株的方法,包括:
(a)提供针对所述recA基因的敲除质粒;
(b)将该敲除质粒导入根癌土壤杆菌菌株;
(c)选择和筛选包含基因组突变的菌落;和,
(d)鉴定至少一种具有recA基因组突变的突变的根癌土壤杆菌。
28.权利要求27的方法,其中所述recA基因与SEQ ID NO:10或11具有至少85%序列同一性。
29.权利要求27的方法,其中所述敲除质粒诱导突变,所述突变选自下组:基因组缺失,基因组重排,基因组插入,及其组合。
30.权利要求29的方法,其中所述基因组插入包含编码选择标志物的序列。
31.权利要求30的方法,其中所述选择标志物基因包含抗生素抗性基因,所述抗生素抗性基因选自下组:氯霉素抗性基因,卡那霉素抗性基因,壮观霉素抗性基因,庆大霉素抗性,或其组合。
32.一种转基因事件,包括
(a)T链插入物,其被上游基因组DNA边界序列所侧翼,和
(b)下游基因组DNA边界序列,
其中所述转基因事件包括来自根癌土壤杆菌的修饰菌株的T链的整合,所述修饰菌株相对于其亲本菌株在遗传重组途径中有缺陷。
33.权利要求32的转基因事件,其中来自根癌土壤杆菌的修饰菌株的T链整合在用于再生该转基因事件的目标植物细胞的基因组内。
34.权利要求32的转基因事件,其还包括农艺性状。
35.权利要求34的转基因事件,其中所述农艺性状选自下组:杀虫抗性,除草剂耐受性状,氮利用效率性状,水分利用效率性状,营养品质性状,DNA结合性状,选择标志物性状,及其组合。
36.权利要求32的转基因事件,其中所述转基因事件是双子叶植物或单子叶植物。
37.一种产生转基因植物的方法,包括:
(a)使目标植物细胞与根癌土壤杆菌的修饰菌株接触,所述修饰菌株相对于其亲本菌株在遗传重组途径中有缺陷;
(b)选择和筛选这样的植物细胞,所述植物细胞包含整合到目标植物细胞的基因组中的来自所述土壤杆菌菌株的DNA;和
(c)从在步骤(b)中选择/筛选的植物细胞再生完整的转基因植物。
38.权利要求37的方法,其中所述选择步骤使用包含抗生素抗性基因的选择标志物来进行,所述抗生素抗性基因选自下组:氯霉素抗性基因,卡那霉素抗性基因,壮观霉素抗性基因,庆大霉素抗性,或其组合。
CN201580059462.3A 2014-09-04 2015-09-03 用于重组土壤杆菌基因缺陷菌株的方法和组合物 Pending CN107075528A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462045947P 2014-09-04 2014-09-04
US62/045,947 2014-09-04
PCT/US2015/048273 WO2016036923A1 (en) 2014-09-04 2015-09-03 Methods and compositions for recombination a gene-deficient strains of agrobacterium tumefaciens

Publications (1)

Publication Number Publication Date
CN107075528A true CN107075528A (zh) 2017-08-18

Family

ID=55436960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580059462.3A Pending CN107075528A (zh) 2014-09-04 2015-09-03 用于重组土壤杆菌基因缺陷菌株的方法和组合物

Country Status (12)

Country Link
US (1) US9765350B2 (zh)
EP (1) EP3189144A4 (zh)
JP (1) JP2017527292A (zh)
KR (1) KR20170044742A (zh)
CN (1) CN107075528A (zh)
AU (1) AU2015311918A1 (zh)
BR (1) BR102015021321A2 (zh)
CA (1) CA2959646A1 (zh)
IL (1) IL250915A0 (zh)
MX (1) MX2017002867A (zh)
PH (1) PH12017500410A1 (zh)
WO (1) WO2016036923A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105886632A (zh) * 2016-05-10 2016-08-24 四川农业大学 一种禾谷镰刀菌中亚油酸合成酶基因功能的研究方法
CN113201555A (zh) * 2021-04-01 2021-08-03 云南师范大学 一种含有eGFP标记和潮霉素抗性双元载体的构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012016222A2 (en) * 2010-07-29 2012-02-02 Dow Agrosciences Llc Strains of agrobacterium modified to increase plant transformation frequency

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3868730A (en) 1973-09-24 1975-03-04 Howmedica Knee or elbow prosthesis
CH632151A5 (de) 1978-10-06 1982-09-30 Sulzer Ag Endoprothese fuer ein kniegelenk.
US5147405A (en) 1990-02-07 1992-09-15 Boehringer Mannheim Corporation Knee prosthesis
US6117175A (en) 1994-08-22 2000-09-12 Bosredon; Jean Spherical knee joint prosthesis
EP0847445B1 (en) * 1995-08-30 2006-06-07 BASF Plant Science GmbH STIMULATION OF HOMOLOGOUS RECOMBINATION IN plant ORGANISMS OR CELLS BY RECOMBINATION PROMOTING ENZYMES
AU2003299851B2 (en) 2002-12-20 2009-12-10 Smith & Nephew, Inc. High performance knee prostheses
US20040220675A1 (en) 2003-04-30 2004-11-04 Lewis Ralph Harrison Total elbow replacement for dogs
WO2010037714A1 (en) * 2008-09-30 2010-04-08 Basf Plant Science Gmbh Method for producing a transgenic plant cell, a plant or a part thereof with increased resistance biotic stress

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012016222A2 (en) * 2010-07-29 2012-02-02 Dow Agrosciences Llc Strains of agrobacterium modified to increase plant transformation frequency

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUO MIN-LIANG等: "Development and Optimization of Method for Generating Unmarked A. tumefaciens Mutants", 《生物化学与生物物理进展》 *
HENKEL,C.V.等: "GenBank:CP007225", 《NCBI》 *
WOOD等,: "GenBank:AE007869", 《NCBI》 *

Also Published As

Publication number Publication date
BR102015021321A2 (pt) 2016-09-20
WO2016036923A1 (en) 2016-03-10
US20160068851A1 (en) 2016-03-10
KR20170044742A (ko) 2017-04-25
MX2017002867A (es) 2017-05-30
IL250915A0 (en) 2017-04-30
JP2017527292A (ja) 2017-09-21
EP3189144A1 (en) 2017-07-12
EP3189144A4 (en) 2019-02-20
AU2015311918A1 (en) 2017-03-23
CA2959646A1 (en) 2016-03-10
US9765350B2 (en) 2017-09-19
PH12017500410A1 (en) 2017-07-17

Similar Documents

Publication Publication Date Title
RU2687369C2 (ru) Универсальная донорная система для направленного воздействия на гены
KR102240135B1 (ko) 부위 특이적 뉴클레아제 활성에 대한 dna 검출 방법
EP4279496A2 (en) Rapid targeting analysis in crops for determining donor insertion
CN107119060A (zh) 草甘膦抗性植物和相关方法
CN110041416B (zh) GmABCA9基因在提高大豆蛋白含量和粒重中的应用
AU2017265034B2 (en) Cytokinin synthase enzymes, constructs, and related methods
CN101981051A (zh) 参与非生物胁迫耐受的转录激活因子
CN109929019A (zh) 一种与植物耐盐碱相关蛋白GsERF7及其编码基因与应用
CN107075528A (zh) 用于重组土壤杆菌基因缺陷菌株的方法和组合物
CN105792642A (zh) 大豆转化方法
US20210010016A1 (en) Plants with altered production of biomass constituents and methods of use
CN103562392B (zh) 植物细胞中草甘膦抗性编码核酸分子的优化表达
US20160319291A1 (en) Use of agrobacterium vir genes in plasmids
KR101820069B1 (ko) 파이토케미칼 함량이 증가된 형질전환 식물체 및 이의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170818

WD01 Invention patent application deemed withdrawn after publication