CN1157478C - 改进的芽孢杆菌rna酶抑制剂基因 - Google Patents

改进的芽孢杆菌rna酶抑制剂基因 Download PDF

Info

Publication number
CN1157478C
CN1157478C CNB971913412A CN97191341A CN1157478C CN 1157478 C CN1157478 C CN 1157478C CN B971913412 A CNB971913412 A CN B971913412A CN 97191341 A CN97191341 A CN 97191341A CN 1157478 C CN1157478 C CN 1157478C
Authority
CN
China
Prior art keywords
dna
barstar
seq
gene
promotor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB971913412A
Other languages
English (en)
Other versions
CN1218509A (zh
Inventor
F
F·米基尔斯
M·威廉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer CropScience SA
Original Assignee
Bayer Bioscience NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer Bioscience NV filed Critical Bayer Bioscience NV
Publication of CN1218509A publication Critical patent/CN1218509A/zh
Application granted granted Critical
Publication of CN1157478C publication Critical patent/CN1157478C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

在真核细胞中,特别是在植物细胞中,和尤其是在雄蕊细胞例如毡绒层细胞中,高产量地产生芽孢杆菌RNA酶抑制剂蛋白质的改进的芽孢杆菌RNA酶抑制剂DNA,例如合成的芽孢杆菌RNA酶抑制剂DNA。合成的芽孢杆菌RNA酶抑制剂DNA具有低于40%的A和T核苷酸。其他改进的芽孢杆菌RNA酶抑制剂DNA编码改进的芽孢杆菌RNA酶抑制剂蛋白质,所述蛋白质具有以Met-Xaa开头的N-末端,其中Xaa是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。植物细胞和植物含有改进的芽孢杆菌RNA酶抑制剂DNA和/或表达改进的芽孢杆菌RNA酶抑制剂蛋白质。

Description

改进的芽孢杆菌RNA酶抑制剂基因
本发明涉及改进的芽孢杆菌RNA酶抑制剂基因和改进的芽孢杆菌RNA酶抑制剂蛋白质,所述蛋白质能够用于中和真核细胞,特别是植物细胞中芽孢杆菌RNA酶的活性。因此可以将改进的芽孢杆菌RNA酶抑制剂基因用于生产可育的恢复系植物,所述植物能够使雄性不育系植物恢复繁殖力,所述雄性不育植物在其细胞的核基因组中含有包括雄蕊选择性启动子和编码芽孢杆菌RNA酶的DNA的嵌合基因。本发明还涉及在其细胞的核基因组中含有改进的芽孢杆菌RNA酶抑制剂基因的恢复系植物。
发明背景
在许多植物中,如果不是大多数植物,开发杂种栽培品种是非常令人满意的,因为通常由于杂种优势,杂种栽培品种的生产能力增强:与其亲本相比杂种个体具有优势性能(参见例如Fehr,1987,栽培品种研制的原理,第一卷:理论和技术,MacMillan出版公司,纽约;Allard,1960,植物育种原理,John Wiley and Sons,Inc.)。
各个植物种类的杂种栽培品种的研制取决于亲本之间获得几乎完全的交叉授粉的能力。达到这一目的最简单的方法是通过去除花药以手工的方式,或通过利用在一个亲本的细胞质或核基因中阻止花药和/或花粉发育(植物雄性不育的综述,参见例如Kaul,1988,‘高等植物的雄性不育’,Springer Verlag)而从遗传上使亲本品系之一雄性不育(即使它们处于没有花粉或花粉没有功能的状态下)。
对于其种子是收获的产品(例如玉米,油菜)的杂种植物,大多数情况下,确保完全恢复杂种植物的繁殖力也是必要的。在雄性不育处于遗传控制下的系统,需要存在和应用能够恢复雄性不育的基因。杂种栽培品种的研制主要取决于是否可获得合适的和有效的不育和恢复基因。
对于大多数可能含有影响雄性不育的基因型的植物品系,内源性核基因座是已知的,并且通常,对于特定的隐性等位基因这样的基因座必须是纯合的,以便产生雄性不育表现型。在这样的基因座显性“雄性能育”等位基因的存在导致产生雄性可育。
近来,已经证明通过给植物基因组提供包括编码例如细胞毒性产物(例如RNA酶)的DNA序列(或雄性不育DNA)并且处于启动子控制下的嵌合雄性不育基因能够在植物中诱导雄性不育,其中启动子在选定的雄性可再生器官的细胞中具有优势的活性。关于这一点,已经证明雄蕊选择性启动子,例如烟草的TA29基因的启动子特别适用于此目的(Mariani等人,1990,自然学347:737,欧洲专利公开(EP 0,344,029)。通过给植物的核基因组提供这样的雄性不育基因,制备了人工的雄性不育基因座,它含有导致产生雄性不育植物的人工的雄性不育基因型。
另外,已经证明用包括另一个DNA序列的嵌合的能育性-恢复基因(或能育性-恢复DNA)能够恢复雄性可育,所述能育性-恢复基因编码例如在植物细胞中抑制细胞毒性产物的活性的蛋白质或阻止细胞毒性产物的活化的蛋白质(欧洲专利公开(EP 0,412,911)。例如解淀粉芽孢杆菌的芽孢杆菌RNA酶基因编码RNA酶,芽孢杆菌RNA酶,该酶受蛋白质,芽孢杆菌RNA酶抑制剂的抑制,它是由解淀粉芽孢杆菌的芽孢杆菌RNA酶抑制剂基因编码的。芽孢杆菌RNA酶基因可用于构建一个不育的基因,而芽孢杆菌RNA酶抑制剂基因可用于构建可育-恢复基因。在不同的植物品系,例如油菜中进行的试验已经证明嵌合的芽孢杆菌RNA酶抑制剂基因完全能够恢复雄性不育系的雄性繁殖力,其中雄性不育系的雄性不育是由于存在嵌合的芽孢杆菌RNA酶抑制剂基因(EP 0,412,911,Mariani等人,1991,CCIRC油菜会议的会议录,1991年,7月9-11日,Saskatoon,Saskatchewan,加拿大;Mariani等人,1992,自然学357:384)。通过偶合一个标记基因,例如显性的除草剂抗性基因(例如编码膦苏菌素乙酰转移酶(PAT)的bar基因,所述PAT将除草剂膦苏菌素转化为非毒性的化合物[De Block等人,1987,EMBO J.6:2513]),利用嵌合的雄性不育和/或可育-恢复基因,可以给育种系统提供选择雄性不育植物的均一的群体的方法(EP 0,344,029;EP 0,412,911)。
任何植物种类的特定的栽培品种的杂种种子的生产要求:1)保持少量的各个自交系亲本的纯种子,和2)制备大量的各个自交系亲本的种子。通常通过几个(通常是两个)种子繁殖循环,从少量的纯种子(“基本种子”)开始,并且在各个繁殖循环中产生大量的自交系亲本的纯种子,最后产生自交系亲本的母本种子(“亲本种子”或“基本种子”),能够获得这样大量的种子,所述母本种子的量足以在种植以后产生所需量的杂种种子。当然,在各个种子繁殖循环中需要较大的种植面积(大田)。
芽孢杆菌RNA酶是一种由解淀粉芽孢杆菌分泌的核糖核酸酶,芽孢杆菌RNA酶抑制剂是由该相同的微生物产生的芽孢杆菌RNA酶的抑制剂(Hartley,1988,分子生物学杂志202:913-915)。已经有人描述了几种突变的芽孢杆菌RNA酶和芽孢杆菌RNA酶抑制剂蛋白质(Hartley,1993,生物化学32:5978-5984;Schreiber and Fersht,1993,生物化学32:5145-5150;Guillet等人,1993,现代生物学1:165-177;Hartley,1989,TIBS 14:450-454;Axe等人,1996,PNAS 93:5590-5594;Serrano,1993,分子生物学杂志233:305-312)。已证明其中某些突变体基本上保留了由解淀粉芽孢杆菌产生的芽孢杆菌RNA酶和芽孢杆菌RNA酶抑制剂的生物学活性。但是,至少已经描述了两种突变的芽孢杆菌RNA酶抑制剂,它们没有可检测的芽孢杆菌RNA酶抑制剂活性(Hartley,1993,生物化学32:5978-5984;Guillet等人,1993,现代生物学1:165-177)。
还已知其他相关的微生物能够产生与芽孢杆菌RNA酶抑制剂和芽孢杆菌RNA酶高度类似的蛋白质。因此,Bacillus tntermedius产生binase和binstar(Schulga等人,1992,NAR 20:2375;Guillet等人,1993,见上文)。
发明概述
本发明涉及改进的芽孢杆菌RNA酶抑制剂DNA,它编码具有以Met-Xaa开头的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中Xaa是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。优选的是芽孢杆菌RNA酶抑制剂DNA编码具有下列氨基酸序列的芽孢杆菌RNA酶抑制剂,所述氨基酸序列是1)SEQ ID No 2的氨基酸序列,其中第二个氨基酸不是赖氨酸,而是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸;2)SEQ ID No 4的氨基酸序列;或SEQ ID No 4的氨基酸序列,其中第二个氨基酸不是丙氨酸,而是缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
本发明还提供了改进的合成芽孢杆菌RNA酶抑制剂DNA,它含有低于40%的A和T核苷酸和/或具有对油菜籽,棉花,玉米,水稻和小麦,优选的是油菜籽,玉米,水稻最佳的惯用密码子。优选的是合成的芽孢杆菌RNA酶抑制剂DNA含有不高于7%CG双核苷酸和/或不高于9.5%的CNG三核苷酸。优选的合成的芽孢杆菌RNA酶抑制剂DNA编码具有SEQID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂。特别优选的合成的芽孢杆菌RNA酶抑制剂DNA具有SEQ ID No 3的核苷酸序列。
本发明还提供了:嵌合基因,其中改进的芽孢杆菌RNA酶抑制剂DNA可操作连接到植物可表达启动子上,优选的是选择性地在雄蕊细胞中指导表达和至少在毡绒层细胞中指导表达的启动子;含有这些嵌合基因的植物细胞和植物。
本发明进一步提供了改进的芽孢杆菌RNA酶抑制剂DNA和改进的芽孢杆菌RNA酶抑制剂蛋白质在中和植物细胞中芽孢杆菌RNA酶中的应用,特别是关于雄性可育恢复为雄性不育系的应用。
本发明还提供了具有以Met-Xaa开头的氨基酸序列的改进的芽孢杆菌RNA酶抑制剂,其中Xaa是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
发明详述
本文使用的雄性不育(“ms”)植物是给定的植物种类的植物,它是由于一种整合到所述植物的核DNA的嵌合的雄性不育基因(S)的表达而导致的雄性不育植物,其中所述的嵌合基因包括下列可操作连接的DNA片段:
1)“不育性启动子”,它选择性地在雄蕊细胞,优选的是至少在毡绒层细胞中指导表达,和
2)“雄性不育DNA”,它编码芽孢杆菌RNA酶(“芽孢杆菌RNA酶DNA”)。
所述雄性不育基因的一个例子是包括处于来自于烟草的TA29基因的启动子,例如包含于质粒pVE108(WO92/29696)中的启动子的控制下的芽孢杆菌RNA酶DNA的基因。
本文描述的恢复系植物是相同植物种类的雄性可育植物,它含有整合到其细胞的核DNA中的一个可育的恢复基因(R),包括
1)“恢复启动子”,它指导至少那些雄蕊细胞中的表达,其中不育性启动子指导ms植物的芽孢杆菌RNA酶DNA的表达,和,
2)编码芽孢杆菌RNA酶抑制剂的“恢复DNA”(“芽孢杆菌RNA酶抑制剂DNA”)。
对于本发明的恢复系植物,芽孢杆菌RNA酶抑制剂DNA是改进的芽孢杆菌RNA酶抑制剂DNA,如下文所述。
在含有雄性不育基因的雄性不育植物的那些子代植物中存在的可育性的恢复基因使那些子代植物恢复雄性繁殖力。当然子代植物是从雄性不育植物和恢复系植物之间的杂交获得的。
本文使用的恢复系植物是指雄性可育的并且其基因组内含有雄性不育基因和可育性-恢复基因,特别是包括本发明的改进的芽孢杆菌RNA酶抑制剂DNA的可育性恢复基因的植物(其与雄性不育植物和恢复系植物是相同的植物种类)。
品系是指给定的单个植物的子代。给定的品系的植物其一个或多个特定的遗传和/或表现型特性是互相类似的。如本文所述,雄性不育(ms)系是一组属于一个植物种类,特别是一个植物品种的植物,由于在相同的遗传基因座存在特定的雄性不育基因,它们都是雄性不育的。类似地,恢复系是指一组在相同的遗传基因座都含有特定的可育性恢复基因的植物种类的植物。优选的是所有的ms品系的植物(各自的恢复系)就雄性不育基因座(各自的可育性恢复基因座)而言具有相同的基因型。
通过在ms品系导入可育性恢复基因,例如通过将ms品系的植物与恢复系植物杂交以便至少某些子代植物是恢复的植物,可以使雄性不育系恢复为雄性可育。
一个品种的品系的遗传背景命名为存在于该品种中的基因的总数,所述基因总数决定该品种的特定的表现型特性。因此,可以将通过遗传工程手段导入而产生一个品种的特定的品系的外源基因例如雄性不育基因或恢复基因导入到不同的品种(或甚至不同的种类)中,各个品种具有不同的遗传背景。
为了生产杂种种子,也将雄性不育系称作为雌性或第一亲系,还将雄性可育(恢复)系称作为雄性或第二亲系。
本文所述的基因通常被理解为包括至少一个编码RNA,蛋白质或多肽的编码区,该编码区可操作连接到合适的启动子和3’调控序列上。
为了本发明的目的,基因的表达例如嵌合基因的表达是指基因的启动子指导DNA转录为具有生物学活性的RNA,即所述RNA能够与另一个RNA或蛋白质互相作用,或能够被转译为生物学活性的多肽或蛋白质。
表现型是基因型即一个基因或一组基因的表达(或表达不足)的外部形态(例如雄性不育,在特定的植物组织存在蛋白质或RNA等等)。
本文使用的芽孢杆菌RNA酶是能够降解单链RNA的任何蛋白质,并且它包括由解淀粉芽孢杆菌分泌的芽孢杆菌RNA酶(分泌的芽孢杆菌RNA酶)的氨基酸序列(Hartley,1988,分子生物学杂志202:913)或包括与该序列至少具有80%,优选的是至少85%的序列等同性的氨基酸序列。本文使用的芽孢杆菌RNA酶能够通过一个反应降解RNA,所述反应涉及将一个核苷酸的5’核糖和结合到邻近的3’核苷酸上的磷酸基团之间的磷酸二酯键进行初始的裂解。该反应的初始产物是2’,3’-环状的磷酸中间体,随后该中间体被水解为相应的3’核苷磷酸。芽孢杆菌RNA酶也能够将聚乙烯醇腺苷磷酸以产生高荧光团的核苷酸类似物1,N-乙烯醇腺苷(Fitzgerald和Hartley,1993,生化分析214:544-547)并且按照标准条件的测定,具有10%,优选的是至少50%,特别是至少75%的分泌的芽孢杆菌RNA酶的活性(Fitzgerald和Hartley,1993,生化分析214:544-547;Hartley,1993,生物化学32:5978-5984)。芽孢杆菌RNA酶进一步能够特异性地结合到野生型芽孢杆菌RNA酶抑制剂(参见下文),其离解常数为10-12M或更低,优选的是离解常数为10-13M-10-14M的范围内(Schreiber和Fersht,1993,生物化学32:5145-5150;Hartley,1993,生物化学32:5978-5984)。Binase是由Bacillus intermedius分泌的胞外核糖核酸酶(Schulga等人,1992,NAR20:2375)并且还被认为是用于本发明的芽孢杆菌RNA酶。
为了方便起见,用于说明书或下文的实施例中的芽孢杆菌RNA酶命名为具有由pVE108编码的芽孢杆菌RNA酶的氨基酸序列(WO92/09696)。
芽孢杆菌RNA酶抑制剂是能够与分泌的芽孢杆菌RNA酶特异性结合的任何蛋白质,其解离常数为10-12M或更低,优选的是离解常数为10-13M-10-14M的范围内(Schreiber和Fersht,1993,生物化学32:5145-5150;Hartley,1993,生物化学32:5978-5984)。在标准条件以及等摩尔量的芽孢杆菌RNA酶抑制剂和分泌的芽孢杆菌RNA酶的混合物时,芽孢杆菌RNA酶抑制剂能够抑制至少50%,特别是至少75%,更特别是至少90%的分泌的芽孢杆菌RNA酶的活性(Hartley,1993,生物化学32:5978-5984)。芽孢杆菌RNA酶抑制剂是包括SEQ ID No 2的氨基酸序列或与具有该序列至少80%,优选的是至少85%的序列等同性。野生型的芽孢杆菌RNA酶抑制剂是由解淀粉芽孢杆菌产生的芽孢杆菌RNA酶抑制剂并且具有SEQ ID No 2的氨基酸序列(也参见Hartley,1988,分子生物学杂志202:913)。不用置疑本文使用的芽孢杆菌RNA酶抑制剂包括例如由Hartley描述的生物学活性芽孢杆菌RNA酶抑制剂突变体(1993,生物化学32:5978-5984)。
本文使用的芽孢杆菌RNA酶DNA(或芽孢杆菌RNA酶编码序列)是具有编码芽孢杆菌RNA酶的核苷酸序列的任何DNA片段。特别优选的芽孢杆菌RNA酶DNA是存在于pVE108的芽孢杆菌RNA酶DNA(WO92/09696)。芽孢杆菌RNA酶基因是植物可表达的嵌合基因,它包括可操作连接到合适的5’和3’调节区和包括植物聚腺苷酸化位点的3’区域的芽孢杆菌RNA酶DNA,所述调节区即包括由植物细胞的聚合酶识别的启动子的启动子区域。
本文使用的芽孢杆菌RNA酶抑制剂DNA(或芽孢杆菌RNA酶抑制剂编码序列)是具有编码芽孢杆菌RNA酶抑制剂的核苷酸序列的任何DNA片段。野生型芽孢杆菌RNA酶抑制剂DNA是编码野生型芽孢杆菌RNA酶抑制剂的DNA,它具有SEQ ID No 1的核苷酸序列(Hartley,1988,分子生物学杂志202:913)。芽孢杆菌RNA酶抑制剂基因是植物可表达的嵌合基因,它包括可操作连接到合适的5’和3’调节区和包括植物聚腺苷酸化位点的3’区域的芽孢杆菌RNA酶抑制剂DNA,所述调节区即包括由植物细胞的聚合酶识别的启动子的启动子区域。
如本文使用的,遗传基因座是在植物的核基因组,即在特定的染色体中的给定的基因的位置。两个基因座可以是在不同的染色体上,并且将独立分离。两个基因座可以位于相同的染色体上,那么通常被认为联锁(除非它们之间两个出现足够的重组)。
内源性基因座是天然存在于植物中的基因座。外源性基因座是由于借助于遗传转化导入外源DNA而在植物中形成的基因座。
在二倍体植物中,如在任何其它二倍体生物体中,两个拷贝的基因存在于任何常染色体的基因座。任何基因可以以几个变异状态存在于核基因组称作为等位基因。如果两个相同的等位基因存在于一个基因座,该基因座被称作为纯合子,如果存在不同的等位基因,该基因座称作为杂合子。一个基因座,或一套基因座的等位基因的组成是基因型。通常在一个基因座的任何等位基因以独立的标记表示(例如R和-,S和-,-代表没有基因)。通常外源基因座的特征在于存在和/或没有外源DNA。通常显性等位基因的特征为以大写字母表示,通常与生物学活性基因产物(例如蛋白质)和可观察到的表现型效果(例如R表示活性芽孢杆菌RNA酶抑制剂蛋白质的产生)的存在相关。
通过鉴别至少一个遗传基因座的等位基因状态能够对植物的遗传状态进行定性。
由存在于该基因座的两个等位基因的标记(例如R/R或S/-)命名任何给定的基因座的基因型。两个不连接的基因座的基因型能够表示为各个基因座的基因型的序列(例如S/-,R/-)
本文使用的术语雄性不育植物包含外源的“雄性不育基因座”,它含有雄性不育基因S,当该基因在植物细胞中表达时,使植物雄性不育,基本上不影响植物的生长和发育。
优选的是雄性不育基因座在相同的遗传基因座还包括至少一个第一标记基因,所述基因至少包括:
1)编码第一标记RNA,蛋白质或多肽的第一标记DNA,当至少存在于植物的特定的组织或特定的细胞中时,使植物易于与其它植物分离,所述其它植物至少在特定的组织或特定的细胞中不含有由第一标记DNA编码的第一标记RNA,蛋白质或多肽,和
2)能够指导第一标记DNA至少在特定的组织或特定的细胞中表达的第一标记启动子;第一标记DNA是相同于第一标记启动子和受其控制的转录单位。
所述雄性不育基因在这样的外源雄性不育基因座总是显性等位基因。隐性等位基因对应于在植物的核基因组中没有存在雄性不育基因。
以前已经描述了在本发明的第一亲代品系的雄性不育基因中可以使用的不育启动子(EP 0,344,029和EP0,412,911)。不育启动子可以是任何启动子,但是它至少应该在雄蕊细胞中是有活性的,特别是在毡绒层细胞中。特别有用的不育启动子是在雄蕊细胞中有选择性活性的,例如烟草的TA29基因的特异于毡绒层的启动子(EP0,344,029),该启动子可以用于烟草,油菜,莴苣,菊苣,棉花,水稻,小麦和其它植物种类;来自于水稻的PT72,PT42和PE1启动子,它可以用于水稻,玉米,小麦和其它植物种类(WO92/13956);来自于玉米的PCA55启动子,它可以用于玉米,水稻,小麦和其它植物种类(WO92/13957);和鼠耳芥的特异于毡绒层的基因的A9启动子(Wyatt等人,1992,植物分子生物学,19:611-922)。
本发明是基于发现:“恢复系能力”(恢复系有效地使各种各样的ms品系恢复雄性可育的能力和效力)与在恢复系植物的雄蕊中,特别是在毡绒层细胞中产生的芽孢杆菌RNA酶抑制剂的量直接相关(并且由于包含于被恢复的植物的雄蕊,特别是毡绒层细胞)。
恢复系的能力是重要的,因为有效的恢复系能够用于使各种各样的雄性不育系恢复雄性可育,其含量不同于在雄蕊中,特别是在毡绒层细胞中产生的芽孢杆菌RNA酶的量(由于雄性不育基因的表达)。在不同的ms品系中产生各种各样的芽孢杆菌RNA酶的一个来源是由于位置的影响,即由于在不同的转化体的核基因组中不同的插入位置ms基因的表达的变异。在不同的ms品系(在相同的遗传基因座含有ms基因)中产生的芽孢杆菌RNA酶的变异的另一个来源是不同的ms品系的不同的遗传背景。因此,当通过回交将来自于植物种类的一个品种的一个雄性不育品系的ms基因导入到相同(或密切相关)的植物种类的其它品种,以产生那些品种的ms品系时,ms基因被导入到不同的遗传背景,这会影响表达ms基因的水平。当考虑不同的恢复系植物中的恢复基因的表达的变异时-(所述变异可起源于如上文指出的相同来源,即在不同的恢复系品系中的可育性恢复系基因的位置影响和/或不同的恢复系品系的不同的遗传背景),进一步增加了所观察到的芽孢杆菌RNA酶产生的变异,和与此相关的可育性的恢复的问题。因此,为了获得具有良好的恢复系能力的恢复系品系,具有植物可表达嵌合芽孢杆菌RNA酶抑制剂基因是令人满意的,所述基因以高水平表达,以在植物的雄蕊细胞,特别是在花药细胞,尤其是在毡绒层细胞中产生大量的芽孢杆菌RNA酶抑制剂。
因此本发明提供了改进的芽孢杆菌RNA酶抑制剂DNA,在其它各点都相同的情况下,该DNA更有效地在植物细胞中表达-从而在那些细胞中它比野生型芽孢杆菌RNA酶抑制剂DNA产生更高水平的活性芽孢杆菌RNA酶抑制剂蛋白质,特别是改进的芽孢杆菌RNA酶抑制剂蛋白质。因此,在至少一个植物种类的植物中(和优选的是在几个植物种类,特别是几个单子叶植物种类的植物中)以平均高于用类似的包括野生型芽孢杆菌RNA酶抑制剂DNA的恢复系基因观察到的水平表达改进的可育性恢复系基因。平均的较高水平的表达是指在不同的遗传基因座和/或在不同的遗传背景含有本发明的可育恢复基因的不同的恢复系品系的特定的器官(例如花药)中产生的芽孢杆菌RNA酶抑制剂的量显著地高于在不同的遗传基因座和不同的遗传背景含有包括野生型芽孢杆菌RNA酶抑制剂DNA的类似的可育性恢复系基因不同的恢复系品系的雄蕊中产生的芽孢杆菌RNA酶抑制剂的量。
通常本发明提供“改进的”芽孢杆菌RNA酶抑制剂编码区,该编码区具有含有作为第二密码子的一个密码子的核苷酸序列,所述的密码子编码选自于下列组缬氨酸(Val),丙氨酸(Ala),天冬氨酸(Asp),谷氨酸(Glu)和甘氨酸(Gly)的一个氨基酸。特别优选的是该第二密码子编码丙氨酸。这些密码子以G起始,在位置+4(即芽孢杆菌RNA酶抑制剂编码序列的第二密码子的第一核苷酸)提供了最佳的转译起始位置。因此由改进的芽孢杆菌RNA酶抑制剂DNA编码的芽孢杆菌RNA酶抑制剂的N-末端由Met-Xaa组成,其中Xaa是Ala,Val,Gly,Glu或Asp,并且优选的是Ala(更优选的是由GCC密码子编码的Ala)。优选的是,改进的芽孢杆菌RNA酶抑制剂DNA编码在包括SEQ ID No.2的氨基酸残基3和90之间的氨基酸序列(对应于SEQ ID No.1的核苷酸7至270)的芽孢杆菌RNA酶抑制剂。改进的芽孢杆菌RNA酶抑制到DNA的例子是1)编码具有SEQ ID No.2的序列的芽孢杆菌RNA酶抑制剂的芽孢杆菌RNA酶抑制剂DNA,其中氨基酸序列的第二氨基酸(Lys)被上文定义的Xaa所替代,和2)编码具有SEQ ID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂的芽孢杆菌RNA酶抑制剂DNA。发现以非保守的方式修饰芽孢杆菌RNA酶抑制剂蛋白质的N-末端对芽孢杆菌RNA酶抑制剂的特定的生物学活性没有产生负面影响。事实上当在植物中表达时,特别是在单子叶植物(例如玉米,水稻和小麦)中表达时,这些改进的芽孢杆菌RNA酶抑制剂DNA通常产生更多的芽孢杆菌RNA酶抑制剂蛋白质,如通过雄蕊组织的Western印迹分析评估看到的。毡绒层细胞中产生的芽孢杆菌RNA酶抑制剂的提高是由于芽孢杆菌RNA酶抑制剂蛋白质的转译得到改进,而且其稳定性提高。
还发现对芽孢杆菌RNA酶抑制剂编码序列进行修饰以使该序列的%AT降低到低于40%导致产生改进的芽孢杆菌RNA酶抑制剂DNA,这样可以在植物细胞中,特别是在毡绒层细胞中大大提高产生的具有芽孢杆菌RNA酶抑制剂活性的蛋白质的水平。本文中所述的改进的芽孢杆菌RNA酶抑制剂编码序列通常被命名为“合成”的芽孢杆菌RNA酶抑制剂编码序列。
优选的是合成的芽孢杆菌RNA酶抑制剂DNA具有在大多数的植物种类中为优选的惯用的密码子,其中例如可以在恢复系品系中使用。对于大多数N植物种类X1,X2,.....XN优选的芽孢杆菌RNA酶抑制剂DNA的惯用的密码子是指对于存在一个密码子以上的各个氨基酸,在合成的芽孢杆菌RNA酶抑制剂DNA中编码该氨基酸的频率最高的密码子(该氨基酸的“芽孢杆菌RNA酶抑制剂密码子”),优选的是编码该氨基酸的每个密码子是在各个N/2以上的植物种类中,该密码子具有综合的频率为1)至少是最少使用的密码子的综合频率的两倍和/或2)大于最多使用的密码子的综合频率的一半。
还优选的是对于存在多个密码子的19个氨基酸的至少17,优选的是至少18,在合成的芽孢杆菌RNA酶抑制剂DNA中使用频率最高的密码子,优选的是每个密码子是在各个N植物种类中,该密码子的综合频率为1)至少是最少使用的密码子的综合频率的两倍和/或2)大于最多使用的密码子的综合频率的一半。实施例2描述了对于五个植物种类(N=5)即油菜,棉花,玉米,小麦和水稻,用最佳化的惯用密码子设计的特定的合成的芽孢杆菌RNA酶抑制剂DNA。
为了本发明的目的,使用了由Ikemura公开的对于各个植物种类的综合的密码子频率(Ikemura,1993,在“植物分子生物学Labfax”,Croy,ed.,Bios Scientific Publishers Ltd.,第37-48页)。
其中例如在恢复系中使用本发明的合成的芽孢杆菌RNA酶抑制剂DNA的优选的植物种类是油菜,棉花,玉米,水稻和小麦,特别是油菜,玉米和水稻,尤其是油菜和玉米。
合成的芽孢杆菌RNA酶抑制剂DNA优选的是其进一步特征在于具有低频率的CG二核苷酸和CNG三核苷酸,它们是在植物细胞中甲基化的靶。因此本发明的合成的芽孢杆菌RNA酶抑制剂DNA的特征为:
具有不超过7%的CG二核苷酸,优选的是具有不超过6%的CG二核苷酸,特别是具有5.5和6%之间的CG二核苷酸(在270-273碱基对的编码序列中,它是约15或16的CG核苷酸),和/或,
不超过9.5%的CNG三核苷酸(其中N是任何核苷酸),优选的是具有不超过9%的CNG三核苷酸,特别是具有8.5%和9%之间的CNG三核苷酸(在270-273碱基对的编码序列中,它是约23-25的CNG三核苷酸)。
优选的本发明的合成的芽孢杆菌RNA酶抑制剂DNA进一步的特征在于具有不超过7,优选的是不超过5,特别是不超过3个的由仅一个种类的核苷酸组成的四核苷酸(即AAAA,CCCC,GGGG,TTTT)和具有不超过2,优选的是不超过1个的由仅一个种类的核苷酸组成的五核苷酸(即AAAAA,CCCCC,GGGGG,TTTTT)。
本发明的合成的芽孢杆菌RNA酶抑制剂DNA包括编码野生型芽孢杆菌RNA酶抑制剂(SEQ ID No 2)的那些序列,例如具有由ATG引导的SEQ IDNo 3的位置7和273之间的核苷酸序列的芽孢杆菌RNA酶抑制剂DNA。但是,本发明的优选的合成的芽孢杆菌RNA酶抑制剂DNA是合成的芽孢杆菌RNA酶抑制剂编码序列,该序列编码具有以Met-Xaa起始的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中Xaa是缬氨酸,丙氨酸,天冬氨酸,谷氨酸或甘氨酸,并且优选的是其中Xaa是丙氨酸。优选的合成的芽孢杆菌RNA酶抑制剂DNA是由ATGGNN引导,优选的是由ATGGCN引导(其中N是任何核苷酸)的SEQ ID No 3的位置7和273之间的核苷酸序列的DNA。特别优选的合成的芽孢杆菌RNA酶抑制剂DNA是具有SEQ ID No3的核苷酸序列的DNA。
优选的是,合成的芽孢杆菌RNA酶抑制剂编码序列和野生型芽孢杆菌RNA酶抑制剂编码序列编码具有至少80%序列等同性的芽孢杆菌RNA酶抑制剂蛋白质。
为了本发明的目的,两个相关的核苷酸序列(例如两个芽孢杆菌RNA酶抑制剂DNA)或氨基酸序列(即两个芽孢杆菌RNA酶抑制剂)的%序列等同性是指在两个最佳化校正序列中具有相同残基(×100)的位置的数量除以所比较的位置的数量。存在于一个序列但是不存在于另一个序列中的残基的排列中的位置,即空缺被认为具有非相同残基的位置。
包括本发明的合成的芽孢杆菌RNA酶抑制剂DNA的恢复系基因可以用于在不同的植物种类中产生恢复系,但是特别适用于在谷类,尤其是在玉米,水稻和小麦中产生恢复系。
因此本发明还提供了N-末端由Met-Xaa(其中Xaa如上文定义)组成的改进的芽孢杆菌RNA酶抑制剂蛋白质。特别优选的改进的本发明的芽孢杆菌RNA酶抑制剂包括SEQ ID No.2的残基3和90之间的序列(对应于SEQID No.1的核苷酸7至270),并且是例如:1)具有SEQ ID No.4的氨基酸序列的芽孢杆菌RNA酶抑制剂,和2)具有SEQ ID No.2的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中第二氨基酸(Lys)被如上定义的Xaa所替代。
此外,不用说,可以对对应于SEQ ID No.2的残基3和90之间的序列(对应于SEQ ID No.1的核苷酸7至270)的这些优选的改进的芽孢杆菌RNA酶抑制剂区域进行修饰,只要总的氨基酸序列与SEQ ID No.2至少具有80%,优选的是至少具有85%,特别是至少具有90%的序列相似性,并且只要在标准条件下改进的芽孢杆菌RNA酶抑制剂能够抑制至少50%,优选的是至少75%,特别是至少90%的分泌的芽孢杆菌RNA酶的活性。
如上说明的,在芽孢杆菌RNA酶抑制剂蛋白质的N-末端的修饰(即导入由Met-Xaa组成的N-末端)是非保守的修饰,但是当在植物细胞中生产它们时它对本发明的改进的芽孢杆菌RNA酶抑制剂的特定的生物学活性没有负面的影响。这由实施例6的SEQ ID No.4的改进的芽孢杆菌RNA酶抑制剂所举证。
因此本发明还提供了可育性恢复基因,其特征在于它们含有本发明的改进的和/或合成的芽孢杆菌RNA酶抑制剂DNA,并且可以用于生产植物种类的改进的转基因恢复系植物,即具有良好的恢复能力的恢复系植物。不用说,可育性恢复基因的芽孢杆菌RNA酶抑制剂DNA与其它编码序列融合在一起转译,以便作为融合蛋白的一部分进行表达。
原则上,在本发明的恢复系植物中可以使用任何启动子作为可育性恢复基因的恢复系启动子。唯一的前提是含有可育性,恢复系基因的这样的恢复系植物能够恢复雄性不育品系的可育性即能够产生恢复的植物(包括雄性不育基因和可育性恢复基因),所述植物的表现型是正常的并且雄性可育。这要求可育性恢复基因中的恢复启动子应该至少是在植物的雄蕊细胞中具有活性的,所述植物中相应的雄性不育基因的不育启动子能够指导芽孢杆菌RNA酶DNA的表达。关于这一点,优选的是不育性启动子和恢复启动子是相同的(例如两个TA29启动子或两个CA55启动子)。但是,不育性启动子可以是仅在毡绒层细胞中有活性的,而恢复启动子在其它细胞中也是有活性的。例如,不育性启动子可以是雄蕊选择性的(例如TA29启动子或CA55启动子),而恢复启动子是组成型启动子例如35S-tap启动子,它是被修饰后在毡绒层细胞中有活性的35S启动子(van der Meer等人,1992,植物细胞4:253-262)。
当然,本发明的改进的恢复系DNA除了用于恢复植物的雄性可育,还可以用于其它目的。关于这一点,本发明的改进和/或合成的芽孢杆菌RNA酶抑制剂DNA可以在任何情况下使用,可以用于中和植物细胞的芽孢杆菌RNA酶活性,例如在EP 0412911,WO93/19188,WO92/21757,WO93/25695和WO95/02157中描述的。为了上述应用,可以将芽孢杆菌RNA酶抑制剂DNA置于更适合的其它启动子的转录控制下,可以使用类似于35S启动子和农杆菌T-DNA的烟脂碱合成酶基因的启动子。还可以使用基本的启动子(即基本上仅含有TATA盒没有其它调节增强子元件的植物启动子),甚至可以使用本发明的芽孢杆菌RNA酶抑制剂DNA,完全没有启动子(例如当计划在转化植物细胞中在内源性启动子控制下转录芽孢杆菌RNA酶抑制剂DNA时)。
用于恢复系植物中的可育性恢复基因R优选的是还包括至少第二标记基因,它至少包括:
1)编码第二标记RNA,蛋白质或多肽的第二标记DNA,当至少存在于植物的特定的组织或特定的细胞中时,使植物易于与其它植物分离,所述其它植物至少在特定的组织或特定的细胞中不含有由第二标记DNA编码的第二标记RNA,蛋白质或多肽,和
2)能够指导第二标记DNA至少在特定的组织或特定的细胞中表达的第二标记启动子;第二标记DNA是相同于第二标记启动子和受其控制的转录单位。
因此本发明的恢复系植物含有外源的“恢复系基因座”,它含有包括本发明的改进的恢复系DNA的恢复系基因R。
优选的恢复系基因座在相同的遗传基因座还包括至少一个第二标记基因。
优选的本发明的恢复系植物是单子叶恢复系植物,优选的是玉米,水稻或小麦植物,它们从其离体的花朵(例如水稻和小麦的圆锥花序,玉米的穗状花序-参见实施例4)提取的每毫克总蛋白平均产生至少10纳克,优选的是至少20纳克,特别是至少40纳克(且至多100至200纳克)的芽孢杆菌RNA酶抑制剂。
尤其优选的本发明的恢复系植物将产生本发明的改进的芽孢杆菌RNA酶抑制剂,特别是具有SEQ ID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂。
可以用于本发明的第一和第二标记基因的第一和第二标记DNA和第一和第二标记启动子也是熟知的(EP0344029;EP0412911)。关于这一点,优选的是第一和第二标记DNA是不同的,尽管第一和第二标记启动子可以是相同的。
优选的是提供的外源DNA例如可育性恢复系基因,雄性不育基因,或第一或第二标记基因在它们的编码序列的下游(即3’)具有合适的3’转录调节序列和聚腺苷酸化信号,即分别是可育性恢复系DNA,雄性不育DNA,或第一或第二标记DNA。关于这一点,可以使用适用于获得嵌合基因的表达的外源转录3’末端的形成和聚腺苷酸化信号。例如,可以使用基因例如基因7(Velten和Schell(1985)核酸研究13:6998),章鱼碱合成酶基因(De Greve等人,1982,J.Mol.Appl.Genet.1:499;Gielen等人(1983)EMBO J.3:835;Ingelbrecht等人,1989,植物细胞1:671)和根癌农杆菌Ti质粒的T-DNA区域的烟脂碱合成酶基因(DePicker等人,1982,J.Mol.Appl.Genet.1:561),或苯基苯乙烯酮合成酶基因(Sommer和Saedler,1986,Mol.Gen.Genet.202:429-434),或CaMV19S/35S转录单位(Mogen等人,1990,植物细胞2:1261-1272)的外源的3’未转译末端。
可育性恢复系基因,雄性不育基因,或本发明的第一或第二标记基因通常是外源DNA,优选的是外源嵌合DNA。关于这一点对于这样的DNA的“外源”和“嵌合”具有相同于EP 0344029和EP0412911描述的含义。
利用去臂的并且由农杆菌携带的Ti质粒可以转化植物细胞,特别是能够被农杆菌感染的植物例如大多数双子叶植物(例如欧洲油菜)和一些单子叶植物,所述载体含有雄性不育基因或可育性恢复系基因。利用在EP0116718和EP0270822中描述的程序可以实施这样的转化。优选的Ti质粒载体含有Ti质粒的T-DNA的边界序列之间的外源DNA,或至少定位于右边界序列的左边的外源DNA。当然,利用例如直接的基因转移(例如如EP0233247描述的),花粉介导的转化(例如在EP0270356,PCT专利公开“WO”85/01856,和美国专利4684611中描述的),植物RNA病毒介导的转化(例如在EP0067553和美国专利4407956中描述的)和脂质体介导的转化(例如在美国专利4536475中描述的),可以使用其它类型的载体以转化植物细胞。利用由此获得的能够形成坚实的成胚愈伤组织(例如玉米的未成熟的胚)或成胚愈伤组织(例如玉米的I型愈伤组织)的受伤的或酶降解的完整组织,可以转化(例如通过电穿孔)单子叶植物的细胞例如大多数谷类包括玉米,水稻,小麦,燕麦和大麦,例如在WO92/09696中描述的。如果待转化的植物是玉米,还可以使用其它近年来研制的方法,例如由Fromm等人,1990,生物/技术8:833;Gordon-Kamm等人,1990,生物/技术2:603和Gould等人,1991,植物生理学95:426描述的对于某些玉米的品系的方法。如果待转化的植物是水稻,还可以使用其它近年来研制的方法,例如由Shimamoto等人,1989,自然学338:274;Datta等人,1990,生物/技术8:736和Hayashimoto等人,1990,植物生理学93:857描述的对于某些水稻品系的方法。
将待转化的细胞再生为成熟的植物,可以将获得的转化植物用于常规的育种计划以产生多种具有相同特征的转化植物或在相同的相关的植物种类的其它品种中导入雄性不育基因,或可育性恢复系基因。从转化的植物获得的种子含有作为稳定的基因组插入物的本发明嵌合基因。因此,当导入到植物种类的特定的品系或品种时,通过回交总是可以将本发明的雄性不育基因或可育性恢复系基因导入到任何其它品系或品种。
当然当使该编码DNA的惯常密码子对于一系列的植物种类最佳化时,如用于制备本发明的合成的芽孢杆菌RNA酶抑制剂DNA,上面描述的用于降低编码DNA的AT含量的方法也可以应用到在许多植物种类中需要其最佳表达的任何编码序列。关于这一点,例如该方法可用于编码杀虫蛋白的苏云金芽孢杆菌的基因,例如全长的和截断的Crylab和Cry9C基因(EP0193259;EP 0654075)。
除非另有说明,通过在Sambrook等人,1989,“分子克隆:实验手册”,冷泉港实验室,和Ausubel等人,1994,“当前的分子生物学方案”,John Wiley&Sons描述的标准的程序实施操作重组DNA的所有实验程序。
将聚合酶链反应(“PCR”)用于克隆和/或扩增DNA片段。使用具有重叠延伸的PCR以构建嵌合基因(Horton等人,1989,基因77:61-68;Ho等人,1989,基因77:51-59)。
使用的PCR反应都是在常规条件下,利用VentTM聚合酶完成的(Cat.No.254L-Biolabs New England,Beverley,MA 01915,美国),所述聚合酶是从Thermococcus litoralis分离到的(Neuner等人,1990,Arch.Microbiol.153:205-207)。根据已知的由Kramer和Fritz概括的规则设计寡核苷酸(1987,酶学方法154:350),在Applied Biosystems 380ADNA合成仪(Applied Biosystems B.V.,Maarssen,Netherlands)上采用phosphoramidite方法(Beaucage和Caruthers,1981,Tetrahedron Letters22:1859)合成。
在说明书和下面的实施例中,参照下面的序列表和附图:
序列表
SEQ ID No 1:野生型芽孢杆菌RNA酶抑制剂DNA
SEQ ID No 2:野生型芽孢杆菌RNA酶抑制剂
SEQ ID No 3:合成的芽孢杆菌RNA酶抑制剂DNA
SEQ ID No 4:改进的芽孢杆菌RNA酶抑制剂
SEQ ID No 5:质粒pMV71
SEQ ID No 6:质粒pLH43的相关部分
SEQ ID No 7:质粒pTTS24的T-DNA
SEQ ID No 8:寡核苷酸CASOLX1
SEQ ID No 9:寡核苷酸CASOLX2
SEQ ID No 10:质粒pLH48
在参照这些核苷酸和氨基酸序列时,应该注意到位置X和Y之间的序列(或另一种可选的方法从位置X到位置Y的序列)是包括在位置X和Y的残基的序列。
利用在序列表中使用的缩写命名功能性DNA元件。
实施例
实施例1:改进的芽孢杆菌RNA酶抑制剂DNA的制备
通过位点特异性诱变在野生型芽孢杆菌RNA酶抑制剂的第一密码子(ATG)和第二密码子(AAA)之间插入丙氨酸密码子GCC而制备改进的芽孢杆菌RNA酶抑制剂DNA。因此改进的芽孢杆菌RNA酶抑制剂DNA编码改进的芽孢杆菌RNA酶抑制剂,当与野生型芽孢杆菌RNA酶抑制剂比较时,改进的芽孢杆菌RNA酶抑制剂具有改变的N-末端,它由Met-Ala-Lys组成(而不是野生型芽孢杆菌RNA酶抑制剂中的Met-Lys)。N-末端的非保守修饰不会影响植物细胞中改进的芽孢杆菌RNA酶抑制剂的生物学活性(参见实施例6)。
实施例2:合成的芽孢杆菌RNA酶抑制剂DNA的合成和制备
根据下列标准设计编码实施例1的改进的芽孢杆菌RNA酶抑制剂的合成的芽孢杆菌RNA酶抑制剂DNA:
-在合成的芽孢杆菌RNA酶抑制剂中A和T核苷酸的百分数应该低于40%(野生型芽孢杆菌RNA酶抑制剂DNA具有51.6的%AT)。AT丰富的基因具有包括聚腺苷酸化信号和内含子识别序列的较高的可能性,它能阻止或降低特别是长编码序列(例如Bt编码序列)在植物细胞中的表达。
-尽管C和G核苷酸的增加,CG二核苷酸和CNG三核苷酸的量应该尽可能低。这是因为CG二核苷酸和CNG三核苷酸是甲基化的靶,它可以在植物细胞中使基因失活。
-惯用密码子应该尽可能地在许多种类的植物中最佳化,特别是在油菜,棉花,玉米,水稻和小麦中。因此,对于各个氨基酸,选择在芽孢杆菌RNA酶抑制剂DNA中优选使用的一个密码子(或几个密码子),在大多数植物种类中,所述密码子具有的频率至少是最少使用的密码子的频率的两倍以上和/或至少是最多使用的密码子的频率的一半以上。因此,对于各个植物种类和对于各个氨基酸,制作一个密码子表,其中具有的频率至少是在所述植物种类中最少使用的密码子的频率的两倍以上和/或至少是在所述植物种类中最多使用的密码子的频率的一半以上(将符合该标准的密码子命名为所述植物种类的最佳密码子)。在大多数植物种类中是最佳密码子的密码子称作为在合成的芽孢杆菌RNA酶抑制剂DNA中所述氨基酸的优势密码子,优选的是唯一的密码子。
方便的是,在该分析中使用的密码子的频率是所列出的那些(上文)。
-避免大于4个相同核苷酸以上的延伸。
因此获得了具有SEQ ID No.3的核苷酸序列的合成的芽孢杆菌RNA酶抑制剂DNA。这种合成的芽孢杆菌RNA酶抑制剂DNA具有38.4的%AT,不过仅含有16CG二核苷酸和24CNG三核苷酸。合成的芽孢杆菌RNA酶抑制剂DNA不含有潜在的植物聚腺苷酸化信号或内含子拼接位点。合成的芽孢杆菌RNA酶抑制剂DNA的惯用密码子似乎适合于在至少油菜,棉花,玉米,水稻和小麦中表达(表1)。对于其中存在多个密码子的18个氨基酸,在合成的芽孢杆菌RNA酶抑制剂DNA中17个氨基酸优选地被在这五个植物种类的各个中是最佳密码子的一个密码子所编码。事实上,在这五个植物种类的至少三个中,所有的存在多个密码子的氨基酸在合成的芽孢杆菌RNA酶抑制剂DNA中优选地被一个最佳密码子所编码。
合成芽孢杆菌RNA酶抑制剂DNA只含有1CCCCC和1GGGG延伸。
为了克隆的目的,SEQ ID No.3的合成的芽孢杆菌RNA酶抑制剂使用下面的唯一的限制性位点:NcoI,BspE1和Kasl。
实施例3:改进的芽孢杆菌RNA酶抑制剂DNA在玉米细胞中的表达
用包被了质粒pLH43或质粒pMV71的微弹(金颗粒),用Bio-Rad PDS-1000/HE颗粒枪(Bio-Rad实验室,Hercules,加里福尼亚,美国)轰击培养的Black Mexican Sweet(BMS)玉米细胞,如下所述。
将BMS悬浮细胞置于合适的滤膜,并且用常规程序进行轰击(Kirihara,1994,“玉米手册”,Freeling和Walbot,Springer Verlag,第690-694页),所述程序进行了包括渗透压预处理的修饰(Russel等人,1992,体外28:97-105)。利用由供应商手册描述的程序,用含有5∶1比例的芽孢杆菌RNA酶抑制剂DNA和质粒pAct1-D的合适的质粒DNA的混合物包被金颗粒(McElroy等人,1990,植物细胞2:163-171)。pAct1-D是含有gus基因(编码β-葡糖苷酸酶)的质粒,所述基因处于水稻肌动蛋白基因的启动子的控制下,所述基因基本上具有描述于SEQ ID No.5的位置1999到3400之间的序列。
对于各个质粒,轰击2-3个滤膜。轰击以后24小时,收集来自于各个滤膜的细胞,通过在液氮中研磨捕获。将各个滤膜的捕获的细胞分为二等份,一份用于芽孢杆菌RNA酶抑制剂检测,另一份用于GUS检测。
来自于各个轰击的滤膜的被捕获细胞的一半,在提取缓冲液(50mMTris/HCl pH 7.5,5%甘油,100mM KCl,1mM benzamidin.HCl,5mM e-氨基-n-己酸,10mM EDTA,10mM EGTA,1微克/毫升抗蛋白酶,1微克/毫升亮抑蛋白酶肽,14mM β-巯基乙醇,1.5%聚乙烯基聚吡咯烷酮,1mM PMSF)中提取总可溶性细胞蛋白质。采用Bio-RadBradford检测试验测定蛋白质的浓度。每个样品的50微克的蛋白质装载于18%SDS-聚丙烯酰胺凝胶并且通过电泳进行分离。将0.1,0.5,2.5,和5纳克的纯化的芽孢杆菌RNA酶抑制剂装载于凝胶上作为阳性对照。
然后利用TGM-缓冲液(25mM Tris pH8.3,192mM甘氨酸,20%v/v甲醇),以60V进行2小时,将蛋白质电吸印到Hybond C。然后将滤膜在0.5%PBS-吐温20中首先保温2小时,然后在一级抗体的溶液(在PBS-0.5%吐温20中1/1000稀释的多克隆兔IgG抗-芽孢杆菌RNA酶抑制剂抗体)中保温过夜。然后将滤膜在PBS中洗涤4次,每次5分钟,然后在驴抗兔IgG,辣根过氧化物酶连接(Amersham,Buckinghamshire,英国)的在PBS-0.5%吐温20中1/1000稀释的溶液中保温1小时。然后再将滤膜在PBS中洗涤4次,每次5分钟,然后利用ECL检测系统(Amersham)检测蛋白质。通过放射自显影的密度计扫描测定芽孢杆菌RNA酶抑制剂的量。
平行试验,采用荧光团检测方法,检测在从各个轰击的滤膜获得的另-半捕获细胞提取的蛋白质中β-葡糖苷酸酶的活性(Jefferson,1987,植物分子生物学报道5:387-405)。
通过比较每(任意的)单位GUS活性中芽孢杆菌RNA酶抑制剂的量确定特定的质粒产生的芽孢杆菌RNA酶抑制剂。
pMV71是具有SEQ ID No.5的核苷酸序列的质粒,并且含有实施例1的改进的芽孢杆菌RNA酶抑制剂DNA。将该变异体芽孢杆菌RNA酶抑制剂DNA可操作连接到水稻肌动蛋白启动子和农杆菌T-DNA的胭脂碱合成酶3’未转译末端。
pLH43是具有SEQ ID No.5的核苷酸序列的质粒,其中核苷酸3399和4021之间的序列被SEQ ID No.6的核苷酸序列替代。pLH43含有可操作连接到水稻肌动蛋白启动子和农杆菌T-DNA的胭脂碱合成酶3’未转译末端的实施例2的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No.3)。
pTS410是具有SEQ ID No.5的核苷酸序列的质粒,其中核苷酸3404到3406(即pMV71的芽孢杆菌RNA酶抑制剂DNA的第二密码子)已被缺失。
上面实验的结果列于表2,其中显示来自于各个轰击试验的测定结果。当与在pTS410的野生型芽孢杆菌RNA酶抑制剂DNA导入后产生的(野生型)芽孢杆菌RNA酶抑制剂蛋白质相比,易于看到pMV71和pLH43的改进的芽孢杆菌RNA酶抑制剂DNA的导入平均导致显著高地产生(改进的)芽孢杆菌RNA酶抑制剂蛋白质。另外,可以看到,当与在pMV71的改进的芽孢杆菌RNA酶抑制剂DNA导入后产生的(也改进的)芽孢杆菌RNA酶抑制剂蛋白质相比,在玉米细胞中导入pLH43的改进的合成芽孢杆菌RNA酶抑制剂DNA导致在那些细胞中显著高地产生(改进的)芽孢杆菌RNA酶抑制剂蛋白质。
实施例4:改进的芽孢杆菌RNA酶抑制剂DNA在水稻植物中的表达
利用质粒pTS172,基本上如WO 92/13956描述的,获得了四个转基因的雄性不育水稻的栽培品种Kochihibiki品系。质粒pTS172含有下面的嵌合基因:P35S-bar-3’g7和PE1-芽孢杆菌RNA酶-3’nos并且可以通过将用BstEII和MscI消化的pTS173的大片段连接到pJVR2-E1的小BstEII-MscI片段上从pTS173(见下)获得。这些品系被命名为K104,K107,K109和K111。
基本上按照WO 92/13956描述的方法,利用质粒pTS173获得7个转基因的雄性可育的恢复系水稻植物Chiyonishiki栽培品种。所述质粒含有下面的嵌合基因:P35S-bar-3’g7和PE1-野生型芽孢杆菌RNA酶抑制剂-3’nos。通过用35S启动子和pTTS24的嵌合bar基因的3’未转译末端替代35S启动子和pJVR3-E1的嵌合bar基因的3’未转译末端,可从pJVR3-E1衍生pTS173(WO 92/13956)。从质粒pTTS24的T-DNA插入物(SEQ ID No.7),利用寡核苷酸引物CASOLX1(SEQ IDNo.8),它重叠bar基因的KpnI位点,和CASOLX2(SEQ ID No.9),采用PCR扩增含有T-DNA基因7的3’末端的DNA片段。用AatII和KpnI切割PCR产物,并且连接到用AatII和KpnI切割的质粒pJVR3-E1的大片段上。从该获得的质粒,通过由来自于pTTS24(SEQ ID No.7的位置880到2281)的相应的NcoI-NotI片段替代较小的NcoI+NotI片段(含有P35S),导致产生pTS173。
获得的品系命名为C111,C113,C117,C118,C120,C121和C125。因此所有这些植物含有处于E1启动子控制下的SEQ ID No.1的野生型芽孢杆菌RNA酶抑制剂DNA(WO 92/13956)。
利用农杆菌介导的受伤的坚实的成胚愈伤组织(从水稻栽培品种Kochihibiki未成熟的胚获得的)的转化获得32个另外的恢复系植物(WO92/09696)。用于转化的农杆菌菌株是从其野生型Ti-质粒恢复的并且含有质粒pGV4000和pTTS24的Ach5菌株(Genetello等人,1977,自然学265:561-563)。pTTS24是中间体克隆载体,它在其必要的特性上类似pGSC1700(Cornelissen和Vandewiele,1989,NAR 17:19-29),但是由于缺失β-内酰胺酶基因和含有具有SEQ ID No.7的核苷酸序列的T-DNA,其主要部分不同于pGSC1700。pGV4000是去臂的Ti-质粒,它来自于pMP90(Koncz和Schell,1986,Mol.Gen.Genet.204:383-396)并且含有允许与pTTS24的相应的区域同源重组的区域。
将所有含有实施例2的处于E1启动子的控制下的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No.3)的这些植物命名为“OSC”数,如在表3中使用的。
在所有恢复系品系中测定芽孢杆菌RNA酶抑制剂蛋白质的量。每个品系在液氮中研碎单个植物的1-2个未成熟的圆锥花序(即圆锥花序,其中大多数的小穗约为3.5-4.5毫米长)。如实施例3描述的方法提取和检测蛋白质。
结果概括于表3。可以看到含有SEQ ID No.3的芽孢杆菌RNA酶抑制剂DNA的恢复系品系产生的芽孢杆菌RNA酶抑制剂明显高于含有SEQID No.1的芽孢杆菌RNA酶抑制剂DNA的那些品系。
芽孢杆菌RNA酶抑制剂mRNA的量直接与圆锥花序中芽孢杆菌RNA酶抑制剂蛋白质的量相关得到证实(数据没有显示)。进一步证实芽孢杆菌RNA酶抑制剂蛋白质的产生有效地限制到圆锥花序的花(数据没有显示)。
选定的恢复系品系与四个雄性不育品系杂交。观察到恢复系品系的恢复能力与所述花中产生的芽孢杆菌RNA酶抑制剂蛋白质的量相关。观察到每毫克提取的蛋白质产生4和10纳克芽孢杆菌RNA酶抑制剂之间的品系能够部分恢复微孢子的发育为雄性不育品系,在这种意义上,“恢复系植物”产生非存活的花粉(雄性不育植物完全不产生花粉)。对于所有检测的雄性不育品系观察到每毫克提取的蛋白质产生50纳克或更多的芽孢杆菌RNA酶抑制剂的恢复系品系能够完全恢复可育性,即在自我授粉后,所有恢复的子代植物产生完全存活的和有功能的花粉,和正常的种子。
选定的恢复系品系也是自我授粉的并且从转基因子代植物收集到未成熟的圆锥花序。如由所产生的芽孢杆菌RNA酶抑制剂的量测定的表达水平至少等于,和在许多植物中大于在初级转化中测定的量。通常,这些观察结果证实芽孢杆菌RNA酶抑制剂表达水平稳定地转移到子代植物。
实施例5:改进的芽孢杆菌RNA酶抑制剂DNA在玉米植物中的表达
基本上按照WO 92/13956描述的方法,利用质粒pVE108获得命名为MS3的转基因雄性不育玉米品系。
基本上按照WO95/34634描述的方法获得含有处于TA29启动子(EP344,029)或CA55启动子(WO92/13957)控制下的SEQ ID No 1的野生型芽孢杆菌RNA酶抑制剂DNA的几个转基因雄性可育恢复系玉米植物。特别是,通过用质粒pCOL100和pDE110(WO 92/34634)转化玉米获得七个恢复系品系,pDE110含有可操作连接到如SEQ ID No 1描述的芽孢杆菌RNA酶抑制剂DNA上的TA29启动子。当与MS2植物杂交时,恢复是不完全的,因为最多75%的花药产生存活的花粉(这证明MS3品系特别难于恢复,因为用其它雄性不育品系获得了良好的恢复程度-数据未显示)。
类似地,通过用质粒pLH48(与选自于pCOL9S或PLH52或p35S-Bperu或pCOL11(WO92/34634)的质粒一起)转化玉米获得了六个转基因恢复系玉米品系。这些恢复品系都至少含有处于TA29启动子控制下的实施例2的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No 3)。六个恢复品系与MS3植物杂交,对于四个恢复品系观察到完全恢复。将这四个恢复系品系之一命名为RZM583-0101。
由转基因品系RZM583-0101给转基因品系MS3授粉,通过PCR筛选识别含有嵌合芽孢杆菌RNA酶基因和嵌合芽孢杆菌RNA酶抑制剂基因的子代植物。将那些可育性恢复的子代植物用于给MS3植物授粉。在该最后的杂交的90个子代植物中,识别出15个植物(通过定量的Southern印迹分析)为MS3的嵌合芽孢杆菌RNA酶基因的纯合子。在这些中,不含有RZM583-0101的嵌合的芽孢杆菌RNA酶抑制剂基因的植物是雄性不育的,而含有RZM583-0101的嵌合的芽孢杆菌RNA酶抑制剂基因的那些植物是完全雄性可育的。这证实了由包括改进的合成的芽孢杆菌RNA酶抑制剂DNA的嵌合的芽孢杆菌RNA酶抑制剂基因可以完全恢复在纯合条件下含有嵌合的芽孢杆菌RNA酶基因的植物的可育性。
因此,可以总结出,含有改进的合成的芽孢杆菌RNA酶抑制剂DNA的恢复品系具有显著好的恢复能力。
基本上按照实施例3描述的方法测定子代恢复系植物的未成熟穗状雄花(包括单核阶段的微孢子)的芽孢杆菌RNA酶抑制剂的量。观察到在含有改进的合成芽孢杆菌RNA酶抑制剂DNA的恢复系植物的穗状雄花中芽孢杆菌RNA酶抑制剂蛋白质的量显著地高于含有野生型芽孢杆菌RNA酶抑制剂DNA的恢复系植物的穗状雄花中芽孢杆菌RNA酶抑制剂蛋白质的量。例如在含有野生型芽孢杆菌RNA酶抑制剂DNA的植物中,测定芽孢杆菌RNA酶抑制剂蛋白质的量低于20纳克芽孢杆菌RNA酶抑制剂/毫克总蛋白。相反,在含有改进的合成芽孢杆菌RNA酶抑制剂DNA的两个品系中,测定未成熟的穗状雄花的芽孢杆菌RNA酶抑制剂蛋白质的量分别是210和100纳克芽孢杆菌RNA酶抑制剂/毫克总蛋白。
实施例6:在油菜的雄蕊细胞中生产时野生型芽孢杆菌RNA酶抑制剂和改进的芽孢杆菌RNA酶抑制剂的活性
利用农杆菌介导的转化,用质拉pTHW118或pTTS139转化油菜植物(栽培品种Drakkar)。质粒pTHW118含有处于TA29启动子控制下的野生型芽孢杆菌RNA酶抑制剂DNA(SEQ ID No 1)。质粒pTTS139含有包括野生型的芽孢杆菌RNA酶抑制剂DNA的第一和第二密码子之间的附加的GCC丙氨酸密码子的改进的芽孢杆菌RNA酶抑制剂DNA。因此,pTTS139中的芽孢杆菌RNA酶抑制剂DNA编码SEQ ID No 4的改进的芽孢杆菌RNA酶抑制剂蛋白质。
用pTHW118转化的两个油菜品系,分别命名为DBN 366-0011和DBN 366-0029,用pTTS139转化的两个油菜品系分别命名为DBN 342-1010和DNB 367-0035,选择上述品系进行定量分析。
从所述植物分离长度约为3-4毫米的油菜花芽,并且在液氮中研碎。提取蛋白质,基本上按照实施例3描述的方法,测定提取的总蛋白质的量,以及采用Western印迹可检测的芽孢杆菌RNA酶抑制剂的量。表4显示了在各个品系中存在可提取的总蛋白质的量(栏4)和芽孢杆菌RNA酶抑制剂的量(栏2)。
基本上按照Fitzgerald和Hartley描述的方法(1993,见上文)测定芽孢杆菌RNA酶抑制剂的活性。向600微升的TE缓冲液(10mM Tris/HClpH8.0;1mM EDTA)中加入
-20微升的含有10微克/毫升牛血清白蛋白和0.1微克/毫升的芽孢杆菌RNA酶的0.02M乙酸铵pH8.0溶液,
-“ X”微升的5倍稀释的从花芽提取的蛋白质(“X”分别是0,4,8,12,16,20)。
在混合和等待约1分钟之后,加入6微升的10倍稀释的含有溶于TE缓冲液中的0.4微克/毫升的聚乙烯醇腺苷磷酸的原液。
将最后的溶液混合并且立即转移到透明小容器,记录1-2分钟内荧光的增加。
以起始时荧光的增加值/分钟相对于“X”(含有芽孢杆菌RNA酶抑制剂溶液的体积)作图。在各种情况下,如预期的获得了线性关系。计算X-轴的隐性品系的截距(表4,栏3):这代表“X”的体积,它含有足够的芽孢杆菌RNA酶抑制剂以完全中和2纳克的芽孢杆菌RNA酶(即含有芽孢杆菌RNA酶抑制剂的摩尔量的体积,它相当于2纳克的芽孢杆菌RNA酶)。由此可以测定花芽中“活性”芽孢杆菌RNA酶抑制剂的量(表4,栏5),以及“活性”芽孢杆菌RNA酶抑制剂与由Western印迹测定的总芽孢杆菌RNA酶抑制剂蛋白质的比例(表4,栏6)。
根据这些比例,能够推导出改进的芽孢杆菌RNA酶抑制剂的活性至少相当于野生型芽孢杆菌RNA酶抑制剂的量。但是,在用pTHW118转化的品系(表达野生型芽孢杆菌RNA酶抑制剂)中,平均比例是0.27(标准偏差0.08),而在用pTTS139转化的品系中,平均比例是0.39(标准偏差0.08)。两个品系类型的平均比例之间的差异在统计学上是显著的(t=-26,p<0.005)。根据这一点,能够总结出当在油菜花芽中产生时,与野生型芽孢杆菌RNA酶抑制剂相比,改进的芽孢杆菌RNA酶抑制剂通常产生较高水平的活性芽孢杆菌RNA酶抑制剂。
本申请中引用的所有出版物均引入本文作为参考。
表1
氨基酸b) 芽孢杆菌RNA酶抑制剂密码子c) Nrd)                     植物a)
油菜 棉花 玉米 水稻 小麦
Leu  CTC  9     +     +     +     +     +
 CTT 2     +     +     +     +     +
 TTG  1     +     +     +     +     +
Ser  AGC  4     +     +     +     +     +
 TCC  1     +     +     +     +     +
Arg  AGG  3     +     +     +     +     +
Thr  ACC  4     +     +     +     +     +
Pro  CCC  1     +     -     +     +     -
 CCG  1     +     -     +     +     -
Ala  GCC  6     +     +     +     +     +
 GCT  1     +     +     +     +     +
Gly  GGC  3     +     +     +     +
 GGT  1     +     +     -     -     -
 GGG  1     +     +     -     -     +
Val  GTG  4     +     +     +     +     +
 GTC  1     +     +     +     +     +
Lys  AAG  6     +     +     +     +     +
Asn  AAC  3     +     +     +     +     +
Gln  CAG  5     +     +     +     +     +
 CAA  1     +     +     +     +     +
His  CAC  1     +     +     +     +     +
Glu  GAG  11     +     +     +     +     +
Asp  GAC  4     +     +     +     +     +
Tyr  TAC  3     +     +     +     +     +
Cys TGC 2 + + + + +
Phe  TTC  2     +     +     +     +     +
Ile  ATC  6     +     +     +     +     +
a)+:表示在选定的植物中,密码子是该植物中的最佳密码子,即在所述植物中该密码子的频率至少为该植物中最低频率的密码子的频率的两倍和/或至少是该植物中最多使用的密码子的频率的50%。在该植物种类中密码子的频率是由Ikemura列出(千分之)的那些(见上文)
-:表示在选定的植物中,该密码子在如上定义的植物中不是最佳密码子
b)存在多个密码子的氨基酸(不是Trp,Met)
c)在合成的芽孢杆菌RNA酶抑制剂DNA中使用的编码该氨基酸的SEQID No.3的密码子
d)由这种SEQ ID No.3的密码子编码的氨基酸的数目
表2
质粒 滤膜编 芽孢杆菌RNA酶抑制剂蛋白a)纳克数 Gus活性b) 正确的芽孢杆菌RNA酶抑制剂c) 平均 SD
pLH43     1     2.8     0.6     4.7 5.4 0.8
    2     3.7     0.6     6.2
    3     2.7     0.5     5.4
pMV71     1     2.4     0.8     3.0 2.7 0.4
    2     3.6     1.3     2.8
    3     1.1     0.5     2.2
pTS410     1     0.6     0.8     0.8 0.9 0.1
2 0.8 0.8 1.0
a)由Western印迹测定的50微克负载的蛋白质中芽孢杆菌RNA酶抑制剂的量
b)Gus活性以任意单位计
c)正确的芽孢杆菌RNA酶抑制剂:纳克芽孢杆菌RNA酶抑制剂/GUS活性单位。
表3
编号 质粒 品系 芽孢杆菌RNA酶抑制剂纳克数/总蛋白的毫克数
1 pTS173 C111     <2a)
2 C113     4
3 C117     <2a)
4 C118     2
5 C120     6
6 C121     2
7 C125     4
8  pTTS24 OSC1156     21
9 OSC1160     36
10 OSC1178     <12a)
11 OSC1181     39
12 OSC1185     <12a)
13 OSC1187     29
14 OSC1188     78
15 OSC1208     22
16 OSC1210     <12a)
17 OSC1212     69
18 OSC1219     72
19 OSC1226     <12a)
20 OSC1229     42
21 OSC1235     <12a)
22 OSC1237     20
23 OSC1239     26
24 OSC1241     <12a)
25 OSC1242     43
26 OSC1247     84
27 OSC1249     42
28 OSC1251     65
29 OSC1254     185
30 OSC1258     53
31 OSC1268     130
32 OSC1271     75
33 OSC1272     30
34 OSC1274     138
35 OSC1276     <12a)
36 OSC1278     86
37 OSC1287     26
38 OSC1288     32
39 OSC1293     <12a)
a:低于检测限制值
表4
样品 纳克b*/总蛋白毫克数1)     X2)     总蛋白 活性b*纳克数/n总蛋白4)毫克数 活性b*/总b*5)
 DBN366-0011     300     15.3     5.4     99     0.33
 DBN366-0029     310     18.5     6.8     65     0.21
 DBN342-1010     170     23.6     4.7     74     0.44
 DBN367-0035     280     18.4     4.8     93     0.33
1)由Western印迹测定的。
2)X-截距
3)从花芽提取的蛋白质的总量(对于芽孢杆菌RNA酶抑制剂活性测定稀释了5倍)
4)评估的活性芽孢杆菌RNA酶抑制剂的量(约16.36纳克/毫升与20纳克/毫升芽孢杆菌RNA酶等摩尔)
5)活性芽孢杆菌RNA酶抑制剂(参见上述4)与总芽孢杆菌RNA酶抑制剂(参见上述1))的比例
序列表
(1)一般资料:
(i)申请人:
(A)名称:植物遗传系统N.V.
(B)街道:Plateaustraat 22
(C)城市:Ghent
(E)国家:比利时
(F)邮编(ZIP):B-9000
(G)电话:32 9 2358411
(H)传真:32 9 2231923
(ii)发明名称:恢复基因
(iii)序列数:10
(iv)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC相容
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.30(EPO)
(2)SEQ ID NO:1的资料:
(i)序列特征:
(A)长度:270个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“芽孢杆菌RNA酶抑制剂DNA”
(iii)推测:不是
(iv)反义:不是
(vi)原始来源:
(A)生物体:解淀粉芽孢杆菌
(ix)特征:
(A)名称/键:CDS
(B)位置:1..270
(D)其它资料:/功能=“芽孢杆菌RNA酶抑制剂”
      /产物=“芽孢杆菌RNA酶抑制剂”
(xi)序列描述:SEQ ID NO:1:
ATG AAA AAA GCA GTC ATT AAC GGG GAA CAA ATC AGA AGT ATC AGC GAC           48
Met Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser Asp
  1               5                  10                  15
CTC CAC CAG ACA TTG AAA AAG GAG CTT GCC CTT CCG GAA TAC TAC GGT           96
Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr Gly
             20                  25                  30
GAA AAC CTG GAC GCT TTA TGG GAT TGT CTG ACC GGA TGG GTG GAG TAC           144
Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu Tyr
         35              40                     45
CCG CTC GTT TTG GAA TGG AGG CAG TTT GAA CAA AGC AAG CAG CTG ACT           192
Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu Thr
     50                  55                  60
GAA AAT GGC GCC GAG AGT GTG CTT CAG GTT TTC CGT GAA GCG AAA GCG           240
Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys Ala
65                   70                  75                  80
GAA GGC TGC GAC ATC ACC ATC ATA CTT TCT                                   270
Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
                 85                  90
(2)SEQ ID NO:2的资料:
  (i)序列特征:
    (A)长度:90个氨基酸
    (B)类型:氨基酸
    (D)拓扑结构:线性
  (ii)分子类型:蛋白质
  (xi)序列描述:SEQ ID NO:2
Met Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser Asp
  1               5                  10                  15
Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr Gly
             20                  25                  30
Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu Tyr
         35                  40                  45
Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu Thr
     50                  55                  60
Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys Ala
 65                  70                  75                  80
Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
                 85                  90
(2)SEQ ID NO:3的资料:
  (i)序列特征:
    (A)长度:273个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:线性
  (ii)分子类型:其它核酸
    (A)描述:/desc=“改进的芽孢杆菌RNA酶抑制剂DNA”
  (iii)推测:不是
  (iV)反义:不是
  (ix)特征:
    (A)名称/键:CDS
    (B)位置:1..273
    (xi)序列描述:SEQ ID NO:3:
ATG GCC AAG AAG GCT GTC ATC AAC GGG GAG CAG ATC AGG AGC ATC AGC          48
Met Ala Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser
                 95                 100                 105
GAC CTC CAC CAG ACC CTC AAG AAG GAG CTT GCC CTT CCG GAG TAC TAC          96
Asp Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr
            110                 115                 120
GGT GAG AAC CTC GAC GCC CTC TGG GAC TGC CTC ACC GGC TGG GTG GAG          144
Gly Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu
        125                 130                 135
TAC CCC CTC GTG TTG GAG TGG AGG CAG TTC GAG CAG AGC AAG CAG CTC          192
Tyr Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu
    140                 145                 150
ACC GAG AAC GGC GCC GAG AGC GTG CTC CAA GTG TTC AGG GAG GCC AAG          240
Thr Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys
155                 160                 165                 170
GCC GAG GGC TGC GAC ATC ACC ATC ATC CTC TCC                              273
Ala Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
                175                 180
(2)SEQ ID NO:4的资料:
  (i)序列特征:
    (A)长度:91个氨基酸
    (B)类型:氨基酸
    (D)几何结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:
Met Ala Lys Lys Ala Val Ile Ash Gly Glu Gln Ile Arg Ser Ile Ser
  1               5                  10                  15
Asp Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr
             20                  25                  30
Gly Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu
         35                  40                  45
Tyr Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu
     50                  55                  60
Thr Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys
 65                  70                  75                  80
Ala Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
                 85                  90
(2)SEQ ID NO:5的资料:
  (i)序列特征:
    (A)长度:4032个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
  (ii)分子类型:其它核酸
    (A)描述:/desc=“质粒pMV71”
  (iii)推测:不是
  (iv)反义:不是
  (ix)特征:
    (A)名称/键:-
    (B)位置:1999..3400
(D)其它资料:/标记=PRAC1
    /注解=“水稻肌动蛋白基因的启动子区域-在引导序列中含
            有内含子”
  (ix)特征:
    (A)名称/键:-
    (B)位置:3401..3676
    (D)其它资料:/标记=芽孢杆菌RNA酶抑制剂
         /注解=“芽孢杆菌RNA酶抑制剂DNA”
  (ix)特征:
    (A)名称/键:-
    (B)位置:3677..4003
    (D)其它资料:/标记=3’nos
            /注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
                    未转译末端的区域”
  (ix)特征:
    (A)名称/键:-
    (B)位置:3399..3404
    (D)其它资料:/标记=NcoI
            /注解=“NcoI识别位点”
  (ix)特征:
    (A)名称/键:-
    (B)位置:4016..4021
    (D)其它资料:/标记=KpnI
        /注解=“KpnI识别位点”
(xi)序列描述:SEQ ID NO:5:
CAAGCTTGAC GTCAGGTGGC ACTTTTCGGG GAAATGTGCG CGGAACCCCT ATTTGTTTAT      60
TTTTCTAAAT ACATTCAAAT ATGTATCCGC TCATGAGACA ATAACCCTGA TAAATGCTTC      120
AATAATATTG AAAAAGGAAG AGTATGAGTA TTCAACATTT CCGTGTCGCC CTTATTCCCT      180
TTTTTGCGGC ATTTTGCCTT CCTGTTTTTG CTCACCCAGA AACGCTGGTG AAAGTAAAAG      240
ATGCTGAAGA TCAGTTGGGT GCACGAGTGG GTTACATCGA ACTGGATCTC AACAGCGGTA      300
AGATCCTTGA GAGTTTTCGC CCCGAAGAAC GTTTTCCAAT GATGAGCACT TTTAAAGTTC      360
TGCTATGTGG CGCGGTATTA TCCCGTATTG ACGCCGGGCA AGAGCAACTC GGTCGCCGCA      420
TACACTATTC TCAGAATGAC TTGGTTGAGT ACTCACCAGT CACAGAAAAG CATCTTACGG      480
ATGGCATGAC AGTAAGAGAA TTATGCAGTG CTGCCATAAC CATGAGTGAT AACACTGCGG      540
CCAACTTACT TCTGACAACG ATCGGAGGAC CGAAGGAGCT AACCGCTTTT TTGCACAACA      600
TGGGGGATCA TGTAACTCGC CTTGATCGTT GGGAACCGGA GCTGAATGAA GCCATACCAA      660
ACGACGAGCG TGACACCACG ATGCCTGTAG CAATGGCAAC AACGTTGCGC AAACTATTAA      720
CTGGCGAACT ACTTACTCTA GCTTCCCGGC AACAATTAAT AGACTGGATG GAGGCGGATA      780
AAGTTGCAGG ACCACTTCTG CGCTCGGCCC TTCCGGCTGG CTGGTTTATT GCTGATAAAT      840
CTGGAGCCGG TGAGCGTGGG TCTCGCGGTA TCATTGCAGC ACTGGGGCCA GATGGTAAGC      900
CCTCCCGTAT CGTAGTTATC TACACGACGG GGAGTCAGGC AACTATGGAT GAACGAAATA      960
GACAGATCGC TGAGATAGGT GCCTCACTGA TTAAGCATTG GTAACTGTCA GACCAAGTTT      1020
ACTCATATAT ACTTTAGATT GATTTAAAAC TTCATTTTTA ATTTAAAAGG ATCTAGGTGA      1080
AGATCCTTTT TGGCTCGAGT CTCATGACCA AAATCCCTTA ACGTGAGTTT TCGTTCCACT      1140
GAGCGTCAGA CCCCGTAGAA AAGATCAAAG GATCTTCTTG AGATCCTTTT TTTCTGCGCG      1200
TAATCTGCTG CTTGCAAACA AAAAAACCAC CGCTACCAGC GGTGGTTTGT TTGCCGGATC      1260
AAGAGCTACC AACTCTTTTT CCGAAGGTAA CTGGCTTCAG CAGAGCGCAG ATACCAAATA      1320
CTGTCCTTCT AGTGTAGCCG TAGTTAGGCC ACCACTTCAA GAACTCTGTA GCACCGCCTA      1380
CATACCTCGC TCTGCTAATC CTGTTACCAG TGGCTGCTGC CAGTGGCGAT AAGTCGTGTC      1440
TTACCGGGTT GGACTCAAGA CGATAGTTAC CGGATAAGGC GCAGCGGTCG GGCTGAACGG      1500
GGGGTTCGTG CACACAGCCC AGCTTGGAGC GAACGACCTA CACCGAACTG AGATACCTAC      1560
AGCGTGAGCA TTGAGAAAGC GCCACGCTTC CCGAAGGGAG AAAGGCGGAC AGGTATCCGG      1620
TAAGCGGCAG GGTCGGAACA GGAGAGCGCA CGAGGGAGCT TCCAGGGGGA AACGCCTGGT      1680
ATCTTTATAG TCCTGTCGGG TTTCGCCACC TCTGACTTGA GCGTCGATTT TTGTGATGCT      1740
CGTCAGGGGG GCGGAGCCTA TGGAAAAACG CCAGCAACGC GGCCTTTTTA CGGTTCCTGG      1800
CCTTTTGCTG GCCTTTTGCT CACATGTTCT TTCCTGCGTT ATCCCCTGAT TCTGTGGATA      1860
ACCGTATTAC CGCCTTTGAG TGAGCTGATA CCGCTCGCCG CAGCCGAACG ACCGAGCGCA      1920
GCGAGTCAGT GAGCGAGGAA GCGGAAGAGC GCCCAATACG CAAACCGCCT CTCCCCGCGC      1980
GTTGGCCTGA TCAGAATTTC GAGGTCATTC ATATGCTTGA GAAGAGAGTC GGGATAGTCC      2040
AAAATAAAAC AAAGGTAAGA TTACCTGGTC AAAAGTGAAA ACATCAGTTA AAAGGTGGTA      2100
TAAAGTAAAA TATCGGTAAT AAAAGGTGGC CCAAAGTGAA ATTTACTCTT TTCTACTATT      2160
ATAAAAATTG AGGATGTTTT TGTCGGTACT TTGATACGTC ATTTTTGTAT GAATTGGTTT      2220
TTAAGTTTAT TCGCTTTTGG AAATGCATAT CTGTATTTGA GTCGGGTTTT AAGTTCGTTT      2280
GCTTTTGTAA ATACAGAGGG ATTTGTATAA GAAATATCTT TAAAAAAACC CATATGCTAA      2340
TTTGACATAA TTTTTGAGAA AAATATATAT TCAGGCGAAT TCTCACAATG AACAATAATA      2400
AGATTAAAAT AGCTTTCCCC CGTTGCAGCG CATGGGTATT TTTTCTAGTA AAAATAAAAG      2460
ATAAACTTAG ACTCAAAACA TTTACAAAAA CAACCCCTAA AGTTCCTAAA GCCCAAAGTG      2520
CTATCCACGA TCCATAGCAA GCCCAGCCCA ACCCAACCCA ACCCAACCCA CCCCAGTCCA      2580
GCCAACTGGA CAATAGTCTC CACACCCCCC CACTATCACC GTGAGTTGTC CGCACGCACC      2640
GCACGTCTCG CAGCCAAAAA AAAAAAAAGA AAGAAAAAAA AGAAAAAGAA AAAACAGCAG      2700
GTGGGTCCGG GTCGTGGGGG CCGGAAACGC GAGGAGGATC GCGAGCCAGC GACGAGGCCG      2760
GCCCTCCCTC CGCTTCCAAA GAAACGCCCC CCATCGCCAC TATATACATA CCCCCCCCTC      2820
TCCTCCCATC CCCCCAACCC TACCACCACC ACCACCACCA CCTCCACCTC CTCCCCCCTC      2880
GCTGCCGGAC GACGAGCTCC TCCCCCCTCC CCCTCCGCCG CCGCCGCGCC GGTAACCACC      2940
CCGCCCCTCT CCTCTTTCTT TCTCCGTTTT TTTTTTCCGT CTCGGTCTCG ATCTTTGGCC      3000
TTGGTAGTTT GGGTGGGCGA GAGGCGGCTT CGTGCGCGCC CAGATCGGTG CGCGGGAGGG      3060
GCGGGATCTC GCGGCTGGGG CTCTCGGCGG CGTGGATCCG GCCCGGATCT CGCGGGGAAT      3120
GGGGCTCTCG GATGTAGATC TGCGATCCGC CGTTGTTGGG GGAGATGATG GGGGGTTTAA      3180
AATTTCCGCC ATGCTAAACA AGATCAGGAA GAGGGGAAAA GGGCACTATG GTTTATATTT      3240
TTATATATTT CTGCTGCTTC GTCAGGCTTA GATGTGCTAG ATCTTTCTTT CTTCTTTTTG      3300
TGGGTAGAAT TTGAATCCCT CAGCATTGTT CATCGGTAGT TTTTCTTTTC ATGATTTGTG      3360
ACAAATGCAG CCTCGTGCGG AGCTTTTTTG TAGGTAGACC ATGGCCAAAA AAGCAGTCAT      3420
TAACGGGGAA CAAATCAGAA GTATCAGCGA CCTCCACCAG ACATTGAAAA AGGAGCTTGC      3480
CCTTCCGGAA TACTACGGTG AAAACCTGGA CGCTTTATGG GATTGTCTGA CCGGATGGGT      3540
GGAGTACCCG CTCGTTTTGG AATGGAGGCA GTTTGAACAA AGCAAGCAGC TGACTGAAAA      3600
TGGCGCCGAG AGTGTGCTTC AGGTTTTCCG TGAAGCGAAA GCGGAAGGCT GCGACATCAC      3660
CATCATACTT TCTTAATACG ATCAATGGGA GATGAACAAT ATGGAAACAC AAACCCGCAA      3720
GCTAGCTTGG CTCTAGAGGA TCCGAAGCAG ATCGTTCAAA CATTTGGCAA TAAAGTTTCT      3780
TAAGATTGAA TCCTGTTGCC GGTCTTGCGA TGATTATCAT ATAATTTCTG TTGAATTACG      3840
TTAAGCATGT AATAATTAAC ATGTAATGCA TGACGTTATT TATGAGATGG GTTTTTATGA      3900
TTAGAGTCCC GCAATTATAC ATTTAATACG CGATAGAAAA CAAAATATAG CGCGCAAACT      3960
AGGATAAATT ATCGCGCGCG GTGTCATCTA TGTTACTAGA TCGGGAAGAT CCCCGGGTAC      4020
CGAGCTCGAA TT                                                          4032
(2)SEQ ID NO:6的资料:
(i)序列特征:
(A)长度:563个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“质粒pLH43的部分”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:1..6
(D)其它资料:/标记=NcoI
     /注解=“NcoI识别位点”
(ix)特征:
(A)名称/键:-
(B)位置:3..278
(D)其它资料:/标记=synb*
    /注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
    (A)名称/键:-
    (B)位置:279..545
    (D)其它资料:/标记=3’nos
         /注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3,
                 未转译末端的区域”
(ix)特征:
    (A)名称/键:-
    (B)位置:558..563
    (D)其它资料:/标记=KpnI
         /注解=“KpnI识别位点”
(xi)序列描述:SEQ ID NO:6:
CCATGGCCAA GAAGGCTGTC ATCAACGGGG AGCAGATCAG GAGCATCAGC GACCTCCACC       60
AGACCCTCAA GAAGGAGCTT GCCCTTCCGG AGTACTACGG TGAGAACCTC GACGCCCTCT       120
GGGACTGCCT CACCGGCTGG GTGGAGTACC CCCTCGTGTT GGAGTGGAGG CAGTTCGAGC       180
AGAGCAAGCA GCTCACCGAG AACGGCGCCG AGAGCGTGCT CCAAGTGTTC AGGGAGGCCA       240
AGGCCGAGGG CTGCGACATC ACCATCATCC TCTCCTGATG GATCCGAAGC AGATCGTTCA       300
AACATTTGGC AATAAAGTTT CTTAAGATTG AATCCTGTTG CCGGTCTTGC GATGATTATC       360
ATATAATTTC TGTTGAATTA CGTTAAGCAT GTAATAATTA ACATGTAATG CATGACGTTA       420
TTTATGAGAT GGGTTTTTAT GATTAGAGTC CCGCAATTAT ACATTTAATA CGCGATAGAA       480
AACAAAATAT AGCGCGCAAA CTAGGATAAA TTATCGCGCG CGGTGTCATC TATGTTACTA       540
GATCGGGAAG ATCCCCGGGT ACC                                               563
(2)SEQ ID NO:7的资料:
  (i)序列特征:
    (A)长度:5349个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:线性
  (ii)分子类型:其它核酸
    (A)描述:/desc=“质粒pTTS24的T-DNA”
  (iii)推测:不是
  (iv)反义:不是
  (ix)特征:
    (A)名称/键:-
    (B)位置:补体(1..25)
  (D)其它资料:/标记=RB
        /注解=“ T-DNA右边界”
(ix)特征:
  (A)名称/键:-
  (B)位置:补体(98..331)
  (D)其它资料:/标记=3’g7
        /注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
               未转译末端的区域”
(ix)特征:
  (A)名称/键:-
  (B)位置:补体(332..883)
  (D)其它资料:/标记=bar
        /注解=“编码膦苏菌素乙酰基转移酶的区域”
(ix)特征:
  (A)名称/键:-
  (B)位置:补体(884..2258)
  (D)其它资料:/标记=P35S
        /注解=“花椰菜花叶病毒的35S启动子”
(ix)特征:
  (A)名称/键:-
  (B)位置:2281..3969
  (D)其它资料:/标记=PE1
       /注解=“水稻的E1基因的启动子(WO92/13956)”
(ix)特征:
  (A)名称/键:-
  (B)位置:3970..4245
(D)其它资料:/标记=synb*
      /注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
  (A)名称/键:-
  (B)位置:  4246..4577
  (D)其它资料:/标记=3’chs
       /注解=“含有苯基苯乙烯酮合成酶基因的3’未转译末端的
               区域”
(ix)特征:
  (A)名称/键:-
  (B)位置:补体(5325..5349)
  (D)其它资料:/标记=LB
     /注解=“T-DNA左边界”
(xi)序列描述:SEQ ID NO:7
AATTACAACG GTATATATCC TGCCAGTACT CGGCCGTCGA ACTCGGCCGT CGAGTACATG       60
GTCGATAAGA AAAGGCAATT TGTAGATGTT AATTCCCATC TTGAAAGAAA TATAGTTTAA       120
ATATTTATTG ATAAAATAAC AAGTCAGGTA TTATAGTCCA AGCAAAAACA TAAATTTATT       180
GATGCAAGTT TAAATTCAGA AATATTTCAA TAACTGATTA TATCAGCTGG TACATTGCCG       240
TAGATGAAAG ACTGAGTGCG ATATTATGTG TAATACATAA ATTGATGATA TAGCTAGCTT       300
AGCTCATCGG GGGATCCTAG AACGCGTGAT CTCAGATCTC GGTGACGGGC AGGACCGGAC       360
GGGGCGGTAC CGGCAGGCTG AAGTCCAGCT GCCAGAAACC CACGTCATGC CAGTTCCCGT       420
GCTTGAAGCC GGCCGCCCGC AGCATGCCGC GGGGGGCATA TCCGAGCGCC TCGTGCATGC       480
GCACGCTCGG GTCGTTGGGC AGCCCGATGA CAGCGACCAC GCTCTTGAAG CCCTGTGCCT       540
CCAGGGACTT CAGCAGGTGG GTGTAGAGCG TGGAGCCCAG TCCCGTCCGC TGGTGGCGGG       600
GGGAGACGTA CACGGTCGAC TCGGCCGTCC AGTCGTAGGC GTTGCGTGCC TTCCAGGGGC       660
CCGCGTAGGC GATGCCGGCG ACCTCGCCGT CCACCTCGGC GACGAGCCAG GGATAGCGCT       720
CCCGCAGACG GACGAGGTCG TCCGTCCACT CCTGCGGTTC CTGCGGCTCG GTACGGAAGT       780
TGACCGTGCT TGTCTCGATG TAGTGGTTGA CGATGGTGCA GACCGCCGGC ATGTCCGCCT       840
CGGTGGCACG GCGGATGTCG GCCGGGCGTC GTTCTGGGTC CATGGTTATA GAGAGAGAGA       900
TAGATTTATA GAGAGAGACT GGTGATTTCA GCGTGTCCTC TCCAAATGAA ATGAACTTCC       960
TTATATAGAG GAAGGGTCTT GCGAAGGATA GTGGGATTGT GCGTCATCCC TTACGTCAGT       1020
GGAGATGTCA CATCAATCCA CTTGCTTTGA AGACGTGGTT GGAACGTCTT CTTTTTCCAC       1080
GATGCTCCTC GTGGGTGGGG GTCCATCTTT GGGACCACTG TCGGCAGAGG CATCTTGAAT       1140
GATAGCCTTT CCTTTATCGC AATGATGGCA TTTGTAGGAG CCACCTTCCT TTTCTACTGT       1200
CCTTTCGATG AAGTGACAGA TAGCTGGGCA ATGGAATCCG AGGAGGTTTC CCGAAATTAT       1260
CCTTTGTTGA AAAGTCTCAA TAGCCCTTTG GTCTTCTGAG ACTGTATCTT TGACATTTTT       1320
GGAGTAGACC AGAGTGTCGT GCTCCACCAT GTTGACGAAG ATTTTCTTCT TGTCATTGAG       1380
TCGTAAAAGA CTCTGTATGA ACTGTTCGCC AGTCTTCACG GCGAGTTCTG TTAGATCCTC       1440
GATTTGAATC TTAGACTCCA TGCATGGCCT TAGATTCAGT AGGAACTACC TTTTTAGAGA       1500
CTCCAATCTC TATTACTTGC CTTGGTTTAT GAAGCAAGCC TTGAATCGTC CATACTGGAA       1560
TAGTACTTCT GATCTTGAGA AATATGTCTT TCTCTGTGTT CTTGATGCAA TTAGTCCTGA       1620
ATCTTTTGAC TGCATCTTTA ACCTTCTTGG GAAGGTATTT GATCTCCTGG AGATTGTTAC       1680
TCGGGTAGAT CGTCTTGATG AGACCTGCTG CGTAGGCCTC TCTAACCATC TGTGGGTCAG       1740
CATTCTTTCT GAAATTGAAG AGGCTAACCT TCTCATTATC AGTGGTGAAC ATAGTGTCGT       1800
CACCTTCACC TTCGAACTTC CTTCCTAGAT CGTAAAGATA GAGGAAATCG TCCATTGTAA          1860
TCTCCGGGGC AAAGGAGATC TCTTTTGGGG CTGGATCACT GCTGGGCCTT TTGGTTCCTA          1920
GCGTGAGCCA GTGGGCTTTT TGCTTTGGTG GGCTTGTTAG GGCCTTAGCA AAGCTCTTGG          1980
GCTTGAGTTG AGCTTCTCCT TTGGGGATGA AGTTCAACCT GTCTGTTTGC TGACTTGTTG          2040
TGTACGCGTC AGCTGCTGCT CTTGCCTCTG TAATAGTGGC AAATTTCTTG TGTGCAACTC          2100
CGGGAACGCC GTTTGTTGCC GCCTTTGTAC AACCCCAGTC ATCGTATATA CCGGCATGTG          2160
GACCGTTATA CACAACGTAG TAGTTGATAT GAGGGTGTTG AATACCCGAT TCTGCTCTGA          2220
GAGGAGCAAC TGTGCTGTTA AGCTCAGATT TTTGTGGGCC CGGGCCTAGG CTAGCGGCCG          2280
CAGATCCTTC TGTGTGATTG TTTTATTAAA ATTTAATATT TATCTGGAAT ACCTACCAAT          2340
ATATAGTAGA CTTGTCAAGC TGCAAGAACT TCCAATCGCC GACAATACCA ATAGAGATCC          2400
AACCACCTTA ATATCATAAA CAATCTGATT GTTAGTCCAG AACTATATTG AGTAGTGAAC          2460
AACAATAGCA CATTAACATT ATGAGGATTA TTGGCTAACT CTGCAATTCA ATATTCTGAT          2520
GCGTCTAATC TGGTCAATTT TAGCGCTCCA GAAAGAATTG CACAATCCTT GGACA ATGTT         2580
GGCACTGGAA CTGTTGCATG TTTTTACATC TCTTATTAAC GTAGCAAAGG AGTAGATTAT          2640
TATGTACCAG GAGAAATCTC TTCAGATCCT TTCCACATGC AATGTCGTAA AGAACAGATA          2700
CAGTGTACGT TAGTTTGTAA TGGACGGTCA ATGCCATTTC TCTGAAGGCA TGTTCAGAGA          2760
TGATGATTTC TGGGATCCTT GGAGGGGCCC TGAAATTCGG AAACAGTTAG TTGAGTTTTA          2820
GTACCTAATG TCTTGCGTTA TACTACGTGA AATGCCATTT CTGTAAGCTG AGTTTTCTAC          2880
CATCTCCACA GGAAATAAAG CTAATACCTG TCCAAGAGTG GTGCGGCATT TGACCAAATG          2940
AAGATCACAA GCATGGCAAG AATGGCAATC TGGCAAAGGA GCGGAATTAT ATTGTATTCT          3000
ACTACATCGA ACAGGAACCA TATCAATGTT GCCCCAGCAA GGACCCCCGC AGATAAGTTC          3060
CTGTTCTTCC ACAGCAGAAT ATCCGCAACT GCATAGCTCC CAACAATGAA ATCCAAAACC          3120
ACATCGGCTC AGAGAGAAGT TATGATAAAA GGCACTAATT CTGAATAATT TCCTAGAAAG          3180
CGAATAATAA TAGCACACCT TGACCTCCAC CAAGAAGCTT GTGGATCGAC TTGTGCCCAT          3240
GAAATGGCAT TCTGACATTC TGGTCACTGT CAGAATCTCT CGGAAAATGA GGAGGCATAG          3300
CTTCGTGTGT GTATGTGTGT GGGATATTAC GCTGCTAAAA CTTTGTGTTT CTGATCGATC          3360
TGGTTAGAGA GCATCGTCTT TATAAGCACT TAAAAATGGT AGTATAATCT CTCAAGGAGC          3420
CTATACTGCC AAGGAAAGGA TAGCTTGGCC TGTGGGGATT GAGCCGTTGA AGGGAACAAA          3480
CGAATACAGT TACCTTACCA GATGTTTGCC ACGACATGGG CAACGTCATT GCTAGACCAA          3540
GAAGGCAAGA AGCAAAGTTT AGCTGTCAAA AAAGATATGC TAGAGGCTTT CCAGAATATG          3600
TTCTATCTCA GCCAGACCAA TGGGGGCAAA ATTTACTACT ATTTGCCATA CATTAACCAC          3660
GTAAAAGTCC TACACTCAAC CTAACTGTTG AACGGTCCTG TTCTGGCCAA CGGTGAGAAT          3720
GCACCTAATG GACGGGACAA CACTTCTTTC ACCGTGCTAC TGCTACATCC TGTAGACGGT          3780
GGACGCGTGA GGTGCTTTCG CCATGACCGT CCTTGGTTGT TGCAGTCACT TGCGCACGCT          3840
TGCACCGTGA CTCACCTGCC ACATTGCCCC CGCCGTCGCC GGCGCCTACA AAAGCCACAC          3900
ACGCACGCCG GCCACGATAA CCCATCCTAG CATCCCGGTG TCCAGCAAGA GATCCATCAA      3960
GCCGTCGCGA TGGCCAAGAA GGCTGTCATC AACGGGGAGC AGATCAGGAG CATCAGCGAC      4020
CTCCACCAGA CCCTCAAGAA GGAGCTTGCC CTTCCGGAGT ACTACGGTGA GAACCTCGAC      4080
GCCCTCTGGG ACTGCCTCAC CGGCTGGGTG GAGTACCCCC TCGTGTTGGA GTGGAGGCAG      4140
TTCGAGCAGA GCAAGCAGCT CACCGAGAAC GGCGCCGAGA GCGTGCTCCA AGTGTTCAGG      4200
GAGGCCAAGG CCGAGGGCTG CGACATCACC ATCATCCTCT CCTGATGGAT CTGGGGCCGC      4260
TCTAGAACTA GTGGATCCCC CGGGCTGCAG GTCGGGTTGG GTTATTTTCT TATTTCCGTA      4320
ATAAAAAAGT GGACATGGTT ACCTATTATT GTGATGTGTG CTGCATGTGA GCTATATTGG      4380
CGATTTCTCT CTTGTAACGC TTTGTACTTG TACCGTTTCG TTGTGATCAT TGAAATAAAG      4440
GCCTATATAA AAATAATTTA TGTTATTTGT TGGTTTATGT GTGTGTTTTT TTTTTTTTTT      4500
TTTAGTCAAA ATATTTAAGT ATTTCTATAT AAATCTTTTG CAAGTTTTTT AAGTCATGGA      4560
GGAGATGTTA TGAATTCTGT AATATAGTAA AAATATTACG TGAAAAACCA GAGGATCCGG      4620
GGAATTCCCA GATCCGCCTA CCTTTCACGA GTTGCGCAGT TTGTCTGCAA GACTCTATGA      4680
GAAGCAGATA AGCGATAAGT TTGCTCAACA TCTTCTCGGG CATAAGTCGG ACACCATGGC      4740
ATCACAGTAT CGTGATGACA GAGGCAGGGA GTGGGACAAA ATTGAAATCA AATAATGATT      4800
TTATTTTGAC TGATAGTGAC CTGTTCGTTG CAACAAATTG ATAAGCAATG CTTTTTTATA      4860
ATGCCAACTT AGTATAAAAA AGCAGGCTTC ATCCGGATTC TCTGAGCCCA CCGTGTTCAC      4920
CACCACCGTG GTGCTGTTAC GTCTGGCTTT CAGCTGAATG GTGCAGTTCT GTACCGGTTT      4980
TCCTGTGCCG TCTTTCAGGA CTCCTGAAAT CTTTACTGCC ATATTCACCC CACAAAAAAG      5040
CCCACCGGTT CCGGCGGGCT GTCATAACAC TGTGTTACCT GGCTAATCAG AATTTATAAC      5100
CGACCCCAAC GATGAATCCG TCAGTACGCC AGTCGCCACT GCCGGAGCCT TCATAAGCAA      5160
TATCAACAAC GACGGACGCT GCCGGATTAA TCTGTATACC TGCACTCCAC GCCACTGAGG      5220
TATGCCGCAT TGCACTTTCG TCCCTGGCAG TGGTCGTCTC TTTCATATAC CCGACTCTAG      5280
AGGATCCCCC GGGTACCGAG CTCTCCCCAG ATCTGCATGG AGCCATTTAC AATTGAATAT      5340
ATCCTGCCG                                                              5349
(2)SEQ ID NO:8的资料:
  (i)序列特征:
    (A)长度:24个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线性
  (ii)分子类型:其它核酸
    (A)描述:/desc=“寡核苷酸CASOLX1”
  (iii)推测:不是
  (iv)反义:不是
  (ix)特征:
    (A)名称/键:-
    (B)位置:10..15
    (D)其它资料:/标记=KpnI
        /注解=“KpnI识别位点”
  (xi)序列描述:SEQ ID NO:8的资料:
CAGCCTGCCG GTACCGCCCC GTCC                  24
(2)SEQ ID NO:9的资料:
  (i)序列特征:
    (A)长度:50个碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线性
  (ii)分子类型:其它核酸
    (A)描述:/desc=“寡核苷酸CASOLX2”
  (iii)推测:不是
  (iv)反义:不是
  (ix)特征:
    (A)名称/键:-
    (B)位置:5..10
    (D)其它资料:/标记=AatII
         /注解=“AatII识别位点”
  (ix)特征:
    (A)名称/键:-
    (B)位置:30..50
    (D)其它资料:/标记=3’g7
         /注解=“含有农杆菌T-DNA的3’未转译末端的部分”
  (xi)序列描述:SEQ ID NO:9
CCCCGACGTC AAGCTTGAAT TCGCGATACG TACATGGTCG ATAAGAAAAG    50
(2)(2)SEQ ID NO:10的资料:
  (i)序列特征:
    (A)长度:5611个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:环状
  (ii)分子类型:其它核酸
     (A)描述:/desc=“质粒pLH48”
  (iii)推测:不是
  (iv)反义:不是
  (ix)特征:
    (A)名称/键:-
    (B)位置:补体(39..317)
    (D)其它资料:/标记=3’nos
        /注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
               未转译末端的区域”
  (ix)特征:
    (A)名称/键:-
    (B)位置:补体(318..869)
    (D)其它资料:/标记=bar
        /注解=“编码膦苏菌素乙酰基转移酶的区域”
  (ix)特征:
    (A)名称/键:-
    (B)位置:补体(870..1702)
    (D)其它资料:/标记=P35S
        /注解=“花椰菜花叶病毒的35S启动子”
  (ix)特征:
    (A)名称/键:-
    (B)位置:1740..2284
    (D)其它资料:/标记=PTA29
        /注解=“烟草TA29基因的启动子”
  (ix)特征:
    (A)名称/键:-
    (B)位置:2285..2560
    (D)其它资料:/标记=synb*
          /注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
  (A)名称/键:-
  (B)位置:2561..2892
  (D)其它资料:/标记=3’chs
       /注解=“含有苯基苯乙烯酮合成酶基因的3’未转译末端的
               区域”
  (xi)序列描述:SEQ ID NO:10:
AGCTTGCATG CCTGCAGGTC GACTCTAGAG GATCTTCCCG ATCTAGTAAC ATAGATGACA       60
CCGCGCGCGA TAATTTATCC TAGTTTGCGC GCTATATTTT GTTTTCTATC GCGTATTAAA       120
TGTATAATTG CGGGACTCTA ATCATAAAAA CCCATCTCAT AAATAACGTC ATGCATTACA       180
TGTTAATTAT TACATGCTTA ACGTAATTCA ACAGAAATTA TATGATAATC ATCGCAAGAC       240
CGGCAACAGG ATTCAATCTT AAGAAACTTT ATTGCCAAAT GTTTGAACGA TCTGCTTCGG       300
ATCCTAGACG CGTGAGATCA GATCTCGGTG ACGGGCAGGA CCGGACGGGG CGGTACCGGC       360
AGGCTGAAGT CCAGCTGCCA GAAACCCACG TCATGCCAGT TCCCGTGCTT GAAGCCGGCC       420
GCCCGCAGCA TGCCGCGGGG GGCATATCCG AGCGCCTCGT GCATGCGCAC GCTCGGGTCG       480
TTGGGCAGCC CGATGACAGC GACCACGCTC TTGAAGCCCT GTGCCTCCAG GGACTTCAGC       540
AGGTGGGTGT AGAGCGTGGA GCCCAGTCCC GTCCGCTGGT GGCGGGGGGA GACGTACACG       600
GTCGACTCGG CCGTCCAGTC GTAGGCGTTG CGTGCCTTCC AGGGGCCCGC GTAGGCGATG       660
CCGGCGACCT CGCCGTCCAC CTCGGCGACG AGCCAGGGAT AGCGCTCCCG CAGACGGACG       720
AGGTCGTCCG TCCACTCCTG CGGTTCCTGC GGCTCGGTAC GGAAGTTGAC CGTGCTTGTC       780
TCGATGTAGT GGTTGACGAT GGTGCAGACC GCCGGCATGT CCGCCTCGGT GGCACGGCGG       840
ATGTCGGCCG GGCGTCGTTC TGGGTCCATG GTTATAGAGA GAGAGATAGA TTTATAGAGA       900
GAGACTGGTG ATTTCAGCGT GTCCTCTCCA AATGAAATGA ACTTCCTTAT ATAGAGGAAG       960
GGTCTTGCGA AGGATAGTGG GATTGTGCGT CATCCCTTAC GTCAGTGGAG ATGTCACATC       1020
AATCCACTTG CTTTGAAGAC GTGGTTGGAA CGTCTTCTTT TTCCACGATG CTCCTCGTGG       1080
GTGGGGGTCC ATCTTTGGGA CCACTGTCGG CAGAGGCATC TTGAATGATA GCCTTTCCTT       1140
TATCGCAATG ATGGCATTTG TAGGAGCCAC CTTCCTTTTC TACTGTCCTT TCGATGAAGT       1200
GACAGATAGC TGGGCAATGG AATCCGAGGA GGTTTCCCGA AATTATCCTT TGTTGAAAAG       1260
TCTCAATAGC CCTTTGGTCT TCTGAGACTG TATCTTTGAC ATTTTTGGAG TAGACCAGAG     1320
TGTCGTGCTC CACCATGTTG ACGAAGATTT TCTTCTTGTC ATTGAGTCGT AAAAGACTCT     1380
GTATGAACTG TTCGCCAGTC TTCACGGCGA GTTCTGTTAG ATCCTCGATT TGAATCTTAG     1440
ACTCCATGCA TGGCCTTAGA TTCAGTAGGA ACTACCTTTT TAGAGACTCC AATCTCTATT     1500
ACTTGCCTTG GTTTATGAAG CAAGCCTTGA ATCGTCCATA CTGGAATAGT ACTTCTGATC     1560
TTGAGAAATA TGTCTTTCTC TGTGTTCTTG ATGCAATTAG TCCTGAATCT TTTGACTGCA     1620
TCTTTAACCT TCTTGGGAAG GTATTTGATC TCCTGGAGAT TGTTACTCGG GTAGATCGTC     1680
TTGATGAGAC CTGCTGCGTA GGAGCTTGCA TGCCTGCAGG TCGACTCTAG AGGATCCCCA     1740
TCTAGCTAAG TATAACTGGA TAATTTGCAT TAACAGATTG AATATAGTGC CAAACAAGAA     1800
GGGACAATTG ACTTGTCACT TTATGAAAGA TGATTCAAAC ATGATTTTTT ATGTACTAAT     1860
ATATACATCC TACTCGAATT AAAGCGACAT AGGCTCGAAG TATGCACATT TAGCAATGTA     1920
AATTAAATCA GTTTTTGAAT CAAGCTAAAA GCAGACTTGC ATAAGGTGGG TGGCTGGACT     1980
AGAATAAACA TCTTCTCTAG CACAGCTTCA TAATGTAATT TCCATAACTG AAATCAGGGT     2040
GAGACAAAAT TTTGGTACTT TTTCCTCACA CTAAGTCCAT GTTTGCAACA AATTAATACA     2100
TGAAACCTTA ATGTTACCCT CAGATTAGCC TGCTACTCCC CATTTTCCTC GAAATGCTCC     2160
AACAAAAGTT AGTTTTGCAA GTTGTTGTGT ATGTCTTGTG CTCTATATAT GCCCTTGTGG     2220
TGCAAGTGTA ACAGTACAAC ATCATCACTC AAATCAAAGT TTTTACTTAA AGAAATTAGC     2280
TACCATGGCC AAGAAGGCTG TCATCAACGG GGAGCAGATC AGGAGCATCA GCGACCTCCA     2340
CCAGACCCTC AAGAAGGAGC TTGCCCTTCC GGAGTACTAC GGTGAGAACC TCGACGCCCT     2400
CTGGGACTGC CTCACCGGCT GGGTGGAGTA CCCCCTCGTG TTGGAGTGGA GGCAGTTCGA     2460
GCAGAGCAAG CAGCTCACCG AGAACGGCGC CGAGAGCGTG CTCCAAGTGT TCAGGGAGGC     2520
CAAGGCCGAG GGCTGCGACA TCACCATCAT CCTCTCCTGA TGGATCTGGG GCCGCTCTAG     2580
AACTAGTGGA TCCCCCGGGC TGCAGGTCGG GTTGGGTTAT TTTCTTATTT CCGTAATAAA     2640
AAAGTGGACA TGGTTACCTA TTATTGTGAT GTGTGCTGCA TGTGAGCTAT ATTGGCGATT     2700
TCTCTCTTGT AACGCTTTGT ACTTGTACCG TTTCGTTGTG ATCATTGAAA TAAAGGCCTA     2760
TATAAAAATA ATTTATGTTA TTTGTTGGTT TATGTGTGTG TTTTTTTTTT TTTTTTTTAG     2820
TCAAAATATT TAAGTATTTC TATATAAATC TTTTGCAAGT TTTTTAAGTC ATGGAGGAGA     2880
TGTTATGAAT TCTGTAATAT AGTAAAAATA TTACGTGAAA AACCAGAGGA TCCGGGGAAT     2940
TCCCAGATCC GCCTACCTTT CACGAGTTGC GCAGTTTGTC TGCAAGACTC TATGAGAAGC     3000
AGATAAGCGA TAAGTTTGCT CAACATCTTC TCGGGCATAA GTCGGACACC ATGGCATCAC     3060
AGTATCGTGA TGACAGAGGC AGGGAGTGGG ACAAAATTGA AATCAAATAA TGATTTTATT     3120
TTGACTGATA GTGACCTGTT CGTTGCAACA AATTGATAAG CAATGCTTTT TTATAATGCC     3180
AACTTAGTAT AAAAAAGCAG GCTTCATCCG GATTCTCTGA GCCCACCGTG TTCACCACCA     3240
CCGTGGTGCT GTTACGTCTG GCTTTCAGCT GAATGGTGCA GTTCTGTACC GGTTTTCCTG     3300
TGCCGTCTTT CAGGACTCCT GAAATCTTTA CTGCCATATT CACCCCACAA AAAAGCCCAC     3360
CGGTTCCGGC GGGCTGTCAT AACACTGTGT TACCTGGCTA ATCAGAATTT ATA ACCGACC      3420
CCAACGATGA ATCCGTCAGT ACGCCAGTCG CCACTGCCGG AGCCTTCATA AGCAATATCA       3480
ACAACGACGG ACGCTGCCGG ATTAATCTGT ATACCTGCAC TCCACGCCAC TGAGGTATGC       3540
CGCATTGCAC TTTCGTCCCT GGCAGTGGTC GTCTCTTTCA TATACCCGAC TCTAGAGGAT       3600
CCCCCGGGTA CCGAGCTCGA ATTCTGATCA GGCCAACGCG CGGGGAGAGG CGGTTTGCGT       3660
ATTGGGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT TCGGCTGCGG       3720
CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC       3780
GCAGGAAAGA ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAAGGCCGCG       3840
TTGCTGGCGT TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA       3900
AGTCAGAGGT GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC       3960
TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC CGCCTTTCTC       4020
CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG TTCGGTGTAG       4080
GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC       4140
TTATCCGGTA ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA       4200
GCAGCCACTG GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG       4260
AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG CGCTCTGCTG       4320
AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT       4380
GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA AGGATCTCAA       4440
GAAGATCCTT TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA       4500
GGGATTTTGG TCATGAGACT CGAGCCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA       4560
AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA       4620
TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC       4680
TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT       4740
GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA       4800
GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT       4860
AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT       4920
GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC       4980
GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC       5040
TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT       5100
ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT       5160
GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC       5220
CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT       5280
GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG       5340
ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT       5400
GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA       5460
TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT      5520
CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC      5580
ACATTTCCCC GAAAAGTGCC ACCTGACGTC A                                     5611

Claims (32)

1.包括编码芽孢杆菌RNA酶抑制剂蛋白质的芽孢杆菌RNA酶抑制剂DNA的DNA,所述芽孢杆菌RNA酶抑制剂蛋白质具有以Met-Xaa开头的氨基酸序列,其中Xaa选自于由丙氨酸,缬氨酸,甘氨酸,天冬氨酸和谷氨酸组成的组,并且其中所述芽孢杆菌RNA酶抑制剂蛋白质与SEQ ID No.2具有至少80%的氨基酸序列相同性且能够抑制至少50%的芽孢杆菌RNA酶活性。
2.根据权利要求1所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA编码具有选自于下列组的氨基酸序列的芽孢杆菌RNA酶抑制剂:
(a)SEQ ID No.2的氨基酸序列,其中第二氨基酸赖氨酸被丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸替换;和
(b)SEQ ID No.2的氨基酸序列,其中在SEQ ID No.2的第一个氨基酸甲硫氨酸和SEQ ID No.2的第二个氨基酸赖氨酸之间插入氨基酸丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
3.根据权利要求2所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA含有低于40%的A和T核苷酸。
4.根据权利要求1-3任一项所述的DNA,该DNA具有对油菜,棉花,玉米,水稻和小麦该DNA最佳的惯用密码子。
5.根据权利要求1-3任一项所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA含有仅仅7%的CG二核苷酸和含有仅仅9.5%的CNG三核苷酸。
6.根据权利要求4所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA编码具有SEQ ID No.4的氨基酸序列的芽孢杆菌RNA酶抑制剂。
7.根据权利要求6所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA具有SEQ ID No.3的核苷酸序列。
8.根据权利要求2所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA具有核苷酸序列ATGGCC,后面连接SEQ ID No.1的第7和270位之间的核苷酸序列。
9.根据权利要求1-3和6-8任一项所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA与指导在植物细胞中转录的启动子可操作连接。
10.根据权利要求9所述的DNA,其中所述启动子是指导在植物的雄蕊细胞中选择性地转录的启动子。
11.根据权利要求10所述的DNA,其中所述启动子是指导至少在植物的毡绒层细胞中转录的启动子。
12.根据权利要求11所述的DNA,其中所述的启动子是烟草的TA29基因的启动子,玉米CA55基因的启动子或水稻的E1,T72或T42基因的启动子。
13.根据权利要求9所述的DNA,其中所述启动子是组成型启动子。
14.根据权利要求13所述的DNA,其中所述启动子是35S启动子。
15.包括权利要求9所述的DNA的植物细胞。
16.根据权利要求15所述的植物细胞,该植物细胞也包括芽孢杆菌RNA酶DNA。
17.根据权利要求15或16所述的植物细胞,该植物细胞是油菜,棉花,玉米,水稻或小麦的细胞。
18.根据权利要求15或16所述的植物细胞,该植物细胞是单子叶植物细胞。
19.根据权利要求18所述的植物细胞,该植物细胞每毫克的总蛋白质产生至少20纳克芽孢杆菌RNA酶抑制剂。
20.具有以Met-Xaa开头的氨基酸序列的芽孢杆菌RNA酶抑制剂蛋白质,其中Xaa选自于由丙氨酸,缬氨酸,甘氨酸,天冬氨酸和谷氨酸组成的组,并且其中所述芽孢杆菌RNA酶抑制剂蛋白质与SEQ ID No.2具有至少80%的氨基酸序列相同性且能够抑制至少50%的芽孢杆菌RNA酶活性。
21.根据权利要求20所述的芽孢杆菌RNA酶抑制剂蛋白质,具有选自于下列组的氨基酸序列:
(a)SEQ ID No.2的氨基酸序列,其中第二氨基酸赖氨酸被丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸替换;和
(b)SEQ ID No.2的氨基酸序列,其中在SEQ ID No.2的第一个氨基酸甲硫氨酸和SEQ ID N0.2的第二个氨基酸赖氨酸之间插入氨基酸丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
22.根据权利要求21所述的芽孢杆菌RNA酶抑制剂蛋白质,具有SEQ ID No.4的氨基酸序列。
23.包括权利要求20-22任一项所述的芽孢杆菌RNA酶抑制剂蛋白质的植物细胞。
24.包括编码芽孢杆菌RNA酶抑制剂蛋白质的芽孢杆菌RNA酶抑制剂DNA的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA具有低于40%的AT含量,并且其中所述的芽孢杆菌RNA酶抑制剂蛋白质与SEQID No.2具有至少80%的氨基酸序列相同性且能够抑制至少50%的芽孢杆菌RNA酶活性。
25.根据权利要求24所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA具有对油菜,棉花,玉米,水稻和小麦最佳的惯用密码子。
26.根据权利要求24或25所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA含有仅仅7%的CG二核苷酸和含有仅仅9.5%的CNG三核苷酸。
27.根据权利要求24或25所述的DNA,其中所述的芽孢杆菌RNA酶抑制剂DNA具有SEQ ID No.3的第7和273位之间的核苷酸序列,该核苷酸序列之前是ATGGNN。
28.包括权利要求24或25所述的DNA的植物细胞。
29.权利要求1-3,6-8,10-12,24和27任一项所述的DNA用于恢复雄性不育系的可育性的应用。
30.根据权利要求1-3和24任一项所述的DNA,该DNA具有对油菜,玉米和水稻最佳的惯用密码子。
31.包括权利要求30所述的DNA的植物细胞。
32.根据权利要求31所述的植物细胞,该植物细胞是油菜,棉花,玉米,水稻或小麦的细胞。
CNB971913412A 1996-09-03 1997-09-01 改进的芽孢杆菌rna酶抑制剂基因 Expired - Lifetime CN1157478C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP96202446.9 1996-09-03
EP96202446 1996-09-03

Publications (2)

Publication Number Publication Date
CN1218509A CN1218509A (zh) 1999-06-02
CN1157478C true CN1157478C (zh) 2004-07-14

Family

ID=8224343

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971913412A Expired - Lifetime CN1157478C (zh) 1996-09-03 1997-09-01 改进的芽孢杆菌rna酶抑制剂基因

Country Status (12)

Country Link
US (2) US6372960B1 (zh)
EP (1) EP0868524B1 (zh)
JP (1) JP4159114B2 (zh)
CN (1) CN1157478C (zh)
AT (1) ATE282705T1 (zh)
BR (1) BRPI9706706B1 (zh)
CA (1) CA2234119C (zh)
CZ (1) CZ133598A3 (zh)
DE (1) DE69731608T2 (zh)
HK (1) HK1020585A1 (zh)
PL (1) PL328819A1 (zh)
WO (1) WO1998010081A2 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998010081A2 (en) * 1996-09-03 1998-03-12 Plant Genetic Systems, N.V. Improved barstar-gene
AU773492B2 (en) 1998-08-19 2004-05-27 British American Tobacco (Investments) Limited A novel plastid-targeting nucleic acid sequence, a novel beta-amylase sequence, a stimulus-responsive promoter and uses thereof
DK1141350T3 (da) * 1998-12-22 2010-11-08 Dow Agrosciences Llc Fremgangsmåde og genetiske sammensætninger til begrænsning af udkrydsning og uønskede genstrømme i nytteplanter
JP2001095406A (ja) * 1999-09-30 2001-04-10 Japan Tobacco Inc 雄性不稔植物の作出方法
US6818807B2 (en) * 2001-08-06 2004-11-16 Bayer Bioscience N.V. Herbicide tolerant cotton plants having event EE-GH1
MXPA05006983A (es) * 2002-12-27 2006-02-22 Ct Ingenieria Genetica Biotech Promotor artificial para la expresion de secuencias de acido desoxirribonucleico en celulas vegetales.
AU2003247160A1 (en) * 2003-07-07 2005-01-21 Dhara Vegetable Oil And Foods Company Limited A method for obtaining improved fertility restorer lines for transgenic male sterile crop plants and a dna construct for use in said method
US7371848B2 (en) * 2004-01-20 2008-05-13 Monsanto Technology Llc Chimeric promoters comprising a caulimovirus promoter enhancer for use in plants
US7667097B2 (en) 2004-04-14 2010-02-23 Bayer Bioscience N.V. Rice pollen-preferential promoters and uses thereof
EP1824967B1 (en) 2004-12-21 2014-11-05 Monsanto Technology, LLC Recombinant dna constructs and methods for controlling gene expression
US20060200878A1 (en) 2004-12-21 2006-09-07 Linda Lutfiyya Recombinant DNA constructs and methods for controlling gene expression
US8314290B2 (en) 2004-12-21 2012-11-20 Monsanto Technology Llc Temporal regulation of gene expression by MicroRNAs
EA023885B1 (ru) 2005-10-13 2016-07-29 МОНСАНТО ТЕКНОЛОДЖИ, ЭлЭлСи Конструкция рекомбинантной днк для индуцирования стерильности в трансгенном растении, стерильные трансгенные растения и способы получения гибридных семян
WO2008063203A2 (en) * 2006-01-27 2008-05-29 Whitehead Institute For Biomedical Research Compositions and methods for efficient gene silencing in plants
CN101421406B (zh) 2006-02-13 2016-08-31 孟山都技术有限公司 用于产生改变的种子油组成的核酸构建体和方法
AU2007290367B2 (en) 2006-08-31 2013-10-31 Monsanto Technology, Llc Phased small RNAs
US8946511B2 (en) * 2006-10-12 2015-02-03 Monsanto Technology Llc Plant microRNAs and methods of use thereof
EP2115141A4 (en) 2007-02-20 2010-08-04 Monsanto Technology Llc INVERTEBRA MICRO-RNA
PT2443247E (pt) * 2009-06-18 2014-07-18 Syngenta Participations Ag Método de remoção de distorção de codificação
BR112014003919A2 (pt) * 2011-08-22 2017-03-14 Bayer Cropscience Ag métodos e meios para modificar um genoma de planta
CA2860611A1 (en) * 2012-01-06 2013-07-11 Pioneer Hi-Bred International, Inc. Compositions and methods for the expression of a sequence in a reproductive tissue of a plant
MA43177A (fr) 2015-12-15 2018-09-12 Bayer Cropscience Lp Brassicacées résistantes à plasmodiophora brassicae (hernie)
CA3225922A1 (en) 2021-07-23 2023-01-26 BASF Agricultural Solutions Seed US LLC Blackleg resistant plants and methods for the identification of blackleg resistant plants

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) * 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
WO1990002184A1 (en) 1988-08-19 1990-03-08 The Upjohn Company Potyvirus coat protein genes and plants transformed therewith
NZ230375A (en) 1988-09-09 1991-07-26 Lubrizol Genetics Inc Synthetic gene encoding b. thuringiensis insecticidal protein
DE69034268D1 (de) * 1989-08-10 2011-03-03 Bayer Bioscience Nv Pflanzen mit modifizierten Blüten
EP0558676B1 (en) * 1990-11-23 2000-04-19 Plant Genetic Systems, N.V. Process for transforming monocotyledonous plants
EP0570422B1 (en) 1991-02-07 2007-12-19 Bayer BioScience N.V. Stamen-specific promoters from corn
AU1192392A (en) 1991-02-08 1992-09-07 Plant Genetic Systems N.V. Stamen-specific promoters from rice
DE69333880T2 (de) 1992-06-12 2006-06-22 Bayer Bioscience N.V. Erhaltung von männlichen sterilen pflanzen
WO1998010081A2 (en) * 1996-09-03 1998-03-12 Plant Genetic Systems, N.V. Improved barstar-gene

Also Published As

Publication number Publication date
HK1020585A1 (en) 2000-05-12
BR9706706A (pt) 1999-07-20
US6759575B2 (en) 2004-07-06
PL328819A1 (en) 1999-02-15
ATE282705T1 (de) 2004-12-15
CN1218509A (zh) 1999-06-02
EP0868524A2 (en) 1998-10-07
CZ133598A3 (cs) 1998-10-14
JP2001511642A (ja) 2001-08-14
CA2234119A1 (en) 1998-03-12
JP4159114B2 (ja) 2008-10-01
DE69731608T2 (de) 2006-03-23
DE69731608D1 (de) 2004-12-23
AU4619797A (en) 1998-03-26
AU720071B2 (en) 2000-05-25
WO1998010081A3 (en) 1998-09-03
US6372960B1 (en) 2002-04-16
BRPI9706706B1 (pt) 2015-08-18
EP0868524B1 (en) 2004-11-17
WO1998010081A2 (en) 1998-03-12
CA2234119C (en) 2010-01-05
US20020133845A1 (en) 2002-09-19

Similar Documents

Publication Publication Date Title
CN1157478C (zh) 改进的芽孢杆菌rna酶抑制剂基因
CN1026497C (zh) 昆虫抗性植物
CN1063488C (zh) Dna扩增
CN1056880C (zh) 合成杀虫的晶状蛋白质基因
KR100789274B1 (ko) 코리네박테리움 글루타미쿰에서 유래한 신규한 프로모터핵산 분자, 그 프로모터를 포함하는 재조합 벡터, 그재조합 벡터를 포함하는 숙주 세포 및 그 숙주 세포를이용하여 유전자를 발현하는 방법
CN1849397A (zh) 苏云金芽孢杆菌分泌的杀虫蛋白及其应用
CN1639338A (zh) 修饰的Cry3A毒素及编码它的核酸序列
CN1073717A (zh) 编码杀虫剂蛋白的基因,用该基因转化的禾本科植物及其制备方法
CN1199321A (zh) 用于在植物中防治鳞翅目昆虫的、修饰的苏云金芽胞杆菌基因
CN1513057A (zh) 宿主微生物
CN1039616A (zh) 巴斯德毕赤酵母醇氧化酶ii调节区
CN1288060A (zh) 在棒状细菌中可自主复制的质粒
CN1193098C (zh) 利用条件雌性不育性生产杂种种子的方法
CN1898259A (zh) 用于编码精细化学品的代谢途径的蛋白质的基因变体
CN1809640A (zh) 延迟植物中种子落粒的方法和手段
CN1578834A (zh) 编码代谢途径蛋白的基因
CN1596267A (zh) 来自谷氨酸棒状杆菌的编码调节蛋白的基因
CN1582299A (zh) 编码与遗传稳定性、基因表达和折叠相关的蛋白质的基因
CN1160448C (zh) 含有两拷贝以不同方向转录之基因的原核细胞
CN1213402A (zh) 表层蛋白的重组表达
CN1650018A (zh) 昆虫抗性植物及产生该植物的方法
CN1646690A (zh) 编码葡萄糖-6-磷酸脱氢酶蛋白的基因
AU720071C (en) Improved barstar gene
CN1238510C (zh) 人工合成的用于转基因抗虫植物的Bt杀虫基因及其研制方法
CN1756835A (zh) 用作选择标记的转位酶

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1020585

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: BAYER CORP. SCIENCE S.A.

Free format text: FORMER OWNER: BAYER BIOSCIENCE N. V.

Effective date: 20120410

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120410

Address after: Belgium

Patentee after: Bayer Cropscience SA

Address before: Ghent

Patentee before: Bayer Bioscience N. V.

CX01 Expiry of patent term

Granted publication date: 20040714

CX01 Expiry of patent term