CN107072165B - 小麦Ms1多核苷酸、多肽以及使用方法 - Google Patents

小麦Ms1多核苷酸、多肽以及使用方法 Download PDF

Info

Publication number
CN107072165B
CN107072165B CN201580051730.7A CN201580051730A CN107072165B CN 107072165 B CN107072165 B CN 107072165B CN 201580051730 A CN201580051730 A CN 201580051730A CN 107072165 B CN107072165 B CN 107072165B
Authority
CN
China
Prior art keywords
plant
male
polynucleotide
promoter
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580051730.7A
Other languages
English (en)
Other versions
CN107072165A (zh
Inventor
M.C.阿伯特森
U.鲍曼恩
A.M.西甘
M.辛格
E.图克
R.怀特福特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
Original Assignee
Pioneer Hi Bred International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc filed Critical Pioneer Hi Bred International Inc
Priority to CN202110503141.5A priority Critical patent/CN113136390A/zh
Publication of CN107072165A publication Critical patent/CN107072165A/zh
Application granted granted Critical
Publication of CN107072165B publication Critical patent/CN107072165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/022Genic fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8231Male-specific, e.g. anther, tapetum, pollen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits

Abstract

本发明提供了能够调节植物的雄性能育性的组合物和方法。所述组合物包含调节雄性能育性的多核苷酸和多肽及其片段和变体。表达盒包含可操作地连接至启动子的雄性能育性多核苷酸或其片段或变体,其中所述多核苷酸的表达调节植物的雄性能育性。影响雄性能育性的多核苷酸的水平和/或活性在植物或植物部分中受到调节。调控序列以雄性组织优选的方式驱动表达,并且可以是下调可操作地连接的基因的靶标。本发明还提供了追踪在含有突变的小麦品系的随后的自交和杂交中诱导核隐性雄性不育的突变的方法。雄性不育植物可以通过用保持系植物授粉来得以维持。

Description

小麦Ms1多核苷酸、多肽以及使用方法
技术领域
本发明涉及植物分子生物学领域,更具体地讲,涉及影响雄性能育 性。
以电子方式提交的序列表的引用
通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列 表文件提交,该文件名称为RTS20250D-PCT_ST25.txt,最后修改日期为 2015年9月21日,文件大小为79KB,并且该文件与本说明书同时提交。 在该ASCII格式的文件中包含的序列表是本说明书的一部分,并且全文以 引用方式并入本文。
背景技术
杂交植物育种的发展已使产生的作物在质量和数量方面取得相当大的 进展成为可能。由于经过了杂交过程,故收率增加,所需特性的组合诸如 对病害和虫害的抗性、耐热性和耐旱性,以及植物组成发生变化都可能出 现。这些过程在很多情况下主要依赖于提供向雌性亲本贡献花粉的雄性亲 本以产生所得的杂交体。
大田作物通过利用植物的授粉方法的技术进行育种。如果来自植物的 一朵花的花粉转移到同一植物或遗传上相同的植物的同一朵花或另一朵 花,则植物自花授粉。如果花粉来自遗传上不同的植物的花,则植物异花 授粉。
在某些物种中,诸如芸苔(Brassica campestris),植物通常自体不育, 并且只能够异花授粉。在主要为自花授粉的物种(诸如大豆、小麦和棉 花)中,雄性和雌性植物处于解剖学上的并置关系,使得在天然授粉过程 中,给定花的雄性繁殖器官对同一朵花的雌性繁殖器官授粉。
普通小麦(Triticum aestivum)是具有限定基因组A、B和D的三对同源 染色体的六倍体植物。小麦籽粒的胚乳包括来自母本细胞的两个单倍体补 体和来自父本细胞的一个单倍体补体。小麦籽粒的胚包括来自母本细胞和 父本细胞中的每一者的一个单倍体补体。六倍性被认为是研究和开发小麦 的可用变体的过程中的重大障碍。实际上,人们对小麦的同源基因如何相 互作用、如何调控这些同源基因的表达、以及由同源基因产生的不同蛋白 质如何独立或协同地发挥作用方面知之甚少。操纵雄性能育性多核苷酸在 小麦中的表达的策略将需要考虑各个小麦品种的倍性水平。普通小麦是包 含被指定为A、B和D的三个基因组的六倍体(N=21);每个基因组包含七 对非同源染色体。单粒小麦品种是二倍体(N=7),而二粒小麦品种是四倍体 (N=14)。
用遗传性雄性不育体系进行的大部分工作的必要方面是鉴定影响雄性 能育性的基因。这种基因可以在包括本文所述的那些体系在内的多种体系 中使用以控制雄性能育性。
发明内容
本发明提供了用于调节植物中的雄性能育性的组合物和方法。该组合 物包含表达盒,该表达盒包含可操作地连接至启动子的一个或多个雄性能 育性多核苷酸或者其片段或变体中,其中该多核苷酸的表达调节植物的雄 性能育性。本发明提供了各种方法,其中影响雄性能育性的多核苷酸或多 肽的水平和/或活性在植物或植物部分中受到调节。本发明还提供了用于鉴 定和/或选择对于诱导核隐性雄性不育的突变是纯合的或杂合的小麦植物的 方法。
附图说明
图1示出了大麦(SEQ ID NO:3)和小麦(SEQ ID NO:5)MS1氨基酸序列 的比对结果。
图2示出了msld、msle和mslf的等位基因系列序列踪迹。坐标数对 应于SEQ IDNO:7中的位置。
图3是小麦MS1(也称为TaLTPG1)的结构的图示。
图4是多棱大麦(Hordeum vulgare)(SEQ ID NO:3)、普通小麦(SEQ ID NO:5)、二穗短柄草(Brachypodium distachyon)(SEQ ID NO:39)和水稻 (Oryza sativa)(SEQ IDNO:40)的MS1同系物的比对结果。
具体实施方式
现在将在下文中更全面地描述本发明;示出了本发明的一些但不是所 有实施方案。事实上,这些发明内容可以多种不同形式呈现,并且不应理 解为受限于本文陈述的实施方案;相反,提供这些实施方案的目的是使本 公开满足适用的法律要求。同样的编号在全文中是指同样的要素。
借助前文的描述和随附的附图中给出的教导内容,本发明所属领域的 技术人员将会想到本文示出的本发明的多种修改形式和其它实施方案。因 此,应当理解,本发明不限于所公开的具体实施方案,旨在将修改形式和 其它实施方案包括在所附权利要求的范围内。虽然本文中采用特定术语, 但这些术语仅在一般性和描述性意义上使用,而并非用于限制目的。
I.雄性能育性多核苷酸
本文所公开的组合物包含影响雄性能育性的多核苷酸和多肽。具体地 讲,本发明提供了分离的多核苷酸,其包含编码SEQ ID NO:3、5、39或 40示出的氨基酸序列或者它们的活性片段或变体的核苷酸序列。本发明还 提供了具有由本文所述的多核苷酸编码的氨基酸序列(例如,SEQ ID NO: 3、5、39或40示出的氨基酸序列或者它们的活性片段或变体)的多肽。
有性繁殖植物发育出用于产生雄性配子和雌性配子的特化组织。雄性 配子的成功产生依赖于雄性繁殖组织的正确形成。体现植物的雄性繁殖器 官的雄蕊包含各种细胞类型,包括例如花丝、花粉囊、绒毡层和花粉。如 本文所用,“雄性组织”是指有性繁殖植物中的负责产生雄性配子的特化 组织。雄性组织包括但不限于雄蕊、花丝、花粉囊、绒毡层和花粉。
成熟花粉粒形成的过程始于小孢子发生,其中性母细胞形成于花粉囊 的造孢组织中。随后是小配子发生,其中小孢子核发生不对称有丝分裂, 以形成小配子体或花粉粒。“雄性能育性”或“雄性能育”的状态是指产 生成熟花粉粒的那些植物,成熟花粉粒能够使雌性配子受精以产生后代的 后续世代。如本文所用,术语“影响雄性能育性”或“调节雄性能育性” 是指在与合适的对照比较时植物产生成熟花粉粒的能力的任何增强或下 降。“成熟花粉粒”或“成熟花粉”是指任何能够使雌性配子受精以产生 后代的的后续世代的花粉粒。同样,术语“雄性能育性多核苷酸”或“雄 性能育性多肽”是指调节雄性能育性的多核苷酸或多肽。雄性能育性多核 苷酸可例如编码参与小孢子发生或小配子发生过程的多肽。
某些雄性不育基因诸如MACl、EMS1或GNE2(Sorensen et al.(2002) Plant J.29:581-594(Sorensen等人,2002年,《植物杂志》,第29卷,第 581-594页))阻止四分孢子阶段中的细胞生长。 SPOROCYTELESS/NOZZLE基因中的突变在发育早期起作用,但不仅影响 花粉囊形成而且影响胚珠形成,使得植物为雄性不育和雌性不育。拟南芥 属(Arabidopsis)的SPOROCYTELESS基因是孢子发生的起始所必需的,并 且编码新型的核蛋白(GenesDev.1999Aug 15;13(16):2108-17(《基因与发 育》,1999年8月15日,第13卷,第16期,第2108-2117页))。
本文所公开的雄性能育性多核苷酸包括被示出影响雄性能育性的多核 苷酸的同源物和直系同源物。例如,本文所公开的雄性能育性多核苷酸及 其活性片段和变体包括Ms1的同源物和直系同源物。缺乏功能性Ms1的植 物在繁殖组织发育中表现出生理变化,并且是雄性不育的。ms1突变体的 表型分析使用本领域已知的技术进行。例如,在Gladius小麦中筛选雄性不 育表型如下进行:为了防止开放式授粉的种子形成,在开花之前用纸袋覆盖穗,并用纸夹固定。每株植物覆盖至少三个穗,用于定量分析能育性得 分。为了确定定量分析能育性得分,对每个穗的小花数和每个穗的种子数 进行计数,并表示为每朵小花形成的种子数。
如在本文别处所公开的,SEQ ID NO:4提供了小麦Ms1编码序列。 SEQ ID NO:7提供了天然小麦Ms1基因组序列。SEQ ID NO:9提供了变体 Ms1基因组序列。SEQ ID NO:39提供了来源于短柄草属的MS1同系物。 SEQ ID NO:40提供了来自稻的MS1同系物。
染色体臂4BS上的普通小麦ms1基因座的突变体包括:
·Pugsley(msla);参见
○Pugsley,A.T.and R.N.Oram(1959)Genic male sterility in wheat.Aust.Pl.Breed.Genet.Newsl.No.14:10-11(Pugsley A.T.和R.N. Oram,1959年,“小麦基因雄性不育”,《Aust.Pl.Breed. Genet.Newsl.》,第14卷,第10-11页);
○Suneson,C.A.(1962)Use of Pugsley’s sterile wheat in crossbreeding.Crop Sci.2:534-535(Suneson C.A.,1962年, “Pugsley不育小麦在杂交育种中的用途”,《作物科学》,第 2卷,第534-535页);以及
○Waninge,J.and Zeven,A.C.(1968)Chromosome numbers in Pugley’s(sic)male sterile wheat.Euphytica 17:378-380(Waninge J.和Zeven A.C.,1968年,“Pugley(sic)雄性不育小麦中的染色 体数”,《Euphytica》,第17卷,第378-380页)。
·Probus(mslb);参见Fossati,A.and M.Ingold(1970)A male sterile mutantin Triticum aestivum.Wheat Information Service(Kyoto)30:3-10 (Fossati A.和M.Ingold,1970年,“普通小麦中的雄性不育突变 体”,《Wheat Information Service》(京都),第30卷,第3-10 页)。
·Cornerstone(mslc);参见Driscoll,C.J.and K.K.Barlow(1976)Malesterility in plants:Induction,isolation and utilization.pp.123-131 in InducedMutation in Cross-Breeding,IAEA,Vienna,Austria(Driscoll C.J.和K.K.Barlow,1976年,“植物中的雄性不育”,《在杂交育 种中诱导突变-诱导、分离与利用》,第123-131页,奥地利维也 纳,IAEA)。
Probus和Cornerstone中的突变是辐射诱导的,并且据推测是由染色体 臂4BS的末端缺失引起的。Pugsley突变体被单独归为自发突变体。已将 ms1基因的位置物理地映射到包含16%的远端4BS染色体臂的区域(Endo et al.(1991)The Japanese Journal ofGenetics 66(3):291-295(Endo等人, 1991年,《日本遗传学杂志》,第66卷,第3期,第291-295页); Klindworth et al.(2002)Crop Sci.42:1447-1450(Klindworth等人,2002年,《作物科学》,第42卷,第1447-1450页);Cenci et al.(2003)Theor.Appl. Genet 107(5):931-9(Cenci等人,2003年,《理论与应用遗传学》,第107 卷,第5期,第931-939页))。
本文提供了Ms1突变msld、msle、mslf和mslh的因果变化,以及与 染色体4BS上的Ms1基因紧密连接的标记。标记包括ET0487、ET0488、 ET0489、ET0490、ET0491、ET0495、007-0033.1和007-0046.1;参见SEQ ID NO:24-29和32-33。这些标记可用于在随后的含有msld、msle、mslf 或mslh突变的小麦品系的自交和杂交中追踪msld、msle、mslf或mslh, 从而确保雄性不育性状有利地在小麦育种程序中得以遗传。
Ms1突变msld、msle和mslf是使用甲磺酸乙酯在Chris小麦品种中诱 导的Ms1基因的隐性突变(Klindworth et al.2002.Crop Sci.42:1447-1450 (Klindworth等人,2002年,《作物科学》,第42卷,第1447-1450 页))。外显子1中的mslh突变是通过TILLING(靶向诱导基因组局部突 变技术)(McCallum et al.(2000)Nat.Biotechnol.18:455-457(McCallum等 人,2000年,《自然生物技术》,第18卷,第455-457页))产生的。
有利的是,植物育种人员可使用分子标记通过鉴定标记等位基因来鉴 定含有Ms1突变的个体,所述标记等位基因显示与雄性不育共分离的统计 学显著的概率,表现为连锁不平衡。这被称为标记辅助选择(MAS)。因 此,本发明还提供了用于选择对于Ms1基因的突变(诸如但不限于msld、 msle和mslf)是纯合的或杂合的突变体小麦植物的方法。
为了进行MAS,在来自待选择植物的生物样品中检测对应于标记核酸 等位基因的核酸。这种检测可采取探针核酸与标记等位基因或其扩增子进 行杂交的形式,例如使用等位基因特异性杂交、Southern分析、Northern分 析、原位杂交、引物杂交然后对标记区域进行PCR扩增、对PCR扩增产物 进行DNA测序等。对于本文所述的任何标记序列,本领域普通技术人员将 理解如何使用已知的DNA扩增和测序技术在特定小麦品系或品种的标记基 因座处获得等位基因。出于本文所述的目的,所用的品系或品种是公众可 获得的。因此,可以获得DNA,并且本领域普通技术人员可使用所提供的 引物或从所提供的参考序列研发引物,以在每个品系或品种的每个标记基 因座处扩增和获得序列。
在验证生物样品中存在(或不存在)特定标记等位基因之后,选择植 物并与第二植物(任选地来自优良品系的小麦植物)杂交。可对由杂交产 生的子代植物中的特定标记等位基因进行评估,并且将只选择具有所需标 记等位基因的那些子代植物。
通过标记辅助选择,植物育种人员可通过控制杂交来跟踪雄性不育性 状的存在,以在需要时获得在纯合或杂合状态含有Ms1突变的新植物,从 而维持Ms1突变。此外,标记辅助选择可用于产生将用作雌株(即需要花 粉供体植物授粉的植物)的突变体雄性不育种子亲本,以产生具有商业价 值的种子。或者,标记辅助选择可用于产生在杂合状态含有Ms1突变的F1 杂交体。
本文提供的任何标记,以及与任何这些标记连接并关联的任何标记, 均可用于雄性不育性状的标记辅助选择。
术语“连锁”用于描述一个标记基因座与另一个标记基因座或某个其 它基因座(例如,雄性不育基因座)“相关联”的程度。连锁的常见量度 是性状共分离的频率。这可表示为共分离百分比(重组频率),或用厘摩 (cM)表示。cM是基因重组频率的量度单位。1cM等于由于在一个世代中的 交换导致的在一个基因座上的性状将与在另一个基因座上的性状分离的概 率为1%(意味着性状在99%的情况下共分离)。
连锁可表示为所期望的界限或范围。例如,在一些实施方案中,当标 记的间隔距离小于50、40、30、25、20或15个图距单位(或cM)时,任 何标记与任何其它标记(或基因座诸如Ms1)连接(遗传上和物理上)。 进一步的连锁可通过间隔14、13、12、11、10、9、8、7、6、5、4、3、 2、1个图距单位(或cM)来描述。在某些方面,限定相等范围的连锁(例 如介于10cM和20cM之间、介于10cM和30cM之间、或者介于10cM和 40cM之间)是有利的。
标记与第二基因座连接越紧密,标记越可能变成第二基因座的指示。 因此,“紧密连接的基因座”(诸如标记基因座和第二基因座)显示的基 因座间重组频率为10%或更低、或者约9%或更低、或者约8%或更低、或 者约7%或更低、或者约6%或更低、或者约5%或更低、或者约4%或更 低、或者约3%或更低、或者约2%或更低。在其它实施方案中,关联基因 座显示的重组频率为约1%或更低,例如约0.75%或更低、或者约0.5%或更 低,或者约0.25%或更低。如果两个基因座位于同一染色体上,并且它们 间的距离使得两个基因座间的重组发生频率小于10%(例如约9%、8%、 7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更低),那么 也说这两个基因座彼此“邻近”。因为1cM是重组频率为1%的两个遗传 标记之间的距离,所以任何标记以例如等于或小于10cM的距离与紧邻的任 何其它标记紧密连接(遗传上和物理上)。在同一染色体上的两个紧密连 接的标记可定位为彼此相距9、8、7、6、5、4、3、2、1、0.75、0.5、 0.25、0.1、0.075、0.05、0.025或0.01cM或更近。
尽管特定标记等位基因可显示与雄性不育表型共分离,但需要注意的 是,标记不一定是负责表达雄性不育的基因座的一部分。例如,并没有要 求标记多核苷酸序列是Ms1基因的一部分。特定标记等位基因和雄性不育 表型之间的关联,是由于在Ms1突变起源的小麦品系中,标记等位基因和 Ms1突变之间的最初“偶联”连锁相。因为msld、msle和mslf起源于品 种Chris,所以Ms1区域内的Chris中的标记等位基因可用于追踪后续世代 中的msld、msle和mslf突变。
本文公开了分离的或实质上纯化的核酸分子或蛋白质组合物。“分离 的”或“纯化的”核酸分子、多核苷酸、多肽或蛋白质,或者它们的生物 活性部分,实质上或基本上不含通常在该多核苷酸或蛋白质的天然存在的 环境中存在的、与该多核苷酸或蛋白质相伴随或相互作用的组分。因此, 分离的或纯化的多核苷酸或多肽或蛋白质,当通过重组技术产生时实质上 不含其它细胞物质或培养基,或者当通过化学法合成时实质上不含化学前 体或其它化学品。最优的是,“分离的”多核苷酸不含在衍生该多核苷酸 的生物体的基因组DNA中天然位于该多核苷酸的旁侧的序列(即,位于该 多核苷酸的5′和3′端的序列)(最佳的是蛋白质编码序列)。例如,在各 种实施方案中,分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、 0.5kb或0.1kb的在衍生该多核苷酸的细胞的基因组DNA中天然位于该多核苷酸的旁侧的核苷酸序列。实质上不含细胞物质的蛋白质包括具有小于约 30%、20%、10%、5%或1%(以干重计)的污染性蛋白质的蛋白质制备 物。当本文所公开的多肽或其生物活性部分用重组法产生时,最佳的是, 培养基具有少于约30%、20%、10%、5%或1%(以干重计)的化学前体或 非目的蛋白质的化学品。
“受试植物”或“受试植物细胞”是其中已针对目的基因实现了遗传 改变(诸如转化)的植物或植物细胞,或者是从经如此改变的植物或细胞 遗传下来并包含该改变的植物或植物细胞。“对照”、“对照植物”或 “对照植物细胞”提供用于测量受试植物或植物细胞的表型变化的基准 点。
对照植物或植物细胞可包括例如:(a)野生型植物或植物细胞,即具有 与用于进行遗传改变的起始材料相同的基因型的植物或植物细胞,该遗传 改变得到受试植物或细胞;(b)具有与起始材料相同的基因型但已用无效构 建体(即用对目的性状不具有已知效果的构建体,诸如包含标记基因的构 建体)转化的植物或植物细胞;(c)为受试植物或植物细胞的子代中的非转 化分离子的植物或植物细胞;(d)在遗传上与受试植物或植物细胞相同但不 暴露于会诱导目的基因的表达的条件或刺激因素的植物或植物细胞;或者(e) 处于目的基因不被表达的条件下的受试植物或者植物细胞本身。
还提供了本发明所公开的多核苷酸的片段和变体以及由其编码的蛋白 质。所谓“片段”,意指多核苷酸的一部分或由其编码的氨基酸序列从而 由其编码的蛋白质的一部分。多核苷酸的片段可编码保留该天然蛋白质的 生物活性从而影响雄性能育性的蛋白质片段;这些片段在本文中可被称为 “活性片段”。或者,可用作杂交探针或在下调或靶向序列修饰的构建体 和策略中有用的多核苷酸片段通常不编码保留生物活性的蛋白质片段,但 仍可影响雄性能育性。因此,核苷酸序列的片段的范围可为本文所公开的 编码多肽的至少约20个核苷酸、约50个核苷酸、约100个核苷酸、直至 全长多核苷酸。
编码影响雄性能育性的多肽的生物活性部分的多核苷酸的片段将编码 至少15、25、30、50、100、150或200个连续氨基酸,或最多编码存在于 影响雄性能育性的全长多肽(例如,SEQ ID NO:3、5、39或40)中的氨 基酸总数。可用作杂交探针或PCR引物或者在下调构建体或靶向修饰方法 中可用的雄性能育性多核苷酸的片段通常不需要编码多肽的生物活性部 分,但可影响雄性能育性。
因此,本文所公开的雄性能育性多核苷酸的片段可编码雄性能育性多 肽的生物活性部分,或者其可以是可使用本领域已知的或下文所公开的方 法被用作杂交探针或PCR引物或者在下调构建体或靶向修饰方法中可用的 片段。雄性能育性多肽的生物活性部分可通过以下过程制备:分离本文所 公开的雄性能育性多核苷酸中的一者的一部分,表达雄性能育性蛋白质的 编码部分(例如,通过体外重组表达),并且评估雄性能育性多肽的编码部分的活性。作为雄性能育性多核苷酸的片段的多核苷酸包含至少16、 20、50、75、100、150、200、250、300、350、400、450、500、550、 600、650、700、800、900、1000、1200、1400、1600、1800、2000、 2200、2400、2600、2800、3000、3200、3400、3600、3800或4000个核苷 酸,或最多包含存在于本文所公开的全长雄性能育性多核苷酸(例如, SEQ ID NO:1、2、4、7、42、43、44或45,或者编码SEQ ID NO:39或40 的多核苷酸)中的核苷酸数。
“变体”旨在意指实质上相似的序列。对于多核苷酸,变体包含在天 然多核苷酸内的一个或多个位点处发生一个或多个核苷酸的缺失和/或添 加,和/或在天然多核苷酸中的一个或多个位点处发生一个或多个核苷酸的 置换。如本文所用,“天然”或“野生型”多核苷酸或多肽分别包含天然 存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包括由于遗传 密码的简并性而编码本文所公开的雄性能育性多肽的氨基酸序列的那些序 列。天然等位基因变体(如这些)可用熟知的分子生物学技术进行鉴定, 例如用下文所述的聚合酶链反应(PCR)和杂交技术来鉴定。变体多核苷酸还 包括合成来源的多核苷酸,诸如那些例如通过使用定点诱变产生并且可编 码雄性能育性多肽的多核苷酸。通常,本文所公开的特定多核苷酸的变体 将与该特定多核苷酸(例如,SEQ ID NO:1、2、4、7、42、43、44或 45)具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更高的序列同一性,这是通过本文别处所述的或 本领域已知的序列比对程序和参数确定的。
本文所公开的特定多核苷酸(即,参考多核苷酸)的变体还可通过比 较变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的百分 比序列同一性来进行评估。因此,例如分离的多核苷酸可编码与SEQ ID NO:3、5、39或40的多肽具有给定百分比序列同一性的多肽。任何两种多 肽之间的百分比序列同一性可用本文别处描述的序列比对程序和参数来计 算。在本文所公开的任何给定的多核苷酸对通过比较它们编码的两种多肽 所共享的百分比序列同一性来进行评估,这两种编码的多肽之间的百分比 序列同一性为至少约40%、45%、50%、55%、60%、65%、70%、75%、 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更高的序列同一性。
“变体”蛋白质旨在意指通过在天然蛋白质中的一个或多个位点处缺 失或添加一个或多个氨基酸和/或在天然蛋白质中的一个或多个位点处置换 一个或多个氨基酸而从该天然蛋白质衍生的蛋白质。本文所公开的变体蛋 白质具有生物活性,即它们仍然具有天然蛋白质的生物活性,即本文所述 的雄性能育性活性。这类变体可例如由遗传多态性或人类操纵而得到。本 文所公开的雄性能育性蛋白质的生物活性变体将与该天然蛋白质的氨基酸 序列(例如,SEQ ID NO:3、5、39或40)具有至少约40%、45%、50%、 55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序 列同一性,这是通过本文别处所述的或本领域已知的序列比对程序和参数 确定的。本文所公开的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基,少至1-10个(诸如6-10个)、少至5个、少至4个、3 个、2个或甚至1个氨基酸残基。
本文所公开的蛋白质可通过各种方式(包括氨基酸置换、缺失、截短 和插入)进行改变。用于此类操纵的方法是本领域公知的。例如,雄性能 育性多肽的氨基酸序列变体和片段可通过在DNA中进行突变来制备。用于 诱变和多核苷酸改变的方法是本领域熟知的。参见,例如Kunkel (1985)Proc.Natl.Acad.Sci.USA 82:488-492(Kunkel,1985年,《美国国家 科学院院刊》,第82卷,第488-492页);Kunkel et al.(1987)Methods in Enzymol.154:367-382(Kunkel等人,1987年,《酶学方法》,第154卷, 第367-382页);美国专利4,873,192;Walker and Gaastra,eds.(1983) Techniques in Molecular Biology(MacMillanPublishing Company,New York) (Walker和Gaastra编辑,1983年,《分子生物学技术》(纽约麦克米兰 出版公司))以及其中引用的参考文献。有关不影响目的蛋白质的生物活 性的适当氨基酸置换的指导可在以下文献所述的模型中找到:Dayhoff et al. (1978)Atlasof Protein Sequence and Structure(Natl.Biomed.Res.Found., Washington,D.C.)(Dayhoff等人,1978年,《蛋白序列和结构图表集》 (美国国家生物医学研究基金会,华盛顿特区)),该文献以引用方式并 入本文。保守置换,诸如将一个氨基酸用另一个具有相似性质的氨基酸进 行交换,可能是最佳的。
因此,本文所公开的基因和多核苷酸包括天然存在的序列以及DNA序 列变体两者。同样,雄性能育性多肽和蛋白质涵盖天然存在的多肽以及其 变型形式和修饰形式两者。这种多核苷酸和多肽变体可仍然具有所需的雄 性能育性活性,在这种情况下,将在编码变体的DNA中进行的突变不应将 序列置于阅读框之外,并且最好不形成可产生二级mRNA结构的互补区 域。参见EP专利申请公开75,444。
本文所涵盖的蛋白质序列的某些缺失、插入和置换预期不产生该蛋白 质特性的根本变化。然而,当在进行置换、缺失或插入之前难以预测其确 切效应时,本领域技术人员将认识到该效应将通过常规的筛选测定法进行 评估。即,该活性可通过测定雄性能育性活性来评估。
雄性能育性的增强或下降可以以多种方式来测定。本领域普通技术人 员可通过以下过程容易地评估变体或片段的活性:将多核苷酸引入对于多 核苷酸的稳定雄性不育等位基因而言为纯合的植物中,随后观察植物中的 雄性组织发育。例如,为了测定由SEQID NO:1、2、4、7、42、43、44或 45的片段或变体赋予的雄性能育性活性,本领域技术人员可通过鉴定表达 ms1表型的植物或通过构建对于天然Ms1基因的突变而言为纯合的植物来开始,从而导致雄性不育。随后,技术人员可通过以下过程对突变进行弥 补:提供Ms1多核苷酸或者其片段或变体,随后观察植物的雄性组织是否 正常发育以及是否能够产生成熟花粉。
变体功能性多核苷酸和蛋白质还涵盖由诱变和重组过程(诸如DNA改 组)获得的序列和蛋白质。利用这种过程,可操纵一种或多种不同的雄性 能育性序列以产生具有所需性质的新雄性能育性多肽。这样,从一组相关 的序列多核苷酸生成重组多核苷酸的文库,该相关的序列多核苷酸包含具 有显著序列同一性且可在体外或体内发生同源重组的序列区域。例如,使 用该方法,可将编码目的结构域的序列基序在本文所公开的雄性能育性多核苷酸与其它已知的雄性能育性多核苷酸之间进行改组,以获得编码具有 改善的目的性质(诸如,在酶的情况中为提高的Km)的蛋白质的新基因。 这种DNA改组的策略是本领域已知的。参见例如Stemmer(1994)Proc.Natl. Acad.Sci.USA 91:10747-10751(Stemmer,1994年,《美国国家科学院院 刊》,第91卷,第10747-10751页);Stemmer(1994)Nature 370:389-391 (Stemmer,1994年,《自然》,第370卷,第389-391页);Crameri et al.(1997)NatureBiotech.15:436-438(Crameri等人,1997年,《自然生物技 术》,第15卷,第436-438页);Moore et al.(1997)J.Mol.Biol.272:336- 347(Moore等人,1997年,《分子生物学杂志》,第272卷,第336-347 页);Zhang et al.(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509(Zhang等 人,1997年,《美国国家科学院院刊》,第94卷,第4504-4509页); Crameri et al.(1998)Nature 391:288-291(Crameri等人,1998年,《自 然》,第391卷,第288-291页);以及美国专利5,605,793和5,837,458。
II.序列分析
如本文所用,“序列同一性”或“同一性”在两个多核苷酸或多肽序 列的情形中是指当在指定的比较窗口上进行比对以获得最大对应时两个序 列中相同的残基。当序列同一性百分比用于蛋白质时,应当认识到不相同 的残基位置往往差别在于保守氨基酸置换,其中氨基酸残基由具有相似化 学性质(例如电荷或疏水性)的其它氨基酸残基置换,因此不会改变分子 的功能性质。当序列差别在于保守置换时,则可以上调百分比序列同一性以校正置换的保守性质。差别在于这种保守置换的序列被称为具有“序列 相似性”或“相似性”。用于作出这个调整的手段是本领域技术人员公知 的。通常,这涉及将保守置换评定为部分错配而不是完全错配,从而增加 百分比序列同一性。因此,例如,如果相同的氨基酸给予1分,非保守置 换给予0分,则保守置换给予0至1之间的分数。保守置换的评分是例如 在程序PC/GENE(美国加利福尼亚州山景城(Mountain View,California)的Intelligenetics公司)中所执行那样进行计算。
本文所用的“序列同一性百分比”意指通过在比较窗口上比较两个最 佳比对的序列所确定的数值,其中多核苷酸序列在该比较窗口中的部分与 参考序列(不包含添加或缺失)相比可包含添加或缺失(即,空位),以 便两个序列的最佳比对。通过以下方式计算该百分比:确定在两个序列中 出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目, 将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100 以得到序列同一性百分比。
除非另外指明,否则本文提供的序列同一性/相似性值是指使用采用以 下参数的GAP版本10或其任何等同程序获得的值:核苷酸序列的同一性 百分比和相似性百分比采用GAP权重50和长度权重3以及nwsgapdna.cmp 计分矩阵;氨基酸序列的同一性百分比和相似性百分比采用GAP权重8和 长度权重2以及BLOSUM62计分矩阵。所谓“等同程序”意指任何这样的 序列比较程序,其对于任何两条所考虑的序列,相比于GAP版本10所产 生的对应的比对,能产生具有相同的核苷酸或氨基酸残基匹配和相同的百 分比序列同一性的比对。
术语“多核苷酸”的使用并不旨在将本公开局限于包含DNA的多核苷 酸。本领域的普通技术人员将认识到,多核苷酸可包含核糖核苷酸以及具 有核糖核苷酸与脱氧核糖核苷酸的组合。这种脱氧核糖核苷酸和核糖核苷 酸既包括天然存在的分子,也包括合成的类似物。本文所公开的多核苷酸 还涵盖所有形式的序列,包括但不限于单链形式、双链形式、发夹结构、 茎-环结构等。
III.表达盒
本文所公开的雄性能育性多核苷酸可在表达盒中提供,以用于在目的 生物体中表达。表达盒可包含可操作地连接至本文所公开的雄性能育性多 核苷酸的5′和3′调控序列。“可操作地连接”旨在意指两个或更多个元件 之间的功能性连接。例如,目的多核苷酸与调控序列(例如,启动子)之 间的可操作地连接是可使该目的多核苷酸得以表达的功能性连接。可操作 地连接的元件可以是连续的或非连续的。当用来指两个蛋白质编码区域的连接时,所谓可操作地连接,是指所述编码区域处于同一阅读框中。
本文所公开的表达盒在5′-3′转录方向上可包含在宿主细胞(例如,植 物细胞)中起作用的转录和翻译起始区(即,启动子)、目的多核苷酸以 及转录和翻译终止区(即,终止区)。表达盒还设置有多个限制性位点和/ 或重组位点,以使雄性能育性多核苷酸的插入处于本文别处所述的调控区 的转录调控之下。调控区(即,启动子、转录调控区和翻译终止区)和/或 目的多核苷酸对于宿主细胞而言或彼此之间可以是天然的/相似的。或者, 调控区和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是异源的。如 本文所用,关于多核苷酸或多肽序列的“异源”是起源于外来物种的序 列,或者,如果起源于相同物种的话,则为通过蓄意的人为干预从其天然 形式在组成和/或基因座方面进行实质性修饰得到的序列。例如,可操作地 连接至异源多核苷酸的启动子来自与衍生该多核苷酸的物种不同的物种, 或者,如果来自相同/相似的物种,那么一方或双方实质上由它们的源形式 和/或基因组修饰得到,或者该启动子不是可操作地连接的多核苷酸的天然 启动子。如本文所用,除非另外指明,否则嵌合多核苷酸包括与转录起始 区可操作地连接的编码序列,该转录起始区对于该编码序列是异源的。
在某些实施方案中,本文所公开的多核苷酸可与本文别处所公开的或 本领域已知的目的多核苷酸序列的任何组合或表达盒堆叠。例如,本文所 公开的雄性能育性多核苷酸可与本文别处所公开的或本领域已知的编码雄 性配子破坏性多核苷酸或多肽、细胞毒素、标记、或其它雄性能育性序列 的任何其它多核苷酸堆叠。堆叠的多核苷酸可操作地连接至与雄性能育性 多核苷酸相同的启动子,或者可操作地连接至单独的启动子多核苷酸。
如本文别处所述,表达盒可包含可操作地连接至目的多核苷酸的启动 子,连同对应的终止区。终止区对于转录起始区可以是天然的,对于可操 作地连接的目的雄性能育性多核苷酸或雄性能育性启动子序列可以是天然 的,对于植物宿主可以是天然的,或者可以源自另一来源(即,外来的或 异源的)。易得的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒,诸 如章鱼碱合酶和胭脂碱合酶终止区。还可参见Guerineau et al.(1991)Mol.Gen.Genet.262:141-144(Guerineau等人,1991年,《分子遗传学与普通遗 传学》,第262卷,第141-144页);Proudfoot(1991)Cell 64:671-674 (Proudfoot,1991年,《细胞》,第64卷,第671-674页);Sanfacon et al.(1991)Genes Dev.5:141-149(Sanfacon等人,1991年,《基因与发育》, 第5卷,第141-149页);Mogen et al.(1990)Plant Cell 2:1261-1272 (Mogen等人,1990年,《植物细胞》,第2卷,第1261-1272页); Munroe et al.(1990)Gene 91:151-158(Munroe等人,1990年,《基因》, 第91卷,第151-158页);Ballas et al.(1989)NucleicAcids Res.17:7891- 7903(Ballas等人,1989年,《核酸研究》,第17卷,第7891-7903 页);以及Joshi et al.(1987)Nucleic Acids Res.15:9627-9639(Joshi等人, 1987年,《核酸研究》,第15卷,第9627-9639页)。
如适当的话,可对目的多核苷酸进行优化以使其在转化的植物中的表 达提高。也就是说,可使用植物优选的密码子来合成或改变多核苷酸,以 便提高其表达。有关宿主优选的密码子用法的讨论,参见例如Campbell and Gowri(1990)Plant Physiol.92:1-11(Campbell和Gowri,1990年,《植 物生理学》,第92卷,第1-11页)。合成植物优选基因的方法是本领域可 得的。参见例如美国专利5,380,831和5,436,391,以及Murray et al.(1989)Nucleic Acids Res.17:477-498(Murray等人,1989年,《核酸研究》,第17 卷,第477-498页),将其以引用方式并入本文。
已知增强细胞宿主中的基因表达的另外的序列修饰。这些序列修饰包 括消除以下序列:编码假聚腺苷酸化信号、外显子-内含子剪接位点信号、 转座子样重复序列,以及其它此类得到充分表征的可能对基因表达有害的 序列。可将序列的G-C含量调整到给定的细胞宿主的平均水平,该平均水 平通过参考在宿主细胞中表达的已知基因计算得到。当可能时,修饰序列 以避免可预见的发夹二级mRNA结构。
表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的 作用。翻译前导序列是本领域已知的,包括:小核糖核酸病毒前导序列, 例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein et al. (1989)Proc.Natl.Acad.Sci.USA 86:6126-6130(Elroy-Stein等人,1989年, 《美国国家科学院院刊》,第86卷,第6126-6130页);马铃薯Y病毒组 前导序列,例如TEV前导序列(烟草蚀纹病毒)(Gallie et al.(1995)Gene 165(2):233-238(Gallie等人,1995年,《基因》,第165卷,第2期,第 233-238页))、MDMV前导序列(玉米矮花叶病毒)(Johnson,et al., (1986)Virology 154:9-20(Johnson等人,1986年,《病毒学》,第154 卷,第9-20页))和人免疫球蛋白重链结合蛋白(BiP)(Macejak,et al.,(1991)Nature 353:90-94(Macejak等人,1991年,《自然》,第353卷,第 90-94页));来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导序列 (AMV RNA 4)(Jobling et al.(1987)Nature 325:622-625(Jobling等人,1987 年,《自然》,第325卷,第622-625页));烟草花叶病毒前导序列 (TMV)(Gallie et al.(1989)in Molecular Biology of RNA,ed.Cech(Liss,New York),pp.237-256(Gallie等人,1989年,载于《RNA的分子生物学》, Cech编辑(Liss,纽约),第237-256页));以及玉米枯黄斑点病毒前导 序列(MCMV)(Lommel et al.(1991)Virology 81:382-385(Lommel等人, 1991年,《病毒学》,第81卷,第382-385页))。还可参见Della- Cioppa et al.(1987)Plant Physiol.84:965-968(Della-Cioppa等人,1987年, 《植物生理学》,第84卷,第965-968页)。也可利用其它已知的用于增 强翻译的方法,例如内含子等等。
在制备表达盒时,可对多个DNA片段进行操纵,以提供处于正确取向 的DNA序列,且适当时提供处于正确的阅读框的DNA序列。为此目的, 可应用衔接子或接头将DNA片段连接在一起,或者可涉及其它的操纵以提 供便利的限制性位点、去除多余的DNA、去除限制性位点等。出于这个目 的,可能涉及体外诱变、引物修复、限制性酶切、退火、再置换(例如转换和颠换)。
在特定实施方案中,本文所公开的表达盒包含可操作地连接至雄性能 育性多核苷酸的启动子或者其片段或变体,如本文所公开。在某些实施方 案中,雄性能育性启动子可操作地连接至本文所公开的雄性能育性多核苷 酸,诸如SEQ ID NO:1、2、4、7、42、43、44或45示出的多核苷酸,或 其活性片段或变体。
在某些实施方案中,植物启动子可优先地在某些组织(诸如雄蕊、花 粉囊、花丝和花粉)或发育生长阶段(诸如造孢组织、小孢子和小配子 体)中起始转录。这种植物启动子被称为“组织优选的”、“细胞类型优 选的”或“生长阶段优选的”。仅在某些组织中起始转录的启动子被称为 “组织特异性的”。同样,仅在某些生长阶段起始转录的启动子被称为 “生长阶段特异性的”。“细胞类型特异性”启动子仅在一种或多种器官 中的某些细胞类型中驱动表达,例如雄蕊细胞,或雄蕊内的单独细胞类型 诸如花粉囊、花丝或花粉细胞。
“雄性能育性启动子”可唯一地或优先地在涉及小孢子发生或小配子 发生的过程的细胞或组织中起始转录。本文所公开的雄性能育性多核苷酸 及其活性片段和变体可操作地连接至雄性组织特异性的或雄性组织优选的 启动子,包括例如雄蕊特异性的或雄蕊优选的启动子、花粉囊特异性的或 花粉囊优选的启动子、花粉特异性的或花粉优选的启动子、绒毡层特异性 的启动子或绒毡层优选的启动子,等等。可基于所需的结果来选择启动子。例如,目的多核苷酸可操作地连接至组成型启动子、组织优选的启动 子、生长阶段优选的启动子或其它启动子,以在植物中表达。
在一个实施方案中,启动子可以是唯一地或优先地在植物的雄性组织 中表达可操作地连接的目的多核苷酸的那些启动子。在该过程中不必使用 特定雄性能育性组织优选的或组织特异性的启动子;并且可使用本领域技 术人员已知的多种此类启动子中的任何一种。一个这种启动子为5126启动 子,其优先地将其所连接的多核苷酸的表达引导至植物的雄性组织,如在 美国专利5,837,851和5,689,051中所述。其它示例包括美国专利6,037,523 中描述的玉米Ms45启动子;美国专利6,452,069中描述的SF3启动子; WO 02/063021中描述的BS92-7启动子;以及美国专利5,470,359中描述的 SGB6调控元件;TA29启动子(Koltunow,et al.,(1990)Plant Cell 2:1201- 1224(Koltunow等人,1990年,《植物细胞》,第2卷,第1201-1224 页);Nature 347:737(1990)(《自然》,第347卷,第737页,1990年);Goldberg,et al.,(1993)Plant Cell 5:1217-1229(Goldberg等人,1993 年,《植物细胞》,第5卷,第1217-1229页)以及美国专利 6,399,856);SB200基因启动子(WO 2002/26789)、PG47基因启动子(美国 专利5,412,085;美国专利号5,545,546;Plant J 3(2):261-271(1993)(《植物 杂志》,第3卷,第2期,第261-271页,1993年))、G9基因启动子 (美国专利号5,837,850;5,589,610);2型金属硫蛋白样基因启动子 (Charbonnel-Campaa,etal.,Gene(2000)254:199-208(Charbonnel-Campaa 等人,《基因》,2000年,第254卷,第199-208页));芸苔属Bca9启 动子(Lee,et al.,(2003)Plant Cell Rep.22:268-273(Lee等人,2003年, 《植物细胞报告》,第22卷,第268-273页));ZM13启动子(Hamilton, et al.,(1998)Plant Mol.Biol.38:663-669(Hamilton等人,1998年,《植物 分子生物学》,第38卷,第663-669页));肌动蛋白解聚因子启动子 (诸如Zmabp1、Zmabp2;参见例如Lopez,et al.,(1996)Proc.Natl.Acad.Sci. USA 93:7415-7420(Lopez等人,1996年,《美国国家科学院院刊》,第 93卷,第7415-7420页));玉米果胶甲酯酶样基因的启动子ZmC5 (Wakeley,et al.,(1998)Plant Mol.Biol.37:187-192(Wakeley等人,1998 年,《植物分子生物学》,第37卷,第187-192页));抑制蛋白基因启 动子Zmprol(Kovar,et al.,(2000)The Plant Cell 12:583-598(Kovar等人, 2000年,《植物细胞》,第12卷,第583-598页));硫酸化五肽phytosulphokine基因ZmPSK1(Lorbiecke,et al.,(2005)Journal of ExperimentalBotany 56(417):1805-1819(Lorbiecke等人,2005年,《实验 植物学杂志》,第56卷,第417期,第1805-1819页));钙调蛋白结合 蛋白的启动子Mpcbp(Reddy,et al.,(2000)J.Biol.Chem.275(45):35457-70 (Reddy等人,2000年,《生物化学杂志》,第275卷,第45期,第 35457-35470页))。
如本文所公开,组成型启动子包括例如Rsyn7启动子的核心启动子和 WO 99/43838和美国专利6,072,050中公开的其它组成型启动子;CaMV 35S核心启动子(Odell etal.(1985)Nature 313:810-812(Odell等人,1985 年,《自然》,第313卷,第810-812页));稻肌动蛋白(McElroy et al. (1990)Plant Cell 2:163-171(McElroy等人,1990年,《植物细胞》,第2 卷,第163-171页));泛素(Christensen et al.(1989)Plant Mol.Biol. 12:619-632(Christensen等人,1989年,《植物分子生物学》,第12卷, 第619-632页)和Christensenet al.(1992)Plant Mol.Biol.18:675-689 (Christensen等人,1992年,《植物分子生物学》,第18卷,第675-689 页));pEMU(Last et al.(1991)Theor.Appl.Genet.81:581-588(Last等 人,1991年,《理论与应用遗传学》,第81卷,第581-588页));MAS (Velten et al.(1984)EMBO J.3:2723-2730(Velten等人,1984年,《欧洲 分子生物学组织杂志》,第3卷,第2723-2730页));ALS启动子(美 国专利5,659,026),等等。其它组成型启动子包括例如美国专利 5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、 5,268,463、5,608,142、和6,177,611。
“种子优选的”启动子包括在种子发育期间活跃的那些启动子(诸如 种子贮藏蛋白的启动子)以及在种子发芽期间活跃的那些启动子。参见 Thompson et al.(1989)BioEssays 10:108(Thompson等人,1989年,《生物 学论文集》,第10卷,第108页),该文献以引用方式并入本文。这类种 子优选的启动子包括但不限于Ciml(细胞分裂素诱导信息);cZ19B1(玉 米19kDa玉米醇溶蛋白);milps(肌醇-1-磷酸合酶)(参见WO 00/11177 和美国专利6,225,529;所述专利以引用方式并入本文)。γ-玉米醇溶蛋白 基因启动子是胚乳特异性启动子。球蛋白-1(Glob-1)基因启动子是代表性的 胚特异性启动子。对于双子叶植物而言,种子特异性启动子包括但不限于 菜豆β-菜豆蛋白基因启动子、油菜籽蛋白(napin)基因启动子、β-伴大豆球 蛋白基因启动子、大豆凝集素基因启动子、十字花科蛋白基因启动子等。 对于单子叶植物而言,种子特异性启动子包括但不限于玉米15kDa玉米醇 溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、γ-玉米醇溶蛋白、糯 性蛋白基因(waxy)、超甜蛋白1(shrunken 1)、超甜蛋白2(shrunken 2)、球 蛋白1等。还可参见WO 00/12733,其中公开了来自endl和end2基因的种 子优选的启动子。另外的胚特异性启动子在如下文献中公开:Sato et al. (1996)Proc.Natl.Acad.Sci.93:8117-8122(Sato等人,1996年,《美国国家 科学院院刊》,第93卷,第8117-8122页);Nakase et al.(1997)Plant J 12:235-46(Nakase等人,1997年,《植物杂志》,第12卷,第235-246 页);以及Postma-Haarsma et al.(1999)Plant Mol.Biol.39:257-71(Postma- Haarsma等人,1999年,《植物分子生物学》,第39卷,第257-271 页)。另外的胚乳特异性启动子在如下文献中公开:Albani et al.(1984)EMBO 3:1405-15(Albani等人,1984年,《欧洲分子生物学组织杂志》, 第3卷,第1405-1415页);Albani et al.(1999)Theor.Appl.Gen.98:1253-62 (Albani等人,1999年,《理论与应用遗传学》,第98卷,第1253-1262 页);Albani et al.(1993)Plant J.4:343-55(Albani等人,1993年,《植物 杂志》,第4卷,第343-355页);Mena et al.(1998)The Plant Journal116:53-62(Mena等人,1998年,《植物杂志》,第116卷,第53-62页) 和Wu et al.(1998)Plant Cell Physiology 39:885-889(Wu等人,1998年, 《植物细胞生理学》,第39卷,第885-889页)。
分裂细胞或分生组织优选的启动子已在如下文献中公开:Ito et al. (1994)Plant Mol.Biol.24:863-878(Ito等人,1994年,《植物分子生物 学》,第24卷,第863-878页);Reyad et al.(1995)Mo.Gen.Genet. 248:703-711(Reyad等人,1995年,《分子遗传学与普通遗传学》,第 248卷,第703-711页);Shaul et al.(1996)Proc.Natl.Acad.Sci.93:4868- 4872(Shaul等人,1996年,《美国国家科学院院刊》,第93卷,第4868- 4872页);Itoet al.(1997)Plant J.11:983-992(Ito等人,1997年,《植物 杂志》,第11卷,第983-992页);以及Trehin et al.(1997)Plant Mol.Biol. 35:667-672(Trehin等人,1997年,《植物分子生物学》,第35卷,第 667-672页)。
胁迫诱导型启动子包括盐/水胁迫诱导型启动子,诸如P5CS(Zang et al.(1997)Plant Sciences 129:81-89(Zang等人,1997年,《植物科学》, 第129卷,第81-89页));冷诱导型启动子,诸如cor15a(Hajela et al. (1990)Plant Physiol.93:1246-1252(Hajela等人,1990年,《植物生理 学》,第93卷,第1246-1252页))、cor15b(Wlihelm et al.(1993)Plant Mol Biol 23:1073-1077(Wlihelm等人,1993年,《植物分子生物学》,第 23卷,第1073-1077页))、wsc120(Ouellet et al.(1998)FEBS Lett.423- 324-328(Ouellet等人,1998年,《欧洲生化学会联合会快报》,第423 卷,第324-328页))、ci7(Kirch et al.(1997)Plant Mol Biol.33:897-909 (Kirch等人,1997年,《植物分子生物学》,第33卷,第897-909页))、ci21A(Schneider et al.(1997)Plant Physiol.113:335-45(Schneider 等人,1997年,《植物生理学》,第113卷,第335-345页));干旱诱 导型启动子,诸如Trg-31(Chaudharyet al(1996)Plant Mol.Biol.30:1247- 57(Chaudhary等人,1996年,《植物分子生物学》,第30卷,第1247- 1257页))、rd29(Kasuga et al.(1999)Nature Biotechnology 18:287-291 (Kasuga等人,1999年,《自然生物技术》,第18卷,第287-291 页));渗透诱导型启动子,诸如Rab17(Vilardell et al.(1991)Plant Mol. Biol.17:985-93(Vilardell等人,1991年,《植物分子生物学》,第17卷, 第985-993页))和渗透蛋白(Raghothama et al.(1993)Plant Mol Biol 23:1117-28(Raghothama等人,1993年,《植物分子生物学》,第23卷, 第1117-1128页));以及热诱导型启动子,诸如热休克蛋白(Barros et al. (1992)PlantMol.19:665-75(Barros等人,1992年,《植物分子生物学》, 第19卷,第665-675页);Marrset al.(1993)Dev.Genet.14:27-41(Marrs等 人,1993年,《发育遗传学》,第14卷,第27-41页))和smHSP (Waters et al.(1996)J.Experimental Botany 47:325-338(Waters等人,1996 年,《实验植物学杂志》,第47卷,第325-338页))。其它胁迫诱导型 启动子包括rip2(美国专利5,332,808和美国专利公开2003/0217393)和 rd29A(Yamaguchi-Shinozaki etal.(1993)Mol.Gen.Genetics 236:331-340 (Yamaguchi-Shinozaki等人,1993年,《分子遗传学与普通遗传学》,第 236卷,第331-340页))。
如本文别处所述,包含雄性能育性多核苷酸的表达盒可与其它目的多 核苷酸堆叠。任何目的多核苷酸均可与雄性能育性多核苷酸堆叠,包括例 如雄性配子破坏性多核苷酸和标记多核苷酸。
本文所公开的雄性能育性多核苷酸可堆叠在包含可操作地连接至具有 雄性配子破坏性的多核苷酸(即,干扰雄性配子的功能、形成或传播的多 核苷酸)的启动子的表达盒中,或与该表达盒堆叠。可通过多种方法中的 任一种来操作雄性配子破坏性多核苷酸以阻止雄性配子的功能、形成或传 播。以举例而非限制的方式,这可包括使用这样的多核苷酸,其编码基因 产物诸如DAM-甲基化酶或芽孢杆菌RNA酶(参见例如,美国专利 5,792,853或5,689,049,PCT/EP89/00495);编码干扰淀粉累积、降解淀粉 或影响花粉中的渗透平衡的基因产物,诸如α-淀粉酶(参见例如美国专利 7,875,764、8,013,218、7,696,405、8,614,367);抑制对于雄性配子的功 能、形成或传播而言重要的基因产物的形成(参见例如,美国专利 5,859,341、6,297,426);编码与另一种基因产物结合以阻止雄性配子的形 成或功能的基因产物(参见例如美国专利6,162,964、6,013,859、 6,281,348、6,399,856、6,248,935、6,750,868、5,792,853);与对雄性配子 的功能、形成或传播至关重要的基因反义,或导致对所述基因的共抑制 (参见例如美国专利6,184,439、5,728,926、6,191,343、5,728,558、 5,741,684);通过使用发夹式形成物干扰雄性能育性多核苷酸的表达(参 见例如Smith et al.(2000)Nature 407:319-320(Smith等人,2000年,《自 然》,第407卷,第319-320页)、WO 99/53050和WO 98/53083),等 等。
雄性配子破坏性多核苷酸包括显性负基因,诸如甲基化酶基因和生长 抑制基因。参见美国专利6,399,856。显性负基因包括白喉毒素A链基因 (Czako and An(1991)PlantPhysiol.95 687-692(Czako和An,1991年, 《植物生理学》,第95卷,第687-692页);Greenfield et al.(1983)PNAS 80:6853(Greenfield等人,1983年,《美国国家科学院院刊》,第80卷, 第6853页));细胞周期分裂突变体,诸如玉米中的CDC(Colasanti et al.(1991)PNAS 88:3377-3381(Colasanti等人,1991年,《美国国家科学院院 刊》,第88卷,第3377-3381页));WT基因(Farmer et al.(1994)Mol. Genet.3:723-728(Farmer等人,1994年,《分子遗传学》,第3卷,第 723-728页));以及P68(Chen et al.(1991)PNAS 88:315-319(Chen等 人,1991年,《美国国家科学院院刊》,第88卷,第315-319页))。
雄性配子破坏性多核苷酸的另外的示例包括但不限于来自菊欧氏菌 (Erwiniachrysanthermi)的果胶裂解酶基因pelE(Kenn et al(1986)J. Bacteriol.168:595(Kenn等人,1986年,《细菌学杂志》,第168卷,第 595页));来自苏云金芽孢杆菌(Bacillusthuringiensis)以色列亚种的CytA 毒素基因(McLean et al(1987)J.Bacteriol.169:1017(1987)(McLean等人, 1987年,《细菌学杂志》,第169卷,第1017页)、美国专利 4,918,006);DNA酶、RNA酶、蛋白酶或表达反义RNA的多核苷酸。雄 性配子破坏性多核苷酸可编码涉及抑制花粉和柱头的相互作用、花粉管生 长、受精或它们的组合的蛋白质。
本文所公开的雄性能育性多核苷酸可与本文所公开的表达盒堆叠,所 述表达盒包含可操作地连接至编码报道基因或标记产物的目的多核苷酸的 启动子。本领域已知的合适报道基因多核苷酸的示例可见于例如以下文 献:Jefferson et al.(1991)in PlantMolecular Biology Manual,ed.Gelvin et al. (Kluwer Academic Publishers),pp.1-33(Jefferson等人,1991年,载于《植 物分子生物学手册》,Gelvin等人编辑,克吕维尔学术出版社,第1-33 页);DeWet et al.Mol.Cell.Biol.7:725-737(1987)(DeWet等人,1987年,《分子细胞生物学》,第7卷,第725-737页);Goff et al.EMBO J. 9:2517-2522(1990)(Goff等人,1990年,《欧洲分子生物学组织杂志》, 第9卷,第2517-2522页);Kain etal.BioTechniques 19:650-655(1995) (Kain等人,1995年,《生物技术》,第19卷,第650-655页);以及 Chiu et al.Current Biology 6:325-330(1996)(Chiu等人,1996年,《当代生 物学》,第6卷,第325-330页)。在某些实施方案中,目的多核苷酸编码 选择性报道基因。这些多核苷酸可包括赋予抗生素抗性或除草剂抗性的多 核苷酸。合适的选择性标记多核苷酸的示例包括但不限于编码对氯霉素、 甲氨蝶呤、潮霉素、链霉素、壮观霉素、博来霉素、磺酰胺、溴苯腈、草 甘膦和草胺膦的抗性的基因。
在一些实施方案中,本文所公开的表达盒包含编码可记录或可筛选标 记的目的多核苷酸,其中多核苷酸的存在产生可测量的产物。示例包括β- 葡糖苷酸酶或uidA基因(GUS),其编码针对其的各种显色底物是已知的酶 (例如,美国专利5,268,463和5,599,670);氯霉素乙酰转移酶和碱性磷酸 酶。其它可筛选的标记包括花青苷/类黄酮多核苷酸,包括例如编码调控植 物组织中花青苷色素(红色)的产生的产物的R-基因座多核苷酸,控制类 黄酮色素的生物合成的基因,诸如玉米C1和C2、B基因、p1基因和 bronze基因座基因等。由目的多核苷酸编码的合适的标记的另外的示例包 括青色荧光蛋白(CYP)基因、黄色荧光蛋白基因、编码荧光素酶的发光基因 (其存在可使用例如,X光片、闪烁计数、荧光光度法、微光摄像机、光 子计数照相机或多孔发光测定法来检测)、绿色荧光蛋白(GFP)和DsRed2 (美国加利福尼亚州山景城的克隆实验室公司(Clontech Laboratories,Inc.,Mountain View,California)),其中用标记基因转化的植物细胞发出红色荧 光,因而可从视觉上选择。另外的示例包括编码其各种显色底物(例如, PADAC、显色头孢菌素)已知的酶的p-内酰胺酶基因、编码可转化显色儿 茶酚的儿茶酚双加氧酶的xylE基因和编码能够将酪氨酸氧化为多巴和多巴 醌(其继而缩合以形成易于检测的化合物黑素)的酶的酪氨酸酶基因。
表达盒还可包含用于选择转化的细胞的选择性标记基因。选择性标记 基因用于选择经转化的细胞或组织。标记基因包括编码抗生素抗性的基 因,诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的 基因,以及赋予对除草化合物的抗性的基因,所述除草化合物诸如草铵 膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-D)。另外的选择性标记 包括表型标记诸如β-半乳醣苷酶和荧光蛋白诸如绿色荧光蛋白(GFP)(Suet al.(2004)Biotechnol Bioeng 85:610-9(Su等人,2004年,《生物技术和生 物工程》,第85卷,第610-619页)和Fetter et al.(2004)Plant Cell 16:215- 28(Fetter等人,2004年,《植物细胞》,第16卷,第215-228页))、 青色荧光蛋白(CYP)(Bolte et al.(2004)J.Cell Science 117:943-54(Bolte等 人,2004年,《细胞科学杂志》,第117卷,第943-954页)和Kato et al. (2002)Plant Physiol 129:913-42(Kato等人,2002年,《植物生理学》,第 129卷,第913-942页))和黄色荧光蛋白(来自Evrogen公司的 PhiYFPTM,参见Bolte etal.(2004)J.Cell Science 117:943-54(Bolte等人, 2004年,《细胞科学杂志》,第117卷,第943-954页))。对于另外的 选择性标记,通常参见Yarranton(1992)Curr.Opin.Biotech.3:506-511 (Yarranton,1992年,《生物技术新见》,第3卷,第506-511页); Christopherson et al.(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318(Christopherson等人,1992年,《美国国家科学院院刊》,第89卷,第 6314-6318页);Yao etal.(1992)Cell 71:63-72(Yao等人,1992年,《细 胞》,第71卷,第63-72页);Reznikoff(1992)Mol.Microbiol.6:2419-2422 (Reznikoff,1992年,《分子微生物学》,第6卷,第2419-2422页); Barkley et al.(1980)in The Operon,pp.177-220(Barkley等人,1980年,载 于《操纵子》,第177-220页);Hu et al.(1987)Cell 48:555-566(Hu等 人,1987年,《细胞》,第48卷,第555-566页);Brown et al.(1987) Cell 49:603-612(Brown等人,1987年,《细胞》,第49卷,第603-612 页);Figge et al.(1988)Cell 52:713-722(Figge等人,1988年,《细 胞》,第52卷,第713-722页);Deuschle et al.(1989)Proc.Natl.Acad.Aci.USA 86:5400-5404(Deuschle等人,1989年,《美国国家科学院院刊》, 第86卷,第5400-5404页);Fuerst et al.(1989)Proc.Natl.Acad.Sci.USA 86:2549-2553(Fuerst等人,1989年,《美国国家科学院院刊》,第86 卷,第2549-2553页);Deuschle et al.(1990)Science 248:480-483 (Deuschle等人,1990年,《科学》,第248卷,第480-483页);Gossen (1993)Ph.D.Thesis,University of Heidelberg(Gossen,1993年,德国海德尔 堡大学博士论文);Reines et al.(1993)Proc.Natl.Acad.Sci.USA 90:1917- 1921(Reines等人,1993年,《美国国家科学院院刊》,第90卷,第 1917-1921页);Labow et al.(1990)Mol.Cell.Biol.10:3343-3356(Labow等 人,1990年,《分子细胞生物学》,第10卷,第3343-3356页); Zambretti et al.(1992)Proc.Natl.Acad.Sci.USA 89:3952-3956(Zambretti等 人,1992年,《美国国家科学院院刊》,第89卷,第3952-3956页); Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88:5072-5076(Baim等人,1991 年,《美国国家科学院院刊》,第88卷,第5072-5076页);Wyborski et al.(1991)Nucleic Acids Res.19:4647-4653(Wyborski等人,1991年,《核 酸研究》,第19卷,第4647-4653页);Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10:143-162(Hillenand-Wissman,1989年,《分子结构生物学主题》,第10卷,第143-162页);Degenkolb et al.(1991)Antimicrob. AgentsChemother.35:1591-1595(Degenkolb等人,1991年,《抗微生物剂 和化学治疗》,第35卷,第1591-1595页);Kleinschnidt et al.(1988) Biochemistry 27:1094-1104(Kleinschnidt等人,1988年,《生物化学》,第 27卷,第1094-1104页);Bonin(1993)Ph.D.Thesis,University of Heidelberg(Bonin,1993年,德国海德尔堡大学博士论文);Gossen et al.(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551(Gossen等人,1992年,《美 国国家科学院院刊》,第89卷,第5547-5551页);Oliva et al. (1992)Antimicrob.AgentsChemother.36:913-919(Oliva等人,1992年,《抗 微生物剂和化学治疗》,第36卷,第913-919页);Hlavka et al.(1985) Handbook of Experimental Pharmacology,Vol.78(Springer-Verlag,Berlin) (Hlavka等人,1985年,《实验药理学手册》,第78卷,柏林斯普林格出 版社);Gill et al.(1988)Nature 334:721-724(Gill等人,1988年,《自 然》,第334卷,第721-724页)。这些公开内容以引用的方式并入本文。 以上选择性标记基因的列表并不意指是限制性的。任何选择性标记基因均 可用于本文所公开的组合物和方法中。
在一些实施方案中,本文所公开的表达盒包含编码可操作地连接至第 一启动子多核苷酸的雄性能育性多核苷酸的第一目的多核苷酸,该第一目 的多核苷酸与编码可操作地连接至雄性组织优选的启动子多核苷酸的雄性 配子破坏性基因产物的第二目的多核苷酸堆叠。在某些实施方案中,本文 所述的表达盒还可与编码可操作地连接至启动子多核苷酸的标记多核苷酸 的第三目的多核苷酸堆叠。
在特定实施方案中,本文所公开的表达盒包含编码本文所公开的可操 作地连接至组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的雄 性能育性基因(诸如小麦或大麦Ms1)的第一目的多核苷酸。表达盒还可 包含编码可操作地连接至雄性组织优选的启动子的雄性配子破坏性基因产 物的第二目的多核苷酸。在某些实施方案中,本文所公开的表达盒还可以 包含编码可操作地连接至组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的标记基因(诸如来自产绿色链霉菌(Streptomyces viridochomagenes)的草胺膦乙酰转移酶(PAT)基因)的第三目的多核苷酸。
IV.植物
A.具有改变的雄性能育性多肽水平/活性的植物
还提供了具有改变的雄性能育性多肽水平和/或活性和/或改变的雄性能 育性水平的植物。在一些实施方案中,本文所公开的植物已在它们的基因 组中稳定地掺入了如本文所公开的异源雄性能育性多核苷酸或其活性片段 或变体。因此,提供了这样的植物、植物细胞、植物部分和种子,它们包 含SEQ ID NO:1、2、4、7、42、43、44或45中任一者示出的至少一种异 源雄性能育性多核苷酸,或者它们的任何活性片段或变体。
还提供了包含本文所公开的表达盒的植物,该表达盒包含可操作地连 接至在植物中有活性的启动子的雄性能育性多核苷酸。在一些实施方案 中,雄性能育性多核苷酸的表达调节植物的雄性能育性。在某些实施方案 中,雄性能育性多核苷酸的表达增强植物的雄性能育性。例如,提供了包 含这样的表达盒的植物,该表达盒包含可操作地连接至组成型启动子(诸 如CaMV 35S启动子)的SEQ ID NO:1、2、4、7、42、43、44或45示出 的Ms1多核苷酸,或者它们的活性片段或变体。在Ms1多核苷酸表达时, 植物的雄性能育性增强。
在某些实施方案中,向雄性不育植物提供表达盒,该表达盒包含本文 所公开的可操作地连接至在植物中有活性的启动子的异源雄性能育性多核 苷酸或者其活性片段或变体。在异源雄性能育性多核苷酸表达时,赋予雄 性能育性;这可被称为恢复植物的雄性能育性。在特定实施方案中,本文 所公开的植物包含具有如本文所公开的可操作地连接至启动子的异源雄性 能育性多核苷酸、或其活性片段或变体的表达盒,该表达盒与包含可操作地连接至在植物中有活性的启动子的目的多核苷酸的一个或多个表达盒堆 叠。例如,堆叠的目的多核苷酸可包括雄性配子破坏性多核苷酸和/或标记 多核苷酸。
本文所公开的植物还可以包含本文所述的具有至少两种多核苷酸的堆 叠表达盒,使得所述至少两种多核苷酸在超过50%的减数分裂中(即,不 是随机地)被一起遗传。因此,当包含具有两种多核苷酸的堆叠表达盒的 植物或植物细胞发生减数分裂时,所述两种多核苷酸分离到同一个子代 (子系)细胞中。这样,堆叠的多核苷酸将很可能在它们被呈递至的任何 细胞中一起表达。例如,植物可包含具有雄性能育性多核苷酸的表达盒, 该表达盒与包含雄性配子破坏性多核苷酸的表达盒堆叠,使得雄性能育性 多核苷酸和雄性配子破坏性多核苷酸被一起遗传。具体地讲,雄性不育植 物可包含具有本文所公开的可操作地连接至组成型启动子的雄性能育性多 核苷酸的表达盒,该表达盒与包含可操作地连接至雄性组织优选启动子的 雄性配子破坏性多核苷酸的表达盒堆叠,使得所述植物产生成熟的花粉 粒。然而,在这种植物中,包含雄性能育性多核苷酸的花粉的发育将被雄 性配子破坏性多核苷酸的表达抑制。
B.植物和引入方法
如本文所用,术语“植物”包括植物细胞、植物原生质体、从中可再 生出植物的植物细胞组织培养物、植物愈伤组织、在植物或植物部分中完 好的植物块和植物细胞如胚、花粉、胚珠、种子、叶、花、枝、果实、 仁、穗、穗轴、壳、茎、根、根尖、花粉囊、谷粒等。如本文所用,所谓 “谷粒”意指商业种植者出于栽培或繁殖物种以外的目的生产的成熟种 子。再生植物的子代、变体和突变体也包括在本公开的范围内,前提条件 是这些部分包含所引入的核酸序列。
本文所公开的方法包括将多肽或多核苷酸引入植物细胞中。“引入” 旨在意指以使得多核苷酸或多肽的序列得以进入细胞内部的方式将多核苷 酸或多肽呈递到植物。本文所公开的方法不依赖于将序列引入宿主细胞中 的具体方法,只要多核苷酸或多肽进入宿主的至少一个细胞的内部即可。 用于将多核苷酸或多肽引入宿主细胞(即,植物细胞)中的方法是本领域 已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。
“稳定转化”旨在意指被引入宿主(即,植物)中的核苷酸构建体整 合进植物的基因组中,并能够由其子代遗传。“瞬时转化”旨在意指将多 核苷酸或多肽引入宿主(即,植物)中并进行瞬时表达。
转化规程以及用于将多肽或多核苷酸序列引入植物中的规程,可根据 要进行转化的植物或植物细胞的类型(例如,单子叶植物或双子叶植物) 而异。将多肽和多核苷酸引入植物细胞中的合适方法包括微注射 (Crossway et al.(1986)Biotechniques 4:320-334(Crossway等人,1986年, 《生物技术》,第4卷,第320-334页))、电穿孔(Riggs et al.(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606(Riggs等人,1986年,《美国 国家科学院院刊》,第83卷,第5602-5606页))、农杆菌(Agrobacterium) 介导的转化(Townsend等人,美国专利5,563,055;Zhao等人,美国专利 5,981,840)、直接基因转移(Paszkowski et al.(1984)EMBO J.3:2717-2722 (Paszkowski等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第 2717-2722页))和弹道粒子加速(参见例如Sanford等人,美国专利 4,945,050;Tomes等人,美国专利5,879,918;Tomes等人,美国专利 5,886,244;Bidney等人,美国专利5,932,782;Tomes et al.(1995)″Direct DNA Transfer into Intact Plant Cells viaMicroprojectile Bombardment,″inPlant Cell,Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin)(Tomes等人,1995年,“通过微粒轰击直 接将DNA转移进完整植物细胞中”,载于《植物细胞、组织和器官培养: 基本方法》,Gamborg和Phillips编辑,柏林施普林格出版社);McCabe et al.(1988)Biotechnology 6:923-926(McCabe等人,1988年,《生物技 术》,第6卷,第923-926页));以及Lec1转化(WO 00/28058)。还可参 见Weissinger et al.(1988)Ann.Rev.Genet.22:421-477(Weissinger等人, 1988年,《遗传学年评》,第22卷,第421-477页);Sanford et al.(1987) Particulate Science and Technology 5:27-37(Sanford等人,1987年,《颗粒 科学与技术》,第5卷,第27-37页)(洋葱);Christou et al.(1988)PlantPhysiol.87:671-674(Christou等人,1988年,《植物生理学》,第87卷, 第671-674页)(大豆);McCabe et al.(1988)Bio/Technology 6:923-926 (McCabe等人,1988年,《生物技术》,第6卷,第923-926页)(大 豆);Finer and McMullen(1991)In Vitro CellDev.Biol.27P:175-182(Finer 和McMullen,1991年,《体外细胞发育生物学》,第27P卷,第175-182 页)(大豆);Singh et al.(1998)Theor.Appl.Genet.96:319-324(Singh等 人,1998年,《理论与应用遗传学》,第96卷,第319-324页)(大 豆);Datta et al.(1990)Biotechnology 8:736-740(Datta等人,1990年, 《生物技术》,第8卷,第736-740页)(稻);Klein et al. (1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(Klein等人,1988年,《美国国家科学院院刊》,第85卷,第4305-4309页)(玉米);Klein et al. (1988)Biotechnology6:559-563(Klein等人,1988年,《生物技术》,第6 卷,第559-563页)(玉米);Tomes,美国专利5,240,855;Buising等 人,美国专利5,322,783和5,324,646;Tomes et al.(1995)″Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment,″inPlant Cell, Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg(Springer- Verlag,Berlin)(Tomes等人,1995年,“通过微粒轰击直接将DNA转移到 完整植物细胞中”,载于《植物细胞、组织和器官培养:基本方法》, Gamborg编辑,柏林施普林格出版社)(玉米);Klein et al.(1988)Plant Physiol.91:440-444(Klein等人,1988年,《植物生理学》,第91卷,第 440-444页)(玉米);Fromm et al.(1990)Biotechnology 8:833-839 (Fromm等人,1990年,《生物技术》,第8卷,第833-839页)(玉 米);Hooykaas-VanSlogteren et al.(1984)Nature(London)311:763-764 (Hooykaas-Van Slogteren等人,1984年,《自然》(伦敦),第311卷, 第763-764页);Bowen等人,美国专利5,736,369(谷类);Bytebier et al. (1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(Bytebier等人,1987年, 《美国国家科学院院刊》,第84卷,第5345-5349页)(百合科);De Wet et al.(1985)inThe Experimental Manipulation of Ovule Tissues,ed. Chapman et al.(Longman,NewYork),pp.197-209(De Wet等人,1985年, 载于《胚珠组织的实验操纵》,Chapman等人编辑,纽约朗文出版社,第 197-209页)(花粉);Kaeppler et al.(1990)Plant Cell Reports 9:415-418 (Kaeppler等人,1990年,《植物细胞报告》,第9卷,第415-418页)和 Kaeppler etal.(1992)Theor.Appl.Genet.84:560-566(Kaeppler等人,1992 年,《理论与应用遗传学》,第84卷,第560-566页)(颈须介导的转 化);D′Halluin et al.(1992)Plant Cell 4:1495-1505(D′Halluin等人,1992 年,《植物细胞》,第4卷,第1495-1505页)(电穿孔);Li et al.(1993) Plant Cell Reports 12:250-255(Li等人,1993年,《植物细胞报告》,第 12卷,第250-255页)和Christou and Ford(1995)Annals of Botany 75:407- 413(Christou和Ford,1995年,《植物学年鉴》,第75卷,第407-413 页)(稻);Osjoda et al.(1996)NatureBiotechnology 14:745-750(Osjoda 等人,1996年,《自然生物技术》,第14卷,第745-750页)(玉米,通 过根瘤农杆菌转化);以上所有文献以引用方式并入本文。
在具体的实施方案中,可使用多种瞬时转化方法为植物提供本文所公 开的雄性能育性多核苷酸或表达盒。这种瞬时转化方法包括但不限于直接 向植物中引入雄性能育性多肽或其变体和片段,或者向植物中引入雄性能 育性转录物。这类方法包括例如显微注射法或粒子轰击法。参见例如 Crossway et al.(1986)Mol Gen.Genet.202:179-185(Crossway等人,1986 年,《分子遗传学与普通遗传学》,第202卷,第179-185页);Nomura etal.(1986)Plant Sci.44:53-58(Nomura等人,1986年,《植物科学》,第 44卷,第53-58页);Hepler et al.(1994)Proc.Natl.Acad.Sci.91:2176-2180 (Hepler等人,1994年,《美国国家科学院院刊》,第91卷,第2176- 2180页)以及Hush et al.(1994)The Journal of CellScience 107:775-784 (Hush等人,1994年,《细胞科学杂志》,第107卷,第775-784页), 以上所有文献以引用方式并入本文。或者,可使用本领域已知的技术将本 文所公开的雄性能育性多核苷酸或表达盒瞬时转化到植物中。此类技术包 括利用病毒载体系统,和将多核苷酸以避免DNA随后释放的方式沉淀。因 此,虽然仍可能从粒子结合的DNA开始转录,但这种DNA释放继而整合 到基因组中的频率会大大降低。此类方法包括使用包被有聚乙基亚胺(PEI,Sigma#P3143)的粒子。
在其它实施方案中,通过使植物与病毒或病毒核酸接触,可将本文所 公开的雄性能育性多核苷酸或表达盒引入植物中。一般来讲,此类方法涉 及将本文所公开的核苷酸构建体掺入在病毒DNA或RNA分子内。应当认 识到,本文所公开的雄性能育性序列可最初作为病毒聚蛋白的一部分来合 成,其随后可通过体内或体外蛋白水解进行加工,由此产生所需的重组蛋 白。涉及病毒DNA或RNA分子的用于将多核苷酸引入植物中并表达其中 所编码的蛋白质的方法是本领域已知的。参见例如美国专利5,889,191、 5,889,190、5,866,785、5,589,367、5,316,931,以及Porta et al.(1996) Molecular Biotechnology 5:209-221(Porta等人,1996年,《分子生物技 术》,第5卷,第209-221页);以上文献以引用方式并入本文。
用于在植物基因组中特定位置处靶向插入多核苷酸的方法是本领域已 知的。在一个实施方案中,在期望的基因组位置插入多核苷酸是使用位点 特异性重组系统实现的。参见例如WO99/25821、WO99/25854、 WO99/25840、WO99/25855和WO99/25853,这些专利全部以引用方式并入 本文。简而言之,本文所公开的多核苷酸可包含在旁侧分布有两个不相同的重组位点的转移盒中。将转移盒引入在其基因组中稳定掺入这样的靶标 位点的植物中,该靶标位点在旁侧分布有与该转移盒的所述位点对应的两 个不相同的重组位点。提供适当的重组酶,并且将转移盒整合在该靶标位 点处。目的多核苷酸因此被整合在植物基因组中的特定染色体位置处。
可依据常规方式将已转化的细胞培育成植株。参见例如McCormick et al.(1986)Plant Cell Reports 5:81-84(McCormick等人,1986年,《植物细 胞报告》,第5卷,第81-84页)。然后可用相同的转化植株或不同的植株 对这些植物进行授粉,并且所得的子代具有所鉴定的所需表型特征的所需 表达。可以培育两代或更多世代,以确保所需表型特征的表达得到稳定保 持和遗传,然后收获种子,以确保已实现所需表型特征的表达。以此方 式,本公开提供在其基因组中稳定掺入了本文所公开的雄性能育性多核苷 酸(例如本文所公开的表达盒)的转化种子(也称为“转基因种子”)。
术语“靶位点”、“靶序列”、“靶DNA”、“靶基因座”、“基因 组靶位点”、“基因组靶序列”、和“基因组靶基因座”在本文中可互换 使用,并且是指在细胞基因组(包括叶绿体和线粒体DNA)中诱导双链断 裂的位置处的细胞的基因组中的多核苷酸序列。靶位点可以是细胞或生物 体的基因组中的内源位点,或者靶位点对于细胞或生物体可以是异源的, 因而并非天然存在于基因组中,或者与在自然界中存在的位置相比,靶位 点可在异源基因组位置中存在。如本文所用,术语“内源靶序列”和“天 然靶序列”在本文中可互换使用,是指对于细胞或生物体的基因组是内源 的或天然的并且在细胞或生物体的基因组中位于该靶序列的内源或天然位 置的靶序列。细胞包括植物细胞以及通过本文所述的方法产生的植物和种 子。
在一个实施方案中,与正在使用的特定基因编辑系统相关的靶位点可 与通过双链断裂诱导剂特异性识别和/或结合的DNA识别位点或靶位点相 似,所述双链断裂诱导剂为诸如但不限于锌指内切核酸酶、大范围核酸 酶、TALEN内切核酸酶、CRISPR-Cas向导RNA或其它多核苷酸指导的双 链断裂试剂。
术语“人工靶位点”和“人工靶序列”在本文中可互换使用,是指已 经引入细胞或生物体的基因组中的靶序列。这种人工靶序列可在序列上与 细胞基因组中的内源或天然靶序列相同,但可位于细胞或生物体的基因组 中的不同位置(即,非内源或非天然位置)。
术语“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”和 “修饰的靶序列”在本文中可互换使用,是指与未改变的靶序列相比包括 至少一个改变的如本文所公开的靶序列。这种“改变”包括,例如:(i)替 换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或 者(iv)(i)-(iii)的任何组合。例如,已经证实msld、msle、mslf或mslh的点 突变导致雄性不育;类似的突变可定向发生在Ms1的外显子内,以提供导 致雄性不育的替代等位基因。此外,可组合使用多个突变。
某些实施方案包括使用内切核酸酶修饰的本文所公开的多核苷酸。内 切核酸酶是裂解多核苷酸链内的磷酸二酯键的酶,并且包括在特定位点裂 解DNA而不损伤碱基的限制性内切核酸酶。限制性内切核酸酶包括I型、 II型、III型和IV型内切核酸酶,它们进一步包括亚型。在I型和III型系 统中,甲基化酶活性和限制酶活性两者都包含在单一复合物中。
内切核酸酶还包括大范围核酸酶,也称为归巢内切核酸酶(HEase)。与 限制性内切核酸酶类似,HEase在特异性识别位点结合和切割。但大范围 核酸酶的识别位点通常更长,约为18bp或更长。(参见2012年3月22日 提交的专利公开WO2012/129373)。基于保守序列基序,已经将大范围核 酸酶分类为四个家族(Belfort M,and Perlman P SJ.Biol.Chem.1995; 270:30237-30240(Belfort M和Perlman PS,《生物化学杂志》,1995年, 第270卷,第30237-30240页))。这些基序参与金属离子的配位和磷酸二 酯键的水解。HEase的显著之处在于它们的识别位点长,并且能容忍它们 的DNA底物中有一定的序列多态性。
大范围核酸酶的命名规范与其它限制性内切核酸酶的规范相似。对于 分别由自立式(free-standing)ORF、内含子和内含肽编码的大范围核酸酶, 它们还通过前缀F-、I-或者PI-进行表征。重组过程中的一个步骤涉及在识 别位点之处或者附近进行多核苷酸裂解。该裂解活性可用于产生双链断 裂。有关位点特异性重组酶及其识别位点的综述,参见Sauer(1994) Curr.Op.Biotechnol.5:521-7(Sauer等人,1994年,《生物技术当前述 评》,第5卷,第521-527页);以及Sadowski(1993)FASEB 7:760-7 (Sadowski,1993年,《美国实验生物学学会联合会》,第7卷,第760- 767页)。在一些示例中,重组酶来自整合酶或者解离酶家族。
TAL效应子核酸酶是一类序列特异性核酸酶,可用于在植物或者其它 生物体的基因组中的特定靶序列处产生双链断裂(Miller et al.(2011)Nature Biotechnology 29:143-148(Miller等人,2011年,《自然生物技术》,第 29卷,第143-148页))。锌指核酸酶(ZFN)是工程改造的双链断裂诱导 剂,由锌指DNA结合结构域和双链断裂诱导剂结构域构成。识别位点特异 性由锌指结构域赋予,锌指结构域通常包含两个、三个或者四个例如具有 C2H2结构的锌指;但是其它锌指结构也是已知的并已被工程化。锌指结构 域易于设计特异性结合选定的多核苷酸识别序列的多肽。ZFN包括连接到 非特异性内切核酸酶结构域的工程改造的DNA结合锌指结构域,所述非特 异性内切核酸酶结构域例如来自II型内切核酸酶(诸如FokI)的核酸酶结 构域。可将另外的功能性融合到锌指结合结构域,包括转录激活因子结构 域、转录阻遏蛋白结构域和甲基化酶。在一些示例中,核酸酶结构域的二 聚化为裂解活性所需。每个锌指识别靶DNA中的三个连续碱基对。例如, 一个3锌指结构域识别9个连续核苷酸的序列;由于该核酸酶要求二聚 化,使用两组锌指三联体来结合一条18个核苷酸的识别序列。
CRISPR基因座(Clustered Regularly Interspaced Short PalindromicRepeats,规律成簇间隔短回文重复序列)(也称SPIDR——SPacer Interspersed DirectRepeats,间隔区散在同向重复序列)构成最近描述的 DNA基因座的家族。CRISPR基因座由短且高度保守的DNA重复序列(通 常24bp至40bp,重复1至140次,也称CRISPR重复序列)组成,所述 DNA重复序列是部分回文的。重复的序列(通常是物种特异性的)被恒定 长度的可变序列(通常20至58,取决于CRISPR基因座(2007年3月1日 公布的WO2007/025097))间隔。
CRISPR基因座首先在大肠杆菌中识别(Ishino et al.(1987)J.Bacterial. 169:5429-5433(Ishino等人,1987年,《细菌学杂志》,第169卷,第 5429-5433页);Nakata etal.(1989)J.Bacterial.171:3553-3556(Nakata等 人,1989年,《细菌学杂志》,第171卷,第3553-3556页))。在地中 海富盐菌(Haloferax mediterranei)、酿脓链球菌(Streptococcus pyogenes)、鱼 腥藻属(Anabaena)和肺结核分枝杆菌(Mycobacteriumtuberculosis)中已鉴定出 类似的散在短序列重复序列(Groenen et al.(1993)Mol.Microbiol.10:1057- 1065(Groenen等人,1993年,《分子微生物学》,第10卷,第1057-1065页);Hoe et al.(1999)Emerg.Infect.Dis.5:254-263(Hoe等人,1999 年,《新兴传染病》,第5卷,第254-263页);Masepohl et al.(1996) Biochim.Biophys.Acta 1307:26-30(Masepohl等人,1996年,《生物化学 与生物物理学学报》,第1307卷,第26-30页);Mojicaet al.(1995)Mol. Microbiol.17:85-93(Mojica等人,1995年,《分子微生物学》,第17卷,第85-93页))。CRISPR基因座与其它SSR不同之处在于重复序列的结 构,该重复序列也被命名为短规则间隔重复序列(SRSR)(Janssen et al. (2002)OMICS J.Integ.Biol.6:23-33(Janssen等人,2002年,《0MICS:整 合生物学杂志》,第6卷,第23-33页);Mojica et al.(2000)Mol. Microbiol.36:244-246(Mojica等人,2000年,《分子微生物学》,第36 卷,第244-246页))。重复序列是成簇出现的短元件,其通常被恒定长度 的可变序列规则地间隔(Mojica et al.(2000)Mol.Microbiol.36:244-246 (Mojica等人,2000年,《分子微生物学》,第36卷,第244-246 页))。
Cas基因是指通常与侧翼CRISPR基因座偶联、相关或接近或在侧翼 CRISPR基因座附近的基因。术语“Cas基因”、“CRISPR相关(Cas)基 因”在本文中可互换使用。Cas蛋白家族的综述在Haft et al.(2005) Computational Biology,PLoS Comput Biol 1(6):e60.doi:10.1371/journal.pcbi.0010060(Haft等人,2005年,“计算生物学”, 《数学与计算生物学》,第1卷,第6期,第e60页, doi:10.1371/journal.pcbi.0010060)中呈现。如该文献中所描述,除了四个之 前已知的基因家族外,还描述了41个CRISPR相关(Cas)基因家族。该文献 表明,CRISPR系统属于不同的类别,具有不同的重复序列模式、不同组的 基因以及不同物种范围。给定的CRISPR基因座中的Cas基因的数目可随 物种而不同。
Cas内切核酸酶涉及由Cas基因编码的Cas蛋白,其中所述Cas蛋白能 够将双链断裂引入DNA靶序列中。Cas内切核酸酶由向导多核苷酸导向以 在特定靶位点处识别并任选地将双链断裂引入细胞基因组中(提交于2014 年7月11日的美国临时申请62/023239)。向导多核苷酸/Cas内切核酸酶 系统包括Cas内切核酸酶和能够将双链断裂引入DNA靶序列中的向导多核 苷酸的复合物。Cas内切核酸酶解开基因组靶位点附近的DNA双链体,如 果正确的前间区序列邻近基序(PAM)大致定向在靶序列的3′端,那么在向导 RNA识别靶序列后,该Cas内切核酸酶裂解两条DNA链。
Cas内切核酸酶基因可以是Cas9内切核酸酶或其功能片段,诸如但不 限于2007年3月1日公布的WO2007/025097中的SEQ ID NO:462、474、 489、494、499、505和518所列的Cas9基因。Cas内切核酸酶基因可以是 植物、玉米或大豆优化的Cas9内切核酸酶,诸如但不限于植物密码子优化 的酿脓链球菌(streptococcus pyogenes)Cas9基因,其可识别N(12-30)NGG 形式的任何基因组序列。Cas内切核酸酶可通过本领域已知的任何方法直接 引入细胞中,所述方法例如但不限于瞬时引入法、转染和/或局部施用。
如本文所用,术语“向导RNA”是指crRNA(CRISPR RNA)(其包含 可变靶向结构域)和tracrRNA这两种RNA分子的合成融合体。在一个实 施方案中,向导RNA包含12至30个核苷酸序列的可变靶向结构域和可与 Cas内切核酸酶相互作用的RNA片段。
如本文所用,术语“向导多核苷酸”是指可与Cas内切核酸酶形成复 合物并且使Cas内切核酸酶能够识别并任选地裂解DNA靶位点的多核苷酸 序列(2014年7月11日提交的美国临时申请62/023239)。向导多核苷酸 可以是单分子或双分子。向导多核苷酸序列可以是RNA序列、DNA序列 或它们的组合(RNA-DNA组合序列)。任选地,向导多核苷酸可包含至少一个核苷酸、磷酸二酯键或连接修饰,诸如但不限于锁核酸(LNA)、5-甲 基脱氧胞嘧啶、2,6-二氨基嘌呤、2′-氟腺嘌呤、2′-氟尿嘧啶、2′-O-甲基 RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与 间隔区18(六乙二醇链)分子的连接或者导致环化的5′至3′共价连接。仅 包含核糖核酸的向导多核苷酸也被称为“向导RNA”。
向导多核苷酸可以是双分子(也称为双链体向导多核苷酸),其包含 与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结 构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结 构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子向导多核 苷酸的CER结构域包含沿着互补区域杂交的两个单独分子。两个单独分子 可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施方案中,包含 连接到CER结构域的VT结构域的双链体向导多核苷酸的第一分子被称为 “crDNA”(当由连续DNA核苷酸区段组成时)或“crRNA”(当由连续 RNA核苷酸区段组成时)或“crDNA-RNA”(当由DNA和RNA核苷酸 的组合组成时)。cr核苷酸可包含天然存在于细菌和古细菌中的cRNA的 片段。在一个实施方案中,存在于本文所公开的cr核苷酸中的天然存在于 细菌和古细菌中的cRNA的片段的大小的范围可为但不限于2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核 苷酸。在一些实施方案中,包含CER结构域的双链体向导多核苷酸的第二 分子被称为“tracrRNA”(当由连续RNA核苷酸区段组成时)或 “tracrDNA”(当由连续DNA核苷酸区段组成时)或“tracrDNA-RNA “(当由DNA和RNA核苷酸的组合组成时)。在一个实施方案中,导向 RNA/Cas9内切核酸酶复合物的RNA是包含双链体crRNA-tracrRNA的双链 体RNA。
向导多核苷酸还可以是单分子,其包含与靶DNA中的核苷酸序列互补 的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内 切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结 构域或CER结构域)。所谓“结构域”,是指可以是RNA、DNA和/或 RNA-DNA组合序列的连续核苷酸区段。单向导多核苷酸的VT结构域和/ 或CER结构域可包含RNA序列、DNA序列或RNA-DNA组合序列。在一 些实施方案中,单向导多核苷酸包含连接到tracr核苷酸(包含CER结构 域)的cr核苷酸(包含连接到CER结构域的VT结构域),其中该连接是 包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自 cr核苷酸和tracr核苷酸的序列组成的单向导多核苷酸可被称为“单向导 RNA”(当由连续RNA核苷酸区段组成时)或“单向导DNA”(当由连 续DNA核苷酸区段组成时)或“单指导RNA-DNA”(当由RNA和DNA 核苷酸的组合组成时)。在本公开的一个实施方案中,单向导RNA包含可 与II型Cas内切核酸酶形成复合物的II型/Cas系统的cRNA或cRNA片段 以及tracrRNA或tracrRNA片段,其中所述向导RNA/Cas内切核酸酶复合 物可将Cas内切核酸酶引导至植物基因组靶位点,使Cas内切核酸酶能够 将双链断裂引入基因组靶位点中。与双链体向导多核苷酸相比,使用单向 导多核苷酸的一个方面在于,仅需制备一个表达盒就能表达单向导多核苷 酸。
术语“可变靶向结构域”或“VT结构域”在本文中可互换使用,并且 包括与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一 核苷酸序列结构域(VT结构域)与靶序列之间的互补百分比可为至少 50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、 61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或100%。可变靶向结构域的长度可为 至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29或30个核苷酸。在一些实施方案中,可变靶向结构域包含12 至30个核苷酸的连续区段。可变靶向结构域可由DNA序列、RNA序列、 修饰的DNA序列、修饰的RNA序列或它们的任何组合组成。
向导多核苷酸的术语“Cas内切核酸酶识别结构域”或“CER结构 域”在本文中可互换使用,并且包括与Cas内切核酸酶多肽相互作用的核 苷酸序列(诸如,向导多核苷酸的第二核苷酸序列结构域)。CER结构域 可由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见 例如本文所述的修饰)或它们的任何组合组成。
连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含 RNA序列、DNA序列或RNA-DNA组合序列。在一个实施方案中,连接单 向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列的长度可为至少3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、 69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、 84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或 100个核苷酸。在另一个实施方案中,连接单向导多核苷酸的cr核苷酸和 tracr核苷酸的核苷酸序列可包含四环序列,诸如但不限于GAAA四环序 列。
向导多核苷酸、VT结构域和/或CER结构域的核苷酸序列修饰可选自 但不限于由5′帽、3′多聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成 dsRNA双链体的序列、将向导多核苷酸靶向亚细胞位置的修饰或序列、提 供追踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(LNA)、 5-甲基脱氧胞嘧啶核苷酸、2,6-二氨基嘌呤核苷酸、2′-氟腺嘌呤核苷酸、2′- 氟尿嘧啶核苷酸;2′-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的 连接、与聚乙二醇分子的连接、与间隔区18分子的连接、5′至3′共价连接 或它们的任何组合。这些修饰可导致至少一个另外的有益特征,其中所述 另外的有益特征选自经修饰的或调控的稳定性、亚细胞靶向、追踪、荧光 标记、蛋白质或蛋白质复合物的结合位点、修饰的对互补靶序列的结合亲 和力、修饰的对细胞降解的抗性以及增加的细胞通透性。
在某些实施方案中,待修饰的核苷酸序列可以是调控序列,诸如启动 子,其中启动子的编辑包括用不同启动子(也称为替换启动子)或启动子 片段(也称为替换启动子片段)替换启动子(也称为“启动子更换”或 “启动子替换”),其中启动子替换导致以下中的任一项,或以下项的任 意组合:启动子活性增加、启动子组织特异性增加、启动子活性降低、启 动子组织特异性降低、新的启动子活性、诱导型启动子活性、扩展基因表 达的窗口、相同细胞层或其它细胞层中基因表达的时间选择或发育进展的 改变(诸如但不限于延长玉米花粉囊的绒毡层中基因表达的时间选择;参 见例如1998年11月17日公布的US 5,837,850)、DNA结合元件突变和/或 DNA结合元件缺失或添加。待修饰的启动子(或启动子片段)可以是对于 正被编辑的细胞而言是内源的、人工的、预先存在的或转基因的启动子 (或启动子片段)。替换启动子(或替换启动子片段)可以是对于正被编 辑的细胞而言是内源的、人工的、预先存在的或转基因的启动子(或启动 子片段)。
待插入的启动子元件可为但不限于启动子核心元件(诸如但不限于 CAAT盒、CCAAT盒、Pribnow盒和/或TATA盒)、翻译调控序列和/或可 诱导表达的阻遏物系统(诸如TET操纵子阻遏物/操纵子/诱导物元件或磺 酰脲(Su)阻遏物/操纵子/诱导物元件)。脱水应答元件(DRE)首先被鉴定为 干旱应答基因rd29A的启动子中的顺式作用启动子元件,其含有9bp保守 核心序列TACCGACAT(Yamaguchi-Shinozaki,K.,and Shinozaki,K.(1994)Plant Cell 6,251-264(Yamaguchi-Shinozaki,K.和Shinozaki,K,1994年, 《植物细胞》,第6卷,第251-264页))。将DRE插入内源性启动子可 赋予下游基因的干旱诱导表达。另一个示例是ABA应答元件(ABRE),其 含有发现存在于许多ABA和/或胁迫调控基因中的(C/T)ACGTGGC共有序 列(Busk P.K.,Pages M.(1998)Plant Mol.Biol.37:425-435(Busk P.K.、Pages M.,1998年,《植物分子生物学》,第37卷,第425-435页))。 将35S增强子或MMV增强子插入内源性启动子区域将增加基因表达(美 国专利5196525)。待插入的启动子(或启动子元件)可以是对于正被编辑 的细胞而言是内源的、人工的、预先存在的或转基因的启动子(或启动子 元件)。
本文所公开的雄性能育性多核苷酸和表达盒可用于任何植物物种的转 化,包括但不限于单子叶植物和双子叶植物。目的植物物种的示例包括但 不限于玉米(corn/maize,Zea mays)、芸苔属物种(Brassica sp.)(例如甘蓝型 油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea)),苜蓿(Medicago sativa)、 稻(Oryza sativa)、裸麦(Secalecereale)、高粱(Sorghum bicolor、Sorghum vulgare)、粟(例如珍珠粟(Pennisetumglaucum)、黄米(Panicum miliaceum)、谷子(Setaria italica)、龙爪稷(Eleusinecoracana))、向日葵 (Helianthus annuus)、红花(Carthamus tinctorius)、小麦(参见下文了解物 种)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanumtuberosum)、花生(Arachis hypogaea)、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoea batatus)、木薯 (Manihot esculenta)、咖啡(Coffea spp.)、椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘(Citrus spp.)、可可(Theobroma cacao)、茶(Camellia sinensis)、香蕉(Musa spp.)、鳄梨(Perseaamericana)、无花果(Ficus caslca)、番石榴(Psidium guajava)、芒果(Mangiferaindica)、橄榄(Olea europaea)、木瓜(Carica papaya)、腰果(Anacardium occidentale)、澳洲坚果 (Macadamia integrifolia)、杏仁(Prunus amygdalus)、糖用甜菜(Betavulgaris)、甘蔗(Saccharum spp.)、燕麦(Avena sativa)、大麦(Hordeum vulgare)、蔬菜类、观赏植物类、草类和针叶树类。
在特定实施方案中,将小麦植物用于本文所公开的方法和组合物中。 如本文所用,术语“小麦”是指小麦属(Triticum)的任何物种,包括其亲代 以及通过与其它物种进行杂交而得到的其子代。小麦包括“六倍体小麦” 和“四倍体小麦”,前者具有AABBDD的基因组结构、由42条染色体构 成,后者具有AABB的基因组结构、由28条染色体构成。六倍体小麦包括 普通小麦(T.aestivum)、斯佩耳特小麦(T.spelta)、摩卡小麦(T.mocha)、密穗 小麦(T.compactum)、印度圆粒小麦(T.sphaerococcum)、瓦维洛夫小麦(T. vavilovii),以及它们的种间杂交品种。四倍体小麦包括硬粒小麦(T.durum) (也称为硬质小麦或Triticumturgidum ssp.durum)、野生二粒小麦(T. dicoccoides)、栽培二粒小麦(T.dicoccum)、波兰小麦(T.polonicum),以及它 们的种间杂交品种。此外,术语“小麦”包括六倍体或四倍体小麦属物种 的可能亲代,诸如提供A基因组的乌拉尔图小麦(T.uartu)、栽培一粒小麦(T.monococcum)或野生一粒小麦(T.boeoticum),提供B基因组的拟斯卑尔 托山羊草(Aegilops speltoides),以及提供D基因组的粗山羊草(T.tauschii) (也称为节节麦(Aegilops squarrosa)或Aegilops tauschii)。用于本公开中的 小麦栽培种可属于但不限于上文列出物种中的任一种。还涵盖了通过常规 技术使用小麦属物种作为亲本与非小麦属物种进行有性杂交产生的植物, 所述非小麦属物种诸如裸麦(Secale cereale),包括但不限于黑小麦。在一些 实施方案中,小麦植物适用于具有本领域技术人员已知的合适农学特性的 谷物(诸如六倍体小麦或硬质小麦的商业品种)的商业生产。
蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如Lactuca sativa)、青豆(Phaseolus vulgaris)、利马豆(Phaseolus limensis)、豌豆(香 豌豆属物种(Lathyrusspp.))和黄瓜属(Cucumis)的成员诸如黄瓜(C. sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括杜鹃(杜鹃 花属物种(Rhododendron spp.))、八仙花(Macrophylla hydrangea)、木槿 (Hibiscus rosasanensis)、玫瑰(蔷薇属物种(Rosaspp.))、郁金香(郁金香 属物种(Tulipa spp.))、水仙(水仙属物种(Narcissus spp.))、矮牵牛 (Petunia hybrida)、尿乃馨(Dianthus caryophyllus)、一品红(Euphorbiapulcherrima)和菊花。
可用于实践本发明的方法和组合物的针叶树包括例如松树诸如火炬松 (Pinustaeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、美国黑松 (Pinuscontorta)和辐射松(Pinus radiata);花旗松(Pseudotsuga menziesii);异 叶铁杉(Tsuga canadensis);北美云杉(Picea glauca);红杉(Sequoia sempervirens);冷杉,诸如银枞(Abies amabilis)和胶枞(Abies balsamea);以 及雪松,诸如西岸红雪松(Thujaplicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。在特定实施方案中,本文所公开的植物是作物植物(例如玉 米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高粱、小麦、 粟、烟草等等)。其它目的植物包括提供目的种子的谷物植物、油料种子 植物和豆科植物。目的种子包括谷物种子,诸如玉米、小麦、大麦、稻、 高粱、裸麦等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属、 玉米、苜蓿、棕榈、椰子等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔 豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、兵豆、 鹰嘴豆等。
通常,中间宿主细胞将被用于实施本文所公开的方法和组合物,以增 加克隆载体的拷贝数。随着拷贝数增加,可分离极大数量的含有目的核酸 的载体以引入所需的植物细胞中。在一个实施方案中,采用不会引起所述 多肽在细菌中表达的植物启动子。
原核生物最常用各种大肠杆菌菌株代表;然而,也可使用其它微生物 菌株。在本文中定义为包括用于转录起始的启动子(任选地具有操纵子) 以及核糖体结合序列的常用原核控制序列,包括诸如β-内酰胺酶(青霉素 酶)启动子系统和乳糖(lac)启动子系统(Chang et al.(1977)Nature 198:1056 (Chang等人,1977年,《自然》,198卷,第1056页))、色氨酸(trp) 启动子系统(Goeddel et al.(1980)Nucleic Acids Res.8:4057(Goeddel等人,1980年,《核酸研究》,第8卷,第4057页))和λ衍生PL启动子 之类的常用启动子,以及N-基因核糖体结合位点(Shimatake et al.(1981) Nature 292:128(Shimatake等人,1981年,《自然》,第292卷,第128 页))。在转染进大肠杆菌中的DNA载体中包含选择标记也是有用的。这 种标记的示例包括特异于对氨苄青霉素、四环素或氯霉素的抗性的基因。
选择载体以使得能引入适当的宿主细胞中。细菌载体通常是质粒或噬 菌体起源的。将适当的细菌细胞用噬菌体载体颗粒感染或用裸噬菌体载体 DNA转染。如果使用质粒载体,则将细菌细胞用质粒载体DNA转染。使 用芽孢杆菌属(Bacillus sp.)和沙门氏菌属(Salmonella)来表达本文所公开的蛋 白质的表达系统(Palva et al.(1983)Gene 22:229-235(Palva等人,1983 年,《基因》,第22卷,第229-235页);Mosbach et al.(1983)Nature 302:543-545(Mosbach等人,1983年,《自然》,第302卷,第543-545 页))。
在一些实施方案中,本文所公开的表达盒或雄性能育性多核苷酸在植 物中维持半合子状态。半合子状态为当仅存在基因(或基因组)的一个拷 贝,而没有对应等位基因时存在的遗传状态。在某些实施方案中,本文所 公开的表达盒包含可操作地连接至雄性能育性多核苷酸的第一启动子,该 雄性能育性多核苷酸与可操作地连接至雄性组织优选启动子的雄性配子破 坏性多核苷酸堆叠,并且将此类表达盒引入处于半合子状态的雄性不育植 物中。当雄性能育性多核苷酸表达时,由于雄性能育性多核苷酸使该植物 恢复到能育状态,故该植物能够成功地产生成熟的花粉粒。鉴于表达盒处 于半合子状态,故在花粉粒形成过程中,只有某些子细胞将遗传该表达 盒。由于堆叠的被编码的雄性配子破坏性基因产物的雄性组织优选的表 达,遗传了包含雄性能育性多核苷酸的表达盒的子细胞将不会发育为成熟 的花粉粒。未遗传该表达盒的那些花粉粒将继续发育为成熟的花粉粒并具 有功能性,但它们将不包含该表达盒的雄性能育性多核苷酸,因此将不会 通过花粉将雄性能育性多核苷酸传递到子代。
V.调节雄性能育性多肽的浓度和/或活性
提供了用于调节植物中的本文所公开的雄性能育性多肽的浓度和/或活 性的方法。本文针对雄性能育性多肽的浓度和/或活性所用的术语“影响” 或“调节”,是指当与适当的对照比较时,雄性能育性多肽的浓度和/或活 性的任何增大或减小。一般来讲,本文所公开的雄性能育性多肽的浓度和/ 或活性相对于对照植物、植物部分或细胞增大或减小至少1%、5%、10%、 20%、30%、40%、50%、60%、70%、80%或90%。本文所公开的调节可在植物生长至具体的发育阶段之前、过程中和/或之后进行。在特定实施方 案中,在单子叶植物(特别是小麦)中对本文所公开的雄性能育性多肽进 行调节。
可采用多种方法来测定雄性能育性多肽的浓度和/或活性受到的调节。 例如,雄性能育性多肽的表达水平可例如通过测定植物中雄性能育性多肽 或RNA的水平来直接测量(即,蛋白质印迹法或RNA印迹法),或者例 如通过测定植物中雄性能育性多肽的雄性能育性活性来间接测量。用于测 量雄性能育性活性的方法在本文别处描述或是本领域已知的。在特定实施 方案中,对雄性能育性多肽浓度和/或活性的调节包括对植物中的雄性能育 性多肽的水平的调节(即,增大或减小)。测量雄性能育性多肽的水平和/ 或活性的方法在本领域中是已知的并且在本文别处进行讨论。在其它实施 方案中,对营养组织中、繁殖组织中、或营养组织和繁殖组织两者中的雄 性能育性多肽的水平和/或活性进行调节。
在一个实施方案中,通过将多肽或相应的雄性能育性多核苷酸引入植 物中来增大雄性能育性多肽的活性和/或浓度。随后,使用本领域技术人员 已知的方法选择具有引入的雄性能育性序列的植物,所述方法诸如但不限 于Southern印迹分析、DNA测序、PCR分析或表型分析。在某些实施方案 中,将标记多核苷酸与雄性能育性多核苷酸一起引入,以便帮助选择具有 或缺乏本文所公开的雄性能育性多核苷酸的植物。将经前述实施方案改变 或修饰的植物或植物部分在形成植物的条件下培育足以调节雄性能育性多 肽在该植物中的浓度和/或活性的时间。形成植物的条件在本领域中是熟知 的。
如本文别处所讨论,许多用来将多肽提供给植物的方法是本领域已知 的,包括但不限于将多肽直接引入植物中,或者将编码雄性能育性多肽的 多核苷酸构建体引入植物中(瞬时引入或稳定引入)。还应认识到,本文 所公开的方法可采用不能够在转化的植物中指导蛋白质或RNA的表达的多 核苷酸。雄性能育性多肽的水平和/或活性可例如通过改变编码雄性能育性 多肽的基因或其启动子来增大。参见例如,Kmiec的美国专利5,565,350;Zarling等人,PCT/US93/03868。因此提供了在雄性能育性基因中携带突变 的经诱变处理的植物,其中所述突变调节雄性能育性基因的表达或调节被 编码的雄性能育性多肽的活性。
在某些实施方案中,通过向植物引入如本文别处所公开的包含雄性能 育性多核苷酸(例如,SEQ ID NO:1、2、4、7、42、43、44或45,或者其 活性片段或变体)的表达盒来增大雄性能育性多肽的浓度和/或活性。雄性 能育性多核苷酸可操作地连接至对于植物是异源的或者对于植物是天然的 启动子。通过增大植物中的雄性能育性多肽的浓度和/或活性,植物的雄性 能育性也增大。因此,可通过增大雄性能育性多肽的浓度和/或活性来增大 植物的雄性能育性。例如,通过增大雄性能育性多肽的浓度和/或活性,可 使雄性不育植物恢复雄性能育性。
还应认识到,可通过采用不能够在转化的植物中指导蛋白质或RNA的 表达的多核苷酸,来调节该多肽的水平和/或活性。例如,本文所公开的多 核苷酸可用来设计可在用于改变或诱变生物体中的基因组核苷酸序列的方 法中采用的多核苷酸构建体。此类多核苷酸构建体包括但不限于: RNA:DNA载体、RNA:DNA突变载体、RNA:DNA修复载体、混合双链体寡核苷酸、自身互补RNA:DNA寡核苷酸和引起重组的寡核苷酸。此类核 苷酸构建体和使用方法是本领域已知的。参见美国专利5,565,350、 5,731,181、5,756,325、5,760,012、5,795,972、和5,871,984,以上所有专利 以引用方式并入本文。还可参见WO 98/49350、WO99/07865、WO 99/25821和Beetham et al.(1999)Proc.Natl.Acad.Sci.USA 96:8774-8778(Beetham等人,1999年,《美国国家科学院院刊》,第96卷,第8774- 8778页),以上文献以引用方式并入本文。在一些实施方案中,可采用病 毒诱导的基因沉默;参见例如,Ratcliffet al.(2001)Plant J.25:237-245 (Ratcliff等人,2001年,《植物杂志》,第25卷,第237-245页); Dinesh-Kumar et al.(2003)Methods Mol.Biol.236:287-294(Dinesh-Kumar等人,2003年,《分子生物学方法》,第236卷,第287-294页);Lu et al. (2003)Methods 30:296-303(Lu等人,2003年,《方法》,第30卷,第 296-303页);Burch-Smith et al.(2006)Plant Physiol.142:21-27(Burch- Smith等人,2006年,《植物生理学》,第142卷,第21-27页))。因此 应认识到,本文所公开的方法并不依赖于将完整多核苷酸掺入基因组中, 只要将该多核苷酸引入细胞中而使植物或其细胞被改变即可。
在其它实施方案中,通过不需要将多核苷酸引入植物中的方法(诸 如,通过将dsRNA外源应用于植物表面)来调节多肽的水平和/或活性;参 见例如WO2013/025670。
在一个实施方案中,基因组可在将该多核苷酸引入细胞中之后被改 变。例如,可将多核苷酸或其任何部分掺入植物的基因组中。本文所公开 的基因组的改变包括但不限于基因组中核苷酸的添加、缺失和置换。虽然 本文所公开的方法并不依赖于任何具体数目的核苷酸的添加、缺失和置 换,但应认识到此类添加、缺失或置换包含至少一个核苷酸。
VI.定义
术语“等位基因”指在特定基因座处出现的两个或更多个不同核苷酸 序列中的一个。
在核酸扩增的情况下术语“扩增”是其中产生附加拷贝的所选核酸 (或其转录形式)的任何过程。典型的扩增方法包括基于多种聚合酶的复 制方法,包括聚合酶链反应(PCR)、连接酶介导的方法诸如连接酶链反应 (LCR)以及基于RNA聚合酶的扩增(例如通过转录)方法。
“BAC”或细菌人工染色体是源自大肠杆菌天然存在的F因子的克隆 载体,其本身是可作为环状质粒存在或可整合到细菌染色体中的DNA元 件。BAC可接受较大的DNA序列插入。
厘摩(“cM”)是重组频率的量度单位。1cM等于由于在一个世代中的 杂交导致的在一个基因座处的标记将与在第二基因座处的标记分离的概率 为1%。
“染色体”是包含许多基因的一段盘绕DNA,这些基因在细胞分裂过 程中作为一个单元起作用和移动并因此可被称为是连接的。“染色体”也 可被称为“连锁群”。
“基因图谱”是对给定物种中一个或多个染色体(或连锁群)上的基 因座间的基因连锁关系的描述,一般以图表或表格形式描述。对于各个基 因图谱,基因座之间的距离通过在种群中它们的等位基因在一起出现的频 繁程度(即,它们的重组频率)而测量。利用DNA或蛋白质标记或可观察 的表型,能够检测等位基因。基因图谱是作图的种群、使用的标记的类型 以及不同种群间各个标记的多态性潜力的产物。一个基因图谱与另一个基 因图谱在基因座之间的遗传距离可以不同。然而,使用共同标记能够将一 个图谱与另一个图谱的信息关联。本领域的普通技术人员能够使用共同的 标记位置来鉴定每个单独基因图谱上的目的标记和其它基因座的位置。基 因座的顺序在图谱之间应当是不变的,然而由于例如标记在不同的群体中 检测替代性的重复基因座、用于对标记排序的统计学方法的差异、新的突 变或实验误差,经常存在标记顺序的小的变化。
“基因图谱位置”是在相同连锁群上,相对于围绕的遗传标记在基因 图谱上的位置,其中能够在给定物种中发现指定标记。
“基因作图”是限定基因座的连锁关系的方法,该方法通过使用遗传 标记、标记的种群分离以及重组频率的标准遗传原则进行。
“遗传标记”是种群中的多态核酸,并且其中可通过一种或多种分析 方法检测并区分出它们的等位基因,例如RFLP、AFLP、同功酶、SNP、 SSR、HRM等。该术语也指与基因组序列互补的核酸序列,诸如用作探针 的核酸。对应于种群成员之间的遗传多态性的标记能够通过本领域已建立 的方法进行检测。这些方法包括例如基于PCR的序列特异性扩增方法、限 制性片段长度多态性检测(RFLP)、同功酶标记检测、通过等位基因特异性 杂交(ASH)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、 自主序列复制检测、简单重复序列检测(SSR)、单核苷酸多态性检测(SNP) 或扩增片段长度多态性检测(AFLP)。已经建立的方法也已知用于检测表达 序列标签(EST)和来源于EST序列的SSR标记以及随机扩增的多态性DNA (RAPD)。
“基因组”指染色体或染色体组携带的总DNA或整组基因。
术语“基因型”是个体(或个体组)的基因组成,其由个体从其亲本 遗传的一个或多个已知基因座的等位基因限定。更一般地说,术语“基因 型”可用于指个体在其基因组中的所有基因的基因构成。
“基因座”是染色体上的位置,例如核苷酸、基因、序列或标记所位 于的地方。
“标记”是发现基因或物理图谱上的位置或发现标记与性状基因座 (影响性状的基因座)之间的连锁的手段。标记所检测的位置可通过检测 多态性等位基因及其基因作图而获知,或通过对已经进行物理标测的序列 进行杂交、序列匹配或扩增而获知。标记可以是DNA标记(检测DNA多 态性)、蛋白质(检测所编码多肽的变异)或简单遗传表型(诸如“蜡质”表型)。可通过基因组核苷酸序列或表达的核苷酸序列(例如,通过 剪接的RNA或cDNA)开发DNA标记。根据DNA标记技术,所述标记将 由侧接所述基因座的互补引物或与该基因座处的多态性等位基因杂交的互 补探针组成。DNA标记,或遗传标记,还能够被用于描述其自身染色体上 的基因、DNA序列或核苷酸(而不是用于检测基因或DNA序列的组 分),并且当该DNA标记与人类遗传学中的特定性状相关联时经常被使用 (例如,针对乳腺癌的标记)。术语标记基因座是指该标记所检测的基因 座(基因、序列或核苷酸)。
检测种群成员之间的遗传多态性的标记在本领域中是已建立的。标记 可由其所检测的多态性的类型以及用于检测所述多态性的标记技术所限 定。标记类型包括但不限于,例如,限制性片段长度多态性检测(RFLP)、 同功酶标记检测、随机扩增的多态性DNA(RAPD)、扩增片段长度多态性 检测(AFLP)、简单重复序列检测(SSR)、植物基因组的扩增可变序列检测、 自主序列复制检测或单核苷酸多态性检测(SNP)。SNP可通过以下方法检 测:例如DNA测序、基于PCR的序列特异性扩增方法、通过等位基因特 异性杂交(ASH)对多核苷酸多态性的检测、动态等位基因特异性杂交 (DASH)、竞争性等位基因特异性聚合酶链反应(KASPar)、分子信标、微阵 列杂交、寡核苷酸连接酶测定、Flap内切核酸酶、5’内切核酸酶、引物延 伸、单链构象多态性(SSCP)或温度梯度凝胶电泳(TGGE)。DNA测序(诸如 焦磷酸测序技术)具有能够检测组成单倍型的一系列连接的SNP等位基因 的优点。单倍型倾向于比SNP更具信息性(检测更高水平的多态性)。
“标记等位基因”或者“由标记检测的等位基因”或“在标记基因座 处的等位基因”可指在群体中的标记基因座处发现的一个或多个多态性核 苷酸序列。
“标记基因座”是由特定标记检测的物种的基因组中的特定染色体位 置。标记基因座可用于追踪第二连接基因座的存在情况,例如影响表型性 状表达的基因座。例如,标记基因座可用于监控在遗传上或物理上连接的 基因座处的等位基因的分离,诸如QTL。
“标记探针”是可用于通过核酸杂交鉴定标记基因座处的等位基因的 存在与否的核酸序列或分子,例如与标记基因座序列互补的核酸探针。包 含标记基因座的30个或更多个连续核苷酸(“所有或部分”的标记基因座 序列)的标记探针可用于核酸杂交。或者,在某些方面,标记探针指能够 区别(即基因分型)存在于标记基因座处的特定等位基因的任何类型的探 针。当核酸在溶液中特异性杂交或配对时,例如根据Watson-Crick碱基配 对原则杂交或配对,核酸是“互补的”。
如上所述,当鉴定连接基因座时,术语“分子标记”可用于指如上所 定义的遗传标记,或其用作参照点的编码产物(例如,蛋白质)。标记能 够来源于基因组核苷酸序列或来源于表达的核苷酸序列(例如来源于剪接 的RNA、cDNA等),或来源于编码的多肽。该术语也指与标记序列互补 或侧接标记序列的核酸序列,诸如用作探针或能够扩增标记序列的引物对 的核酸。“分子标记探针”是能够被用于鉴定标记基因座的存在的核酸序 列或分子,例如与标记基因座序列互补的核酸探针。或者,在某些方面, 分子探针指能够区别(即基因分型)存在于标记基因座处的特定等位基因 的任何类型的探针。当核酸在溶液中特异性杂交时,例如根据Watson- Crick碱基配对原则杂交,核酸是“互补的”。当本文所述的一些标记位于 插入缺失区域时,这些标记也被称为杂交标记。这是因为,根据定义,插 入区域是关于无插入的植物的多态性。因此,标记仅需要指明插入缺失区 域是否存在。任何合适的标记检测技术都可用于鉴定此类杂交标记,例如 SNP技术被用于本文提供的示例。
基因组的“物理图谱”是显示染色体DNA上可鉴定的界标(包括基 因、标记等)的线性顺序的图谱。然而与基因图谱相比,界标间的距离是 绝对的(例如以碱基对测量的或分离的和重叠的邻接基因片段)并且不基 于基因重组(所述基因重组可在不同的种群中有所变化)。
“植物”可为整个植物、其任何部分,或者来源于植物的细胞或组织 培养物。因此,术语“植物”可指如下中的任何一种:整个植物、植物组 分或器官(例如叶、茎、根等)、植物组织、种子、植物细胞和/或它们的 子代。植物细胞是从植物中获得的植物细胞或来源于从植物中所获得的细 胞的培养物。
“多态性”是群体内的两个或更多个个体之间DNA的变化。多态性在 种群中优选地具有至少1%的频率。可用的多态性可包括单核苷酸多态性 (SNP)、简单重复序列(SSR)、或插入/缺失多态性,本文也称为“插入缺 失”。
“参考序列”或“共有序列”是用作序列比对基准的定义序列。
表1.SEQ ID NO汇总
Figure BDA0001253786840000491
Figure BDA0001253786840000501
本文所用的冠词“一个”和“一种”指一个(种)或多于一个(种) (即,指至少一个(种))所述冠词的语法对象。举例而言,“一个要 素”意指一个或多个要素。
在本说明书中提及的所有出版物和专利申请指示本公开所属领域的技 术人员的水平,并且所有此类出版物和专利申请以引用方式并入本文,如 同每个单独的出版物或专利申请被具体地和单独地指出以引用方式并入。
虽然为了理解清晰目的已经通过举例说明和实施例方式较详细地描述 了本发明,但显然可以在所附权利要求书范围内实施一些改变和修改。
实施例
提供以下实施例来进行说明,但不限制所附权利要求。应当理解,本 文所述的实施例和实施方案仅出于举例说明的目的,本领域技术人员将认 识到在不脱离本发明的实质或所附权利要求书的范围的情况下可改变多种 试剂或参数。
实施例1:Ms1的基因作图
本实施例证明通过使用野生型和雄性不育小麦的重组作图群体,小麦 ms1的雄性不育表型的致病基因座可映射到B基因组的染色体4的短臂上 的1cM区域。
将携带FS2突变基因(也称为msld)的雄性不育(msms)异质小麦(品 种Chris)与品种Gladius的植物杂交,以产生F2作图群体。根据与小麦染 色体4AL(Hernandez etal.2011.Plant Journal 69(3):377-386(Hernandez等 人,2011年,《植物杂志》,第69卷,第3期,第377-386页))、大麦 染色体4HS(Mayer et al.2011.Plant Cell 23(4):1249-1263(Mayer等人, 2011年,《植物细胞》,第23卷,第4期,第1249-1263页))、短柄草 染色体1和水稻染色体3或bin映射小麦EST(Sorrells et al.,2003 Genome Research 13:1818-1827(Sorrells等人,2003年,《基因组研究》,第13 卷,第1818-1827页);La Rota&Sorrells,2004Funct Integr Genomics 4:34- 46)(La Rota和Sorrells,2004年,《功能基因组学和整合基因组学》,第 4卷,第34-46页))的同线性,来鉴定染色体4BS上的Ms1区域中的序 列。通过BLAST将来自参考合成序列(例如,大麦SNP标记11_21056, SEQ ID NO:10代表其参考序列)或bin映射EST(例如,BF292015,SEQ ID NO:14代表其参考序列)的对应小麦序列重叠群鉴定为染色体4BS衍生 的IWGSC(国际小麦基因组测序协会)研究组装序列(Mayer,2014 Science 345(6194):1251788(Mayer,2014年,《科学》,第345卷,第 6194期,第1251788页))。IWGSC重叠群是针对高分辨率熔解(HRM)标 记发展或基于插入位点的多态性(ISBP-HRM)标记发展的。使用ISBP Finder 工具(Paux et al.,2010 PlantBiotechnology Journal 8:196-210(Paux等人, 2010年,《植物生物技术杂志》,第8卷,第196-210页))设计ISBP- HRM引物。
使用来自以下各项的DNA进行聚合酶链反应(PCR)扩增:作图群体的 亲本、4B缺对染色体品系以及辐射诱导的缺失Probus和Cornerstone。因为 遗传和物理作图研究表明Cornerstone和Probus在末端缺失大小和端粒修复 程度方面可能不同,所以对其进行比较分析来鉴定Ms1侧翼标记(Barlow &Driscoll(1981)Genetics.98(4):791-799(Barlow和Driscoll,1981年, 《遗传学》,第98卷,第4期,第791-799页);Zhong-an&Darvey (1999)Acta Agriculturae Boreali-Occidentalis Sinica.cnki:ISSN:1004- 1389.0.1999-04-006(Zhong-an和Darvey,1999年,《西北农业学报》, cnki:ISSN:1004-1389.0.1999-04-006))。侧接Ms1的引物通过缺乏具有以 下特征的PCR产物以实验方式确定:该PCR产物来自染色体4B的DNA 缺对染色体,并且对于辐射诱导的缺失突变体Cornerstone是纯合的,但呈现为纯合辐射诱导的缺失突变体Probus。将符合上述标准的HRM标记用于 作图。
通过在开花前用密封的白色纸袋牢固地覆盖每株植物的至少三个穗来 进行遗传性雄性不育的表型分析,然后通过对每个穗的小花数量和每个穗 的种子数量计数并且将得分表示为每朵小花形成的种子数来确定定量能育 性得分。
首先用被鉴定为侧接染色体4BS上的Ms1区域且在Chris与Gladius之 间呈现多态性的标记来筛选509个F2个体。使用前述过程在表型方面对F2 个体进行遗传性雄性不育评估。鉴定了21个重组体,并且发现Ms1基因座 位于HRM标记21056(SEQ ID NO:11是参考序列)与BF292015(SEQ ID NO:15是参考序列)之间。将HRM标记21056和BF292015分别指定为4BS衍生的IWGSC序列重叠群lcl|4BS_4947956和lcl|4BS_4925422(Mayer, 2014 Science345(6194):1251788(Mayer,2014年,《科学》,第345 卷,第6194期,第1251788页))。确定该区域在90K的共有图谱上覆盖 14cM的遗传距离。
然后在标记21056和BF292015之间的区域中形成标记,并测试该标记 与遗传性雄性不育表型的关联。使用9K的共有小麦单核苷酸多态性(SNP) 图谱(Cavanagh et al.2013PNAS 110:8057-8062(Cavanagh等人,2013 年,《美国国家科学院院刊》,第110卷,第8057-8062页))来鉴定含有 SNP的序列以及在遗传上位于小麦中染色体4BS的短臂上的Ms1区域中的 相应IWGSC重叠群(Mayer 2014.Science 345(6194):1251788(Mayer, 2014年,《科学》,第345卷,第6194期,第1251788页))。含有SNP 的序列或染色体4BS衍生的IWGSC重叠群是针对HRM标记发展或基于插 入位点的多态性(ISBP-HRM)标记物发展的。总共筛选了3000个F2个体, 鉴定了54个重组体,同时将含有Ms1的区域缩窄到由标记 wsnp_Ex_c18318_27140346(SEQ ID NO:18是参考序列)和 wsnp_Ku_c7153_12360198(SEQ ID NO:21是参考序列)界定的区域。标记 wsnp_Ex_c18318_27140346和wsnp_Ku_c7153_12360198分别对应于4BS衍 生的IWGSC序列重叠群lcl|4BS_4920499和lcl|4BS_4954867(Mayer,2014Science 345(6194):1251788(Mayer,2014年,《科学》,第345卷,第 6194期,第1251788页))。根据9K的共有小麦SNP图谱,该区域跨越 0.5cM的遗传区间。
实施例2:鉴定用于Ms1测序的4BS BAC
使用与短柄草和水稻的同线性,在由标记 wsnp_Ex_c18318_27140346(SEQ IDNO:18)和 wsnp_Ku_c7153_12360198(SEQ ID NO:21)所界定的0.5cM区域内设计了18 个探针。根据靶序列的BLAST分析,将探针设计为非重复的。然后对探针 进行PCR扩增并通过琼脂糖凝胶电泳进行分离,使用Qiaquick Gel Extraction试剂盒(美国马里兰州德国镇的快而精公司(Qiagen,Germantown, Md.,USA))从凝胶中洗脱所需大小的片段。将PCR片段合并至等摩尔浓 度,然后使用制造商的方案,通过NEBlot试剂盒(新英格兰生物实验室 (NewEngland Biolabs))进行32P-dATP放射标记。将标记的探针在 Sephadex G50柱(通用电气医疗集团(GE Healthcare))中纯化,并在100℃ 下变性10分钟。将用于杂交到Hybond N+尼龙膜(美国新泽西州皮斯卡特 维的通用电气医疗集团(GE Healthcare))上的28个高密度BAC克隆菌落过 滤器用于杂交。这表示来自硬质小麦品种Langdon的5.1-基因组等同物的覆盖情况(Cenci et al.2003.Theor Appl Genet 107(5):931-9)(Cenci等人, 2003年,《理论与应用遗传学》,第107卷,第5期,第931-939 页))。就预杂交而言,在65℃下,在旋转的玻璃管中完成以下过程:将 菌落过滤器在杂交溶液(2×SSPE,0.5%SDS,5×Denhardt试剂(Sambrook &Russel(2001)Molecular Cloning:ALaboratory Manual,Cold SpringHarbor Laboratory Press,New York,NY,USA(Sambrook和Russel,2001年,《分 子克隆实验指南》,美国纽约的冷泉港实验室出版社))、40μg/ml鲑鱼精 子DNA)中过夜温育。将标记的探针与5ml杂交溶液混合,并将菌落过滤 器在65℃下过夜温育。为了除去未结合的探针,将过滤器在含有2×SSPE 和0.5%SDS的洗涤溶液中洗涤两次,并用1×SSC冲洗。根据信号强度将 洗涤后的过滤器暴露于X射线胶片一至三天,以鉴定阳性克隆。
Figure BDA0001253786840000541
(2011)Journal of Biomedicine and Biotechnology. http://dx.doi.org/10.1155/2011/302543(
Figure BDA0001253786840000542
2011年,《生物医学和生 物技术杂志》,http://dx.doi.org/10.1155/2011/302543)。这些探针鉴定了跨 越Ms1区域的公共BAC。
从板中分离出显示阳性信号的BAC。使用限制性作图、利用与上文所 用标记对应的引物进行的PCR实验以及从每个BAC的端部获得的序列, 来确定覆盖目的区域的BAC的顺序。从Langdon文库中选择跨越Ms1区域 的三个BAC(占251kB)用于测序。此外,对专有BAC进行测序,以覆盖 关键区域。使用标准鸟枪测序技术对这些BAC进行测序,并且使用 Phred/Phrap/Consed软件包(Ewing et al.(1998)Genome Research,8:175-185 (Ewing等人,1998年,《基因组研究》,第8卷,第175-185页))组装 序列。组装之后,根据作图数据,对被认为在区域中位于最接近基因座的 序列进行注释,意味着推断可能的基因编码区和表示重复元件的区域。使 用fGenesH软件包(美国纽约芒特基斯科的Softberry公司(Softberry,Mount Kisco,New York,USA))寻找编码(基因)区的基因。
实施例3:候选Ms1基因的鉴定
通过对来源于小麦根、叶和花粉囊组织的cDNA进行作图,在251kB 序列内检测到10个潜在编码区。表2提供了这10个可能的编码序列及其 推定肽功能的物理位置。
表2.
Figure BDA0001253786840000551
在这10个开放阅读框中,鉴定了与非特异转脂蛋白(nsLTP)(Edstam et al.,2014Physiologia Plantarum doi:10.1111/pp1.12156(Edstam等人,2014 年,《植物生理学》,doi:10.1111/ppl.12156))具有相似性的三个编码的 多肽。在检查来自雄性不育纯合msl Cornerstone植物的花粉囊转录物时, 未观察到对应于SEQ ID NO:4的cDNA。缺乏来自SEQ ID NO:4的转录物 表明ms1不育表型与该cDNA之间具有紧密的相关性。预测该特定序列编 码糖基磷脂酰肌醇(GPI)锚定的nsLTP(LTPG)多肽(SEQ ID NO:5是编码的 蛋白质的氨基酸序列),并且该特定序列已被命名为TaLTPG1,也被称为 Ms1。
Ms1多肽(SEQ ID NO:5)的分析结果表明信号肽位于位置1-23处;LTP 结构域位于位置24-108处;并且GPI锚定结构域位于位置195-220处。使 用初级多肽序列的结构模拟表明,通过二硫键(Cys-Cys)在LTP结构域内形 成的疏水口袋可能结合脂肪酸,而预测GPI锚定结构域会将TaLTPG1固定 到细胞表面。
在合适晶体结构模板的Protein Homology/analogY Recognition Engine V 2.0(Phyre2;Kelley et al.(2015)Nature Protocols 10:845-858(Kelley等 人,2015年,《自然研究步骤》,第10卷,第845-858页))搜索中,使 用C-末端通过穿过LTP结构域(即,位置24至位置120)的12个氨基酸 直接连接到信号肽的编码的初级多肽序列。该搜索鉴定了在96%置信度下 具有29%同一性的dir1蛋白(pdb:c2rknA)。对使用的Ms1多肽序列的48个残基部分进行建模,其中对模板c2rknA具有96.2%置信度。
通过fpocket2程序(Schmidtke et al.,(2011)Bioinformatics 27(23):3276-3285(Schmidtke等人,2011年,《生物信息学》,第27卷,第23期,第 3276-3285页))和3DLigandSite(3DLigandSite:使用类似的结构预测配 体结合位点(Wass et al.(2010)Nucleic Acids Res.38:W469-73(Wass等 人,2010年,《核酸研究》,第38卷,第W469-W473页)))的组合来 检测通过二硫键在LTP结构域内形成的疏水口袋。使用具有表面疏水性的标准pdb查看器使Ms1、mslf和mslh的结构模型可视化并对其进行注释, 并使用Colony方法进行计算。使用与测定疏水口袋相同的技术以及二硫键 在三级构象中的重要性的相关知识对msld、msle、mslf和mslh突变体的 LTP结构域的结构进行分析。(参见例如José-Estanyol et al.(2004)Plant Physiology and Biochemistry 42:355-365(José-Estanyol等人,2004年,《植 物生理学和生物化学》,第42卷,第355-365页))。
根据BIG-PI植物预测器推断GPI锚定结构域和细胞表面聚集的预测。(Eisenhaber et al.(2003)Plant Physiology 133(4):1691-701(Eisenhaber等 人,2003年,《植物生理学》,第133卷,第4期,第1691-1701页))
实施例4:小麦突变体ms1等位基因的分离和序列
使用来自从雄性不育纯合的甲磺酸乙酯(EMS)诱导的突变体msld、 msle和mslf分离的基因组DNA的高保真校对酶(Klindworth et al.2002. Crop Sci.42:1447-1450(Klindworth等人,2002年,《作物科学》,第42 卷,第1447-1450页))以及野生型(Ms1)雄性能育基因型(栽培品种 Chris),对来自染色体4BS的TaLTPG1的全长编码序列进行PCR扩增。使用用于富含GC的产物的标准Sanger测序技术对两条PCR扩增子的链进 行测序。对获得的ms1与Ms1 Sanger测序色谱图进行比较,结果表明每个 ms1突变体等位基因(包括来源于TILLING的mslh)和野生型序列之间存 在SNP(图2、图3)。序列分析预测,每个这些突变体的蛋白质功能受到 破坏。
当与野生型Ms1基因组DNA序列(SEQ ID NO:7)比较时,msld在位置 1856(G1856A)处表现SNP。预测该SNP会消除第一外显子/内含子剪接连 接,从而导致第一内含子内的提前终止密码子的通读,因此会消除所编码 的多肽内的保守C末端GPI锚定结构域。
当与野生型Ms1基因组DNA序列(SEQ ID NO:7)比较时,msle在位置 2962处表现SNP并且在位置2963处表现1bp缺失(G2962A、 C2963del)。预测msle中的1bp缺失会引起所编码的多肽内的移码以及保 守C末端GPI锚定结构域的消除。
当与野生型Ms1基因组DNA序列(SEQ ID NO:7)比较时,mslf在位置 1682(G1682A)处表现SNP。预测该SNP会在所编码的野生型Ms1多肽 (SEQ ID NO:5)内将保守的半胱氨酸转变为酪氨酸(C52Y)。预测该氨基酸变 化会破坏由二硫键介导的成熟蛋白的三级构象。
当与野生型Ms1基因组DNA序列(SEQ ID NO:7)比较时,mslh在位置 1705(G1705A)处表现SNP。预测该SNP会在所编码的野生型Ms1多肽 (SEQ ID NO:5)内将天冬氨酸转变为天冬酰胺。预测该氨基酸变化会破坏所 编码的Ms1多肽的功能或活性。
实施例5:Ms1和ms1花粉的细胞学和代谢物分析
对ms1花粉囊的细胞学检查显示出破碎的绒毡层细胞表面局部球状体 和具有缺陷外壁结构和纹饰的塌缩花粉。能育与不育花粉囊的代谢分析显 示出C16-C22脂肪酸的累积,与Ms1在孢粉素生物合成和/或向发育中小孢 子的运输中的作用一致。
细胞学检查
对于透射电子显微镜(TEM)或扫描电子显微镜(SEM),将来自减数分裂 后期的不育(msld)和能育(Ms1)成熟花粉囊固定于二胞花粉。将TEM样品用 3%戊二醛在pH 7.4的磷酸盐缓冲盐水(PBS)中的溶液在4℃下渗透16小 时,而SEM样品则用4%多聚甲醛、1.25%戊二醛和4%蔗糖在pH 7.4的磷 酸盐缓冲盐水(PBS)中的溶液在4℃下渗透16小时。将TEM样品用LR White Resin缓慢渗透并包埋在明胶胶囊中。用PBS pH 7.4冲洗SEM样品 两次,每次5分钟,然后使用一系列分级乙醇溶液(30%、50%、70%、 85%、90%和95%)分别脱水60分钟。然后将SEM样品在100%乙醇中渗 透3次,每次60分钟。在超薄切片机(EM UC6,德国徕卡公司(Leica, Germany))上制备70nm的超薄切片,将其安放在铜网格上,并且根据Bozzola和Russell 1999用4%乙酸双氧铀水溶液染色,再用柠檬酸铅染色 (Specimenstaining and contrast methods for transmission electron microscopy. Electronmicroscopy:Principles and techniques for biologists.The Jones and BartlettSeries in Biology,pp.120-147.Jones and Bartlett Publishers,Boston, MA(用于透射电子显微镜法的样本染色和造影方法。电子显微镜:适用于 生物学的原理和技术。Jonesand Bartlett生物学系列,第120-147页。Jones and Bartlett出版公司,美国马萨诸塞州波士顿))。观察超薄切片,并在 80kV的加速电压下用TEM(Philips CM100,阿德莱德大学显微镜研究中 心(The University of Adelaide microscopy))采集图像。切割SEM样品,然后进行临界点干燥并用铂溅射涂布(BalTec CPD030临界点干燥仪(BalTec CPD030Critical Point Dryer))。在10kV的加速电压(Philips XL20SEM, EDAX EDS,阿德莱德大学显微镜研究中心(The University of Adelaide microscopy))下进行SEM观察和图像采集。
糖磷脂酰肌醇(GPI)锚定的脂质转移蛋白通常是角质层蜡累积或输出到 茎和长角果表面上所必需。(Borner et al.(2003)Plant Physiology 132:568- 577(Borner等人,2003年,《植物生理学》,第132卷第568-577页); Kim et al.(2012)Plant and CellPhysiology 53:1391-1403(Kim等人,2012 年,《植物与细胞生理学》,第53卷,第1391-1403页)外角质层蜡具有 与花粉外膜的主要成分孢粉素相同的脂质前体,花粉外壁在花粉囊的孢子 体组织中产生并在称为球状体的结构中运输至发育中的小孢子。通过TEM 和SEM分析不育msld花粉囊,与能育Ms1花粉囊相比,结果显示出破碎 的绒毡层细胞表面局部球状体和具有缺陷外壁结构和纹饰的塌缩花粉。
代谢物分析
在3个发育阶段(减数分裂早期至单核期后期)从2个不育 (msld/msld)和1个能育(Ms1/Ms1)植株中分离花粉囊,包括3个生物学重复 样,并在干冰上快速冷冻。使用气相色谱-质谱联用法(GC-MS),分析氯仿 可萃取蜡的组成和数量。(Jung et al.(2006)PlantCell 18:3015-3032(Jung 等人,2006年,《植物细胞》,第18卷,第3015-3032页)通过用酯交换 试剂Meth-Prep II进行提取物处理以衍生脂肪酸,并与样品加标脂肪酸标准 品进行比较。
在三个发育阶段分析不育msld花粉囊与能育Ms1花粉囊,结果表 明,棕榈酸(C16:0)、棕榈油酸(C16:1)、油酸(C18:1n9c)、反油酸 (C18:1n9t)、亚油酸(C18:2n6c)、γ-亚油酸(C18:3n6)、α-亚油酸(C18:3n6)、花 生酸(C20:0)、二十烯酸(C20:1)、二十碳二烯酸(C20:2)和二十二烷酸(C22:0) 增加超过2倍。突变花粉囊中的长链(C16-C22)脂肪酸的增加是孢粉素生物 合成中的破坏和/或其向发育中小孢子的运输的典型表现。
实施例6:Ms1区域的标记及其在鉴定和选择含有Ms1突变的小麦植株中的用途
据发现,Ms1基因紧密连接至位于Ms1区域中的标记ET0487、 ET0488、ET0489、ET0490、ET0491、ET0495、007-0033.1和007-0046.1。 参见SEQ ID NO:24-29、32和33。由于雄性不育性状由单个核隐性基因控 制,因此雄性不育突变体与野生型授粉媒介之间的所有杂交将导致100%雄 性能育F1子代(Ms1ms1),而F2和BC1子代将分离这种性状。希望确定子 代的基因型,这样可以评估植株本身是否存在突变,或者是否存在连接至 Ms1基因中的突变并与其相关联的一个或多个等位基因(即,与突变连锁 不平衡)。例如,可以检测在标记物ET0487、ET0488、ET0489、 ET0490、ET0491、ET0495、007-0033.1或007-0046.1处的一个或多个等位 基因以确定植株是否具有纯合或杂合状态的ms1突变。对于msld、msle或mslf,突变在Chris品种中出现;这样,位于Ms1基因附近的Chris等位基 因与因果突变处于连锁不平衡,因此可以评估存在情况以确定是否存在 msld、msle或mslf。通过标记辅助选择,植物育种人员将能够通过受控的 杂交跟进雄性不育性状的存在情况,以便在需要时获得含有纯合或杂合状 态的ms1突变的新植株,从而保持ms1突变。植物育种人员还可以利用Ms1区域中的标记来产生将用作雌性的突变雄性不育种子亲本,即需要花 粉供体植株授粉的植株,以产生具有商业利益的种子或产生含有杂合状态 的ms1突变的F1杂交体。
实施例7:小麦转化
本领域技术人员可获知小麦转化方案。参见例如He,et al.,(2010)J.Exp.Botany 61(6):1567-1581(He等人,2010年,《实验植物学杂志》,第 61卷,第6期,第1567-1581页);Wu,et al.,(2008)Transgenic Res. 17:425-436(Wu等人,2008年,《转基因研究》,第17卷,第425-436 页);Nehra,et al.,(1994)Plant J.5(2):285-297(Nehra等人,1994年, 《植物杂志》,第5卷,第2期,第285-297页);Rasco-Gaunt,et al., (2001)J.Exp.Botany 52(357):865-874(Rasco-Gaunt等人,2001年,《实验 植物学杂志》,第52卷,第357期,第865-874页);Razzaq,et al.,(2011) African J.Biotech.10(5):740-750(Razzaq等人,2011年,《非洲生物技术杂 志》,第10卷,第5期,第740-750页);Tamás-Nyitrai,et al.,(2012) Plant Cell Culture Protocols,Methods in MolecularBiology 877:357-384 (Tamás-Nyitrai等人,2012年,《植物细胞培养实验指南-分子生物学方 法》,第877卷,第357-384页);和美国专利公布2014/0173781。
实施例8:通过表达Ms1基因或直系同源物的转化拷贝为小麦ms1纯合隐性植株恢 复雄性能育性
在前一实施例中,在对应于来自msld、msle和mslf植株的Ms1候选 基因的DNA区域内检测到核苷酸序列差异。在本实施例中,描述了用于为 纯合隐性msld植株恢复雄性能育性的各种策略。当用包含Ms1基因的功能 性拷贝的DNA载体进行转化时,含有ms1突变的雄性不育小麦植株恢复为 雄性能育性。这表明候选Ms1基因在为导致雄性不育表型的ms1突变提供 补充方面是有效的。
虽然小麦是含有三个具有相似基因含量的相关基因组(ABD)的异源六 倍体,但它在减数分裂过程中表现为二倍体。通常相关的小麦基因组包含 具有相似基因结构和功能的同源基因,需要三重突变体才能得到功能丧失 表型。然而,在msld突变体中观察到的小麦雄性不育表型以3∶1的能育与 不育植株比率分离。这表明在该突变体中,在纯合条件下的单个隐性基因 座诱导雄性不育表型,并且该基因座根据孟德尔遗传定律分离。与Ms1的其它同源物缺乏功能冗余性,表明该基因的A和D基因组拷贝的功能已经 存在差异。
标记开发和评估显示,杂合的ms1基因座以1∶2∶1的纯合野生型与杂合 突变体与纯合突变体的比例分离。表型数据和基因型数据的相关性支持 ms1突变遵循孟德尔遗传定律。
ms1突变的孟德尔性质将促使雄性不育性状渗入不同的遗传背景中。
恢复ms1植株的雄性能育性的一种策略是表达可以克服由Ms1突变或 缺失导致的功能或活性丧失的一个或多个基因。来自小麦或来自具有与 Ms1相同或相似功能的另一植物物种的基因用于恢复转化的小麦植株中的 基因活性。例如,如图1所示,来自大麦的基因编码与小麦Ms1基因产物 具有高氨基酸序列相似性并具有约79%序列同一性的蛋白质。将存在于 SEQ ID NO:1中的大麦基因引入小麦ms1突变植物中以恢复雄性能育性。 该大麦基因可以使用其天然启动子(参见SEQ ID NO:1、核苷酸1-902、 SEQ ID NO:41)或非天然启动子(例如组织优选的启动子、组成型启动子 或条件启动子)来表达,以恢复雄性能育性。其它单子叶植物或双子叶植 物也可以作为补充基因和启动子的来源,为ms1突变雄性不育小麦植株恢 复雄性能育性。基因和启动子可以来自一种来源或来自多种源物种的组 合,例如来自小麦、大麦、水稻和短柄草中的一种或多种。
在另一策略中,野生型小麦Ms1基因或其变体(参见例如SEQ ID NO:1、2、4、7、9、42、43、44或45)用于恢复纯合隐性ms1植株的雄性 能育性。变体Ms1基因包含一个或多个DNA限制性位点的改变以允许与用 于植物转化的DNA载体相容。参见例如SEQ ID NO:9,其包含在第2、 3、1209和1301位处引入的核苷酸变化,以促进载体构建。通过已知的植 物转化方法将Ms1基因引入ms1植株中,产生含有稳定整合形式的Ms1基 因的植株以用于能育性补充。作为使用天然Ms1启动子(SEQ ID NO:6)的替 代,使用启动子变体(例如参见SEQ IDNO:8,其包含引入以促进载体构 建的核苷酸变化)或其它植物(例如SEQ ID NO:41)或非植物组成型启动 子、条件启动子或组织优选的启动子表达野生型或变体形式的Ms1基因或cDNA,以恢复纯合隐性ms1小麦植株的雄性能育性。基因和启动子可以来 自一种源物种或来自多种源物种的组合。在一些实施例中,启动子是来自 小麦、水稻、大麦或短柄草的Ms1启动子。翻译终止密码子3′的基因组 Ms1序列包含功能性终止子区域;参见SEQ ID NO:7第3384-4335位的 UTR(SEQ ID NO:46)。还参见SEQ ID NO:1第2838-3838位的UTR(SEQ IDNO:47)。
构建体和转化
为了恢复msld/msld纯合突变体的能育性,将在天然小麦Ms1启动子 和终止子控制下的小麦Ms1基因连接到在大麦LTP2启动子控制下并且还 携带PINII终止子序列(TaMs1-DsRED)的DsRed2基因(参见例如美国专利 5,525,716)。通过本文别处所引用的农杆菌介导的转化方法将该构建体直 接转化到从Ms1/msld杂合子植株收获的小麦胚中。获得了包含TaMs1- DsRED的若干独立的T-DNA插入事件,用于在msld植株中进行构建体评估。
T0植株生成和分析
鉴定含有单拷贝TaMs1-DsRED盒的T0小麦植株,并将其基因分型为 对于msld突变为纯合或杂合的。将来自这些单个植株的自交种子计数为雄 性能育性的定性量度。如表4所示,在缺乏TaMs1-DsRED盒的msld/msld 纯合植株中没有观察到结籽。相比之下,当msld/msld纯合植株含有 TaMs1-DsRED盒的转化拷贝时,观察到结籽。这些结果表明,TaMs1的转化拷贝是功能性的,能够恢复msld/msld纯合雄性不育植株的能育性。
表3:含有TaMs1互补T-DNA插入的T0小麦植株中的结籽
T-DNA插入事件 msld基因型 T-DNA拷贝数 雄性能育性表型
事件1 msld/msld 1 能育
事件2 msld/msld 1 能育
事件3 msld/msld 2 能育
事件4 msld/msld 2 能育
事件5 msld/msld 3 能育
事件6 msld/msld 4 能育
事件7 Ms1/msld 1 能育
事件8 Ms1/msld 1 能育
事件9 Ms1/msld 1 能育
事件10 Ms1/msld 1 能育
事件11 Ms1/msld 1 能育
无T-DNA msld/msld 0 不育
无T-DNA msld/msld 0 不育
T1植株分析;分子和表型
TaMs1 T-DNA插入的互补的遗传通过分析来自具有独立T-DNA插入(事件1和事件7)的两个单独T0植株的T1植物来证实。一组T1子代衍生自对于具有TaMs1-DsRED盒(事件1)的ms1d突变(ms1d/ms1d)为纯合的T0植株。第二组T1子代衍生自具有TaMs1-DsRED盒(事件7)的对ms1d突变(Ms1/ms1d)为杂合的T0植株。来自这两组的植株被基因分型用于ms1d和T-DNA插入。在两组T1子代中,具有基因型ms1d/ms1和T-DNA插入(事件1或事件7)的所有植株都是通过产生种子来确定能育的(表4)。具有基因型ms1d/ms1d而没有T-DNA插入的所有子代是雄性不育的并且不产生种子。这清楚地表明,TaMs1互补T-DNA插入能够恢复ms1d/ms1d突变植株的能育性,并且这种能力会传递给子代。
表4:具有或不具有TaMs1互补T-DNA插入的T1植株的能育性
T0事件 T1植株 msld基因型 T-DNA拷贝数 雄性能育性表型
事件1 植株1 纯合 1 能育
事件1 植株2 纯合 1 能育
事件1 植株3 纯合 1 能育
事件1 植株4 纯合 1 能育
事件1 植株5 纯合 2 能育
事件1 植株6 纯合 2 能育
事件1 植株7 纯合 2 能育
事件1 植株8 纯合 0 不育
事件1 植株9 纯合 0 不育
事件7 植株1 纯合 1 能育
事件7 植株2 纯合 1 能育
事件7 植株3 纯合 1 能育
事件7 植株4 纯合 2 能育
事件7 植株5 纯合 2 能育
事件7 植株6 纯合 2 能育
事件7 植株7 纯合 0 不育
事件7 植株8 纯合 0 不育
总之,用含有天然小麦MS1基因的T-DNA插入分析T0和T1植株显 示该基因能够恢复msld/msld纯合隐性突变的育性。该实施例进一步证明 了msld突变位于小麦Ms1基因中。
实施例9:使用半合保持系进行小麦ms1雄性不育植株的近交系保持和增加
该实施例证实,使用连接至种子标记基因和花粉抑制基因的Ms1的功 能性拷贝,可以将ms1的纯合隐性小麦植株保持为雄性不育植株。
产生雄性不育植株的纯系以便用不同的近交系小麦品种进行异花授粉 来产生杂种种子,这将是有利的。通常,整合隐性雄性不育的策略导致不 能自花授粉的植株。为了完成自花授粉和产生用于异花授粉的纯系雄性不 育植株,构建了表达盒(Ms1-AA-Red),其包含的Ms1功能性拷贝连接至表 达功能性α淀粉酶基因的玉米PG47启动子(参见例如SEQ IDNO:30), 并且进一步连接至在大麦LTP2启动子(参见例如美国专利5,525,716)的 控制下并且还携带PINII终止子序列的颜色标记基因(例如,编码红色荧光 蛋白)。使用生物弹道或农杆菌介导的转化,将该构建体直接转化到来自 自花授粉的Ms1/ms1小麦植株的胚中。将转化的胚再生成植株。可以使用 如上所述的ms1基因座侧翼的标记鉴定的含有单拷贝Ms1-AA-Red盒的小 麦植物(ms1/ms1)是雄性能育的并且允许自花授粉。由于PG47:AA抑制花粉 功能并因此阻止Ms1-AA-Red表达盒通过花粉传输的作用,来自这一代子 代的种子将以1∶1红色荧光和非荧光的频率分离。从红色荧光种子生长的子 代对于Ms1-AA-Red是半合子的,对于ms1是纯合的,并且是雄性能育 的;这些用于繁殖(即,“保持”)雄性不育近交系。非荧光种子的子代 不含有Ms1互补基因的转化拷贝,对于ms1是纯合的并且是雄性不育的。这些雄性不育近交系作为雌性近交系用于在与Ms1基因的野生型雄性近交 小麦植株相邻种植时用于产生杂种种子。
实施例10:基因的靶向调控或诱变
对于雄性能育性应用,突变内源性Ms1基因或改变其表达可能是有利 的,例如通过本实施例中所述的方法。
已经证明将RNA引入活细胞中抑制该细胞中靶基因的表达。(Bae et al.(2010)Plant Breeding 129(6):647-651(Bae等人,2010年,《植物育 种》,第129卷,第6期,第647-651页);Beetham et al.(1999) Proceedings of the National Academy of Sciences96(15):8774-8778, doi:10.1073/pnas.96.15.8774(Beetham等人,1999年,《美国国家科学院院 刊》,第96卷,第15期,第8774-8778页, doi:10.1073/pnas.96.15.8774);Cigan等人,2010年,美国专利7696405; Cigan et al.(2005)The Plant Journal 43(6):929-940(Cigan等人,2005年, 《植物杂志》,第43卷,第6期,第929-940页);Dalakouras et al.(2009) The Plant Journal 60(5):840-851,doi:10.1111/j.1365-313X.2009.04003.x(Dalakouras等人,2009年,《植物杂志》,第60卷,第5期,第840- 851页,doi:10.1111/j.1365-313X.2009.04003.x);Fire et al.(1998)Nature 391(6669):806-811(Fire等人,1998年,《自然》,第391卷,第6669 期,第806-811页);Fire等人,1999年,WO 1999032619A1;Mette et al. (2000)EMBO J 19(19):5194-5201(Mette等人,2000年,《欧洲分子生物学组织杂志》,第19卷,第19期,第5194-5201页);Okuzaki and Toriyama(2004)Plant CellReports 22(7):509-512.doi:10.1007/s00299-003- 0698-2(Okuzaki和Toriyama,2004年,《植物细胞报告》,第22卷,第 7期,第509-512页,doi:10.1007/s00299-003-0698-2);Tang,2013年, WO 2013025670 A1;Timmons and Fire(1998)Nature 395:854(Timmons和Fire,1998年,《自然》,第395卷,第854页);Yu et al.(2002)PNAS 99(9):6047-6052(Yu等人,2002年,《美国国家科学院院刊》,第99 卷,第9期,第6047-6052页)。技术人员应当理解,RNA可以在细胞内 表达或外源应用(Tang WO 2013025670A1)。
干扰RNA可以靶向转录、翻译或mRNA稳定性,从而改变靶基因的 表达。在该实施例中,Ms1基因的表达通过在植物中单独地或组合地表达 靶向启动子区域的RNA(如先前在包括小麦(美国专利申请14/203,698) 在内的单子叶植物中证实的那样(Cigan等人,2010年))或靶向所表达的 mRNA的RNA来减少或沉默。对于启动子反向重复方法,Ms1启动子区域的一部分可以在相反方向上串联复制、并置和定向,并且置于植物转化载 体中的组成型组织优选的启动子或条件启动子的控制下,以在植物细胞中 表达启动子反向重复RNA以使可操作地连接至靶启动子的基因沉默。
技术人员还将理解,可通过核酸序列的突变引入变化,从而导致编码 的mRNA的表达或编码的Ms1多肽的氨基酸序列发生变化,导致mRNA 和/或蛋白的生物活性的改变。参见例如在2014年8月20日提交的美国专 利申请14/463,687中描述的方法,该专利申请全文以引用方式并入本文。 因此,可以通过将一个或多个核苷酸的置换、添加和/或缺失引入本文公开 的相应核酸序列或周围序列中来产生变体核酸分子。此类变体核酸序列也 被本发明涵盖。
变体核酸序列可以通过沿着Ms1基因区域的全部或部分随机引入序列 改变来制备,包括但不限于化学或辐照诱变和寡核苷酸介导的诱变(OMM) (Beetham等人,1999年;Okuzaki和Toriyama,2004年)。另选地或作 为补充,可以使用双链断裂技术,例如但不限于ZNF、定制设计的归巢内 切核酸酶、TALEN、CRISPR/CAS(也称为向导RNA/Cas内切核酸酶系统 (2014年8月20日提交的美国专利申请14/463,687)),或其它基于蛋白 质、或多核苷酸、或偶联的多核苷酸-蛋白质的诱变技术,在具体选定位点 引入序列变化。可以筛选所得变体的改变后的Ms1活性。应当理解,这些 技术通常不是相互排它性的。实际上,各种方法可以单独或组合使用、并 行或串联使用,以产生或获得多样的序列变体。
实施例11:通过TaLTPG1的转录后基因沉默诱导雄性不育
多核苷酸片段(SEQ ID NO:38)从TaLTPGl的3′UTR中分离,并且在 RNAi盒(ZmUbi::TaLTPG1-IR:SbActin项)内亚克隆至组成型表达载体 PHP1中。
将用于转化供体材料的植株以每6L(8英寸直径)装有土壤混合物的 盆5-6株植株进行播种。土壤混合物由75%(v/v)椰子泥、25%(v/v)苗圃切 割砂(锋利)、750mg/LCaSO4.2H2O(石膏)、750mg/L Ca(H2PO4)2.H20 (过磷酸盐)、1.9g/L FeSO4、125mg/LFeEDTA、1.9g/L Ca(NO3)2、 750mg/L Scotts Micromax微量营养素和2.5g/L OsmocotePlus缓释肥料 (16∶3∶9)(Scotts Australia Pty.Ltd.)组成。使用2份农用石灰与1份熟石灰将 pH调节至6.0至6.5。盆栽植物在23℃(白天)和16℃(夜)的受控环境 生长室中生长,使用400W高压钠灯与金属卤化物灯组合延长的光周期在 冬季月份达12小时。
根据公布的方法进行具有组成型表达的hpt选择性标记基因序列的 RNAi盒的共轰击。Ismagul et al.in Crop Breeding Vol.1145 Methods in Molecular Biology(edsD.Fleury&R.Whitford)Ch 14,239-252(Springer, 2014)(Ismagul等人,《作物育种》,第1145卷,分子生物学方法,D. Fleury和R.Whitford编辑,第14章,第239-252页,施普林格出版社, 2014年)。通过在含有100mg/L潮霉素B的MS培养基上选择来回收T0 再生植株。
对从开裂前的各个植株的不同小穗收集的成熟花粉囊进行花粉粒活力 试验。将花粉囊放置在培养皿中的润湿滤纸上以运送到实验室,在那里将 它们在干净的载玻片上在一滴2%的碘化钾溶液中粉碎。通过用澄清的指甲 油包围盖玻片边缘来保护位于载玻片与盖玻片之间的花粉颗粒免于干燥。 使用连接至AxioCam MRm3S/N 5669相机的AxioImager M2显微镜检查和 记录样品。
通过在开花前在每个植株头上放置玻璃纸袋来评估单个植株的自体能 育性。收集每株植株3至10植株头用于种子计数。每植株头的两个基部和 两个顶尖小穗由于其不完全的发育从分析中移除。以每植株头为基础对总 种子集和小花数进行计数。每个穗或植株的能育性百分比计算如下:
Figure BDA0001253786840000671
使用苯酚氯仿或冷冻干燥提取方案进行来自所有转基因再生植株的 DNA提取。(Kovalchuk,N.in Crop Breeding Vol.1145 Methods in Molecular Biology(edsD.Fleury&R.Whitford)239-252(Springer,2014) (Kovalchuk,N.,《作物育种》,第1145卷,分子生物学方法,D.Fleury 和R.Whitford编辑,第239-252页,施普林格出版社,2014年))。将来 自2周龄植株的15cm叶片在液氮中冷冻,并使用1个大滚珠(9mm)和3个 小滚珠(3mm)以及涡旋机将组织研磨成细粉末。向每个样品中加入700μL 提取缓冲液(1%sarkosyl,100mM Tris-HCl pH8.5,100mM NaCl,10mM EDTA,2%PVPP),将样品在旋转振荡器上混合20min。加入700μL苯酚 /氯仿/异戊醇(25∶24∶1),将提取物转移到二氧化硅基质管中并以4000rpm旋 转10min。通过加入60μL 3M醋酸钠pH4.8和600μL异丙醇沉淀DNA,并 以13000rpm离心10分钟。用1mL 70%乙醇洗涤DNA沉淀,在13000rpm 下离心2分钟,空气干燥20分钟。将纯化的DNA重悬于50μL R40 (1×TE,40μg/mL RNA酶A)中。通过使用转基因特异性引物的PCR评 估T0再生小植株中RNAi盒的存在。
鉴定出九十九种T0再生小植株对潮霉素具有抗性,其中73个被认为 含有RNAi盒。在73个PCR阳性T0转基因植株中,当评估自体能育性 时,观察到26个(约36%)是完全不育的或表达部分不育。这些结果表明 TaLTPGl特异性转录后基因沉默可以诱导不育。
实施例12:使用基因组TaLTPG1恢复msld纯合子的能育性
通过生物弹道转化将载体PHP2中TaLTPG1的基因组片段引入基因型 msld×Gladius(F2/F3代)中。
按照实施例11进行转化。通过KASPar分析使用Ms1连接的标记 ET0292(SEQ IDNO:34)、ET0294(SEQ ID NO:35)、007-0042.1(SEQ ID NO:36)、007-0046.1(SEQ ID NO:33)以及007-0182.1(SEQ ID NO:37)对再 生T0小植株进行基因分析,所述标记靶向来自SEQID NO:8的Ms1 4BS 变体启动子(人工)。根据实施例11的方法评估被鉴定为msld纯合子并含有Ms1 4BS变体启动子的植株的自体能育性。
鉴定出八十个T0再生小植株对潮霉素具有抗性,通过KASP分析用 007-0182.1鉴定出其中69个被认为含有转基因衍生的Ms1 4BS变体启动 子。在这69个T0转基因植株中,使用007-0009.1、007-0011.1、007- 0042.1和007-0046.1标记通过KASP分析鉴定出4个植株对于Chris单倍型 (msld/msld)是纯合的。开花前装袋的穗的分析显示三个品系是自体能育 的。这些研究结果表明TaLTPGl的基因组片段可以恢复msld纯合子的能 育性。
实施例13:Ms1启动子反向重复表达影响小麦的能育性
该实施例证明可以通过Ms1启动子特异性反向重复序列(启动子反向 重复序列,pIR)分子的表达来改变植物的能育性。这提供了Ms1基因的表 达是小麦中雄性能育所需的进一步证据。
通过将泛素启动子与靶向小麦Ms1启动子的一部分的反向重复序列连 接,来产生pIR构建体(SEQ ID NO:6),包括反向重复序列之间的NOS间 隔区段。用于制备载体的核酸分子和方法之前已有描述(Cigan et al Plant Journal(2005)43,929-940(Cigan等人,《植物杂志》,2005年,第43 卷,第929-940页))。使用本领域已知的和本文别处提到的方法,通过农 杆菌介导的转化将该构建体引入小麦Fielder品种中。
使植株在温室中生长。通过定量聚合酶链式反应(QPCR)测定转基因拷 贝数。将植株栽培至成熟,记录雄性能育性表型。
抑制足以造成在100%的事件中呈雄性不育。单拷贝和多拷贝T-DNA 插入事件都是雄性不育的,这表明单拷贝和多拷贝插入事件都是有效的。 该实施例进一步证实,Ms1基因是小麦中的雄性能育基因,并且其抑制导 致雄性不育。
序列表
<110> Pioneer Hi-Bred International, Inc.
<120> 小麦Ms1多核苷酸、多肽和使用方法
<130> RTS20250D-US-NP
<140> US14866078
<141> 2015-09-25
<150> US 62/056365
<151> 2014-09-26
<150> US 62/187591
<151> 2015-07-01
<160> 51
<170> PatentIn版本3.5
<210> 1
<211> 3838
<212> DNA
<213> 多棱大麦(Hordeum vulgare)
<220>
<221> 启动子
<222> (1)..(902)
<400> 1
cgcacatcaa cataaactca tcagatggga ataatcggat ctacgaagga cataaaactc 60
tttaatctca tgacaacgcc agaagagcaa gagtaaatat attctcataa aaaacaatga 120
acactagatg atgacgaaga acataagatt cttcaaggag aaattgcggc agcggagatg 180
gcagccggag gcgagggggc caaaaactct gttgcggcgg cagcggtagc cttggtgaaa 240
cccacacgtt tgcacaccat ataagttgtt tgcaagggtt acatgggcct cgctctcgtg 300
aaaaagaagg tcatacatgg gtcttggtct cgtgcaaaac gaaaggtcag cagtccatgg 360
gccggaggaa aaaccgggca acaacacgcc atgtgtgttt tcgcgggaac ccaattccga 420
aatcactcac cggcacctcg tcccgatgcc ttccagaacg ttctacgtgc ttccacaggg 480
ccagcccagc cgtgggatca gatcaggatc agcacgaaca ttgaagctag cgcggcgata 540
tttttcccag cctccgcctc gctcgacgac tgcatttcat ttcgaaaaca aaaaaaagag 600
ctttctcctt ctcatcccga gcgccagagg agcaccagaa aggccaccca cccaccctca 660
cgtaccgccc tcgcacccgc gcggccacat ctgggccgtc cacttgggca gctggccgtt 720
ccattcccga actgacgggc aggatcgagc gagcggcgcg cccacggctc ctccggctat 780
ataacccgcc acccacacca ctcccctccg gcgttccacc agagccttcc tccctccacc 840
gcaccaccac caccaccgcg ccaaaaaccc tagggagcga gcgagctcac ctcgccccgc 900
ccatggagag atcccgccgc ctgctgctcg tggcggggct cctcgccgcg ctgctcccgg 960
cggcggccgc caccttcggg ctgcagcagg gggcgcagtg cgaccccacg ttcctggcga 1020
cgcaggccgc gctcttctgc gcccccgaca tgcccacggc ccagtgctgc gagcccgtcg 1080
tcgccgcctt cgacctcggg ggcggcgtcc cctgcctctg ccgcgtcgcc gccgagccgc 1140
agctggtcat ggcggggctc aacgccaccc acctcttcgc gctgtacacc tcctgcggcg 1200
gcatccgtcc cggtggcgcc cacctcgccg ccgcctgcca aggtacgttc acgttcaccg 1260
cctccctccc tctccttctc tctttgcacc tgtaccagcc gattcggcgt tcgctttcgc 1320
gtttcccggt agttttgatg gtttctcgag tcgccagtgc tccgatttgg gttcggtttc 1380
cttgcgttgt accggatctg cctgtacggc gcgcggcgtc ggggttctcg ttgtttcccg 1440
tggcgagcat ccccgcgcgc ccacggccta gctagcttac cttcagatac gcggagcgat 1500
ttaggatcag tatgaggagt tcgtcgtaga agaatgcatg cggaacgcgc gattgtttgt 1560
ttcatcgatt ttggatctgt gataggcctg cttgttcccg agtttttgca cgtagaagaa 1620
tcatgtgcag aacccctggt ccattatttg ttatgtatat acacgattac ttgtgcatat 1680
gcagaagtct tagttatctg ctacccttcc agaattattc gtggtgtttt tgttcctcta 1740
gttaaacttc agatgatctt tcgttcgagt ttattttcct gcctgtaact gagatcgata 1800
tacctatcac cgtgactgtg agagagacag agagttgttg ccgtttaact gctatatata 1860
tgtacgtttt ctgctactgt ttaatcgact gctccatccc gttcgcgata ggacttgttt 1920
caaaccgtca cgcagctctg cttcctgcag tgtcttttgt cttcgtttgg tcaaaactga 1980
aaacgcttgc tatcgaggcc agaggcaggg caaaagctcc ccgtactttt cgctttgcag 2040
tggcatctct ttcttttttt ttgccgaaaa ttgtttccac gttcatcccc gggtgtcgta 2100
ctacttaatt atctgcatgc agttttcgtg tccttcctcc gtcgtgaaaa aaaggttggg 2160
tcaaatgaat caaccgtgta tgcagggcag cagcaacaga gatagagtag ctggctgtcg 2220
cagctttaac aaaagcagtc tgtggcctgc cacagttttc ctgatttttg tttaatctgg 2280
cctgggcttc ttttcttgtt gcgcacgtcg tcgcctcctt cttttttccc aattttttga 2340
tttcttttga gataaggaca cgaacggctg gtaactgact tttcttgttg ttttttactg 2400
tgggttttgg acgcaggacc ggctcccccg gccgccgtcg tcagcagccc cccgccacca 2460
tcgccagcac ctcgccgcaa acaggcagcg cgtacgaacc tctcgctctc tctctctccc 2520
tctcgcctgc atctcgctct gtacataacc tattgggttc atatgctgat cagcgttgac 2580
atactaactt gttcatttga ttctcagacg acgcgcctcc accgccgccg tccagcgaga 2640
agccatcccc gccgccccag gagcatgacg gcgccgcaca cgccaagagc gcccccgccc 2700
tcgcggctcc taccccgctc gcgcccgctg ccgctactgc cccgccgccc gaggcgccac 2760
actccgccgc gtcgtcgtcc gattcggcct tcatcttcat cgccgcggcc atgctcgcca 2820
tttacatcgt cctctgaatg gccgaccccc aaggcagcag agtacttgtc atctgattcc 2880
gtttcatgct tgtcgccgtt tgttgaggtt cgtttctgca gtccgaacaa gacggtgggg 2940
ttttgatcgg gtacccagat ttctatgtcg atcgcgcgta ctagtactag tagttgctta 3000
gcagatgaac gaacattggg ttttgggatt cctctagctg atgaaccact gctattttcc 3060
atgtgatcga tggatatgat ctgaatggat ggatgaagtt ttggtttctg atgctgatga 3120
tgtgctgctt cttcatttgc atgctcgatc tattccttca attttgtgga gcaacagttt 3180
gtttagcttc tgttctgcta tgaataatgc cgcttgcatc ttgtcattgc tgataatctg 3240
cttaatgcag acattgcttc cgtcccaaac aatctgttgc ttaccaggta atgcatataa 3300
tctgtacctc accttcgcac aacaacagaa gctaccctgc taaaaaaaca cacacacaca 3360
cacaaaaaaa acagaagctg gtctcacacg gaagccgctt cggggactgt ttgcagcttt 3420
ttattgccat tttgtttttc atgcaggtac aaatcgaggg tgttgcttga tttgatcatg 3480
gatgatcact tagagcaaca tgtgtgtttt gtctgtgttt tattcgttgc tcgtccatcc 3540
aatttaaact tgaaatggat cgtgtgtgga taaaagaaga cgtgcgtcag tttgaatcga 3600
cgcgttgggt tatattttgt gtctgtgacg accgaaacga agacaaaata tatcgtccgg 3660
ttagaattgc tctaatgcta gctttctctc ctaccatcgc attccgtggt aggaaaaagt 3720
actagaacca caggaaactg gaacgcaaga aaagcatatc taccgttggc cgttgatctt 3780
gtttcacatt cggtatggct ccggtcatat tgttggagat tcacattcat gcacgcaa 3838
<210> 2
<211> 642
<212> DNA
<213> 多棱大麦(Hordeum vulgare)
<400> 2
atggagagat cccgccgcct gctgctcgtg gcggggctcc tcgccgcgct gctcccggcg 60
gcggccgcca ccttcgggct gcagcagggg gcgcagtgcg accccacgtt cctggcgacg 120
caggccgcgc tcttctgcgc ccccgacatg cccacggccc agtgctgcga gcccgtcgtc 180
gccgccttcg acctcggggg cggcgtcccc tgcctctgcc gcgtcgccgc cgagccgcag 240
ctggtcatgg cggggctcaa cgccacccac ctcttcgcgc tgtacacctc ctgcggcggc 300
atccgtcccg gtggcgccca cctcgccgcc gcctgccaag gaccggctcc cccggccgcc 360
gtcgtcagca gccccccgcc accatcgcca gcacctcgcc gcaaacaggc agcgcacgac 420
gcgcctccac cgccgccgtc cagcgagaag ccatccccgc cgccccagga gcatgacggc 480
gccgcacacg ccaagagcgc ccccgccctc gcggctccta ccccgctcgc gcccgctgcc 540
gctactgccc cgccgcccga ggcgccacac tccgccgcgt cgtcgtccga ttcggccttc 600
atcttcatcg ccgcggccat gctcgccatt tacatcgtcc tc 642
<210> 3
<211> 214
<212> PRT
<213> 多棱大麦(Hordeum vulgare)
<400> 3
Met Glu Arg Ser Arg Arg Leu Leu Leu Val Ala Gly Leu Leu Ala Ala
1 5 10 15
Leu Leu Pro Ala Ala Ala Ala Thr Phe Gly Leu Gln Gln Gly Ala Gln
20 25 30
Cys Asp Pro Thr Phe Leu Ala Thr Gln Ala Ala Leu Phe Cys Ala Pro
35 40 45
Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala Ala Phe Asp
50 55 60
Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala Glu Pro Gln
65 70 75 80
Leu Val Met Ala Gly Leu Asn Ala Thr His Leu Phe Ala Leu Tyr Thr
85 90 95
Ser Cys Gly Gly Ile Arg Pro Gly Gly Ala His Leu Ala Ala Ala Cys
100 105 110
Gln Gly Pro Ala Pro Pro Ala Ala Val Val Ser Ser Pro Pro Pro Pro
115 120 125
Ser Pro Ala Pro Arg Arg Lys Gln Ala Ala His Asp Ala Pro Pro Pro
130 135 140
Pro Pro Ser Ser Glu Lys Pro Ser Pro Pro Pro Gln Glu His Asp Gly
145 150 155 160
Ala Ala His Ala Lys Ser Ala Pro Ala Leu Ala Ala Pro Thr Pro Leu
165 170 175
Ala Pro Ala Ala Ala Thr Ala Pro Pro Pro Glu Ala Pro His Ser Ala
180 185 190
Ala Ser Ser Ser Asp Ser Ala Phe Ile Phe Ile Ala Ala Ala Met Leu
195 200 205
Ala Ile Tyr Ile Val Leu
210
<210> 4
<211> 660
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 4
atggagagat cccgcgggct gctgctggtg gcggggctgc tggcggcgct gctgccggcg 60
gcggcggcgc agccgggggc gccgtgcgag cccgcgctgc tggcgacgca ggtggcgctc 120
ttctgcgcgc ccgacatgcc gacggcccag tgctgcgagc ccgtcgtcgc cgccgtcgac 180
ctcggcggcg gggtgccctg cctctgccgc gtcgccgccg agccgcagct cgtcatggcg 240
ggcctcaacg ccacccacct cctcacgctc tacagctcct gcggcggcct ccgccccggc 300
ggcgcccacc tcgccgccgc ctgcgaagga cccgctcccc cggccgccgt cgtcagcagc 360
cccccgcccc cgcctccacc gtccgccgca cctcgccgca agcagccagc gcacgacgca 420
ccaccgccgc caccgccgtc gagcgagaag ccgtcgtccc cgccgccgtc ccaggaccac 480
gacggcgccg ccccccgcgc caaggccgcg cccgcccagg cggccacctc cacgctcgcg 540
cccgccgccg ccgccaccgc cccgccgccc caggcgccgc actccgccgc gcccacggcg 600
ccgtccaagg cggccttctt cttcgtcgcc acggccatgc tcggcctcta catcatcctc 660
<210> 5
<211> 220
<212> PRT
<213> 普通小麦(Triticum aestivum)
<400> 5
Met Glu Arg Ser Arg Gly Leu Leu Leu Val Ala Gly Leu Leu Ala Ala
1 5 10 15
Leu Leu Pro Ala Ala Ala Ala Gln Pro Gly Ala Pro Cys Glu Pro Ala
20 25 30
Leu Leu Ala Thr Gln Val Ala Leu Phe Cys Ala Pro Asp Met Pro Thr
35 40 45
Ala Gln Cys Cys Glu Pro Val Val Ala Ala Val Asp Leu Gly Gly Gly
50 55 60
Val Pro Cys Leu Cys Arg Val Ala Ala Glu Pro Gln Leu Val Met Ala
65 70 75 80
Gly Leu Asn Ala Thr His Leu Leu Thr Leu Tyr Ser Ser Cys Gly Gly
85 90 95
Leu Arg Pro Gly Gly Ala His Leu Ala Ala Ala Cys Glu Gly Pro Ala
100 105 110
Pro Pro Ala Ala Val Val Ser Ser Pro Pro Pro Pro Pro Pro Pro Ser
115 120 125
Ala Ala Pro Arg Arg Lys Gln Pro Ala His Asp Ala Pro Pro Pro Pro
130 135 140
Pro Pro Ser Ser Glu Lys Pro Ser Ser Pro Pro Pro Ser Gln Asp His
145 150 155 160
Asp Gly Ala Ala Pro Arg Ala Lys Ala Ala Pro Ala Gln Ala Ala Thr
165 170 175
Ser Thr Leu Ala Pro Ala Ala Ala Ala Thr Ala Pro Pro Pro Gln Ala
180 185 190
Pro His Ser Ala Ala Pro Thr Ala Pro Ser Lys Ala Ala Phe Phe Phe
195 200 205
Val Ala Thr Ala Met Leu Gly Leu Tyr Ile Ile Leu
210 215 220
<210> 6
<211> 1527
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 6
agacttaaac catttagtta caaatatcga tgcacacctt cggtggggcg ttgtgaaaaa 60
gcatgttttt tgggtcgaca agcccctttt gcaacgtatc ctcttctaat cctattcaga 120
tcattaacat cataagctgc aattgacatg ctcttctgag gatcaggttc atgcaattaa 180
acatcataaa ctgcatcttt gatgtcatcc ttttcctata ttttttccag attattggct 240
tgcttcgttt tcaatatcag gttctatgat tcgacttctg ttgttgccag taataatttg 300
tagttgctgc ggaatatgaa ctcaaggaga gctgatggtg ctatgaagtt gatttgatgg 360
gaggttgttc tacacctgca cttgctgctc gacttaaata catgccttgg atttcttccc 420
agctctagta cataatattt ttcaaattaa tgttccacga cataaaattt aaatccacaa 480
acatattttt agtacatgaa caattttcta atatagggca aacatttttc atatacaaac 540
cgatcatttt aatatatggt gaaaatcagt gtaatatatg ctgaaatgtt ttcaaataca 600
tattgaacat atttataata aatggtgaac atttttttta ataattgatg accattttta 660
aaatgcatat tgaacatttt ataatataca ctgtacagtt ttataataat cgacgaacat 720
cttttggagt tctgaacatt tttttcaaaa acacaagcca ttttccagga agaatacaaa 780
tgcaaaagaa atgagatatc caaaaagcaa aaaagaaaaa caaaacaaaa cagagaaacc 840
tacaggaaaa tccaaacaga aaaggcaaag aaagaacccg aactgggcca ggcaatgttt 900
ccaacggcct cgctcttcct gaacaagaag gccagtcagc ccatgggctg ctcccagtac 960
tcgggccccg ctgtggcagc acgccatgta atagttttcg cgggaatcca acgccgaaat 1020
cgcccgcagc gggaacccga cgtcggtctg gtgcgttctg gcgccttcca gaactctcca 1080
caggctcccg cagccgtccg atcagatcag cacgaagcac gaacattggc gcgcggcgat 1140
attttctttc ctcgcccgac gacggccgca ctgcatttca ttttgaattt caaaattcgg 1200
aaacggaaaa gctttctcgc atcccgaggc gaggcggtta cgggcgccag aggggccacc 1260
ccacccaccc acccccgccc tcacgtgccc cgcgcggccg catccgggcc gtccgcgcgg 1320
acagctggcc gcgcccagcc cgaaccgacg cccaggatcg agcgagggcg gcgcgcccgg 1380
ggcttggctt agcgtccacg ccacctccgg ctatataagc cgccccacac ccgctccccc 1440
tccggcattc cattccgcca ccgcaccacc accaccacca aaccctagcg agcgagcgag 1500
ggagagagag accgccccgc cgcgacg 1527
<210> 7
<211> 4335
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 外显子
<222> (1528)..(1855)
<220>
<221> 外显子
<222> (2925)..(3008)
<220>
<221> 外显子
<222> (3133)..(3380)
<400> 7
agacttaaac catttagtta caaatatcga tgcacacctt cggtggggcg ttgtgaaaaa 60
gcatgttttt tgggtcgaca agcccctttt gcaacgtatc ctcttctaat cctattcaga 120
tcattaacat cataagctgc aattgacatg ctcttctgag gatcaggttc atgcaattaa 180
acatcataaa ctgcatcttt gatgtcatcc ttttcctata ttttttccag attattggct 240
tgcttcgttt tcaatatcag gttctatgat tcgacttctg ttgttgccag taataatttg 300
tagttgctgc ggaatatgaa ctcaaggaga gctgatggtg ctatgaagtt gatttgatgg 360
gaggttgttc tacacctgca cttgctgctc gacttaaata catgccttgg atttcttccc 420
agctctagta cataatattt ttcaaattaa tgttccacga cataaaattt aaatccacaa 480
acatattttt agtacatgaa caattttcta atatagggca aacatttttc atatacaaac 540
cgatcatttt aatatatggt gaaaatcagt gtaatatatg ctgaaatgtt ttcaaataca 600
tattgaacat atttataata aatggtgaac atttttttta ataattgatg accattttta 660
aaatgcatat tgaacatttt ataatataca ctgtacagtt ttataataat cgacgaacat 720
cttttggagt tctgaacatt tttttcaaaa acacaagcca ttttccagga agaatacaaa 780
tgcaaaagaa atgagatatc caaaaagcaa aaaagaaaaa caaaacaaaa cagagaaacc 840
tacaggaaaa tccaaacaga aaaggcaaag aaagaacccg aactgggcca ggcaatgttt 900
ccaacggcct cgctcttcct gaacaagaag gccagtcagc ccatgggctg ctcccagtac 960
tcgggccccg ctgtggcagc acgccatgta atagttttcg cgggaatcca acgccgaaat 1020
cgcccgcagc gggaacccga cgtcggtctg gtgcgttctg gcgccttcca gaactctcca 1080
caggctcccg cagccgtccg atcagatcag cacgaagcac gaacattggc gcgcggcgat 1140
attttctttc ctcgcccgac gacggccgca ctgcatttca ttttgaattt caaaattcgg 1200
aaacggaaaa gctttctcgc atcccgaggc gaggcggtta cgggcgccag aggggccacc 1260
ccacccaccc acccccgccc tcacgtgccc cgcgcggccg catccgggcc gtccgcgcgg 1320
acagctggcc gcgcccagcc cgaaccgacg cccaggatcg agcgagggcg gcgcgcccgg 1380
ggcttggctt agcgtccacg ccacctccgg ctatataagc cgccccacac ccgctccccc 1440
tccggcattc cattccgcca ccgcaccacc accaccacca aaccctagcg agcgagcgag 1500
ggagagagag accgccccgc cgcgacg atg gag aga tcc cgc ggg ctg ctg ctg 1554
Met Glu Arg Ser Arg Gly Leu Leu Leu
1 5
gtg gcg ggg ctg ctg gcg gcg ctg ctg ccg gcg gcg gcg gcg cag ccg 1602
Val Ala Gly Leu Leu Ala Ala Leu Leu Pro Ala Ala Ala Ala Gln Pro
10 15 20 25
ggg gcg ccg tgc gag ccc gcg ctg ctg gcg acg cag gtg gcg ctc ttc 1650
Gly Ala Pro Cys Glu Pro Ala Leu Leu Ala Thr Gln Val Ala Leu Phe
30 35 40
tgc gcg ccc gac atg ccg acg gcc cag tgc tgc gag ccc gtc gtc gcc 1698
Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala
45 50 55
gcc gtc gac ctc ggc ggc ggg gtg ccc tgc ctc tgc cgc gtc gcc gcc 1746
Ala Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala
60 65 70
gag ccg cag ctc gtc atg gcg ggc ctc aac gcc acc cac ctc ctc acg 1794
Glu Pro Gln Leu Val Met Ala Gly Leu Asn Ala Thr His Leu Leu Thr
75 80 85
ctc tac agc tcc tgc ggc ggc ctc cgc ccc ggc ggc gcc cac ctc gcc 1842
Leu Tyr Ser Ser Cys Gly Gly Leu Arg Pro Gly Gly Ala His Leu Ala
90 95 100 105
gcc gcc tgc gaa g gtacgttgtc cgcctcctcc cctccctccc tccctccctc 1895
Ala Ala Cys Glu
tctctctacg tgctcgcttt cctgcttacc tagtagtacg tagtttccca tgccttcttg 1955
actcgctaga agtgctccgg tttgggtctg ttaatttcct cgctgtacta ccggatctgt 2015
cgtcggcacg gcgcgcggcg tcgggtcctc gccttctccc gtggcgaccg acctgcgcag 2075
cgcgcgcgcg gcctagctag cttcataccg ctgtacctcg acatacacgg agcgatctat 2135
ggtctactct gagtatttcc tcatcgtaga acgcatgcgc cgctcgcgat tgtttcgtcg 2195
attctagatc cgtgcttgtt cccgcgagtt agtatgcatc tgcgtgcata tgccgtacgc 2255
acgcagatgc agagtctgtt gctcgagtta tctactgtcg ttcgctcgac catatttgcc 2315
tgttaatttc ctgttcatcg tgcatgcagt agtagtagcc atgtccacgc cttcttgttt 2375
tgaggcgatc atcgtcgaga tccatggctt tgctttctgc actatcttct gccttgtttt 2435
gttctccgca gtacgtacgt cttgcttggt caaaactgaa aaacgctttg ctgtttgttt 2495
gatcggcaag agctggccgt gcttttggca ccgcagtgcg tcgcctctgc cgcttttgcg 2555
aaacatttcc atgttgatcc tctggcggaa ctactttttc gcgtgcggtt tgcgtggcct 2615
tcctctctcg tgaaaagagg tcgggtcaaa ccaaatggat cgcctcttgg cagagcagcg 2675
gcagcagata gctggccgtc tcgcagcttt ggcagaaccg gtctgtggcc atctgtcgcc 2735
gcctgccacc gtttccctga tgtttgtttc tctctcgcct gccactgttt cttttcttgt 2795
tgcgcacgta cgtcgtcacc tcctcctact tttttgccag ttttgtttac ttttgatgaa 2855
atatacggat gaatcggctg gtgattaact ttggctgctg ctgttaatta ctgtggattt 2915
tggatgcag ga ccc gct ccc ccg gcc gcc gtc gtc agc agc ccc ccg ccc 2965
Gly Pro Ala Pro Pro Ala Ala Val Val Ser Ser Pro Pro Pro
110 115 120
ccg cct cca ccg tcc gcc gca cct cgc cgc aag cag cca gcg c 3008
Pro Pro Pro Pro Ser Ala Ala Pro Arg Arg Lys Gln Pro Ala
125 130 135
gtaagaacct ctccctctcc ctctctctct ccctctcgcc tgcatctcgc tatgtttatc 3068
catgtccata tgttgatcag ccttgtttag ttactaacat gtgcaccgga tcgggttctc 3128
gcag ac gac gca cca ccg ccg cca ccg ccg tcg agc gag aag ccg tcg 3176
His Asp Ala Pro Pro Pro Pro Pro Pro Ser Ser Glu Lys Pro Ser
140 145 150
tcc ccg ccg ccg tcc cag gac cac gac ggc gcc gcc ccc cgc gcc aag 3224
Ser Pro Pro Pro Ser Gln Asp His Asp Gly Ala Ala Pro Arg Ala Lys
155 160 165
gcc gcg ccc gcc cag gcg gcc acc tcc acg ctc gcg ccc gcc gcc gcc 3272
Ala Ala Pro Ala Gln Ala Ala Thr Ser Thr Leu Ala Pro Ala Ala Ala
170 175 180
gcc acc gcc ccg ccg ccc cag gcg ccg cac tcc gcc gcg ccc acg gcg 3320
Ala Thr Ala Pro Pro Pro Gln Ala Pro His Ser Ala Ala Pro Thr Ala
185 190 195 200
ccg tcc aag gcg gcc ttc ttc ttc gtc gcc acg gcc atg ctc ggc ctc 3368
Pro Ser Lys Ala Ala Phe Phe Phe Val Ala Thr Ala Met Leu Gly Leu
205 210 215
tac atc atc ctc tgagtcgcgc gccgaccccg cgagagaccg tggtccgtcc 3420
Tyr Ile Ile Leu
220
agtcgcagta gagtagagcg ctcgtcgtct cgttccgttt cgtgcctgtc gccgttcgag 3480
gttcgtttct gcgtgcagtc cggtcgaaga agccggtggg ttttgagtac tagtggtagt 3540
agtagcagca gctatcgttt ctgtccgctc gtacgtgttt gcgtggtcgc ggagaacaat 3600
taattgggtg tttgcgagtc ctctggttaa gatgaaccac tgatgctatg tgatcgatcg 3660
atcggtatga tctgaatgga aatggatcaa gttttgcgtt ctgctgatga tgtgatccat 3720
ttggatctgt gtggggcaac agtttcgctt gcttttgctc tgcgatgaac gaatgcttct 3780
tgcatgcatc ttgtctttgc ttaatttgaa ctgtagaacg gatgcagtac tgatttctgc 3840
ttatgatgtg acgattcgtc gtacgcatat catctcttca aatttgtgta gcagctgttt 3900
gtagcttcca ttctgctatg gacgaatgcc tgtttttcac ggagaaccgc gcgcggggac 3960
cgatgcggct ttgtgttgcc atgttgtttt ccacgccagg acaaaataga tggtgcggtt 4020
ttgatcccca atcccaccat caccatgttc cggagagcca catggaactc acgtcaagcg 4080
gtcacttttt gcagaatcac tcttaccatt ttaccctttt gttgaaacct ctctcctcat 4140
ccccaaaagt tgatgcaaca gtgctatgcg cgcccaccca tgctttttca tatgattgta 4200
aaatttggat cgattttatc ttttgaaccc taagtccggt ttacaatctg tttgcatgtt 4260
tatgttcctt gcggcgagga ccattaaaca agactactat tggatatatt tcgacaggct 4320
ttgaaatccg aattc 4335
<210> 8
<211> 1527
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 8
aagcttaaac catttagtta caaatatcga tgcacacctt cggtggggcg ttgtgaaaaa 60
gcatgttttt tgggtcgaca agcccctttt gcaacgtatc ctcttctaat cctattcaga 120
tcattaacat cataagctgc aattgacatg ctcttctgag gatcaggttc atgcaattaa 180
acatcataaa ctgcatcttt gatgtcatcc ttttcctata ttttttccag attattggct 240
tgcttcgttt tcaatatcag gttctatgat tcgacttctg ttgttgccag taataatttg 300
tagttgctgc ggaatatgaa ctcaaggaga gctgatggtg ctatgaagtt gatttgatgg 360
gaggttgttc tacacctgca cttgctgctc gacttaaata catgccttgg atttcttccc 420
agctctagta cataatattt ttcaaattaa tgttccacga cataaaattt aaatccacaa 480
acatattttt agtacatgaa caattttcta atatagggca aacatttttc atatacaaac 540
cgatcatttt aatatatggt gaaaatcagt gtaatatatg ctgaaatgtt ttcaaataca 600
tattgaacat atttataata aatggtgaac atttttttta ataattgatg accattttta 660
aaatgcatat tgaacatttt ataatataca ctgtacagtt ttataataat cgacgaacat 720
cttttggagt tctgaacatt tttttcaaaa acacaagcca ttttccagga agaatacaaa 780
tgcaaaagaa atgagatatc caaaaagcaa aaaagaaaaa caaaacaaaa cagagaaacc 840
tacaggaaaa tccaaacaga aaaggcaaag aaagaacccg aactgggcca ggcaatgttt 900
ccaacggcct cgctcttcct gaacaagaag gccagtcagc ccatgggctg ctcccagtac 960
tcgggccccg ctgtggcagc acgccatgta atagttttcg cgggaatcca acgccgaaat 1020
cgcccgcagc gggaacccga cgtcggtctg gtgcgttctg gcgccttcca gaactctcca 1080
caggctcccg cagccgtccg atcagatcag cacgaagcac gaacattggc gcgcggcgat 1140
attttctttc ctcgcccgac gacggccgca ctgcatttca ttttgaattt caaaattcgg 1200
aaacggaata gctttctcgc atcccgaggc gaggcggtta cgggcgccag aggggccacc 1260
ccacccaccc acccccgccc tcacgtgccc cgcgcggccg aatccgggcc gtccgcgcgg 1320
acagctggcc gcgcccagcc cgaaccgacg cccaggatcg agcgagggcg gcgcgcccgg 1380
ggcttggctt agcgtccacg ccacctccgg ctatataagc cgccccacac ccgctccccc 1440
tccggcattc cattccgcca ccgcaccacc accaccacca aaccctagcg agcgagcgag 1500
ggagagagag accgccccgc cgcgacg 1527
<210> 9
<211> 4335
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 9
aagcttaaac catttagtta caaatatcga tgcacacctt cggtggggcg ttgtgaaaaa 60
gcatgttttt tgggtcgaca agcccctttt gcaacgtatc ctcttctaat cctattcaga 120
tcattaacat cataagctgc aattgacatg ctcttctgag gatcaggttc atgcaattaa 180
acatcataaa ctgcatcttt gatgtcatcc ttttcctata ttttttccag attattggct 240
tgcttcgttt tcaatatcag gttctatgat tcgacttctg ttgttgccag taataatttg 300
tagttgctgc ggaatatgaa ctcaaggaga gctgatggtg ctatgaagtt gatttgatgg 360
gaggttgttc tacacctgca cttgctgctc gacttaaata catgccttgg atttcttccc 420
agctctagta cataatattt ttcaaattaa tgttccacga cataaaattt aaatccacaa 480
acatattttt agtacatgaa caattttcta atatagggca aacatttttc atatacaaac 540
cgatcatttt aatatatggt gaaaatcagt gtaatatatg ctgaaatgtt ttcaaataca 600
tattgaacat atttataata aatggtgaac atttttttta ataattgatg accattttta 660
aaatgcatat tgaacatttt ataatataca ctgtacagtt ttataataat cgacgaacat 720
cttttggagt tctgaacatt tttttcaaaa acacaagcca ttttccagga agaatacaaa 780
tgcaaaagaa atgagatatc caaaaagcaa aaaagaaaaa caaaacaaaa cagagaaacc 840
tacaggaaaa tccaaacaga aaaggcaaag aaagaacccg aactgggcca ggcaatgttt 900
ccaacggcct cgctcttcct gaacaagaag gccagtcagc ccatgggctg ctcccagtac 960
tcgggccccg ctgtggcagc acgccatgta atagttttcg cgggaatcca acgccgaaat 1020
cgcccgcagc gggaacccga cgtcggtctg gtgcgttctg gcgccttcca gaactctcca 1080
caggctcccg cagccgtccg atcagatcag cacgaagcac gaacattggc gcgcggcgat 1140
attttctttc ctcgcccgac gacggccgca ctgcatttca ttttgaattt caaaattcgg 1200
aaacggaata gctttctcgc atcccgaggc gaggcggtta cgggcgccag aggggccacc 1260
ccacccaccc acccccgccc tcacgtgccc cgcgcggccg aatccgggcc gtccgcgcgg 1320
acagctggcc gcgcccagcc cgaaccgacg cccaggatcg agcgagggcg gcgcgcccgg 1380
ggcttggctt agcgtccacg ccacctccgg ctatataagc cgccccacac ccgctccccc 1440
tccggcattc cattccgcca ccgcaccacc accaccacca aaccctagcg agcgagcgag 1500
ggagagagag accgccccgc cgcgacgatg gagagatccc gcgggctgct gctggtggcg 1560
gggctgctgg cggcgctgct gccggcggcg gcggcgcagc cgggggcgcc gtgcgagccc 1620
gcgctgctgg cgacgcaggt ggcgctcttc tgcgcgcccg acatgccgac ggcccagtgc 1680
tgcgagcccg tcgtcgccgc cgtcgacctc ggcggcgggg tgccctgcct ctgccgcgtc 1740
gccgccgagc cgcagctcgt catggcgggc ctcaacgcca cccacctcct cacgctctac 1800
agctcctgcg gcggcctccg ccccggcggc gcccacctcg ccgccgcctg cgaaggtacg 1860
ttgtccgcct cctcccctcc ctccctccct ccctctctct ctacgtgctc gctttcctgc 1920
ttacctagta gtacgtagtt tcccatgcct tcttgactcg ctagaagtgc tccggtttgg 1980
gtctgttaat ttcctcgctg tactaccgga tctgtcgtcg gcacggcgcg cggcgtcggg 2040
tcctcgcctt ctcccgtggc gaccgacctg cgcagcgcgc gcgcggccta gctagcttca 2100
taccgctgta cctcgacata cacggagcga tctatggtct actctgagta tttcctcatc 2160
gtagaacgca tgcgccgctc gcgattgttt cgtcgattct agatccgtgc ttgttcccgc 2220
gagttagtat gcatctgcgt gcatatgccg tacgcacgca gatgcagagt ctgttgctcg 2280
agttatctac tgtcgttcgc tcgaccatat ttgcctgtta atttcctgtt catcgtgcat 2340
gcagtagtag tagccatgtc cacgccttct tgttttgagg cgatcatcgt cgagatccat 2400
ggctttgctt tctgcactat cttctgcctt gttttgttct ccgcagtacg tacgtcttgc 2460
ttggtcaaaa ctgaaaaacg ctttgctgtt tgtttgatcg gcaagagctg gccgtgcttt 2520
tggcaccgca gtgcgtcgcc tctgccgctt ttgcgaaaca tttccatgtt gatcctctgg 2580
cggaactact ttttcgcgtg cggtttgcgt ggccttcctc tctcgtgaaa agaggtcggg 2640
tcaaaccaaa tggatcgcct cttggcagag cagcggcagc agatagctgg ccgtctcgca 2700
gctttggcag aaccggtctg tggccatctg tcgccgcctg ccaccgtttc cctgatgttt 2760
gtttctctct cgcctgccac tgtttctttt cttgttgcgc acgtacgtcg tcacctcctc 2820
ctactttttt gccagttttg tttacttttg atgaaatata cggatgaatc ggctggtgat 2880
taactttggc tgctgctgtt aattactgtg gattttggat gcaggacccg ctcccccggc 2940
cgccgtcgtc agcagccccc cgcccccgcc tccaccgtcc gccgcacctc gccgcaagca 3000
gccagcgcgt aagaacctct ccctctccct ctctctctcc ctctcgcctg catctcgcta 3060
tgtttatcca tgtccatatg ttgatcagcc ttgtttagtt actaacatgt gcaccggatc 3120
gggttctcgc agacgacgca ccaccgccgc caccgccgtc gagcgagaag ccgtcgtccc 3180
cgccgccgtc ccaggaccac gacggcgccg ccccccgcgc caaggccgcg cccgcccagg 3240
cggccacctc cacgctcgcg cccgccgccg ccgccaccgc cccgccgccc caggcgccgc 3300
actccgccgc gcccacggcg ccgtccaagg cggccttctt cttcgtcgcc acggccatgc 3360
tcggcctcta catcatcctc tgagtcgcgc gccgaccccg cgagagaccg tggtccgtcc 3420
agtcgcagta gagtagagcg ctcgtcgtct cgttccgttt cgtgcctgtc gccgttcgag 3480
gttcgtttct gcgtgcagtc cggtcgaaga agccggtggg ttttgagtac tagtggtagt 3540
agtagcagca gctatcgttt ctgtccgctc gtacgtgttt gcgtggtcgc ggagaacaat 3600
taattgggtg tttgcgagtc ctctggttaa gatgaaccac tgatgctatg tgatcgatcg 3660
atcggtatga tctgaatgga aatggatcaa gttttgcgtt ctgctgatga tgtgatccat 3720
ttggatctgt gtggggcaac agtttcgctt gcttttgctc tgcgatgaac gaatgcttct 3780
tgcatgcatc ttgtctttgc ttaatttgaa ctgtagaacg gatgcagtac tgatttctgc 3840
ttatgatgtg acgattcgtc gtacgcatat catctcttca aatttgtgta gcagctgttt 3900
gtagcttcca ttctgctatg gacgaatgcc tgtttttcac ggagaaccgc gcgcggggac 3960
cgatgcggct ttgtgttgcc atgttgtttt ccacgccagg acaaaataga tggtgcggtt 4020
ttgatcccca atcccaccat caccatgttc cggagagcca catggaactc acgtcaagcg 4080
gtcacttttt gcagaatcac tcttaccatt ttaccctttt gttgaaacct ctctcctcat 4140
ccccaaaagt tgatgcaaca gtgctatgcg cgcccaccca tgctttttca tatgattgta 4200
aaatttggat cgattttatc ttttgaaccc taagtccggt ttacaatctg tttgcatgtt 4260
tatgttcctt gcggcgagga ccattaaaca agactactat tggatatatt tcgacaggct 4320
ttgaaatccg aattc 4335
<210> 10
<211> 241
<212> DNA
<213> 多棱大麦(Hordeum vulgare)
<220>
<221> 变型
<222> (121)..(121)
<223> a或c
<400> 10
ttttacagca gcaacaacaa caacaaaacc caagtcacca gtaagagctt acacgcagcc 60
tgagggcggg cacgacacaa acgggtataa ggttgacacg tacatccaac acagggcaaa 120
maagttccgt ttcaaggggt cgcgagcccg gagttccacc gctggaatcg gtcaatccgg 180
ttctgcacac acacagccgt tacactgcct acaaacaagt ttaagggata catacacact 240
g 241
<210> 11
<211> 274
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (34)..(34)
<223> c (Chris) 或t (Gladius)
<220>
<221> 变型
<222> (54)..(54)
<223> g (Chris) 或t (Gladius)
<220>
<221> 变型
<222> (83)..(83)
<223> t (Chris) 或c (Gladius)
<220>
<221> 变型
<222> (130)..(130)
<223> g (Chris) 或a (Gladius)
<220>
<221> 变型
<222> (165)..(165)
<223> a (Chris) 或空位 (Gladius)
<220>
<221> 变型
<222> (174)..(174)
<223> a (Chris) 或t (Gladius,第173位)
<220>
<221> 变型
<222> (186)..(186)
<223> t (Chris) 或g (Gladius,第185位)
<220>
<221> 变型
<222> (253)..(253)
<223> t (Chris) 或c (Gladius,第252位)
<400> 11
atgatggatg gacggatgat gctctgtggt gccytgtatt tatatttgtt gagktctttg 60
atacaggatg atatgtctcc aaygtatcta taattttttg ttgttccatg ttgttatatt 120
atcattttgr atgttttaca atcattttat aatcattcta tatcattttt tgtwactaac 180
ctattkacat agtgccaagt gctagttgtt gttttctgct tgttttttac atcgcaggaa 240
atcaatacca aayggagtcc aaacgcagca aaac 274
<210> 12
<211> 273
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 12
atgatggatg gacggatgat gctctgtggt gccttgtatt tatatttgtt gagttctttg 60
atacaggatg atatgtctcc aacgtatcta taattttttg ttgttccatg ttgttatatt 120
atcattttga atgttttaca atcattttat aatcattcta tatctttttt gttactaacc 180
tattgacata gtgccaagtg ctagttgttg ttttctgctt gttttttaca tcgcaggaaa 240
tcaataccaa acggagtcca aacgcagcaa aac 273
<210> 13
<211> 274
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 13
atgatggatg gacggatgat gctctgtggt gccctgtatt tatatttgtt gaggtctttg 60
atacaggatg atatgtctcc aatgtatcta taattttttg ttgttccatg ttgttatatt 120
atcattttgg atgttttaca atcattttat aatcattcta tatcattttt tgtaactaac 180
ctatttacat agtgccaagt gctagttgtt gttttctgct tgttttttac atcgcaggaa 240
atcaatacca aatggagtcc aaacgcagca aaac 274
<210> 14
<211> 415
<212> DNA
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 14
accaggcctc ccgaccccac cgtgagcatg cgcttcgcgt gcacggcggc accactccgc 60
tacggcctcg gcccttcttc ttccttctcc gacaacgccg cctcctcgtg ttgttcttct 120
tcgtctcgga ttctatctac aaggagctag ctagctagcg cgattcactg atctctagct 180
ggggaggggt acaaccgtac aagcatggag cccggagctt tagcgacgtg cggggcggtg 240
gccttctcct gggagcagga gccgggggtg tccaaggaga gcccggcggc cgaggcgagg 300
aagccctccg gtggaaggac gccggacagc accaggaagg tggaggtgca gacggacagg 360
ctgctcgtgc cccctccacc gggagggccc ggagcgccgt ctctgtcgcc ggtga 415
<210> 15
<211> 281
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (224)..(224)
<223> t (Chris) 或a (Gladius)
<220>
<221> 变型
<222> (229)..(229)
<223> c (Chris) 或a (Gladius)
<220>
<221> 变型
<222> (253)..(253)
<223> a (Chris) 或c (Gladius)
<400> 15
ttaatagtgt tccgccctgc gtggcacaga ccgtaacgaa tgattgtacg aacgtttttc 60
actaatcatt acataggtgt ggtttaagaa aaaatcaacc accttaacgc cgtaatcccc 120
tctacagaat aaccacacaa gtcatgaaaa ggaactatta acaaaaatag atgataaaat 180
aaatctcaaa tccaaattca taaagcacct ctagtctata aacwcgacma atctagctat 240
gtttagtact tcmtccgttc caaaatactt gtcgtggttt t 281
<210> 16
<211> 281
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 16
ttaatagtgt tccgccctgc gtggcacaga ccgtaacgaa tgattgtacg aacgtttttc 60
actaatcatt acataggtgt ggtttaagaa aaaatcaacc accttaacgc cgtaatcccc 120
tctacagaat aaccacacaa gtcatgaaaa ggaactatta acaaaaatag atgataaaat 180
aaatctcaaa tccaaattca taaagcacct ctagtctata aacacgacaa atctagctat 240
gtttagtact tcctccgttc caaaatactt gtcgtggttt t 281
<210> 17
<211> 281
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 17
ttaatagtgt tccgccctgc gtggcacaga ccgtaacgaa tgattgtacg aacgtttttc 60
actaatcatt acataggtgt ggtttaagaa aaaatcaacc accttaacgc cgtaatcccc 120
tctacagaat aaccacacaa gtcatgaaaa ggaactatta acaaaaatag atgataaaat 180
aaatctcaaa tccaaattca taaagcacct ctagtctata aactcgacca atctagctat 240
gtttagtact tcatccgttc caaaatactt gtcgtggttt t 281
<210> 18
<211> 199
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (101)..(101)
<223> t (Gladius) 或c (Chris)
<400> 18
atgctcatgg tgcacgcgac gagaagtggc cagagacaat ccttgaccat gatcgaataa 60
tatggctcgg ggatttgaat taccggatag cgctttccta ycgctctgtg aaggctttgg 120
ttgagatgca caattggaaa caattgttgg aaaaagatca gcttcgtata gagcaaaggt 180
ttggtcgggt attcgcggg 199
<210> 19
<211> 199
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 19
atgctcatgg tgcacgcgac gagaagtggc cagagacaat ccttgaccat gatcgaataa 60
tatggctcgg ggatttgaat taccggatag cgctttccta tcgctctgtg aaggctttgg 120
ttgagatgca caattggaaa caattgttgg aaaaagatca gcttcgtata gagcaaaggt 180
ttggtcgggt attcgcggg 199
<210> 20
<211> 199
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 20
atgctcatgg tgcacgcgac gagaagtggc cagagacaat ccttgaccat gatcgaataa 60
tatggctcgg ggatttgaat taccggatag cgctttccta ccgctctgtg aaggctttgg 120
ttgagatgca caattggaaa caattgttgg aaaaagatca gcttcgtata gagcaaaggt 180
ttggtcgggt attcgcggg 199
<210> 21
<211> 198
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (101)..(101)
<223> a (Gladius) 或g (Chris)
<220>
<221> 变型
<222> (165)..(165)
<223> c (Gladius) 或t (Chris)
<400> 21
tatatgaatt aggctttgcg gaccggaagt acaacgccaa cttgcttggt gttcctgcac 60
tgctgcttga gaccttgatg tgcaaagtta tgaacatatc rgcgtaacta gggaaagtga 120
atatgtataa tactagcaaa caagttagat taggctaaat cgcgytattt tccggtgagc 180
tgggatttcc tggccagt 198
<210> 22
<211> 198
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 22
tatatgaatt aggctttgcg gaccggaagt acaacgccaa cttgcttggt gttcctgcac 60
tgctgcttga gaccttgatg tgcaaagtta tgaacatatc agcgtaacta gggaaagtga 120
atatgtataa tactagcaaa caagttagat taggctaaat cgcgctattt tccggtgagc 180
tgggatttcc tggccagt 198
<210> 23
<211> 198
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 23
tatatgaatt aggctttgcg gaccggaagt acaacgccaa cttgcttggt gttcctgcac 60
tgctgcttga gaccttgatg tgcaaagtta tgaacatatc ggcgtaacta gggaaagtga 120
atatgtataa tactagcaaa caagttagat taggctaaat cgcgttattt tccggtgagc 180
tgggatttcc tggccagt 198
<210> 24
<211> 58
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (22)..(22)
<223> t (Chris) 或c (Gladius)
<400> 24
atgtggacct tggcaagatt tyatatgcat tttgagagaa atagaagtaa tgtgattg 58
<210> 25
<211> 56
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (27)..(27)
<223> g (Chris) 或a (Gladius)
<400> 25
ggttttgggt ttactttgag tcatagraga agccatacta taaagagggg gttgct 56
<210> 26
<211> 53
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (31)..(31)
<223> t (Chris) 或g (Gladius)
<400> 26
acttgattgt actttttggt tagcaacaat kgcaatgact tgacaaggga aag 53
<210> 27
<211> 50
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (30)..(30)
<223> g (Chris) 或c (Gladius)
<400> 27
ctcgccttgg ctatagggtc ctctgtgags aaggaaaagg tcgaggaggc 50
<210> 28
<211> 59
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (38)..(38)
<223> a (Chris) 或g (Gladius)
<400> 28
caacgctatc ccttaaaacg gatacactat ccatccgrga agcatgttcg gatgtgttg 59
<210> 29
<211> 39
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (20)..(20)
<223> a (Chris) 或G (Gladius)
<400> 29
ctcgccgccg cctgcgaagr tacgttgtcc gcctcctcc 39
<210> 30
<211> 1618
<212> DNA
<213> 玉米(Zea mays)
<220>
<221> CDS
<222> (108)..(1430)
<400> 30
ggcacgagcc ggcgagccca ctcggcagtc ggcacaacca cacacacctc cacccactct 60
ctgagataag tgaagcatct cgcgcactgt cgcagtcgca gacggag atg atg aag 116
Met Met Lys
1
cac tcg agc agc ttg tgc ttg ctc ttc ctc ttg gcg ctc tgc acc acc 164
His Ser Ser Ser Leu Cys Leu Leu Phe Leu Leu Ala Leu Cys Thr Thr
5 10 15
ctg ctg gcc tgc ggc ctg gtc cag gca caa gtc ctc ttc cag ggg ttt 212
Leu Leu Ala Cys Gly Leu Val Gln Ala Gln Val Leu Phe Gln Gly Phe
20 25 30 35
aac tgg gag tcg tgc aag cag cag gga ggc tgg tac aac agg ctc aag 260
Asn Trp Glu Ser Cys Lys Gln Gln Gly Gly Trp Tyr Asn Arg Leu Lys
40 45 50
gcc cag gtc gac gac atc gcc aag gcc ggc gtc acg cac gtc tgg ctg 308
Ala Gln Val Asp Asp Ile Ala Lys Ala Gly Val Thr His Val Trp Leu
55 60 65
cct cca ccc tcg cac tcc gtc tcg cca caa ggc tac atg cca ggc cgc 356
Pro Pro Pro Ser His Ser Val Ser Pro Gln Gly Tyr Met Pro Gly Arg
70 75 80
cta tac gac ctg gac gcg tcc aag tac ggc acg gcg gcg gag ctc aag 404
Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr Ala Ala Glu Leu Lys
85 90 95
tcc ctg ata gcg gcg ttc cac ggc agg ggc gtg cag tgc gtg gcg gac 452
Ser Leu Ile Ala Ala Phe His Gly Arg Gly Val Gln Cys Val Ala Asp
100 105 110 115
atc gtc atc aac cac cgg tgc gcg gaa aag aag gac gcg cgc ggc gtg 500
Ile Val Ile Asn His Arg Cys Ala Glu Lys Lys Asp Ala Arg Gly Val
120 125 130
tac tgc atc ttc gag ggc ggg act ccc gac gac cgc ctg gac tgg ggc 548
Tyr Cys Ile Phe Glu Gly Gly Thr Pro Asp Asp Arg Leu Asp Trp Gly
135 140 145
ccc ggg atg atc tgc agc gac gac acg cag tac tcg gac ggg acg ggg 596
Pro Gly Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asp Gly Thr Gly
150 155 160
cac cgc gac acg ggc gag ggg ttc gcg gcg gcg ccc gac atc gac cac 644
His Arg Asp Thr Gly Glu Gly Phe Ala Ala Ala Pro Asp Ile Asp His
165 170 175
ctc aac ccg cgc gtg cag cgg gag ctc tcc gcc tgg ctc aac tgg ctc 692
Leu Asn Pro Arg Val Gln Arg Glu Leu Ser Ala Trp Leu Asn Trp Leu
180 185 190 195
agg tcc gac gcc gtg ggg ttc gac ggc tgg cgc ctc gac ttc gcc aag 740
Arg Ser Asp Ala Val Gly Phe Asp Gly Trp Arg Leu Asp Phe Ala Lys
200 205 210
ggc tac tcg ccg gcc gtc gcc aga atg tac gtg gag agc acg ggg ccg 788
Gly Tyr Ser Pro Ala Val Ala Arg Met Tyr Val Glu Ser Thr Gly Pro
215 220 225
ccg agc ttc gtc gtc gcg gag ata tgg aac tcg ctg agc tac agc ggg 836
Pro Ser Phe Val Val Ala Glu Ile Trp Asn Ser Leu Ser Tyr Ser Gly
230 235 240
gac ggc aag ccg gcg ccc aac cag gac cag tgc cgg cag gag ctg ctg 884
Asp Gly Lys Pro Ala Pro Asn Gln Asp Gln Cys Arg Gln Glu Leu Leu
245 250 255
gac tgg acg cgg gcc gtc ggc ggg ccc gcc atg gcg ttc gac ttc ccc 932
Asp Trp Thr Arg Ala Val Gly Gly Pro Ala Met Ala Phe Asp Phe Pro
260 265 270 275
acc aag ggc ctg ctg cag gcg ggc gtg cag ggg gag ctg tgg cgg ctg 980
Thr Lys Gly Leu Leu Gln Ala Gly Val Gln Gly Glu Leu Trp Arg Leu
280 285 290
cgc gac agc tcc ggc aac gcg gcc ggc ctg atc ggg tgg gcg ccc gag 1028
Arg Asp Ser Ser Gly Asn Ala Ala Gly Leu Ile Gly Trp Ala Pro Glu
295 300 305
aag gcc gtc acc ttc gtc gac aac cat gac acc ggg tcg acg cag aag 1076
Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln Lys
310 315 320
ctc tgg ccg ttc cca tcc gac aag gtc atg cag ggc tac gcc tac atc 1124
Leu Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile
325 330 335
ctc acc cat cca gga gtc ccc tgc att ttc tac gac cac atg ttc gac 1172
Leu Thr His Pro Gly Val Pro Cys Ile Phe Tyr Asp His Met Phe Asp
340 345 350 355
tgg aac ctg aag cag gag ata tcc acg ctg tct gcc atc agg gcg cgg 1220
Trp Asn Leu Lys Gln Glu Ile Ser Thr Leu Ser Ala Ile Arg Ala Arg
360 365 370
aac ggc atc cgc gcc ggg agc aag ctg cgg atc ctc gtg gcg gac gcg 1268
Asn Gly Ile Arg Ala Gly Ser Lys Leu Arg Ile Leu Val Ala Asp Ala
375 380 385
gac gcg tac gtg gcc gtc gtc gac gag aag gtc atg gtg aag atc ggg 1316
Asp Ala Tyr Val Ala Val Val Asp Glu Lys Val Met Val Lys Ile Gly
390 395 400
aca agg tac ggc gtg agc agc gtg gtc ccg tcg gat ttc cac ccg gcg 1364
Thr Arg Tyr Gly Val Ser Ser Val Val Pro Ser Asp Phe His Pro Ala
405 410 415
gcg cac ggc aag gac tac tgc gtc tgg gag aaa gcg agc ctc cgc gtc 1412
Ala His Gly Lys Asp Tyr Cys Val Trp Glu Lys Ala Ser Leu Arg Val
420 425 430 435
ccg gcg ggg cgc cac ctc tagcagctca gattgctcag tcttgtgctg 1460
Pro Ala Gly Arg His Leu
440
cattgcaaac acagcagcac gacactgcat aacgtctttt ccttaatttc ctgaatttta 1520
ccttttccta gttcaatttc atatatgtat ttctacatgt acacactatc acaatcagat 1580
aaataaacaa gcttggtcaa aaaaaaaaaa aaaaaaaa 1618
<210> 31
<211> 441
<212> PRT
<213> 玉米(Zea mays)
<400> 31
Met Met Lys His Ser Ser Ser Leu Cys Leu Leu Phe Leu Leu Ala Leu
1 5 10 15
Cys Thr Thr Leu Leu Ala Cys Gly Leu Val Gln Ala Gln Val Leu Phe
20 25 30
Gln Gly Phe Asn Trp Glu Ser Cys Lys Gln Gln Gly Gly Trp Tyr Asn
35 40 45
Arg Leu Lys Ala Gln Val Asp Asp Ile Ala Lys Ala Gly Val Thr His
50 55 60
Val Trp Leu Pro Pro Pro Ser His Ser Val Ser Pro Gln Gly Tyr Met
65 70 75 80
Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr Ala Ala
85 90 95
Glu Leu Lys Ser Leu Ile Ala Ala Phe His Gly Arg Gly Val Gln Cys
100 105 110
Val Ala Asp Ile Val Ile Asn His Arg Cys Ala Glu Lys Lys Asp Ala
115 120 125
Arg Gly Val Tyr Cys Ile Phe Glu Gly Gly Thr Pro Asp Asp Arg Leu
130 135 140
Asp Trp Gly Pro Gly Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asp
145 150 155 160
Gly Thr Gly His Arg Asp Thr Gly Glu Gly Phe Ala Ala Ala Pro Asp
165 170 175
Ile Asp His Leu Asn Pro Arg Val Gln Arg Glu Leu Ser Ala Trp Leu
180 185 190
Asn Trp Leu Arg Ser Asp Ala Val Gly Phe Asp Gly Trp Arg Leu Asp
195 200 205
Phe Ala Lys Gly Tyr Ser Pro Ala Val Ala Arg Met Tyr Val Glu Ser
210 215 220
Thr Gly Pro Pro Ser Phe Val Val Ala Glu Ile Trp Asn Ser Leu Ser
225 230 235 240
Tyr Ser Gly Asp Gly Lys Pro Ala Pro Asn Gln Asp Gln Cys Arg Gln
245 250 255
Glu Leu Leu Asp Trp Thr Arg Ala Val Gly Gly Pro Ala Met Ala Phe
260 265 270
Asp Phe Pro Thr Lys Gly Leu Leu Gln Ala Gly Val Gln Gly Glu Leu
275 280 285
Trp Arg Leu Arg Asp Ser Ser Gly Asn Ala Ala Gly Leu Ile Gly Trp
290 295 300
Ala Pro Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser
305 310 315 320
Thr Gln Lys Leu Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr
325 330 335
Ala Tyr Ile Leu Thr His Pro Gly Val Pro Cys Ile Phe Tyr Asp His
340 345 350
Met Phe Asp Trp Asn Leu Lys Gln Glu Ile Ser Thr Leu Ser Ala Ile
355 360 365
Arg Ala Arg Asn Gly Ile Arg Ala Gly Ser Lys Leu Arg Ile Leu Val
370 375 380
Ala Asp Ala Asp Ala Tyr Val Ala Val Val Asp Glu Lys Val Met Val
385 390 395 400
Lys Ile Gly Thr Arg Tyr Gly Val Ser Ser Val Val Pro Ser Asp Phe
405 410 415
His Pro Ala Ala His Gly Lys Asp Tyr Cys Val Trp Glu Lys Ala Ser
420 425 430
Leu Arg Val Pro Ala Gly Arg His Leu
435 440
<210> 32
<211> 55
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (30)..(30)
<223> c (Gladius) 或a (Chris)
<400> 32
atcacattgc acaagttaat agtccggtam tgggtaatta cctttggact ttcca 55
<210> 33
<211> 61
<212> DNA
<213> 普通小麦(Triticum aestivum)
<220>
<221> 变型
<222> (27)..(27)
<223> a (Gladius) 或t (Chris)
<400> 33
tgtttctgct gcttgctctg cttatawaat gataatgata tgtgcgaatg gtctgttcat 60
g 61
<210> 34
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 侧翼标记扩增子
<400> 34
ggttttccct agtagtgtga ggrgaacgcc tcatcccact cgctc 45
<210> 35
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 侧翼标记007-0011.1扩增子
<400> 35
gtatatacta gtaaatcaat aaggtcgatr ctaaagatag aaaaatacct gaagtggtgc 60
c 61
<210> 36
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 扩增子
<400> 36
ggcctaaaat ttgagcccga aggttgrgcc gggcttgggc ttga 44
<210> 37
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 扩增子
<400> 37
tcattttgaa tttcaaaatt cggaaacgga awagctttct cgcatcccga ggcgaggcgg 60
ttacgggcgc cagaggggc 79
<210> 38
<211> 196
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 38
tgtcgccgtt cgaggttcgt ttctgcgtgc agtccggtcg aagaagccgg tgggttttga 60
gtactagtgg tagtagtagc agcagctatc gtttctgtcc gctcgtacgt gtttgcgtgg 120
tcgcggagaa caattaattg ggtgtttgcg agtcctctgg ttaagatgaa ccactgatgc 180
tatgtgatcg atcgat 196
<210> 39
<211> 228
<212> PRT
<213> 二穗短柄草(Brachypodium distachyon)
<400> 39
Met Glu Arg Ser His His Leu Leu Leu Val Leu Gly Leu Leu Ala Ala
1 5 10 15
Leu Leu Pro Ala Ala Ala Ala Thr Phe Gly Thr Thr Gln Pro Glu Pro
20 25 30
Gly Ala Pro Cys Glu Pro Thr Leu Leu Ala Thr Gln Val Ser Leu Phe
35 40 45
Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala
50 55 60
Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala
65 70 75 80
Glu Pro Gln Leu Val Met Ala Gly Leu Asn Ala Thr His Leu Leu Thr
85 90 95
Leu Tyr Thr Ser Cys Gly Gly Leu Arg Pro Gly Gly Ala His Leu Ala
100 105 110
Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ala Val Val Ser Ala Pro
115 120 125
Pro Pro Ser Ala Ala Pro Arg Arg Lys Gln Pro Ala His Glu Ala Pro
130 135 140
Pro Pro Pro Pro Ser Thr Glu Lys Pro Ser Pro Pro Pro Gln Gln Asp
145 150 155 160
Asn Val Thr Ala His Gly Lys Ala Ile Pro Thr His Ala Ala Thr Ser
165 170 175
Pro Leu Ala Pro Ala Ala Ser Met Ile His Met Ser Pro Pro Pro Ala
180 185 190
Cys Asn Pro Cys Ser Gly Ser Ala Ala Ser Ser Ala Glu Gly Pro Leu
195 200 205
Leu Ile Ala Ala Leu Leu Leu Val Ile Thr Ala Ile Ile Val Gly Thr
210 215 220
Leu Asp Asp Lys
225
<210> 40
<211> 228
<212> PRT
<213> 水稻(Oryza sativa)
<400> 40
Met Glu Arg Ser His Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala
1 5 10 15
Ala Gly Val Pro Ala Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln
20 25 30
Ala Ala Thr Ala Glu Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln
35 40 45
Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu
50 55 60
Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys
65 70 75 80
Arg Val Ala Ala Glu Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr
85 90 95
His Leu Leu Thr Leu Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly
100 105 110
Ala Arg Leu Ala Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ser Ile
115 120 125
Val Thr Ala Pro Pro Pro Pro Val Ala Phe Arg Arg Lys Pro Pro Ala
130 135 140
Arg Glu Ala Pro Pro Pro Pro Pro Ala Ala Glu Lys Leu Ser Pro Pro
145 150 155 160
Pro Gln Gln His Asp Asp Ser Asp His Asn Lys Arg Val Gly Pro Leu
165 170 175
Pro Arg Gly Ser Pro Pro Pro Tyr Ala Gln Ser Val Pro Val Gly Pro
180 185 190
Ala Ala Ala Pro Pro Pro Pro Arg Ser Gly Ala Ser Ser Ser Leu Gln
195 200 205
Ala Pro Leu Ala Ala Thr Thr Thr Ile Val Ala Ile Thr Leu Ile Ala
210 215 220
Ala Ala Gln Tyr
225
<210> 41
<211> 902
<212> DNA
<213> 多棱大麦(Hordeum vulgare)
<400> 41
cgcacatcaa cataaactca tcagatggga ataatcggat ctacgaagga cataaaactc 60
tttaatctca tgacaacgcc agaagagcaa gagtaaatat attctcataa aaaacaatga 120
acactagatg atgacgaaga acataagatt cttcaaggag aaattgcggc agcggagatg 180
gcagccggag gcgagggggc caaaaactct gttgcggcgg cagcggtagc cttggtgaaa 240
cccacacgtt tgcacaccat ataagttgtt tgcaagggtt acatgggcct cgctctcgtg 300
aaaaagaagg tcatacatgg gtcttggtct cgtgcaaaac gaaaggtcag cagtccatgg 360
gccggaggaa aaaccgggca acaacacgcc atgtgtgttt tcgcgggaac ccaattccga 420
aatcactcac cggcacctcg tcccgatgcc ttccagaacg ttctacgtgc ttccacaggg 480
ccagcccagc cgtgggatca gatcaggatc agcacgaaca ttgaagctag cgcggcgata 540
tttttcccag cctccgcctc gctcgacgac tgcatttcat ttcgaaaaca aaaaaaagag 600
ctttctcctt ctcatcccga gcgccagagg agcaccagaa aggccaccca cccaccctca 660
cgtaccgccc tcgcacccgc gcggccacat ctgggccgtc cacttgggca gctggccgtt 720
ccattcccga actgacgggc aggatcgagc gagcggcgcg cccacggctc ctccggctat 780
ataacccgcc acccacacca ctcccctccg gcgttccacc agagccttcc tccctccacc 840
gcaccaccac caccaccgcg ccaaaaaccc tagggagcga gcgagctcac ctcgccccgc 900
cc 902
<210> 42
<211> 4504
<212> DNA
<213> 水稻(Oryza sativa)
<220>
<221> 外显子
<222> (1001)..(1363)
<220>
<221> 外显子
<222> (3093)..(3164)
<220>
<221> 外显子
<222> (3253)..(3505)
<400> 42
gaacagtgca ctggttggga taacaagaag ttagaaattg ggcatatata tagaagggta 60
agacacctct aatggatagg gtggacaatc catcaaagat gactattttg gcacctctga 120
ggccgtgaca agttgcctat cttcgcaccc ttcacaagtg actccctact tgtgatgggt 180
cgtgagatgt gagccggtga tctttctcag atgtaaattt cggcctctca caagtgactc 240
cttatctgtg ataggtcttg ccctcacagc ctcatctgta acggcctcta attcaatccg 300
ttacagatta aatcattcat gacaagacac tttgacccat cataggtggg ttgttaatgt 360
tgaaccgagg tagcgtggtg gtggcttctt tgattgttga gcgggttgtg ttcttcatca 420
cttggtagga agtaggaacc caagaaggtt agaagcccac aactattata tcgtcggcct 480
cattggtaaa tgggctagaa gcctagaggc aatctgattc aatagtgtcg gaaatttgtg 540
gatgggccag agacgttgcg tcgtcttcga ctcttcgagt gcctggccta cggatctgca 600
cgaatcttag agcaagtaga aaatcgcata tcgtcgtgta gagcgcagca caaattcgag 660
ttgcttttcc ctttttcgca gccaaatctt acctgctcac gtgccgtgct gcccggtgtg 720
cagagcccac gcgccacggc gccagtgtac tacaccgaat cggcaccatc catcgccaca 780
gctggccggt cccccctaag acggacgctc cggatcaatc cacgttggca tggcttcccc 840
gcatcgcctt ctccgcgccc ccgcctatat aatggcgctc tcgcttctct tccccatttc 900
gtcttcccct tctctagagc cttcctctca cagagcacac acaaaaccct agagtaggaa 960
gcgagcgaga gagagagaga gagagagaga gaccacaccc atg gag cgc tcc cac 1015
Met Glu Arg Ser His
1 5
ctc gcc gtc ctg ctc ggc ctc ctc gcc ttc gcc gcc ggg gtc ccg gcc 1063
Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala Ala Gly Val Pro Ala
10 15 20
gca gcg gcg gcc acc gcc gtg gag gga gcg cag gcg gcc acg gcg gag 1111
Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln Ala Ala Thr Ala Glu
25 30 35
gcg tcg tgc gag ccc tcc atc ctc gcc acc cag gtc tcg ctc ttc tgc 1159
Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln Val Ser Leu Phe Cys
40 45 50
gcg ccc gac atg ccc acc gcg cag tgc tgc gag ccg gtg gtg gcc tcc 1207
Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala Ser
55 60 65
gtc gac ctc ggc ggc ggc gta ccc tgc ctc tgc cgc gtc gcc gcc gag 1255
Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala Glu
70 75 80 85
ccg cag ctc atc atc tcc ggc ctc aac gcc acc cac ctc ctc acg ctg 1303
Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr His Leu Leu Thr Leu
90 95 100
tac gcc gcc tgc gga ggc ctc cgc cct gga ggc gct cgc ctc gcc gcc 1351
Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly Ala Arg Leu Ala Ala
105 110 115
gcc tgt gaa ggt acgtacatgc ataacctcct cctcctcctc ctcctctctc 1403
Ala Cys Glu Gly
120
tctctctctc tctctctctc tctctctctc tctctctctc tctctctctc tctctctctc 1463
tctctctctc tctctctctc tctctctctc tctctctctc tctcggttgg ggttgctgcc 1523
ttgcgttttt ggttggtttt tcgtgggttg ggcgagatcc ttcgagttgc ttgtgttttg 1583
tggtatgcta ggcttcgaac gagttgccgg cgttgctgtg tcgaccaact ctcgtatgct 1643
tatctttcag cacatgagtt ttggcctcgt ttttactcgg ttgttgtatg ctacttctga 1703
gatttgagtt catccactgc taaactgaca tcatagatga agaatagcag cggcgtttgg 1763
tcgattttga ttcctttctc tggatgttcg agctgatctt gtggttattg ctcgaagcct 1823
cgaaacgctt gcgcacatgc aagatccagc aacgtataga tctatagtgg tgttgtgctt 1883
ttattcggat ttgtggttca gtgtttacgt gcgaagtcac gcgttcgatg tttccgcttg 1943
agctccatat ctatagcaca aatcaatcat gtgcgttgcg cgagttcaag ctcgagagaa 2003
aagaaaagca tcaaggccac ggggggtttt tgggccaggt cgtgattctc ccttgaactc 2063
cgaatatacc gagtttatta tcttttgagc ggatttggtg ttgaactggc aggactcaaa 2123
acccacccgt gggacgatcg ttttcttttc ctttcgcttt gtgttctctg tctcctttcc 2183
gtgaaatctc tgcgtttccc ttctggtgct tgttatagat gattctggat cgagccgtgt 2243
atgctcgtgc agtggtacga cttggcgatg aacgtgcttg cggagctagt cgcagttcat 2303
ctttcttttt tttttccctc gtttcttttc tcggcgtttc attctctaca cctcttctac 2363
tcgccatgca tgttcatctc tctccgtgtt ggtcctcatt tggagccgat tcgaaccggg 2423
cagcacagtg ctttttttct gtttcgtttt ggaggtttcc actttcgtga aaaggaaagg 2483
gtcaaatcga atcgccccct gaaccatcct ttgcagagct tttttggacg tttccgcctt 2543
tcgtcagaga ccatctgcac tgcgcgtttc tccccaactc gatcgatttt gcagctttta 2603
atcacttttt agaaaaagtt tttaatcact cgtcatcgat gtgatctctt gctctaattg 2663
catcttctcc gtaggattag cacttccatg cttcttgttt tgtctgttca attagccaag 2723
aaacgagtca gtataccttc aagatgcatg cagatttaaa atcggcactg ctctttatct 2783
tgttcttgtt tttgcaagtt ttggttggtt caaaacttat ctcttctgca gcattgcctg 2843
ctgtgtacag aaagttggca ggggcatcgt gcagcttttt tgcctgctgt gtgtaacgtt 2903
ttctttccgt acgttgcgtt ccgtttcacg tcgcttacct ctgtttcttg gggcgcaagt 2963
tatggcagta cagccgttgt ttccacgttg gaaggacggt tttgcccctt cgcttccaga 3023
agcttccaga gatttttcga gtttttctaa tgtgtttgtt attgctgtaa ctcgttctaa 3083
cgtgcaggt ccc gcc cca ccg gcc tcc atc gtc act gcc ccg ccg ccc ccg 3134
Pro Ala Pro Pro Ala Ser Ile Val Thr Ala Pro Pro Pro Pro
125 130 135
gtt gct ttt cgc cgc aag ccg ccg gca cgt aaggctgatt gattcccctt 3184
Val Ala Phe Arg Arg Lys Pro Pro Ala Arg
140 145
catccactga ttgttaatgc gcgtgtaatc tttgtgatta ctaacttgct gctggatgct 3244
ttgcaggc gag gca cct ccc cca ccg ccg gcg gcc gag aag ctc tcc ccg 3294
Glu Ala Pro Pro Pro Pro Pro Ala Ala Glu Lys Leu Ser Pro
150 155
ccg cct cag cag cac gac gac tcc gac cac aac aag cgc gtc ggc cca 3342
Pro Pro Gln Gln His Asp Asp Ser Asp His Asn Lys Arg Val Gly Pro
160 165 170 175
ctc ccg aga ggc tct cct ccc ccg tat gcc cag tcc gtc ccg gtc ggc 3390
Leu Pro Arg Gly Ser Pro Pro Pro Tyr Ala Gln Ser Val Pro Val Gly
180 185 190
ccc gcc gcc gct ccc ccg cca cca cgc tcc ggc gcc tcc tcg tcg ctc 3438
Pro Ala Ala Ala Pro Pro Pro Pro Arg Ser Gly Ala Ser Ser Ser Leu
195 200 205
cag gcg ccc ctc gcc gcc acc acc acc atc gtt gcc atc acc ctc atc 3486
Gln Ala Pro Leu Ala Ala Thr Thr Thr Ile Val Ala Ile Thr Leu Ile
210 215 220
gcc gcc gcc cag tac tga g gacacgccgc cgccggcgcc cgctccccag 3535
Ala Ala Ala Gln Tyr
225
agccatgatt cgttcgcagt atttttcatc ctgttctttt gcttctctct ctggctaccc 3595
atgtatatga gtttggaaga cgatgatttg atctagtagc gcgttaccaa gtttgcctag 3655
attcgagtag tagctgtggt actatgctga tgtctctttg atcgcgtcgt ctctagagcg 3715
tccgccgttt ttgatcgatc actagcatgg ccgatgtgag tccagcatga aaagtggtcg 3775
aggagaacat tgttgctaag tttttttttt gctttctatc tccagtagct gaacaagtat 3835
gtcaactgaa tgctgcaatg aagtgaatgg atgcagtctt aaatttagcc tttctgttgc 3895
caacttcttc ctctgttctg tacggttcag atgctgcttg ttctgtttat gcgatggtgt 3955
tgcattgttg tgatgtgtga agtgcgccca attctgggtg aactctgcag tattggcaag 4015
ctctgatcga tacataaaga actgaaatgt gccggcttct ccgcctcccg ttgcatgctc 4075
ttgtgcgcga gctgcacagc gcaaccgcgc cctcctctgc acatccatcg acacaaagtc 4135
tcaagttgtt gcgcgtgtgc tctaccaggc accgtggctc ctgcgggcgt gcacgggtca 4195
cattcacatc gcacccaagt tgcggacgtt tcagctgagc acctaccatc cgcaatgttt 4255
gcccacagct tgctcgatga aatgactggt tcatgtcaaa aggtaaaaac tgacattctc 4315
acgcggtaaa ttcccctaag cttcatagac caccgcactg tcatccactc gacctgccac 4375
gacacccgcc accgcagaac gcgacaccct gtgcccacgg ccacctaccc tggcacgcac 4435
cgagccgaag ccggataagc acccgagttg atccccatga gacgtggcga ctcggctgcc 4495
ctctgccac 4504
<210> 43
<211> 684
<212> DNA
<213> 水稻(Oryza sativa)
<400> 43
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtcccgccc caccggcctc catcgtcact gccccgccgc ccccggttgc ttttcgccgc 420
aagccgccgg cacgcgaggc acctccccca ccgccggcgg ccgagaagct ctccccgccg 480
cctcagcagc acgacgactc cgaccacaac aagcgcgtcg gcccactccc gagaggctct 540
cctcccccgt atgcccagtc cgtcccggtc ggccccgccg ccgctccccc gccaccacgc 600
tccggcgcct cctcgtcgct ccaggcgccc ctcgccgcca ccaccaccat cgttgccatc 660
accctcatcg ccgccgccca gtac 684
<210> 44
<211> 5291
<212> DNA
<213> 二穗短柄草(Brachypodium distachyon)
<220>
<221> 外显子
<222> (2069)..(2419)
<220>
<221> 外显子
<222> (3818)..(3887)
<220>
<221> 外显子
<222> (4026)..(4288)
<400> 44
cccttaaaag ggggtaatga tggctcatat tgaggaattg acatgcaccc cttaaaggag 60
gtaatgatgg ctcatattga tttgaggaaa ctccttccat aaggacatct ccaacaagac 120
acagtcagcg gtactataaa gcacggcacc tggatcagtt ctcgtcgagg gtgcagacga 180
cgattgcagt gaatatgatg actatcgcgg cgacgaggag ggggggcagt ggggacggct 240
gaggtgcatc ctctgccaaa ttaaagcacg cgcgcgtgcc acgcgagtca gatcaaggac 300
acgcaaaaca gataacatat taacaggaag caacgcatag atttttagaa tcgagtaaaa 360
gaatagcagc agcatttttt ttagcgaaat agtagcagca attagatcaa gcgaaatgta 420
aaggttgttc acataccaac aagggcggcg gtgtggggcg ggacattgac ctccggggcc 480
tcctccaggg cctgcggcgc ctgctgggcc tcgacaaatg cagtcaggct gcaagatatg 540
agggtaaaaa aacagatgta cagtccggtc aagaaaaaca acaaacatgc agactactta 600
gatctgccaa gactaaatta cctaacgatt ccaagtccag tgatggttgc atcgcgatga 660
atttcagcca tgctgcgtgc ccgcctggtt accggacgcg cgggaagggg agcaagccca 720
atcagagcgg gtgcagccgg gcggcgtgtg ttattgcgat aatactcgac ggtatgcttc 780
caccgcaggt acagtctcag gaaggcatcc gattgaccca ccagatcatc tatcaccaag 840
gtagccattc tgccacccat ctaaacacaa actgagagta agaaagcagt ttgaccgcga 900
ttgtttatca caaaaggcaa cacaaaaaaa ctgctagctt cgtgtcagaa aatcaacatg 960
catggtgcgc gacagtacaa cagaaacatg gggagacata gcagaaacgt ccaaaccaaa 1020
aatccaaaaa aagaaggaga tgcactgcgt aagaaaacag cacgggaagc gctcttcacc 1080
gtgtgagact gcacaagtcc aagagacgac aatagcagaa aagaactgca gaaaggagag 1140
ctgctttcgg gggtcaaagt actagcacgg cttcgatcaa tcggtcgatt aaatccctcg 1200
tgccaccgag atcctcacag tgctcgaggg gacactctaa gtcggctttg tcacatccaa 1260
cccaaacaac acgctcttgt ctaaggtgct caacaaaggt gatgtgttcg cacgcaggca 1320
cagtggaaca acaaactagc gtcgatcgac cacgtccctc ccccagaaaa gtgctcccaa 1380
catgatcgca tcgaagtaat cgtagagata gatcttacag aataaaaaat aaacccaaac 1440
caaaggagga gttctgcact actagatccg aaccaaagcc aggaaatagc aaactaaaca 1500
caaaagatat cgatgaaatc atacatcgtc caaacgtttc ggattacacc ttctggtcgc 1560
aactctcgtg ctcaccgcgc agacagatct tctgtacgta ccttggctcc agcccgagga 1620
gagcgagcac tccaggaaac ggcggtctcg agcgagcagt ctaggaaatg gcggtcgcga 1680
tggaaaagcc ttcaagagat atcgggtgat gccccctatt tctagagctc tggcctttac 1740
agttcaccac ttcaccctgc gccatcccga ttcccagtac ctatgacgag cgacgaccct 1800
cacgtgcctg gccagcatca cgggagagaa tcttgctcag catctcaacc gcccaaacag 1860
acagctgtcc ggtcccaccc aaatggacgc acaggatcga tcgggccgcc ggtggcctgt 1920
ccttggctaa cccttcacgc ctcttcgtcc cctccgccta tataatccca ccccgctccg 1980
cttcttcccc caccgcgctc tcttcctctg gactcacacc aactcgccta gccctagcgg 2040
taggaagcga aagcgagaga tcccaccc atg gag aga tcc cac cac ctc ctc 2092
Met Glu Arg Ser His His Leu Leu
1 5
ctc gtg ctc ggc ctc ctc gcc gcg ctg ctc ccg gcg gcc gcg gct acc 2140
Leu Val Leu Gly Leu Leu Ala Ala Leu Leu Pro Ala Ala Ala Ala Thr
10 15 20
ttc ggg acg acg cag ccg gag cct ggg gcc cca tgc gag ccc acc ctc 2188
Phe Gly Thr Thr Gln Pro Glu Pro Gly Ala Pro Cys Glu Pro Thr Leu
25 30 35 40
ctc gcc acc cag gtc tcg ctc ttc tgc gcg ccg gac atg ccg acc gcg 2236
Leu Ala Thr Gln Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala
45 50 55
cag tgc tgc gag cct gtg gtg gcc tcc gtc gac ctc ggg ggt ggc gtc 2284
Gln Cys Cys Glu Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val
60 65 70
ccc tgc ctc tgc cgt gtc gcc gcc gag ccg cag ctc gtc atg gcc ggc 2332
Pro Cys Leu Cys Arg Val Ala Ala Glu Pro Gln Leu Val Met Ala Gly
75 80 85
ctc aac gcc acc cac ctc ctc acg ctc tac acc tcc tgc ggt gga ctc 2380
Leu Asn Ala Thr His Leu Leu Thr Leu Tyr Thr Ser Cys Gly Gly Leu
90 95 100
cgc ccc gga ggc gcc cac ctc gcc gcc gcc tgt gaa ggt acgcgacgcc 2429
Arg Pro Gly Gly Ala His Leu Ala Ala Ala Cys Glu Gly
105 110 115
tgcgtctctc tctctctctg cgtctctctc tgcgtctctc ccatgacgag caactcgcga 2489
tacgccttac tgccttattt tttttgaaga tatgtgtctg cttggtccac tgtatttggg 2549
ttcttctttc gagaagttca tccgtaggca tctataatcc gacgagttcg gatgagatca 2609
aacagtgaca cgcgcgacac caacgttttc aacgatctct tgctgtttgg tttgatattt 2669
cctgcttccc atgatctatt ttcaaccttt tttgtatggc tttcgctcca atctcgtgca 2729
gaaccatatt tcatcttggg tttatgctgt tctgtaagat ctagcgccat gcagaggtca 2789
tttctgctgt tccagacccc ctacgtgaca tttgctgttt ttcctctttg ttgccatggc 2849
cacgggttgg tttttacgaa agatactttg atatgtcaag atctgcgagc actttgaaac 2909
cccaacgcat tttctatgtg ttttgtgctg tttgatcgac cgattgatcg aggccgtgct 2969
agtactttga cacccgaaag catctctcct ttctgcagta tcttttctgt tcttgtcgtc 3029
tcttgggctt gtgcagttta ccatggtgaa gagcgcttca tacacgatct gccgcgaggc 3089
cagagcaaaa gcttcccgtg ctttttcttg cacagtgcat ctccttcttt tttgcctttt 3149
tcgtttggac gtttctgctt cgtctcccca tgtttctgtt gtactgtcgc gcaccatgca 3209
tgttgatttt ctgatacgaa gctagtactg ctctgcagtt tttgtgtagc cttcctcttt 3269
cgtgataaag aacgtggtca aactgctctc tgactctgtt cgtctaaatc tttttctcgc 3329
aggaaaattt tcgttgcaga tctcctttac cctcgtcctc cgcatctgtt tgctttacct 3389
gctgtagttg cgttcttcgt ttgaatcaaa ttcttgtttc cttcttttat cccatcgctc 3449
gtttagttac cttttctttt tattgaactt tagttcattg gtgtagtagg cagtagtatg 3509
ctttgcgttg tttgcggagt agcaattgaa ttgctctccg gtctctgcag agcggcccgc 3569
tgaacagata gctggctgca gcagctttac cagaatcggt cggttacgaa cttacgatta 3629
tacccttcgt cttgctttca tttactggta gcctgctagt cttttcttgt tgcgcacgta 3689
atcgtaccca gtactgtacg cttagataaa atagacgggt ctggccttaa attatttcgt 3749
tgcgttttcg aattttgaat tccggaagtt aactttattt tgtgctctgt ttggacgcat 3809
gtgcaggt cca gct cct ccc gcc gcc gtc gtc agt gcc cct ccc ccc tcc 3859
Pro Ala Pro Pro Ala Ala Val Val Ser Ala Pro Pro Pro Ser
120 125 130
gcc gca cct cgc cgc aag cag cca gca c gtacgaacaa ccttttacac 3907
Ala Ala Pro Arg Arg Lys Gln Pro Ala
135 140
ttcgcttgat ctaattgctg ctgctatact ctcttactcg attctaaatc tatgttttgc 3967
tcattattaa tatgttgatc tgactcgtgt ggcacgcgcg cgtgctttga tttcgcag 4025
ac gag gca cct ccg cct ccg ccg tcg act gag aag ccg tcc ccg ccg 4072
His Glu Ala Pro Pro Pro Pro Pro Ser Thr Glu Lys Pro Ser Pro Pro
145 150 155
cct cag cag gac aac gtc acc gcc cac ggc aag gca atc ccc acc cat 4120
Pro Gln Gln Asp Asn Val Thr Ala His Gly Lys Ala Ile Pro Thr His
160 165 170
gcg gcc aca tcc ccg ctc gcg ccg gct gct tcc atg atc cac atg tcc 4168
Ala Ala Thr Ser Pro Leu Ala Pro Ala Ala Ser Met Ile His Met Ser
175 180 185
cca ccg ccc gca tgc aat cca tgc tcc ggc tcc gcc gct tcc tca gcc 4216
Pro Pro Pro Ala Cys Asn Pro Cys Ser Gly Ser Ala Ala Ser Ser Ala
190 195 200
gag ggg ccc ctc ctc atc gcc gcg ctc ctc ctc gtc atc acc gcc atc 4264
Glu Gly Pro Leu Leu Ile Ala Ala Leu Leu Leu Val Ile Thr Ala Ile
205 210 215 220
atc gtc ggc acc ctc gac gat aag tgatccagga gccgtccgcc ccctccgact 4318
Ile Val Gly Thr Leu Asp Asp Lys
225
caccaacgtc cgactatgat ccagttgcag tagtggtctt gttctgtttc atgtttctcg 4378
ccatttggtt ccgagatttc tatatcgtgc ctagtcgtag ctgtagcagt cagtatgttc 4438
atgtgtccac aagatgtggt cgagtataac attgggtttc atgattcctc tagcagatga 4498
aacactatgt gatgtgatct gaatggatgc agttttgcta ccttttctgc tgctatgata 4558
tgcttatcca tatgtttatc tttcattccc ttaatttgtg cggtttagcg ttgtgttgcc 4618
atgaatgcct cttgctctgc tttgcgggtt gcattttgtc ttcgttctgc tgtatatttg 4678
attctgaatt tgcatgctgt gagtactaag tactgactac aatctctgga tggttttgaa 4738
atttgaatga tgttataaag gagagctagc tggggaattg cctcacctct aaactccaaa 4798
acacagagca gaagttggcc tcaagatcca acttggtcac tttgcatgtc ggagcattgt 4858
agcaattctg caataaacgg agtagttctg ttagcatgtt gtttttacac tgtcagtaca 4918
agtagaggtc gatgattaat tatattccgg ttgtttgctg ctggcttccc agttccctcc 4978
aggtaggaag gaaccgtatc cgggtagtag ccagtagtag ccaggaagct actagcagaa 5038
cagtcttctg gtgctctttt tttggagtaa cgtcttctcg cgatcttttt cgagtaattc 5098
aaatccgggt ataccgagcc ttgtatcagt gagagccgat agtcttaatt atctccagca 5158
caggcacagg aacaaccacg tttgtttttc agaatgcaca gcaacatttt ttttaagagc 5218
atggcacagc tacttttttt ttttttaagg aaacatggca cagctacatt tttttttaga 5278
ggaacatggc aca 5291
<210> 45
<211> 684
<212> DNA
<213> 二穗短柄草(Brachypodium distachyon)
<400> 45
atggagagat cccaccacct cctcctcgtg ctcggcctcc tcgccgcgct gctcccggcg 60
gccgcggcta ccttcgggac gacgcagccg gagcctgggg ccccatgcga gcccaccctc 120
ctcgccaccc aggtctcgct cttctgcgcg ccggacatgc cgaccgcgca gtgctgcgag 180
cctgtggtgg cctccgtcga cctcgggggt ggcgtcccct gcctctgccg tgtcgccgcc 240
gagccgcagc tcgtcatggc cggcctcaac gccacccacc tcctcacgct ctacacctcc 300
tgcggtggac tccgccccgg aggcgcccac ctcgccgccg cctgtgaagg tccagctcct 360
cccgccgccg tcgtcagtgc ccctcccccc tccgccgcac ctcgccgcaa gcagccagca 420
cacgaggcac ctccgcctcc gccgtcgact gagaagccgt ccccgccgcc tcagcaggac 480
aacgtcaccg cccacggcaa ggcaatcccc acccatgcgg ccacatcccc gctcgcgccg 540
gctgcttcca tgatccacat gtccccaccg cccgcatgca atccatgctc cggctccgcc 600
gcttcctcag ccgaggggcc cctcctcatc gccgcgctcc tcctcgtcat caccgccatc 660
atcgtcggca ccctcgacga taag 684
<210> 46
<211> 951
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 46
tcgcgcgccg accccgcgag agaccgtggt ccgtccagtc gcagtagagt agagcgctcg 60
tcgtctcgtt ccgtttcgtg cctgtcgccg ttcgaggttc gtttctgcgt gcagtccggt 120
cgaagaagcc ggtgggtttt gagtactagt ggtagtagta gcagcagcta tcgtttctgt 180
ccgctcgtac gtgtttgcgt ggtcgcggag aacaattaat tgggtgtttg cgagtcctct 240
ggttaagatg aaccactgat gctatgtgat cgatcgatcg gtatgatctg aatggaaatg 300
gatcaagttt tgcgttctgc tgatgatgtg atccatttgg atctgtgtgg ggcaacagtt 360
tcgcttgctt ttgctctgcg atgaacgaat gcttcttgca tgcatcttgt ctttgcttaa 420
tttgaactgt agaacggatg cagtactgat ttctgcttat gatgtgacga ttcgtcgtac 480
gcatatcatc tcttcaaatt tgtgtagcag ctgtttgtag cttccattct gctatggacg 540
aatgcctgtt tttcacggag aaccgcgcgc ggggaccgat gcggctttgt gttgccatgt 600
tgttttccac gccaggacaa aatagatggt gcggttttga tccccaatcc caccatcacc 660
atgttccgga gagccacatg gaactcacgt caagcggtca ctttttgcag aatcactctt 720
accattttac ccttttgttg aaacctctct cctcatcccc aaaagttgat gcaacagtgc 780
tatgcgcgcc cacccatgct ttttcatatg attgtaaaat ttggatcgat tttatctttt 840
gaaccctaag tccggtttac aatctgtttg catgtttatg ttccttgcgg cgaggaccat 900
taaacaagac tactattgga tatatttcga caggctttga aatccgaatt c 951
<210> 47
<211> 1000
<212> DNA
<213> 多棱大麦(Hordeum vulgare)
<400> 47
tggccgaccc ccaaggcagc agagtacttg tcatctgatt ccgtttcatg cttgtcgccg 60
tttgttgagg ttcgtttctg cagtccgaac aagacggtgg ggttttgatc gggtacccag 120
atttctatgt cgatcgcgcg tactagtact agtagttgct tagcagatga acgaacattg 180
ggttttggga ttcctctagc tgatgaacca ctgctatttt ccatgtgatc gatggatatg 240
atctgaatgg atggatgaag ttttggtttc tgatgctgat gatgtgctgc ttcttcattt 300
gcatgctcga tctattcctt caattttgtg gagcaacagt ttgtttagct tctgttctgc 360
tatgaataat gccgcttgca tcttgtcatt gctgataatc tgcttaatgc agacattgct 420
tccgtcccaa acaatctgtt gcttaccagg taatgcatat aatctgtacc tcaccttcgc 480
acaacaacag aagctaccct gctaaaaaaa cacacacaca cacacaaaaa aaacagaagc 540
tggtctcaca cggaagccgc ttcggggact gtttgcagct ttttattgcc attttgtttt 600
tcatgcaggt acaaatcgag ggtgttgctt gatttgatca tggatgatca cttagagcaa 660
catgtgtgtt ttgtctgtgt tttattcgtt gctcgtccat ccaatttaaa cttgaaatgg 720
atcgtgtgtg gataaaagaa gacgtgcgtc agtttgaatc gacgcgttgg gttatatttt 780
gtgtctgtga cgaccgaaac gaagacaaaa tatatcgtcc ggttagaatt gctctaatgc 840
tagctttctc tcctaccatc gcattccgtg gtaggaaaaa gtactagaac cacaggaaac 900
tggaacgcaa gaaaagcata tctaccgttg gccgttgatc ttgtttcaca ttcggtatgg 960
ctccggtcat attgttggag attcacattc atgcacgcaa 1000
<210> 48
<211> 54
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 48
cctgcgaagg tacgttgtag ccccccgccc ccgcgcccag tgctgcgagc ccgt 54
<210> 49
<211> 54
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 49
cctgcgaaga tacgttgtag ccccccgccc ccgcgcccag tgctgcgagc ccgt 54
<210> 50
<211> 53
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 50
cctgcgaagg tacgttgtag ccccccaccc cgcgcccagt gctgcgagcc cgt 53
<210> 51
<211> 54
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 51
cctgcgaagg tacgttgtag ccccccgccc ccgcgcccag tgctacgagc ccgt 54

Claims (43)

1.一种表达盒,所述表达盒包含可操作地连接至异源启动子的第一多核苷酸,其中所述多核苷酸由选自以下的核苷酸序列所示:
(a) SEQ ID NO:4、7或9的核苷酸序列;和
(b) 编码SEQ ID NO:5或40的氨基酸序列的核苷酸序列。
2.根据权利要求1所述的表达盒,其中所述表达盒包含由选自以下的核苷酸序列所示的第一多核苷酸:
(a) SEQ ID NO:4的核苷酸序列;和
(b) 编码SEQ ID NO:5或40的氨基酸序列的核苷酸序列。
3.根据权利要求1或2所述的表达盒,其中所述异源启动子为组成型启动子、诱导型启动子、组织优选的启动子、组织特异性启动子或生长期优选的启动子。
4.根据权利要求3所述的表达盒,其中所述异源启动子是雄性组织优选的启动子。
5.根据权利要求1至4中任一项所述的表达盒,所述表达盒还包含可操作地连接至第二启动子的第二多核苷酸,所述第二启动子驱动植物中的表达。
6.根据权利要求5所述的表达盒,其中所述第二多核苷酸编码干扰雄性配子的功能、形成或传播的多核苷酸或多肽。
7.根据权利要求6所述的表达盒,其中所述第二多核苷酸编码芽孢杆菌RNA酶、DAM-甲基化酶、淀粉酶或ADP核糖基化酶。
8.根据权利要求5至7中任一项所述的表达盒,所述表达盒还包含可操作地连接至启动子的第三多核苷酸,其中所述第三多核苷酸编码标记基因产物。
9.根据权利要求8所述的表达盒,其中所述标记基因产物包括抗生素抗性标记基因产物或可视标记基因产物。
10.一种分离的多肽,所述分离的多肽由选自SEQ ID NO:5或40的氨基酸序列所示。
11.根据权利要求10所述的分离的多肽,所述分离的多肽由SEQ ID NO:5的氨基酸序列所示。
12.一种载体,所述载体包含权利要求1至9中任一项所述的表达盒。
13.一种制备植物细胞的方法,所述植物细胞包含根据权利要求1至2中任一项所述的表达盒,所述方法包括将所述表达盒掺入所述植物细胞。
14.一种制备植物细胞的方法,所述植物细胞包含根据权利要求5至9中任一项所述的表达盒,所述方法包括将所述表达盒掺入所述植物细胞。
15.根据权利要求13至14中任一项所述的方法,其中所述植物细胞来自单子叶植物或双子叶植物。
16.根据权利要求13所述的方法,其中所述植物是玉米、大麦、粟、小麦、稻、高粱、裸麦、大豆、卡诺拉油菜、苜蓿、向日葵、红花、甘蔗、烟草、拟南芥或棉花。
17.一种制备植物的方法,所述植物包含根据权利要求13至16中任一项所述的植物细胞,所述方法包括从所述植物细胞生长出所述植物。
18.根据权利要求17所述的方法,其中当与对照植物比较时,所述植物的雄性能育性受到调节。
19.根据权利要求18所述的方法,其中当与对照植物比较时,所述植物具有增强的雄性能育性。
20.根据权利要求17至19中任一项所述的方法,其中所述多核苷酸的表达赋予雄性不育植物雄性能育性。
21.根据权利要求17至20中任一项所述的方法,其中所述植物是雌性能育植物。
22.根据权利要求17至21中任一项所述的方法,其中当与对照植物比较时,所述植物的至少一种雄性组织的形成受到调节。
23.根据权利要求22所述的方法,其中所述雄性组织包括雄蕊、花粉囊、花丝或花粉。
24.根据权利要求22或23所述的方法,其中至少一种雄性组织的所述受到调节的形成包括至少一种雄性组织的形成增加。
25.根据权利要求17至24中任一项所述的方法,其中所述第一多核苷酸被稳定地掺入所述植物的基因组中。
26.一种制备根据权利要求19至25中任一项所述的植物的种子的方法,其中所述种子包含所述异源第一多核苷酸。
27.一种用于增加植物中的多肽的活性和/或水平的方法,所述方法包括向所述植物提供根据权利要求10或权利要求11所述的多肽。
28.一种增加植物中的多肽的活性和/或水平的方法,所述方法包括向所述植物中引入可操作地连接至在所述植物中有活性的启动子的多核苷酸,所述多核苷酸由选自以下的核苷酸序列所示:
(a) SEQ ID NO:4、7或9的核苷酸序列;和
(b) 编码SEQ ID NO:5或40的氨基酸序列的核苷酸序列。
29.根据权利要求28所述的方法,其中所述多核苷酸由SEQ ID NO:4、7或9的核苷酸序列所示。
30.根据权利要求28至29中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节所述植物中的雄性能育性。
31.根据权利要求30所述的方法,其中当与对照植物比较时,所述多核苷酸的表达增强所述植物中的雄性能育性。
32.根据权利要求28至31中任一项所述的方法,其中所述多核苷酸的表达赋予雄性不育植物雄性能育性。
33.根据权利要求28至32中任一项所述的方法,其中所述植物是雌性能育植物。
34.根据权利要求28至33中任一项所述的方法,其中所述启动子是组成型启动子、诱导型启动子、组织优选的启动子、组织特异性启动子或生长期优选的启动子。
35.根据权利要求34所述的方法,其中所述启动子是雄性组织优选的启动子。
36.根据权利要求28至35中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节至少一种雄性组织的形成。
37.根据权利要求36所述的方法,其中所述雄性组织包括雄蕊、花粉囊、花丝或花粉。
38.根据权利要求36或37所述的方法,其中至少一种雄性组织的所述受到调节的形成包括至少一种雄性组织的形成增加。
39.一种用于繁殖雄性不育植物的方法,所述方法包括用保持系植物对所述雄性不育植物授粉,其中所述保持系植物包含DNA构建体,所述DNA构建体包括
(a) 将恢复雄性能育性的第一核苷酸构建体;
(b) 抑制所述保持系植物的雄性配子的形成、功能或传播的第二核苷酸构建体,
其中所述保持系植物的所述第一核苷酸构建体包含由SEQ ID NO:4、7或9所示的多核苷酸。
40.根据权利要求39所述的方法,其中所述雄性不育植物对于ms1是纯合的。
41.根据权利要求40所述的方法,其中所述保持系植物的DNA构建体还包含编码种子颜色标记的多核苷酸。
42.一种产生杂交子代的方法,其中通过根据权利要求40所述的方法产生的植物由携带Ms1等位基因的近交植物授粉。
43.根据权利要求42所述的方法,其中所述植物是小麦。
CN201580051730.7A 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法 Active CN107072165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110503141.5A CN113136390A (zh) 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462056365P 2014-09-26 2014-09-26
US62/056,365 2014-09-26
US201562187591P 2015-07-01 2015-07-01
US62/187,591 2015-07-01
PCT/US2015/051214 WO2016048891A1 (en) 2014-09-26 2015-09-21 Wheat ms1 polynucleotides, polypeptides, and mehtods of use

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110503141.5A Division CN113136390A (zh) 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法

Publications (2)

Publication Number Publication Date
CN107072165A CN107072165A (zh) 2017-08-18
CN107072165B true CN107072165B (zh) 2021-05-28

Family

ID=54252407

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580051730.7A Active CN107072165B (zh) 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法
CN202110503141.5A Pending CN113136390A (zh) 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110503141.5A Pending CN113136390A (zh) 2014-09-26 2015-09-21 小麦Ms1多核苷酸、多肽以及使用方法

Country Status (8)

Country Link
US (5) US11015209B2 (zh)
EP (1) EP3197270A1 (zh)
CN (2) CN107072165B (zh)
AU (2) AU2015321591B2 (zh)
CA (1) CA2962419A1 (zh)
RU (1) RU2017114370A (zh)
UA (1) UA123765C2 (zh)
WO (1) WO2016048891A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3197270A1 (en) * 2014-09-26 2017-08-02 Pioneer Hi-Bred International, Inc. Wheat ms1 polynucleotides, polypeptides, and methods of use
KR20240013283A (ko) 2014-12-03 2024-01-30 애질런트 테크놀로지스, 인크. 화학적 변형을 갖는 가이드 rna
JP6873911B2 (ja) 2015-04-06 2021-05-19 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 初代細胞において標的核酸の遺伝子調節を誘導するためにインビトロで行う方法
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
CN107267527B (zh) * 2016-07-25 2021-03-19 未名兴旺系统作物设计前沿实验室(北京)有限公司 雄性育性的保持方法及其应用
GB2552657A (en) * 2016-07-29 2018-02-07 Elsoms Dev Ltd Wheat
WO2019043082A1 (en) 2017-08-29 2019-03-07 Kws Saat Se BLUE ALEURONE ENHANCED AND OTHER SEGREGATION SYSTEMS
US20210222192A1 (en) * 2017-12-11 2021-07-22 Pioneer Hi-Bred International, Inc. Compositions and methods of modifying a plant genome to produce a ms1 or ms5 male-sterile plant
US11203752B2 (en) 2017-12-11 2021-12-21 Pioneer Hi-Bred International, Inc. Compositions and methods of modifying a plant genome to produce a MS9, MS22, MS26, or MS45 male-sterile plant
CN108588273B (zh) * 2018-08-02 2020-10-13 北京科技大学 玉米隐性核雄性不育突变基因ms30的功能标记及其应用
CN109486989A (zh) * 2018-12-03 2019-03-19 北京科技大学 玉米核雄性不育基因ms1-alb在广泛遗传背景下的不育稳定性分析方法及应用
CN109593873A (zh) * 2018-12-29 2019-04-09 中国科学院遗传与发育生物学研究所 小麦隐性核雄性不育突变基因ms1的分子标记及其应用
CN110257402B (zh) * 2019-07-10 2021-11-26 吉林大学 一种玉米小斑病菌ChCDC10基因及其应用
CN110499387B (zh) * 2019-09-27 2021-12-03 四川农业大学 一种小麦旗叶长qtl连锁的分子标记及其应用
CN112592932B (zh) * 2020-01-09 2022-03-22 中国农业科学院作物科学研究所 一种植物育性相关蛋白及其应用
CA3196691A1 (en) 2020-10-28 2022-05-05 Jacob LAGE Methods for cereal crop hybrid test cross evaluation
CN114540366B (zh) * 2020-11-24 2024-02-13 海南波莲水稻基因科技有限公司 一种水稻育性调控基因gms3及其突变体与应用
AU2022343300A1 (en) 2021-09-10 2024-04-18 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing
EP4183247A1 (en) 2021-11-17 2023-05-24 KWS SAAT SE & Co. KGaA Method and apparatus for sorting seeds

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243770A (zh) * 2007-02-14 2008-08-20 甘肃省农业科学院 一种细胞核雄性不育杂交小麦的培育方法
CN103525809A (zh) * 2012-07-02 2014-01-22 北京大北农科技集团股份有限公司 介导植物生育力的构建体及其应用
WO2014039815A2 (en) * 2012-09-06 2014-03-13 Pioneer Hi-Bred International, Inc. Compositions and methods comprising male fertility sequences

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6198026B1 (en) 1988-02-03 2001-03-06 Pioneer Hi-Bred International, Inc. Molecular methods of hybrid seed production
US6013859A (en) 1994-07-14 2000-01-11 Pioneer Hi-Bred International, Inc. Molecular methods of hybrid seed production
US5750868A (en) 1994-12-08 1998-05-12 Pioneer Hi-Bred International, Inc. Reversible nuclear genetic system for male sterility in transgenic plants
IL120835A0 (en) * 1997-05-15 1997-09-30 Yeda Res & Dev Method for production of hybrid wheat
EP1263977A2 (en) 2000-02-28 2002-12-11 Yale University Methods and compositions to reduce or eliminate transmission of a transgene
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
BRPI0410656A (pt) * 2003-05-28 2006-07-18 Pioneer Hi Bred Int método de melhoramento de planta e planta obtida
US20060143729A1 (en) * 2004-06-30 2006-06-29 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
CN104293826A (zh) 2003-12-16 2015-01-21 先锋高级育种国际公司 显性基因抑制性转基因及其使用方法
AP2693A (en) * 2005-05-27 2013-07-16 Monsanto Technology Llc Soybean event MON89788 and methods for detection thereof
US7915478B2 (en) 2007-08-03 2011-03-29 Pioneer Hi-Bred International, Inc. Msca1 nucleotide sequences impacting plant male fertility and method of using same
CA2695530C (en) * 2007-08-03 2016-07-05 Pioneer Hi-Bred International, Inc. Msca1 nucleotide sequences impacting plant male fertility and method of using same
CN101974081B (zh) * 2010-05-28 2013-03-06 中国农业科学院油料作物研究所 一种控制植物花粉育性的pdf1基因及制备方法和用途
CN103237441B (zh) * 2011-11-02 2014-12-03 未名兴旺系统作物设计前沿实验室(北京)有限公司 一种小麦细胞核雄性不育系的保持方法
EP3197270A1 (en) * 2014-09-26 2017-08-02 Pioneer Hi-Bred International, Inc. Wheat ms1 polynucleotides, polypeptides, and methods of use

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243770A (zh) * 2007-02-14 2008-08-20 甘肃省农业科学院 一种细胞核雄性不育杂交小麦的培育方法
CN103525809A (zh) * 2012-07-02 2014-01-22 北京大北农科技集团股份有限公司 介导植物生育力的构建体及其应用
WO2014039815A2 (en) * 2012-09-06 2014-03-13 Pioneer Hi-Bred International, Inc. Compositions and methods comprising male fertility sequences

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
",XP002751257, retrieved from.《EBI》.2011, *
DATABASE Geneseq [Online],"Triticum aestivum derived protein, SEQ:2.",XP002751256, retrieved from EBI accession no. GSP:AZN49541 Database accession no. AZN49541,;Database accession no. AZN49541;《EBI》;20111124;全文 *
DATABASE UniParc [Online],XP002751258, retrieved from EBI accession no. UNIPARC:U P 1000234E968;Database accession no. UP1000234E968;《EBI》;20111106;全文 *
DATABASE UniProt [Online],"SubName: Full=Expressed protein {ECO:0000313}EMBL:AAS07321.1}SubName: Full=Os03g0663900 protein {ECO:0000313}EMBL:BAF12750.1,XP002751259,retrieved from EBI accession no. UNIP ROT:Q75GY0;Database accession no. 075GY0,;《EBI》;20040705;全文 *
EBI accession no. UNIPROT:F2E958Database accession no. F2E958.DATABASE UniProt [Online],"SubName: Full=Predicted protein {EC0:0000313}EMBL:BAK03880.1} *

Also Published As

Publication number Publication date
UA123765C2 (uk) 2021-06-02
WO2016048891A1 (en) 2016-03-31
US20170298383A1 (en) 2017-10-19
US20240018538A1 (en) 2024-01-18
AU2015321591B2 (en) 2022-03-10
EP3197270A1 (en) 2017-08-02
CN107072165A (zh) 2017-08-18
WO2016048891A8 (en) 2017-04-20
AU2015321591A1 (en) 2017-03-30
US20210254096A1 (en) 2021-08-19
US20200087678A1 (en) 2020-03-19
CA2962419A1 (en) 2016-03-31
US11015209B2 (en) 2021-05-25
US11761016B2 (en) 2023-09-19
US20160201084A1 (en) 2016-07-14
US10519464B2 (en) 2019-12-31
AU2022203961A1 (en) 2022-06-23
CN113136390A (zh) 2021-07-20
RU2017114370A (ru) 2018-11-07

Similar Documents

Publication Publication Date Title
CN107072165B (zh) 小麦Ms1多核苷酸、多肽以及使用方法
AU2020202241B2 (en) Manipulation of dominant male sterility
AU2019240727B2 (en) Compositions and methods comprising male fertility sequences
US20170369902A1 (en) Restoration of male fertility in wheat

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant