CN111954462A - Fad2基因和突变 - Google Patents

Fad2基因和突变 Download PDF

Info

Publication number
CN111954462A
CN111954462A CN201980024178.0A CN201980024178A CN111954462A CN 111954462 A CN111954462 A CN 111954462A CN 201980024178 A CN201980024178 A CN 201980024178A CN 111954462 A CN111954462 A CN 111954462A
Authority
CN
China
Prior art keywords
plant
less
gene
fad2
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980024178.0A
Other languages
English (en)
Inventor
G·F·W·勾卡尔
M·克努斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cibus Europe BV
Hibbs America Inc
Cibus US LLC
Original Assignee
Cibus Europe BV
Hibbs America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cibus Europe BV, Hibbs America Inc filed Critical Cibus Europe BV
Publication of CN111954462A publication Critical patent/CN111954462A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • A01H6/202Brassica napus [canola]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/10Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits
    • A01H1/101Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine
    • A01H1/104Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine involving modified lipid metabolism, e.g. seed oil composition
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/19Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本公开提供了脂肪酸去饱和酶2(FAD2)基因和携带两种或更多种FAD2基因中的一个或多个突变的植物和/或植物细胞;以及制造和使用这种植物的方法。在一些实施方式中,提供了产生具有高油酸含量的种子油的植物。

Description

FAD2基因和突变
相关申请的交叉引用
本申请要求于2018年4月4日提交的美国临时申请号62/652,623的权益,其通过引用以其整体并入本文。
在ASCII文本文件上提交序列表
下述以ASCII文本文件提交的内容以其整体通过引用并入本文:计算机可读形式(CRF)的序列表(文件名:165072000240SEQLIST.TXT,记录日期:2019年4月4日,大小:42KB)。
技术领域
本公开涉及与新的植物基因和基因产物有关的组合物和方法,并且也涉及具有一个或多个基因突变的植物。特别地,本公开提供了脂肪酸去饱和酶2(FAD2)基因以及携带FAD2基因中的一个或多个突变的植物和/或植物细胞;以及制造和使用这种植物的方法。在一些实施方式中,植物产生具有高油酸含量的种子油。
背景技术
Wells,Mol Breeding(2014)33:349-362公开了甘蓝型油菜(Brassica napus)的品系并且叙述了“数个品系具有~6%的PUFA含量和~84%的油酸含量……”。PCT申请WO2014/039692公开了组合物和方法以“在FAD2基因中产生断裂,并且然后公开了将与感兴趣的一个或多个性状相关的核酸分子连接至断裂中”。菜籽油的油酸含量影响菜籽油的烹饪、工业和商业效用。目前,菜籽油一般含有约60%的油酸,这为低于适于许多应用的值。相应地,存在对于具有高油酸含量的种子油的需要,以及对于产生具有高油酸含量的种子油(例如,菜籽油)的改进植物的需要。
发明内容
本公开至少部分基于在植物细胞的脂肪酸去饱和酶2(FAD2)基因中具有突变的植物。在某些实施方式中,如本文提供的植物或植物细胞为非转基因的。在某些实施方式中,提供了相对于野生型植物在FAD2基因中具有突变并且种子油中具有更高水平的油酸(18:1Δ9cis)的植物(比如,芸薹属物种(Brassica spp))。在某些实施方式中,提供了相对于野生型植物在FAD2基因中具有突变并且在种子油中具有降低水平的亚麻油酸(18:2Δ9,12)和亚麻酸(18:3Δ9,12,15)之一或二者的植物(比如,芸薹属物种)。在某些实施方式中,提供了相对于野生型植物在FAD2基因中具有突变并且在种子油中具有更高水平的油酸(18:1Δ9cis)和降低水平的亚麻油酸(18:2Δ9,12)和亚麻酸(18:3Δ9,12,15)之一或二者的植物(比如,芸薹属物种)。在任何方面的一些实施方式中和本文提供的实施方式中,植物或植物细胞为非转基因的。在某些方面中,FAD2基因的突变、变更或修饰包括插入或缺失。在一些实施方式中,突变、变更或修饰为或包括核苷酸改变或替换。在方法的一些实施方式中,变更、突变或修饰引入提前终止密码子。在一些实施方式中,变更、突变或修饰引入移码突变。在本文提供的组合物和方法的一些实施方式中,相对于野生型FAD2基因的突变为+1、-1、-2核苷酸插入缺失(InDel)。在本文提供的组合物和方法的某些实施方式中,相对于野生型FAD2基因的突变为通过靶向突变产生的+1、-1、-2核苷酸插入缺失(InDel)。在本文提供的方法的一些实施方式中,FAD2基因中的突变、修饰或变更降低或消除FAD2基因的活性或表达。在一些实施方式中,植物或植物细胞为芸薹属植物。
如本文使用的脂肪酸去饱和酶2(FAD2)基因意思是具有由如本文公开的甘蓝型油菜FAD2-1序列表示的序列的基因(BnFAD2-1为SEQ ID NO:1;BnFAD2-2为SEQ ID NO:2;BnFAD2-3为SEQ ID NO:3;BnFAD2-4为SEQ ID NO:4),或在某些实施方式中,意思是该基因的同源物、变体或突变体。术语“FAD2同源物”或任何变化指下述FAD2基因或FAD2基因产物:其在另一物种中发现,进行与本文公开的芸薹属基因和基因产物相同或基本上相同的生物功能,并且其中编码区的核酸序列或(FAD2基因产物的)多肽序列被认为与如本文公开的FAD2-1、FAD2-2、FAD2-3或FAD2-4序列中的一个或多个“相同”或至少50%或至少60%或至少70%或至少75%或至少80%或至少85%或至少90%或至少92%或至少95%或至少96%或至少97%或至少98%或至少99%类似(也称为“同一性百分比”或“基本上相同”)。
在一个方面中,提供了其中FAD2-1、FAD2-2、FAD2-3或FAD2-4内源基因中的至少一个具有与任何天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞;在一些实施方式中,提供了其中FAD2-1、FAD2-2、FAD2-3或FAD2-4内源基因中的至少两个具有与任何天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞;在一些实施方式中,提供了其中FAD2-1、FAD2-2、FAD2-3或FAD2-4内源基因中的至少三个具有与任何天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞;在一些实施方式中,提供了具有其中FAD2-1、FAD2-2、FAD2-3和FAD2-4内源基因中的每个具有与任何天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞。
在某些实施方式中,提供了其中FAD2-1内源基因具有与天然存在的FAD2-1基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-1内源基因具有与天然存在的FAD2-1基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,如本文提供的植物或植物细胞具有作为通过靶向突变产生的+1、-1、-2核苷酸插入缺失(InDel)的基因FAD2变更、突变或修饰。在某些实施方式中,如本文提供的植物或植物细胞具有通过靶向突变而产生或发展的FAD2基因变更、突变或修饰。在某些实施方式中,提供了其中FAD2-2内源基因具有与天然存在的FAD2-2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-2内源基因具有与天然存在的FAD2-2基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-3内源基因具有与天然存在的FAD2-3基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-3内源基因具有与天然存在的FAD2-3基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-4内源基因具有与天然存在的FAD2-4基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-4内源基因具有与天然存在的FAD2-4基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1和FAD2-2内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-1和FAD2-2内源基因具有与相应的天然存在的FAD2基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1和FAD2-3内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中FAD2-1和FAD2-3内源基因具有与相应的天然存在的FAD2基因相比具有+1、-1、-2核苷酸插入缺失(InDel)差异的序列的植物或植物细胞(比如,芸薹属物种)。
在一些实施方式中,提供了具有如本文提供的FAD2基因变更、突变或修饰的植物或植物细胞,其中植物或植物细胞进一步具有引起耐受除草剂的突变。在一些实施方式中,提供了具有如本文提供的FAD2基因变更、突变或修饰的植物或植物细胞,其中植物或植物细胞进一步具有引起耐受磺酰脲类除草剂的突变。在某些实施方式中,提供了具有如本文提供的FAD2基因变更、突变或修饰的植物或植物细胞,其中植物或植物细胞来自BN2SU或412SUR品系。在某些实施方式中,提供了具有如本文提供的FAD2基因变更、突变或修饰的植物或植物细胞,其中植物或植物细胞来自BN2SU品系。在某些实施方式中,提供了具有如本文提供的FAD2基因变更、突变或修饰的植物或植物细胞,其中植物或植物细胞来自412SUR品系。
在某些实施方式中,提供了其中FAD2-1和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-1和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-2和FAD2-3内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-2和FAD2-3内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-2和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-2和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-3和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-3和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1、FAD2-2和FAD2-3内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-1、FAD2-2和FAD2-3内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1、FAD2-2和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-1、FAD2-2和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1、FAD2-3和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-1、FAD2-3和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-2、FAD2-3和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-2、FAD2-3和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在某些实施方式中,提供了其中FAD2-1、FAD2-2、FAD2-3和FAD2-4内源基因具有与相应的天然存在的FAD2基因不同(例如,通过基因变更、突变或修饰)的序列的植物或植物细胞(比如,芸薹属物种)。在某些实施方式中,提供了其中与相应的天然存在的FAD2基因相比,FAD2-1、FAD2-2、FAD2-3和FAD2-4内源基因具有的序列具有+1、-1、-2核苷酸插入缺失(InDel)差异的植物或植物细胞(比如,芸薹属物种)。
在一些实施方式中,在FAD2基因中具有如本文提供的突变的植物(比如,芸薹属物种)产生具有至少68%或至少70%或至少72%或至少74%;或至少76%;或至少78%;或至少79%;或至少80%;或至少81%;或至少82%;或至少83%;或至少84%;或至少84%;或至少85%;或至少86%;或至少87%;或至少88%;或至少89%;或至少90%;或至少91%;或至少92%;或至少93%;或至少94%;或至少95%的油酸含量的种子油。
在一些实施方式中,在FAD2基因中具有如本文提供的突变的植物(比如,芸薹属物种)产生具有68%-72%之间;或70%-76%之间;或72%-80%之间;或74%-80%之间;或74%-82%之间;或76%-82%之间;或78%-82%之间;或80%-84%之间;或82%-88%之间;或82%-89%之间;或84%-90%之间;或86%-90%之间的油酸含量的种子油。
在一些实施方式中,在FAD2基因中具有如本文提供的突变的植物(比如,芸薹属物种)产生具有小于18%;或小于16%;或小于15%;或小于14%;或小于13%;或小于12%;或小于10%;或小于9%;或小于8%;或小于7%;或小于6%;或小于5%;或小于4%;或小于3%;或小于2%的亚麻油酸含量的种子油。
在一些实施方式中,在FAD2基因中具有如本文提供的突变的植物(比如,芸薹属物种)产生具有至少68%或至少70%或至少72%或至少74%;或至少76%;或至少78%;或至少79%;或至少80%;或至少81%;或至少82%;或至少83%;或至少84%;或至少84%;或至少85%;或至少86%;或至少87%;或至少88%;或至少89%;或至少90%;或至少91%;或至少92%;或至少93%;或至少94%;或至少95%的油酸含量;并且具有小于18%;或小于16%;或小于15%;或小于14%;或小于13%;或小于12%;或小于10%;或小于9%;或小于8%;或小于7%;或小于6%;或小于5%;或小于4%;或小于3%;或小于2%的亚麻油酸含量的种子油。
在一些实施方式中,在FAD2基因中具有如本文提供的突变的植物(比如,芸薹属物种)产生具有小于10%;或小于8%;或小于6%;或小于5%;或小于4%;或小于3%;或小于2%的亚麻酸含量的种子油。
在一个方面中,提供了获得自如本文提供的植物的种子油。
在一个方面中,提供了一种方法,包括使植物(比如,芸薹属物种)的细胞中的至少一种内源FAD2基因突变,以例如制备如本文提供的植物或植物种子。在一些实施方式中,方法包括(1)将具有FAD2基因中的靶向突变的基因修复寡核碱基引入至植物细胞中,以产生具有突变体FAD2基因的植物细胞;和(2)从所述选择的植物细胞再生具有突变的FAD2基因的非转基因植物。在一些实施方式中,方法包括(1)将配置为特异性使FAD2基因产生切口或切割FAD2基因的DNA切割物引入至植物细胞中,以产生具有突变体FAD2基因的植物细胞;和(2)从所述选择的植物细胞再生具有突变的FAD2基因的非转基因植物。在相关的实施方式中,提供了包括使细胞接触配置为特异性使FAD2基因产生切口或切割FAD2基因的DNA切割物的方法。相关的方面中,提供了在FAD2基因中制造突变的方法。在一些实施方式中,如本文描述的一种方法或多种方法可包括使细胞暴露于DNA切割物和GRON。在某些实施方式中,方法包括使细胞暴露于DNA切割物和GRON,其中用Cy3基团、3PS基团和2’O-甲基中的一种或多种修饰所述GRON。在一些实施方式中,一种方法或多种方法可包括使细胞暴露于DNA切割物而不使细胞暴露于GRON。在包括暴露于DNA切割物的一些实施方式中,DNA切割物特异性靶向FAD2基因。在一些实施方式中,DNA切割物为选自下述中的一种或多种:CRISPR(其包括但不限于Cas9、Cpf1和它们相应的同源物、直系同源物和/或旁系同源物)、碱基编辑器、TALEN、锌指、大范围核酸酶和切割DNA的抗生素。在一些实施方式中,DNA切割物可为质粒(DNA)、RNA和/或蛋白质。在某些实施方式中,提供的方法不包括使植物或植物细胞接触任何转基因。在某些实施方式中,提供了通过本文公开的方法产生的植物或植物细胞。
在另一方面中,本公开涉及在编码脂肪酸去饱和酶2(FAD2)基因的至少一条、至少两条、至少三条或四条核酸序列中包括至少一个突变的植物或其部分。在一些实施方式中,核酸序列与选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中的核酸序列具有至少90%的同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。在一些实施方式中,核酸序列选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中。在可与任何前述实施方式组合的一些实施方式中,突变为移码突变。在一些实施方式中,与没有移码突变的相应的内源基因相比,移码突变产生一个或多个核苷酸插入或缺失。在可与任何前述实施方式组合的一些实施方式中,移码突变产生提前终止密码子。在可与任何前述实施方式组合的一些实施方式中,突变降低或消除FAD2基因和/或FAD2多肽的表达。在可与任何前述实施方式组合的一些实施方式中,植物产生包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量的种子油。在一些实施方式中,植物产生包括至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量的种子油。在可与任何前述实施方式组合的一些实施方式中,植物产生包括68%-72%之间、70%-76%之间、72%-80%之间、74%-80%之间、74%-82%之间、76%-82%之间、78%-82%之间、80%-84%之间、82%-88%之间、82%-89%之间、84%-90%之间或86%-90%之间的油酸含量的种子油。在可与任何前述实施方式组合的一些实施方式中,植物产生包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量的种子油。在可与任何前述实施方式组合的一些实施方式中,植物产生包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量;并且包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量的种子油。在可与任何前述实施方式组合的一些实施方式中,植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在下述水平的油酸:至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%。在可与任何前述实施方式组合的一些实施方式中,植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在下述水平的油酸:至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%。在可与任何前述实施方式组合的一些实施方式中,按种子的总脂肪酸含量的重量计,种子包括在下述水平的油酸:68%-72%之间、70%-76%之间、72%-80%之间、74%-80%之间、74%-82%之间、76%-82%之间、78%-82%之间、80%-84%之间、82%-88%之间、82%-89%之间、84%-90%之间或86%-90%之间。在可与任何前述实施方式组合的一些实施方式中,植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在下述水平的亚麻油酸:小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%。在可与任何前述实施方式组合的一些实施方式中,植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在下述水平的油酸:至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%;并且按种子的总脂肪酸含量的重量计,种子包括在下述水平的亚麻油酸:小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%。在可与任何前述实施方式组合的一些实施方式中,植物选自甘蓝型油菜(Brassica napus)、芜菁(Brassicarapa)、甘蓝(Brassica oleracea)、芥菜型油菜(Brassica juncea)、芸薹属物种、萝卜(Raphanus sativus)、豌豆(Pisum sativum)、四季豆(Phaseolus vulgaris)、兵豆(Lensculinaris)、大豆(Glycine max)或豆科(Fabaceae)物种的组中。在一些实施方式中,植物为甘蓝型油菜、芜菁或芥菜型油菜。
在另一方面中,本公开提供了F1植物,其中F1植物具有任何一个前述实施方式的植物作为亲本。在另一方面中,本公开提供了制造植物种子的方法,方法包括使任何一个前述实施方式的植物与另一植物杂交并且从中收获种子。在另一方面中,本公开提供了制造任何一个前述实施方式的植物的方法,方法包括从任何一个前述实施方式的植物与任何一个前述实施方式的植物的杂交选择种子,以制备任何一个前述实施方式的植物。在另一方面中,本公开提供了通过使任何一个前述实施方式的种子生长而产生的植物,其中植物具有任何一个前述实施方式的植物的所有的生理学和形态学特点。
在另一方面中,本公开提供了从包括在按种子的总脂肪酸含量的重量计至少80%的水平的油酸的种子中提取的油。在一些实施方式中,油为从包括按种子的总脂肪酸含量的重量计约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸的种子中提取的。
在另一方面中,本公开提供了从在编码脂肪酸去饱和酶2(FAD2)基因的至少一条、至少两条、至少三条或四条核酸序列中包括至少一个突变的植物的种子中提取的油,其中核酸序列与选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中的核酸序列具有至少90%的同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性,其中突变降低或消除FAD2基因和/或FAD2多肽的表达,并且其中植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在至少80%的水平的油酸。在一些实施方式中,按种子的总脂肪酸含量的重量计,种子包括约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸。在可与任何前述实施方式组合的一些实施方式中,植物选自甘蓝型油菜、芜菁、甘蓝、芥菜型油菜、芸薹属物种、萝卜、豌豆、四季豆、兵豆、大豆或豆科物种的组中。在一些实施方式中,植物为甘蓝型油菜、芜菁或芥菜型油菜。
在另一方面中,本公开涉及产生任何前述实施方式的植物或其部分的方法,包括下述步骤:a)将突变引入至植物细胞中,其中突变为编码FAD2基因的至少一条、至少两条、至少三条或四条核酸序列中的至少一个突变;b)选择或鉴定含有突变的植物细胞;和c)再生具有突变的植物;其中植物产生包括高油酸含量的种子油。在进一步的方面中,本公开涉及产生任何前述实施方式的植物或其部分的方法,包括下述步骤:a)将突变引入至植物细胞中,其中突变为编码FAD2基因的至少一条、至少两条、至少三条或四条核酸序列中的至少一个突变;b)选择或鉴定含有突变的植物细胞;和c)再生具有突变的植物;其中植物产生种子并且种子包括高油酸含量。在可与任何前述实施方式组合的一些实施方式中,高油酸含量包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量。在可与任何前述实施方式组合的一些实施方式中,植物产生包括低亚麻油酸含量的种子油。在一些实施方式中,低亚麻油酸含量包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量。在可与任何前述实施方式组合的一些实施方式中,使用一个或多个载体引入突变,其中载体包括设计为靶向编码FAD2基因的核酸序列的,选自CRISPR/Cas9系统、TALEN、锌指和大范围核酸酶的组中的基因编辑组分。在一些实施方式中,使用设计为靶向编码FAD2基因的核酸序列的GRON系统引入突变。在一些实施方式中,GRON系统包括选自由下述组成的组中的一个或多个修饰:Cy3基团、3PS基团和2’O-甲基。在可与任何前述实施方式组合的一些实施方式中,核酸序列与选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中的核酸序列具有至少90%的序列同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。在一些实施方式中,核酸序列选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中。在可与任何前述实施方式组合的一些实施方式中,突变选自移码突变;与没有移码突变的相应的内源基因相比,产生一个或多个核苷酸插入或缺失的移码突变;和产生提前终止密码子的移码突变的组中,并且其中突变降低或消除FAD2基因和/或FAD2多肽的表达。
在另一方面中,本公开涉及在种子中产生高油酸的方法,方法包括使在编码FAD2基因的至少一条、至少两条、至少三条或四条核酸序列中包括至少一个突变的植物生长,其中突变降低或消除FAD2基因和/或FAD2多肽的表达,并且其中所述植物产生包括在至少80%水平的油酸的种子油。在进一步的方面中,本公开涉及在种子中产生高油酸的方法,方法包括使在编码FAD2基因的至少一条、至少两条、至少三条或四条核酸序列中包括至少一个突变的植物生长,其中突变降低或消除FAD2基因和/或FAD2多肽的表达,和其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少80%水平的油酸。在可与任何前述实施方式组合的一些实施方式中,核酸序列与选自SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中的核酸序列具有至少90%的序列同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。在一些实施方式中,核酸序列选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4的组中。在可与任何前述实施方式组合的一些实施方式中,方法进一步包括从植物中分离种子。在一些实施方式中,方法进一步包括从植物种子中提取油。在可与任何前述实施方式组合的一些实施方式中,植物选自甘蓝型油菜、芜菁、甘蓝、芥菜型油菜、芸薹属物种、萝卜、豌豆、四季豆、兵豆、大豆和豆科物种的组中。在一些实施方式中,植物为甘蓝型油菜、芜菁或芥菜型油菜。
附图说明
专利或申请文件包含至少一幅彩色执行的附图。根据要求并且支付必要的费用,该局将提供带有彩色附图的本专利或专利申请公开的副本。
图1A-1B阐释了具有不同脂肪酸组成的油的数据和趋势线(见表7)。图1A阐释了这些油的油酸%对氧化稳定性指数(OSI)。图1B阐释了这些油的总多不饱和脂肪酸(PUFA)%对OSI。对于图1A-1B,每种油由点表示,用于CIBUS品系#1菜籽油的点为由标签指示的红色点,并且用于油之间的比例的趋势线显示为虚线。
详细描述
在本公开的各种方面和实施方式中,提供了包括具有一个或多个FAD2突变和/或突变组合的植物或植物细胞;制造这种植物或植物细胞的方法;和用于产生具有期望的种子油组成的植物的方法。
对于本领域技术人员容易显而易见的,在不背离本公开的范围和精神的情况下,可对本文公开的本公开进行各种替换和修饰。
本文说明性地描述的公开内容可在不存在本文未具体地公开的任何一个或多个元素、一个或多个限制的情况下适当地实践。因此,例如,在本文的每种情况下,术语“包括(comprising)”、“基本上由……组成”和“由……组成”中的任何一个都可以用另外两个术语中的任一个替换。已经采用的术语和表达用作说明书的术语,且是非限制性的,并且不旨在使用这种术语和表达时排除所示出和描述的特征或其部分的任何等同物,但是应认识到,在所要求的公开内容的范围内各种修饰是可能的。因此,应理解,尽管本公开已经通过优选的实施方式和任选的特征被具体地公开,但是本领域技术人员可以对本文公开的概念进行修饰和变型,并且这种修饰和变型被认为在由所附权利要求限定的公开内容的范围内。
因此,应理解,尽管本公开已经通过优选的实施方式和任选的特征被具体地公开,但是本领域技术人员可对公开的公开内容进行修饰、提高和变化。并且这种修饰、提高和变化被认为在本公开的范围内。这里提供的材料、方法和实施例是优选的实施方式的代表,是示例性的,并且不旨在作为对本公开的范围的限制。
本文已经广泛地和一般地描述了本公开。落入一般公开内容内的每个较窄的物种和亚属群也构成本公开的部分。这包括从属中去除任何主题的具有附带条件或否定限制的公开内容的一般性描述,无论删除的材料是否具体地被本文列举。
另外,依据Markush组描述的公开内容的特征或方面,本领域技术人员将认识到,公开内容由此也依据Markush组的任何单个成员或成员的子组描述。
本文提及的所有出版物、专利申请、专利和其他参考文献均通过引用以其全部特别地并入本文,程度如同每个分别地通过引用并入本文。在发生冲突的情况下,以包括定义的本说明书为准。
高油酸菜籽油
在各种方面和实施方式中,本文提供的包括用于产生具有高水平的油酸(18:1Δ9cis)的种子油的甘蓝型油菜植物。在一些实施方式中,快速性状选育系统(Rapid TraitDevelopment System)(RTDSTM)技术用于变更或破坏编码油酸酯去饱和酶(负责在油酰基CoA的Δ12位置添加不饱和或双键引起产生亚麻油酸(18:2Δ9cis,12cis))的一个或多个基因或等位基因(FAD2基因座)。在一些实施方式中,具有这些修饰的植物在种子油中,具有增加的油酸(18:1Δ9cis)的量和减少的亚麻油酸(18:2Δ9,12)和亚麻酸(18:3Δ9,12,15)之一或二者的量。所得油可为主要在食品和专用化学品市场中的重要商业物品。所得种子油可具有范围为65%至大于90%的混合甘油三酯形式的油酸的油酸含量。油酸含量的增加通常伴随着多不饱和脂肪酸(18:2和/或18:3)的减少,并且所以将具有更高的氧化稳定性。在使用RTDSTM实现FAD2基因修饰的情况下,种子和来自包括油、脂肪酸和膳食的种子的产物可考虑为非转基因的和非GMO的。
菜籽油一般含有以混合甘油三酯形式的约60%的油酸,以及约21%的亚麻油酸和9%-11%的亚麻酸。如当前构成的,菜籽油晋升为健康的油,饱和脂肪酸低,但仍足够稳定用于作为烹饪油的一般使用。然而,具有明显增加水平的油酸和减少水平的亚麻油酸和亚麻酸的油在食品和商品化学品市场二者中可具有增加的价值。
在食品市场中,油酸的适度增加至70%-80%的范围,将使菜籽油与RBD(精制、脱色、脱臭处理的)橄榄油和中油酸葵花籽油竞争。该油对于色拉油和煎炸油二者,可具有增加的价值,增加的氧化稳定性产生低的酸败、更长的存储时间和在高温较少的褐变。这是关键的,因为煎炸油通常局部氢化,以增加高温稳定性。具有增加的油酸和减少的亚麻油酸和亚麻酸的菜籽油将消除对于氢化的需要,因此避免产生作为公认的公共健康危害的反式脂肪酸。
具有高于80%的水平的油酸的菜籽油在例如工业油脂化学市场中有应用。目前,技术等级油酸在约75%的油酸下是可用的,并且杂质(亚麻油酸和亚麻酸)损害了产物用于制造用于非常宽范围的化学中间体和成品产品的可预测的高纯度化学修饰。另外,尽管菜籽油制备了重要的生物柴油燃料原料,但是亚麻油酸和亚麻酸的存在损害了存储稳定性并产生比期望更高的NOx产生二者。在80%-90%范围内的油酸以及低亚麻油酸和亚麻酸的菜籽油将为工业化学使用和清洁、提高的热和冷稳定的生物柴油燃料提供附加值。
油酸水平大于或等于90%的菜籽油将允许甘油三酯和脂肪酸用于要求高纯度原料的化学修饰,比如三油酸甘油三酯的复分解和直接聚合,以产生用于汽车和家具市场的高性能泡沫填料。在大于90%的油酸下,菜籽油可为蒸馏级别的油酸的替换品,蒸馏级别的油酸目前具有作为商业的原材料的技术等级的价值的许多倍价值。
产生具有高油酸含量的种子油的本公开的植物可产生具有,例如,至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%的油酸的种子油。在一些实施方式中,具有高油酸含量的种子油可具有约68%-72%之间、约70%-76%之间、约72%-80%之间、约74%-80%之间、约74%-82%之间、约76%-82%之间、约78%-82%之间、约80%-84%之间、约82%-88%之间、约82%-89%之间、约84%-90%之间或约86%-90%之间的油酸含量。产生具有高油酸含量和低亚麻油酸含量的种子油的本公开的植物可产生具有,例如,至多约20%、至多约19%、至多约18%、至多约17%、至多约16%、至多约15%、至多约14%、至多约13%、至多约12%、至多约11%、至多约10%、至多约9%、至多约8%、至多约7%、至多约6%、至多约5%、至多约4%、至多约3%、至多约2%、至多约1%或至多约0%的亚麻油酸的种子油。在一些实施方式中,具有高油酸含量和低亚麻油酸含量的种子油可具有至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%的油酸含量;和至多约20%、至多约19%、至多约18%、至多约17%、至多约16%、至多约15%、至多约14%、至多约13%、至多约12%、至多约11%、至多约10%、至多约9%、至多约8%、至多约7%、至多约6%、至多约5%、至多约4%、至多约3%、至多约2%、至多约1%或至多约0%的亚麻油酸含量。
本公开的油可从按种子的总脂肪酸含量的重量计,包括在至少80%的水平的油酸的种子中提取。在一些实施方式中,从按种子的总脂肪酸含量的重量计,包括约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸的种子中提取油。本公开的油可从在编码脂肪酸去饱和酶2(FAD2)基因的至少两条、至少三条或四条核酸序列中包括至少一个突变的植物的种子中提取,其中核酸序列与选自SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3或SEQ ID NO:4的组中的核酸序列具有至少90%的同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性,其中突变降低或消除FAD2基因和/或FAD2多肽的表达,和其中植物产生种子并且按种子的总脂肪酸含量的重量计,种子包括在至少80%的水平的油酸。在一些实施方式中,按种子的总脂肪酸含量的重量计,种子包括约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸。在一些实施方式中。在一些实施方式中,本公开的油具有与C18:3(18:3;Ω-3型)脂肪酸相比更低水平的C18:2(18:2;Ω-6型)脂肪酸。在一些实施方式中,本公开的油含有约1.7%、1.8%、1.9%、2.0%、2.1%、2.2%、2.3%、2.4%、2.5%、2.6%、2.7%、2.8%、2.9%、3.0%、3.1%、3.2%、3.3%、3.4%、3.5%、3.6%、3.7%、3.8%、3.9%或4.0%的C18:2水平;和约2.8%、2.9%、3.0%、3.1%、3.2%、3.3%、3.4%、3.5%、3.6%、3.7%、3.8%、3.9%、4.0%、4.1%、4.2%、4.3%、4.4%、4.5%、4.6%、4.7%、4.8%、4.9%、5.0%、5.1%或5.2%的C18:3水平。在一些实施方式中,本公开的油含有约2.6%的C18:2水平和约4.1%的C18:3水平。在一些实施方式中,本公开的油含有约2%的C18:2水平和约3%的C18:3水平。在一些实施方式中,本公开的油具有小于1的Ω-6与Ω-3的比例。在一些实施方式中,本公开的油具有为约0.60、0.61、0.62、0.63、0.64、0.65、0.66、0.67、0.68、0.69或0.70的Ω-6与Ω-3的比例。
本公开的一些方面涉及营养产物,其含有包括至少70%的油酸含量的本公开的油。在一些实施方式中,营养产物选自由下述组成的组中:制备的膳食、快餐食品、营养保健品、膳食替换、烹饪油、色拉油或煎炸油。在一些实施方式中,本公开的油用作掺混油料,以为使用具有高Ω-6与Ω-3的比例(例如,具有8.5的Ω-6与Ω-3的比例;见表7)的商业油的营养产物制剂降低Ω-6与Ω-3的比例。在一些实施方式中,本公开的油用作油料,以产生具有较低Ω-6与Ω-3的比例的营养产物制剂。在一些实施方式中,本公开的油用于降低慢性疾病的风险(见,例如,Simopolous,Biomed.Pharmacother.,56(8):365-379,2002)。
本公开的一些方面涉及商品化学品(例如,工业化学产品),其含有包括至少80%的油酸含量的本公开的油。在一些实施方式中,本公开的油用于制造产生一系列工业化学中间体和成品产品的可预测的、高纯度化学修饰。在一些实施方式中,本公开的油用作生物柴油燃料原料。在一些实施方式中,本公开的油用作产生低NOx产生的生物柴油燃料原料。
本公开的一些方面涉及高纯度原料,其含有包括至少90%的油酸含量的本公开的油。在一些实施方式中,高纯度原料用于化学修饰。在一些实施方式中,化学修饰为三油酸甘油三酯的复分解和直接聚合。在一些实施方式中,化学修饰产生用于汽车或家具的高性能泡沫填料。
本公开的一些方面涉及高价值蒸馏级别的油酸,其含有包括至少91%的油酸含量的本公开的油。
脂肪酸去饱和酶2(FAD2)基因
本公开一般涉及在脂肪酸去饱和酶2(FAD2)基因中具有突变的植物。在一些实施方式中,两种或更多种FAD2基因中的一个或多个突变引起产生具有高油酸含量的种子油。在一些实施方式中,种子油进一步具有低的亚麻油酸含量。
在一些方面中,本公开的植物为甘蓝型油菜(例如,甘蓝型油菜属油茶(oleifera))、芜菁或芥菜型油菜植物,也称为油菜。油菜植物含有命名为BnFAD2-1、BnFAD2-2、BnFAD2-3和BnFAD2-4的四种脂肪酸去饱和酶2(FAD2)基因。在一些方面中,本公开的植物在至少两种FAD2基因中具有至少一个突变。在一些实施方式中,本公开的植物在BnFAD2-3中不具有突变。
本公开的某些方面涉及BnFAD2-1。BnFAD2-1的核苷酸编码序列阐释在SEQ ID NO:1中。本文也提供了BnFAD2-1的同源物和直系同源物。在一些实施方式中,BnFAD2-1的同源物或直系同源物具有与SEQ ID NO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的核酸编码序列。在一些实施方式中,编码BnFAD2-1的同源物或直系同源物的核酸序列也可具有一个或多个突变。
本公开的某些方面涉及BnFAD2-2。BnFAD2-2的核苷酸编码序列阐释在SEQ ID NO:2中。本文也提供了BnFAD2-2的同源物和直系同源物。在一些实施方式中,BnFAD2-2的同源物或直系同源物具有与SEQ ID NO:2至少50%、至少55%、至少60%、至少65%、至少70%、至少75%,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的核酸编码序列。在一些实施方式中,编码BnFAD2-2的同源物或直系同源物的核酸序列也可具有一个或多个突变。
本公开的某些方面涉及BnFAD2-3。BnFAD2-3的核苷酸编码序列阐释在SEQ ID NO:3中。本文也提供了BnFAD2-3的同源物和直系同源物。在一些实施方式中,BnFAD2-3的同源物或直系同源物具有与SEQ ID NO:3至少50%、至少55%、至少60%、至少65%、至少70%、至少75%,至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的核酸编码序列。在一些实施方式中,编码BnFAD2-3的同源物或直系同源物的核酸序列也可具有一个或多个突变。
本公开的某些方面涉及BnFAD2-4。BnFAD2-4的核苷酸编码序列阐释在SEQ ID NO:4中。本文也提供了BnFAD2-4的同源物和直系同源物。在一些实施方式中,BnFAD2-4的同源物或直系同源物具有与SEQ ID NO:4的至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的核酸编码序列。在一些实施方式中,编码BnFAD2-4的同源物或直系同源物的核酸序列也可具有一个或多个突变。
在一些方面中,本公开的植物在BnFAD2-1中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-2、BnFAD2-3和BnFAD2-4的一种或多种FAD2基因中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-2和BnFAD2-4的一种或多种FAD2基因中具有突变。
在一些方面中,本公开的植物在BnFAD2-2中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-1、BnFAD2-3和BnFAD2-4的一种或多种FAD2基因中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-1和BnFAD2-4的一种或多种FAD2基因中具有突变。
在一些方面中,本公开的植物在BnFAD2-3中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-1、BnFAD2-2和BnFAD2-4的一种或多种FAD2基因中具有突变。
在一些方面中,本公开的植物在BnFAD2-4中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-1、BnFAD2-2和BnFAD2-3的一种或多种FAD2基因中具有突变。在一些实施方式中,这些植物也可在选自BnFAD2-1和BnFAD2-2的一种或多种FAD2基因中具有突变。
在一些方面中,本公开的植物在BnFAD2-3中不具有突变。在一些实施方式中,这些植物可在选自BnFAD2-1、BnFAD2-2和BnFAD2-4的一种或多种FAD2基因中具有突变。
在一些方面中,本公开的植物在至少一种、至少两种、至少三种或四种FAD2基因中具有突变。在一些方面中,本公开的植物在至少两种、至少三种或四种FAD2基因中具有突变。
在一些方面中,突变可为移码突变、与没有移码突变的相应的内源基因相比产生一个或多个核苷酸插入或缺失的移码突变或产生提前终止密码子的移码突变,其中突变降低或消除FAD2基因和/或FAD2多肽的表达。
本公开的修饰核酸(例如,突变的FAD2基因),在植物细胞中其表达与相应的对照相比可降低至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%。各种对照将对于本领域技术人员是容易显而易见的。例如,对照可为不含有本公开的编码FAD2多肽的突变的核酸的相应的植物或植物细胞。
本公开的修饰多肽(例如,具有降低活性的修饰FAD2多肽),在植物细胞中,其表达或活性与相应的对照相比可降低至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%。各种对照将对于本领域技术人员是容易显而易见的。例如,对照可为不含有本公开的修饰FAD2多肽的相应的植物或植物细胞。
鉴定序列相似性的方法
当对于如以下描述的最大对应性比对时,如果在两个序列中的核苷酸或氨基酸残基的序列分别是相同的,则两个多核苷酸或多肽是相同的。当如使用以下序列比较算法之一或通过手动比对和视觉检查测量的,对于比较窗口的最大对应性的比较和比对时,在两个或更多个核酸或多肽序列的上下文中的术语“相同的(identical)”或“同一性百分比”指的是两个或更多个是相同的序列或子序列或具有指定百分比的相同的氨基酸残基或核苷酸的序列或子序列。对于序列在保守替换中不同的多肽,可以向上调整序列同一性百分比以纠正替换的保守性质。进行这种调整的方法对本领域人员而言是众所周知的。典型地,这涉及将保守替换评分为部分错配而不是完全错配,从而增加序列同一性百分比。因此,例如,在相同的氨基酸给出一的评分并且非保守替换给出零的评分的情况中,保守替换给出在零和一之间的评分。保守替换的评分依照,例如下述算法计算:Meyers&Miller,ComputerApplic.Biol.Sci.4:11-17(1988),例如,如程序PC/GENE(Intelligenes,Mountain View,Calif.,USA)中实施的。
当如使用以下序列比较算法之一或通过手动比对和视觉检查测量的,对于比较窗口的最大对应性比对时,在两个核酸或多肽的上下文中,短语“基本上相同的”和“同一性百分比”指的是具有至少50%、有利地60%、优选地70%、更优选地80%和最优选地90-95%核苷酸或氨基酸残基同一性的序列或子序列。该定义也指的是测试序列的补充(complement),当测试序列与参考序列具有实质的同一性时,其具有实质的序列或子序列互补性。
本领域技术人员将认识到,如果两个多肽免疫学上相似,则两个多肽也可为“基本上相同的”。因此,总的蛋白质结构可为相似的,而两个多肽的一级结构显示出显著的变化。因此,测量两个多肽是否基本上相同的方法涉及测量单克隆或多克隆抗体与每个多肽的结合。如果对第一多肽特异的抗体以对第一多肽的亲和力的至少三分之一的亲和力结合至第二多肽,则两个多肽基本上相同的。对于序列比较,典型地将一个序列充当参考序列,将测试序列与其比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并且指定序列算法程序参数。然后,基于指定的程序参数,序列比较算法计算测试序列相对于参考序列的序列同一性百分比。
“序列相似性”的百分比是相同的或变化的氨基酸或核苷酸的百分比,即,“序列相似性”=序列同一性百分比)+变化百分比)。因此,无论何时使用术语序列“相似性”,术语序列“相似性”包括与该序列以一些百分比的序列“同一性”和“变化”。在某些实施方式中,通过参考序列同一性百分比允许的序列中的变化是所有或几乎所有保守变化;换句话说,当序列为90%相同的那些实施方式中,剩余10%是所有或几乎所有保守变化。在该上下文中的术语“几乎所有”指的是允许的序列变化的至少75%是保守变化,更优选地至少85%,仍更优选地至少90%和最优选地至少95%。
可以如下进行用于比较的序列优化比对:通过Smith&Waterman,0.4dv.Appl.Math.2:482(I 98 I)的局部同源算法;通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源比对算法;通过Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA 5 85:2444(1988)的相似性方法的搜索;通过这些算法的计算机操作实施(Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,Wis.中的GAP、BESTFIT、FASTA和TFASTA);通过用于比对的软件如LifeTechnologies,Carlsbad,CA,USA的VECTOR NTI Version#11.5;通过ClustalW,Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTALW中描写的程序:通过序列加权、特定位置的缺口罚分和权重矩阵选择来提高先进的多序列比对的敏感性);NucleicAcidsResearch,22:4673-4680;或通过视觉检查(通常参见,Molecular Biology,F.M.Ausubel等,eds.,Current Protocols,Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.之间的合资企业,(1995 Supplement)(Ausubel)中的方案)。
适合于测定序列同一性百分比和序列相似性的算法的实例是BLAST和BLAST 2.0算法,其分别在Altschul等,(1990)J.Mol.Biol.215:403-410和Altschul等,(1977)Nucleics Res.25:33 89-3402中描述。进行BLAST分析的软件是通过国家生物技术信息中心(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)公开获得的。该算法涉及首先通过识别查询序列中长度W的短字段(word)来识别高评分序列对(HSP),其在与数据库序列中相同长度的字段比对时,匹配或满足一些正值阈值评分T。T称为邻近字段评分阈值(Altschul等,supra)。这些最初的邻近字段命中(hit)充当启动搜索以查找包含它们的较长HSP的种子。然后字段命中沿着每个序列在两个方向上延伸,直到可以增加累积比对评分。对于核苷酸序列,使用参数M(一对匹配残基的奖励评分,总是>0)和N(错配残基的惩罚评分,总是<0)计算累积评分。对于氨基酸序列,使用计分矩阵来计算累积评分。当以下情况时,每个方向上的字段命中的延伸将被停止:累积比对评分从其最大实现值下降了数量X;由于一个或多个负评分残基比对的积累,累积评分达到零或以下;或达到任一序列的终点。BLAST算法参数W、T和X确定对比的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字段长度(W)、10的期望值(E)、M=5,N=-4以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用3的字段长度(W)、10的期望值(E)和BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。除了计算百分比序列同一性,BLAST算法还进行在两个序列之间的相似性的统计分析(参见,例如,Karlin&Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。由BLAST算法提供的一种相似性的测量是最小的总和概率(P(N)),其提供了偶然出现的两个核苷酸或氨基酸序列之间的匹配的概率的指示。例如,如果在测试核酸与参考核酸的比较中最小的总和概率小于约0.1、更优选地小于约0.01和最优选地小于约0.001,则认为核酸与参考序列相似。
核酸和将其递送至细胞
本公开的某些方面涉及核酸(例如,FAD2基因),以及具有一个或多个突变的核酸。如本文所述,存在各种用于将突变引入核酸的方法。在一些实施方式中,如本文所述的,可将一个或多个核酸递送至细胞。
寡核碱基
如本文使用的“寡核碱基”为核碱基的聚合物,其聚合物可通过Watson-Crick碱基配对与具有互补序列的DNA杂交。
核碱基包括碱基,其可为嘌呤、嘧啶或其衍生物或类似物。核碱基包括肽核碱基、肽核酸的亚基(subunit)和吗啉核碱基以及核苷和核苷酸。核苷为包含戊糖呋喃糖基部分的核碱基,例如,任选地替换的核糖苷或2’-脱氧核糖苷。核苷可通过可含磷或不含磷的几个键联部分之一连接。通过未取代的磷酸二酯连接被连接的核苷称为核苷酸。
寡核碱基链可具有单一5’和3’末端,其为聚合物的最终核碱基。特别的寡核碱基链可包含所有类型的核碱基。寡核碱基化合物为包括通过Watson-Crick碱基配对互补的和杂交的一个或多个寡核碱基链的化合物。核碱基为脱氧核糖型或核糖型。核糖型核碱基为包含核碱基的戊糖呋喃糖基,其中2’碳为用羟基、烷氧基或卤素替换的亚甲基。脱氧核糖型核碱基为除了核糖型核碱基外的核碱基并且包括不包含戊糖呋喃糖基部分的所有核碱基。
寡核碱基链通常包括寡核碱基链和寡核碱基链的片段或区域两者。寡核碱基链具有3’端和5’端。当寡核碱基链与链共延伸,链的3’和5’端也为链的3’和5’末端。
可使用本领域中通常使用的任何方法将寡核碱基引入至植物细胞中,所述方法包括但不限微载体(基因枪递送(biolistic delivery))、微纤维(晶须)、电穿孔、核转染、PEG-介导的递送、直接DNA摄取和显微注射。以下描述了寡核碱基的示例性实例。
说明书可用具有通过引用并入本文的Kmiec I和Kmiec II专利中描述的构象和化学性质的寡核碱基实施。Kmiec I公开了用于将特定的基因改变引入靶基因的方法。KmiecI和/或Kmiec II中的寡核碱基包含两个互补链,其中之一包含为与另一链的DNA-型核苷酸配对的碱基的RNA型核苷酸(“RNA片段”)的至少一个片段。
Kmiec II公开了含嘌呤和嘧啶碱基的非核苷酸可被替换为核苷酸。美国专利号5,756,325;5,871,984;5,760,012;5,888,983;5,795,972;5,780,296;5,945,339;6,004,804和6,010,907和国际专利号PCT/US00/23457中;和国际专利公布号WO 98/49350;WO 99/07865;WO 99/58723;WO 99/58702;WO 99/40789;美国专利号6,870,075;和美国公开的专利申请20030084473,其每个以其全部并入本文,公布了可用于本说明书的另外的分子。术语“寡核碱基”在本文用于表示可在本公开的方法中使用的分子,并且包括混合双链寡核苷酸、含Kmiec II中教导的分子的非核苷酸、单链的寡脱氧核苷酸和以上所述专利和专利公布中教导的其他分子。
在一个实施方式中,寡核碱基为混合双链寡核苷酸,其中混合双链寡核苷酸的RNA型核苷酸通过用氟、氯或溴官能团(functionality)替换2’-羟基或在2’-O上放置取代基造成核糖核酸酶(RNase)抗性。合适的取代基包括由Kmiec II教导的取代基。可替选的取代基包括美国专利号5,334,711(Sproat)教导的取代基和由专利公布EP 629 387和EP 679 657(共同地,Martin Applications)教导的取代基,其通过引用并入本文。如本文使用的,核糖核苷酸的2’-氟、氯或溴衍生物或具有用Martin Applications或Sproat中描述的取代基替换的2’-OH的核糖核苷酸被称为“2’-替换的核糖核苷酸”。如本文使用的,术语“RNA型核苷酸”意指通过未取代的磷酸二酯连接或由Kmiec I或Kmiec II教导的任何非天然键联而连接至混合双链寡核苷酸的其他核苷酸的2’-羟基或2’-替换的核苷酸。如本文使用的,术语“脱氧核糖-型核苷酸”意指具有2’-H的核苷酸,其可通过未取代的磷酸二酯连接或由KmiecI或Kmiec II教导的任何非天然键联而连接至MDON的其他核苷酸。
本公开的一个实施方式中,寡核碱基或GRON为由未取代的磷酸二酯键单独地连接的混合双链寡核苷酸。在可替选的实施方式中,键联通过替换的磷酸二酯、磷酸二酯衍生物和非磷基的连接,如由Kmiec II教导的。在还另一个实施方式中,混合双链寡核苷酸中的每个RNA型核苷酸为2’-替换的核苷酸。2’-替换的核糖核苷酸的特别地优选的实施方式为2’-氟、2’-甲氧基、2’-丙氧基、2’-烯丙氧基、2’-羟乙氧基、2’-甲氧基乙氧基、2’-氟丙氧基和2’-三氟丙氧基替换的核糖核苷酸。2’-替换的核糖核苷酸的更优选的实施方式为2’-氟、2’-甲氧基、2’-甲氧基乙氧基和2’-烯丙氧基替换的核苷酸。在另一个实施方式中,混合双链寡核苷酸由未取代的磷酸二酯键连接。
尽管更方便地合成了仅具有单一类型的2’-替换的RNA型核苷酸的混合双链寡核苷酸,但是本公开的方法可以用具有两种或更多种类型的RNA型核苷酸的混合双链寡核苷酸来实践。RNA区段的功能可不受两个RNA-型三核苷酸之间脱氧核苷酸的引入产生的干扰所影响,因此,术语RNA区段涵盖了这种“中断的RNA区段”。不间断的RNA区段被称为连续的RNA区段。在可替选的实施方式中,RNA区段可包含交替的RNase-抗性和未取代的2’-OH核苷酸。混合双链寡核苷酸优选地具有少于100个核苷酸、更优选地少于85个核苷酸,但多于50个核苷酸。第一和第二链是Watson-Crick碱基配对。在一个实施方式中,混合双链寡核苷酸的链通过连接体,如单链六核苷酸、五核苷酸或四核苷酸共价键合,使得第一和第二链是具有单个3’和单个5’端的单个寡核苷酸的区段。3’和5’端可通过“发夹帽(hairpin cap)”的添加来保护3’和5’端,从而使3’和5’末端核苷酸与相邻的核苷酸Watson-Crick配对。另外,可将第二发夹帽放置在远离3’和5’端的第一和第二链之间的接合点,以便稳定第一和第二链之间的Watson-Crick配对。
第一和第二链包含与靶FAD2基因的两个片段同源的两个区域,即具有与靶基因相同的序列。同源区域包含RNA区段的核苷酸,并且可包含连接DNA区段的一个或多个DNA-型核苷酸,并且还可包含不在间插DNA区段内的DNA-型核苷酸。同源性的两个区域被具有与靶基因的序列不同的序列的区域(其被称为“异源的区域”)分开,并且同源性的两个区域各自与所述具有与靶基因的序列不同的序列的区域彼此邻近。异源的区域可包含一个、两个或三个错配的核苷酸。错配的核苷酸可为连续的,或可替选地可被与靶基因同源的一个或两个核苷酸分开。可替选地,异源的区域还可包含插入或一个、两个、三个或五个或更少的核苷酸。可替选地,混合双链寡核苷酸的序列可与仅通过从混合双链寡核苷酸中缺失一个、两个、三个或五个或更少的核苷酸的靶基因的序列不同。在这种情况下,即使没有混合双链寡核苷酸的核苷酸在异源的区域内,异源的区域的长度和位置也被认为是缺失的长度。当旨在一个或多个替换时,与两个同源区域互补的靶基因的片段之间的距离与异源的区域的长度是相同的。当异源的区域包含插入时,同源区域由此在混合双链寡核苷酸中被分开得比基因中它们的互补同源片段更远,并且当异源的区域编码缺失时,反之也是适用的。
混合双链寡核苷酸的RNA区段为同源区域的每个部分,即与靶基因的片段的序列相同的区域,其区段一起优选地包含至少13个RNA型核苷酸和优选地16至25个RNA型核苷酸或还优选地18-22个RNA型核苷酸或最优选地20个核苷酸。在一个实施方式中,同源性区域的RNA区段由间插DNA区段分开并且邻近间插DNA区段,即“由间插DNA区段连接”。在一个实施方式中,异源的区域的每个核苷酸为间插DNA区段的核苷酸。包含混合双链寡核苷酸的异源的区域的间插DNA区段被称为“增变基因区段”。
待引入靶基因的变化由异源的区域编码的。待引入FAD2基因的变化可为靶基因序列的一个或多个碱基的变化,其将那个位置中的天然氨基酸改变为所需的氨基酸。
本公开的另一个实施方式中,寡核碱基为单链的寡脱氧核苷酸突变的载体或SSOMV,其在国际专利申请PCT/US00/23457中公开,其通过引用以其全部并入本文。SSOMV的序列基于相同的原则作为美国专利号5,756,325;5,871,984;5,760,012;5,888,983;5,795,972;5,780,296;5,945,339;6,004,804和6,010,907中和国际公布号WO 98/49350;WO99/07865;WO 99/58723;WO 99/58702;WO 99/40789;US 6,870,075中和美国公布专利申请20030084473中描述的突变的载体。SSOMV的序列包含与通过称为增变基因区域的包含所需的基因的改变的区域分开的靶基因同源的两个区域。增变基因区域可具有与将靶序列中的同源区域分开的序列相同长度的序列,但具有不同的序列。这种增变基因区域将产生替换。
SSOMV的核苷酸是通过未修饰的磷酸二酯键连接的脱氧核糖核苷酸,除了3’末端和/或5’末端核苷酸间键联或可替选地两个3’末端和/或5’末端核苷酸间键联可为硫代磷酸酯或氨基磷酸酯。如本文使用的核苷酸间键联是SSOMV的核苷酸之间的键联,并且不包括3’端核苷酸或5’端核苷酸与封闭取代基(blocking substituent)之间的键联,参见上文。在具体的实施方式中,SSOMV的长度在21个和55个脱氧核苷酸之间,并且因此同源性区域的长度为至少20个脱氧核苷酸的总长度,并且至少两个同源性区域应每个具有至少8个脱氧核苷酸的长度。
SSOMV可被设计成与靶基因的编码链或非编码链互补。当所需突变为单一碱基的取代时,优选地两个增变基因核苷酸都是嘧啶。在与实现所需功能结果一致的程度上,优选地互补链中的增变基因核苷酸和靶核苷酸都为嘧啶。特别地优选的是编码颠换突变的SSOMV,即C或T增变基因核苷酸分别与互补链中的C或T核苷酸错配。
除了寡脱氧核苷酸以外,SSOMV可包含通过连接体附着至5’末端碳的5’封闭取代基。连接体的化学性质除了其长度外都不重要,其优选的应为至少6个原子长,并且连接体应为柔性的。可使用各种无毒的取代基,如生物素、胆固醇或其他类固醇或非嵌入的阳离子荧光染料。特别地优选的作为制造SSOMV的试剂是通过Glen Research,Sterling VA(通过Maravai LifeSciences获取)作为Cy3和Cy5销售的试剂,它们是封闭的亚磷酰胺,其在并入寡核苷酸后可分别生成3,3,3’,3’-四甲基N,N’-异丙基取代的吲哚单碳菁(indomonocarbocyanine)染料和吲哚二碳菁(indodicarbocyanine)染料。Cy3为最优选的。当吲哚碳菁(indocarbocyanine)被N-氧烷基取代时,它可以方便地通过具有5’末端磷酸根的磷酸二酯连接至寡脱氧核苷酸的5’末端。染料和寡脱氧核苷酸之间的染料连接体的化学性质不是关键的,并且其为了合成方便而被选择。当如指示的使用商业上可获得的Cy3亚磷酰胺时,所得的5’修饰由封闭取代基和连接体一起组成,其为N-羟丙基,N’-磷脂酰丙基3,3,3’,3’-四甲基吲哚单碳菁。
在优选的实施方式中,吲哚羰菁染料在吲哚环的3和3’位置被四(tetra)取代。不受理论的限制,这些取代阻止染料成为嵌入染料。在这些位置的取代基的同一性是不重要的。SSOMV可另外具有3’封闭取代基。此外,3’封闭取代基的化学性质也是不重要的。
在另一个实施方式中,寡核苷酸可为单链的寡脱氧核苷酸,其具有3’端核苷酸、5’端核苷酸、具有至少25个脱氧核苷酸和不超过65个的脱氧核苷酸,并且具有包括每个至少8个脱氧核苷酸的至少两个区域的序列,所述两个区域每个分别等同于靶向染色体基因的至少两个区域,其一起为至少24个核苷酸的长度,并且通过靶向染色体基因的序列中或寡脱氧核苷酸的序列中或两者中的至少一个核苷酸分开,以致寡脱氧核苷酸的序列不等同于靶向染色体基因的序列。参见美国专利号6,271,360,其通过引用并入本文。
本文所述的突变还可使用修复模板通过诱变(随机、体细胞的(somatic)或定向的)和其他DNA编辑或核酸酶获得,所述修复模板包括但不限于使用锌指核酸酶、使用转录激活因子样效应子核酸酶(TALEN)、使用成簇的规律间隔的短回文重复序列(CRISPR)的靶向基因。这些核酸酶可为基于质粒(DNA)的、RNA和/或蛋白质。
微载体和微纤维
用于通过弹体侵彻(projectile penetration)将大片段的DNA引入具有纤维素细胞壁的植物细胞中的金属微载体(微球)的用途对相关领域技术人员是众所周知的(此后称为基因枪递送)。美国专利号4,945,050、5,100,792和5,204,253描述了用于选择微载体的通用技术和用于投射微载体的设备。美国专利号5,484,956和5,489,520描述了使用玉米愈伤组织的微粒轰击(microprojectile bombardment)来制备可育的转基因玉米。基因枪技术还在转化未成熟的玉米胚中使用。
在国际公布WO 99/07865中描述了在本公开的方法中使用微载体的具体条件。在说明性技术中,依次添加冰冷的微载体(60mg/ml)、混合双链寡核苷酸(60mg/ml)、2.5MCaCl2和0.1M亚精胺;将该混合物例如通过涡旋轻轻搅拌10分钟,并在室温下静置10分钟,随后将微载体在5体积的乙醇中稀释、离心并重悬于100%乙醇中。良好的结果可以在8-10μg/μl微载体、14-17μg/ml混合双链寡核苷酸、1.1-1.4M CaCl2和18-22mM亚精胺的粘附溶液中的浓缩物(concentration)获得。在8μg/μl微载体、16.5μg/ml混合双链寡核苷酸、1.3MCaCl2和21mM亚精胺的条件下观察到最佳结果。
也可使用微纤维穿透细胞壁和细胞膜而将寡核碱基引入至植物细胞中以实施本公开。Coffee等的美国专利号5,302,523(1994)描述了使用30X0.5μm和10X0.3μm的碳化硅纤维来促进黑墨西哥甜(Black Mexican Sweet)的悬浮玉米培养物的转化。可用于使用微纤维引入DNA用于植物细胞的转化的任何机械技术可用于递送寡核碱基,以在制造本发明的FAD2突变体中使用。在美国专利号5,302,523中由Coffee等公开的工艺可与可再生植物细胞材料一起采用以引入本发明的寡核碱基来影响FAD2基因的突变。
寡核碱基的微纤维递送的示例性技术为以下:将无菌微纤维(2μg)悬浮在150μl的包含约10μg混合双链寡核苷酸的植物培养基中。允许悬浮培养物沉降,并且将等体积的浓集细胞(packed cell)和无菌纤维/核苷酸悬液涡旋10分钟并铺板。对于特定性状适当的,将选择性培养基立即应用或以达约120小时的延迟应用。
电穿孔
在可替选的实施方式中,根据本领域普通技术人员众所周知的技术,通过来源于植物部分的原生质体的电穿孔将寡核碱基递送至植物细胞。参见,例如,Gallois等,1996,在Method in Molecular Biology 55:89-107中,Humana Press,Totowa,N.J.;Kipp等,1999,在Method in Molecular Biology 133:213-221,Humana Press,Totowa,N.J中。
寡核碱基还可通过电穿孔引入至小孢子中。释放四分体后,小孢子为单核且壁薄。在外孢壁形成之前,它开始扩大并发育出生殖孔。与其他植物细胞相比,在这个阶段的小孢子潜在地更服从用外源DNA转化。此外,小孢子发育可被体外改变,以产生可再生进入植物中的单倍体胚或胚性愈伤组织(Coumans等,Plant Cell Rep.7:618-621,1989;Datta等,Plant Sci.67:83-88,1990;Maheshwari等,Am.J Bot.69:865-879,1982;Schaeffer,Adv.In Cell Culture 7:161-182,1989;Swanson等,Plant Cell Rep.6:94-97,1987)。因此,转化的小孢子在通过标准方法染色体加倍后可直接被再生至单倍体植物或双倍体可育植物中。还参见标题为Composition and Methods for Plant genetic Modification(用于植物基因修饰的组合物和方法)共同待决的美国申请序列号09/680,858,其通过引用并入本文。
小孢子电穿孔可以可能进行小孢子培养的任何植物物种实践,其包括但不限于家族禾本科(Graminae)、豆科(Leguminoceae)、十字花科(Cruciferaceae)、茄科(Solanaceac)、葫芦科(Cucurbitaceae)、蔷薇科(Rosaccae)、早熟禾科(Poaceae)、百合科(Lilaceae)、芸香科(Rutaceae)、葡萄科(Vitaceae)中的植物,其包括这类物种如玉米(玉米(Zea mays))、小麦(小麦(Triticum aestivum))、大米(稻米(Oryzasativa))、燕麦、大麦、油菜(甘蓝型油菜(Brassica napus)、芜菁(Brassica rapa)、甘蓝(Brassicaoleracea)、芥菜(Brassica juncea))、棉花(棉花(Gossypium hirsuitum L.))、各种豆类物种(例如大豆(大豆(Glycine max))、豌豆(豌豆(Pisum sativum))等)、葡萄(葡萄(Vitisvinifera))和其他重要作物的宿主。来自花药和小孢子培养两者的小孢子胚胎发生已经在大于170种物种——其属于68个属和28个族的双子叶植物和单子叶植物——中描述(Raghavan,Embryogenesis in Angiosperms:A Developmental and ExperimentalStudy,Cambridge University Press,Cambridge,England,1986;Rhagavan,CellDifferentiation 21:213-226,1987;Raemakers等,Euphytica 81:93-107,1995)。为了详细讨论甘蓝型油菜中来自小孢子胚(MDE)的双单倍体植物的小孢子分离、培养和再生,参见Nehlin,The Use of Rapeseed(Brassica napus L.)Microspores as a Tool forBiotechnological Applications,doctoral thesis,Swedish University ofAgricultural Sciences,Uppsala,Sweden,1999;还参见Nehlin等,Plant Sci.111:219-227,1995和Nehlin等,Plant Sci.111:219-227,1995)。来自小孢子或花药培养的染色体加倍是用于几种作物中的双-单倍体纯合子植物系的生产的确立已久的技术(Heberle-Bors等,In vitro pollen cultures:Progress and perspectives.In:PollenBiotechnology.Gene expression and allergen characterization,第85-109卷,ed.Mohapatra,S.S.和Knox,R.B.,Chapman和Hall,New York,1996)。
小孢子电穿孔方法在Jardinaud等,Plant Sci.93:177-184,1993以及Fennell和Hauptman,Plant Cell Reports 11:567-570,1992中描述。用于MDON电穿孔进入植物原生质体的方法还可适合于在小孢子电穿孔中使用。
晶须技术
在还另一个可替选的实施方式中,可通过植物细胞的晶须或显微注射将寡核碱基递送至植物细胞。所谓晶须技术基本上如在Frame等,1994,Plant J.6:941-948中描述的进行。将寡核碱基添加至晶须并且用于转化植物细胞。寡核碱基可与包括编码能够在植物细胞中形成重组酶复合物的蛋白质的序列的质粒共孵育,使得在寡核苷酸和FAD2基因中的靶序列之间催化重组。
其他递送方法
在可替选的实施方式中,核酸被嵌入由藻酸钙组成的微珠中,并在膜修饰剂聚乙二醇的存在下通过植物原生质体吸收(参见,例如,Sone等,2002;Liu等,2004)。
在可替选的实施方式中,核酸在水中冷冻,并且通过轰击以微粒形式引入至植物细胞中(参见,例如,Gilmore,1991,美国专利5,219,746;Brinegar等)。
在可替选的实施方式中,通过在包含纳米颗粒的悬液中孵育细胞(参见,例如,Pasupathy等,2008),或通过粒子轰击将其递送至完整的细胞中,或通过共同孵育将其递送至原生质体中(参见,例如,Torney等,2007),将附着于纳米颗粒的核酸引入完整的植物细胞中。
在可替选的实施方式中,与穿透肽复合的核酸通过共同孵育递送入细胞中(参见,例如,Chugh等,2008,WO 2008148223 A1;Eudes和Chugh)。
在可替选的实施方式中,通过电穿孔将核酸引入完整的细胞中(参见,例如,He等,1998,美国2003/0115641Al,Dobres等)。
在可替选的实施方式中,通过将核酸在具有核酸的溶液中浸泡,将核酸递送入干胚胎细胞中(通过浸泡干胚胎(参见,例如,
Figure BDA0002711573350000321
等,1989,Senaratna等,1991)。
靶向基因修饰
由寡核苷酸介导的靶向基因的修饰是在短延伸的DNA的特定改变中使用以产生或制造缺失、短插入和点突变的有价值的技术,并且可与本文的公开内容结合使用,例如引起本文预期的一个或多个FAD2突变。在一些实施方式中,这些方法可涉及DNA配对/退火,随后是DNA修复事件。首先,在通过细胞蛋白因子介导的过程中,在双链DNA中核酸以其互补链退火。这种退火产生位于中心的错配碱基对(在点突变的情况下),从而产生结构扰乱(perturbation),其最有可能刺激内源性蛋白质体系以启动修复过程的第二步:染色体序列的位点特异性修饰和/或细胞器(例如线粒体和叶绿体)中的位点特异性修饰。该新引入的错配包括DNA修复体系以进行第二次修复事件,产生最终修正了靶位点。本文公开的各个方面和实施方式中的本发明方法和组合物可通过提供增加DNA修复组分的可用性的新颖方法,从而提高对靶向核酸的基因修复介导的修饰的效率和可再现性来改进方法。
对于研究临床基因疗法、工业微生物学和农业,用于定向位点基因组修饰的有效方法是期望的。一种方法利用三链形成寡核苷酸(TFO),其作为第三链以序列特异性方式结合至双链DNA,以介导定向诱变。这种TFO可以通过递送栓系诱变剂(tethered mutagen),如补骨脂素或苯丁酸氮芥(chlorambucil)(Havre等,Proc Nat’l Acad Sci,U.S.A 90:7879-7883,1993;Havre等,J Virol 67:7323-7331,1993;Wang等,Mol Cell Biol 15:1759-1768,1995;Takasugi等,Proc Nat’l Acad Sci,U.S.A 88:5602-5606,1991;Belousov等,Nucleic Acids Res 25:3440-3444,1997)或通过以足够亲和力结合以引发易于出错的修复(Wang等,Science 271:802-805,1996)来发挥作用。
可以与本文的组合物和方法结合使用的另一种基因组修饰策略涉及外源DNA片段和靶向基因之间的同源重组的诱导。该方法已经成功用于靶向和中断哺乳动物细胞中的选定基因,并且已能够生产携带特异性基因敲除基因的转基因小鼠(Capeechi等,Science244:1288-1292,1989;Wagner,美国专利号4,873,191)。该方法涉及可选择标记的转移,以允许所需的重组体的分离。在没有选择的情况下,在典型的基因转移实验中,转染的DNA的同源整合与非同源整合的比例是低的,通常在1:1000或更低的范围内(Sedivy等,GeneTargeting,W.H.Freeman and Co.,New York,1992)。该同源整合的这种低效率限制了基因转移用于实验用途或基因疗法中的效用。通过来自UV照射和选定的致癌物对靶向位点的损害(Wang等,Mol Cell Biol 8:196-202,1988)以及通过位点特异性内切酶(Sedivy等,GeneTargeting,W.H.Freeman and Co.,New York,1992;Rouet等,Proc Nat’l Acad Sci,U.S.A91:6064-6068,1994;Segal等,Proc Nat’l Acad Sci,U.S.A 92:806-810,1995)可提高靶向突变的频率。此外,由三重定向补骨脂素光加合物诱导的DNA损伤可刺激染色体外的载体内和染色体外的载体之间的重组(Segal等,Proc Nat’l Acad Sci,U.S.A 92:806-810,1995;Faruqi等,Mol Cell Biol 16:6820-6828,1996;Glazer,美国专利号5,962,426)。
线性供体片段比其环状对应物对靶向突变更有效(Folger等,Mol Cell Biol 2:1372-1387,1982)。在某些实施方式中,重组也可受到供体和靶向位点两者之间的不间断同源性的长度的影响,短片段常常似乎是无效的底物(Rubnitz等,Mol Cell Biol 4:2253-2258,1984)。尽管如此,用于基因校正的DNA或DNA/RNA混合物(hybrid)的短片段的使用是各种策略的重点。(Kunzelmann等,Gene Ther 3:859-867,1996)。
如本文使用的“核酸序列”、“核苷酸序列”和“多核苷酸序列”指的是寡核苷酸或多核苷酸及其片段或部分,并且指的是可以是单链或双链,代表有义链或反义链的基因组或合成来源的DNA或RNA。
如本文使用的,术语“寡核苷酸”和“寡聚物”指的是核碱基的聚合物。在一些实施方式中,“寡核苷酸”或“寡聚物”可具有至少约8个核碱基或可具有多达约1,500个核碱基或更多。在某些实施方式中,“寡核苷酸”或“寡聚物”可为如本文考虑的任何长度。
如本文使用的,术语“DNA-修饰分子”和“DNA-修饰试剂”指的是能够识别和特异性结合至细胞的基因组中的核酸序列的分子,并且能够修饰基因组内的靶核苷酸序列的分子,其中DNA-修饰分子与核酸序列的识别和特异性结合是蛋白质非依赖性的。本文中如与DNA-修饰分子关联使用的术语“蛋白质非依赖性的”意指DNA-修饰分子不需要用于核酸序列的识别和/或与核酸序列特异性结合的蛋白质和/或酶的存在和/或活性。DNA-修饰分子是示例性的,但不限于旨在促进基因转化的三链形成寡核苷酸、肽核酸、聚酰胺和寡核苷酸。在某些实施方式中,本公开的DNA-修饰分子区别于用于同源重组的现有技术的核酸序列(Wong&Capecchi,Molec.Cell.Biol.7:2294-2295,1987),因为用于同源重组的现有技术的核酸序列是蛋白质依赖性的。本文中如与分子关联使用的术语“蛋白质依赖性”意指分子需要用于核酸的识别和/或分子与核酸特异性结合的蛋白质和/或酶的存在和/或活性。用于测定DNA修饰分子是否需要用于核酸的识别和/或与核酸的特异性结合的蛋白质和/或酶的存在和/或活性的方法是在本领域的技术范围内(参见,例如,Dennis等,Nucl.AcidsRes.27:4734-4742,1999)。例如,在不存在任何蛋白质和/或酶的情况下,可将DNA修饰分子与核酸序列在体外孵育。DNA修饰分子和核酸序列之间的特异性结合的检测表明DNA修饰分子是蛋白质非依赖性的。另一方面,DNA修饰分子与核酸序列之间不存在特异性结合表明DNA修饰分子是蛋白质依赖性的和/或需要其他因素。
“三链形成寡核苷酸”(TFO)被定义为能够双链DNA或RNA螺旋的主要沟(grove)中结合以形成三螺旋的DNA或RNA的序列。尽管TFO不限于任何特定的长度,TFO的优选的长度为250个核苷酸或更少、200个核苷酸或更少或100个核苷酸或更少或5至50个核苷酸或10至25个核苷酸或15至25个核苷酸。尽管在TFO和双螺旋DNA之间序列特异性的程度对三螺旋的形成是必要的,但是只要能够形成三螺旋就不需要特定的特异性的程度。同样,只要能够形成三螺旋,就不需要在TFO和双螺旋之间特定程度的亲和性(avidity)或亲和力(affinity)。在一个实施方式中,不旨在限制TFO特异性结合的核苷酸序列的长度,但TFO特异性结合的核苷酸序列为1至100个核苷酸,在一些实施方式中5至50个核苷酸,在其他实施方式中10至25个核苷酸,在其他实施方式中15至25个核苷酸。此外,“三螺旋”被定义为具有结合至双螺旋核酸内的靶序列的寡核苷酸的双螺旋核酸。“双螺旋”核酸可为任何双链核酸,其包括双链DNA、双链RNA以及混合双螺旋的DNA和RNA。双链的核酸不限于任何特定的长度。然而,在优选的实施方式中,其具有大于500bp的长度、在一些实施方式中大于1kb的长度和在一些实施方式中大于约5kb的长度。在许多应用中,双螺旋核酸为细胞基因组核酸。三链形成寡核苷酸可以以平行或反平行方式结合至靶序列。
“肽核酸”、“聚酰胺”或“PNA”为核酸,其中磷酸骨架被基于N-氨基乙基甘氨酸的聚酰胺结构替换。遵循Watson-Crick碱基配对规则,PNA比它们的天然对应部分对互补的核酸具有更高的亲和力。PNA可与以下化学计量的DNA形成高度稳定的三螺旋结构:(PNA)2.DNA。尽管肽核酸和聚酰胺不限于任何特定的长度,肽核酸和聚酰胺的优选的长度为200个核苷酸或更短,在一些实施方式中100个核苷酸或更短和在一些实施方式中5至50个核苷酸长。尽管不旨在限制肽核酸和聚酰胺特异性结合的核苷酸序列的长度,但在一个实施方式中,肽核酸和聚酰胺特异性结合的核苷酸序列为1至100个核苷酸,在一些实施方式中5至50个核苷酸,还其他实施方式5至25个核苷酸,和其他实施方式5至20个核苷酸。
术语“能够修饰DNA”或“DNA修饰手段”指的是具有能力诱导或可帮助诱导对DNA的靶向片段的核苷酸序列的改变的程序以及内源性或外源性剂或试剂。这种改变可以通过对靶向DNA区段缺失、添加或取代一个或多个碱基来进行。DNA序列的改变不一定赋予由靶向序列编码的任何基因的功能改变。此外,针对任何特定的细胞部分或百分比进行DNA改变不是必需的。
术语“感兴趣的核苷酸序列”指的是本领域普通技术人员可以出于任何原因认为期望的对其操作的任何核苷酸序列。这种核苷酸序列包括但不限于结构基因的编码序列(例如,报告基因、选择标记基因、致癌基因、药物抗性基因、生长因子等),和不编码mRNA或蛋白质产物的非编码调控序列(例如,启动子序列、增强子序列、聚腺苷酸化序列、终止序列、如miRNA的调控RNA等)。
本文可交换地使用的“氨基酸序列”、“多肽序列”、“肽序列”和“肽”指的是氨基酸的序列。
如本文使用的“靶序列”指的是包括感兴趣的目标的序列的双螺旋核酸。在一些实施方式中,靶序列可为大于8个核苷酸的长度和在一些实施方式中小于1,500个核苷酸的长度。在一些实施方式中,靶序列在8至30个碱基之间。在一些实施方式中,靶序列可为在约75和250个碱基之间的长度。在某些实施方式中,靶序列可以为与本文考虑的寡核苷酸的长度互补的长度。通常,靶序列由双螺旋核酸的一条链上的核苷酸序列限定。
当提及双螺旋核酸序列的一条链上的核苷酸序列时,如本文所用的“富含嘌呤的序列”或“多嘌呤序列”被定义为核苷酸的连续序列,其中靶序列的大于50%的核苷酸包含嘌呤碱基。然而,优选的是富含嘌呤的靶序列包含大于60%的嘌呤核苷酸,在一些实施方式中大于75%的嘌呤核苷酸,在其他实施方式中大于90%的嘌呤核苷酸,并且在还其他实施方式中100%的嘌呤核苷酸。
当提及双螺旋核酸序列的一条链上的核苷酸序列时,如本文所用的“富含嘧啶的序列”或“多嘧啶序列”被定义为核苷酸的连续序列,其中靶序列的大于50%的核苷酸包含嘧啶碱基。然而,优选的是富含嘧啶的靶序列包含大于60%的嘧啶核苷酸,并且在一些实施方式中,大于75%的嘧啶核苷酸。在一些实施方式中,序列包含大于90%的嘧啶核苷酸,并且在其他实施方式中,为100%的嘧啶核苷酸。
第一核苷酸序列的“变体”被定义为与第一核苷酸序列不同的核苷酸序列(例如,通过具有可以使用杂交测定(hybridization assay)或DNA测序检测的一个或多个缺失、插入或替换)。在该定义内包括的是对第一核苷酸序列的基因组序列的改变或修饰的检测。例如,杂交测定可用于检测(1)当包含在基因组中时,能够与第一核苷酸序列杂交的限制性酶片段的模式改变(即RFLP分析),(2)第一核苷酸序列的选定部分不能与包含第一核苷酸序列的基因组DNA样品杂交(例如,使用等位基因特异性寡核苷酸探针),(3)不适当的或不期望的杂交,如除了对于第一核苷酸序列的正常染色体基因座,基因座的杂交(例如,使用荧光原位杂交(FISH)至中期染色体扩展等)。变体的一个实例是突变的野生型序列。
如本文使用的,术语“核酸”和“未修饰的核酸”指的是已知的四个脱氧核糖核酸碱基(即鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶)中的任何一种。术语“修饰的核酸”指的是其结构相对于未修饰的核酸的结构改变的核酸。说明性的这种修饰将是碱基的替换共价修饰,如氨基和环氮的烷基化以及双键的饱和。
当用于提及核酸序列时,如本文使用的,术语“突变”和“修饰”及其语法等同物可互换地用于指缺失、插入、替换、链断裂和/或加合物的引入。“缺失”定义为其中缺少一个或多个核苷酸的核酸序列的变化。“插入”或“添加”是产生一个或多个核苷酸的添加的核酸序列的变化。“替换”由通过与被替换的一个或多个核苷酸不同的分子的分子替换一个或多个核苷酸产生。例如,核酸可被不同的核酸替换,通过胞嘧啶、腺嘌呤、鸟嘌呤或尿苷替换胸腺嘧啶作为示例。嘧啶至嘧啶(例如,C至T或T至C核苷酸取代)或嘌呤至嘌呤(例如,G至A或A至G核苷酸取代)被称为转换(transition),而嘧啶至嘌呤或嘌呤至嘧啶(例如,G至T或G到C或A至T或A至C)被称为颠换(transversion)。可替选地,核酸可由修饰的核酸替换,通过胸腺嘧啶二醇替换胸腺嘧啶作为示例。突变可产生错配。术语“错配”指的是两个核酸之间的非共价相互作用,每个核酸位于不同的多核酸序列上,其不遵循碱基配对规则。例如,对于部分互补的序列5’-AGT-3’和5’-AAT-3’,存在G-A错配(转换)。术语“加合物的引入”或“加合物形成”指的是分子与DNA序列中的一个或多个核苷酸的共价或非共价键联,使得键联产生DNA复制和/或转录水平下降(在一些实施方式中由10%至100%,在其他实施方式中由50%至100%,并且在某些实施方式中为由75%至100%)。
术语“DNA切割物”指实现链断裂的部分。非限制性实例包括大范围核酸酶、TALE/TALEN、抗生素、锌指和CRISPR(其包括但不限于Cas9、Cpf1和它们相应的同源物、直系同源物和/或旁系同源物)、碱基编辑器或CRISPR/Cas系统。
当提及双链核酸序列时,术语“链断裂”包括单链断裂和/或双链断裂。单链断裂(切口)指的是双链核酸序列的两条链之一中的中断。这与双链断裂相反,双链断裂指的是双链核酸序列的两条链中的中断,其可能产生钝的(blunt)或交错的末端。链断裂可直接地(例如,通过电离辐射或用某些化学物质处理)或间接地(例如,通过在核酸碱基处的酶的切口)被引入双链核酸序列中。在某些实施方式中,DNA切割物可对于某些具体的序列具有选择性,比如在CRISPR(其包括但不限于Cas9、Cpf1和它们相应的同源物、直系同源物和/或旁系同源物)、碱基编辑器、锌指、大范围核酸酶、TALEN的情况下。
术语“突变体细胞”和“修饰的细胞”指的是在细胞的基因组序列中包含至少一个修饰的细胞。
当用于提及核苷酸序列时,术语“部分”指的是该核苷酸序列的片段。片段可以以5个核苷酸残基至整个核苷酸序列减去一个核酸残基的大小的范围。
据信DNA分子具有“5’端”和“3’端”,因为以一种单核苷酸戊糖环的5’磷酸通过磷酸二酯在一个方向上连接至其相邻的3’氧的方式单核苷酸反应制造寡核苷酸。因此,如果寡核苷酸的5’磷酸未连接至单核苷酸戊糖环的3’氧,则寡核苷酸的端部被称为“5’端”。如果寡核苷酸的3’氧未连接至另一个单核苷酸戊糖环的5’磷酸,则寡核苷酸的端部被称为“3’端”。如本文所用的核酸序列,即使在较大的寡核苷酸内部,也可以说具有5’和3’端。在线性或环状DNA分子中,离散元件被称为“下游”或3’元件的“上游”或5’。该术语反映了转录沿着DNA链在5’至3’方向进行。指导连接基因转录的启动子和增强子元件通常位于编码区的5’或上游。然而,即使当位于启动子元件和编码区的3’,增强子元件也可以发挥其作用。转录终止和聚腺苷酸化信号位于编码区的3’或下游。
如本文所用的术语“重组DNA分子”指的是包含通过分子生物学技术结合在一起的DNA区段的DNA分子。
如本文所用的术语“重组蛋白”或“重组多肽”指的是使用重组DNA分子表达的蛋白质分子。
如本文所用的术语“载体(vector)”和“媒介物(vehicle)”可互换地用于提及将一个或多个DNA区段从一个细胞转移到另一个细胞的核酸分子。
如本文所用的术语“以可操作的组合”、“以可操作的顺序”和“可操作地连接的”指的是以使得产生能够指导给定基因的转录的核酸分子和/或所需蛋白质分子的合成的这种方式的核酸序列的连接。术语还指的是以使得产生功能性蛋白质的这种方式的氨基酸序列的连接。
如本文所用的术语“转染”指的是将外源DNA引入细胞。转染可通过本领域已知的多种方式完成,其包括磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、聚凝胺介导的转染、电穿孔、显微注射、脂质体融合、脂质体、原生质体融合、逆转录病毒的感染、基因枪(即粒子轰击)等。
如本文使用的,术语“互补的”或“互补性”用于提及通过碱基配对规则相关的“多核苷酸”和“寡核苷酸”(其是指的是核苷酸序列的可互换的术语)。例如,序列“5’-CAGT-3’”是与序列“5’-ACTG-3’”互补的。互补性可为“部分”或“全部”。“部分”互补性是一个或多个核酸碱基根据碱基配对规则未错配的情况。核酸之间的“全部”或“完全”互补性是在碱基配对规则下,每个核酸碱基与另一个碱基匹配。核酸链之间的互补性程度对核酸链之间的杂交效率和强度可具有显著的影响。这在扩增反应以及依赖于核酸之间的结合的检测方法中可能特别重要。为了方便起见,术语“多核苷酸”和“寡核苷酸”包括包含核苷的分子。
本文中如提及核苷酸序列使用的术语“同源性”和“同源的”指的是与其他核苷酸序列的互补性程度。可能有部分同源性或完全同源性(即同一性)。当用于提及如cDNA或基因组克隆的双链核酸序列时,术语“基本上同源的”指的是如上所述在低严格性条件下,可与双链核酸序列的任一或两条链杂交的任何核酸序列(例如,探针)。与核酸序列部分互补,即“基本上同源的”核苷酸序列是至少部分抑制完全互补序列与靶核酸序列杂交的核苷酸序列。可在低严格性条件下使用杂交测定(Southern或Northern印迹、溶液杂交等)来检查完全互补序列与靶序列的杂交的抑制。基本上同源的序列或探针将在低严格性条件下竞争并抑制完全同源的序列与靶序列的结合(即杂交)。这并不是说低严格性的条件是允许这种非特异性结合;低严格性条件要求两个序列彼此的结合是特异性(即选择性的)相互作用。非特异性结合的不存在可通过使用甚至缺乏部分程度的互补性(例如,小于约30%同一性)的第二靶序列测试;在没有非特异性结合的情况下,探针将不与第二非互补靶杂交。
低严格性条件包括等同于下述的条件:在68℃,在包含5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4·H2O和1.85g/l EDTA,用NaOH将pH调节至7.4)、0.1%SDS、5×Denhardt试剂(50×Denhardt每500ml包含:5g聚蔗糖(400型,Pharmacia)、5g BSA(组分(Fraction)V;Sigma))和100μg/ml变性鲑鱼精DNA的溶液中的结合或杂交,随后当采用约100至约1000个核苷酸长度的探针时,在室温,在包括2.0×SSPE、0.1%SDS的溶液中洗涤。
此外,在高严格的条件下促进杂交的条件(例如,提高杂交和/或洗涤步骤的温度,在杂交溶液中使用甲酰胺等)在本领域中是众所周知的。当用于提及核酸杂交时,高严格条件包括等同于下述的条件:在68℃,在包含5×SSPE、1%SDS、5×Denhardt试剂和100μg/ml变性鲑鱼精DNA的溶液中的结合或杂交,然后当采用约100至约1000个核苷酸长度的探针时,在68℃在包含0.1×SSPE和0.1%SDS的溶液中洗涤。
在本领域中众所周知的,可以采用许多等同条件来包括低严格条件;可以改变如探针的长度和性质(DNA、RNA、碱基组成)和靶的性质(存在于溶液中或固定的DNA、RNA、碱基组成等等)和盐和其他组分(例如,存在或不存在甲酰胺、硫酸葡聚糖、聚乙二醇)的浓度以及杂交溶液的组分,以产生不同于但等同于以上列举条件的低严格杂交条件。
当如涉及感兴趣的杂交条件一样提及杂交条件时,术语“等同”意指杂交条件和感兴趣的杂交条件产生具有相同范围的百分比(%)同源性的核酸序列的杂交。例如,如果感兴趣的杂交条件产生第一核酸序列与和第一核酸序列具有50%至70%同源性的其他核酸序列的杂交,然后,如果另一个杂交条件还产生第一核酸序列与和第一核酸序列具有50%至70%同源性的其他核酸序列的杂交,则这个其他杂交条件被认为等同于感兴趣的杂交条件。
如本文所用,术语“杂交”用于提及使用任何过程的互补核酸的配对,通过该过程核酸链通过碱基配对与互补链结合(join)以形成杂交复合物。杂交和杂交强度(即核酸之间的缔合强度)受如核酸之间的互补程度、涉及条件的严格性、形成的杂交体的Tm和核酸内的G:C比例的因素影响。
如本文使用的,术语“杂交复合物”指的是通过互补的G和C碱基之间和互补的A和T碱基之间的氢键形成在两个核酸序列之间形成的复合物;这些氢键可通过碱基堆积相互作用进一步稳定。两个互补的核酸序列的氢以反平行的构型结合。杂交复合物可在溶液中形成(例如,Cot或Rot分析),或在存在于溶液中的一个核酸序列与固定至固体支持物(例如,Southern印迹和Northern印迹、斑点印迹采用的尼龙膜或硝化纤维素滤膜或在包括FISH(荧光原位杂交)的原位杂交中采用的载玻片)的另一个核酸序列之间形成。
如本文使用的,术语“Tm”用于提及“解链温度(melting temperature)”。解链温度是双链核酸分子群体一半变成解离的单链的温度。用于计算核酸的Tm的公式在本领域中是众所周知的。如标准参考文献指示的,当核酸在1M NaCl的水溶液中时,Tm值的简单估算值可通过公式:Tm=81.5+0.41(%G+C)计算(参见例如,Anderson和Young,QuantitativeFilter Hybridization,in Nucleic Acid Hybridization,1985)。其他参考文献包括更复杂的计算,其将结构以及序列特征考虑进Tm的计算。
如本文使用的,术语“严格”用于提及温度、离子强度和如有机溶剂的其他化合物的存在的条件,在该条件下进行核酸杂交。“严格”通常发生在约Tm-5℃(低于探针的解链温度5℃)至低于Tm约20℃至25℃的范围内。如本领域技术人员将理解的,严格杂交可用于鉴定或检测相同的多核苷酸序列或鉴定或检测相似或相关的多核苷酸序列。
当提及第一核苷酸序列与第二核苷酸序列的结合时,术语“特异性结合”、“结合特异性”及其语法等同物指的是与第二核苷酸序列与第三核苷酸序列之间的相互作用相比,第一核苷酸序列与第二核苷酸序列之间的优先相互作用。特异性结合是相对的术语,其不需要结合的绝对特异性;换句话说,术语“特异性结合”不需要在第二核苷酸序列和第三核苷酸序列之间不存在相互作用的情况下,第二核苷酸序列与第一核苷酸序列相互作用。而是,第一核苷酸序列和第二核苷酸序列之间的相互作用水平大于第二核苷酸序列和第三核苷酸序列之间的相互作用水平就足够了。第一核苷酸序列与第二核苷酸序列的“特异性结合”还意指第一核苷酸序列和第二核苷酸序列之间的相互作用取决于第一核苷酸序列上或第一核苷酸序列内的特定结构的存在;换句话说,第二核苷酸序列识别并结合至第一核苷酸序列之上或第一核苷酸序列内的特异性结构,而不是通常结合至核酸或核苷酸序列。例如,如果第二核苷酸序列对第一核苷酸序列上或第一核苷酸序列内的结构“A”有特异性,包含结构A的第三核酸序列的存在将减少结合至第一核苷酸序列的第二核苷酸序列的量。
如本文使用的,术语“可扩增的核酸”用于提及可通过任何扩增方法扩增的核酸。预期“可扩增的核酸”通常将包括“样品模板”。
可互换地使用的术语“异源核酸序列”或“异源DNA”指的是与自然界中未与之连接或在自然界中的不同位置与之连接的核酸序列连接的核苷酸序列。异源DNA对于引入其的细胞不是内源的,而是已经从另一细胞获得的。通常,尽管不是必要的,这种异源DNA编码通常不是由其表达的细胞产生的RNA和蛋白质。异源DNA的实例包括报告基因、转录和翻译调控序列、选择标记蛋白(例如,赋予耐药性的蛋白)等。
“扩增”定义为产生核酸序列的另外的拷贝,并且通常使用本领域众所周知的聚合酶链反应技术进行(Dieffenbach和Dveksler(1995)PCR Primer,a Laboratory Manua,Cold Spring Harbor Press,Plainview,N.Y.)。如本文使用的,术语“聚合酶链反应”(“PCR”)指的是通过引用并入本文的K.B.Mullis的美国专利号4,683,195和4,683,202的方法,其描述了用于增加基因组DNA混合物中靶序列片段浓度而无需克隆或纯化的方法。所需靶序列的扩增片段的长度由两个寡核苷酸引物相对于彼此的相对位置确定,因此,该长度是可控制的参数。由于该过程的重复方面,方法被称为“聚合酶链反应”(“PCR”)。由于靶序列的所需扩增区段成为混合物中的主要序列(就浓度而言),它们被称为“PCR扩增的”。
用PCR,可将基因组DNA中特异性靶序列的单拷贝扩增至通过几种不同方法(例如,与标记探针杂交;掺入生物素化引物,然后抗生物素蛋白-酶缀合物检测;将32P标记的脱氧核苷酸三磷酸如dCTP或dATP并入扩增的片段中)可检测的水平。除了基因组DNA之外,任何寡核苷酸序列可用适当的引物分子组扩增。特别地,通过PCR过程本身产生的扩增的区段本身是用于后续PCR扩增的有效模板。
一个这种优选的方法,特别是用于商业应用,是基于广泛使用的
Figure BDA0002711573350000431
实时PCR技术,并且将等位基因特异性PCR与封闭剂(ASB-PCR)组合以抑制野生型等位基因的扩增。ASB-PCR可用于检测从包括福尔马林固定的石蜡包埋的肿瘤标本的任何类型的组织中提取的DNA或RNA中的种系或体细胞突变。开发了一套试剂设计规则,能够针对野生型等位基因的背景,以千倍或更多量的灵敏度和选择性检测单点取代、插入或缺失(Morlan,Baker,Sinicropi Mutation Detection by Real-Time PCR:A Simple,Robust andHighly Selective Method.PLoS ONE 4(2):e4584,2009)。
术语“逆转录聚合酶链反应”和“RT-PCR”指的是用于RNA序列的逆转录以产生cDNA序列的混合物,随后增加混合物中转录的cDNA序列的所需区段的浓度而无需克隆或纯化的方法。通常,在使用两个引物PCR扩增转录的DNA的所需区段之前,使用单一引物(例如,oligo-dT引物)逆转录RNA。
如本文使用的,术语“引物”指的是寡核苷酸,无论其是以纯化的限制酶切消化天然地存在还是合成地产生,当置于其中诱导与核酸链互补的引物延伸产物的合成的条件(即,在核苷酸和诱导剂如DNA聚合酶的存在下以及在合适的温度和pH)下时,其能够充当合成的起始点。在一些实施方式中,引物是单链的,以实现最大的扩增效率,但是可替选地可为双链的。如果是双链的,在被用于制备延伸产物之前,首先对引物处理以分离其链。在一些实施方式中,引物是寡脱氧核糖核苷酸。引物必须足够长以在诱导剂存在下引发延伸产物的合成。引物的确切长度将取决于包括温度、引物来源和使用方法的许多因素。
如本文使用的,术语“探针”指的是寡核苷酸(即核苷酸的序列),无论是以纯化的限制酶切消化天然地存在还是合成地、重组地或通过PCR扩增产生,其能够与另一个感兴趣的寡核苷酸杂交。探针可为单链或双链的。探针可用于检测、鉴定和分离特定基因序列。可考虑本公开中使用的任何探针将用任何“报告分子”标记,使得其在任何检测系统中都是可检测的,其包括但不限于酶(例如ELISA,以及基于酶的组织化学检测)、荧光系统、放射性系统和发光系统。不旨在将本公开限制于任何特定的检测系统或标记。
如本文使用的,术语“限制性内切核酸酶”和“限制性酶”指的是细菌酶,它们各自在特定核苷酸序列例如IIS类型限制性内切核酸酶的内切核酸酶结构域处或附近切割或切刻双链或单链DNA(例如,可以使用FokI,如通过Kim等,1996,Proc.Nat’l.Acad.Sci.USA,6:1 156-60教导的)。
如本文使用的,术语“具有编码基因的核苷酸序列的寡核苷酸”意指包括基因的编码区的核酸序列,即编码基因产物的核酸序列。编码区可以以cDNA、基因组DNA或RNA形式存在。当以DNA形式存在时,寡核苷酸可为单链的(即有义链)或双链的。另外的,如果需要允许适当引起转录和/或正确处理初级RNA转录物,“具有编码基因的核苷酸序列的寡核苷酸”可包括合适的控制元件,如增强子、启动子、剪接点、聚腺苷酸化信号等。仍进一步的,本公开的编码区可以包含内源性增强子、剪接点、间插序列、聚腺苷酸化信号等。
真核生物中的转录控制信号包括“增强子”元件。增强子包括短阵列的DNA序列,其与转录中涉及的细胞蛋白特异性相互作用(Maniatis,T.等,Science 236:1237,1987)。增强子元件已从包括植物、酵母、昆虫和哺乳动物细胞及病毒中的基因的多种真核生物来源中分离出来。具体增强子的选择取决于什么样的细胞类型用于表达感兴趣的蛋白质。
表达载体上“剪接信号”的存在通常产生重组转录物的更高水平的表达。剪接信号介导从初级RNA转录物中去除内含子,并且由剪接供体和受体位点组成(Sambrook等,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor LaboratoryPress,New York,第16.7-16.8页,1989)。常用的剪接供体和受体位点是来自SV40的16SRNA的剪接点。
重组DNA序列在真核细胞中的有效表达需要指导所得转录物的有效终止和聚腺苷酸化的表达信号。转录终止信号通常在聚腺苷酸化信号的下游发现,并且是数百个核苷酸长度。如本文所用,术语“聚A位点”或“聚A序列”表示指导新生RNA转录物的终止和聚腺苷酸化两者的DNA序列。重组转录物的有效聚腺苷酸化是期望的,因为缺乏聚A尾巴的转录物是不稳定的并且迅速降解。表达载体中利用的聚A信号可为“异源的”或“内源的”。内源性聚A信号是在基因组中给定基因的编码区的3’端天然发现的信号。异源聚A信号是从一个基因分离并且置于另一基因的3’的信号。
如本文使用的术语“启动子”、“启动子元件”或“启动子序列”指的是当置于寡核苷酸序列的5’端(即之前)时能够控制寡核苷酸序列转录为mRNA的DNA序列。启动子通常位于转录成mRNA的寡核苷酸序列的5’(即上游),其控制并提供用于通过RNA聚合酶特异性结合和转录起始的位点。
当提及核酸序列时术语“启动子活性”指的是核酸序列引发寡核苷酸序列转录成mRNA的能力。
当应用于启动子时术语“组织特异性”指的是在不同类型的组织中相对缺乏相同寡核苷酸表达的情况下,能够将寡核苷酸序列的选择性表达引导至特定类型组织的启动子。启动子的组织特异性可通过例如以下来评估:将报告基因与启动子序列可操作地连接以产生报告基因构建体(reporter construct),将报告基因构建体引入植物或动物的基因组,使得报告基因构建体被整合到所得转基因动物的每个组织,并且检测转基因植物或动物的不同组织中的报告基因的表达(例如,检测mRNA、蛋白质或由报告基因编码的蛋白质的活性)。选择性不必是绝对的。检测到相对于其他组织中报告基因的表达水平的一个或多个组织中的报告基因的较高表达水平示出,启动子对检测到更高表达水平的组织有特异性。
应用于启动子的术语“细胞类型特异性”指的是在相同组织内不同类型的细胞中相对缺乏相同的寡核苷酸序列的表达的情况下,能够指导寡核苷酸序列在特定类型的细胞中选择性表达的启动子。当应用于启动子时术语“细胞类型特异性”还意指能够促进寡核苷酸在单一组织内的区域中选择性表达的启动子。同样,选择性不必是绝对的。可使用本领域众所周知的方法,例如本文所述的免疫组织化学染色,来评估启动子的细胞类型特异性。简言之,将组织切片包埋在石蜡中,并且使石蜡切片与对由启动子控制表达的寡核苷酸序列编码的多肽产物是特异性的初级抗体反应。作为石蜡切片的替选,可将样品冷冻切片。例如,切片可在切片之前和切片期间冷冻,从而避免残留石蜡的潜在干扰。对初级抗体特异性的标记的(例如,与过氧化物酶偶联的)第二抗体允许与切片组织结合,并且通过显微镜检测到特异性结合(例如,用抗生物素蛋白/生物素)。
术语“选择性表达”、“选择地表达”及其语法等同物指的是在两个或更多个感兴趣的区域中相对表达水平的比较。例如,当与组织结合使用时,“选择性表达”指的是分别与另一个组织中相同基因的表达水平和表达相同基因的细胞数量相比,在特定组织中感兴趣的基因的实质上更大的表达水平,或在该组织内表达基因的实质上更大的细胞数量(即选择性不一定是绝对的)。选择性表达虽然可包括但不要求在特定组织中表达感兴趣的基因,并且在另一组织中完全不表达相同的基因。类似地,关于细胞类型如本文使用的“选择性表达”指的是当分别与另一细胞类型中基因的表达水平和表达基因的细胞数量相比时,在特定细胞类型中的感兴趣的基因的实质上更大的表达水平,或表达感兴趣基因的实质上更大的细胞数量。
当用于提及两个或更多个核苷酸序列时,术语“连续的”意指在不存在间插序列的情况下或在存在不包括一个或多个控制元件的间插序列的情况下,将核苷酸序列串联连接。
如本文使用的,术语“核酸分子编码”、“核苷酸编码”、“DNA序列编码”和“DNA编码”指的是沿着脱氧核糖核酸的链的脱氧核糖核苷酸的顺序或序列。这些脱氧核糖核苷酸的顺序确定了沿着多肽(蛋白质)链的氨基酸顺序。因此,DNA序列编码氨基酸序列。
当涉及核酸使用时,如在“分离的寡核苷酸”中,术语“分离的”指的是与至少一种通常与其天然来源相关的杂质核酸分离的核酸序列。分离的核酸是以与自然界中发现的核酸不同的形式或背景存在的核酸。相反地,非分离的核酸是以它们在自然界中存在的状态发现的核酸,如DNA和RNA。例如,在邻近基因的附近宿主细胞染色体上发现了给定的DNA序列(例如,基因)。在细胞中发现了RNA序列(如编码特异性蛋白质的特异性mRNA序列)作为与许多其他编码多种蛋白质的mRNA的混合物。然而,编码感兴趣的多肽的分离的核酸包括,举例来说,通常表达感兴趣的多肽的细胞中的这种核酸,其中核酸在与天然细胞不同的染色体或位于染色体外的位置,或否则是与自然界中发现的核酸序列不同的核酸序列位于其两侧。分离的核酸或寡核苷酸可以以单链或双链形式存在。分离的核酸可通过多种技术(例如杂交、斑点印迹等)容易地鉴定(如果需要)。当利用分离的核酸或寡核苷酸表达蛋白质时,寡核苷酸将包含至少有义链或编码链(即寡核苷酸可为单链的)。可替选地,它可包含有义链和反义链两者(即寡核苷酸可为双链的)。
如本文使用的,术语“纯化的”(“purified”)或“纯化”(“to purify”)指的是去除来自样品的一种或多种(不希望的)组分。例如,重组多肽在细菌宿主细胞中表达,通过去除宿主细胞蛋白纯化多肽,从而增加样品中重组多肽的百分比。
如本文使用的,术语“基本上纯化的”指的是这样的分子,核酸序列或氨基酸序列,其从它们的天然环境去除、分离或分开,并且至少60%没有与它们天然缔合的其他组分,在一些实施方式中75%没有与它们天然缔合的其他组分,和其他实施方式中90%没有与它们天然缔合的其他组分。因此,“分离的多核苷酸”是基本上纯化的多核苷酸。
如本文使用的,术语“编码区”当用于提及结构基因时指的是编码在由于mRNA分子的翻译获得的新生多肽中发现的氨基酸的核苷酸序列。在真核生物中,编码区在5’侧通常被编码起始物蛋氨酸的核苷酸三连体“ATG”界定,并且在3’侧被指定终止密码子的三个三连体(即TAA、TAG、TGA)之一界定。
“编码序列”意指可以被转录和/或翻译以产生mRNA和/或多肽或其片段的核酸或其互补物或其部分的序列。编码序列包括基因组DNA或未成熟的初级RNA转录物中的外显子,其通过细胞的生化机制连接在一起以提供成熟的mRNA。反义链是这种核酸的互补物,并且可以从其推导编码序列。
“非编码序列”意指在体内未转录成氨基酸或tRNA不相互作用以放置或试图放置氨基酸的核酸或其互补物或其部分的序列。非编码序列包括基因组DNA或未成熟的初级RNA转录物中的两种内含子序列,和与基因相关的序列如启动子、增强子、沉默子等。
如本文使用的,术语“结构基因”或“结构核苷酸序列”指的是编码RNA或不控制其他基因表达的蛋白质的DNA序列。相反地,“调控基因”或“调控序列”是编码控制其他基因表达的产物(例如转录因子)的结构基因。
如本文使用的,术语“调控元件”指的是控制核酸序列表达的一些方面的遗传元件。例如,启动子是促进可操作连接的编码区的转录的起始的调节元件。其他调控元件包括剪接信号、聚腺苷酸化信号、终止信号等。
如本文使用的,术语“肽转录因子结合位点”或“转录因子结合位点”指的是结合蛋白质转录因子并由此控制核酸序列表达的一些方面的核苷酸序列。例如,Sp-1和AP1(激活蛋白1)结合位点是肽转录因子结合位点的实例。
如本文使用的,术语“基因”意指包括结构基因的编码区的脱氧核糖核苷酸序列。“基因”还可包括位于5’和3’端两者上与编码区相邻的非翻译序列,使得基因对应于全长mRNA的长度。位于编码区5’并且存在于mRNA上的序列被称为5’非翻译序列。位于编码区3’或下游并且存在于mRNA上的序列被称为3’非翻译序列。术语“基因”涵盖基因的cDNA和基因组形式两者。基因的基因组形式或克隆包含以被称为“内含子”或“间插区域”或“间插序列”的非编码序列打断的编码区。内含子是被转录成不均一核RNA(hnRNA)的基因片段;内含子可包含如增强子的调控元件。内含子从核或初级转录物中去除或“剪接”;因此,信使RNA(mRNA)转录物中不存在内含子。在翻译期间mRNA起作用以指定新生多肽中氨基酸的序列或顺序。
除了包含内含子,基因的基因组形式还可包括位于RNA转录物上存在的序列的5’和3’端上的序列。这些序列被称为“侧翼”序列或区域(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’侧翼区可包含调控序列如控制或影响基因转录的启动子和增强子。3’侧翼区可包含指导转录终止,转录后切割和聚腺苷酸化的序列。
“非人类动物”指不是人类的任何动物,并且包括脊椎动物如啮齿动物、非人类灵长类动物、绵羊、牛、反刍动物、兔类动物、猪、山羊、马、犬、猫科动物、鸟类等等。优选的非人类动物选自啮齿目。“非人类动物”另外指的是两栖动物(例如非洲爪蟾)、爬行动物、昆虫(例如果蝇)和其他哺乳动物的物种。
如本文使用的,术语“转基因的”指的是具有衍生自另一有机体的DNA的有机体或细胞,被插入所述有机体或细胞中的所述衍生自另一有机体的DNA被整合入植物或动物的体细胞和/或种系细胞的基因组中。“转基因”意指这样的DNA序列,其与在其中发现转基因的植物或动物部分地或完全地异源的(即在自然中不存在),或其与内源性序列(即在自然中的动物中发现的序列)同源的,并且在不同于天然存在的序列的位置被插入植物或动物的基因组。包括一种或多种转基因的转基因植物或动物在本公开的范围内。此外,如本文使用的“转基因的”指的是已经具有通过本公开的方法、通过同源重组、TFO突变或通过相似的工艺修饰和/或“敲除”(使得非功能的或使以较低的水平起作用,即“敲除”突变)的一个或多个基因的有机体。例如,在一些实施方式中,转基因有机体或细胞包括包含外来启动子和/或编码区的插入的DNA。
“转化的细胞”是已获得在细胞培养物中多代生长的能力、在软琼脂中生长的能力和/或不受通过细胞-至-细胞接触抑制的细胞生长的能力的细胞或细胞系。在这方面,转化指的是将外来遗传物质引入细胞或有机体。转化可通过任何已知的允许将核酸成功地引入细胞并且产生引入的核酸的表达的方法来完成。“转化”包括但不限于如转染、显微注射、电穿孔、核转染和脂质转染(脂质体介导的基因转移)的方法。转化可通过使用任何表达载体来完成。例如,考虑使用杆状病毒以将外来核酸引入昆虫细胞。术语“转化”还包括如P元素介导的整个昆虫的种系转化的方法。另外的,转化指的是通常通过基因突变已自然地被转化的细胞。
如本文使用的,“外源的”意指编码蛋白质的基因在细胞中未被正常表达。另外的,“外源的”指的是转染到细胞中以增强基因的正常(即天然)表达水平的基因。
肽序列和核苷酸序列可为“内源的”或“异源的”(即“外来的”)。术语“内源的”指的是在引入其的细胞中自然地发现的序列,只要其相对于天然存在的序列不包含一些修饰。术语“异源的”指的是在引入其的细胞中不是内源性的序列。例如,异源DNA包括这样的核苷酸序列,其连结至或被操控以被连结至在自然界中不连结或在自然界中在不同位置处连接的核酸序列。异源DNA还包括在引入其的细胞中自然地发现的并且相对于天然存在的序列包含一些修饰的核苷酸序列。通常,尽管不是必须的,异源DNA编码异源RNA和未通过引入其的细胞正常产生的异源蛋白质。异源DNA的实例包括报告基因、转录和翻译调控序列、编码可选择的标记蛋白(例如,赋予耐药性的蛋白)的DNA序列。
在本文的公开内容的某些方面和实施方式中,提供了将基因修复寡核碱基(GRON)介导的突变引入至植物细胞中的靶脱氧核糖核酸(DNA)序列的方法;例如,为了修饰如本文提供的FAD2基因的目的。在某些实施方式中,方法可尤其包括,在将GRON递送至植物细胞和/或将大于15个碱基长度的GRON递送至植物细胞之前和/或同时,在增加一种或多种细胞DNA修复过程的条件下培养植物细胞;GRON任选地包括一个或多个或两个或更多个突变位点(如本文提供的FAD2突变位点)以引入靶DNA。
如本文使用的,“基因修复寡核苷酸”或“GRON”意指可以在某些条件下指导单个或在一些实施方式中多个在DNA序列中的核苷酸缺失、插入或取代的寡核碱基(例如,混合双链寡核苷酸、含非核苷酸的分子、单链寡脱氧核苷酸、双链寡脱氧核苷酸和其他基因修复分子)。基因组的该寡核苷酸介导的基因修复编辑可包括基于非同源性的修复系统(例如,非同源末端连接)和基于同源性的修复系统(例如,同源性指导的修复)两者。除了设计的错配以外,GRON通常被设计为与基因组目标对齐排列。这些错配可通过控制一个或多个细胞的内源性DNA修复系统来识别和纠正。在一些实施方式中,当与有机体靶序列相比时,GRON或寡核苷酸可被设计为包含多个差异。这些差异可能不会全部影响从所述靶序列翻译的蛋白质序列,并且在一种或多种情况下被称为沉默改变。GRON结构、化学和功能的许多变化在本文其他地方描述。在各种实施方式中,如本文使用的GRON可具有一个或多个修饰。例如,如本文使用的GRON可具有一个或多个修饰,其吸引了DNA修复机制至靶向(错配)位点和/或防止GRON的部分或全部重组(除了所需的靶向缺失、插入、取代等等)入靶DNA序列的基因组DNA中和/或增加GRON的稳定性。
在各种实施方式中,GRON可具有RNA和DNA核苷酸两者和/或其他类型的核碱基。在一些实施方式中,一个或多个DNA或RNA核苷酸包含修饰。
在一个方面中,提供了引起植物细胞中的基因变化(例如,FAD2基因的基因变化)的方法,其中方法包含将细胞暴露于DNA切割物和GRON,例如本文考虑的修饰的GRON。在一些实施方式中,GRON可例如用Cy3基团、3PS基团、2’O-甲基或如本文考虑的其他修饰来修饰。在另一个方面中,提供了包括DNA切割物和GRON(如结合和/或修饰FAD2基因的GRON)的植物细胞,例如其中GRON如用Cy3基团、3PS基团、2’O-甲基或其他修饰来修饰。在一些实施方式中,DNA切割物为选自下述中的一种或多种:CRISPR(其包括但不限于Cas9、Cpf1和它们相应的同源物、直系同源物和/或旁系同源物)、碱基编辑器、TALEN、锌指、大范围核酸酶和切割DNA的抗生素。在一些实施方式中,DNA切割物为CRISPR(其包括但不限于Cas9、Cpf1和它们相应的同源物、直系同源物和/或旁系同源物)、碱基编辑器。在一些实施方式中,DNA切割物为TALEN。DNA切割物可为基于质粒(DNA)的、RNA和/或蛋白质。在一些实施方式中,GRON是在15和60个核碱基长度之间;或在30和40个核碱基长度之间;或35和45个核碱基长度之间;或在20和70个核碱基长度之间;或在20和200个核碱基长度之间;或在30和180个核碱基长度之间;或在50和160个核碱基长度之间;或在70和150个核碱基长度之间;或在80和120个核碱基长度之间;或在90和110个核碱基长度之间;或在95和105个核碱基长度之间;或在80和300个核碱基长度之间;或在90和250个核碱基长度之间;或在100和150个核碱基长度之间;或在100和300个核碱基长度之间;或在150和200个核碱基长度之间;或在200和300个核碱基长度之间;或在250和350个核碱基长度之间;或在50和110个核碱基长度之间;或在50和200个核碱基长度之间;或在150和210个核碱基长度之间;或在20和1000个核碱基长度之间;或在100和1000个核碱基长度之间;或在200和1000个核碱基长度之间;或在300和1000个核碱基长度之间;或在400和1000个核碱基长度之间;或在500和1000个核碱基长度之间;或在600和1000个核碱基长度之间;或在700和1000个核碱基长度之间;或在800和1000个核碱基长度之间;或在900和1000个核碱基长度之间;或在300和800个核碱基长度之间;或在400和600个核碱基长度之间;或在500和700个核碱基长度之间;或在600和800个核碱基长度之间;或长于30个核碱基长度;或长于35个核碱基长度;或长于40个核碱基长度;或长于50个核碱基长度;或长于60个核碱基长度;或长于65个核碱基长度;或长于70个核碱基长度;或长于75个核碱基长度;或长于80个核碱基长度;或长于85个核碱基长度;或长于90个核碱基长度;或长于95个核碱基长度;或长于100个核碱基长度;或长于110个核碱基长度;或长于125个核碱基长度;或长于150个核碱基长度;或长于165个核碱基长度;或长于175个核碱基长度;或长于200个核碱基长度;或长于250个核碱基长度;或长于300个核碱基长度;或长于350个核碱基长度;或长于400个核碱基长度;或长于450个核碱基长度;或长于500个核碱基长度;或长于550个核碱基长度;或长于600个核碱基长度;或长于700个核碱基长度;或长于800个核碱基长度;或长于900个核碱基长度。
GRON可在靶基因的非编码(NC)区和编码(C)区两者被靶向。
如本文使用的术语“CRISPR”指的是元件;即Cas(CRISPR相关的)基因、转录物(例如,mRNA)和/或蛋白质和至少一个CRISPR间隔区序列(成簇的规律间隔的短回文重复序列,也称为SPIDR—间隔穿插直接重复序列);当在细胞中有效地存在或表达时,其可通过CRISPR/CAS细胞机制影响靶DNA序列的断裂,如例如,Cong等,Science,第339卷,6121期,第819-823页(2013);Jinek等,Science,第337卷:816-821(2013);Wang等,RNA,第14卷,第903-913页(2008);Zhang等,Plant Physiology,第161卷,第20-27页(2013),Zhang等,PCT申请号PCT/US2013/074743和Charpentier等,PCT申请号PCT/US2013/032589中描述的。在一些实施方式中,如例如用于真核细胞中的CRISPR,如本文考虑的CRISPR还可包括另外的元件,其包括用于一个或多个功能性核定位信号的序列。如本文考虑的CRISPR可以以许多方式或表现表达在细胞(如植物细胞)中、施用至细胞(如植物细胞)和/或存在于细胞(如植物细胞)中。例如,本文考虑的CRISPR可包括或涉及质粒上的CRISPR、质粒上的CRISPR切口酶、质粒上的CRISPRa或质粒上的CRISPRi的一种或多种,如下:
质粒上的CRISPR:重组表达载体包括:
(i)编码DNA-靶向RNA(例如,向导RNA)的核苷酸序列,其中DNA-靶向RNA包括:
a.包括与靶DNA中的序列互补的核苷酸序列的第一区段(例如,前间隔序列(protospacer)、间隔序列或crRNA);和
b.与位点定向修饰多肽相互作用的第二区段(例如,反式激活crRNA或tracrRNA);以及
(ii)编码位点定向修饰多肽的核苷酸序列(例如,Cas基因),其中位点定向多肽包括:
a.与DNA-靶向RNA相互作用的RNA-结合部分(例如,REC叶片(lobe));和
b.引起靶DNA内双链断裂的活性部分(例如,NUC叶片),其中靶DNA内双链断裂的位点由DNA-靶向RNA决定。
质粒上的CRISPR切口酶。重组表达载体包括:
(i)编码DNA-靶向RNA(例如,向导RNA)的核苷酸序列,其中DNA-靶向RNA包括:
a.包括与靶DNA中的序列互补的核苷酸序列的第一区段(例如,前间隔序列、间隔序列或crRNA);和
b.与位点定向修饰多肽相互作用的第二区段(例如,反式激活crRNA或tracrRNA);以及
(ii)编码位点定向修饰多肽的核苷酸序列(例如,Cas基因),其中位点定向多肽包括:
a.与DNA-靶向RNA相互作用的RNA-结合部分(例如,REC叶片);和
b.引起靶DNA内单链断裂的活性部分(例如,NUC叶片),其中靶DNA内单链断裂的位点由DNA-靶向RNA决定。
质粒上的CRISPRa。重组表达载体包括:
(i)编码DNA-靶向RNA(例如,向导RNA)的核苷酸序列,其中DNA-靶向RNA包括:
a.包括与靶DNA中的序列互补的核苷酸序列的第一区段(例如,前间隔序列、间隔序列或crRNA);和
b.与位点定向修饰多肽相互作用的第二区段(例如,反式激活crRNA或tracrRNA);以及
(ii)编码位点定向修饰多肽的核苷酸序列(例如,Cas基因),其中位点定向多肽包括:
a.与DNA-靶向RNA相互作用的RNA-结合部分(例如,REC叶片);和
b.调节靶DNA内的转录的活性部分(例如,NUC叶片;在某些实施方式中增加转录),其中靶DNA内转录调节的位点由DNA-靶向RNA决定。
质粒上的CRISPRi。重组表达载体包括:
(i)编码DNA-靶向RNA(例如,向导RNA)的核苷酸序列,其中DNA-靶向RNA包括:
a.包括与靶DNA中的序列互补的核苷酸序列的第一区段(例如,前间隔序列、间隔序列或crRNA);和
b.与位点定向修饰多肽相互作用的第二区段(例如,反式激活crRNA或tracrRNA);以及
(ii)编码位点定向修饰多肽的核苷酸序列(例如,Cas基因),其中位点定向多肽包括:
a.与DNA-靶向RNA相互作用的RNA-结合部分(例如,REC叶片);和
b.调节靶DNA内转录/翻译的活性部分(例如,NUC叶片;在某些实施方式中减少转录/翻译),其中靶DNA内转录/翻译调节的位点由DNA-靶向RNA决定。
在一些实施方式中,质粒上的CRISPR、质粒上的CRISPR切口酶、质粒上的CRISPRa和质粒上的CRISPRi各自可替换地具有一种或多种适当的元件,其作为RNA(例如,mRNA)或蛋白质在细胞中而不是在质粒上被施用、表达或存在。受保护的mRNA的递送可在Kariko等的美国专利号8,278,036中描述。
在一些实施方式中,CRISPRi和CRISPRa各自可包括失活的cas9(dCas9)。失活的cas9仍结合至靶DNA,但是不具有切割活性。缺乏核酸酶的Cas9可由使其两个催化结构域失活的D10A和H840A点突变造成。
在一些实施方式中,CRISPRi通过RNA聚合酶II的位阻抑制转录起始或延伸。CRISPRi可任选地通过强大的阻遏结构域与dCas9蛋白的C终端末端的融合被增强(CRISPRei)。在一些实施方式中,阻遏结构域募集和采用染色质修饰剂。在一些实施方式中,阻遏结构域可包括但不限于如在Kagale等,Epigenes,第6卷,第2期,第141-146页(2011)中描述的结构域:
1、LDLNRPPPVEN(SEQ ID NO:9)-OsERF3阻遏结构域(“LxLxPP”基序)
2、LRLFGVNM(SEQ ID NO:10)-AtBRD阻遏结构域(“R/KLFGV”基序)
3、LKLFGVWL(SEQ ID NO:11)-AtHsfB1阻遏结构域(“R/KLFGV”基序)
4、LDLELRLGFA(SEQ ID NO:12)-AtSUP阻遏结构域(“EAR”基序)
5、ERSNSIELRNSFYGRARTSPWSYGDYDNCQQDHDYLLGFSWPPRSYTCSFCKREFRSAQALGGHMNVHRRDRARLRLQQSPSSSSTPSPPYPNPNYSYSTMANSPPPHHSPLTLFPTLSPPSSPRYRAGLIRSLSPKSKHTPENACKTKKSSLLVEAGEATRFTSKDACKILRNDEIISLELEIGLINESEQDLDLELRLGFA*(SEQ ID NO:13)-含有阻遏结构域(“EAR”基序)的全At SUP基因
在一些实施方式中,转录的CRISPRa激活通过使用含有融合的C终端末端转录激活因子的dCas9蛋白实现。在一些实施方式中,激活可包括但不限于VP64(4X VP16)、AtERF98激活结构域或AtERF98x4串联体,如在Cheng等,Cell Research,第1-9页(2013);Perez-Pinera等,Nature Methods,第10卷,第913-976页(2013);Maeder等,Nature Methods,第10卷,第977-979页(2013)和Mali等,Nature Biotech.,第31卷,第833-838页(2013)中描述的。
在一些实施方式中,CRISPR包括切口酶。在某些实施方式中,使用两种或更多种CRISPR切口酶。在一些实施方式中,两种或更多种切口酶在靶核酸的相对链上切割。在其他实施方式中,两种或更多种切口酶在靶核酸的相同链上切割。
如本文使用的“阻遏蛋白”或“阻遏物”(“repressor”)指的是结合至DNA的操纵子或RNA以分别地阻止转录或翻译的蛋白。
如本文使用的“阻遏”(“repression”)指的是通过阻遏蛋白与DNA或mRNA上的特异性位点的结合对转录或翻译的抑制。在一些实施方式中,阻遏包括至少1.5倍、在其他实施方式中至少两倍和在其他实施方式中至少五倍的转录或翻译水平的显著变化。
如本文使用的,关于基因转录和/或翻译的“激活蛋白”或“激活因子”(“activator”)指的是结合至DNA的操纵子或RNA以分别地提高或增加转录或翻译的蛋白。
如本文关于基因转录和/或翻译使用的,关于基因转录和/或翻译的“激活”(“activation”)指的是通过激活蛋白与DNA或mRNA上的特异性位点的结合提高或增加转录或翻译。在一些实施方式中,激活包括至少1.5倍、在一些实施方式中至少两倍和在一些实施方式中至少五倍的转录或翻译水平的显著变化。
在某些实施方式中,增加一个或多个细胞DNA修复过程的条件可包括以下中的一个或多个:将一个或多个为碱基切除修复的靶的位点引入GRON或植物细胞DNA中、将一个或多个为非同源的末端连接的靶的位点引入GRON或植物细胞DNA中、将一个或多个为微同源性(microhomology)介导的末端连接的靶的位点引入GRON或植物细胞DNA中、将一个或多个为同源重组的靶的位点引入GRON或植物细胞DNA中和将一个或多个为实现修复(例如,碱基切除修复(BER);同源的重组修复(HR);错配修复(MMR);包括经典的和替换的NHEJ的非同源的末端连接修复(NHEJ)和核苷酸切除修复(NER))的靶的位点引入GRON或植物细胞DNA中。
如本文所述的,本文使用的GRON可包括来自常规RNA和DNA核苷酸的以下(非限制性)变化的一个或多个:
一个或多个无碱基核苷酸;
一个或多个8’氧代dA和/或8’氧代dG核苷酸;
在其3’末端处的反向碱基;
一个或多个2’O-甲基核苷酸;
一个或多个RNA核苷酸;
在其5’端处的一个或多个RNA核苷酸和在一些实施方式中2、3、4、5、6、7、8、9、10个或更多个;其中RNA核苷酸中的一个或多个可进一步被修饰;在其3’端处的一个或多个RNA核苷酸和在一些实施方式中2、3、4、5、6、7、8、9、10个或更多个;其中RNA核苷酸的一个或多个可进一步被修饰;
在其5’端处的一个或多个2’O-甲基RNA核苷酸和在一些实施方式中2、3、4、5、6、7、8、9、10个或更多个;
嵌入染料;
5’末端帽;
主链修饰选自硫代磷酸酯修饰、甲基膦酸酯修饰、锁核酸(LNA)修饰、O-(2-甲氧基乙基)(MOE)修饰、双PS修饰和肽核酸(PNA)修饰组成的组;
一个或多个链内交联;
一种或多种其共轭的荧光染料和在一些实施方式中在GRON的5’或3’端处;以及
一个或多个增加杂交能量的碱基。
如本文使用的术语“摆动碱基”指的是参考核苷酸序列的一个或多个核苷酸碱基中的改变,其中该改变相对于参考序列不改变由核苷酸编码的氨基酸的序列。
如本文使用的术语“非核苷酸”或“无碱基核苷酸”指的是可被并入至核酸链替换一个或多个核苷酸单元的任何基团或化合物,其包括糖和/或磷酸根取代,并且允许剩余的碱基展现出它们的酶促活性。基团或化合物是无碱基的,因为其不包含普遍地公认的核苷酸碱基,如腺苷、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶。如本领域和本文中描述的,其可具有对2’或3’H或OH的取代。
如本文所述的,在某些实施方式中,GRON质量和转化效率可使用核苷酸多聚体,如二聚体、三聚体、四聚体等通过合成GRON的全部或部分,提高其纯度来改善。
在某些实施方式中,靶脱氧核糖核酸(DNA)序列是在植物细胞内,例如靶DNA序列是在植物细胞基因组中。植物细胞可为非转基因的或转基因的,并且靶DNA序列可为植物细胞的转基因或内源性基因。
在某些实施方式中,增加一个或多个细胞DNA修复过程的条件包括将GRON递送至植物细胞之前或同时或之后,将一种或多种诱导单链或双链DNA断裂的化合物引入至植物细胞中。示例性化合物为本文所描述的。
在某些实施方式中,方法进一步包括从植物细胞再生具有由GRON引入的突变的植物,并且可包括从植物收集种子。
在相关的方面,本公开涉及包括根据本文所述的方法由GRON引入的基因组修饰的植物细胞、包括根据本文所述的方法由GRON引入的基因组修饰的植物;或包括根据本文所述的方法由GRON引入的基因组修饰的种子;或包括根据本文所述的方法由GRON引入的基因组修饰的种子的后代。
构建体
本文公开的核酸分子(例如,位点特异性核酸酶,或用于CRISPR的向导RNA)可用于生产重组核酸构建体。在一个实施方式中,本公开的核酸分子可用于制备核酸构建体,例如,用于在感兴趣的植物、微生物或动物中表达的表达盒,如任选地具有如本文所述的一种或多种突变的FAD2表达构建体。当构建体未整合到宿主基因组中或未在启动子赋予的控制下维持,这种表达例如是瞬时的,并且如果其被整合,构建体的位置在宿主基因组内。
表达盒可包括可操作地连接至本文公开的位点特异性核酸酶或向导RNA序列的调控序列。盒可另外地包含至少一个另外的基因以被共转化为有机体。可替选地,另外的一个或多个基因可在多个表达盒上提供。
核酸构建体可以用于位点特异性核酸酶编码序列的插入的多个限制性位点提供,使其处于调控区的转录调控下。核酸构建体可另外地包含编码可选择的标记基因的核酸分子。
任何启动子可用于核酸构建体的生产。对于本文公开的植物、微生物或动物宿主核酸序列,启动子可为天然的或类似的,或外来的或异源的。另外地,启动子可为天然序列或可替选地合成序列。在启动子对于植物、微生物或动物宿主而言是“外来的”或“异源的”情况下,意指在引入启动子的天然的植物、微生物或动物中未发现启动子。如本文使用的嵌合基因包括可操作地连接至与编码序列异源的转录起始区的编码序列。
本文公开的位点定向核酸酶序列可使用异源启动子表达。
任何启动子可用于制备构建体以控制位点定向核酸酶序列的表达,如提供组成型、组织优选的、诱导型的启动子或其他启动子,用于在植物、微生物或动物中表达。组成型启动子包括,例如,在WO 99/43 838和美国专利号6,072,050中公开的Rsyn7启动子的核心启动子和其他组成型启动子;核心CaMV 35S启动子(Odell等,Nature 313:810-812;1985);水稻肌动蛋白(McElroy等,Plant Cell 2:163-171;1990);泛素(Christensen等,PlantMol.Biol.12:619-632,1989和Christensen等,Plant Mol.Biol.18:675-689,1992);pEMU(Last等,Theor.Appl.Genet.81:581-588,1991);MAS(Velten等,EMBO J.3:2723-2730,1984);ALS启动子(美国专利号5,659,026)等等。其他组成型启动子包括,例如,美国专利号5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611。
组织优选的启动子可被用于指导特定植物组织内的位点定向核酸酶表达。这种组织优选的启动子包括但不限于叶优选的启动子、根优选的启动子、种子优选的启动子和茎优选的启动子。组织优选的启动子包括Yamamoto等,Plant J.12(2):255-265,1997;Kawamata等,Plant Cell Physiol.38(7):792-803,1997;Hansen等,Mol.Genet.254(3):337-343,1997;Russell等,Transgenic Res.6(2):157-168,1997;Rinehart等,PlantPhysiol.112(3):1331-1341,1996;Van Camp等,Plant Physiol.1 12(2):525-535,1996;Canevascini等,Plant Physiol.112(2):513-524,1996;Yamamoto等,Plant CellPhysiol.35(5):773-778,1994;Lam,Results Probl.Cell Differ.20:181-196,1994;Orozco等,Plant Mol Biol.23(6):1129-1138,1993;Matsuoka等,Proc Nat’l.Acad.Sci.USA 90(20):9586-9590,1993和Guevara-Garcia等,Plant J.4(3):495-505,1993。
核酸构建体还可包含转录终止区。当使用转录终止区时,在核酸构建体的制备中可以使用任何终止区。例如,终止区可衍生自另一种来源(即对启动子而言是外来的或异源的)。用于本公开的构建体中可获得的终止区的实例包括来自根癌农杆菌(A.tumefaciens)的Ti质粒的那些,如章鱼碱合成酶和胭脂碱合成酶终止区。还参见Guerineau等,Mol.Gen.Genet.262:141-144,1991;Proudfoot,Cell 64:671-674,1991;Sanfacon等,Genes Dev.5:141-149,1991;Mogen等,Plant Cell 2:1261-1272,1990;Munroe等,Genes91:151-158,1990;Ballas等,Nucleic Acids Res.17:7891-7903,1989和Joshi等,NucleicAcids Res.15:9627-9639,1987。
连同本文公开的任何方面、实施方式、方法和/或组合物,可优化核酸以增加在转化植物中的表达。即,可使用植物优选的密码子合成编码位点定向核酸酶蛋白的核酸以提高表达。参见,例如,Campbell和Gowri,(Plant Physiol.92:1-11,1990)关于宿主优选的密码子使用的讨论。用于合成植物优选的基因的方法在本领域是可获得的。参见,例如,美国专利号5,380,831和5,436,391和Murray等,Nucleic Acids Res.17:477-498,1989。还参见例如,Lanza等,BMC Systems Biology 8:33-43,2014;Burgess-Brown等,ProteinExpr.Purif.59:94-102,2008;Gustafsson等,Trends Biotechnol 22:346-353,2004。
此外,可对本文公开的核酸序列进行其他序列修饰。例如,已知另外的序列修饰以增强细胞宿主中的基因表达。这些包括消除编码假聚腺苷酸化(spuriouspolyadenylation)信号、外显子/内含子剪接位点信号、转座子样重复序列的序列,以及其他这种可对基因表达有害的良好表征的序列。序列的G-C含量也可调节至靶细胞宿主的平均水平,如通过参照宿主细胞中表达的已知基因计算的。此外,可修饰序列以避免预测的发夹二级mRNA结构。
其他核酸序列也可用于制备本公开的构建体,例如以增强位点定向核酸酶编码序列的表达。这种核酸序列包括玉米AdhI的内含子,内含子基因(intronl gene)(Callis等,Genes and Development 1:1183-1200,1987)和来自烟草花叶病毒(Tobacco Mosaicvirus)(TMV)、玉米绿斑驳病毒(Maize Chlorotic Mottle Virus)和苜蓿花叶病毒(Alfalfa Mosaic Virus)的前导序列(W-序列)(Gallie等,Nucleic Acid Res.15:8693-8711,1987和Skuzeski等,Plant Mol.Biol.15:65-79,1990)。来自玉米的收缩-1(shrunken-1)基因座的第一内含子已经示出增加嵌合基因构建体中基因的表达。美国专利号5,424,412和5,593,874公开了在基因表达构建体中特异性内含子的用途,并且Gallie等(Plant Physiol.106:929-939,1994)还已经示出内含子用于以组织特异性为基础调节基因表达。为了进一步增强或优化位点定向核酸酶基因表达,本文公开的植物表达载体还可包含含有基质附着区(MAR)的DNA序列。然后,用这种修饰的表达系统转化的植物细胞可以展现出本公开的核苷酸序列的过表达或组成型表达。
本文公开的表达构建体还可以包括能够将位点定向核酸酶序列的表达指引至原核生物和真核生物两者中的叶绿体或其他细胞器和结构的核酸序列。这种核酸序列包括叶绿体靶向序列,其编码叶绿体转运肽以将感兴趣的基因产物指引至植物细胞叶绿体。这种转运肽是本领域已知的。关于叶绿体靶向序列,“可操作地连接”意指编码转运肽的核酸序列(即叶绿体靶向序列)与本文公开的位点定向核酸酶核酸分子连接,使得两个序列是连续的并且在同一读码框中。参见,例如,Von Heijne等,Plant Mol.Biol.Rep.9:104-126,1991;Clark等,J.Biol.Chem.264:17544-17550,1989;Della-Cioppa等,PlantPhysiol.84:965-968,1987;Romer等,Biochem.Biophys.Res.Commun.196:1414-1421,1993和Shah等,Science 233:478-481,1986。
叶绿体靶向序列是本领域已知的并且包括核酮糖-1,5-双磷酸羧化酶(Rubisco)的叶绿体小亚基(de Castro Silva Filho等,Plant Mol.Biol.30:769-780,1996;Schnell等,J.Biol.Chem.266(5):3335-3342,1991);5-(烯醇丙酮)莽草酸酯-3-磷酸合成酶(EPSPS)(Archer等,J.Bioenerg.Biomemb.22(6):789-810,1990);色氨酸合成酶(Zhao等,J.Biol.Chem.270(11):6081-6087,1995);质体蓝素(Lawrence等,J.Biol.Chem.272(33):20357-20363,1997);分支酸酯合成酶(Schmidt等,J.Biol.Chem.268(36):27447-27457,1993)和光收集叶绿素a/b结合蛋白(LHBP)(Lamppa等,J.Biol.Chem.263:14996-14999,1988)。还参见Von Heijne等,Plant Mol.Biol.Rep.9:104-126,1991;Clark等,J.Biol.Chem.264:17544-17550,1989;Della-Cioppa等,Plant Physiol.84:965-968,1987;Romer等,Biochem.Biophys.Res.Commun.196:1414-1421,1993和Shah等,Science233:478-481,1986。
连同本文公开的任何方面、实施方式、方法和/或组合物,可制备核酸构建体以指引来自植物细胞叶绿体的突变体位点定向核酸酶编码序列的表达。用于叶绿体的转化的方法是本领域已知的。参见,例如,Svab等,Proc.Nat’l.Acad.Sci.USA 87:8526-8530,1990;Svab和Maliga,Proc.Nat’l.Acad.Sci.USA 90:913-917,1993;Svab和Maliga,EMBO J.12:601-606,1993。方法依赖于含有可选择的标记的DNA的粒子枪递送,以及通过同源重组将DNA靶向质体基因组。另外地,质体转化可通过组织优先表达核编码和质体定向RNA聚合酶,通过沉默质体携带的转基因的反式激活来实现。这种系统已经在McBride等,Proc.Nat’l.Acad.Sci.USA 91:7301-7305,1994中报道。
可优化待被靶向至叶绿体的感兴趣的核酸以在叶绿体中表达,从而引起植物核与该细胞器之间的密码子使用的差异。以这种方式,可使用叶绿体优选的密码子来合成感兴趣的核酸。参见,例如,美国专利号5,380,831,其通过引用并入本文。
核酸构建体可用于转化植物细胞并且再生包括位点定向核酸酶编码序列的转基因植物。许多植物转化载体和用于转化植物的方法是可获得的。参见,例如,美国专利号6,753,458;An等,Plant Physiol.,81:301-305,1986;Fry等,Plant Cell Rep.6:321-325,1987;Block Theor.Appl Genet.76:767-774,1988;Hinchee等,Stadler.Genet.Symp.203212.203-212,1990;Cousins等,Aust.J.Plant Physiol.18:481-494,1991;Chee和Slightom,Gene.118:255-260,1992;Christou等,Trends.Biotechnol.10:239-246,1992;D’Halluin等,Bio/Technol.10:309-3 14,1992;Dhir等,Plant Physiol.99:81-88,1992;Casas等,Proc.Nat’l.Acad Sci.USA 90:11212-11216,1993;Christou,P.,In Vitro Cell.Dev.Biol.-Plant 29P:119-124,1993;Davies等,Plant Cell Rep.12:180-183,1993;Dong和Mc Hughen Plant Sci.91:139-148,1993;Franklin Trieu Cassidy Dixon Nelson 1993,Plant Cell Report 12,74-79;Golovkin等,Plant Sci.90:41-52,1993;Guo Chin Sci.Bull.38:2072-2078;Asano等,Plant CellRep.13,1994;Ayeres和Park Crit.Rev.Plant.Sci.13:219-239,1994;Barcelo等,Plant.J.5:583-592,1994;Becker等,Plant.J.5:299-307,1994;Borkowska等,Acta.Physiol Plant.16:225-230,1994;Christou Agro.Food.Ind.Hi Tech.5:17-27,1994;Eapen等,Plant Cell Rep.13:582-586,1994;Hartman等,Bio-Technology 12:919923,1994;Ritala等,Plant.Mol.Biol.24:317-325,1994以及Wan和Lemaux PlantPhysiol.104:3748,1994。构建体也可使用同源重组转化至植物细胞。
当提及关于肽序列和核苷酸序列时的术语“野生型”分别指的是当从天然发生来源分离时具有肽序列和核苷酸序列特征的肽序列和核苷酸序列(基因座/基因/等位基因)。野生型肽序列和核苷酸序列是在种群中最经常观察到的那些,因此分别被任意命名为肽序列和核苷酸序列的“正常的(normal)”或“野生型”形式。“野生型”还可指的是在一个或多个特定核苷酸位置处的序列,或在一个或多个特定密码子位置处的序列,或在一个或多个特定氨基酸位置处的序列。
“共有序列”被定义为氨基酸或核苷酸的序列,其至少25%的序列包含相同的氨基酸或核苷酸或功能上等效的氨基酸或核苷酸。相同或功能上等效的氨基酸或核苷酸不需要是连续的。
核碱基是碱基,其在某些优选的实施方式中是嘌呤、嘧啶或其衍生物或类似物。核苷是含有戊糖呋喃糖基部分,例如任选取代的核糖苷或2’-脱氧核糖苷的核碱基。核苷可通过可包含或不包含磷的几个连接部分之一连接。通过未取代的磷酸二酯键联而连接的核苷被称为核苷酸。如本文使用的术语“核碱基”包括肽核碱基、肽核酸的亚基和吗啉核碱基以及核苷和核苷酸。
寡核碱基是包括核碱基的聚合物;在一些实施方式中,至少其一部分可通过Watson-Crick碱基配对与具有互补序列的DNA杂交。寡核碱基链可具有单一5’和3’末端,它们是聚合物的最终核碱基。特定的寡核碱基链可包含所有类型的核碱基。寡核碱基化合物是包括可通过Watson-Crick碱基配对互补和杂交的一个或多个寡核碱基链的化合物。核糖型核碱基包括含有戊糖呋喃糖基的核碱基,其中2’碳是用羟基、烷氧基或卤素取代的亚甲基。脱氧核糖型核碱基是与核糖型核碱基不同的核碱基,并且包括不包含戊糖呋喃糖基部分的所有核碱基。
在某些实施方式中,寡核碱基链可包括寡核碱基链和寡核碱基链的区段或区域两者。寡核碱基链可具有3’端和5’端,并且当寡核碱基链与一个链共延伸时,寡核碱基链的3’和5’端也是该链的3’和5’末端。
如本文使用的,术语“密码子”指的是构成遗传密码的三个相邻核苷酸(RNA或DNA)的序列,其确定在蛋白质合成期间多肽链中特定氨基酸的插入或终止蛋白质合成的信号。术语“密码子”也用于指原始DNA转录至的信使RNA中三个核苷酸的相应(和互补)序列。
如本文使用的,术语“同源性”指的是蛋白质和DNA之中的序列相似性。术语“同源性”或“同源的”指的是同一性的程度。可能存在部分同源性或完全同源性。当与另一序列相比时,部分同源序列是具有小于100%序列同一性的序列。
“杂合的”指的是在同源染色体区段的一个或多个遗传基因座处具有不同的等位基因。如本文使用的“杂合的”还可指的是其中可以检测到一个或多个遗传基因座处的不同等位基因的样品、细胞、细胞群体或有机体。杂合样品也可以通过本领域已知的方法例如核酸测序确定。例如,如果测序电泳图在单一基因座示出两个峰,并且两个峰是大致相同大小,则该样品可被表征为杂合的。或者,如果一个峰小于另一个峰,但是为较大峰大小的至少约25%,则样品可被表征为杂合的。在一些实施方式中,较小的峰是较大的峰的至少约15%。在其他实施方式中,较小的峰是较大的峰的至少约10%。在其他实施方式中,较小的峰是较大的峰的至少约5%。在其他实施方式中,检测到最小量的较小的峰。
如本文使用的“纯合的”指的是在同源染色体区段中的一个或多个遗传基因座处具有相同的等位基因。“纯合的”还可以指其中可在一个或多个遗传基因座处检测到相同等位基因的样品、细胞、细胞群体或有机体。纯合样品可以通过本领域已知的方法例如核酸测序来确定。例如,如果测序电泳图在特定基因座处示出单一峰,则样品可以相对于该基因座被称为“纯合的”。
术语“半合的”指的是基因或基因区段在细胞或有机体的基因型中仅存在一次,因为第二等位基因被缺失或不存在于同源染色体区段上。如本文所用的“半合的”还可指的是其中一个或多个遗传基因座处的等位基因在基因型中仅可被检测到一次的样品、细胞、细胞群体或有机体。
如本文使用的术语“接合性状态”指的是如通过本领域已知的和本文描述的测试方法所确定的表现杂合的、纯合的或半合的样品、细胞群体或有机体。术语“核酸的接合性状态”意指确定是否核酸的来源是杂合的、纯合的或半合的。术语“接合性状态”可指的是序列中单一核苷酸位置的差异。在一些方法中,样品相对于单一突变的接合性状态可被分类为纯合野生型、杂合的(即一个野生型等位基因和一个突变体等位基因)、纯合突变体或半合的(即野生型或突变体等位基因的单一拷贝)。
如本文使用的,术语“RTDS”指由Cibus开发的Rapid Trait Development SystemTM(RTDSTM)。RTDSTM为能确保位点特异性基因修饰的一套技术,其使用在基因序列中有效制造精确改变而不并入外源基因或对照序列的系统。位点特异性基因修饰随后为具有这些精确改变的细胞再生成携带这些改变的植物。
如本文使用的术语“约”意指数量术语(quantitative term)加或减10%。例如,“约3%”将涵盖2.7%-3.3%并且“约10%”将涵盖9%-11%。此外,在本文中结合数量术语使用“约”时,应理解,除了数值加或减10%以外,还考虑并且描述了数量术语的确切值。例如,术语“约3%”明确地考虑、描述和包括精确地3%。
RTDS和修复寡核苷酸(GRON)
本文考虑的方法和组合物的各个方面和实施方式包括改善将修饰靶向基因组或其他核苷酸序列中的特定位置(例如对FAD2基因的修饰,例如本文考虑的)的效率的方法。
RTDS在一些实施方式中是基于通过利用细胞自身的基因修复系统来特别地原位修饰基因序列并且不插入外来DNA和基因表达控制序列来改变靶向基因。当其余的基因组保持不变时,该过程可以影响基因序列的精确变化。在一些实施方式中,与常规转基因GMO相反,没有外来遗传物质的整合,也没有任何外来遗传物质留在植物中。通过RTDS引入的基因序列中的变化不会随机插入。由于受影响的基因保留在它们的本来位置,因此不会出现随机、不受控制或不利的表达模式。
影响该改变的分子是本文所述的化学地合成的寡核苷酸(GRON),其可由DNA和修饰的RNA碱基两者以及其他化学部分组成,并且被设计为在靶向基因位置杂交以产生或制造错配的碱基对。该错配的碱基对充当信号,以将细胞自身的天然基因修复系统吸引至该位点,并且校正(替换、插入或缺失)基因内指定的一个或多个核苷酸。一旦校正过程完成,GRON分子将被降解,并且现在修饰或修复的基因将在该基因的正常内源控制机制下表达。
本文公开的方法和组合物可用具有本文和下文中详细地描述的构象和化学性质的“基因修复寡核碱基”(GRON)实践或制备。本文所考虑的“基因修复寡核碱基”也已经在已发表的科学和专利文献中使用其他名称描述,所述名称包括“重组诱发寡核碱基”、“RNA/DNA嵌合寡核苷酸”、“嵌合寡核苷酸”、“混合双链寡核苷酸”(MDON)、“RNA DNA寡核苷酸(RDO)”、“基因靶向寡核苷酸”、“基因体(genoplast)”、“单链修饰寡核苷酸”、“单链寡脱氧核苷酸突变载体”(SSOMV)、“双重突变载体”和“异源双链突变载体”。可使用本领域常用的任何方法将基因修复寡核碱基引入植物细胞,其包括但不限于微载体(基因枪传递)、微纤维、聚乙二醇(PEG)-介导的摄取、电穿孔和显微注射。
在一个实施方式中,基因修复寡核碱基是混合双链寡核苷酸(MDON),其中通过用氟、氯或溴官能团替换2’-羟基或通过在2’-O上放置取代基使混合双链寡核苷酸的RNA型核苷酸成为RNase抗性。合适的取代基包括由Kmiec II教导的取代基。可替选的取代基包括由美国专利5,334,711(Sproat)教导的取代基和由专利公开EP 629 387和EP 679 657(共同地Martin申请)教导的取代基,其通过引用并入本文。如本文使用的,Martin申请或Sproat中描述的具有用取代基取代的T-OH的核糖核苷酸的2’-氟、氯或溴衍生物或核糖核苷酸被称为“T-取代的核糖核苷酸”。如本文使用的,术语“RNA型核苷酸”意指通过未取代的磷酸二酯键联或Kmiec I或Kmiec II教导的任何非天然键联与混合双链寡核苷酸的其他核苷酸连接的T-羟基或2’-取代的核苷酸。如本文使用的,术语“脱氧核糖型核苷酸”意指具有T-H的核苷酸,其可通过未取代的磷酸二酯键联或由Kmiec I或Kmiec II教导的任何非天然键联与基因修复寡核碱基的其他核苷酸连接。
在本公开的特定实施方式中,基因修复寡核碱基可为仅通过未取代的磷酸二酯键连接的混合双链寡核苷酸(MDON)。在可替选的实施方式中,如Kmiec II教导的,键联是通过取代的磷酸二酯、磷酸二酯衍生物和非基于磷的键联。在还另一个实施方式中,混合双链寡核苷酸中的每个RNA型核苷酸是2’-取代的核苷酸。2’-取代的核糖核苷酸的特别优选的实施方式是2’-氟、T-甲氧基、2’-丙氧基、2’-烯丙氧基、2’-羟基乙氧基、2’-甲氧基乙氧基、T-氟丙氧基和2’-三氟丙氧基取代的核糖核苷酸。2’-取代的核糖核苷酸的更优选的实施方式是2’-氟、2’-甲氧基、2’-甲氧基乙氧基和2’-烯丙氧基取代的核苷酸。在另一个实施方式中,混合双链寡核苷酸通过未取代的磷酸二酯键连接。
尽管更方便地合成仅具有单一类型的2’-取代的RNA型核苷酸的混合双链寡核苷酸(MDON),但是本公开的方法可以以具有两种或更多种类型的RNA型核苷酸的混合双链寡核苷酸实践。RNA区段的功能可能不会受到在两个RNA型三核苷酸之间引入脱氧核苷酸造成的中断的影响,因此,术语RNA区段涵盖如“中断的RNA区段”的术语。不间断的RNA区段被称为连续的RNA区段。在可替选的实施方式中,RNA区段可包含交替的RNase抗性的和未取代的2’-OH核苷酸。混合双链寡核苷酸在一些实施方式中具有少于100个核苷酸,并且其他实施方式少于85个核苷酸,但多于50个核苷酸。第一和第二链是Watson-Crick碱基配对。在一个实施方式中,混合双链寡核苷酸的链通过连接体如单链六、五或四核苷酸共价地键合,使得第一和第二链是具有单个3’和单个5’端的单个寡核苷酸链的区段。3’和5’端可通过添加“发夹帽”来保护,从而使3’和5’末端核苷酸Watson-Crick配对至相邻核苷酸。另外地,第二发夹帽可放置在远离3’和5’端的第一和第二链之间的连接处,以便稳定第一和第二链之间的Watson-Crick配对。
第一链和第二链包含与靶基因/等位基因的两个片段同源的两个区域,即具有与靶基因/等位基因相同的序列。同源区域包含RNA区段的核苷酸,并且可包含连接DNA区段的一个或多个DNA型核苷酸,并且还可包含不在间插DNA区段内的DNA型核苷酸。同源性的两个区域被称为“异源的区域”的具有与靶基因的序列不同的序列的区域分开,并且各自与具有与靶基因的序列不同的序列的区域相邻。异源的区域可包含一个、两个或三个错配的核苷酸。错配的核苷酸可为连续的,或可替选地可被与靶基因/等位基因同源的一个或两个核苷酸分开。可替选地,异源区域还可包含插入一个、两个、三个或五个或更少的核苷酸。可替选地,混合双链寡核苷酸的序列可不同于仅通过从混合双链寡核苷酸中缺失一个、两个、三个或五个或更少的核苷酸的靶基因/等位基因的序列。在这种情况下,即使没有混合双链寡核苷酸的核苷酸在异源区域内,异源区域的长度和位置也被认为是缺失的长度。在旨在进行一个或多个取代的情况下,与两个同源区域互补的靶基因的片段之间的距离与异源区域的长度是相同的。当异源区域包含插入时,同源区域由此在混合双链寡核苷酸中被分开得比基因/等位基因中它们的互补同源片段更远,并且当异源区域编码缺失时,相反的也是适用的。
混合双链寡核苷酸的RNA区段各自是同源区域的一部分,即与靶基因的片段序列相同的区域,在一些实施方式中,这些区段共同包含至少13个RNA型核苷酸并且在一些实施方式中是16至25个RNA型核苷酸,或在还其他实施方式中是18-22个RNA型核苷酸,或在一些实施方式中是20个核苷酸。在一个实施方式中,同源性区域的RNA区段被间插DNA区段分开并且与间插DNA区段相邻,即“连接”。在一个实施方式中,异源区域的每个核苷酸是间插DNA区段的核苷酸。包含混合双链寡核苷酸的异源区域的间插DNA区段称为“增变基因区段”。
在本公开的方法和组合物的另一个实施方式中,基因修复寡核碱基(GRON)是单链寡脱氧核苷酸突变载体(SSOMV),如在国际专利申请PCT/USOO/23457、美国专利号6,271,360、6,479,292和7,060,500中公开的,其通过引用以其整体并入。SSOMV的序列是基于与美国专利号5,756,325、5,871,984、5,760,012、5,888,983、5,795,972、5,780,296、5,945,339、6,004,804和6,010,907中以及在国际公布号WO 98/49350、WO 99/07865、WO 99/58723、WO 99/58702和WO 99/40789中描述的突变载体的相同原理。SSOMV的序列包含与靶序列同源的两个区域,所述两个区域被称为增变基因区域的包含所需基因改变的区域分开。增变基因区域可具有与分开靶序列中的同源区域的序列相同长度的序列,但是具有不同的序列。这样的增变基因区域可产生取代。可替选地,SSOMV中的同源区域可以彼此邻近,而具有相同序列的靶基因中的区域被一个、两个或更多个核苷酸分开。这种SSOMV产生SSOMV不存在的核苷酸的靶基因的缺失。最后,与同源区域相同的靶基因的序列可以在靶基因中相邻,但是在SSOMV的序列中被一个、两个或更多个核苷酸分开。这种SSOMV产生靶基因序列中的插入。在某些实施方式中,SSOMV不与自身重组(anneal)。
SSOMV的核苷酸是通过未修饰的磷酸二酯键连接的脱氧核糖核苷酸,除了3’末端和/或5’末端核苷酸间键联或可替选地两个3’末端和/或5’末端核苷酸间键联可为硫代磷酸酯或氨基磷酸酯。如本文使用的核苷酸间键联是SSOMV的核苷酸之间的键联,并且不包括3’端核苷酸或5’端核苷酸与封闭取代基之间的键联。在具体的实施方式中,SSOMV的长度在21至55个脱氧核苷酸之间,并且因此同源性区域的长度是至少20个脱氧核苷酸的总长度,并且至少两个同源性区域应各自具有至少8个脱氧核苷酸的长度。
SSOMV可被设计成与靶基因的编码链或非编码链互补。当所需突变是单一碱基取代时,优选的增变基因核苷酸和靶向核苷酸两者是嘧啶。在与实现所需功能的结果一致的程度上,优选的互补链中的增变基因核苷酸和靶核苷酸两者为嘧啶。特别地优选的是编码颠换突变的SSOMV,即C或T增变基因核苷酸分别与互补链中的C或T核苷酸错配。
2’-OME GRON设计。在各种实施方式中,GRON可具有RNA和DNA核苷酸两者和/或其他类型的核碱基。在一些实施方式中,一个或多个DNA或RNA核苷酸包括修饰。在某些实施方式中,第一5’核苷酸是RNA核苷酸,并且剩余的核苷酸是DNA。在仍进一步实施方式中,第一5’RNA核苷酸用2-O-Me修饰。在其他实施方式中,前两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个5’核苷酸是RNA核苷酸,并且剩余的核苷酸是DNA。在仍进一步实施方式中,前两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个5’RNA核苷酸的一个或多个用2’-O-Me修饰。在植物细胞中,DNA中的双链断裂通常通过NHEJ DNA修复途径修复。该途径不需要模板来修复DNA,因此容易出错。使用该途径修复植物细胞的DNA的优点是其是快速的、普遍存在的并且至关重要地可在当细胞未经历DNA复制时的时间发生。在植物细胞中修复复制叉外部的双链断裂中起作用的另一个DNA修复途径称为模板化修复;然而,不像NHEJ途径,这种类型的修复非常精确,并且需要使用DNA模板(GRON)。
提高效率
本公开可包括使用修复寡核苷酸增加靶基因的转化效率的多种方法中的任一个,并且其可单独或彼此组合使用。这些包括,例如:
1.将修饰引入修复寡核苷酸,其吸引了DNA修复机制至靶向(错配)位点。
A.在寡核苷酸中引入一个或多个无碱基位点(例如,在10个碱基内,并且在一些实施方式中具有所需错配位点的5个碱基)产生损害(lesion),其是碱基切除修复(BER)中的中间体,并且吸引了BER机制靶向通过修复寡核苷酸转化的位点附近。dSpacer(无碱基呋喃)修饰的寡核苷酸可如,例如Takeshita等,J.Biol.Chem.,262:10171-79,1987中描述的制备。
B.包括在寡核苷酸中或与寡核苷酸一起的诱导单链或双链断裂的化合物产生损害,其通过NHEJ、微观同源性介导的末端连接(MMEJ)和同源重组来修复。举例来说,抗生素的博莱霉素(bleomycin)家族、锌指、FokI(或任何类型的IIS类限制性内切酶)和其他核酸酶可与修复寡核苷酸的3’或5’端共价连接,以便在靶向通过修复寡核苷酸转化的位点附近引入双链断裂。抗生素的博莱霉素家族是DNA裂解糖肽,其包括博莱霉素、吉欧霉素(zeocin)、腐草霉素(phleomycin)、他利霉素(tallysomycin)、培洛霉素(pepleomycin)以及其他。
C.引入并入寡核苷酸中的一个或多个8’氧代dA或dG(例如,在10个碱基内,并且在一些实施方式中具有所需错配位点的5个碱基)产生损害,其与活性氧种类产生的损害相似。这些损害诱导所谓的“推动修复”系统。参见,例如,Kim等,J.Biochem.Mol.Biol.37:657-62,2004。
2.增加修复寡核苷酸的稳定性:
-在寡核苷酸的3’端引入反向碱基(idC),以在修复寡核苷酸上产生3’封闭的端。
-在修复寡核苷酸的5’和/或3’处引入一个或多个增加杂交能量的2’O-甲基核苷酸或碱基(参见,例如,WO2007/073149)。
-在修复寡核苷酸的5’端引入一个或多个2’O-甲基RNA核苷酸,产生提供所需错配位点的DNA碱基,从而产生冈崎片段样核酸结构。
-缀合的(5’或3’)嵌入染料如吖啶、补骨脂素、溴化乙锭和Syber染色剂。
-引入5’末端帽如T/A钳夹、胆固醇部分、SIMA(HEX)、riboC和亚磷酰胺(amidite)。
-主链修饰如硫代磷酸酯、2’-O甲基、甲基膦酸酯、锁核酸(LNA)、MOE(甲氧乙基)、diPS和肽核酸(PNA)。
-使修复寡核苷酸,例如与链内交联剂试剂如顺铂和丝裂霉素C的交联。
-与荧光染料如Cy3、DY547、Cy3.5、Cy3B、Cy5和DY647缀合。
3.通过并入增加杂交能量的碱基来增加修复寡核苷酸的杂交能量(参见,例如,WO2007/073149)。
4.通过使用核苷酸多聚体(二聚体、三聚体、四聚体等)作为合成的结构单元(building block),提高修复寡核苷酸合成的质量。这产生更少的偶联步骤,并且更容易将全长产物与结构单元分离。
5.使用长的修复寡核苷酸(即长度大于55个核苷酸,例如,如本文所述的长度,例如具有在修复寡核苷酸中靶向的一个或多个突变或两个或更多个突变。
上述方法的实例在表A中提供。
表A:示例性GRON化学
Figure BDA0002711573350000711
Figure BDA0002711573350000721
Figure BDA0002711573350000731
前述修饰还可以包括已知的核苷酸修饰,如甲基化、5’嵌入染料、对5’和3’端的修饰、主链修饰、交联剂、环化和“帽”以及用类似物如肌苷取代一个或多个天然存在的核苷酸。核苷酸的修饰包括添加吖啶、胺、生物素、瀑布蓝、胆固醇、Cy3@、Cy5@、Cy5.5@Daboyl、地高辛、二硝基苯基、Edans、6-FAM、荧光素、3’-甘油基、HEX、IRD-700、IRD-800、JOE、磷酸补骨脂素、若丹明、ROX、硫醇(SH)、间隔基、TAMRA、TET、AMCA-S”、SE、BODIPY°、Marina Blue@、Pacific Blue@、Oregon Green@、Rhodamine Green@、Rhodamine Red@、Rhodol Green@和Texas Red@。多核苷酸主链修饰包括甲基膦酸酯、2’-OMe-甲基膦酸酯RNA、硫代磷酸酯、RNA、2’-OMeRNA。碱基修饰包括2-氨基-dA、2-氨基嘌呤、3’-(ddA)、3’dA(蛹虫草菌素)、7-脱氮-dA、8-Br-dA、8-氧代-dA、N6-Me-dA、无碱基位点(dSpacer)、生物素dT、2’-OMe-5Me-C、2’-OMe-丙炔基-C、3’-(5-Me-dC)、3’-(ddC)、5-Br-dC、5-1-duc、5-Me-dC、5-F-dC、羧基-dT、可转换的dA、可转换的dC、可转换的dG、可转换的dT、可转换的dU、7-脱氮-dG、8-Br-dG、8-氧代-dG、O6-Me-dG、S6-DNP-dG、4-甲基-吲哚、5-硝基吲哚、2’-OMe-肌苷、2’-dl、o6-苯基-dl、4-甲基-吲哚、2’-脱氧水粉菌素、5-硝基吲哚、2-氨基嘌呤、dP(嘌呤类似物)、dK(嘧啶类似物)、3-硝基吡咯、2-硫代-dT、4-硫代-dT、生物素-dT、羧基-dT、04-Me-dT、04-三唑dT、2’-OMe-丙炔基-U、5-Br-dU、2’-dU、5-F-dU、5-1-dU、04-三唑dU。所述术语还涵盖肽核酸(PNA)、DNA类似物,其中主链是由N-(2-氨基乙基)-甘氨酸单元而不是糖组成的伪肽。PNA模拟DNA的行为并且结合互补的核酸链。PNA的中性主链产生比正常情况下实现的更强结合和更大的特异性。此外,已经利用PNA独特的化学、物理和生物学特性来产生强大的生物分子工具、反义和抗基因剂、分子探针和生物传感器。
寡核碱基可具有切口、间隙、修饰的核苷酸如修饰的寡核苷酸主链、无碱基核苷酸或其他化学部分。在进一步实施方式中,寡核碱基的至少一条链包括至少一个另外的修饰的核苷酸,例如2’-O-甲基修饰的核苷酸如MOE(甲氧基乙基)、具有5’-硫代磷酸酯基团的核苷酸、连接至胆固醇基衍生物的末端核苷酸、2’-脱氧-2’-氟修饰的核苷酸、2’-脱氧-修饰的核苷酸、锁核苷酸、无碱基的核苷酸(核碱基缺失或在其适当位置上具有羟基(参见,例如,Glen Research,http://www.glenresearch.com/GlenReports/GR21-14.html)、2’-氨基-修饰的核苷酸、2’-烷基-修饰的核苷酸、吗啉代核苷酸、亚磷酰胺和包括核苷酸的非天然碱基。还包括各种盐、混合盐和游离酸形式。
优选的修饰的寡核苷酸主链包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(其包括3’-亚烷基膦酸酯、5’-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(包括3’-氨基氨基磷酸酯和氨基烷基膦酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、具有正常3’-5’键联、这些键联的2’-5’连接类似物的硒代磷酸酯和硼烷磷酸酯,以及具有极性相反的那些(其中一个或多个核苷酸间键联是3’至3’、5’至5’或2’至2’键联)。具有极性相反的优选的寡核苷酸在3’最末端的核苷酸间键联处包括单一3’至3’键联,即可以为无碱基的单一反向核苷残基(核碱基缺失或在其适当位置具有羟基)。键联翻转的最常见用途是将3’-3’键联添加至具有硫代磷酸酯主链的反义寡核苷酸的端部。3’-3’键联通过产生具有两个5’-OH端且没有3’-OH端的寡核苷酸,进一步使反义寡核苷酸对核酸外切酶降解稳定。可通过使用“反向亚磷酰胺”在寡核苷酸合成期间将键联翻转引入特定位置。这些试剂在5’-OH位置具有亚磷酰胺基团,和在3’-OH位置具有二甲氧基三苯甲基(DMT)保护基团。正常地,DMT保护基团在5’-OH上并且亚磷酰胺在3’-OH上。
修饰碱基的实例包括但不限于2-氨基嘌呤、2’-氨基-丁酰芘-尿苷、2’-氨基尿苷、2’-脱氧尿苷、2’-氟-胞啶、2’-氟-尿苷、2,6-二氨基嘌呤、4-硫-尿苷、5-溴-尿苷、5-氟-胞苷、5-氟尿苷、5-吲哚-尿苷、5-甲基-胞苷、肌苷、N3-甲基-尿苷、7-脱氮-鸟嘌呤、8-氨基己基-氨基-腺嘌呤、6-硫代-鸟嘌呤、4-硫代-胸腺嘧啶、2-硫代-胸腺嘧啶、5-碘-尿苷、5-碘-胞苷、8-溴-鸟嘌呤、8-溴-腺嘌呤、7-脱氮-腺嘌呤、7-二氮杂-鸟嘌呤、8-氧代-鸟嘌呤、5,6-二氢-尿苷和5-羟甲基-尿苷。这些合成单元是商业上可获得的;(例如,从Glen ResearchCompany购买)并且可以通过化学合成将其并入DNA中。
糖部分的修饰的实例是3’-脱氧化、2’-氟化和阿拉伯糖基化,然而,不应理解为限制于此。通过化学合成将这些并入DNA也是可能的。
5’端修饰的实例是5’-胺化、5’-生物素化、5’-荧光素化、5’-四氟-荧光素化、5’-硫化和5’-丹磺酰化(dabsylation),但是不应理解为限于此。
3’端修饰的实例是3’-胺化、3’-生物素化、2,3-二脱氧化、3’-硫化、3’-丹磺酰化、3’-羧化和3’-胆固醇化,然而,不应理解为限制于此。
在一个优选的实施方式中,寡核碱基可包含5’封闭取代基,其通过连接体附着至5’末端碳。连接体的化学性质除其长度以外不是关键性的,长度在一些实施方式中应该为至少6个原子长,并且连接体应为柔性的。可使用多种无毒的取代基,如生物素、胆固醇或其他类固醇或非嵌入的阳离子荧光染料。制备寡核碱基的特别优选的试剂是由GlenResearch、Sterling Va.(现在GE Healthcare)以Cy3TM和Cy5TM出售的试剂,其是封闭的亚磷酰胺,在并入至寡核苷酸后分别产生3,3,3’,3’-四甲基N,N’-异丙基取代的吲哚单碳菁染料和吲哚二碳菁染料。Cy3是特别优选的。当吲哚碳菁被N-氧烷基取代时,其可被便利地连接至寡脱氧核苷酸的5’末端,作为具有5’末端磷酸酯的磷酸二酯。当按指导使用可商业上获得的Cy3亚磷酰胺时,所得的5’修饰包括封闭取代基和连接体,所述封闭取代基和连接体一起是N-羟丙基、N’-磷脂酰丙基3,3,3’,3’-四甲基吲哚单碳菁。考虑的其他染料包括罗丹明6G、四甲基罗丹明、磺酰罗丹明101、部花青540、Atto565、Atto55026、Cy3.5、Dy547、Dy548、Dy549、Dy554、Dy555、Dy556、Dy560、mStrawberry和mCherry。
在优选的实施方式中,吲哚碳菁染料在吲哚环的3和3’位置被四次(tetra)取代。在理论上没有限制,这些取代阻止染料成为嵌入染料。在这些位置取代的一致性不是关键的。
本文所述的寡核苷酸设计还可与其他DNA编辑或重组技术组合用作更有效的供体模板,其他DNA编辑或重组技术包括但不限于通过锌指核酸酶、大范围核酸酶、转录激活因子样效应子核酸酶(TALEN)或成簇的规律间隔的短回文重复序列(CRISPR)使用位点特异性同源重组的基因靶向。
某些方面和实施方式中的本公开可以包括涉及用于有效修饰基因组细胞DNA和/或DNA重组到细胞的基因组DNA的方法的方法和组合物。尽管不限于任何特定用途,但是本文提供的一些方法可在某些实施方式中用于例如将修饰引入细胞的基因组中以测定细胞上修饰的效果。例如,可将修饰引入编码酶的核苷酸序列中,以确定修饰是否改变酶的酶活性,和/或确定酶的催化区的位置。可替选地,可将修饰引入DNA结合蛋白的编码序列,以确定蛋白的DNA结合活性是否被改变,并且因此描绘出蛋白内的特定DNA结合区。仍另一个可替选方案是将修饰引入非编码调控序列(例如,启动子、增强子、调控RNA序列(miRNA)等),以便确定修饰对可操作地连接至非编码调控序列的第二序列的表达水平的影响。例如,定义拥有调节活性的特定序列可以是期望的。
DNA切割物
产生靶向基因破坏的一种策略是通过使用DNA切割物如位点特异性内切核酸酶产生单链或双链DNA断裂。内切核酸酶最常用于传统上对更常规的基因靶向方法难治的生物体如藻类、植物和包括人的大型动物模型中的靶向基因破坏。例如,目前正在进行有关锌指核酸酶用于治疗和预防HIV感染的人类临床试验。另外的,目前正在使用内切核酸酶工程化来尝试破坏在作物中产生不希望的表型的基因。
本公开的某些方面涉及使用DNA内切核酸酶将一个或多个突变引入靶向核酸。在一些实施方式中,DNA内切核酸酶是RNA-向导的DNA核酸内切酶。示例性RNA-向导的DNA内切核酸酶包括Cas9、Cpf1等。适用于本文所述的方法和组合物中的RNA-向导的DNA内切核酸酶对于本领域技术人员将是显而易见的。本文描述了用于本公开的方法和组合物中的另外的DNA内切核酸酶。
锌指
一类人工内切核酸酶是锌指内切核酸酶。锌指内切核酸酶将非特异性切割结构域(通常是FokI内切核酸酶的非特异性切割结构域)与被工程化以结合特定DNA序列的锌指蛋白质结构域结合。锌指内切核酸酶的模块化结构使其成为向基因组递送位点特异性双链断裂的通用平台。由于FokI内切核酸酶作为二聚体切割,一种防止脱靶裂解事件的策略已经设计在相邻9个碱基对位点处结合的锌指结构域。还参见美国专利号7,285,416、7,521,241、7,361,635、7,273,923、7,262,054、7,220,719、7,070,934、7,013,219、6,979,539、6,933,113、6,824,978,其每个在此通过引用以其整体并入本文。
TALEN
TALEN是用于将单链和双链断裂诱导入特异性DNA位点的可靶向的核酸酶,然后通过可被利用以在裂解位点产生序列改变的机制修复。
用于工程化TALEN的DNA结合区域的基础结构单元是高度保守的重复结构域,其衍生自黄单胞病菌(Xanthomonas spp.)变形杆菌编码的天然存在的TALE。通过TALEN的DNA结合是由高度保守的33-35个氨基酸重复阵列介导的,在重复的氨基末端和羧基末端两侧有另外的TALE衍生的结构域。
这些TALE重复特异性结合至DNA的单一碱基,其特征由通常在重复的第12位和第13位上发现的两个高变残基决定,其中阵列中重复的数目对应于所需的靶核酸的长度,选择与靶核酸序列匹配的重复的特征。在一些实施方式中,靶核酸在15至20个碱基对之间,以使靶位点的选择性最大化。靶核酸的裂解通常在TALEN结合的50个碱基对内发生。在本领域中已经描述了用于TALEN识别位点设计的计算机程序。参见,例如,Cermak等,NucleicAcids Res.2011年7月;39(12):e82。
一旦设计成与所需的靶序列匹配,TALEN可以重组地表达并且作为外源蛋白质引入原生质体中,或由原生质体内的质粒表达或作为mRNA或蛋白质施用。
大范围核酸酶
归巢内切核酸酶,也称为大范围核酸酶,是序列特异性内切核酸酶,由于它们大的(例如,>14bp)切割位点,其以高度的特异性在基因组DNA中产生双链断裂。虽然归巢内切核酸酶对其靶位点的特异性允许精确靶向诱导的DNA断裂,但是归巢内切核酸酶裂解位点很少,并且在靶向基因中发现天然存在的裂解位点的可能性较低。
另一类人工内切核酸酶是工程化的大范围核酸酶。通过修饰现有的归巢内切核酸酶的特异性来产生工程化的归巢内切核酸酶。在一种方法中,将变异引入天然存在的归巢内切核酸酶的氨基酸序列中,然后筛选所得的工程化归巢内切核酸酶以选择切割靶向结合位点的功能蛋白。在另一种方法中,通过组合两种不同的归巢内切核酸酶的识别位点来工程化嵌合的归巢内切核酸酶,以创建由每个归巢内切核酸酶的半位点组成的新识别位点。见例如,美国专利号8,338,157和8,445,251。
CRISPR或CRISPR/Cas系统
CRISPR-Cas系统包含三个基础设计组分:1)Cas基因、转录物(例如,mRNA)或蛋白质;2)向导RNA(gRNA)和3)crRNA(CRISPR RNA)是从编码CRISPR重复阵列的RNA转录物加工的RNA区段,其拥有(harbor)与外来DNA位点(例如,内源DNA靶区域)和部分CRISPR重复互补的“前间隔序列”区域。参见例如,PCT申请号WO/2014/093661和WO/2013/176772。
Cas(CRISPR相关的)基因、转录体(例如,mRNA)或蛋白质
来自质粒载体的瞬时Cas表达、Cas蛋白的直接递送和/或Cas mRNA的直接递送至植物细胞。Cas基因被密码子优化以在更高等的植物、藻类或酵母中表达,并且当可适用时由组成型、诱导型、组织特异性或物种特异性启动子驱动。Cas转录物终止和聚腺苷酸化信号是NosT、RBCT、HSP18.2T或其他基因特异性或物种特异性的终止子。Cas基因盒可包含天然的或与基因特异性启动子和/或合成启动子组合的内含子。Cas蛋白可包含一个或多个核定位信号序列(NLS)、突变、缺失、改变或截短。在瞬时表达系统中,Cas基因盒可与CRISPR-Cas系统的其他组分结合,如相同瞬时表达载体上的gRNA盒。可替选地,可以定位Cas基因盒并且由独立于gRNA盒的构建体或CRISPR-Cas系统的其他组分表达Cas基因盒。CRISPR相关(Cas)基因-对于具有多种预测的核酸-操纵活性的蛋白质,如核酸酶、解旋酶和聚合酶编码。Cas基因包括Cas9。Cas9是编码包含预测的RuvC样和HNH内切核酸酶结构域的大蛋白的基因,并且与大多数古细菌和许多细菌中存在的CRISPR适应免疫系统相关。Cas9蛋白包含两个叶片:
1)识别(REC)叶片-由三个结构域组成:
a)BH(螺旋桥)
b)REC1-促进RNA-向导的DNA靶向
c)REC2-促进RNA-向导的DNA靶向
2)核酸酶(NUC)叶片-包含三个结构域:
a)RuvC-促进RNA-向导的DNA靶向;内切核酸酶活性
b)HNH-内切核酸酶活性
c)PI-PAM相互作用
在其他实施方式中,Cas基因可为Cas9的同源物,其中RuvC、HNH、REC和BH结构域是高度保守的。在一些实施方式中,Cas基因是以下表B中列举的种类的那些。
表B:示例性Cas基因
Figure BDA0002711573350000791
Figure BDA0002711573350000801
Figure BDA0002711573350000811
Figure BDA0002711573350000821
Figure BDA0002711573350000831
Figure BDA0002711573350000841
Figure BDA0002711573350000851
Figure BDA0002711573350000861
Figure BDA0002711573350000871
Figure BDA0002711573350000881
Figure BDA0002711573350000891
Figure BDA0002711573350000901
Figure BDA0002711573350000911
Figure BDA0002711573350000921
Figure BDA0002711573350000931
Figure BDA0002711573350000941
Figure BDA0002711573350000951
Figure BDA0002711573350000961
Figure BDA0002711573350000971
Figure BDA0002711573350000981
向导RNA(gRNA)
gRNA或sgRNA(单一向导RNA)被工程化作为crRNA与部分反式激活CRISPR RNA(tracrRNA)序列之间的融合体,其将Cas9引导至与前间隔序列区域互补的特异性靶DNA序列。向导RNA可包括表达盒,其包含具有长tracrRNA杂交体、短tracrcrRNA杂交体或天然CRISPR阵列+tracrRNA构象的嵌合RNA设计。嵌合gRNA将crRNA的靶向特异性与tracrRNA的支架特性组合至单一转录物。gRNA瞬时表达受物种特异性的更高等植物RNA聚合酶III启动子如来自U6或U3 snRNA基因家族的那些控制(Wang等,2008)。根据Wang等(2008),gRNA转录物终止受聚dT的6-20个核苷酸控制。gRNA表达盒位于与CRISPR-Cas系统的其他组分相同或不同的瞬时表达载体上。gRNA转录物可在体外合成,并且独立于gRNA瞬时表达载体或与gRNA瞬时表达载体结合直接地递送至植物细胞中。
在一些实施方式中,天然酿脓链球菌II型CRISPR-Cas系统包括CrisprAssociated(Cas9)核酸酶和两个不同的非编码RNA,反式激活RNA(tracrRNA)和CRISPR RNA(crRNA)。该系统的RNA组分将Cas9核酸酶引导至基因组中的序列特异性靶。所有三种组分可分别表达为tracrRNA和crRNA和Cas9蛋白。crRNA提供了靶特异性,并且包括20个碱基的间隔区序列,所述碱基与被Cas9切割的靶DNA(前间隔序列)互补(Cong等,2013)。当通过RNA:RNA碱基配对方式与crRNA关联时,tracrRNA充当RNA支架,并且正是这种与Cas9缔合的复合物。tracrRNA可工程化至短于89个碱基,像是通过整合DNA技术(IDT)开发的Alt-RTM系统中的情况。在该系统中,与天然tracrRNA相比,短至67个碱基的tracrRNA具有增加的靶向(on-target)性能。当将crRNA和tracrRNA人工地组合成单一融合功能RNA或单一向导RNA(sgRNA)时,Cas9蛋白的靶向与原始系统相比可以大大简化。与天然tracerRNA:crRNA复合物相似,工程化的sgRNA将Cas9引导至特异性靶DNA序列。
靶区域
向导RNA包含限定对DNA靶区域特异性的两种组分,前间隔序列和前间隔序列相邻的基序(PAM)。前间隔序列通常为20个核苷酸,但可基于DNA靶变化,可对CRISPR-Cas复合物提供DNA序列特异性。DNA靶还包含NNG或NAG三核苷酸序列(PAM),其中N表示在前间隔序列的刚好3’或下游的任何核苷酸。
一组分方法
类似于Le Cong等(2013)和其他,CRISPR-Cas基因编辑的简化“一组分方法”,其中单一瞬时表达构建体包含CRISPR-Cas复合物的所有组分,即gRNA和Cas表达盒两者。这允许简单的模块设计来靶向任何给定植物或作物中的单个或多个基因座。靶向多个基因座可通过在靶特异性gRNA盒中简单地交换来实现。另外的,物种特异性启动子、终止子或其他表达增强元件可容易地穿梭进出“一组分方法”瞬时载体,其允许以物种特异性方式优化gRNA和Cas蛋白两者的表达。
二组分方法
在二组分方法中,Cas和gRNA表达盒位于不同的瞬时表达载体上。这允许分别地递送CRISPR-Cas编辑组分,允许相同细胞内gRNA与Cas的比率不同。类似于一组分方法,二组分方法还允许影响CRISPR-Cas组分表达的启动子、终止子或其他元件易于改变,并且允许以物种特异性方式靶向DNA。
抗生素
另一类内切核酸酶是为DNA裂解糖肽的抗生素,例如博莱霉素家族的抗生素是DNA裂解糖肽,其包括博莱霉素、吉欧霉素、腐草霉素、他利霉素、培洛霉素以及本文进一步描述的其他抗生素。
其他DNA修饰分子
其他DNA修饰分子可用在靶向基因重组中。例如,肽核酸可用于诱导对一个或多个靶细胞的基因组的修饰(参见,例如,Ecker,美国专利号5,986,053,其通过引用并入本文)。简言之,包含至少部分肽主链的合成核苷酸用于靶向同源基因组核苷酸序列。结合至双螺旋DNA后,或通过与肽核酸连接的诱变剂,靶DNA序列的修饰和/或重组被诱导发生。靶向特异性由靶向序列和基因组序列之间的序列同源性的程度决定。
在本公开的方法和组合物的一些实施方式中,可使用三螺旋形成寡核苷酸(TFO)靶向基因(如FAD2基因)。TFO可例如通过PCR或通过使用基因合成仪装置合成地产生。另外的,如果发现合适的天然序列,TFO可与基因组DNA分离。TFO可以以多种方式使用,包括例如通过连接至诱变剂,如但不限于补骨脂素或苯丁酸氮芥(参见,例如,Havre等,Proc Nat’lAcad Sci,美国90:7879-7883,1993;Havre等,J Virol 67:7323-7331,1993;Wang等,MolCell Biol 15:1759-1768,1995;Takasugi等,Proc Nat’l Acad Sci,美国88:5602-5606,1991;Belousov等,Nucleic Acids Res 25:3440-3444,1997)。此外,例如,TFO可被连接至供体双链DNA上(参见,例如,Chan等,J Biol Chem 272:11541-11548,1999)。TFO也可通过以足够的亲和力结合以驱使容易出错的修复起作用(Wang等,Science 271:802-805,1996)。
本文公开的方法不必限于所使用的DNA修饰试剂的性质或类型。例如,这种DNA修饰试剂释放出自由基,其产生DNA链断裂。可替选地,试剂使DNA烷基化以形成可阻止复制和转录的加合物。在另一个替换方案中,试剂产生抑制产生链断裂的细胞酶的交联或分子。已经连接至寡核苷酸以形成TFO的DNA修饰试剂的实例包括但不限于吲哚并咔唑、萘二酰亚胺(NDI)、反铂、博莱霉素、环丙烷吡咯并吲哚的类似物和菲二氢二噁英。特别地,吲哚并咔唑是拓扑异构酶I抑制剂。这些酶的抑制产生链断裂和DNA蛋白加合物形成(Arimondo等,Bioorganic and Medicinal Chem.8,777,2000)。NDI是可氧化鸟嘌呤的光氧化剂,其可在鸟嘌呤残基的位点处引起突变(Nunez等,Biochemistry,39,6190,2000)。当TFO连接至试剂时,已经示出反铂与三链体靶中的DNA反应。该反应产生可以是诱变的DNA加合物的形成(Columbier等,Nucleic Acids Research,24:4519,1996)。博莱霉素是广泛地用作放射模拟物的DNA断裂剂。它已经连接至寡核苷酸并且示出作为该形式的断裂剂是有活性的(Sergeyev,Nucleic Acids Research 23,4400,1995;Kane等,Biochemistry,34,16715,1995)。环丙烷吡咯并吲哚的类似物已经连接至TFO并且示出在三链体靶序列中将DNA烷基化。然后,烷基化的DNA将包含是诱变的化学加合物(Lukhtanov等,Nucleic AcidsResearch,25,5077,1997)。苯并二氢二噁英是在光活化时释放自由基的掩蔽醌。它们已经连接至TFO并且已经示出在光活化时将断裂引入双链DNA中(Bendinskas等,BioconjugateChem.9,555,1998)。
本公开考虑了诱导修饰和/或重组的其他方法。例如,另一个实施方式涉及诱导外源DNA片段和靶向基因之间的同源重组(参见例如,Capecchi等,Science 244:1288-1292,1989)或通过使用对靶向位点具有亲和力的肽核酸(PNA)。仍其他方法包括序列特异性DNA识别和通过聚酰胺的靶向(参见例如,Dervan等,Curr Opin Chem Biol 3:688-693,1999;Biochemistry 38:2143-2151,1999)以及使用具有位点特异性活性的核酸酶(例如,锌指蛋白、TALEN、大范围核酸酶和/或CRISPR)。
本公开不限于任何特定的修饰和/或重组频率。在一些实施方式中,本文公开的方法产生0.01%至3%的靶核苷酸序列中的修饰频率。尽管如此,修饰和/或重组的任何频率(即在0%和100%之间)被认为在本公开的范围内。修饰和/或重组的频率取决于用于诱导修饰和/或重组的方法、所使用的细胞类型、特定的靶向基因和所使用的DNA突变试剂,若有的话。另外地,由于检测方法的限制,用于检测修饰和/或重组的方法不可能检测所有修饰和/或重组的发生。此外,一些修饰和/或重组事件可能是沉默的,没有给出已经发生了修饰和/或重组的可检测的指示。不能检测沉默的修饰和/或重组事件给出了人为低估的修饰和/或重组。由于这些原因和其他原因,本公开不必限于任何特定的修饰和/或重组频率。在一个实施方式中,修饰和/或重组的频率在0.01%至100%之间。在另一个实施方式中,修饰和/或重组的频率在0.01%至50%之间。在还另一个实施方式中,修饰和/或重组的频率在0.1%至10%之间。在仍还另一个实施方式中,修饰和/或重组的频率在0.1%至5%之间。
如本文使用的术语“突变频率”关于用能够将突变引入细胞的基因组中靶位点的DNA修饰分子处理的细胞群体,指的是与用DNA修饰分子处理的细胞总数相比,在靶位点处包含突变的处理过的群体中的细胞总数。例如,对于用补骨脂蛋白连接的DNA修饰分子TFO处理的细胞群(旨在将突变引入细胞基因组中的靶位点)而言,5%的突变频率表示用TFO-补骨脂素处理的总共100个细胞中,有5个细胞在靶位点处含有突变。例如,关于用连接至被设计为在细胞的基因组中在靶位点处引入突变的补骨脂素的DNA-修饰分子TFO处理的细胞群体,5%的突变频率意指用TFO-补骨脂素处理的总共100个细胞中,5个细胞包含在靶位点处的突变。
尽管本公开不一定限于细胞中DNA的修饰和/或重组的任何精确度,可以预期,根据所需结果,本公开的一些实施方式需要更高的精确度。例如,与产生其中仅基因的破坏是必需的基因敲除相比,基因修复需要的特定序列改变(例如,特定碱基改变)需要更高的精确度。用本公开的方法,在修饰和/或同源重组技术中更高水平的精确的实现大于用现有技术方法。
基因修复寡核碱基至植物细胞的递送
用于转化植物细胞的任何通常地已知的方法都可用于递送基因修复寡核碱基。说明性方法在下面列出。本文的方法和组合物可涉及许多用一种或多种DNA修饰试剂转染细胞的方法中的任何一种。将DNA修饰试剂引入一个或多个细胞的方法是本领域众所周知的,并且包括但不限于显微注射、电穿孔、被动吸附、磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、聚凝胺介导的转染、脂质体融合、脂质体转染剂(lipofection)、核转染、原生质体融合、逆转录病毒感染、基因枪(即粒子轰击)等等。
使用金属微载体(微球)通过弹体射弹穿透(projectile penetration)将大片段的DNA引入具有纤维素细胞壁的植物细胞中是相关领域技术人员众所周知的(此后称为基因枪递送)。美国专利号4,945,050、5,100,792和5,204,253描述了用于选择用于发射它们的微载体和设备的通用技术。
在本文公开的方法中使用微载体的具体条件可包括国际公布WO 99/07865中描述的条件。在说明性技术中,以冰冷的微载体(60mg/ml)、混合双链寡核苷酸(60mg/ml)2.5MCaCl2和0.1M亚精胺的那个顺序添加;例如通过涡旋将混合物轻轻搅动10分钟,然后在室温下放置10分钟,随之将微载体在5体积的乙醇中稀释,离心分离并且重悬于100%乙醇中。在粘附溶液中用浓度为8-10μg/μl微载体、14-17μg/ml混合双链寡核苷酸、1.1-1.4M CaCl2和18-22mM亚精胺,可获得良好的结果。在8μg/μl微载体、16.5μg/ml混合双链体寡核苷酸、1.3M CaCl2和21mM亚精胺的条件下观察到最佳结果。
也可使用微纤维穿透细胞壁和细胞膜将基因修复寡核碱基引入至植物细胞中。Coffee等(1994)的美国专利号5,302,523描述了使用碳化硅纤维以促进黑墨西哥甜(BlackMexican Sweet)的悬浮玉米培养物的转化。可用于引入DNA以使用微纤维转化植物细胞的任何机械技术可用于传递基因修复寡核碱基进行衍变。
用于基因修复寡核碱基的微纤维递送的说明性技术如以下:将无菌微纤维(2μg)悬浮在150μl含有约10μg的混合双链寡核苷酸的植物培养基中。使悬浮培养物沉淀,并且将等体积的浓集细胞和无菌纤维/核苷酸悬液涡旋10分钟并且铺板。对于特定性状,选择性培养基立即应用或高达约120小时的延迟是适当的。
在可替选的实施方式中,基因修复寡核碱基可通过电穿孔源自植物部分的原生质体被递送至植物细胞。根据本领域技术人员众所周知的技术,通过酶处理植物部分,特别是叶,形成原生质体。参见,例如,Gallois等,1996,Methods in Molecular Biology 55:89-107中,Humana Press,Totowa,N.J.;Kipp等,1999,Methods in Molecular Biology 133:213-221,Humana Press,Totowa,N.J.。原生质体不需要在电穿孔之前在生长培养基中培养。电穿孔的说明性条件是在具有0.6-4μg/ml之间的基因修复寡核碱基的浓度的0.3ml总体积中300,000个原生质体。
在可替选的实施方式中,根据本领域技术人员众所周知的技术,核酸在膜修饰剂聚乙二醇的存在下被植物原生质体吸收。在另一个可替选的实施方式中,基因修复寡核碱基可通过将其与微毛细管一起注入植物细胞或原生质体中来递送。
在可替选的实施方式中,核酸被嵌入在由藻酸钙构成的微珠中,并且在膜修饰剂聚乙二醇的存在下被植物原生质体吸收(参见,例如,Sone等,2002;Liu等,2004)。
在可替选的实施方式中,核酸在水中冷冻并且通过轰击以微粒形式引入至植物细胞中(参见,例如,Gilmore,1991,美国专利5,219,746;Brinegar等)。
在可替选的实施方式中,通过在包含纳米颗粒的悬液中孵育细胞(参见,例如,Pasupathy等,2008)或通过粒子轰击将它们递送至完整的细胞中或通过共孵育将其递送至原生质体中(参见,例如,Torney等,2007),将附着于纳米颗粒的核酸引入完整的植物细胞中。
在可替选的实施方式中,核酸与穿透肽复合,并且通过共同孵育递送入细胞中(参见,例如,Chugh等,2008;WO 2008148223 A1;Eudes和Chugh)。
在可替选的实施方式中,核酸通过电穿孔引入完整细胞中(参见,例如,He等,1998,美国2003/0115641 Al,Dobres等)。
在可替选的实施方式中,通过将干胚胎的细胞浸泡在具有核酸的溶液中将核酸递送至干胚胎的细胞中(参见,例如,
Figure BDA0002711573350001041
等,1989,Senaratna等,1991)或在其他实施方式中通过细胞挤压(Cellsqueeze)引入核酸(SQZ Biotech)。
降低多肽活性的方法和其他诱变技术
本公开的某些方面涉及降低多肽(例如FAD2多肽)的水平和/或活性。修饰降低本公开的一种或多种多肽的质量/水平或活性的方法是本领域众所周知的并且在本文描述。
与相应的对照细胞如野生型细胞相比,本公开的细胞(例如植物细胞)可包含一种或多种具有降低活性的多肽。在一些实施方式中,与相应的对照细胞相比,一种或多种FAD2蛋白在宿主细胞中具有降低活性。降低多肽的表达、丰度和/或活性的方法是本领域众所周知的,并且在本文描述。
在一些实施方式中,降低多肽如,例如,一种或多种FAD2蛋白的活性包含降低编码多肽的核酸的表达。
可通过将基因突变引入靶核酸中来完成核酸表达的降低。诱变方法可用于通过产生突变来破坏或“敲除”靶基因的表达。在一些实施方式中,诱变产生靶基因的部分缺失。在其他实施方式中,诱变产生靶基因的完全缺失。诱变微生物的方法是本领域众所周知的,并且包括例如随机诱变和位点定向诱变以诱导突变。随机诱变方法的实例包括,例如,化学诱变(例如,使用乙烷甲基磺酸盐)、插入诱变和辐射。
用于减少或抑制靶基因的表达的一个方法是通过遗传修饰靶基因并且将其引入宿主细胞的基因组以通过同源重组取代基因的野生型形式(例如,如在美国专利号6,924,146中描述的)。
用于减少或抑制靶基因的表达的另一个方法是通过使用根癌农杆菌(Agrobacterium tumefaciens)的T-DNA或转座子的插入诱变(参见Winkler等,MethodsMol.Biol.82:129-136,1989和Martienssen Proc.Natl.Acad.Sci.95:2021-2026,1998)。在生成插入突变体后,可筛选突变体以鉴定含有靶基因中的插入的那些。通过插入诱变破坏靶基因的方法在例如美国专利号5,792,633中描述。通过转座子诱变破坏靶基因的方法在例如美国专利号6,207,384中描述。
破坏靶基因的进一步方法是通过使用cre-lox系统(例如,如在美国专利号4,959,317中描述的)。
破坏靶基因的另一种方法是通过使用PCR诱变(例如,如在美国专利号7,501,275中描述的)。
内源性基因表达还可通过RNA干扰(RNAi)的方式降低或抑制,RNA干扰(RNAi)使用具有与靶基因的序列相同或相似的序列的双链RNA。RNAi可包括使用MicroRNA,如人工miRNA来抑制基因的表达。
RNAi是一种现象,其中当将具有与靶基因的序列相同或相似的序列的双链RNA引入细胞中时,插入的外源性基因和靶内源基因两者的表达被抑制。双链RNA可由两个分开的互补RNA形成,或可为具有形成双链RNA的内部地互补序列的单一RNA。
因此,在一些实施方式中,降低或抑制基因表达使用RNAi技术实现。例如,为了使用RNAi实现降低或抑制编码蛋白质的DNA的表达,具有编码蛋白质的DNA序列或其基本上相似的序列(包括工程化以不翻译蛋白质的那些)或其片段的双链RNA被引入感兴趣的宿主细胞。如本文所用的,RNAi和dsRNA两者指的是通过引入双链RNA分子诱导的基因特异性沉默,参见例如,美国专利号6,506,559和6,573,099并且包括涉及具有是双链的区域的分子,例如短发夹RNA分子。然后可对于靶基因的降低表达例如降低的纤维素酶表达相关的表型,和/或通过监测靶基因的转录物的稳定状态RNA水平,筛选所得细胞。尽管用于RNAi的序列不需要与靶基因完全地相同,但它们可以为与靶基因序列至少70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。参见,例如,美国专利申请公布号2004/0029283。编码具有与靶基因无关的并且位于对感兴趣的基因特异性的序列的远端的茎环结构的RNA分子的构建体也可以用于抑制靶基因的表达。参见,例如,美国专利申请公布号2003/0221211。
RNAi核酸可涵盖全长靶RNA或可对应于靶RNA的片段。在一些情况下,片段将具有少于100个、200个、300个、400个或500个与靶序列相对应的核苷酸。此外,在一些方面中,这些片段的长度是至少例如50个、100个、150个、200个或更多个核苷酸。可以基于短双链体(即双链体序列的短区域)设计干扰RNA。典型地,短双链体的长度是至少约15个、20个或25-50个核苷酸(例如,双链RNA的每个互补序列是15-50个核苷酸的长度),通常约20-30个核苷酸,例如20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸的长度。在一些情况下,在RNAi中使用的片段将对应于靶蛋白的区域,其不会出现在有机体的其他蛋白质中,或与有机体中的其他转录物几乎没有相似性,例如,通过与分析公开地可得的序列数据库中的序列比较来选择。类似地,可以对于与如本文描述的那些感兴趣的基因家族的保守序列的相似性或同一性选择RNAi片段以便RNAi靶向多个包含保守序列的不同基因转录物。
RNAi可作为较大DNA构建体的一部分引入宿主细胞种。通常,这种构建体在引入后,例如通过将构建体整合入宿主基因组中,使得RNAi在细胞中稳定表达。因此,在用载体转染的细胞中连续地表达RNAi的表达载体可被用于本公开。例如,可以使用表达小发夹或茎环结构RNA或microRNA的前体的载体,其在体内被加工成能够进行基因特异性沉默的小RNAi分子(Brummelkamp等,Science 296:550-553,(2002)和Paddison等,Genes&Dev.16:948-958,(2002))。通过Hammond等,Nature Rev Gen 2:110-119,(2001);Fire等,Nature391:806-811,(1998)以及Timmons和Fire,Nature 395:854,(1998)进一步详细讨论了通过双链RNA的转录后基因沉默。
用于产生RNAi的序列的选择和设计的方法是本领域众所周知的(例如美国专利号6,506,559;6,511,824和6,489,127)。
降低或抑制靶基因的宿主细胞中的基因表达还可通过基于靶基因核酸序列将反义构建体引入宿主细胞中获得。为了反义抑制,将靶序列相对于表达载体中的启动子序列以相反的方向排列。引入的序列不需要是全长cDNA或基因,也不需要与在待转化细胞中发现的靶cDNA或基因相同。然而,通常,在引入的序列具有较短长度的情况下,与天然靶序列的更高程度的同源性用于实现有效的反义抑制。在一些方面中,在载体中引入的反义序列将为至少30个核苷酸长度,并且随着反义序列的长度增加,通常将观察到改善的反义抑制。在一些方面中,载体中反义序列的长度将大于100个核苷酸。如所述的反义构建体的转录产生RNA分子的产生,所述RNA分子是从内源性靶基因转录的mRNA分子的反向补体。靶基因表达的抑制还可以使用核酶来实现。核酶的生产和使用在美国专利号4,987,071和5,543,508中描述。
包含编码靶基因表达抑制剂例如反义或siRNA的核酸的表达盒可使用本领域众所周知的方法构建。构建体包括调控元件,其包括启动子和用于表达和选择表达构建体的细胞的其他序列。通常,真菌和/或细菌转化载体包括在5’和3’调控序列的转录控制下的一个或多个克隆编码序列(基因组或cDNA)和显性选择标记。这种转化载体通常还包含启动子(例如,控制诱导型或组成型、环境地或发育调控表达的调控区)、转录引发起始位点、RNA处理信号(如内含子剪接位点)、转录终止位点和/或聚腺苷酸化信号。
在某些实施方式中,可修饰靶核酸的一部分,如编码催化结构域的区域、编码区或表达编码区所需的控制序列。基因的这种控制序列可为启动子序列或其功能部分,即足以影响基因表达的部分。例如,启动子序列可失活,产生不表达或较弱的启动子可被替换为天然启动子序列,以减少编码序列的表达。用于可能修饰的其他控制序列可包括,例如,前导序列、前肽序列、信号序列、转录终止子和转录激活因子。
本公开的植物
在某些方面和实施方式中,本文所述的方法和组合物可通常适用于植物。例如,在一些方面和/或实施方式中,植物物种可选自十字花科(Brassicaceae family),包括许多重要的作物比如甘蓝型油菜(油菜,芸薹)、芜菁(例如,大头菜、大白菜),甘蓝(西兰花、卷心菜、花椰菜等)、芥菜型油菜(Brassica juncea)(芥菜(mustard))、亚麻芥(Camelinasativa)或萝卜(常见小萝卜),以及许多重要的豆类作物,比如豌豆、大豆、扁豆和黄豆。在一些实施方式中,本公开的植物为甘蓝型油菜、芜菁或芥菜型油菜植物,也称为油菜。在一些实施方式中,本公开的植物为甘蓝型油菜属油茶。
根据本说明书,植物、植物器官、植物组织或植物细胞的基本上正常生长被定义为是表达野生型FAD2蛋白的相应植物、植物器官、植物组织或植物细胞中的生长速率或细胞分裂速率的至少35%、至少50%、至少60%或至少75%的植物、植物器官、植物组织或植物细胞的生长速率或细胞分裂速率。
根据本说明书,植物、植物器官、植物组织或植物细胞的基本上正常发育被定义为是与表达野生型FAD2蛋白的相应植物、植物器官、植物组织或植物细胞中发生的一种或多种发育事件基本上相同的植物、植物器官、植物组织或植物细胞中的一种或多种发育事件的发生。
根据本说明书,植物器官包括但不限于叶、茎、根、叶芽、花芽、分生组织、胚、子叶、胚乳、萼片、花瓣、雌蕊、心皮、雄蕊、花药、小孢子、花粉、花粉管、胚珠、子房和果实,或由其获得的切片、薄片或盘状物。植物组织包括但不限于愈伤组织、基础组织、维管组织、贮藏组织、分生组织、叶组织、芽组织、根组织、瘿组织(gall tissue)、植物肿瘤组织和繁殖组织。植物细胞包括但不限于具有细胞壁的分离细胞、其各种尺寸的聚集体和原生质体。
本公开的植物包括具有潜力产生具有高油酸含量的种子油的那些植物。在一些实施方式中,那些植物具有潜力产生也具有低亚麻油酸含量的种子油。例如,本公开包括产生具有高油酸含量和低亚麻油酸含量的种子油的芸薹属植物。
在各种实施方式中,本文公开的植物大部分集中于单子叶植物,其包括作为树或灌木生长的任何木本植物物种、任何草本物种或产生可食用果实、种子或蔬菜的任何物种或产生富有色彩的或芳香的花的任何物种。例如,植物可选自由以下组成的组的植物物种:油菜、向日葵、玉米、烟草、甜菜、棉花、玉米、小麦、大麦、水稻、苜蓿、大麦、高粱、番茄、芒果、桃、苹果、梨、草莓、香蕉、甜瓜、木薯、马铃薯、胡萝卜、生菜、洋葱、大豆、大豆属(soya spp)、甘蔗、豌豆、鹰嘴豆、紫花豌豆、蚕豆、兵豆、白萝卜、大头菜、芽球甘蓝、羽扇豆、花椰菜、羽衣甘蓝、菜豆、杨树、松树、桉树、葡萄、柑橘、黑小麦、苜蓿、黑麦、燕麦、草皮和牧草、亚麻、芸苔、芥菜、黄瓜、牵牛花、凤仙花、胡椒、茄子、万寿菊、莲花、卷心菜、雏菊、康乃馨、郁金香、鸢尾、百合和产坚果植物,只要它们尚未被特别提及的情况。
使用本领域通常已知的方法,可测试植物和植物细胞的具有高油酸含量和低亚麻油酸含量的种子油。
在一些实施方式中,与相应的对照植物(例如,在任何FAD2基因中不具有任何突变的相同物种的植物,比如,野生型植物)相比,在一个或多种FAD2基因中具有一个或多个突变的本公开的植物产生具有高油酸含量的种子油。产生具有高油酸含量的种子油的植物的种子油中的油酸含量可为,例如,至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%的种子油中的总脂肪酸含量。在一些实施方式中,与相应的对照植物(例如,在任何FAD2基因中不具有任何突变的相同物种的植物,比如,野生型植物)相比,在一个或多种FAD2基因中具有一个或多个突变的本公开的植物产生进一步含有低亚麻油酸含量的种子油。产生具有低亚麻油酸含量的种子油的植物的种子油中的亚麻油酸含量可为,例如,至多约20%、至多约19%、至多约18%、至多约17%、至多约16%、至多约15%、至多约14%、至多约13%、至多约12%、至多约11%、至多约10%、至多约9%、至多约8%、至多约7%、至多约6%、至多约5%、至多约4%、至多约3%、至多约2%、至多约1%或至多约0%的种子油中的总脂肪酸含量。
如本文使用的,植物、植物器官、植物组织或植物细胞的基本上正常生长被定义为是表达感兴趣的野生型蛋白的相应植物、植物器官、植物组织或植物细胞中的生长速率或细胞分裂速率的至少35%、至少50%、至少60%或至少75%的植物、植物器官、植物组织或植物细胞的生长速率或细胞分裂速率。
如本文使用的,植物、植物器官、植物组织或植物细胞的基本上正常发育被定义为是与表达野生型蛋白的相应植物、植物器官、植物组织或植物细胞中发生的一种或多种发育事件基本上相同的植物、植物器官、植物组织或植物细胞中的一种或多种发育事件的发生。
在某些实施方式中,本文提供的植物器官包括但不限于叶、茎、根、叶芽、花芽、分生组织、胚、子叶、胚乳、萼片、花瓣、雌蕊、心皮、雄蕊、花药、小孢子、花粉、花粉管、胚珠、子房和果实或由其获得的切片、薄片或盘状物。植物组织包括但不限于愈伤组织、基础组织、维管组织、贮藏组织、分生组织、叶组织、芽组织、根组织、瘿组织、植物肿瘤组织和繁殖组织。植物细胞包括但不限于具有细胞壁的分离细胞,其各种尺寸的聚集体和原生质体。
植物的产生
植物物种的各种组织的组织培养和从中的植物再生是已知的。例如,在以下任何一项中但不限于以下任何一项描述了通过组织培养油菜培育品种的繁殖:Li等,“Somaticembryogenesis in quite a direct way in cultures of mesophyll protoplasts ofBrassica napus L.”,Plant Cell Reports 1:209-211,1982;Chuong等,“A SimpleCulture Method for Brassica hypocotyls Protoplasts”,Plant Cell Reports 4:4-6,1985;Barsby等,“A Rapid and Efficient Alternative Procedure for theRegeneration of Plants from Hypocotyl Protoplasts of Brassica napus”,PlantCell Reports(Spring,1996);Kartha等,“In vitro Plant Formation from StemExplants of Rape”,Physiol.Plant,31:217-220,1974;Narasimhulu等,“SpeciesSpecific Shoot Regeneration Response of Cotyledonary Explants of Brassicas”,Plant Cell Reports(Spring1988);Sun等,“Cotyledon-derived diploid and haploidprotoplast culture and diploid plant regeneration in Brassica napus cv.‘Topas’”,Can.J.Bot.76:530-541,1998;Swanson,E.,“Microspore Culture inBrassica”,Methods in Molecular Biology,第6卷,第17章,第159页,1990。
通过组织培养和再生可产生种类的进一步繁殖。大豆的各种组织的组织培养和从中的植物再生是众所周知的并且广泛公布的。例如,参见Komatsuda等,“Genotype XSucrose Interactions for Somatic Embryogenesis in Soybeans”,Crop Sci.31:333-337,1991;Stephens等,“Agronomic Evaluation of Tissue-Culture-Derived SoybeanPlants”,Theor.Appl.Genet.82:633-635,1991;Komatsuda等,“Maturation andGermination of Somatic Embryos as Affected by Sucrose and Plant GrowthRegulators in Soybeans Glycine gracilis Skvortz and Glycine max(L.)Merr.”Plant Cell,Tissue and Organ Culture,28:103-113,1992;Dhir等,“Regeneration ofFertile Plants from Protoplasts of Soybean(Glycine max L.Merr.);GenotypicDifferences in Culture Response”,Plant Cell Reports 11:285-289,1992;Pandey等,“Plant Regeneration from Leaf and Hypocotyl Explants of Glycine wightii(W.andA.)VERDC.var.longicauda”,Japan J.Breed.42:1-5,1992和Shetty等,“Stimulation ofIn Vitro Shoot Organogenesis in Glycine max(Merrill.)by Allantoin andAmides”,Plant Science 81:245-251,1992。1991年6月18日出版的Collins等的美国专利号5,024,944和1991年4月16日出版的Ranch等的美国专利号5,008,200的公布内容,其在此通过引用以它们的整体并入本文。
本公开的某些方面还涉及衍生自在本公开的核酸(例如FAD2基因)中具有一个或多个突变的植物的植物。例如,具有一个或多个FAD2突变的植物可以与相同的或不同的植物杂交以产生F1后代植物,其中F1后代植物的至少一个亲本具有一个或多个FAD2突变。这些F1植物可进一步自交或与不同的植物品系杂交,并且所得的F2后代可被筛选用于一个或多个FAD2突变。
实施例
提供以下实施例以进一步阐明本公开的方面。这些实施例是非限制性的并且不应该被认为限制本公开的任何方面。
实施例1:FAD2基因的分子表征
使用公众可用的FAD2 cDNA和拟南芥FAD2的基因组序列以及用于甘蓝型油菜的那些,我们设计了PCR引物,以从BN2SU油菜品系基因组DNA扩增四种BnFAD2基因序列。将PCR扩增的FAD2基因组片段克隆并且测序(BnFAD2-1=SEQ ID NO:1;BnFAD2-2=SEQ ID NO:2;BnFAD2-3=SEQ ID NO:3;BnFAD2-4=SEQ ID NO:4)。进行基因组DNA片段的下一代测序,以完成该分析。提供从BN2SU油菜品系分离的FAD2基因的推断的氨基酸序列(BnFAD2-1=SEQID NO:5;BnFAD2-2=SEQ ID NO:6;BnFAD2-3=SEQ ID NO:7或SEQ ID NO:30;BnFAD2-4=SEQ ID NO:31)。
实施例2:使用RTDSTM技术产生FAD2基因敲除油菜植物
在该实施例中,用于靶向BnFAD2基因,以便产生BnFAD2功能丧失(LOF)品系的RTDSTM试剂包括与gRNA复合的CRISPR/Cas9蛋白质(RNP,表1),以及单链寡核苷酸(ssODN)(表2)。CRISPR/Cas9由两种组分组成:分别作为蛋白质和RNA表达的植物密码子优化的酿脓链球菌(Streptococcus pyogenes)Cas9(SpCas9)和sgRNA。sgRNA为从DNA模板体外转录的,并且其为CRISPR RNA(crRNA)和反式激活的crRNA(tracrRNA)的融合体。crRNA区域含有表1中描述的间隔区序列,其用于将Cas9核酸酶蛋白质引导至每个靶FAD2基因。ssODN,也称为GRON(基因修复寡核苷酸)含有在转换的位点周围的靶向的FAD2基因的编码序列,携带精确的基因特异性突变(+1插入、-1和-2缺失),并且在第一个5’碱基(其为RNA碱基而不是DNA碱基)处用2’-O-Me基团标记(表2)。
通过PEG介导的递送,分别以1.0μg/μl和0.05μM的终浓度,将RNP和GRON引入至原生质体中(SOP CB2016-2)。在递送至原生质体之前,重组Cas9蛋白质体外与gRNA复合。按照我们的标准方案,从体外微繁殖的植物的叶子中分离油菜原生质体(SOP CB2014-1和CB2026-3)。在液体培养基中培养原生质体(1.25x 105细胞/ml),并且在暗处在25℃孵育(SOP CB2052-2)。在一周或三周之后获得细胞样品,并且通过深入测序分析,以确定靶基因中的突变的频率。在6-8周之后,将原生质体衍生的微小愈伤组织转移至固体再生培养基,并且在约2-4周之后,芽开始从再生愈伤组织分化。通过NGS分析来自完全分化的芽的叶子样品,以确定4种FAD2基因的每个中的靶向突变的发生。接着,筛选覆盖所有15种可能的基因LOF组合或基因型的单个和多个基因中具有靶向突变的芽的倍性(SOP CB2053),体外微繁殖(SOP 2018),并且转移至生长室中的土壤(SOP GH3516-1)。将强化的植物(hardenedplant)转移至温室并且生长至成熟(结籽)。
表1.应用实验中使用的gRNA
Figure BDA0002711573350001131
表2.应用实验中使用的ssODN的序列。
Figure BDA0002711573350001132
Figure BDA0002711573350001141
表型分析。通过具有Agilent 7890A GC分析仪的气体液相色谱(GC),按照标准方案,确定FAD2基因LOF品系和野生型对照植物的干燥种子的脂肪酸概况。
结果
甘蓝型油菜属油茶;基因组AACC,2n=4×=38)为起源于白菜油菜(芜菁;基因组AA,2n=2×=20)和卷心菜(甘蓝;基因组CC,2n=2×=18)之间的自发杂交的异源单倍体植物。两种FAD2基因存在于芜菁和甘蓝中,并且所以,在甘蓝型油菜中发现了四个拷贝的FAD2基因(Yang等,2012;Lee等,2013)。FAD2-1和FAD2-2基因分别位于甘蓝型油菜染色体A05和C05上。FAD2-3和FAD2-4基因的染色体定位是未知的。然而,遗传自芜菁的FAD2-3基因携带产生截短的非功能蛋白质的突变(Lee等,2013)。如预期的,从BN2SU油菜品系克隆和测序了所有4种BnFAD2基因序列(BnFAD2-1=SEQ ID NO:1;BnFAD2-2=SEQ ID NO:2;BnFAD2-3=SEQ ID NO:3;BnFAD2-4=SEQ ID NO:4)。所有BnFAD2基因的推断的氨基酸序列与报道的序列相同(BnFAD2-1=SEQ ID NO:5;BnFAD2-2=SEQ ID NO:6;BnFAD2-3=SEQ ID NO:7或SEQ ID NO:30;BnFAD2-4=SEQ ID NO:31;Lee等,2013)。
用RNP和GRON靶向所有4种FAD2基因,以产生具有非功能FAD2基因的LOF品系。目标是产生所有可能的单个和多个FAD2 LOF基因型,其将具有比野生型更高水平的油酸。表3总结了用15种可能的LOF基因型中的每个再生的芽的数量,包括具有两个油菜品系BN2SU和412SUR中的单个和多个FAD2 LOF基因的芽。如通过下一代测序确定的,4种FAD2基因的至少一个中的GRON靶向突变(+1、-1、-2核苷酸插入缺失,InDel)分别在约30%和40%的从品系BN2SU和412SUR的处理的原生质体的再生的芽中发现。在1至4种基因中具有靶向突变的芽鉴定为具有不同的频率。靶向InDel通过FAD2基因的阅读框的移码而产生LOF基因。
表3.用BN2SU品系和412SUR品系中的FAD2基因中的靶向InDel再生的芽。
Figure BDA0002711573350001151
Figure BDA0002711573350001161
BN2SUFAD2基因LOF品系的干燥种子中的种子油脂肪酸组成显示在表4A-4D中,并且表4E显示了BN2SU FAD2基因LOF品系中的突变。412SUR FAD2基因LOF品系的干燥种子中的种子油脂肪酸组成显示在表5A-5D中,并且表5E显示了412SUR FAD2基因LOF品系中的突变。通过气相色谱法测量脂肪酸组成。在表4A-4D和表5A-5D的“基因型”列中,在括弧中为“n”提供的数值表示每个基因分析的独立LOF品系的数量。表5F显示了源自FAD2突变的预测的终止密码子的氨基酸位置。
用作对照的BN2SU和412SUR野生型品系的种子中按重量计平均油酸含量%分别为~64%和61%(表4B和表5B)。具有单个非功能fad2-1基因的BN2SULOF品系中的平均油酸为按重量计75.31±1.5%,并且fad2-2单个LOF品系中为按重量计69.96±1.46%。然而,fad2-3和fad2-4单个LOF品系的种子中的油酸水平为按重量计~61%,与野生型水平类似。双fad2-1和fad2-2基因LOF品系具有按重量计86.33±0.7%的高得多的油酸水平(表4B)。相比在双fad2-1和fad2-2基因LOF品系中,在全LOF品系(fad2-1;fad2-2;fad2-3;fad2-4)中的油酸的水平稍微更高(按重量计87.96%)。这比野生型高约按重量计24%。相对于在野生型种子中测量的那些,FAD2基因LOF品系的种子中的饱和脂肪酸(例如,棕榈酸或硬脂酸脂肪酸)水平未明显改变。用412SUR FAD2LOF品系获得了类似的结果(表5A-表5D)。
表4A.BN2SU FAD2基因LOF品系的干燥种子中的棕榈酸和棕榈油酸脂肪酸组成。
Figure BDA0002711573350001171
表4B.BN2SU FAD2基因LOF品系的干燥种子中的硬脂酸和油酸脂肪酸组成。
Figure BDA0002711573350001172
Figure BDA0002711573350001181
表4C.BN2SU FAD2基因LOF品系的干燥种子中的亚麻油酸和亚麻酸脂肪酸组成。
Figure BDA0002711573350001182
Figure BDA0002711573350001191
表4D.BN2SU FAD2基因LOF品系的干燥种子中的二十碳烯酸和芥酸脂肪酸组成。
Figure BDA0002711573350001192
Figure BDA0002711573350001201
表4E.BN2SU FAD2基因LOF品系中的突变。
Figure BDA0002711573350001202
Figure BDA0002711573350001211
Figure BDA0002711573350001221
表5A.412SUR FAD2基因LOF品系的干燥种子中的棕榈酸和棕榈油酸脂肪酸组成。
Figure BDA0002711573350001222
表5B.412SUR FAD2基因LOF品系的干燥种子中的硬脂酸和油酸脂肪酸组成。
Figure BDA0002711573350001231
表5C.412SUR FAD2基因LOF品系的干燥种子中的亚麻油酸和亚麻酸脂肪酸组成。
Figure BDA0002711573350001232
表5D.BN2SU FAD2基因LOF品系的干燥种子中的二十碳烯酸脂肪酸组成。
Figure BDA0002711573350001233
Figure BDA0002711573350001241
表5E.412SUR FAD2基因LOF品系中的突变。
Figure BDA0002711573350001242
Figure BDA0002711573350001251
表5F.源自FAD2突变的预测的终止密码子。
Figure BDA0002711573350001252
1这些为没有突变的野生序列。
2这两条序列含有n-3突变(与野生型序列相比),产生1个氨基酸的丧失,但是没有移码或预测的提前终止密码子。
由于伴随的亚麻油酸和亚麻酸的量的减少,结果指示FAD2-1和FAD2-2基因是油菜种子油中的油酸去饱和的主要参与者,如先前已经报道的(Yang等,2012;Lee等,2013)。结果也再次确认了油菜中的FAD2-3基是不参与野生型油菜中的油酸去饱和的非功能基因。FAD2-4基因仅仅负责种子中约2-5%的油酸的增加。
BN2SU FAD2三重LOF品系的干燥种子中的种子油脂肪酸组成显示在下面表6中。在整个季节,从温室至田地在不同阶段收获种子。评估来自在一个温室地点和两个田地地点生长的材料的种子。另外,通过两个分开的实验室评估从田地地点1收获的种子(即,对相同的材料进行实验室测试)。表6中的平均值为遍及所有测量的按重量计脂肪酸组成%的值(即,来自所有地点和实验室的值)的平均。通过参考Americ Oil Chemists’Society(AOCS)Official Method Ce 1h-05的方法测量按重量计的脂肪酸组成%。
表6.在温室和田地中生长的FAD2三重LOF品系的按重量计的脂肪酸组成%。
Figure BDA0002711573350001261
Figure BDA0002711573350001271
1MUFA=单不饱和脂肪酸
2PUFA=多不饱和脂肪酸
3RBD=在精制、脱色和脱臭处理之后的油概况
与获得自CIBUS品系#1的油相比,不同油的脂肪酸组成显示在下面表7中。CIBUS品系#1为具有基因型fad2-1;fad2-2;fad2-3的BN2SU FAD2三重LOF品系(CIBUS品系#1含有序列EQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53和SEQ ID NO:54)。CIBUS品系#1菜籽油的氧化稳定性指数(OSI)结果指示该油具有高的氧化稳定性。具体地,OSI值表示在试验期间油稳定的小时数,意味着CIBUS品系#1菜籽油保持氧化稳定性至少32小时。相比较,常规的菜籽油(例如,商品油菜)具有7-8小时的氧化稳定性,并且中油酸的菜籽油具有约15小时的氧化稳定性(例如,Clear
Figure BDA0002711573350001273
CV 65菜籽油)。
表7.不同油的脂肪酸组成和氧化稳定性指数(OSI)值。
Figure BDA0002711573350001272
1PUFA=多不饱和脂肪酸
2OSI=氧化稳定性指数
进一步,与表7中的所有其他油不同,CIBUS品系#1菜籽油按重量计%具有相比C18:3脂肪酸更低水平的C18:2。而且,C18:2(Ω6型)与C18:3(Ω3型)的比例小于1;表中的所有其他油具有大于1的比例。具有较低Ω-6与Ω-3的比例的膳食已经与降低的慢性疾病的风险相关(Simopolous,Biomed.Pharmacother.,56(8):365-379,2002)。
图1A和1B显示了比较表7中的油的油酸%与OSI(图1A)以及总的PUFA%与OSI(图1B)的图。图1A显示与其他油相比,CIBUS品系#1菜籽油具有额外的抗氧化剂特性。图1B显示与其他油相比在趋势中,CIBUS品系#1菜籽油为离群值,因为其相比总的PUFA%具有高得多的OSI。
序列表
<110> 希博斯美国有限公司
希博斯欧洲有限公司
<120> FAD2基因和突变
<130> 16507-20002.40
<140> 还未分配
<141> 与此同时
<150> US 62/652,623
<151> 2018-04-04
<160> 54
<170> Windows版本4.0的FastSEQ
<210> 1
<211> 1155
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 1
atgggtgcag gtggaagaat gcaagtgtct cctccctcca aaaagtctga aaccgacaac 60
atcaagcgcg taccctgcga gacaccgccc ttcactgtcg gagaactcaa gaaagcaatc 120
ccaccgcact gtttcaaacg ctcgatccct cgctctttct cctacctcat ctgggacatc 180
atcatagcct cctgcttcta ctacgtcgcc accacttact tccctctcct ccctcaccct 240
ctctcctact tcgcctggcc tctctactgg gcctgccagg gctgcgtcct aaccggcgtc 300
tgggtcatag cccacgagtg cggccaccac gccttcagcg actaccagtg gctggacgac 360
accgtcggcc tcatcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagt 420
catcgacgcc accattccaa cactggctcc ctcgagagag acgaagtgtt tgtccccaag 480
aagaagtcag acatcaagtg gtacggcaag tacctcaaca accctttggg acgcaccgtg 540
atgttaacgg ttcagttcac tctcggctgg cctttgtact tagccttcaa cgtctcgggg 600
agaccttacg acggcggctt cgcttgccat ttccacccca acgctcccat ctacaacgac 660
cgtgagcgtc tccagatata catctccgac gctggcatcc tcgccgtctg ctacggtctc 720
taccgctacg ctgctgtcca aggagttgcc tcgatggtct gcttctacgg agttcctctt 780
ctgattgtca acgggttctt agttttgatc acttacttgc agcacacgca tccttccctg 840
cctcactatg actcgtctga gtgggattgg ttgaggggag ctttggccac cgttgacaga 900
gactacggaa tcttgaacaa ggtcttccac aatatcacgg acacgcacgt ggcgcatcac 960
ctgttctcga ccatgccgca ttatcatgcg atggaagcta cgaaggcgat aaagccgata 1020
ctgggagagt attatcagtt cgatgggacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgtgga accggacagg caaggtgaga agaaaggtgt gttctggtac 1140
aacaataagt tatga 1155
<210> 2
<211> 1155
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 2
atgggtgcag gtggaagaat gcaagtgtct cctccctcca agaagtctga aaccgacacc 60
atcaagcgcg taccctgcga gacaccgccc ttcactgtcg gagaactcaa gaaagcaatc 120
ccaccgcact gtttcaaacg ctcgatccct cgctctttct cctacctcat ctgggacatc 180
atcatagcct cctgcttcta ctacgtcgcc accacttact tccctctcct ccctcaccct 240
ctctcctact tcgcctggcc tctctactgg gcctgccaag ggtgcgtcct aaccggcgtc 300
tgggtcatag cccacgagtg cggccaccac gccttcagcg actaccagtg gcttgacgac 360
accgtcggtc tcatcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagt 420
catcgacgcc accattccaa cactggctcc ctcgagagag acgaagtgtt tgtccccaag 480
aagaagtcag acatcaagtg gtacggcaag tacctcaaca accctttggg acgcaccgtg 540
atgttaacgg ttcagttcac tctcggctgg ccgttgtact tagccttcaa cgtctcggga 600
agaccttacg acggcggctt cgcttgccat ttccacccca acgctcccat ctacaacgac 660
cgcgagcgtc tccagatata catctccgac gctggcatcc tcgccgtctg ctacggtctc 720
ttccgttacg ccgccgcgca gggagtggcc tcgatggtct gcttctacgg agtcccgctt 780
ctgattgtca atggtttcct cgtgttgatc acttacttgc agcacacgca tccttccctg 840
cctcactacg attcgtccga gtgggattgg ttgaggggag ctttggctac cgttgacaga 900
gactacggaa tcttgaacaa ggtcttccac aatattaccg acacgcacgt ggcgcatcat 960
ctgttctcca cgatgccgca ttatcacgcg atggaagcta ccaaggcgat aaagccgata 1020
ctgggagagt attatcagtt cgatgggacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgtgga accggacagg caaggtgaga agaaaggtgt gttctggtac 1140
aacaataagt tatga 1155
<210> 3
<211> 1141
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 3
atgggcgcag gtggaagaat gcaagtctct cctccctcca gctcccccgg aaccaacacc 60
ctcaaacgcg tcccctgcga gacaccacca ttcactctcg gagacctcaa gaaagcaatc 120
ccacctcact gcttcaaacg ctccatccca cgctccttct cctcttcgac atcatcatct 180
cctcctcggc tcctccctct accacctctc cacagcctac ttccctctcc cttacctcgc 240
ctgacccctc tactgggcct gccaaggctg cgtcctaacg ggcctctggg tcatagccca 300
cgagtgcggc caccacgcct tcagcgacca ccagtggctg gacgacgccg ccggcctcgt 360
cttccactcc ttcctcctcg tcccgtactt ctcctggaag tacatccatg acgccaccat 420
tccaacaccg gatccctcga tagggacgaa gtgttcgtcc ccaagaagaa atccgacatc 480
aagtggtacg gcaagtacct caacaacccg ctaggacgca cggtgatgct aaccgtccag 540
ttcaagctcg gctggccgtt gtacttagcc ttcaacgtct cgggaagacc ttacagcgac 600
ggtttcgctt gccatttcca cccgaacgct cccatctaca acgaccgcga gcgtctccag 660
atatacatct ctgacgctgg cgtcctctcc gtatgttacg gtctctaccg ttacgctgct 720
tcgcgaggag tagcctctgt ggtctgtgtc tacggagttc cgcttctaat tgtcaactgt 780
ttcctcgtct tgatcactta cttgcagcac acgcaccctt cgctgcctca ctatgattct 840
tccgagtggg attggttgag aggagctttg gctactgtgg atagagacta tggaatcttg 900
aacaaggtgt tccataacat cacggacacg cacgtggcgc atcatctgtt ctcgacgatg 960
ccgcattata acgcgatgga agcgaccaag gcgataaagc cgatactttg gagagtatta 1020
ccagtttgat ggaacgccgg cggttaaggc gatgtggagg gaggcgaagg agtgtatcta 1080
tgttgaaccg gataggcaag gtgagaagaa aggtgtgttc tggtacaaca ataagttatg 1140
a 1141
<210> 4
<211> 1155
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 4
atgggcgcag gtggaagaat gcaagtctct cctccctcca gctcccccga aaccaaaacc 60
ctcaaacgcg tcccctgcga gacaccaccc ttcactctcg gagacctcaa gaaagcaatc 120
ccacctcact gcttcaaacg ctccatccct cgctccttct cctacctcct cttcgacatc 180
ctcgtctcct cctccctcta ccacctctcc acagcctact tccctctcct cccccaccct 240
ctcccttacc tcgcctggcc cctctactgg gcctgccaag gctgcgtcct aacgggcctc 300
tgggtcatcg cccacgaatg cggccaccac gccttcagcg accaccagtg gctggacgac 360
gccgtgggcc tcgtcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagc 420
catcgacgcc accattccaa caccggatcc ctcgagaggg atgaagtgtt cgtccccaag 480
aagaaatccg acatcaagtg gtacggaaag tacctcaaca acccgctagg acgcacggtg 540
atgctaaccg tccagttcac gctcggctgg ccgttgtact tagccttcaa cgtctctgga 600
agaccttaca gcgacggttt cgcttgccat ttccacccga acgctcccat ctacaacgac 660
cgcgagcgtc tccagatata catctctgac gctggcgtcc tctccgtatg ttacggtctc 720
taccgctacg ctggttcgcg aggagtggcc tcgatggtct gtgtctacgg agttccgctt 780
atgattgtca actgtttcct cgtcttgatc acttacttgc agcacacgca cccttcgctg 840
cctcactatg attcttcgga gtgggattgg ttgagaggag ctttggctac tgtggataga 900
gactatggaa tcttgaacaa ggtgtttcat aacatcacgg acacgcacgt ggcgcatcat 960
ctgttctcga cgatgccgca ttataacgcg atggaagcga ccaaggcgat aaagccgata 1020
cttggagagt attaccagtt tgatggaacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgttga accggatagg caaggtgaga agaaaggtgt gttctggtac 1140
aacaataagt tatga 1155
<210> 5
<211> 384
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<400> 5
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Lys Lys Ser
1 5 10 15
Glu Thr Asp Asn Ile Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Val Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Ile Ala Ser
50 55 60
Cys Phe Tyr Tyr Val Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro
65 70 75 80
Leu Ser Tyr Phe Ala Trp Pro Leu Tyr Trp Ala Cys Gln Gly Cys Val
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu
165 170 175
Gly Arg Thr Val Met Leu Thr Val Gln Phe Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp Gly Gly Phe Ala
195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu
210 215 220
Gln Ile Tyr Ile Ser Asp Ala Gly Ile Leu Ala Val Cys Tyr Gly Leu
225 230 235 240
Tyr Arg Tyr Ala Ala Val Gln Gly Val Ala Ser Met Val Cys Phe Tyr
245 250 255
Gly Val Pro Leu Leu Ile Val Asn Gly Phe Leu Val Leu Ile Thr Tyr
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Val
340 345 350
Val Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro
355 360 365
Asp Arg Gln Gly Glu Lys Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 6
<211> 384
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<400> 6
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Lys Lys Ser
1 5 10 15
Glu Thr Asp Thr Ile Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Val Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Ile Ala Ser
50 55 60
Cys Phe Tyr Tyr Val Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro
65 70 75 80
Leu Ser Tyr Phe Ala Trp Pro Leu Tyr Trp Ala Cys Gln Gly Cys Val
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu
165 170 175
Gly Arg Thr Val Met Leu Thr Val Gln Phe Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp Gly Gly Phe Ala
195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu
210 215 220
Gln Ile Tyr Ile Ser Asp Ala Gly Ile Leu Ala Val Cys Tyr Gly Leu
225 230 235 240
Phe Arg Tyr Ala Ala Ala Gln Gly Val Ala Ser Met Val Cys Phe Tyr
245 250 255
Gly Val Pro Leu Leu Ile Val Asn Gly Phe Leu Val Leu Ile Thr Tyr
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Val
340 345 350
Val Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro
355 360 365
Asp Arg Gln Gly Glu Lys Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 7
<211> 384
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<400> 7
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Lys Lys Ser
1 5 10 15
Glu Thr Asp Asn Ile Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Val Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Ile Ala Ser
50 55 60
Cys Phe Tyr Tyr Val Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro
65 70 75 80
Leu Ser Tyr Phe Ala Trp Pro Leu Tyr Trp Ala Cys Gln Gly Cys Val
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu
165 170 175
Gly Arg Thr Val Met Leu Thr Val Gln Phe Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp Gly Gly Phe Ala
195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu
210 215 220
Gln Ile Tyr Ile Ser Asp Ala Gly Ile Leu Ala Val Cys Tyr Gly Leu
225 230 235 240
Tyr Arg Tyr Ala Ala Val Gln Gly Val Ala Ser Met Val Cys Phe Tyr
245 250 255
Gly Val Pro Leu Leu Ile Val Asn Gly Phe Leu Val Leu Ile Thr Tyr
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Val
340 345 350
Val Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro
355 360 365
Asp Arg Gln Gly Glu Lys Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 8
<211> 384
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<400> 8
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Lys Lys Ser
1 5 10 15
Glu Thr Asp Asn Ile Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Val Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Ile Ala Ser
50 55 60
Cys Phe Tyr Tyr Val Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro
65 70 75 80
Leu Ser Tyr Phe Ala Trp Pro Leu Tyr Trp Ala Cys Gln Gly Cys Val
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu
165 170 175
Gly Arg Thr Val Met Leu Thr Val Gln Phe Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp Gly Gly Phe Ala
195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu
210 215 220
Gln Ile Tyr Ile Ser Asp Ala Gly Ile Leu Ala Val Cys Tyr Gly Leu
225 230 235 240
Tyr Arg Tyr Ala Ala Val Gln Gly Val Ala Ser Met Val Cys Phe Tyr
245 250 255
Gly Val Pro Leu Leu Ile Val Asn Gly Phe Leu Val Leu Ile Thr Tyr
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Val
340 345 350
Val Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro
355 360 365
Asp Arg Gln Gly Glu Lys Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 9
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 9
Leu Asp Leu Asn Arg Pro Pro Pro Val Glu Asn
1 5 10
<210> 10
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 10
Leu Arg Leu Phe Gly Val Asn Met
1 5
<210> 11
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 11
Leu Lys Leu Phe Gly Val Trp Leu
1 5
<210> 12
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 12
Leu Asp Leu Glu Leu Arg Leu Gly Phe Ala
1 5 10
<210> 13
<211> 203
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 13
Glu Arg Ser Asn Ser Ile Glu Leu Arg Asn Ser Phe Tyr Gly Arg Ala
1 5 10 15
Arg Thr Ser Pro Trp Ser Tyr Gly Asp Tyr Asp Asn Cys Gln Gln Asp
20 25 30
His Asp Tyr Leu Leu Gly Phe Ser Trp Pro Pro Arg Ser Tyr Thr Cys
35 40 45
Ser Phe Cys Lys Arg Glu Phe Arg Ser Ala Gln Ala Leu Gly Gly His
50 55 60
Met Asn Val His Arg Arg Asp Arg Ala Arg Leu Arg Leu Gln Gln Ser
65 70 75 80
Pro Ser Ser Ser Ser Thr Pro Ser Pro Pro Tyr Pro Asn Pro Asn Tyr
85 90 95
Ser Tyr Ser Thr Met Ala Asn Ser Pro Pro Pro His His Ser Pro Leu
100 105 110
Thr Leu Phe Pro Thr Leu Ser Pro Pro Ser Ser Pro Arg Tyr Arg Ala
115 120 125
Gly Leu Ile Arg Ser Leu Ser Pro Lys Ser Lys His Thr Pro Glu Asn
130 135 140
Ala Cys Lys Thr Lys Lys Ser Ser Leu Leu Val Glu Ala Gly Glu Ala
145 150 155 160
Thr Arg Phe Thr Ser Lys Asp Ala Cys Lys Ile Leu Arg Asn Asp Glu
165 170 175
Ile Ile Ser Leu Glu Leu Glu Ile Gly Leu Ile Asn Glu Ser Glu Gln
180 185 190
Asp Leu Asp Leu Glu Leu Arg Leu Gly Phe Ala
195 200
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 14
atcgagcgtt tgaaacagtg 20
<210> 15
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 15
tgtaatacga ctcactatag gtcgagcgtt tgaaacagtg gttttagagc tagaaatagc 60
aag 63
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 16
atggagcgtt tgaagcagtg 20
<210> 17
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 17
tgtaatacga ctcactatag gtggagcgtt tgaagcagtg gttttagagc tagaaatagc 60
aag 63
<210> 18
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 18
gaaagcaatc ccaccgcaca tgtttcaaac gctcgatccc t 41
<210> 19
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 19
gaaagcaatc ccaccgcacc tgtttcaaac gctcgatccc t 41
<210> 20
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 20
gaaagcaatc ccaccgcacg tgtttcaaac gctcgatccc t 41
<210> 21
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 21
gaaagcaatc ccaccgcact tgtttcaaac gctcgatccc t 41
<210> 22
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 22
gaaagcaatc ccaccgcacg tttcaaacgc tcgatccct 39
<210> 23
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 23
gaaagcaatc ccaccgcact ttcaaacgct cgatccct 38
<210> 24
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 24
gaaagcaatc ccacctcaca tgcttcaaac gctccatccc a 41
<210> 25
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 25
gaaagcaatc ccacctcacc tgcttcaaac gctccatccc a 41
<210> 26
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 26
gaaagcaatc ccacctcacg tgcttcaaac gctccatccc a 41
<210> 27
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 27
gaaagcaatc ccacctcact tgcttcaaac gctccatccc a 41
<210> 28
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 28
gaaagcaatc ccacctcacg cttcaaacgc tccatccca 39
<210> 29
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 29
gaaagcaatc ccacctcacc ttcaaacgct ccatccca 38
<210> 30
<211> 136
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 30
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Ser Ser Pro
1 5 10 15
Gly Thr Asn Thr Leu Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Leu Gly Asp Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Ser Ser Thr Ser Ser Ser Pro Pro Arg Leu
50 55 60
Leu Pro Leu Pro Pro Leu His Ser Leu Leu Pro Ser Pro Leu Pro Arg
65 70 75 80
Leu Thr Pro Leu Leu Gly Leu Pro Arg Leu Arg Pro Asn Gly Pro Leu
85 90 95
Gly His Ser Pro Arg Val Arg Pro Pro Arg Leu Gln Arg Pro Pro Val
100 105 110
Ala Gly Arg Arg Arg Arg Pro Arg Leu Pro Leu Leu Pro Pro Arg Pro
115 120 125
Val Leu Leu Leu Glu Val His Pro
130 135
<210> 31
<211> 384
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 31
Met Gly Ala Gly Gly Arg Met Gln Val Ser Pro Pro Ser Ser Ser Pro
1 5 10 15
Glu Thr Lys Thr Leu Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr
20 25 30
Leu Gly Asp Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Leu Phe Asp Ile Leu Val Ser Ser
50 55 60
Ser Leu Tyr His Leu Ser Thr Ala Tyr Phe Pro Leu Leu Pro His Pro
65 70 75 80
Leu Pro Tyr Leu Ala Trp Pro Leu Tyr Trp Ala Cys Gln Gly Cys Val
85 90 95
Leu Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp His Gln Trp Leu Asp Asp Ala Val Gly Leu Val Phe His Ser
115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu
165 170 175
Gly Arg Thr Val Met Leu Thr Val Gln Phe Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Ser Asp Gly Phe Ala
195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu
210 215 220
Gln Ile Tyr Ile Ser Asp Ala Gly Val Leu Ser Val Cys Tyr Gly Leu
225 230 235 240
Tyr Arg Tyr Ala Gly Ser Arg Gly Val Ala Ser Met Val Cys Val Tyr
245 250 255
Gly Val Pro Leu Met Ile Val Asn Cys Phe Leu Val Leu Ile Thr Tyr
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Val
340 345 350
Val Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro
355 360 365
Asp Arg Gln Gly Glu Lys Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 32
<211> 388
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 32
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactgtttca aacgctcgat ccctcgctct ttctcctacc tcatctggga catcatcata 180
gcctcctgct tctactacgt cgccaccact tacttccctc tcctccctca ccctctctcc 240
tacttcgcct ggcctctcta ctgggcctgc cagggctgcg tcctaaccgg cgtctgggtc 300
atagcccacg agtgcggcca ccacgccttc agcgactacc agtggctgga cgacaccgtc 360
ggcctcatct tccactcctt cctcctcg 388
<210> 33
<211> 389
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 33
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacttgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 180
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 240
ctacttcgcc tggcctctct actgggcctg ccagggctgc gtcctaaccg gcgtctgggt 300
catagcccac gagtgcggcc accacgcctt cagcgactac cagtggctgg acgacaccgt 360
cggcctcatc ttccactcct tcctcctcg 389
<210> 34
<211> 387
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 34
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacttttcaa acgctcgatc cctcgctctt tctcctacct catctgggac atcatcatag 180
cctcctgctt ctactacgtc gccaccactt acttccctct cctccctcac cctctctcct 240
acttcgcctg gcctctctac tgggcctgcc agggctgcgt cctaaccggc gtctgggtca 300
tagcccacga gtgcggccac cacgccttca gcgactacca gtggctggac gacaccgtcg 360
gcctcatctt ccactccttc ctcctcg 387
<210> 35
<211> 387
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 35
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactgttcaa acgctcgatc cctcgctctt tctcctacct catctgggac atcatcatag 180
cctcctgctt ctactacgtc gccaccactt acttccctct cctccctcac cctctctcct 240
acttcgcctg gcctctctac tgggcctgcc agggctgcgt cctaaccggc gtctgggtca 300
tagcccacga gtgcggccac cacgccttca gcgactacca gtggctggac gacaccgtcg 360
gcctcatctt ccactccttc ctcctcg 387
<210> 36
<211> 386
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 36
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactttcaaa cgctcgatcc ctcgctcttt ctcctacctc atctgggaca tcatcatagc 180
ctcctgcttc tactacgtcg ccaccactta cttccctctc ctccctcacc ctctctccta 240
cttcgcctgg cctctctact gggcctgcca gggctgcgtc ctaaccggcg tctgggtcat 300
agcccacgag tgcggccacc acgccttcag cgactaccag tggctggacg acaccgtcgg 360
cctcatcttc cactccttcc tcctcg 386
<210> 37
<211> 388
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 37
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactgtttca aacgctcgat ccctcgctct ttctcctacc tcatctggga catcatcata 180
gcctcctgct tctactacgt cgccaccact tacttccctc tcctccctca ccctctctcc 240
tacttcgcct ggcctctcta ctgggcctgc caagggtgcg tcctaaccgg cgtctgggtc 300
atagcccacg agtgcggcca ccacgccttc agcgactacc agtggcttga cgacaccgtc 360
ggtctcatct tccactcctt cctcctcg 388
<210> 38
<211> 389
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 38
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacttgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 180
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 240
ctacttcgcc tggcctctct actgggcctg ccaagggtgc gtcctaaccg gcgtctgggt 300
catagcccac gagtgcggcc accacgcctt cagcgactac cagtggcttg acgacaccgt 360
cggtctcatc ttccactcct tcctcctcg 389
<210> 39
<211> 387
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 39
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
catgtttcaa acgctcgatc cctcgctctt tctcctacct catctgggac atcatcatag 180
cctcctgctt ctactacgtc gccaccactt acttccctct cctccctcac cctctctcct 240
acttcgcctg gcctctctac tgggcctgcc aagggtgcgt cctaaccggc gtctgggtca 300
tagcccacga gtgcggccac cacgccttca gcgactacca gtggcttgac gacaccgtcg 360
gtctcatctt ccactccttc ctcctcg 387
<210> 40
<211> 387
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 40
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacgtttcaa acgctcgatc cctcgctctt tctcctacct catctgggac atcatcatag 180
cctcctgctt ctactacgtc gccaccactt acttccctct cctccctcac cctctctcct 240
acttcgcctg gcctctctac tgggcctgcc aagggtgcgt cctaaccggc gtctgggtca 300
tagcccacga gtgcggccac cacgccttca gcgactacca gtggcttgac gacaccgtcg 360
gtctcatctt ccactccttc ctcctcg 387
<210> 41
<211> 386
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 41
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactttcaaa cgctcgatcc ctcgctcttt ctcctacctc atctgggaca tcatcatagc 180
ctcctgcttc tactacgtcg ccaccactta cttccctctc ctccctcacc ctctctccta 240
cttcgcctgg cctctctact gggcctgcca agggtgcgtc ctaaccggcg tctgggtcat 300
agcccacgag tgcggccacc acgccttcag cgactaccag tggcttgacg acaccgtcgg 360
tctcatcttc cactccttcc tcctcg 386
<210> 42
<211> 385
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 42
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
tgtttcaaac gctcgatccc tcgctctttc tcctacctca tctgggacat catcatagcc 180
tcctgcttct actacgtcgc caccacttac ttccctctcc tccctcaccc tctctcctac 240
ttcgcctggc ctctctactg ggcctgccaa gggtgcgtcc taaccggcgt ctgggtcata 300
gcccacgagt gcggccacca cgccttcagc gactaccagt ggcttgacga caccgtcggt 360
ctcatcttcc actccttcct cctcg 385
<210> 43
<211> 384
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 43
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cattcaaacg ctcgatccct cgctctttct cctacctcat ctgggacatc atcatagcct 180
cctgcttcta ctacgtcgcc accacttact tccctctcct ccctcaccct ctctcctact 240
tcgcctggcc tctctactgg gcctgccaag ggtgcgtcct aaccggcgtc tgggtcatag 300
cccacgagtg cggccaccac gccttcagcg actaccagtg gcttgacgac accgtcggtc 360
tcatcttcca ctccttcctc ctcg 384
<210> 44
<211> 382
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 44
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cactaacgct cgatccctcg ctctttctcc tacctcatct gggacatcat catagcctcc 180
tgcttctact acgtcgccac cacttacttc cctctcctcc ctcaccctct ctcctacttc 240
gcctggcctc tctactgggc ctgccaaggg tgcgtcctaa ccggcgtctg ggtcatagcc 300
cacgagtgcg gccaccacgc cttcagcgac taccagtggc ttgacgacac cgtcggtctc 360
atcttccact ccttcctcct cg 382
<210> 45
<211> 374
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 45
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccggaaccaa caccctcaaa 60
cgcgtcccct gcgagacacc accattcact ctcggagacc tcaagaaagc aatcccacct 120
cactgcttca aacgctccat cccacgctcc ttctcctctt cgacatcatc atctcctcct 180
cggctcctcc ctctaccacc tctccacagc ctacttccct ctcccttacc tcgcctgacc 240
cctctactgg gcctgccaag gctgcgtcct aacgggcctc tgggtcatag cccacgagtg 300
cggccaccac gccttcagcg accaccagtg gctggacgac gccgccggcc tcgtcttcca 360
ctccttcctc ctcg 374
<210> 46
<211> 375
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 46
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccggaaccaa caccctcaaa 60
cgcgtcccct gcgagacacc accattcact ctcggagacc tcaagaaagc aatcccacct 120
cacttgcttc aaacgctcca tcccacgctc cttctcctct tcgacatcat catctcctcc 180
tcggctcctc cctctaccac ctctccacag cctacttccc tctcccttac ctcgcctgac 240
ccctctactg ggcctgccaa ggctgcgtcc taacgggcct ctgggtcata gcccacgagt 300
gcggccacca cgccttcagc gaccaccagt ggctggacga cgccgccggc ctcgtcttcc 360
actccttcct cctcg 375
<210> 47
<211> 388
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<400> 47
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccgaaaccaa aaccctcaaa 60
cgcgtcccct gcgagacacc acccttcact ctcggagacc tcaagaaagc aatcccacct 120
cactgcttca aacgctccat ccctcgctcc ttctcctacc tcctcttcga catcctcgtc 180
tcctcctccc tctaccacct ctccacagcc tacttccctc tcctccccca ccctctccct 240
tacctcgcct ggcccctcta ctgggcctgc caaggctgcg tcctaacggg cctctgggtc 300
atcgcccacg aatgcggcca ccacgccttc agcgaccacc agtggctgga cgacgccgtg 360
ggcctcgtct tccactcctt cctcctcg 388
<210> 48
<211> 389
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 48
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccgaaaccaa aaccctcaaa 60
cgcgtcccct gcgagacacc acccttcact ctcggagacc tcaagaaagc aatcccacct 120
cacttgcttc aaacgctcca tccctcgctc cttctcctac ctcctcttcg acatcctcgt 180
ctcctcctcc ctctaccacc tctccacagc ctacttccct ctcctccccc accctctccc 240
ttacctcgcc tggcccctct actgggcctg ccaaggctgc gtcctaacgg gcctctgggt 300
catcgcccac gaatgcggcc accacgcctt cagcgaccac cagtggctgg acgacgccgt 360
gggcctcgtc ttccactcct tcctcctcg 389
<210> 49
<211> 387
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 49
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccgaaaccaa aaccctcaaa 60
cgcgtcccct gcgagacacc acccttcact ctcggagacc tcaagaaagc aatcccacct 120
cacgcttcaa acgctccatc cctcgctcct tctcctacct cctcttcgac atcctcgtct 180
cctcctccct ctaccacctc tccacagcct acttccctct cctcccccac cctctccctt 240
acctcgcctg gcccctctac tgggcctgcc aaggctgcgt cctaacgggc ctctgggtca 300
tcgcccacga atgcggccac cacgccttca gcgaccacca gtggctggac gacgccgtgg 360
gcctcgtctt ccactccttc ctcctcg 387
<210> 50
<211> 385
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 50
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccgaaaccaa aaccctcaaa 60
cgcgtcccct gcgagacacc acccttcact ctcggagacc tcaagaaagc aatcccacct 120
cacttcaaac gctccatccc tcgctccttc tcctacctcc tcttcgacat cctcgtctcc 180
tcctccctct accacctctc cacagcctac ttccctctcc tcccccaccc tctcccttac 240
ctcgcctggc ccctctactg ggcctgccaa ggctgcgtcc taacgggcct ctgggtcatc 300
gcccacgaat gcggccacca cgccttcagc gaccaccagt ggctggacga cgccgtgggc 360
ctcgtcttcc actccttcct cctcg 385
<210> 51
<211> 389
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 51
gcaggtggaa gaatgcaagt gtctcctccc tccaaaaagt ctgaaaccga caacatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacttgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 180
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 240
ctacttcgcc tggcctctct actgggcctg ccagggctgc gtcctaaccg gcgtctgggt 300
catagcccac gagtgcggcc accacgcctt cagcgactac cagtggctgg acgacaccgt 360
cggcctcatc ttccactcct tcctcctcg 389
<210> 52
<211> 389
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 52
gcaggtggaa gaatgcaagt gtctcctccc tccaagaagt ctgaaaccga caccatcaag 60
cgcgtaccct gcgagacacc gcccttcact gtcggagaac tcaagaaagc aatcccaccg 120
cacttgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 180
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 240
ctacttcgcc tggcctctct actgggcctg ccaagggtgc gtcctaaccg gcgtctgggt 300
catagcccac gagtgcggcc accacgcctt cagcgactac cagtggcttg acgacaccgt 360
cggtctcatc ttccactcct tcctcctcg 389
<210> 53
<211> 375
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 53
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccggaaccaa caccctcaaa 60
cgcgtcccct gcgagacacc accattcact ctcggagacc tcaagaaagc aatcccacct 120
cacttgcttc aaacgctcca tcccacgctc cttctcctct tcgacatcat catctcctcc 180
tcggctcctc cctctaccac ctctccacag cctacttccc tctcccttac ctcgcctgac 240
ccctctactg ggcctgccaa ggctgcgtcc taacgggcct ctgggtcata gcccacgagt 300
gcggccacca cgccttcagc gaccaccagt ggctggacga cgccgccggc ctcgtcttcc 360
actccttcct cctcg 375
<210> 54
<211> 388
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体(Synthetic Construct)
<400> 54
gcaggtggaa gaatgcaagt ctctcctccc tccagctccc ccgaaaccaa aaccctcaaa 60
cgcgtcccct gcgagacacc acccttcact ctcggagacc tcaagaaagc aatcccacct 120
cactgcttca aacgctccat ccctcgctcc ttctcctacc tcctcttcga catcctcgtc 180
tcctcctccc tctaccacct ctccacagcc tacttccctc tcctccccca ccctctccct 240
tacctcgcct ggcccctcta ctgggcctgc caaggctgcg tcctaacggg cctctgggtc 300
atcgcccacg aatgcggcca ccacgccttc agcgaccacc agtggctgga cgacgccgtg 360
ggcctcgtct tccactcctt cctcctcg 388

Claims (70)

1.一种非转基因植物或植物细胞,其包括具有与任何天然存在的FAD2基因不同的序列的两种FAD2基因,其中所述FAD2基因的差异为各自+1、-1、-2核苷酸插入缺失(InDel)。
2.一种非转基因植物或植物细胞,其包括具有与任何天然存在的FAD2基因不同的序列的三种FAD2基因,其中所述FAD2基因的差异为各自+1、-1、-2核苷酸插入缺失(InDel)。
3.一种非转基因植物或植物细胞,其包括具有与任何天然存在的FAD2基因不同的序列的四种FAD2基因,其中所述FAD2基因的差异为各自+1、-1、-2核苷酸插入缺失(InDel)。
4.根据前述权利要求中任一项所述的非转基因植物或植物细胞,其中所述FAD2基因序列差异为靶向突变。
5.根据前述权利要求中任一项所述的植物或植物细胞,其中与相应的野生型全长FAD2蛋白质相比,降低或消除由修饰的或突变的FAD2基因表达的蛋白质的活性或表达。
6.根据前述权利要求中任一项所述的非转基因植物,其中所述植物产生具有至少68%或至少70%或至少72%或至少74%;或至少76%;或至少78%;或至少79%;或至少80%;或至少81%;或至少82%;或至少83%;或至少84%;或至少84%;或至少85%;或至少86%;或至少87%;或至少88%;或至少89%;或至少90%;或至少91%;或至少92%;或至少93%;或至少94%;或至少95%的油酸含量的种子油。
7.根据前述权利要求中任一项所述的非转基因植物,其中所述植物产生具有68%-72%之间;或70%-76%之间;或72%-80%之间;或74%-80%之间;或74%-82%之间;或76%-82%之间;或78%-82%之间;或80%-84%之间;或82%-88%之间;或82%-89%之间;或84%-90%之间;或86%-90%之间的油酸含量的种子油。
8.根据前述权利要求中任一项所述的非转基因植物,其中所述植物产生具有小于18%;或小于16%;或小于15%;或小于14%;或小于13%;或小于12%;或小于10%;或小于9%;或小于8%;或小于7%;或小于6%;或小于5%;或小于4%;或小于3%;或小于2%的亚麻油酸含量的种子油。
9.根据前述权利要求中任一项所述的非转基因植物,其中所述植物产生具有至少68%或至少70%或至少72%或至少74%;或至少76%;或至少78%;或至少79%;或至少80%;或至少81%;或至少82%;或至少83%;或至少84%;或至少84%;或至少85%;或至少86%;或至少87%;或至少88%;或至少89%;或至少90%;或至少91%;或至少92%;或至少93%;或至少94%;或至少95%的油酸含量;和具有小于18%;或小于16%;或小于15%;或小于14%;或小于13%;或小于12%;或小于10%;或小于9%;或小于8%;或小于7%;或小于6%;或小于5%;或小于4%;或小于3%;或小于2%的亚麻油酸含量的种子油。
10.一种方法,所述方法包括在植物或植物细胞的内源基因组FAD2基因中制造靶向突变。
11.一种方法,所述方法包括使细胞接触配置为特异性使内源基因组FAD2基因产生切口或切割内源基因组FAD2基因的DNA切割物。
12.一种方法,所述方法包括使细胞接触配置为特异性使内源基因组FAD2基因产生切口或切割内源基因组FAD2基因的CRISPR、TALEN、锌指或大范围核酸酶。
13.一种在植物细胞中造成基因改变的方法,所述方法包括使所述细胞暴露于编码FAD2基因中的至少一个突变的GRON。
14.一种用于制造包括内源基因组FAD2基因中的突变的植物或植物细胞的方法,所述方法包括:
(1)将具有所述FAD2基因中的靶向突变的基因修复寡核碱基引入至植物细胞中,以产生具有突变体FAD2基因的植物细胞;和
(2)从所述选择的植物细胞再生具有突变的FAD2基因的植物。
15.一种用于在FAD2基因中制造突变的方法,所述方法包括使细胞暴露于DNA切割物。
16.一种用于在FAD2基因中制造突变的方法,所述方法包括使细胞暴露于DNA切割物和GRON。
17.一种用于在FAD2基因中制造突变的方法,所述方法包括使细胞暴露于DNA切割物和GRON,其中用Cy3基团、3PS基团和2’O-甲基中的一种或多种修饰所述GRON。
18.一种植物细胞,所述植物细胞包括DNA切割物和GRON(比如,结合和/或修饰FAD2基因的GRON),例如,其中所述GRON比如用Cy3基团、3PS基团、2’O-甲基或其他修饰来修饰。在一些实施方式中,所述DNA切割物为选自CRISPR、TALEN、锌指、大范围核酸酶和切割DNA的抗生素中的一种或多种。
19.根据前述权利要求中任一项所述的方法,其中所述方法不包括使所述植物或植物细胞接触任何转基因。
20.根据前述权利要求中任一项所述的方法,其中源自所述方法的所述植物为非转基因的。
21.根据前述权利要求中任一项所述的植物或方法,其中所述植物为芸薹属植物、甘蓝型油菜(油菜、芸薹)、芜菁(例如,大头菜、大白菜)、甘蓝(西兰花、卷心菜、花椰菜等)、芥菜型油菜(芥菜)或萝卜(常见小萝卜),以及许多重要的豆类作物,比如豌豆、大豆、扁豆和黄豆。
22.根据前述权利要求中任一项所述的方法,其中所述方法产生根据前述权利要求中任一项所述的植物或植物细胞。
23.一种植物或其部分,包括编码脂肪酸去饱和酶2(FAD2)基因的至少两条、至少三条或四条核酸序列中的至少一个突变。
24.根据权利要求23所述的植物或其部分,其中所述核酸序列与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中的核酸序列具有至少90%的同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。
25.根据权利要求24所述的植物或其部分,其中所述核酸序列选自由SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中。
26.根据权利要求23-25中任一项所述的植物或其部分,其中所述突变为移码突变。
27.根据权利要求26所述的植物或其部分,其中与没有所述移码突变的相应的内源基因相比,所述移码突变产生一个或多个核苷酸插入或缺失。
28.根据权利要求26-27中任一项所述的植物或其部分,其中所述移码突变产生提前终止密码子。
29.根据权利要求26-28中任一项所述的植物或其部分,其中所述突变降低或消除所述FAD2基因和/或FAD2多肽的表达。
30.根据权利要求23-29中任一项所述的植物或其部分,其中所述植物产生包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量的种子油。
31.根据权利要求30所述的植物或其部分,其中所述植物产生包括至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量的种子油。
32.根据权利要求23-31中任一项所述的植物或其部分,其中所述植物产生包括68%-72%之间、70%-76%之间、72%-80%之间、74%-80%之间、74%-82%之间、76%-82%之间、78%-82%之间、80%-84%之间、82%-88%之间、82%-89%之间、84%-90%之间或86%-90%之间的油酸含量的种子油。
33.根据权利要求23-32中任一项所述的植物或其部分,其中所述植物产生包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量的种子油。
34.根据权利要求23-33中任一项所述的植物或其部分,其中所述植物产生包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量;并且包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量的种子油。
35.根据权利要求23-29中任一项所述的植物或其部分,其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的水平的油酸。
36.根据权利要求35所述的植物或其部分,其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的水平的油酸。
37.根据权利要求35或权利要求36所述的植物或其部分,其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在68%-72%之间、70%-76%之间、72%-80%之间、74%-80%之间、74%-82%之间、76%-82%之间、78%-82%之间、80%-84%之间、82%-88%之间、82%-89%之间、84%-90%之间或86%-90%之间的水平的油酸。
38.根据权利要求35-37中任一项所述的植物或其部分,其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的水平的亚麻油酸。
39.根据权利要求35-38中任一项所述的植物或其部分,其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的水平的油酸;并且按所述种子的总脂肪酸含量的重量计,所述种子包括在小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的水平的亚麻油酸。
40.根据权利要求23-39中任一项所述的植物,其中所述植物选自由甘蓝型油菜、芜菁、甘蓝、芥菜型油菜、芸薹属物种、萝卜、豌豆、四季豆、兵豆、大豆和豆科物种组成的组中。
41.根据权利要求40所述的植物,其中所述植物为甘蓝型油菜、芜菁或芥菜型油菜。
42.一种F1植物,其中所述F1植物具有根据权利要求23-41中任一项所述的植物作为亲本。
43.一种制造植物种子的方法,所述方法包括使根据权利要求23-41中任一项所述的植物与另一植物杂交并且从中收获种子。
44.一种制造根据权利要求23-41中任一项所述的植物的方法,所述方法包括从根据权利要求23-41中任一项所述的植物与根据权利要求23-41中任一项所述的植物的杂交中选择种子,以制备根据权利要求23-41中任一项所述的植物。
45.一种通过使根据权利要求43或权利要求44所述的种子生长而产生的植物,其中所述植物具有根据权利要求23-41中任一项所述的植物的所有生理学和形态学特点。
46.从种子中提取的油,按所述种子的总脂肪酸含量的重量计,所述油包括在至少80%的水平的油酸。
47.根据权利要求46所述的油,其中从种子中提取所述油,所述种子按所述种子的总脂肪酸含量的重量计,包括约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸。
48.从植物的种子提取的油,所述油包括编码脂肪酸去饱和酶2(FAD2)基因的至少两条、至少三条或四条核酸序列中的至少一个突变,其中所述核酸序列与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中的核酸序列具有至少90%的同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性,其中所述突变降低或消除所述FAD2基因和/或FAD2多肽的表达,并且其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少80%的水平的油酸。
49.根据权利要求48所述的油,其中按所述种子的总脂肪酸含量的重量计,所述种子包括约80%-84%、82%-88%、82%-89%、84%-90%或86%-90%或更多的油酸。
50.根据权利要求48或权利要求49所述的植物,其中所述植物选自由甘蓝型油菜、芜菁、甘蓝、芥菜型油菜、芸薹属物种、萝卜、豌豆、四季豆、兵豆、大豆和豆科物种组成的组中。
51.根据权利要求50所述的植物,其中所述植物为甘蓝型油菜、芜菁或芥菜型油菜。
52.一种产生根据权利要求23-42、45和50-51中任一项所述的植物的方法,所述方法包括下述步骤:
a)将突变引入至植物细胞中,其中所述突变为编码FAD2基因的至少两条、至少三条或四条核酸序列中的至少一个突变;
b)选择或鉴定含有所述突变的植物细胞;和
c)再生具有所述突变的植物;
其中所述植物产生包括高油酸含量的种子油。
53.产生根据权利要求23-42、45和50-51中任一项所述的植物的方法,包括下述步骤:
a)将突变引入至植物细胞中,其中所述突变为编码FAD2基因的至少两条、至少三条或四条核酸序列中的至少一个突变;
b)选择或鉴定含有所述突变的植物细胞;和
c)再生具有所述突变的植物;
其中所述植物产生种子并且所述种子包括高油酸含量。
54.根据权利要求52或权利要求53所述的方法,其中所述高油酸含量包括至少68%、至少70%、至少72%、至少74%、至少76%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%的油酸含量。
55.根据权利要求52-54中任一项所述的方法,其中所述植物产生进一步包括低亚麻油酸含量的种子油。
56.根据权利要求55所述的方法,其中所述低亚麻油酸含量包括小于18%、小于16%、小于15%、小于14%、小于13%、小于12%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%或小于2%的亚麻油酸含量。
57.根据权利要求52-56中任一项所述的方法,其中使用一个或多个载体引入所述突变,其中所述载体包括选自由设计为靶向编码FAD2基因的核酸序列的CRISPR/Cas9系统、TALEN、锌指和大范围核酸酶组成的组中的基因编辑组分。
58.根据权利要求57所述的方法,其中使用设计为靶向编码FAD2基因的核酸序列的GRON系统引入所述突变。
59.根据权利要求58所述的方法,其中所述GRON系统包括选自由Cy3基团、3PS基团和2’O-甲基组成的组中的一种或多种修饰。
60.根据权利要求52-59中任一项所述的方法,其中所述核酸序列与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中的核酸序列具有至少90%的序列同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。
61.根据权利要求60所述的方法,其中所述核酸序列选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中。
62.根据权利要求52-61中任一项所述的方法,其中所述突变选自由移码突变;与没有移码突变的相应的内源基因相比,产生一个或多个核苷酸插入或缺失的移码突变;和产生提前终止密码子的移码突变组成的组中,并且其中所述突变降低或消除所述FAD2基因和/或FAD2多肽的表达。
63.一种用于在种子中产生高油酸的方法,所述方法包括使包括编码FAD2基因的至少两条、至少三条或四条核酸序列中的至少一个突变的植物生长,其中所述突变降低或消除所述FAD2基因和/或FAD2多肽的表达,并且其中所述植物产生包括在至少80%的水平的油酸的种子油。
64.一种用于在种子中产生高油酸的方法,所述方法包括使包括编码FAD2基因的至少两条、至少三条或四条核酸序列中的至少一个突变的植物生长,其中所述突变降低或消除FAD2基因和/或FAD2多肽的表达,并且其中所述植物产生种子并且按所述种子的总脂肪酸含量的重量计,所述种子包括在至少80%水平的油酸。
65.根据权利要求63或权利要求64所述的方法,其中所述核酸序列与选自由SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中的核酸序列具有至少90%的序列同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。
66.根据权利要求65所述的方法,其中所述核酸序列选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4组成的组中。
67.根据权利要求63-66中任一项所述的方法,其中所述方法进一步包括从所述植物中分离种子。
68.根据权利要求67所述的方法,其中所述方法进一步包括从植物种子中提取油。
69.根据权利要求52-68中任一项所述的方法,其中所述植物选自由甘蓝型油菜、芜菁、甘蓝、芥菜型油菜、芸薹属物种、萝卜、豌豆、四季豆、兵豆、大豆和豆科物种组成的组中。
70.根据权利要求69所述的方法,其中所述植物为甘蓝型油菜、芜菁或芥菜型油菜。
CN201980024178.0A 2018-04-04 2019-04-04 Fad2基因和突变 Pending CN111954462A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862652623P 2018-04-04 2018-04-04
US62/652,623 2018-04-04
PCT/US2019/025881 WO2019195611A1 (en) 2018-04-04 2019-04-04 Fad2 genes and mutations

Publications (1)

Publication Number Publication Date
CN111954462A true CN111954462A (zh) 2020-11-17

Family

ID=68101453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980024178.0A Pending CN111954462A (zh) 2018-04-04 2019-04-04 Fad2基因和突变

Country Status (8)

Country Link
US (1) US20210010013A1 (zh)
EP (1) EP3772905A4 (zh)
CN (1) CN111954462A (zh)
AU (1) AU2019247403A1 (zh)
CA (1) CA3095047A1 (zh)
CL (1) CL2020002548A1 (zh)
EA (1) EA202092382A1 (zh)
WO (1) WO2019195611A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020012365A1 (en) * 2018-07-09 2020-01-16 Cellectis Canola with high oleic acid
WO2021138403A1 (en) * 2019-12-30 2021-07-08 Calyxt, Inc. High oleic acid soybean oil
CN113528698B (zh) * 2021-07-14 2022-01-25 中国农业科学院油料作物研究所 一种鉴定和/或区分甘蓝类蔬菜的InDel分子标记及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101629206A (zh) * 2008-07-19 2010-01-20 刘春林 甘蓝型油菜种子内不同来源fad2基因表达的快速检测方法
CN101696415A (zh) * 2009-10-28 2010-04-21 南京农业大学 一种油酸脱氢酶基因及其所编码的蛋白质
US20140150132A1 (en) * 2011-03-02 2014-05-29 Plant Bioscience Limited Mutants
US20170283820A1 (en) * 2016-04-04 2017-10-05 The United States Of America, As Represented By The Secretary Of Agriculture High oleic acid soybean seeds

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6342658B1 (en) * 1995-12-14 2002-01-29 Cargill, Incorporated Fatty acid desaturases and mutant sequences thereof
US5850026A (en) * 1996-07-03 1998-12-15 Cargill, Incorporated Canola oil having increased oleic acid and decreased linolenic acid content
EP1844153A2 (en) * 2005-01-28 2007-10-17 Bayer BioScience N.V. Brassica plant comprising a mutant fatty acid desaturase
EP1837397A1 (en) * 2006-03-21 2007-09-26 Monsanto S.A.S. FAD-2 mutants and high oleic plants
US20120122223A1 (en) * 2010-08-03 2012-05-17 Cibus Us Llc Mutated protoporphyrinogen ix oxidase (ppx) genes
EP3288370A1 (en) * 2015-04-28 2018-03-07 Bayer CropScience NV Brassica plants with modified seed oil composition
CA3014036A1 (en) * 2016-02-09 2017-08-17 Cibus Us Llc Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101629206A (zh) * 2008-07-19 2010-01-20 刘春林 甘蓝型油菜种子内不同来源fad2基因表达的快速检测方法
CN101696415A (zh) * 2009-10-28 2010-04-21 南京农业大学 一种油酸脱氢酶基因及其所编码的蛋白质
US20140150132A1 (en) * 2011-03-02 2014-05-29 Plant Bioscience Limited Mutants
US20170283820A1 (en) * 2016-04-04 2017-10-05 The United States Of America, As Represented By The Secretary Of Agriculture High oleic acid soybean seeds

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WILLIAM HAUN 等: "Improved soybean oil quality by targeted mutagenesis of the fatty acid desaturase 2 gene family", 《 PLANT BIOTECHNOL J》 *
WILLIAM HAUN 等: "Improved soybean oil quality by targeted mutagenesis of the fatty acid desaturase 2 gene family", 《 PLANT BIOTECHNOL J》, vol. 12, no. 7, 23 May 2014 (2014-05-23), pages 934 - 940, XP055358281, DOI: 10.1111/pbi.12201 *

Also Published As

Publication number Publication date
EP3772905A4 (en) 2022-01-05
CL2020002548A1 (es) 2020-12-18
US20210010013A1 (en) 2021-01-14
EP3772905A1 (en) 2021-02-17
CA3095047A1 (en) 2019-10-10
AU2019247403A1 (en) 2020-11-26
WO2019195611A1 (en) 2019-10-10
EA202092382A1 (ru) 2021-02-02

Similar Documents

Publication Publication Date Title
JP7170807B2 (ja) オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物
JP7293441B2 (ja) オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物
US20210261974A1 (en) Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
US20230407322A1 (en) Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
US20230057587A1 (en) Shatterproof genes and mutations
CN111954462A (zh) Fad2基因和突变
NZ751577B2 (en) Methods And Compositions For Increasing Efficiency Of Targeted Gene Modification Using Oligonucleotide-Mediated Gene Repair

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination