CN110325643A - 具有经基因修饰的fad2的富含油酸的植物体及其生产方法 - Google Patents

具有经基因修饰的fad2的富含油酸的植物体及其生产方法 Download PDF

Info

Publication number
CN110325643A
CN110325643A CN201780086719.3A CN201780086719A CN110325643A CN 110325643 A CN110325643 A CN 110325643A CN 201780086719 A CN201780086719 A CN 201780086719A CN 110325643 A CN110325643 A CN 110325643A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
gene
fatty acid
unsaturated fatty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780086719.3A
Other languages
English (en)
Inventor
金奭中
具钰才
郑民熙
金艺瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corporation Tours
Toolgen Inc
Original Assignee
Corporation Tours
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Corporation Tours filed Critical Corporation Tours
Publication of CN110325643A publication Critical patent/CN110325643A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L19/00Products from fruits or vegetables; Preparation or treatment thereof
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/115Fatty acids or derivatives thereof; Fats or oils
    • A23L33/12Fatty acids or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/19Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Mycology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及用于增加植物体中的特定不饱和脂肪酸的含量的经人工操纵的不饱和脂肪酸生物合成相关因子及其用途;更具体而言,本发明涉及:能够实现不饱和脂肪酸的生物合成的人工调节的系统,所述系统包含用于调节不饱和脂肪酸的生物合成的经人工操纵的不饱和脂肪酸生物合成相关因子;和/或能够实现不饱和脂肪酸生物合成相关因子的人工操纵的组合物;以及由所述系统和/或组合物产生的植物体。特别地,本发明涉及用于通过经人工操纵的不饱和脂肪酸生物合成相关因子(例如FAD2、FAD3、FAD6、FAD7和FAD8和/或它们的表达产物)调节不饱和脂肪酸的生物合成的系统。

Description

具有经基因修饰的FAD2的富含油酸的植物体及其生产方法
技术领域
本发明涉及使用CRISPR-Cas系统对FAD2基因进行操纵或修饰以增加植物体内的油酸含量,更具体而言,本发明涉及通过使用能够靶向相应基因的CRISPR-Cas系统对FAD2基因进行修饰而使油酸含量增加的植物体、能够操纵FAD2基因的操纵组合物以及使用该操纵组合物的方法。
背景技术
由于大豆油富含必需脂肪酸以及大豆油粕作为副产品的高利用率,大豆油是世界上消费量第二大的食用油,每年生产4500万吨。组成大豆油的脂肪酸中约62%为多不饱和脂肪酸(polyunsaturated fatty acids,PUFA),其中54%的脂肪酸为亚油酸,8%的脂肪酸为亚麻酸。由于这些脂肪酸具有两个以上双键,因而容易发生氧化,并且油容易酸败,从而使得难以进行储存和分送(储存性低且分送困难)。因此,为制造具有稳定质量的大豆油以用于食品加工或烹饪,需要预处理工艺和纯化工艺。大多数大豆油制造商通过部分氢化处理将氢添加至不饱和双键(其在制造工艺中容易发生氧化)处来防止酸败,从而将质量维持在一定水平。
然而,部分氢化具有产生反式脂肪酸的缺点,从而在用氢使不饱和脂肪酸的双键饱和的过程中具有风险。虽然在天然状态下,氧化主要产生顺式脂肪酸,但是由于反式形式是热力学稳定的,在氢化或加工中产生反式脂肪酸(其是不会天然出现的几何异构体)。
由于对反式脂肪风险的争议,2015年,美国FDA决定将在制造加工食品的过程中广泛使用的部分氢化油从公认安全(Generally Recognized as Safe,GRAS)清单中剔除。因此,美国食品制造商正在寻找可替代部分氢化油的不同的食用油,至2018年停止使用部分氢化油,预计相关行业将花费60亿美元来确立可替代的食用油或新制造工艺。根据FDA行动,预计仅在美国,部分氢化大豆油的需求量每年减少900万吨。
此外,许多国家(如欧洲、韩国和日本以及美国)均非常清楚反式脂肪酸的风险,并且全球趋于鼓励人们尽可能不要过多地食用,看起来未来会进一步加强对部分氢化油的监管。因此,需要开发出可替代通过部分氢化生产的大豆油的不含反式脂肪酸的食用油产品。
发明内容
技术问题
为解决上述问题,本发明涉及经人工操纵的不饱和脂肪酸的控制系统,所述系统具有增加特定不饱和脂肪酸的含量的效果。更具体而言,本发明涉及经人工操纵的不饱和脂肪酸生物合成相关因子以及人工修饰特定不饱和脂肪酸的含量的不饱和脂肪酸控制系统。
本发明旨在提供通过经人工操纵的不饱和脂肪酸生物合成相关因子使特定不饱和脂肪酸的含量增加的植物体。
本发明旨在提供通过经人工操纵的不饱和脂肪酸生物合成相关因子使特定不饱和脂肪酸的含量减少的植物体。
作为本发明的示例性实施方式,本发明提供了经人工操纵的不饱和脂肪酸生物合成相关因子。
作为本发明的示例性实施方式,本发明提供了经人工操纵的不饱和脂肪酸的控制系统。
作为本发明的示例性实施方式,本发明提供了经人工操纵的不饱和脂肪酸生物合成相关因子及其表达产物。
作为本发明的示例性实施方式,本发明提供了用于操纵基因以对不饱和脂肪酸生物合成相关因子进行操纵的组合物及其使用方法。
作为本发明的示例性实施方式,本发明提供了控制不饱和脂肪酸的生物合成的方法。
作为本发明的示例性实施方式,本发明提供了控制不饱和脂肪酸的种类及其含量的方法。
作为本发明的示例性实施方式,本发明提供了用于控制不饱和脂肪酸以控制不饱和脂肪酸的生物合成和/或不饱和脂肪酸的含量的组合物及其各种用途。
作为本发明的示例性实施方式,本发明提供了经人工操纵的不饱和脂肪酸生物合成相关因子(例如FAD2、FAD3、FAD4、FAD6、FAD7或FAD8)和/或它们的表达产物。
作为本发明的示例性实施方式,本发明提供了用于操纵基因以对不饱和脂肪酸生物合成相关因子(例如FAD2、FAD3、FAD4、FAD6、FAD7或FAD8)进行人工操纵的组合物。
作为本发明的示例性实施方式,本发明提供了经人工操纵的不饱和脂肪酸生物合成相关因子(例如FAD2、FAD3、FAD4、FAD6、FAD7或FAD8)和/或用于操纵基因的组合物在人工操纵方面的各种用途。
作为本发明的示例性实施方式,本发明提供了特定不饱和脂肪酸的含量增加或减少的植物体以及使用该植物体的加工产品。
技术方案
为解决这些问题,本发明提供了能够人工控制不饱和脂肪酸的生物合成和/或脂肪酸的含量的系统,所述系统包含用于控制特定不饱和脂肪酸的含量的经人工操纵的不饱和脂肪酸生物合成相关因子和/或能够人工操纵不饱和脂肪酸生物合成相关因子的组合物。
在一个示例性实施方式中,本发明提供了通过经人工操纵的不饱和脂肪酸生物合成相关因子使特定不饱和脂肪酸的含量增加的植物体。
在另一示例性实施方式中,本发明提供了通过使用经人工操纵的不饱和脂肪酸生物合成相关因子从植物体获得的特定不饱和脂肪酸。
本文使用的术语“特定不饱和脂肪酸”是指选自于各种类型的已知不饱和脂肪酸中的一种或多种不饱和脂肪酸,在多种类型的不饱和脂肪酸中,其可为选自于由不饱和脂肪酸所包含的碳(C)数和双键(D)数表示的分类系统中的一种或多种不饱和脂肪酸。本文使用的术语“CN:DM不饱和脂肪酸”是指由N个碳(C)组成且包含M个双键(D)的不饱和脂肪酸。此处,N可为4-36的整数,且M可为1-35的整数。
特定不饱和脂肪酸可为C8-24:D1不饱和脂肪酸。
特定不饱和脂肪酸可为C16-22:D1不饱和脂肪酸。
特定不饱和脂肪酸可为C18:D1不饱和脂肪酸。
特定不饱和脂肪酸可为油酸、反油酸(elaidic acid)或异油酸(vaccenic acid)。
此外,特定不饱和脂肪酸可为C8-24:D2不饱和脂肪酸。
特定不饱和脂肪酸可为C16-22:D2不饱和脂肪酸。
特定不饱和脂肪酸可为C18:D2不饱和脂肪酸。
特定不饱和脂肪酸可为亚油酸或反亚油酸(linoelaidic acid)。
在本发明的一个示例性实施方式中,本发明提供了经人工操纵的不饱和脂肪酸生物合成相关因子。
本文使用的术语“不饱和脂肪酸生物合成相关因子(unsaturated fatty acidbiosynthesis-associated factor)”是指直接参与不饱和脂肪酸的生物合成或者间接影响不饱和脂肪酸的生物合成的所有因子。此处,所述因子可为DNA、RNA、基因、肽、多肽或蛋白。所述因子包括能够控制不饱和脂肪酸的生物合成的各种物质,其为非天然的,即经人工操纵的。例如,所述因子可以是在植物中表达的经基因操纵或修饰的基因或蛋白。
不饱和脂肪酸生物合成相关因子可增加植物中所包含的特定不饱和脂肪酸的含量。
不饱和脂肪酸生物合成相关因子可减少植物中所包含的特定不饱和脂肪酸的含量。
不饱和脂肪酸生物合成相关因子可影响用于控制植物中所包含的特定不饱和脂肪酸的含量的直接机制/间接机制。
在本发明的一个示例性实施方式中,不饱和脂肪酸生物合成相关因子可以是例如经人工操纵的FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因或FAD8基因,优选FAD2基因或FAD3基因。
在本发明的一个示例性实施方式中,不饱和脂肪酸生物合成相关因子可包含两种以上经人工操纵的基因。例如,选自于由如下基因所组成的组中的两种以上基因可为经人工操纵的:FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因和FAD8基因。
因此,在本发明的示例性实施方式中,提供了一种或多种经人工操纵的不饱和脂肪酸生物合成相关因子,所述不饱和脂肪酸生物合成相关因子选自于由在核酸序列中进行了修饰的FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因和FAD8基因所组成的组。
核酸序列中的修饰可不受限制地为通过引导核酸-编辑蛋白复合体进行人工操纵。
术语“引导核酸-编辑蛋白复合体”是指经由引导核酸和编辑蛋白间的相互作用形成的复合体,该核酸-蛋白复合体包含引导核酸和编辑蛋白。
引导核酸-编辑蛋白复合体可用于修饰对象物。所述对象物可为靶核酸、基因、染色体或蛋白。
例如,所述基因可为通过引导核酸-编辑蛋白复合体进行人工操纵的不饱和脂肪酸生物合成相关因子,
其中,经人工操纵的所述不饱和脂肪酸生物合成相关因子包含一种或多种核酸修饰,所述修饰为:
在组成所述不饱和脂肪酸生物合成相关因子的核酸序列中的原型间隔区邻近基序(PAM)序列中或在临近所述PAM序列的5'端和/或3'端的连续的1bp-50bp碱基序列区内的以下修饰中的至少一种:一个或多个核苷酸的删除或插入;用不同于野生型基因的一个或多个核苷酸进行的置换;以及一个或多个外源核苷酸的插入;或者
在组成所述不饱和脂肪酸生物合成相关因子的核酸序列中的一个或多个核苷酸的化学修饰。
核酸修饰可发生于基因的启动子区。
核酸修饰可发生于基因的外显子区。在一个示例性实施方式中,50%的修饰可发生于基因编码区的上游部分。
核酸修饰可发生于基因的内含子区。
核酸修饰可发生于基因的增强子区。
PAM序列可为例如如下序列中的一种或多种(以5'至3'方向来描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;R为A或G;Y为C或T);以及
TTN(N为A、T、C或G)。
编辑蛋白可由如下微生物衍生而来:酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomycesviridochromogenes)、绿色产色链霉菌、玫瑰链孢囊菌(Streptosporangium roseum)、玫瑰链孢囊菌、酸热脂环酸芽胞杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒还原芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德式乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌(Burkholderiales bacterium)、食萘极单胞菌(Polaromonas naphthalenivorans)、极单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝杆藻(Cyanothecesp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯醋盐杆菌(Acetohalobium arabaticum)、丹氏制氨菌(Ammonifex degensii)、Caldicelulosiruptor bescii、Candidatus Desulforudis、肉毒梭菌(Clostridiumbotulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、Pelotomaculum thermopropionicum、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、Allochromatium vinosum、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsonii)、游海假交替单胞菌(Pseudoalteromonas haloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、调查甲烷盐菌(Methanohalobium evestigatum)、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻(Nostoc sp.)、极大节旋藻(Arthrospiramaxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)或Acaryochloris marina。
在一个示例性实施方式中,编辑蛋白可为选自于由如下编辑蛋白所组成的组中的一种或多种:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌(Campylobacter jejuni)衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌(Streptocuccusaureus)衍生而来的Cas9蛋白、脑膜炎奈瑟菌(Neisseria meningitidis)衍生而来的Cas9蛋白以及Cpf1蛋白。作为实例,编辑蛋白可为酿脓链球菌衍生而来的Cas9蛋白或者空肠弯曲杆菌衍生而来的Cas9蛋白。
此外,在另一实施方式中,本发明提供了引导核酸,所述引导核酸能够与FAD2基因的核酸序列中的SEQ ID NO:1-SEQ ID NO:30(例如SEQ ID NO:7或SEQ ID NO:30)的靶序列形成互补结合。
引导核酸可与FAD2基因的部分核酸序列形成互补结合。所述结合可产生0-5、0-4、0-3或0-2个错配。作为优选实例,引导核酸可为分别与SEQ ID NO:1-SEQ ID NO:30(例如SEQ ID NO:7或SEQ ID NO:30)的靶序列中的一条或多条形成互补结合的核苷酸。
所述引导核酸可不受限制地为18bp-25bp、18bp-24bp、18bp-23bp、19bp-23bpp、19bp-23bp或20bp-23bp的核苷酸。
此外,本发明提供了用于基因操纵的组合物,可在用于特定目的的不饱和脂肪酸生物合成相关因子的人工操纵中利用所述组合物。
用于基因操纵的组合物可包含引导核酸-编辑蛋白复合体或编码该引导核酸-编辑蛋白复合体的核酸序列。
用于基因操纵的组合物可包含:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸能够分别与选自于由FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的各个靶序列形成互补结合;
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
在一个示例性实施方式中,引导核酸可为分别与SEQ ID NO:1-SEQ ID NO:30的靶序列中的一条或多条形成互补结合的核酸序列。
例如,引导核酸可为与SEQ ID NO:7或SEQ ID NO:30的靶序列形成互补结合的核酸序列。
在一个示例性实施方式中,用于基因操纵的组合物可为病毒载体系统。
病毒载体可为使用农杆菌的农杆菌载体系统。
在一个示例性实施方式中,用于基因操纵的组合物可为病毒载体系统。
病毒载体可包括选自于由如下病毒载体所组成的组中的一种或多种:花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒(vaccinia virus)、痘病毒(poxvirus)和单纯疱疹病毒。
在示例性实施方式中,本发明提供了用于人工操纵细胞的方法,所述方法包括分别将如下物质导入细胞:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸能够分别与选自于由FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的靶序列形成互补结合;以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
引导核酸和编辑蛋白可以以核酸序列的形式存在于一个或多个载体中,或者可存在于通过将引导核酸和编辑蛋白结合而形成的复合体中。
导入可在植物体内进行或离体进行。
导入可通过选自于如下方法中的一种或多种方法进行:基因枪、电穿孔、脂质体、质粒、农杆菌载体系统、病毒载体、纳米粒子和蛋白质易位结构域(PTD)融合蛋白方法。
病毒载体可包括选自于由如下病毒载体所组成的组中的一种或多种:花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
此外,本发明提供了用于控制不饱和脂肪酸以对植物中不饱和脂肪酸的生物合成和/或不饱和脂肪酸的含量进行控制的组合物。
用于控制不饱和脂肪酸的组合物可包括用于基因操纵的组合物,其可在不饱和脂肪酸生物合成相关因子的人工操纵中使用。
用于基因操纵的组合物的构成与上述相同。
在示例性实施方式中,本发明提供了使用特定不饱和脂肪酸的含量增加或减少的植物体的加工产品。
所述植物体可包含经人工操纵的不饱和脂肪酸生物合成相关因子。
所述加工产品可为能够被人和/或动物摄取的食品。
在示例性实施方式中,本发明提供了用于基因操纵以控制特定不饱和脂肪酸的含量的试剂盒。
所述试剂盒可包含用于基因操纵的组合物,所述用于基因操纵的组合物可在不饱和脂肪酸生物合成相关因子的人工操纵中使用。
可使用此种试剂盒对感兴趣的基因进行人工操纵。
有益效果
通过使用经人工操纵的不饱和脂肪酸生物合成相关因子以及由此而经人工修饰的不饱和脂肪酸的控制系统,能够制造其中对人健康有益的特定不饱和脂肪酸的含量增加或者对人健康有害的特定不饱和脂肪酸的含量减少的植物体和/或使用该植物体的加工产品。
例如,可使用选自于如下基因中的一种或多种基因:FAD2基因、FAD3基因、FAD4基因、FAD6基因、FAD7基因和FAD8基因。
附图说明
图1是用于修饰大豆FAD2基因的CRISPR-Cas9载体pPZP-FAD2-7和pPZP-FAD2-30的示意图。
图2说明了由使用pPZP-FAD2-7(a)和pPZP-FAD2-30(b)敲除FAD2基因而制备的大豆转基因植物体的生长过程。
图3示出了pPZP-FAD2-7和pPZP-FAD2-30的T0转化体。
图4示出了用于确认pPZP-FAD2-7和pPZP-FAD2-30的T0转化体的插入基因的PCR结果。此处,NT为Glycine max L.Kwangan(野生型),而#1、#2、#3、#5、#8、#9、#19和#21为T0转化体。
图5示出了pPZP-FAD2-7和pPZP-FAD2-30的T1种子中的油酸含量。
图6示出了由CRISPR-Cas9靶向的FAD2基因的插入缺失(indel)频率。
图7示出了使用CRISPR-Cas9转化的大豆FAD2基因的测序结果(包含PAM的靶序列用下划线示出)。
图8示出了在T1转化体中经操纵的FAD2基因的插入缺失频率和靶位点筛选的结果,示出了(a)10号染色体(chr10)和(b)20号染色体(chr20)中FAD2基因的插入缺失频率和靶位点筛选的结果。
图9示出了在T1转化体中经操纵的FAD2基因的靶位点测序结果,示出了(a)10号染色体(chr10)和(b)20号染色体(chr20)中FAD2基因的靶位点测序结果。
图10示出了pPZP-FAD2-7和pPZP-FAD2-30的T1转化体。
图11示出了使用PCR进行的pPZP-FAD2-7和pPZP-FAD2-30的T1转化体的基因去除分析结果。
具体实施方式
除非另有定义,本文使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文所述的方法和材料类似或相同的方法和材料可用于本发明的实践或实验中,适合的方法和材料将在下文中描述。本文提及的所有出版物、专利申请、专利和其它参考文献都以引用的方式将它们整体并入。另外,材料、方法和实施方式仅为说明性的,而不旨在进行限制。
本发明的一个方面涉及
C8-24:D1不饱和脂肪酸的含量增加的转基因植物体。
具体而言,本发明涉及通过人工操纵不饱和脂肪酸生物合成相关因子而使特定不饱和脂肪酸的含量增加的转基因植物体;本发明包括其中的功能被人工改变的不饱和脂肪酸生物合成相关因子、用于该不饱和脂肪酸生物合成相关因子的人工操纵组合物、制备该不饱和脂肪酸生物合成相关因子的方法以及包含该不饱和脂肪酸生物合成相关因子的植物体。
本发明的另一方面涉及
C8-24:D2不饱和脂肪酸的含量减少的转基因植物体。
具体而言,本发明涉及通过人工操纵不饱和脂肪酸生物合成相关因子而使特定不饱和脂肪酸的含量减少的转基因植物体;本发明包括其中的功能被人工改变的不饱和脂肪酸生物合成相关因子、用于该不饱和脂肪酸生物合成相关因子的人工操纵组合物、制备该不饱和脂肪酸生物合成相关因子的方法以及包含该不饱和脂肪酸生物合成相关因子的植物体。
[不饱和脂肪酸]
本发明的一个方面是用于改变脂肪酸的含量的系统。
在一个实例中,可提供用于改变植物体中特定饱和脂肪酸的含量的系统。
在另一实例中,可提供用于改变植物体中特定不饱和脂肪酸的含量的系统。
本文使用的术语“脂肪酸”是指具有脂肪链的羧酸,并且在天然状态下产生的大多数脂肪酸具有约4-36个偶数个碳(其形成碳链)。根据碳键的类型,主要将脂肪酸分成饱和脂肪酸和不饱和脂肪酸。
本文使用的术语“饱和脂肪酸”是指由单键形成的脂肪酸。
饱和脂肪酸包括丙酸、丁酸、戊酸、己酸、庚酸、辛酸、壬酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山嵛酸、木蜡酸(lignoceric acid)、蜡酸(cerotic acid)等。
本文使用的术语“不饱和脂肪酸”是指具有一个或多个碳-碳双键的脂肪酸。不饱和脂肪酸包括所有的顺式不饱和脂肪酸和反式不饱和脂肪酸。顺式不饱和脂肪酸是指其中的分别与参与双键的两个碳结合的两个氢在结构上位于同一方向上的不饱和脂肪酸。另一方面,反式不饱和脂肪酸是指其中的分别与参与双键的两个碳结合的两个氢在结构上位于不同方向上的不饱和脂肪酸。
根据参与双键的碳的位置,可将不饱和脂肪酸分为Omega-3、Omega-6、Omega-7和Omega-9。
不饱和脂肪酸包括Omega-3(ω-3)脂肪酸。
此处,“Omega-3(ω-3)脂肪酸”是指其中的双键从碳链末端的第三个碳开始的不饱和脂肪酸,并且包括α-亚麻酸(ALA)、二十碳五烯酸(EPA)和二十二碳六烯酸(DHA)。
不饱和脂肪酸包括Omega-6(ω-6)脂肪酸。
此处,“Omega-6(ω-6)脂肪酸”是指其中的双键从碳链末端的第六个碳开始的不饱和脂肪酸,并且包括亚油酸(LA)、γ-亚麻酸(GLA)、二高-γ-亚麻酸(DGLA)和花生四烯酸(AA)。
不饱和脂肪酸包括Omega-7(ω-7)脂肪酸。
此处,“Omega-7(ω-7)脂肪酸”是指其中的双键从碳链末端的第七个碳开始的不饱和脂肪酸,并且包括二十烯酸(paullinic acid)、棕榈油酸或异油酸。
不饱和脂肪酸包括Omega-9(ω-9)脂肪酸。
此处,“Omega-9(ω-9)脂肪酸”是指其中的双键从碳链末端的第九个碳开始的不饱和脂肪酸,并且包括油酸、反油酸、二十碳烯酸(eicosenoic acid)、芥酸(erucic acid)和神经酸(nervonic acid)。
在一个示例性实施方式中,不饱和脂肪酸可为Omega-6(ω-6)脂肪酸。
在另一示例性实施方式中,不饱和脂肪酸可为Omega-9(ω-9)脂肪酸。
此外,通过表示出碳数和双键数,可将不饱和脂肪酸分类成CN:DM不饱和脂肪酸。
术语“CN:DM不饱和脂肪酸”是指由N个碳(C)组成并包含M个双键(D)的不饱和脂肪酸。此处,N可为4-36的整数,且M可为1-35的整数。
例如,由18个碳组成并包含2个双键的不饱和脂肪酸可通过表示为C18:D2不饱和脂肪酸来进行分类。
在一个示例性实施方式中,不饱和脂肪酸包括CN:D1不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D1不饱和脂肪酸可为C8:D1不饱和脂肪酸、C10:D1不饱和脂肪酸、C12:D1不饱和脂肪酸、C14:D1不饱和脂肪酸、C16:D1不饱和脂肪酸、C18:D1不饱和脂肪酸、C20:D1不饱和脂肪酸、C22:D1不饱和脂肪酸或C24:D1不饱和脂肪酸。
在另一示例性实施方式中,不饱和脂肪酸包括CN:D2不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D2不饱和脂肪酸可为C8:D2不饱和脂肪酸、C10:D2不饱和脂肪酸、C12:D2不饱和脂肪酸、C14:D2不饱和脂肪酸、C16:D2不饱和脂肪酸、C18:D2不饱和脂肪酸、C20:D2不饱和脂肪酸、C22:D2不饱和脂肪酸或C24:D2不饱和脂肪酸。
在又一示例性实施方式中,不饱和脂肪酸包括CN:D3不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D3不饱和脂肪酸可为C8:D3不饱和脂肪酸、C10:D3不饱和脂肪酸、C12:D3不饱和脂肪酸、C14:D3不饱和脂肪酸、C16:D3不饱和脂肪酸、C18:D3不饱和脂肪酸、C20:D3不饱和脂肪酸、C22:D3不饱和脂肪酸或C24:D3不饱和脂肪酸。
在又一示例性实施方式中,不饱和脂肪酸包括CN:D4不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D4不饱和脂肪酸可为C8:D4不饱和脂肪酸、C10:D4不饱和脂肪酸、C12:D4不饱和脂肪酸、C14:D4不饱和脂肪酸、C16:D4不饱和脂肪酸、C18:D4不饱和脂肪酸、C20:D4不饱和脂肪酸、C22:D4不饱和脂肪酸或C24:D4不饱和脂肪酸。
在又一示例性实施方式中,不饱和脂肪酸包括CN:D5不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D5不饱和脂肪酸可为C8:D5不饱和脂肪酸、C10:D5不饱和脂肪酸、C12:D5不饱和脂肪酸、C14:D5不饱和脂肪酸、C16:D5不饱和脂肪酸、C18:D5不饱和脂肪酸、C20:D5不饱和脂肪酸、C22:D5不饱和脂肪酸或C24:D5不饱和脂肪酸。
在又一示例性实施方式中,不饱和脂肪酸包括CN:D6不饱和脂肪酸。
此处,N可为4-36的整数。
优选地,CN:D6不饱和脂肪酸可为C8:D6不饱和脂肪酸、C10:D6不饱和脂肪酸、C12:D6不饱和脂肪酸、C14:D6不饱和脂肪酸、C16:D6不饱和脂肪酸、C18:D6不饱和脂肪酸、C20:D6不饱和脂肪酸、C22:D6不饱和脂肪酸或C24:D6不饱和脂肪酸。
在又一示例性实施方式中,不饱和脂肪酸包括CN:DK不饱和脂肪酸。
此处,N可为4-36的整数,且K可为7-35的整数。
在一个示例性实施方式中,不饱和脂肪酸可为C8-24:D1不饱和脂肪酸。
优选地,不饱和脂肪酸可选自于由如下不饱和脂肪酸所组成的组:C16:D1不饱和脂肪酸、C18:D1不饱和脂肪酸、C20:D1不饱和脂肪酸和C22:D1不饱和脂肪酸。
最优选地,不饱和脂肪酸可为C18:D1不饱和脂肪酸或C20:D1不饱和脂肪酸。
在另一示例性实施方式中,不饱和脂肪酸可为C8-24:D2不饱和脂肪酸。
优选地,不饱和脂肪酸可选自于由如下不饱和脂肪酸所组成的组:C16:D2不饱和脂肪酸、C18:D2不饱和脂肪酸、C20:D2不饱和脂肪酸和C22:D2不饱和脂肪酸。
最优选地,不饱和脂肪酸可为C18:D2不饱和脂肪酸或C20:D2不饱和脂肪酸。
[不饱和脂肪酸生物合成相关因子]
不饱和脂肪酸生物合成相关因子
本发明的另一方面是经人工操纵或修饰的不饱和脂肪酸生物合成相关因子。
本文使用的术语“不饱和脂肪酸生物合成相关因子”是指直接参与不饱和脂肪酸的生物合成或者间接影响不饱和脂肪酸的生物合成的所有因子。此处,所述因子可为DNA、RNA、基因、肽、多肽或蛋白。
在示例性实施方式中,不饱和脂肪酸生物合成相关因子包括能够控制不饱和脂肪酸的生物合成的各种物质,这些物质是非天然的,即经人工操纵的。例如,所述不饱和脂肪酸生物合成相关因子可以是在植物中表达的经基因操纵或修饰的基因或蛋白。
术语“经人工操纵的(artificially manipulated)”是指经人工修饰的状态,而不是天然存在的状态。
术语“经基因操纵的(genetically manipulated)”意味着将基因修饰人工导入本发明提及的植物衍生物质,例如,其可为出于特定目的对其中的基因组进行了人工修饰的基因和基因产物(多肽、蛋白等)。
作为优选实例,本发明提供了用于特定目的的经基因操纵或修饰的不饱和脂肪酸生物合成相关因子。
具有下列功能的基因或蛋白不仅可以具有一种类型的不饱和脂肪酸生物合成相关功能,还可具有多种类型的功能。此外,根据需要,可提供两种以上不饱和脂肪酸生物合成相关功能和因子。
不饱和脂肪酸生物合成相关因子可通过在饱和脂肪酸中形成一个或多个双键来产生不饱和脂肪酸。
不饱和脂肪酸生物合成相关因子可在不饱和脂肪酸中形成新的一个或多个双键。
不饱和脂肪酸生物合成相关因子可将不饱和脂肪酸中所包含的一个或多个双键的位置改变。
不饱和脂肪酸生物合成相关因子可将具有两个以上双键的不饱和脂肪酸的一个或多个双键去除。
不饱和脂肪酸生物合成相关因子可将顺式不饱和脂肪酸变成反式不饱和脂肪酸。
不饱和脂肪酸生物合成相关因子可将反式不饱和脂肪酸变成顺式不饱和脂肪酸。
不饱和脂肪酸生物合成相关因子可控制植物中所包含的不饱和脂肪酸的含量。
不饱和脂肪酸生物合成相关因子可增加植物中所包含的特定不饱和脂肪酸的含量。
不饱和脂肪酸生物合成相关因子可减少植物中所包含的特定不饱和脂肪酸的含量。
在示例性实施方式中,不饱和脂肪酸生物合成相关因子可为植物的不饱和脂肪酸生物合成相关因子。
优选地,不饱和脂肪酸生物合成相关因子可为FAD基因或FAD蛋白。
最优选地,不饱和脂肪酸生物合成相关因子可为选自于由FAD2、FAD3、FAD6、FAD7和FAD8所组成的组中的一种或多种。
在任意示例性实施方式中,不饱和脂肪酸生物合成相关因子可为FAD2。
FAD2(omega-6脂肪酸去饱和酶)基因是指编码FAD2(也称为FAD2-1、FAD2-1B或GMFAD2-1B)蛋白的基因(全长DNA、cDNA或mRNA)。在一个实例中,FAD2基因可为选自于由以下基因所组成的组中的一种或多种基因,但本发明不限于此:编码植物(例如大豆(Glycinemax))FAD2(例如NCBI登录号NP_001341865.1、XP_006605883.1、XP_006605882.1、XP_006605885.1、XP_006605884.1或XP_014627765.1)的基因,例如由NCBI登录号NM_001354936.1、XM_006605820.2、XM_006605819.2、XM_006605822.2、XM_006605821.2或XM_014772279.1表示的FAD2基因。
在任意示例性实施方式中,不饱和脂肪酸生物合成相关因子可为FAD3。
FAD3(微粒体omega-3脂肪酸去饱和酶)基因是指编码FAD3(也称为Fanx)蛋白的基因(全长DNA、cDNA或mRNA)。在一个实例中,FAD3基因可为选自于由以下基因所组成的组中的一种或多种基因,但本发明不限于此:编码植物(例如大豆)FAD3(例如NCBI登录号NP_001237507.1)的基因,例如由NCBI登录号NM_001250578.1表示的FAD3基因。
在任意示例性实施方式中,不饱和脂肪酸生物合成相关因子可为FAD6。
FAD6(脂肪酸去饱和酶6)基因是指编码FAD6(也称为FADC或SFD4)蛋白的基因(全长DNA、cDNA或mRNA)。在一个实例中,FAD3基因可为选自于由以下基因所组成的组中的一种或多种基因,但本发明不限于此:编码植物(例如拟南芥(Arabidopsis thaliana))FAD6(例如NCBI登录号NP_194824.1)的基因,例如由NCBI登录号NM_119243.4表示的FAD6基因。
在任意示例性实施方式中,不饱和脂肪酸生物合成相关因子可为FAD7。
FAD7(叶绿体omega-3脂肪酸去饱和酶亚型2)基因是指编码FAD7蛋白的基因(全长DNA、cDNA或mRNA)。在一个实例中,FAD7基因可为选自于由以下基因所组成的组中的一种或多种基因,但本发明不限于此:编码植物(例如大豆)FAD7(例如NCBI登录号NP_001237361.1)的基因,例如由NCBI登录号NM_001250432.1表示的FAD7基因。
在任意示例性实施方式中,不饱和脂肪酸生物合成相关因子可为FAD8。
FAD8(叶绿体样omega-3脂肪酸去饱和酶)基因是指编码FAD8蛋白的基因(全长DNA、cDNA或mRNA)。在一个实例中,FAD8基因可为选自于由以下基因所组成的组中的一种或多种基因,但本发明不限于此:编码植物(例如大豆)FAD8(例如NCBI登录号NP_001239777.1)的基因,例如由NCBI登录号NM_001252848.1表示的FAD8基因。
不饱和脂肪酸生物合成相关因子可源自于植物,例如大豆、拟南芥、芝麻和玉米等。
可从已知数据库(例如美国国立生物技术信息中心(NCBI)的GenBank)获得关于基因的信息。
在本发明的一个示例性实施方式中,不饱和脂肪酸生物合成相关因子(例如FAD2、FAD3、FAD6、FAD7或FAD8)可为经人工操纵的不饱和脂肪酸生物合成相关因子。
在某一实施方式中,经人工操纵的不饱和脂肪酸生物合成相关因子可为经基因操纵的。
可以通过在野生型基因的基因组序列的部分或全部区域中发生的人工插入、删除、置换或倒位(inversion)来实现基因操纵或修饰。此外,可以通过对两种以上基因进行融合操纵或修饰来实现基因操纵或修饰。
例如,可通过此类基因操纵或修饰使基因进一步活化,从而该基因编码的蛋白表达为具有比其原始功能更好的功能的蛋白形式。在实例中,当由特定基因编码的蛋白的功能为A时,经操纵的基因表达的蛋白的功能可完全不同于A,或者其可具有包含A在内的额外功能(A+B)。例如,由于此类基因操纵或修饰,可利用功能彼此不同或彼此互补的两种以上基因来表达融合形式的两种以上蛋白。
例如,由于此类基因操纵或修饰,可通过利用功能彼此不同或彼此互补的两种以上基因来在细胞中单独地或独立地表达两种以上蛋白。
经操纵的不饱和脂肪酸生物合成相关因子可通过在饱和脂肪酸中形成一个或多个双键来产生不饱和脂肪酸。
经操纵的不饱和脂肪酸生物合成相关因子可在不饱和脂肪酸中形成新的一个或多个双键。
经操纵的不饱和脂肪酸生物合成相关因子可改变不饱和脂肪酸中所包含的一个或多个双键的位置。
经操纵的不饱和脂肪酸生物合成相关因子可去除具有两个以上双键的不饱和脂肪酸的一个或多个双键。
经操纵的不饱和脂肪酸生物合成相关因子可将顺式不饱和脂肪酸变成反式不饱和脂肪酸。
经操纵的不饱和脂肪酸生物合成相关因子可将反式不饱和脂肪酸变成顺式不饱和脂肪酸。
经操纵的不饱和脂肪酸生物合成相关因子可控制植物中所包含的不饱和脂肪酸的含量。
经操纵的不饱和脂肪酸生物合成相关因子可增加植物中所包含的特定不饱和脂肪酸的含量。
经操纵的不饱和脂肪酸生物合成相关因子可减少植物中所包含的特定不饱和脂肪酸的含量。
操纵包括不饱和脂肪酸生物合成相关因子的所有类型的结构修饰或功能修饰。
不饱和脂肪酸生物合成相关因子的结构修饰包括不同于自然状态中存在的野生型的所有类型的修饰。
例如,当不饱和脂肪酸生物合成相关因子为DNA、RNA或基因时,结构修饰可为一个或多个核苷酸的丢失(loss)。
结构修饰可为一个或多个核苷酸的插入。
此处,插入的核苷酸包含对象物(其包含不饱和脂肪酸生物合成相关因子)和从对象物外部进入的核苷酸这二者。
结构修饰可为一个或多个核苷酸的置换。
结构修饰可包括一个或多个核苷酸的化学修饰。
此处,化学修饰包括化学官能团的添加、去除和取代中的全部。
作为另一实例,当不饱和脂肪酸生物合成相关因子为肽、多肽或蛋白质时,结构修饰可为一个或多个氨基酸的丢失。
结构修饰可为一个或多个氨基酸的插入。
此处,插入的氨基酸包含对象物(其包含不饱和脂肪酸生物合成相关因子)以及从对象物外部进入的氨基酸这二者。
结构修饰可为一个或多个氨基酸的置换。
结构修饰可包括一个或多个氨基酸的化学修饰。
此处,化学修饰包括化学官能团的添加、去除和取代中的全部。
结构修饰可为不同的肽、多肽或蛋白质的部分或全部附着。
此处,不同的肽、多肽或蛋白质可以是不饱和脂肪酸生物合成相关因子,或者是具有不同功能的肽、多肽或蛋白质。
不饱和脂肪酸生物合成相关因子的功能修饰可包括相比于自然状态下存在的野生型的功能而言具有改善或降低的功能以及具有第三种不同功能的全部类型。
例如,当不饱和脂肪酸生物合成相关因子为肽、多肽或蛋白时,功能修饰可为不饱和脂肪酸生物合成相关因子的突变。
此处,突变可为增强或抑制不饱和脂肪酸生物合成相关因子的功能的突变。
功能修饰可具有不饱和脂肪酸生物合成相关因子的额外功能。
此处,额外功能可以是相同或不同的功能。此外,具有额外功能的不饱和脂肪酸生物合成相关因子可与不同的肽、多肽或蛋白质进行融合。
功能修饰可以是归因于不饱和脂肪酸生物合成相关因子的表达增加的功能上的增强。
功能修饰可以是归因于不饱和脂肪酸生物合成相关因子的表达减少的功能上的降低。
在示例性实施方式中,可通过如下突变中的一种或多种对经操纵的不饱和脂肪酸生物合成相关因子进行诱导:
全部或部分删除不饱和脂肪酸生物合成相关因子(即,待操纵的基因(下文中称为靶基因)),例如删除靶基因的1bp或更多个核苷酸,例如1-30个核苷酸、1-27个核苷酸、1-25个核苷酸、1-23个核苷酸、1-20个核苷酸、1-15个核苷酸、1-10个核苷酸、1-5个核苷酸、1-3个核苷酸或者1个核苷酸;
用不同于野生型的核苷酸置换靶基因的1bp或更多个核苷酸,例如1-30个核苷酸、1-27个核苷酸、1-25个核苷酸、1-23个核苷酸、1-20个核苷酸、1-15个核苷酸、1-10个核苷酸、1-5个核苷酸、1-3个核苷酸或者1个核苷酸;以及
在靶基因的任意位置插入一个或多个核苷酸,例如1-30个核苷酸、1-27个核苷酸、1-25个核苷酸、1-23个核苷酸、1-20个核苷酸、1-15个核苷酸、1-10个核苷酸、1-5个核苷酸、1-3个核苷酸或者1个核苷酸(各自独立地选自于A、T、C和G)。
靶基因被修饰的部分(“靶区域”)可为基因的碱基序列中连续的1bp以上、3bp以上、5bp以上、7bp以上、10bp以上、12bp以上、15bp以上、17bp以上或20bp以上(例如1bp-30bp、3bp-30bp、5bp-30bp、7bp-30bp、10bp-30bp、12bp-30bp、15bp-30bp、17bp-30bp、20bp-30bp、1bp-27bp、3bp-27bp、5bp-27bp、7bp-27bp、10bp-27bp、12bp-27bp、15bp-27bp、17bp-27bp、20bp-27bp、1bp-25bp、3bp-25bp、5bp-25bp、7bp-25bp、10bp-25bp、12bp-25bp、15bp-25bp、17bp-25bp、20bp-25bp、1bp-23bp、3bp-23bp、5bp-23bp、7bp-23bp、10bp-23bp、12bp-23bp、15bp-23bp、17bp-23bp、20bp-23bp、1bp-20bp、3bp-20bp、5bp-20bp、7bp-20bp、10bp-20bp、12bp-20bp、15bp-20bp、17bp-20bp、21bp-25bp、18bp-22bp或者21bp-23bp)的区域。
[不饱和脂肪酸控制系统]
本发明的一个方面涉及不饱和脂肪酸控制系统,所述系统通过人工操纵不饱和脂肪酸生物合成相关因子来控制不饱和脂肪酸的生物合成。
本文使用的术语“不饱和脂肪酸控制系统”包括通过改变经人工操纵的不饱和脂肪酸生物合成相关因子的功能而影响如下的所有现象:不饱和脂肪酸的生物合成的促进或抑制和/或不饱和脂肪酸的产量的增加或抑制,并且包括直接或间接参与控制不饱和脂肪酸的生物合成的系统的所有材料、组合物、方法及用途。
构成用于控制不饱和脂肪酸的生物合成的系统的各个因子也被称为“不饱和脂肪酸控制因子”。
本发明的系统包括与经人工操纵的不饱和脂肪酸生物合成相关因子相关的植物体中的修饰机制。通过经人工操纵的不饱和脂肪酸生物合成相关因子,
在任意示例性实施方式中,可控制C8-24:D1不饱和脂肪酸的生物合成;
在任意示例性实施方式中,可控制C8-24:D2不饱和脂肪酸的生物合成;
在任意示例性实施方式中,可控制C8-24:D1不饱和脂肪酸的产量;
在任意示例性实施方式中,可控制C8-24:D2不饱和脂肪酸的产量;
在任意示例性实施方式中,可控制植物体中C8-24:D1不饱和脂肪酸的含量;
在任意示例性实施方式中,可控制植物体中C8-24:D2不饱和脂肪酸的含量;
在任意示例性实施方式中,可控制植物体中C8-24:D1不饱和脂肪酸与C8-24:D2不饱和脂肪酸的含量比;
在任意示例性实施方式中,可添加或去除C8-24:D1不饱和脂肪酸的双键;以及
在任意示例性实施方式中,可添加或去除C8-24:D2不饱和脂肪酸的双键。
在另一示例性实施方式中,本发明的不饱和脂肪酸控制系统包含用于操纵不饱和脂肪酸生物合成相关因子的组合物。
用于操纵的组合物可为能够人工操纵不饱和脂肪酸生物合成相关因子的组合物,并且优选地为用于基因操纵的组合物。
下文中,将对用于基因操纵的组合物进行描述。
[用于操纵不饱和脂肪酸生物合成相关因子的组合物]
涉及本发明的不饱和脂肪酸生物合成相关因子和不饱和脂肪酸控制系统的物质的操纵或修饰优选通过基因操纵来完成。
一方面,可提供通过靶向不饱和脂肪酸生物合成相关因子的非编码区或编码区的部分或全部来操纵基因的组合物和方法。
在示例性实施方式中,所述组合物和方法可在参与形成用于控制不饱和脂肪酸的期望系统的一种或多种不饱和脂肪酸生物合成相关基因的操纵或修饰中使用。操纵或修饰可通过对构成基因的核酸进行修饰而实施。作为操纵结果,包括敲减、敲除和敲入中的全部。
在示例性实施方式中,可通过靶向启动子区或转录序列(例如内含子序列或外显子序列)来实施操纵。可靶向编码序列(例如编码区和起始编码区)来改变表达和进行敲除。
在示例性实施方式中,核酸修饰可为一个或多个核苷酸(例如1bp-30bp、1bp-27bp、1bp-25bp、1bp-23bp、1bp-20bp、1bp-15bp、1bp-10bp、1bp-5bp、1bp-3bp或1bp的核苷酸)的置换、删除和/或插入。
在示例性实施方式中,对于一种或多种不饱和脂肪酸生物合成相关基因的敲除、一种或多种基因的表达的去除或者一个或两个等位基因中的一个或多个敲除而言,可靶向上述区域以使得一种或多种不饱和脂肪酸生物合成相关基因包含缺失或突变。
在示例性实施方式中,可利用基因敲减来降低不希望的等位基因或转录组的表达。
在示例性实施方式中,可靶向启动子、增强子、内含子、3'UTR和/或多聚腺苷酸信号的非编码序列来用于修饰影响不饱和脂肪酸的生物合成功能的不饱和脂肪酸生物合成相关基因。
在示例性实施方式中,可通过修饰基因的核酸来对不饱和脂肪酸生物合成相关基因的活性进行调节(例如活化或失活)。
在示例性实施方式中,修饰基因的核酸可以是通过引导核酸-编辑蛋白复合体在靶基因的特定区域中催化单链或双链的切割(即,核酸链的断裂),使得靶基因失活。
在示例性实施方式中,可借助诸如同源重组或非同源末端接合(NHEJ)等机制来修复核酸链的断裂。
在该情况下,当发生NHEJ机制时,在切割位点处诱导DNA序列的改变,导致基因失活。借助NHEJ的修复可诱导短基因片段的置换、插入或删除,并可用于诱导相应的基因敲除。
在另一方面,本发明提供了用于操纵不饱和脂肪酸生物合成相关因子的组合物。
用于操纵的组合物是能够人工操纵不饱和脂肪酸生物合成相关因子的组合物,优选地为用于基因操纵的组合物。
所述组合物可在参与形成用于控制不饱和脂肪酸的期望系统的一种或多种不饱和脂肪酸生物合成相关因子的基因操纵中使用。
可考虑基因表达的调节过程来实施基因操纵。
在示例性实施方式中,可通过选择对如下各步骤而言合适的操纵方法来实施:转录调节步骤、RNA加工调节步骤、RNA转运调节步骤、RNA降解调节步骤、翻译调节步骤和蛋白修饰调节步骤。
在示例性实施方式中,使用RNA干扰(RNAi)或RNA沉默,小RNA(sRNA)干扰mRNA或降低其稳定性;并且,在一些情况下,通过破坏mRNA来中断蛋白合成信息的递送,从而调节遗传信息的表达。
基因操纵可通过对构成不饱和脂肪酸生物合成相关因子的核酸进行修饰而实施。作为操纵结果,包括敲减、敲除和敲入中的全部。
在某些实施方式中,核酸修饰可为一个或多个核苷酸(例如1bp-30bp、1bp-27bp、1bp-25bp、1bp-23bp、1bp-20bp、1bp-15bp、1bp-10bp、1bp-5bp、1bp-3bp或1bp的核苷酸)的置换、删除和/或插入。
在某个实施方式中,对于一种或多种不饱和脂肪酸生物合成相关因子的敲除、一种或多种因子的表达的去除或者一个或两个等位基因中的一个或多个敲除而言,可对基因进行操纵以使得一种或多种不饱和脂肪酸生物合成相关因子包含缺失或突变。
在某个实施方式中,可利用不饱和脂肪酸生物合成相关因子的敲减来降低不希望的等位基因或转录组的表达。
在某个实施方式中,核酸修饰可为一个或多个核酸片段或基因的插入。此处,核酸片段可为由一个或多个核苷酸组成的核酸序列,并且核酸片段的长度可为1bp-40bp、1bp-50bp、1bp-60bp、1bp-70bp、1bp-80bp、1bp-90bp、1bp-100bp、1bp-500bp或1bp-1000bp。此处,插入基因可为不饱和脂肪酸生物合成相关因子之一,或者为具有不同功能的基因。
在示例性实施方式中,可使用能够催化DNA或RNA分子(优选DNA分子)中的核酸之间的键水解(切割)的野生型或变体酶来进行核酸的修饰。其也可使用引导核酸-编辑蛋白复合体。
例如,可使用选自于由如下核酸酶所组成的组中的一种或多种核酸酶对基因进行操纵来调节遗传信息的表达:大范围核酸酶、锌指核酸酶、CRISPR/Cas9(Cas9蛋白)、CRISPR-Cpf1(Cpf1蛋白)以及TALE核酸酶。
在某个实施方式中,不受限制地,可以使用引导核酸-编辑蛋白复合体(例如CRISPR/Cas系统),借助NHEJ或同源介导的修复(HDR)来介导基因操纵。
在该情况下,当发生NHEJ机制时,可在切割位点处诱导DNA序列的改变,导致基因失活。借助NHEJ的修复可诱导短基因片段的置换、插入或删除,并可用于诱导相应的基因敲除。
另一方面,本发明可提供基因操纵位点。
在示例性实施方式中,当通过NHEJ介导的修饰对基因进行修饰时,基因操纵位点可为触发不饱和脂肪酸生物合成相关基因产物的表达减少或去除的基因中的位点。
例如,所述位点可处于起始编码区、
启动子序列、
增强子序列、
特定内含子序列、或
特定外显子序列中。
在示例性实施方式中,用于操纵不饱和脂肪酸生物合成相关因子的组合物可靶向:
影响不饱和脂肪酸的生物合成调节的不饱和脂肪酸生物合成相关因子(如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)作为操纵对象。最优选地,用于操纵不饱和脂肪酸生物合成相关因子的组合物可靶向FAD2基因作为操纵对象。
表1中总结了FAD2基因的靶区域(即,就其中发生基因操纵的区域而言的靶序列或针对基因操纵而识别的区域的靶序列)的实例。
靶序列可靶向一种或多种基因。
靶序列可同时靶向两种以上基因。此处,两种以上基因可为同源基因或异源基因。
基因可含有一个或多个靶序列。
基因可在两个以上靶序列处被同时靶向。
可根据靶序列的数量改变基因的基因操纵的位点和数量。
可根据靶序列的数量和位置将基因操纵设计成各种形式。
基因操纵可同时发生在两个以上靶序列中。此处,两个以上靶序列可存在于同源基因或异源基因中。
可对两种以上基因同时实施基因操纵。此处,两种以上基因可以是同源基因或异源基因。
下文中,将能够用于本发明实施方式的靶序列的实例在下表中示出:
表1.FAD2基因的靶序列
[用于操纵的组合物-基因剪刀系统]
本发明的不饱和脂肪酸控制系统可以包含引导核酸-编辑蛋白复合体作为用于操纵不饱和脂肪酸生物合成相关因子的组合物。
引导核酸-编辑蛋白复合体
术语“引导核酸-编辑蛋白复合体”是指通过引导核酸和编辑蛋白之间的相互作用形成的复合体,该核酸-蛋白复合体包含引导核酸和编辑蛋白。
术语“引导核酸”是指能够识别靶核酸、基因、染色体或蛋白的核酸。
引导核酸可以以DNA、RNA或者DNA/RNA杂合体的形式存在,并可具有5-150个碱基的核酸序列。
引导核酸可包含一个或多个结构域。
所述结构域可为引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端(proximal)结构域或者尾部(tail)结构域,但不限于此。
引导核酸可包含两个以上结构域,所述两个以上结构域可为相同结构域的重复,或可为不同的结构域。
引导核酸可具有一条连续的核酸序列。
例如,所述一条连续的核酸序列可为(N)m,其中N代表A、T、C或G,或代表A、U、C或G;m为1-150的整数。
引导核酸可具有两条以上连续的核酸序列。
例如,所述两条以上连续的核酸序列可为(N)m以及(N)o,其中N代表A、T、C或G,或代表A、U、C或G;m和o为1-150的整数,并且m和o可彼此相同或彼此不同。
术语“编辑蛋白”是指能够与核酸直接结合或无需直接结合而与核酸相互作用的肽、多肽或蛋白。
编辑蛋白可为酶。
编辑蛋白可为融合蛋白。
此处,“融合蛋白”是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。
术语“酶”是指含有能够切割核酸、基因、染色体或蛋白的结构域的蛋白。
所述额外的结构域、肽、多肽或蛋白可以是具有与所述酶相同或不同的功能的功能结构域、肽、多肽或蛋白。
融合蛋白可以在酶的氨基末端(N末端)或其附近、羧基末端(C末端)或其附近、酶的中间部分及它们的组合中的一个或多个区域处包含额外的结构域、肽、多肽或蛋白。
融合蛋白可以在酶的N末端或其附近、C末端或其附近、酶的中间部分及它们的组合中的一个或多个区域处包含功能结构域、肽、多肽或蛋白。
引导核酸-编辑蛋白复合体可用于修饰对象物。
所述对象物可为靶核酸、基因、染色体或蛋白。
例如,引导核酸-编辑蛋白复合体可造成感兴趣的蛋白表达的最终调控(例如抑制、阻遏、降低、升高或促进)、蛋白的去除或新蛋白的表达。
此处,引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。
引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。
引导核酸-编辑蛋白复合体可在蛋白水平发挥作用。
1.引导核酸
引导核酸为能够识别靶核酸、基因、染色体或蛋白并形成引导核酸-蛋白复合体的核酸。
此处,引导核酸被设置为对引导核酸-蛋白复合体所靶向的核酸、基因、染色体或蛋白进行识别或靶向。
引导核酸可以以DNA、RNA或者DNA/RNA混合物的形式存在,并可具有5-150个核酸的序列。
引导核酸可以以线性或环状形式存在。
引导核酸可为一条连续的核酸序列。
例如,所述一条连续的核酸序列可为(N)m,其中N为A、T、C或G,或为A、U、C或G;m为1-150的整数。
引导核酸可为两条以上连续的核酸序列。
例如,所述两条以上连续的核酸序列可为(N)m以及(N)o,其中N代表A、T、C或G,或代表A、U、C或G;m和o为1-150的整数,并且可彼此相同或彼此不同。
引导核酸可包含一个或多个结构域。
此处,所述结构域可为引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域或者尾部结构域,但不限于此。
引导核酸可包含两个以上结构域,所述两个以上结构域可为相同结构域的重复,或可为不同的结构域。
结构域将在下文中描述。
i)引导结构域
术语“引导结构域”是具有能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列的结构域,功能在于与靶基因或核酸特异性相互作用。
引导序列为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
引导结构域可为5-50个碱基的序列。
在实例中,引导结构域可为5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,引导结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
引导结构域可具有引导序列。
引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列。
引导序列可为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
引导序列可为5-50个碱基的序列。
在实例中,引导结构域可为5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,引导序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
此外,引导结构域可包含引导序列和额外碱基序列。
额外碱基序列可用于提高或降低引导结构域的功能。
额外碱基序列可用于提高或降低引导序列的功能。
额外碱基序列可为1-35个碱基的序列。
在一个实例中,额外碱基序列可为5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,额外碱基序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
额外碱基序列可位于引导序列的5'端。
额外碱基序列可位于引导序列的3'端。
ii)第一互补结构域
术语“第一互补结构域”是包含与第二互补结构域互补的核酸序列的核酸序列,其具有足够的互补性以与第二互补结构域形成双链。
第一互补结构域可为5-35个碱基的序列。
在实例中,第一互补结构域可为5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,第一互补结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
iii)接头结构域
术语“接头结构域”是连接两个以上结构域(两个以上相同或不同的结构域)的核酸序列。接头结构域可借助共价键或非共价键与两个以上结构域连接,或可借助共价键或非共价键连接两个以上结构域。
接头结构域可为1-30个碱基的序列。
在一个实例中,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
在另一实例中,接头结构域可为1-30个碱基、5-30个碱基、10-30个碱基、15-30个碱基、20-30个碱基或25-30个碱基的序列。
iv)第二互补结构域
术语“第二互补结构域”是包含与第一互补结构域互补的核酸序列的核酸序列,其具有足够的互补性以与第一互补结构域形成双链。
第二互补结构域可具有与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如不与第一互补结构域形成双链的碱基序列),并可具有比第一互补结构域更长的碱基序列。
第二互补结构域可具有5-35个碱基的序列。
在实例中,第二互补结构域可为1-35个碱基、5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,第二互补结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
v)近端结构域
术语“近端结构域”是指其位置靠近第二互补结构域的核酸序列。
近端结构域中可具有互补碱基序列,可基于互补碱基序列形成双链。
近端结构域可为1-20个碱基的序列。
在一个实例中,近端结构域可为1-20个碱基、5-20个碱基、10-20个碱基或15-20个碱基的序列。
在另一实例中,近端结构域可为1-5个碱基、5-10个碱基、10-15个碱基或15-20个碱基的序列。
vi)尾部结构域
术语“尾部结构域”为位于引导核酸两个末端中的一个或多个末端处的核酸序列。
尾部结构域中可具有互补碱基序列,并可基于互补碱基序列形成双链。
尾部结构域可为1-50个碱基的序列。
在一个实例中,尾部结构域可为5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,尾部结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
同时,所述结构域(即引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域)中包含的部分或全部核酸序列可任选地或额外地包含化学修饰。
化学修饰可为但不限于甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP)。
引导核酸包含一个或多个结构域。
引导核酸可包含引导结构域。
引导核酸可包含第一互补结构域。
引导核酸可包含接头结构域。
引导核酸可包含第二互补结构域。
引导核酸可包含近端结构域。
引导核酸可包含尾部结构域。
此处,可以存在1、2、3、4、5、6个或更多个结构域。
引导核酸可包含1、2、3、4、5、6个或更多个引导结构域。
引导核酸可包含1、2、3、4、5、6个或更多个第一互补结构域。
引导核酸可包含1、2、3、4、5、6个或更多个接头结构域。
引导核酸可包含1、2、3、4、5、6个或更多个第二互补结构域。
引导核酸可包含1、2、3、4、5、6个或更多个近端结构域。
引导核酸可包含1、2、3、4、5、6个或更多个尾部结构域。
此处,在引导核酸中,一种类型的结构域可以是重复的。
引导核酸可包含具有或不具有重复的数个结构域。
引导核酸可包含相同类型的结构域。此处,相同类型的结构域可具有相同的核酸序列或不同的核酸序列。
引导核酸可包含两种类型的结构域。此处,两种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含三种类型的结构域。此处,三种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含四种类型的结构域。此处,四种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含五种类型的结构域。此处,五种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含六种类型的结构域。此处,六种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
例如,引导核酸可由[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[接头结构域]-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]组成。此处,两个引导结构域可包含针对不同或相同靶标的引导序列;两个第一互补结构域和两个第二互补结构域可具有相同或不同的核酸序列。当引导结构域包含针对不同靶标的引导序列时,引导核酸可与两种不同靶标特异性结合;此处,该特异性结合可以同时进行或顺序进行。此外,接头结构域可被特定的酶切割,在特定的酶的存在下,引导核酸可被分为两个或三个部分。
作为本发明的引导核酸的具体实例,gRNA将在下文描述。
gRNA
术语“gRNA”是指能够将gRNA-CRISPR酶复合体(即,CRISPR复合体)特异性导向至靶基因或核酸的核酸。此外,gRNA是可结合至CRISPR酶并将CRISPR酶引导至靶基因或核酸的核酸特异性RNA。
gRNA可包含多个结构域。基于各结构域,相互作用可出现在三维结构或者gRNA的活性形式的链中或者这些链之间。
gRNA可指单链gRNA(单个RNA分子)或者双链gRNA(包含多于一个RNA分子,通常为两个独立的RNA分子)。
在一个示例性实施方式中,单链gRNA从5'至3'方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、接头结构域、第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,因此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
在另一实施方式中,双链gRNA可包含第一链和第二链,所述第一链从5'至3'方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)以及第一互补结构域;所述第二链包含第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,因此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
此处,第一链可指crRNA,第二链可指tracrRNA。crRNA可包含引导结构域和第一互补结构域;tracrRNA可包含第二互补结构域、近端结构域和任选的尾部结构域。
在又一实施方式中,单链gRNA从5'至3'方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域和第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,因此与第一互补结构域形成双链核酸)。
i)引导结构域
引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列。引导序列可为与靶基因或核酸上的靶序列具有互补性的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。认为引导结构域允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性相互作用。
引导结构域可为5-50个碱基的序列。
作为示例性实施方式,引导结构域可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
作为示例性实施方式,引导结构域可包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
此处,引导结构域可包含引导序列。
引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列。
引导序列可为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
在一个示例性实施方式中,引导序列可为与靶基因(即不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列互补的核酸序列,其具有例如至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
引导序列可为5-50个碱基的序列。
在一个示例性实施方式中,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD2基因的靶序列互补的核酸序列,其可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD3基因的靶序列互补的核酸序列,其可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD6基因的靶序列互补的核酸序列,其可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD7基因的靶序列互补的核酸序列,其可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD8基因的靶序列互补的核酸序列,其可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
此处,用于引导序列的靶基因(即,不饱和脂肪酸生物合成相关因子,如FAD2基因)的靶序列在上表1中列出,但本发明不限于此。
此处,引导结构域可包含引导序列和额外碱基序列。
额外碱基序列可为1-35个碱基的序列。
在一个示例性实施方式中,额外碱基序列可为1、2、3、4、5、6、7、8、9或10个碱基的序列。
例如,额外碱基序列可为单碱基序列(鸟嘌呤(G))或者两个碱基的序列(GG)。
额外碱基序列可位于引导序列的5'端。
额外碱基序列可位于引导序列的3'端。
任选地,引导结构域的部分或全部碱基序列可包含化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
ii)第一互补结构域
第一互补结构域包含与第二互补结构域互补的核酸序列,其具有足够的互补性,从而能够与第二互补结构域形成双链。
此处,第一互补结构域可为5-35个碱基的序列。第一互补结构域可包含5-35个碱基的序列。
在一个示例性实施方式中,第一互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
在另一实施方式中,第一互补结构域可包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
第一互补结构域可与天然第一互补结构域具有同源性,或可由天然第一互补结构域衍生而来。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的碱基序列中存在差异、可由天然存在的物种中含有的第一互补结构域衍生而来、或可与天然存在的物种中含有的第一互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第一互补结构域或由它们衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性。
例如,当第一互补结构域是酿脓链球菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有部分(即至少50%以上)或完全同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,使得其为5'-GUUUUAGAGCUA(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其为5-15的整数。此处,(X)n可为相同碱基的n个重复,或者为n个碱基A、T、U和G的混合。
在另一实施方式中,当第一互补结构域为空肠弯曲杆菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有部分(即至少50%以上)或完全同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,使得其为5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其为5-15的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。
在另一实施方式中,第一互补结构域可与如下菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性:俭菌(Parcubacteriabacterium)(GWC2011_GWC2_44_17)、毛螺菌(Lachnospiraceae bacterium)(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(Acidaminococcus sp.)(BV3L6)、猕猴卟啉单胞菌(Porphyromonas macacae)、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌(Prevotelladisiens)、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体(Leptospira inadai)、毛螺菌(MA2020)、新凶手弗朗西斯菌(Francisella novicida)(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌(Eubacterium eligens)。
例如,当第一互补结构域是俭菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5'-UUUGUAGAU-3'或与5'-UUUGUAGAU-3'具有部分(即至少50%以上)同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,使得其为5'-(X)nUUUGUAGAU-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其为1-5的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。
任选地,第一互补结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
iii)接头结构域
接头结构域为连接两个以上结构域(连接两个以上相同或不同的结构域)的核酸序列。接头结构域可借助共价键或非共价键与两个以上结构域连接,或可借助共价键或非共价键连接两个以上结构域。
接头结构域可为使得第一互补结构域与第二互补结构域连接以产生单链gRNA的核酸序列。
接头结构域可通过共价或非共价键与第一互补结构域和第二互补结构域连接。
接头结构域可通过共价或非共价键连接第一互补结构域和第二互补结构域。
接头结构域可为1-30个碱基的序列。接头结构域可包含1-30个碱基的序列。
在示例性实施方式中,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
在示例性实施方式中,接头结构域可包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
接头结构域适合用于单链gRNA分子中,并可用于借助共价或非共价键与双链gRNA的第一链和第二链连接或者连接第一链和第二链来产生单链gRNA。接头结构域可用于借助共价或非共价键与双链gRNA的crRNA和tracrRNA连接或者连接crRNA和tracrRNA来产生单链gRNA。
接头结构域可与天然序列(例如tracrRNA的部分序列)具有同源性,或者可由天然序列衍生而来。
任选地,接头结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
iv)第二互补结构域
第二互补结构域包含与第一互补结构域互补的核酸序列,并具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如不与第一互补结构域形成双链的碱基序列),并可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为5-35个碱基的序列。第二互补结构域可包含5-35个碱基的序列。
在示例性实施方式中,第二互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
在示例性实施方式中,第二互补结构域可包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
此外,第二互补结构域可与天然第二互补结构域具有同源性,或可由天然第二互补结构域衍生而来。此外,第二互补结构域可取决于天然存在的物种而在第二互补结构域的碱基序列中存在差异、可由天然存在的物种中含有的第二互补结构域衍生而来、或可与天然存在的物种中含有的第二互补结构域具有部分或完全同源性。
在示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或由它们衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性。
例如,当第二互补结构域是酿脓链球菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有部分(即至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5'-(X)n UAGCAAGUUAAAAU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;n和m各自可表示碱基数,其中n可为1-15的整数,m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。此外,(X)m可表示相同碱基的m个重复,或者表示m个碱基A、T、U和G的混合。
在另一实例中,当第二互补结构域是空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有部分(即至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5'-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;n和m各自可表示碱基数,其中n可为1-15的整数,m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。此外,(X)m可表示相同碱基的m个重复,或者表示m个碱基A、T、U和G的混合。
在另一实施方式中,第二互补结构域可与如下菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性:俭菌(GWC2011_GWC2_44_17)、毛螺菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihellasp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
例如,当第二互补结构域是俭菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5'-AAAUUUCUACU-3'或与5'-AAAUUUCUACU-3'具有部分(即至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5'-(X)nAAAUUUCUACU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;n和m各自可表示碱基数,其中n可为1-10的整数,m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。此外,(X)m可表示相同碱基的m个重复,或者表示m个碱基A、T、U和G的混合。
任选地,第二互补结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
v)近端结构域
近端结构域是位于靠近第二互补结构域的位置处的1-20个碱基的序列,该结构域位于第二互补结构域的3'端方向。此处,近端结构域可用于在近端结构域内的互补碱基序列之间形成双链。
在一个示例性实施方式中,近端结构域可为5、6、7、8、8、9、10、11、12、13、14或15个碱基的序列。
在另一实施方式中,近端结构域可包含5、6、7、8、8、9、10、11、12、13、14或15个碱基的序列。
此外,近端结构域可与天然近端结构域具有同源性,或可由天然近端结构域衍生而来。此外,近端结构域可取决于天然存在的物种而在碱基序列中存在差异、可由天然存在的物种中含有的近端结构域衍生而来、或可与天然存在的物种中含有的近端结构域具有部分或完全同源性。
在示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或由它们衍生而来的近端结构域具有部分(即至少50%以上)或完全同源性。
例如,当近端结构域是酿脓链球菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有部分(即至少50%以上)同源性的碱基序列。此处,近端结构域可进一步包含(X)n,使其为5'-AAGGCUAGUCCG(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其可为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。
在又一实施方式中,当近端结构域是空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%或更高同源性的碱基序列。此处,近端结构域可进一步包含(X)n,使其为5'-AAAGAGUUUGC(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其可为1-40的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。
任选地,近端结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
vi)尾部结构域
尾部结构域为能被选择性添加至单链gRNA或双链gRNA的3'末端的结构域。尾部结构域可为1-50个碱基的序列,或包含1-50个碱基的序列。此处,尾部结构域可用于在尾部结构域内的互补碱基序列之间形成双链。
在示例性实施方式中,尾部结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
在示例性实施方式中,尾部结构域可包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
此外,尾部结构域可与天然尾部结构域具有同源性,或可由天然尾部结构域衍生而来。此外,尾部结构域可取决于天然存在的物种而在碱基序列中存在差异、可由天然存在的物种中含有的尾部结构域衍生而来、或可与天然存在的物种中含有的尾部结构域具有部分或完全同源性。
在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域或由它们衍生而来的尾部结构域具有部分(即至少50%以上)或完全同源性。
例如,当尾部结构域是酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有部分(即至少50%以上)同源性的碱基序列。此处,尾部结构域可进一步包含(X)n,使其为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其可为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基(如A、T、U和G)的混合。
在另一实例中,当尾部结构域是空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有部分(即至少50%以上)同源性的碱基序列。此处,尾部结构域可进一步包含(X)n,使其为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;n可表示碱基数,其可为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合。
在另一实施方式中,尾部结构域可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或可替代的碱基。
任选地,尾部结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
gRNA可包含上文所述的多个结构域,因此可根据gRNA中含有的结构域来调整核酸序列的长度;基于各结构域,相互作用可出现在三维结构或者gRNA的活性形式的链中或者这些链之间。
gRNA可指单链gRNA(单个RNA分子)或者双链gRNA(包含多于一个RNA分子,通常为两个独立的RNA分子)。
双链gRNA
双链gRNA由第一链和第二链组成。
此处,第一链可由
5'-[引导结构域]-[第一互补结构域]-3'组成;以及
第二链可由
5'-[第二互补结构域]-[近端结构域]-3'或者
5'-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
此处,第一链可以指crRNA,第二链可以指tracrRNA。
第一链
引导结构域
在第一链中,引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列。引导序列为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。认为引导结构域允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性相互作用。
此处,引导结构域可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导结构域可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
此外,引导结构域可包含引导序列。
此处,引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
在一个示例性实施方式中,引导序列可为与靶基因(即不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列互补的核酸序列,其具有例如至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
此处,引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列为与FAD2基因的靶序列互补的核酸序列。引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列为与FAD3基因的靶序列互补的核酸序列。引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列为与FAD6基因的靶序列互补的核酸序列。引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列为与FAD7基因的靶序列互补的核酸序列。引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列为与FAD8基因的靶序列互补的核酸序列。引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
此处,用于引导序列的靶基因(即,不饱和脂肪酸生物合成相关因子,如FAD2基因)的靶序列在上表1中列出,但本发明不限于此。
任选地,引导结构域可包含引导序列和额外碱基序列。
此处,额外碱基序列可为1-35个碱基的序列。例如,额外碱基序列可为1、2、3、4、5、6、7、8、9或10个碱基的序列。
在一个示例性实施方式中,额外碱基序列可包含单个碱基(鸟嘌呤(G))或者两个碱基(GG)。
此处,额外碱基序列可位于引导结构域的5'端,或位于引导序列的5'端。
额外碱基序列可位于引导结构域的3'端,或位于引导序列的3'端。
第一互补结构域
第一互补结构域包含与第二链的第二互补结构域互补的核酸序列,该结构域具有足够的互补性以与第二互补结构域形成双链。
此处,第一互补结构域可为5-35个碱基的序列,或包含5-35个碱基的序列。例如,第一互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
第一互补结构域可与天然第一互补结构域具有同源性,或可由天然第一互补结构域衍生而来。此外,第一互补结构域可取决于天然存在的物种而在碱基序列中存在差异、可由天然存在的物种中含有的第一互补结构域衍生而来、或可与天然存在的物种中含有的第一互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第一互补结构域或由它们衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性。
任选地,第一互补结构域可含有不与第二链的第二互补结构域进行互补结合的额外碱基序列。
此处,额外碱基序列可为1-15个碱基的序列。例如,额外碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
任选地,引导结构域和/或第一互补结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,第一链可如上所述由5'-[引导结构域]-[第一互补结构域]-3'构成。
此外,第一链可任选地包含额外碱基序列。
在一个实例中,第一链可为
5'-(N靶标)-(Q)m-3';或者
5'-(X)a-(N靶标)-(X)b-(Q)m-(X)c-3'。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标可为能够与靶基因(即,不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列形成互补结合的碱基序列。
此处,(Q)m是包含第一互补结构域的碱基序列,其能够与第二链的第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;m可为碱基数,其为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由酿脓链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由空肠弯曲杆菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由嗜热链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGAGCUGUGUUGUUUCG-3'或与5'-GUUUUAGAGCUGUGUUGUUUCG-3'具有至少50%或更高同源性的碱基序列。
此外,(X)a、(X)b、(X)c各自为任选的额外碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;a、b、c各自可为碱基数,其为0或1-20的整数。
第二链
第二链可由第二互补结构域和近端结构域组成,并可任选地包含尾部结构域。
第二互补结构域
在第二链中,第二互补结构域包含与第一链的第一互补结构域互补的核酸序列,并具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及不与第一互补结构域互补的碱基序列(例如不与第一互补结构域形成双链的碱基序列),并可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为5-35个碱基的序列,或者包含5-35个碱基的序列。例如,第二互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列,但本发明不限于此。
第二互补结构域可与天然第二互补结构域具有同源性,或可由天然第二互补结构域衍生而来。此外,第二互补结构域可取决于天然存在的物种而在第二互补结构域的碱基序列中存在差异、可由天然存在的物种中含有的第二互补结构域衍生而来、或可与天然存在的物种中含有的第二互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或由它们衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性。
任选地,第二互补结构域可进一步包含不与第一链的第一互补结构域进行互补结合的额外碱基序列。
此处,额外碱基序列可为1-25个碱基的序列。例如,额外碱基序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基或20-25个碱基的序列。
近端结构域
在第二链中,近端结构域为1-20个碱基的序列,该结构域位于第二互补结构域的3'端方向。例如,近端结构域可为5、6、7、8、8、9、10、11、12、13、14或15个碱基的序列,或包含5、6、7、8、8、9、10、11、12、13、14或15个碱基的序列。
此处,近端结构域可在其互补碱基序列之间具有双链结合。
此外,近端结构域可与天然近端结构域具有同源性,或可由天然近端结构域衍生而来。此外,近端结构域可取决于天然存在的物种而在碱基序列中存在差异、可由天然存在的物种的近端结构域衍生而来、或可与天然存在的物种的近端结构域具有部分或完全同源性。
在一个示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或由它们衍生而来的近端结构域具有部分(即至少50%以上)或完全同源性。
尾部结构域
任选地,在第二链中,尾部结构域可为被选择性添加至第二链的3'端的结构域,尾部结构域可为1-50个碱基的序列,或包含1-50个碱基的序列。例如,尾部结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列,或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
此处,尾部结构域可在其互补碱基序列之间具有双链结合。
此外,尾部结构域可与天然尾部结构域具有同源性,或可由天然尾部结构域衍生而来。此外,尾部结构域可取决于天然存在的物种而在碱基序列中存在差异、可由天然存在的物种中含有的尾部结构域衍生而来、或可与天然存在的物种中含有的尾部结构域具有部分或完全同源性。
在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域或由它们衍生而来的尾部结构域具有部分(即至少50%以上)或完全同源性。
在另一实施方式中,尾部结构域可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或可替代的碱基。
任选地,第二互补结构域、近端结构域和/或尾部结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,第二链可如上所述由5'-[第二互补结构域]-[近端结构域]-3'或者5'-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
此外,第二链可任选地包含额外碱基序列。
在一个示例性实施方式中,第二链可为5'-(Z)h-(P)k-3';或者5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3'。
在另一实施方式中,第二链可为5'-(Z)h-(P)k-(F)i-3';或者5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'。
此处,(Z)h是包含第二互补结构域的碱基序列,其能够与第一链的第一互补结构域形成互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的碱基序列进行修饰。Z可各自独立地选自于由A、U、C和G所所组成的组;h可为碱基数,其可为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由酿脓链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由空肠弯曲杆菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由嗜热链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-CGAAACAACACAGCGAGUUAAAAU-3'或与5'-CGAAACAACACAGCGAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
(P)k是包含近端结构域的碱基序列,其可与天然存在的物种的近端结构域具有部分或完全同源性;根据来源的物种,可对近端结构域的碱基序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;k可为碱基数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或由酿脓链球菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由空肠弯曲杆菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由嗜热链球菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAGGCUUAGUCCG-3'或与5'-AAGGCUUAGUCCG-3'具有至少50%或更高同源性的碱基序列。
(F)i可为包含尾部结构域的碱基序列,其可与天然存在的物种的尾部结构域具有部分或完全同源性;根据来源的物种,可对尾部结构域的碱基序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;i可为碱基数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或由酿脓链球菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由空肠弯曲杆菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有至少50%或更高同源性的碱基序列。
在又一实施方式中,当尾部结构域与嗜热链球菌的尾部结构域或由嗜热链球菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'或与5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'具有至少50%或更高同源性的碱基序列。
此外,(F)i可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或可替代的碱基。
此外,(X)d、(X)e和(X)f可为任选添加的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;d、e、f各自可为碱基数,其为0或1-20的整数。
单链gRNA
单链gRNA可分为两种类型。
i)单链gRNA
首先,存在这样的单链gRNA:在该单链gRNA中,借助接头结构域使得双链gRNA的第一链和第二链连接;此处,单链gRNA由5'-[第一链]-[接头结构域]-[第二链]-3'组成。
具体而言,单链gRNA可由
5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3';或者
5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
除接头结构域外的各结构域与双链gRNA的第一链和第二链中的各结构域的描述相同。
接头结构域
在单链gRNA中,接头结构域是连接第一链和第二链的结构域,具体而言,是连接第一互补结构域与第二互补结构域以产生单链gRNA的核酸序列。此处,接头结构域可借助共价键或非共价键与第一互补结构域和第二互补结构域连接,或可借助共价键或非共价键连接第一互补结构域和第二互补结构域。
接头结构域可为1-30个碱基的序列,或包含1-30个碱基的序列。例如,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或者25-30个碱基的序列,或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或者25-30个碱基的序列。
接头结构域适合用于单链gRNA分子中,并可用于借助共价或非共价键与双链gRNA的第一链和第二链连接或者连接第一链和第二链来产生单链gRNA。接头结构域可用于借助共价或非共价键与双链gRNA的crRNA和tracrRNA连接或者连接crRNA和tracrRNA来产生单链gRNA。
接头结构域可与天然序列(例如tracrRNA的部分序列)具有同源性,或者可由天然序列衍生而来。
任选地,接头结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,单链gRNA可如上所述由5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3';或者5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
此外,单链gRNA可任选包含额外碱基序列。
在一个示例性实施方式中,单链gRNA可为
5'-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-3';或者
5'-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3'。
在另一实施方式中,单链gRNA可为
5'-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3';或者
5'-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标为能够与靶基因(即,不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列形成互补结合的碱基序列。
(Q)m含有包含第一互补结构域的碱基序列,其能够与第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;m可为碱基数,其可为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由酿脓链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由空肠弯曲杆菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由嗜热链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-GUUUUAGAGCUGUGUUGUUUCG-3'或与5'-GUUUUAGAGCUGUGUUGUUUCG-3'具有至少50%或更高同源性的碱基序列。
此外,(L)j是包含接头结构域的碱基序列,它连接第一互补结构域和第二互补结构域,由此产生单链gRNA。此处,L可各自独立地选自于由A、U、C和G所组成的组;j可为碱基数,其为1-30的整数。
(Z)h是包含第二互补结构域的碱基序列,其能够与第一互补结构域形成互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的碱基序列进行改变。Z可各自独立地选自于由A、U、C和G所组成的组;h为碱基数,其可为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由酿脓链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由空肠弯曲杆菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由嗜热链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-CGAAACAACACAGCGAGUUAAAAU-3'或与5'-CGAAACAACACAGCGAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
(P)k是包含近端结构域的碱基序列,其可与天然存在的物种的近端结构域具有部分或完全同源性;根据来源的物种,可对近端结构域的碱基序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;k可为碱基数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或由酿脓链球菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由空肠弯曲杆菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由嗜热链球菌衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5'-AAGGCUUAGUCCG-3'或与5'-AAGGCUUAGUCCG-3'具有至少50%或更高同源性的碱基序列。
(F)i可以是包含尾部结构域的碱基序列,其可与天然存在的物种的尾部结构域具有部分或完全同源性;根据来源的物种,可对尾部结构域的碱基序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;i可为碱基数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或由酿脓链球菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由空肠弯曲杆菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当尾部结构域与嗜热链球菌的尾部结构域或由嗜热链球菌衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'或与5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'具有至少50%或更高同源性的碱基序列。
此外,(F)i可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或可替代的碱基。
此外,(X)a、(X)b、(X)c、(X)d、(X)e和(X)f可为任选添加的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;a、b、c、d、e、f各自可为碱基数,其为0或1-20的整数。
ii)单链gRNA
其次,单链gRNA可为由引导结构域、第一互补结构域和第二互补结构域组成的单链gRNA,此处,gRNA可由
5'-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3';或者
5'-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3'组成。
引导结构域
在单链gRNA中,引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列。引导序列可为与靶基因或核酸上的靶序列具有互补性的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。认为引导结构域允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性相互作用。
此处,引导结构域可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导结构域可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
此外,引导结构域可包含引导序列。
此处,引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
在一个示例性实施方式中,引导序列可为与靶基因(即不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列互补的核酸序列,其具有例如至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
此处,引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD2基因的靶序列互补的核酸序列。所述引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,所述引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD3基因的靶序列互补的核酸序列。所述引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,所述引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD6基因的靶序列互补的核酸序列。所述引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,所述引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD7基因的靶序列互补的核酸序列。所述引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,所述引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与FAD8基因的靶序列互补的核酸序列。所述引导序列可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,所述引导序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含16、17、18、19、20、21、22、23、24或25个碱基的序列。
此处,用于引导序列的靶基因(即,不饱和脂肪酸生物合成相关因子,例如FAD2基因)的靶序列在上表1中列出,但本发明不限于此。
任选地,引导结构域可包含引导序列和额外碱基序列。
此处,额外碱基序列可为1-35个碱基的序列。例如,额外碱基序列可为1、2、3、4、5、6、7、8、9或10个碱基的序列。
在一个示例性实施方式中,额外碱基序列可为单个碱基的序列(鸟嘌呤(G))或者两个碱基的序列(GG)。
此处,额外碱基序列可位于引导结构域的5'端,或位于引导序列的5'端。
额外碱基序列可位于引导结构域的3'端,或位于引导序列的3'端。
第一互补结构域
第一互补结构域为包含与第二互补结构域互补的核酸序列的结构域,该结构域具有足够的互补性以与第二互补结构域形成双链。
此处,第一互补结构域可为5-35个碱基的序列,或包含5-35个碱基的序列。例如,第一互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
第一互补结构域可与天然第一互补结构域具有同源性,或可由天然
第一互补结构域衍生而来。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的碱基序列中存在差异、可由天然存在的物种中含有的第一互补结构域衍生而来、或可与天然存在的物种中含有的第一互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第一互补结构域可与如下菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性:俭菌(GWC2011_GWC2_44_17)、毛螺菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteriabacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
任选地,第一互补结构域可包含不与第二互补结构域进行互补结合的额外碱基序列。
此处,额外碱基序列可为1-15个碱基的序列。例如,额外碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
第二互补结构域
第二互补结构域包含与第一互补结构域互补的核酸序列,并具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如不与第一互补结构域形成双链的碱基序列),并可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为5-35个碱基的序列,或包含5-35个碱基的序列。例如,第二互补结构域可为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列,或包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基的序列。
第二互补结构域可与天然第二互补结构域具有同源性,或可由天然第二互补结构域衍生而来。此外,第二互补结构域可取决于天然存在的物种而在第二互补结构域的碱基序列中存在差异、可由天然存在的物种中含有的第二互补结构域衍生而来、或可与天然存在的物种中含有的第二互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第二互补结构域可与如下菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性:俭菌(GWC2011_GWC2_44_17)、毛螺菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteriabacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
任选地,第二互补结构域可包含不与第一互补结构域进行互补结合的额外碱基序列。
此处,额外碱基序列可为1-15个碱基的序列。例如,额外碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
接头结构域
任选地,接头结构域是连接第一互补结构域和第二互补结构域以产生单链gRNA的核酸序列。此处,接头结构域可借助共价键或非共价键与第一互补结构域和第二互补结构域连接,或可借助共价键或非共价键连接第一互补结构域和第二互补结构域。
接头结构域可为1-30个碱基的序列,或包含1-30个碱基的序列。例如,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或者25-30个碱基的序列,或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或者25-30个碱基的序列。
任选地,引导结构域、第一互补结构域、第二互补结构域和接头结构域的部分或全部碱基序列可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,单链gRNA可如上所述由5'-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3';或者5'-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3'组成。
此外,单链gRNA可任选地包含额外碱基序列。
在一个示例性实施方式中,单链gRNA可为
5'-(Z)h-(Q)m-(N靶标)-3';或者
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(N靶标)-3'。
在另一实施方式中,单链gRNA可为
5'-(Z)h-(L)j-(Q)m-(N靶标)-3';或者
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(N靶标)-3'。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标可为能够与靶基因(即,不饱和脂肪酸生物合成相关因子,如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因或FAD8基因)的靶序列形成互补结合的碱基序列。
(Q)m是包含第一互补结构域的碱基序列,其能够与第二链的第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;m可为碱基数,其可为5-35的整数。
例如,当第一互补结构域与俭菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5'-UUUGUAGAU-3'或与5'-UUUGUAGAU-3'具有至少50%或更高同源性的碱基序列。
(Z)h是包含第二互补结构域的碱基序列,其能够与第一链的第一互补结构域形成互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的碱基序列进行修饰。Z可各自独立地选自于由A、U、C和G所组成的组;h可为碱基数,其为5-50的整数。
例如,当第二互补结构域与俭菌的第二互补结构域或由俭菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5'-AAAUUUCUACU-3'或与5'-AAAUUUCUACU-3'具有至少50%或更高同源性的碱基序列。
此外,(L)j是包含接头结构域的碱基序列,它连接第一互补结构域和第二互补结构域。此处,L可各自独立地选自于由A、U、C和G所组成的组;j可为碱基数,其为1-30的整数。
此外,(X)a、(X)b和(X)c各自为任选的额外碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;a、b和c可为碱基数,其为0或1-20的整数。
2.编辑蛋白
编辑蛋白是指能够与核酸直接结合或无需直接结合而与核酸相互作用的肽、多肽或蛋白。
核酸可为靶核酸、基因或染色体中含有的核酸。
核酸可为引导核酸。
编辑蛋白可为酶。
编辑蛋白可为融合蛋白。
此处,融合蛋白是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。
酶是指含有能够切割核酸、基因、染色体或蛋白的结构域的蛋白。
酶可为核酸酶、蛋白酶或限制性酶。
所述额外的结构域、肽、多肽或蛋白可以是具有与所述酶相同或不同的功能的功能结构域、肽、多肽或蛋白。
融合蛋白可以在酶的N末端或其附近、酶的C末端或其附近、酶的中间部分及它们的组合中的一处或多处包含额外的结构域、肽、多肽或蛋白。
融合蛋白可以在酶的N末端或其附近、酶的C末端或其附近、酶的中间部分及它们的组合中的一处或多处包含功能结构域、肽、多肽或蛋白。
此处,功能结构域、肽、多肽或蛋白可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域、肽、多肽或蛋白,或者为用于纯化和分离蛋白(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域、肽、多肽或蛋白可为脱氨酶。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;报告基因包括谷胱甘肽硫转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
此外,功能结构域、肽、多肽或蛋白可为核定位序列或信号(NLS)或者核输出序列或信号(nuclear export sequence or signal,NES)。
NLS可为:具有氨基酸序列PKKKRKV的SV40病毒大T抗原的NLS;由核质蛋白衍生而来的NLS(例如具有序列KRPAATKKAGQAKKKK的双分型核质蛋白(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD或RQRRNELKRSP的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY的hRNPA1 M9 NLS;由输入蛋白α(importin-α)衍生而来的IBB结构域序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白序列VSRKRPRP和PPKKARED;人p53序列POPKKKPL;小鼠c-abl IV序列SALIKKKKKMAP;流感病毒NS1序列DRLRR和PKQKKRK;肝炎病毒δ抗原序列RKLKKKIKKL;小鼠Mx1蛋白序列REKKKFLKRR;人多聚(ADP-核糖)聚合酶序列KRKGDEVDGVDEVAKKKSKK;或者类固醇激素受体(人)糖皮质激素序列RKCLQAGMNLEARKTKK,但本发明不限于此。
编辑蛋白可包括具有完全活性的酶。
此处,“具有完全活性的酶”是指具有与野生型酶的功能相同的功能的酶,例如,切割双链DNA的野生型酶具有将双链DNA全部切割的完全酶活性。
此外,具有完全活性的酶包括与野生型酶的功能相比具有改善的功能的酶,例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式具有与野生型酶(即切割双链DNA的活性)相比改善的完全酶活性。
编辑蛋白可包括具有不完全或部分活性的酶。
此处,“具有不完全或部分活性的酶”是指具有野生型酶的部分功能的酶,例如,野生型酶(切割双链DNA)的特定修饰或经操纵的形式具有切割双链一部分(即单链DNA)的不完全或部分的酶活性。
编辑蛋白可包括失活的酶。
此处,“失活的酶”是指其中野生型酶的功能完全失活的酶。例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式没有活性,从而完全不切割双链DNA。
编辑蛋白可为天然的酶或融合蛋白。
编辑蛋白可以以部分修饰的天然酶或融合蛋白的形式存在。
编辑蛋白可为在天然状态下不存在的人工产生的酶或融合蛋白。
编辑蛋白可以以在天然状态下不存在的部分修饰的人工酶或融合蛋白的形式存在。
此处,修饰可为对编辑蛋白中含有的氨基酸进行置换、删除、添加或上述修饰的组合。
此外,修饰可为对编码编辑蛋白的碱基序列中的部分碱基进行置换、删除、添加或上述修饰的组合。
作为本发明编辑蛋白的一个示例性实施方式,将在下文描述CRISPR酶。
CRISPR酶
术语“CRISPR酶”是CRISPR-Cas系统的主要蛋白成分,与gRNA形成复合体,从而产生CRISPR-Cas系统。
CRISPR酶是具有编码CRISPR酶的序列的核酸或多肽(或蛋白),典型地,II型CRISPR酶或V型CRISPR酶已得到广泛使用。
II型CRISPR酶为Cas9,其可由诸如以下多种微生物衍生而来:酿脓链球菌、嗜热链球菌、链球菌、金黄色葡萄球菌、达松维尔拟诺卡氏菌、始旋链霉菌、绿色产色链霉菌、绿色产色链霉菌、玫瑰链孢囊菌、玫瑰链孢囊菌、酸热脂环酸芽胞杆菌、假蕈状芽孢杆菌、硒还原芽孢杆菌、西伯利亚微小杆菌、德式乳杆菌、唾液乳杆菌、海洋微颤菌、伯克氏菌、食萘极单胞菌、极单胞菌、瓦氏鳄球藻、蓝杆藻、铜绿微囊藻、聚球藻、阿拉伯醋盐杆菌、丹氏制氨菌、Caldicelulosiruptor bescii、Candidatus Desulforudis、肉毒梭菌、艰难梭菌、大芬戈尔德菌、嗜热盐碱厌氧菌、Pelotomaculum thermopropionicum、喜温嗜酸硫杆菌、嗜酸氧化亚铁硫杆菌、Allochromatium vinosum、海杆菌、嗜盐亚硝化球菌、瓦氏亚硝化球菌、游海假交替单胞菌、消旋纤线杆菌、调查甲烷盐菌、多变鱼腥藻、泡沫节球藻、念珠藻、极大节旋藻、钝顶节旋藻、节旋藻、鞘丝藻、原型微鞘藻、颤藻、Petrotoga mobilis、非洲栖热腔菌和Acaryochloris marina。
术语“Cas9”是与gRNA结合从而切割或修饰靶基因或核酸上的靶序列或位置的酶,Cas9可由HNH结构域(能够切割与gRNA形成互补结合的核酸链)、RuvC结构域(能够切割与gRNA形成互补结合的核酸链)、REC结构域(识别靶标)以及PI结构域(识别PAM)组成。对于Cas9的具体结构特征,可参考Hiroshi Nishimasu等(2014)Cell 156:935-949。
此外,V型CRISPR酶可为Cpf1,Cpf1可由如下微生物衍生而来:链球菌(Streptococcus)、弯曲杆菌(Campylobacter)、Nitratifractor、葡萄球菌(Staphylococcus)、Parvibaculum、罗斯氏菌(Roseburia)、奈瑟菌(Neisseria)、葡糖醋杆菌(Gluconacetobacter)、固氮螺菌(Azospirillum)、Sphaerochaeta、乳杆菌(Lactobacillus)、真杆菌(Eubacterium)、棒状杆菌(Corynebacter)、肉食杆菌(Carnobacterium)、红细菌(Rhodobacter)、李斯特菌(Listeria)、Paludibacter、梭菌(Clostridium)、毛螺菌、Clostridiaridium、纤毛菌(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团杆菌(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌(Porphyromonas)、普雷沃菌(Prevotella)、拟杆菌、创伤球菌(Helcococcus)、钩端螺旋体(Letospira)、脱硫弧菌(Desulfovibrio)、Desulfonatronum、丰佑菌(Opitutaceae)、肿块芽孢杆菌(Tuberibacillus)、芽孢杆菌(Bacillus)、短芽孢杆菌(Brevibacilus)、甲基杆菌(Methylobacterium)或氨基酸球菌(Acidaminococcus)。
Cpf1可由RuvC结构域(类似于并对应于Cas9的RuvC结构域)、Nuc结构域(而不是Cas9的HNH结构域)、REC结构域和WED结构域(识别靶标)以及PI结构域(识别PAM)组成。对于Cpf1的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。
可从天然存在的微生物中分离或者通过重组或合成方法非天然地产生CRISPR酶(Cas9或Cpf1蛋白)。
II型CRISPR酶
根据对两种以上类型的天然微生物II型CRISPR酶分子的研究(Jinek等,Science,343(6176):1247997,2014)以及对酿脓链球菌Cas9(SpCas9)与gRNA复合的研究(Nishimasu等,Cell,156:935-949,2014;以及Anders等,Nature,2014,doi:10.1038/nature13579)确定了II型CRISPR酶的晶体结构。
II型CRISPR酶包含两个叶(lobes),即识别(REC)叶和核酸酶(NUC)叶,各叶包含数个结构域。
REC叶包含富精氨酸的螺旋桥(BH)结构域、REC1结构域和REC2结构域。
此处,BH结构域为长α螺旋并且为富精氨酸区域,而REC1和REC2结构域在识别gRNA(例如单链gRNA、双链gRNA或tracrRNA)中形成的双链中起到重要作用。
NUC叶包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。此处,RuvC结构域包括RuvC样结构域,HNH结构域则用于包括HNH样结构域。
此处,RuvC结构域与含有II型CRISPR酶的天然存在的微生物家族的成员共享结构相似性,并切割单链(例如靶基因或核酸的非互补链,即不与gRNA形成互补结合的链)。在本领域中,RuvC结构域有时指RuvCI结构域、RuvCII结构域或RuvCIII结构域,一般称为RuvCI、RuvCII或RuvCIII。例如,在SpCas9的情况下,RuvC结构域由分别位于SpCas9氨基酸序列第1-59位、第718-769位和第909-1098位的三个分离的RuvC结构域(RuvCI、RuvCII和RuvCIII)组装而来。
HNH结构域与HNH核酸内切酶共享结构相似性,并切割单链(例如靶核酸分子的互补链,即与gRNA形成互补结合的链)。HNH结构域位于RuvCII和RuvCIII基序之间。例如,在SpCas9的情况下,HNH结构域位于SpCas9氨基酸序列的第775-908位。
PI结构域识别靶基因或核酸中的特定碱基序列(即原型间隔区邻近基序(PAM))或与PAM相互作用。例如,在SpCas9的情况下,PI结构域位于SpCas9氨基酸序列的第1099-1368位。
此处,PAM可根据II型CRISPR酶的来源改变。例如,当CRISPR酶是SpCas9时,PAM可为5'-NGG-3';当CRISPR酶是嗜热链球菌Cas9(StCas9)时,PAM可为5'-NNAGAAW-3'(W=A或T);当CRISPR酶是脑膜炎奈瑟菌Cas9(NmCas9)时,PAM可为5'-NNNNGATT-3';当CRISPR酶是空肠弯曲杆菌Cas9(CjCas9)时,PAM可为5'-NNNVRYAC-3'(V=G或C或A,R=A或G,Y=C或T),其中,N可为A、T、G或C;或者A、U、G或C。
V型CRISPR酶
V型CRISPR酶包含类似的RuvC结构域(对应于II型CRISPR酶的RuvC结构域),并可由Nuc结构域(而不是II型CRISPR酶的HNH结构域)、REC结构域和WED结构域(识别靶标)以及PI结构域(识别PAM)组成。对于V型CRISPR酶的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。
V型CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下允许引导序列接近包含PAM序列的靶序列。此处,V型CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。
PAM序列是存在于靶基因或核酸中的序列,其可被V型CRISPR酶的PI结构域识别。PAM序列可根据V型CRISPR酶的来源改变。即,取决于物种,存在能够被特异性识别的不同PAM序列。
在一个实例中,由Cpf1识别的PAM序列可为5'-TTN-3'(N为A、T、C或G)。
CRISPR酶活性
CRISPR酶切割靶基因或核酸的双链或单链,并具有造成双链或单链断裂或缺失的核酸酶活性。通常,野生型II型CRISPR酶或V型CRISPR酶切割靶基因或核酸的双链。
为了对CRISPR酶的上述核酸酶活性进行操纵或修饰,可对CRISPR酶进行操纵或修饰,例如可以对CRISPR酶进行操纵或修饰来使其改变为具有不完全或部分活性、或者失活的酶。
具有不完全或部分活性的酶
经修饰而改变其酶活性从而表现出不完全或部分活性的CRISPR酶称为切口酶(nickase)。
术语“切口酶”是指经操纵或修饰而仅切割靶基因或核酸双链中的一条链的CRISPR酶,切口酶具有切割单链(例如不与靶基因或核酸的gRNA互补的链或与其互补的链)的核酸酶活性。因此,为了切割双链需要两种切口酶的核酸酶活性。
例如,切口酶可具有RuvC结构域的核酸酶活性。即,切口酶可不包含HNH结构域的核酸酶活性,为此可对HNH结构域进行操纵或修饰。
在一个实例中,如果CRISPR酶是II型CRISPR酶,在SpCas9的情况下,当将SpCas9氨基酸序列中的第840位残基由组氨酸突变为丙氨酸时,HNH结构域的核酸酶活性失活而用作切口酶。由于由此产生的切口酶具有RuvC结构域的核酸酶活性,它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列中的第559位残基由组氨酸突变为丙氨酸时,HNH结构域的核酸酶活性失活而用作切口酶。由于由此产生的切口酶具有RuvC结构域的核酸酶活性,它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
例如,切口酶可具有HNH结构域的核酸酶活性。即,切口酶可不包含RuvC结构域的核酸酶活性,为此可对RuvC结构域进行操纵或修饰。
在一个实例中,如果CRISPR酶是II型CRISPR酶,在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9氨基酸序列中的第10位残基由天冬氨酸突变为丙氨酸时,RuvC结构域的核酸酶活性失活而用作切口酶。由于由此产生的切口酶具有HNH结构域的核酸酶活性,因此它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列中的第8位残基由天冬氨酸突变为丙氨酸时,RuvC结构域的核酸酶活性失活而用作切口酶。由于由此产生的切口酶具有HNH结构域的核酸酶活性,它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
失活的酶
经修饰而使得酶活性完全失活的CRISPR酶称为失活的CRISPR酶。
术语“失活的CRISPR酶”是指经修饰而完全不切割靶基因或核酸双链的CRISPR酶,由于野生型CRISPR酶中具有核酸酶活性的结构域中的突变,失活的CRISPR酶不具核酸酶活性。失活的CRISPR酶可为其中RuvC结构域和HNH结构域的核酸酶活性失活的酶。
例如,失活的CRISPR酶可为对RuvC结构域和HNH结构域进行操纵或修饰而使得核酸酶活性失活。
在一个实例中,如果CRISPR酶是II型CRISPR酶,在一个示例性实施方式中,在SpCas9的情况下,当分别将SpCas9氨基酸序列中的第10位和第840位残基由天冬氨酸和组氨酸突变为丙氨酸时,RuvC结构域和HNH结构域的核酸酶活性失活,从而可完全不切割靶基因或核酸的双链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列中的第8位和第559位残基由天冬氨酸和组氨酸突变为丙氨酸时,RuvC结构域和HNH结构域的核酸酶活性失活,从而可完全不切割靶基因或核酸的双链。
其它活性
除上述核酸酶活性外,CRISPR酶还可具有核酸内切酶活性、核酸外切酶活性或解旋酶活性(即,使得双链核酸的螺旋结构解旋的能力)。
此外,可对CRISPR酶进行修饰而使其具有核酸内切酶活性、核酸外切酶活性或解旋酶活性的完全活性、不完全或部分活性。
CRISPR酶的靶向
CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下使得引导序列接近包含PAM序列的靶序列。此处,CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。
PAM序列是存在于靶基因或核酸中的序列,其可被CRISPR酶的PI结构域识别。PAM序列可根据CRISPR酶的来源改变。即,取决于物种,存在能够被特异性识别的多种PAM序列。
在一个实例中,在CRISPR酶是II型CRISPR酶的情况下,
在SpCas9的情况下,PAM序列可为5'-NGG-3'、5'-NAG-3'和/或5'-NGA-3';
在StCas9的情况下,PAM序列可为5'-NGGNG-3'和/或5'-NNAGAAW-3'(W=A或T);
在NmCas9的情况下,PAM序列可为5'-NNNNGATT-3'和/或5'-NNNGCTT-3';
在CjCas9的情况下,PAM序列可为5'-NNNVRYAC-3'(V=G、C或A;R=A或G;Y=C或T);
在变形链球菌Cas9(SmCas9)的情况下,PAM序列可为5'-NGG-3'和/或5'-NAAR-3'(R=A或G);以及
在金黄色葡萄球菌Cas9(SaCas9)的情况下,PAM序列可为5'-NNGRR-3'、5'-NNGRRT-3'和/或5'-NNGRRV-3'(R=A或G;V=G、C或A)。
在另一实例中,当CRISPR酶是V型CRISPR酶的情况下,
在Cpf1的情况下,PAM序列可为5'-TTN-3'。
此处,N可为A、T、G或C;或为A、U、G或C。
可利用取决于物种能被特异性识别的PAM序列对能够识别特定PAM序列的CRISPR酶进行操纵或修饰。例如,可利用CjCas9的PI结构域替换SpCas9的PI结构域,使其具有SpCas9的核酸酶活性并识别CjCas9特异性PAM序列,从而产生识别CjCas9特异性PAM序列的SpCas9。可通过对PI结构域进行置换或替换来改变特异性识别的PAM序列。
CRISPR酶突变体
可对CRISPR酶进行修饰来改善或抑制多种特征,例如核酸酶活性、解旋酶活性、与gRNA相互作用的能力、接近靶基因或核酸的能力(例如CRISPR酶的PAM识别能力)。
此外,CRISPR酶突变体可为这样的CRISPR酶:其与gRNA相互作用以形成gRNA-CRISPR酶复合体(即CRISPR复合体),并经修饰或操纵以改善靶特异性,使得当接近或定位于靶基因或核酸时,仅切割靶基因或核酸的双链或单链,而不切割与gRNA形成部分互补结合的非靶基因或核酸以及不与gRNA形成互补结合的非靶基因或核酸的双链或单链。
此处,将对与gRNA形成部分互补结合的非靶基因或核酸的双链或单链或者不与gRNA形成互补结合的非靶基因或核酸的双链或单链进行切割的效应称为脱靶效应,将与gRNA形成部分互补结合的非靶基因或核酸或者不与gRNA形成互补结合的非靶基因或核酸中的位置或碱基序列称为脱靶靶标。此处,可存在一个或多个脱靶靶标。另一方面,将对靶基因或核酸的双链或单链进行切割的效应称为中靶效应,并将靶基因或核酸中的位置或靶序列称为中靶靶标。
CRISPR酶突变体可为对天然存在的CRISPR酶的氨基酸中的至少一个进行修饰,与未修饰的CRISPR酶相比,所作修饰例如可改善或抑制各种特征中的一种或多种,例如核酸酶活性、解旋酶活性、与gRNA相互作用的能力、接近靶基因或核酸的能力以及靶特异性。此处,修饰可为氨基酸的置换、删除、添加或它们的混合。
在CRISPR酶突变体中,
修饰可为对位于存在于天然CRISPR酶中的由带正电的氨基酸组成的区域中的一个或两个以上氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的一个或两个以上带正电的氨基酸(例如赖氨酸(K)、精氨酸(R)和组氨酸(H))进行的修饰。
修饰可为对位于存在于天然CRISPR酶中的由不带正电的氨基酸组成的区域中的一个或两个以上氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的一个或两个以上不带正电的氨基酸(即天冬氨酸(D)、谷氨酸(E)、丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W))进行的修饰。
在另一实例中,修饰可为对存在于天然CRISPR酶中的一个或两个以上非带电氨基酸(即丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W))进行的修饰。
此外,修饰可为对存在于天然CRISPR酶中的一个或两个以上带疏水残基的氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)中的一个或两个以上氨基酸进行的修饰。
修饰可为对存在于天然CRISPR酶中的一个或两个以上带极性残基的氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、天冬氨酸(D)和谷氨酸(E)中的一个或两个以上氨基酸进行的修饰。
此外,修饰可为对存在于天然CRISPR酶中的包括赖氨酸(K)、精氨酸(R)和组氨酸(H)在内的一个或两个以上氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的包括赖氨酸(K)、精氨酸(R)和组氨酸(H)在内的一个或两个以上氨基酸进行的置换。
修饰可为对存在于天然CRISPR酶中的包括天冬氨酸(D)和谷氨酸(E)在内的一个或两个以上氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的包括天冬氨酸(D)和谷氨酸(E)在内的一个或两个以上氨基酸进行的置换。
修饰可为对存在于天然CRISPR酶中的包括丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)在内的一个或两个以上氨基酸进行的修饰。
例如,修饰可为对存在于天然CRISPR酶中的包括丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)在内的一个或两个以上氨基酸进行的置换。
此外,修饰可为对存在于天然CRISPR酶中的一个、两个、三个、四个、五个、六个、七个或更多个氨基酸进行的修饰。
此外,在CRISPR酶突变体中,
修饰可为对CRISPR酶的RuvC结构域中存在的一个或两个以上氨基酸进行的修饰。此处,RuvC结构域可为RuvCI、RuvCII或RuvCIII结构域。
修饰可为对CRISPR酶的HNH结构域中存在的一个或两个以上氨基酸进行的修饰。
修饰可为对CRISPR酶的REC结构域中存在的一个或两个以上氨基酸进行的修饰。
修饰可为对CRISPR酶的PI结构域中存在的一个或两个以上氨基酸进行的修饰。
修饰可为对CRISPR酶的REC、RuvC、HNH和PI结构域中的至少两个或更多个结构域中含有的两个以上氨基酸进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC和RuvC结构域中含有的两个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和RuvC结构域中含有的A203、H277、G366、F539、I601、M763、D965和F1038中的至少两个或更多个氨基酸进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC和HNH结构域中含有的两个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和HNH结构域中含有的A203、H277、G366、F539、I601和K890中的至少两个或更多个氨基酸进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC和PI结构域中含有的两个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和PI结构域中含有的A203、H277、G366、F539、I601、T1102和D1127中的至少两个或更多个氨基酸进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、RuvC和HNH结构域中含有的三个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC和HNH结构域中含有的A203、H277、G366、F539、I601、M763、K890、D965和F1038中的至少三个或更多个氨基酸进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC、RuvC和PI结构域中含有的三个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC和PI结构域中含有的A203、H277、G366、F539、I601、M763、D965、F1038、T1102和D1127中的至少三个或更多个氨基酸进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、HNH和PI结构域中含有的三个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、HNH和PI结构域中含有的A203、H277、G366、F539、I601、K890、T1102和D1127中的至少三个或更多个氨基酸进行的修饰。
在一个实例中,修饰可为对CRISPR酶的RuvC、HNH和PI结构域中含有的三个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的RuvC、HNH和PI结构域中含有的M763、K890、D965、F1038、T1102和D1127中的至少三个或更多个氨基酸进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、RuvC、HNH和PI结构域中含有的四个以上氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC、HNH和PI结构域中含有的A203、H277、G366、F539、I601、M763、K890、D965、F1038、T1102和D1127中的至少四个或更多个氨基酸进行的修饰。
此外,在CRISPR酶突变体中,
修饰可为对参与CRISPR酶的核酸酶活性的一个或两个以上氨基酸进行的修饰。
例如,在SpCas9突变体中,修饰可为对由如下氨基酸所组成的组中的一个或两个以上氨基酸进行的修饰:D10、E762、H840、N854、N863以及D986;或者修饰可为对由其它Cas9直系同源物中对应于这些氨基酸的氨基酸所组成的组中的一个或两个以上氨基酸进行的修饰。
修饰可为使得CRISPR酶的核酸酶活性部分失活的修饰,从而CRISPR酶突变体可为切口酶。
此处,修饰可为使得CRISPR酶的RuvC结构域的核酸酶活性失活的修饰,从而CRISPR酶突变体不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9氨基酸序列的第10位残基由天冬氨酸突变为丙氨酸(即D10A突变)时,RuvC结构域的核酸酶活性失活,从而SpCas9可用作切口酶。由此生成的切口酶不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列的第8位残基由天冬氨酸突变为丙氨酸(即D8A突变)时,RuvC结构域的核酸酶活性失活,从而CjCas9可用作切口酶。由此生成的切口酶不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
此外,此处,修饰可为使得CRISPR酶的HNH结构域的核酸酶活性失活的修饰,从而CRISPR酶突变体不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9氨基酸序列的第840位残基由组氨酸突变为丙氨酸(即H840A突变)时,HNH结构域的核酸酶活性失活,从而SpCas9可用作切口酶。由此生成的切口酶不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列的第559位残基由组氨酸突变为丙氨酸(即H559A突变)时,HNH结构域的核酸酶活性失活,从而CjCas9可用作切口酶。由此生成的切口酶不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
此外,修饰可为使得CRISPR酶的核酸酶活性完全失活的修饰,从而CRISPR酶突变体可为失活的CRISPR酶。
此处,修饰可为使得CRISPR酶的RuvC和HNH结构域的核酸酶活性失活的修饰,从而CRISPR酶突变体不能切割靶基因或核酸的双链。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9氨基酸序列的第10位和840位残基分别由天冬氨酸和组氨酸突变为丙氨酸(即D10A和H840A突变)时,RuvC结构域和HNH结构域的核酸酶活性失活,从而靶基因或核酸的双链可完全不被切割。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9氨基酸序列的第8位和559位残基分别由天冬氨酸和组氨酸突变为丙氨酸(即D8A和H559A突变)时,RuvC结构域和HNH结构域的核酸酶活性失活,从而靶基因或核酸的双链可完全不被切割。
此外,除CRISPR酶的固有特征外,CRISPR酶突变体还可进一步包含任选的功能结构域,从而CRISPR酶突变体还可具有除固有特征外的额外特征。
此处,功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域,或者为用于纯化和分离蛋白(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域、肽、多肽或蛋白可为脱氨酶。
例如,不完整或部分的CRISPR酶可额外包含胞苷脱氨酶作为功能结构域。在一个示例性实施方式中,可将胞苷脱氨酶(例如载脂蛋白B编辑复合体1(APOBEC1))添加至SpCas9切口酶,从而生成融合蛋白。由此形成的[SpCas9切口酶]-[APOBEC1]可用于由C到T或U、或者由G到A的编辑或者碱基修复中。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;报告基因包括谷胱甘肽硫转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
此外,功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
在一个实例中,CRISPR酶可包含一个或多个NLS。此处,一个或多个NLS可包含于CRIPSR酶的N端或其附近、酶的C端或其附近或者二者的组合。NLS可为由如下NLS衍生而来的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK的双分型核质蛋白NLS);具有氨基酸序列PAAKRVKLD或RQRRNELKRSP的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY的hRNPA1 M9 NLS;来自输入蛋白α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;肝炎病毒δ抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;或者由类固醇激素受体(人)糖皮质激素的序列衍生而来的NLS序列RKCLQAGMNLEARKTKK。
此外,CRISPR酶突变体可包括通过将CRISPR酶分为两个以上部分而制备的拆分型(split-type)CRISPR酶。术语“拆分”是指对蛋白进行功能或结构性划分,或者将蛋白随机划分为两个以上部分。
此处,拆分型CRISPR酶可为具有完全活性的酶、具有不完全或部分活性的酶或失活的酶。
例如,可在第656位残基(酪氨酸)和第657位残基(苏氨酸)之间将SpCas9分为两部分,从而生成拆分型SpCas9。
此外,拆分型CRISPR酶可任选包含用于重构(reconstitution)的额外的结构域、肽、多肽或蛋白。
此处,“重构”是指所形成的拆分型CRISPR酶在结构方面与野生型CRISPR酶相同或类似。
用于重构的额外的结构域、肽、多肽或蛋白可为FRB和FKBP二聚化结构域;内含肽(intein);ERT和VPR结构域;或者在特定条件下形成异二聚体的结构域。
例如,可在第713位残基(丝氨酸)和第714位残基(甘氨酸)之间将SpCas9分为两部分,从而生成拆分型SpCas9。可将FRB结构域连接至两部分中的一个部分,并将FKBP结构域连接至另一部分。在由此产生的拆分型SpCas9中,FRB结构域和FKBP结构域可以在存在雷帕霉素的环境中形成二聚体,从而生成重构的CRISPR酶。
本发明所述的CRISPR酶或CRISPR酶突变体可为多肽、蛋白或者具有编码所述多肽、蛋白的序列的核酸,并可针对待导入所述CRISPR酶或CRISPR酶突变体的受试者实施密码子优化。
术语“密码子优化”是指对核酸序列的修饰过程,该修饰过程通过在保持天然氨基酸序列的同时将天然序列中的至少一个密码子替换为在宿主细胞中更常或最常使用的密码子来改善在宿主细胞中的表达。多种物种对特定氨基酸的特定密码子具有特定偏好,该密码子偏好(不同生物体间密码子使用的差别)通常与mRNA的翻译效率相关,认为这取决于所翻译的密码子的特征和特定tRNA分子的可获得性。细胞中选择的优势tRNA通常反映了肽合成中最常使用的密码子。因此,可基于密码子优化在给定生物体中通过优化基因表达来对基因进行定制化。
3.靶序列
术语“靶序列”是存在于靶基因或核酸中并与引导核酸的引导结构域中含有的引导序列具有互补性的碱基序列。靶序列是可根据靶基因或核酸(即用于基因操纵或修正的对象物)而改变的碱基序列,可根据靶基因或核酸将其设计为多种形式。
靶序列可与引导核酸的引导结构域中含有的引导序列形成互补结合,靶序列的长度可与引导序列的长度相同。
靶序列可为5-50个碱基的序列。
在实施方式中,靶序列可为16、17、18、19、20、21、22、23、24或25个碱基的序列。
靶序列可为与引导核酸的引导结构域中含有的引导序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全互补性。
在一个实例中,靶序列可为1-8个碱基的序列或包含1-8个碱基的序列,其与引导核酸的引导结构域中含有的引导序列不互补。
此外,靶序列可为临近能够被编辑蛋白识别的核酸序列的碱基序列。
在一个实例中,靶序列可为临近能够被编辑蛋白识别的核酸序列的5'端和/或3'端的连续的5-50个碱基的序列。
在一个示例性实施方式中,gRNA-CRISPR酶复合体的靶序列将在下文中描述。
当靶基因或核酸被gRNA-CRISPR酶复合体靶向时,
靶序列具有对gRNA的引导结构域中含有的引导序列的互补性。靶序列是可根据靶基因或核酸(即用于基因操纵或修正的对象物)而改变的碱基序列,可根据靶基因或核酸将其设计为多种形式。
此外,靶序列可为临近能够被CRISPR酶(即Cas9或Cpf1)识别的PAM序列的碱基序列。
在一个实例中,靶序列可为临近被CRISPR酶识别的PAM序列的5'端和/或3'端的连续的5-50个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是SpCas9时,靶序列可为与5'-NGG-3'、5'-NAG-3'和/或5'-NGA-3'(N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端临近的连续的16-25个碱基的序列。
在另一示例性实施方式中,当CRISPR酶是StCas9时,靶序列可为临近5'-NGGNG-3'和/或5'-NNAGAAW-3'(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在又一示例性实施方式中,当CRISPR酶是NmCas9时,靶序列可为临近5'-NNNNGATT-3'和/或5'-NNNGCTT-3'(N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是CjCas9时,靶序列可为临近5'-NNNVRYAC-3'(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在另一示例性实施方式中,当CRISPR酶是SmCas9时,靶序列可为与5'-NGG-3'和/或5'-NAAR-3'(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端临近的连续的16-25个碱基的序列。
在又一示例性实施方式中,当CRISPR酶是SaCas9时,靶序列可为临近5'-NNGRR-3'、5'-NNGRRT-3'和/或5'-NNGRRV-3'(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是Cpf1时,靶序列可为临近5'-TTN-3'(N=A、T、G或C,或A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在本发明的一个示例性实施方式中,靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因中所包含的核酸序列。
靶序列可为FAD2基因中所包含的核酸序列。
靶序列可为FAD3基因中所包含的核酸序列。
靶序列可为FAD6基因中所包含的核酸序列。
靶序列可为FAD7基因中所包含的核酸序列。
靶序列可为FAD8基因中所包含的核酸序列。
或者,
靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的部分核酸序列。
靶序列可为FAD2基因的部分核酸序列。
靶序列可为FAD3基因的部分核酸序列。
靶序列可为FAD6基因的部分核酸序列。
靶序列可为FAD7基因的部分核酸序列。
靶序列可为FAD8基因的部分核酸序列。
或者,
靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的编码区或非编码区或其混合物的核酸序列。
靶序列可为FAD2基因的编码区或非编码区或其混合物的核酸序列。
靶序列可为FAD3基因的编码区或非编码区或其混合物的核酸序列。
靶序列可为FAD6基因的编码区或非编码区或其混合物的核酸序列。
靶序列可为FAD7基因的编码区或非编码区或其混合物的核酸序列。
靶序列可为FAD8基因的编码区或非编码区或其混合物的核酸序列。
或者,
靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
靶序列可为FAD2基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
靶序列可为FAD3基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
靶序列可为FAD6基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
靶序列可为FAD7基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
靶序列可为FAD8基因的启动子、增强子、3'UTR或多聚腺苷(polyA)区或其混合物的核酸序列。
或者,
靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的外显子、内含子或其混合物的核酸序列。
靶序列可为FAD2基因的外显子、内含子或其混合物的核酸序列。
靶序列可为FAD3基因的外显子、内含子或其混合物的核酸序列。
靶序列可为FAD6基因的外显子、内含子或其混合物的核酸序列。
靶序列可为FAD7基因的外显子、内含子或其混合物的核酸序列。
靶序列可为FAD8基因的外显子、内含子或其混合物的核酸序列。
或者,
靶序列可为包含或邻近选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的突变区(例如,不同于野生型基因的区域)的核酸序列。
靶序列可为包含或邻近FAD2基因的突变区的核酸序列。
靶序列可为包含或邻近FAD3基因的突变区的核酸序列。
靶序列可为包含或邻近FAD6基因的突变区的核酸序列。
靶序列可为包含或邻近FAD7基因的突变区的核酸序列。
靶序列可为包含或邻近FAD8基因的突变区的核酸序列。
或者,
靶序列可为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的连续的5-50个核酸的序列。
靶序列可为FAD2基因的连续的5-50个核酸的序列。
靶序列可为FAD3基因的连续的5-50个核酸的序列。
靶序列可为FAD6基因的连续的5-50个核酸的序列。
靶序列可为FAD7基因的连续的5-50个核酸的序列。
靶序列可为FAD8基因的连续的5-50个核酸的序列。
作为本发明的一个示例性实施方式,上述FAD2基因的靶序列总结在表1中。
[用于操纵不饱和脂肪酸生物合成相关因子的组合物]
4.引导核酸-编辑蛋白复合体及其用途
引导核酸-编辑蛋白复合体可对靶标进行修饰。
例如,引导核酸-编辑蛋白复合体可用于对感兴趣的蛋白的表达进行最终调节(例如抑制、阻遏、降低、升高或促进)、去除蛋白、对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)或表达新蛋白。
此处,引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。
例如,引导核酸-编辑蛋白复合体可通过对靶DNA进行操纵或修饰来对靶DNA编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)、去除蛋白、对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在另一实例中,引导核酸-编辑蛋白复合体可通过对靶RNA进行操纵或修饰来对靶DNA编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)、去除蛋白、对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在一个实例中,引导核酸-编辑蛋白复合体可通过对靶基因进行操纵或修饰来对靶DNA编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)、去除蛋白、对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在另一实例中,引导核酸-编辑蛋白复合体可通过对靶染色体进行操纵或修饰来对靶DNA编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)、去除蛋白、对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可促进或阻遏靶基因的转录,从而对靶基因编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)。
在另一实例中,引导核酸-编辑蛋白复合体可促进或阻遏靶基因的翻译,从而对靶基因编码的蛋白的表达进行调节(例如抑制、阻遏、降低、升高或促进)。
引导核酸-编辑蛋白复合体可在蛋白水平发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可对靶蛋白进行操纵或修饰,从而去除靶蛋白或对蛋白活性进行调节(例如抑制、阻遏、降低、升高或促进)。
在一个示例性实施方式中,本发明提供了用于操纵不饱和脂肪酸生物合成相关因子(例如FAD基因,优选FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因)的引导核酸-编辑蛋白复合体。优选地,提供gRNA-CRISPR酶复合体。
特别地,本发明可提供包含能够与来自基因的靶序列形成互补结合的引导结构域的gRNA(例如分离的或非天然的gRNA)以及编码该gRNA的DNA。可将gRNA和编码该gRNA的DNA序列设计成能够与表1中列出的靶序列互补结合。
此外,设计gRNA的靶区域以提供第三基因,该第三基因具有FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因中的核酸修饰(例如双链断裂或单链断裂)或靶位点处的特定功能。
此外,当将两个以上gRNA用于在靶基因中诱导两个以上切割事件(例如双链断裂或单链断裂)时,可借助相同或不同的Cas9蛋白发生两个以上切割事件。
gRNA可靶向例如
FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因中的两种以上;或者
FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因中各自的两个以上区域;并且
可独立地诱导FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因的双链和/或单链切割;或者
可诱导一个外源核苷酸插入FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因的切割位点。
此外,在本发明的另一示例性实施方式中,构成引导核酸-编辑蛋白复合体的核酸可包含:
(a)编码包含引导结构域(其与本文所述的FAD2基因的靶序列互补)的引导核酸的序列;以及
(b)编码编辑蛋白的序列。
此处,根据靶区域可存在两种以上(a),并且(b)可使用相同的编辑蛋白或两种以上编辑蛋白。
在实施方式中,可设计核酸以靶向酶促失活的编辑蛋白或其融合蛋白(例如转录阻遏子(transcription repressor)结构域融合)而使其与敲减的靶位点充分靠近,从而降低、减少或抑制FAD2基因的表达。
此外,应显而易见的是,上述引导核酸-编辑蛋白复合体的结构、功能和所有应用将可用于对FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因的操纵中。
引导核酸-编辑蛋白复合体的用途
在本发明的引导核酸-编辑蛋白复合体的用途的实施方式中,下面将对利用gRNA-CRISPR酶复合体对靶DNA、RNA、基因或染色体进行的操纵或修饰进行描述。
基因操纵(Gene manipulation)
可使用上述gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行操纵或修正。此处,对靶基因或核酸的操纵或修正包括用于i)对靶基因或核酸进行切割或损伤;以及ii)对损伤的靶基因或核酸进行修复的全部步骤。
i)靶基因或核酸的切割或损伤
i)靶基因或核酸的切割或损伤可为使用CRISPR复合体对靶基因或核酸进行切割或损伤,具体而言对靶基因或核酸中的靶序列进行切割或损伤。
在一个实例中,使用CRISPR复合体对靶基因或核酸进行切割或损伤可为将靶序列的双链完全切割或损伤。
在一个示例性实施方式中,当使用野生型SpCas9时,与gRNA形成互补结合的靶序列的双链可被完全切割。
在另一示例性实施方式中,当使用SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,可顺序或同时实施切割。
在又一示例性实施方式中,当使用SpCas9切口酶(D10A)和SpCas9切口酶(H840A)以及具有不同靶序列的两条gRNA时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第二gRNA形成互补结合的靶序列的非互补单链,可顺序或同时实施切割。
在另一实例中,使用CRISPR复合体对靶基因或核酸进行切割或损伤可为仅对靶序列的单链进行切割或损伤。此处,单链可为与gRNA形成互补结合的靶序列的互补单链或与gRNA形成互补结合的靶序列的非互补单链。
在一个示例性实施方式中,当使用SpCas9切口酶(D10A)时,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而与gRNA形成互补结合的靶序列的非互补单链可不被切割。
在另一示例性实施方式中,当使用SpCas9切口酶(H840A)时,SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,而与gRNA形成互补结合的靶序列的互补单链可不被切割。
在又一实例中,使用CRISPR复合体对靶基因或核酸进行切割或损伤可为部分去除核酸片段。
在一个示例性实施方式中,当使用具有不同靶序列的两条gRNA和野生型SpCas9时,可对与第一gRNA形成互补结合的靶序列的双链进行切割,并可对与第二gRNA形成互补结合的靶序列的双链进行切割,从而借助第一gRNA和第二gRNA以及SpCas9去除核酸片段。
在另一示例性实施方式中,当使用具有不同靶序列的两条gRNA、野生型SpCas9、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,野生型SpCas9可切割与第一gRNA形成互补结合的靶序列的双链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割非互补单链,从而借助第一gRNA和第二gRNA、野生型SpCas9、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)去除核酸片段。
在又一示例性实施方式中,当使用具有不同靶序列的两条gRNA、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,SpCas9切口酶(H840A)可切割非互补单链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割非互补单链,从而借助第一gRNA和第二gRNA、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)去除核酸片段。
在又一示例性实施方式中,当使用具有不同靶序列的三条gRNA、野生型SpCas9、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,野生型SpCas9可切割与第一gRNA形成互补结合的靶序列的双链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第三gRNA形成互补结合的靶序列的非互补单链,从而借助第一gRNA、第二gRNA、第三gRNA、野生型SpCas9、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)去除核酸片段。
在又一示例性实施方式中,当使用具有不同靶序列的四条gRNA、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,SpCas9切口酶(H840A)可切割与第二gRNA形成互补结合的靶序列的非互补单链,SpCas9切口酶(D10A)可切割与第三gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第四gRNA形成互补结合的靶序列的非互补单链,从而借助第一gRNA、第二gRNA、第三gRNA、第四gRNA、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)去除核酸片段。
ii)损伤的靶基因或核酸的修复或恢复
可借助非同源末端接合(NHEJ)和同源介导的修复(HDR)来对CRISPR复合体所切割或损伤的靶基因或核酸进行修复或恢复。
非同源末端接合(NHEJ)
NHEJ是通过将被切割的双链或单链的两端连接在一起对DNA中的双链断裂进行恢复或修复的方法,一般而言,当将通过双链断裂(例如切割)形成的两个相容末端持续彼此接触使得两个末端完全相接,损伤的双链得以修复。NHEJ是能够用于整个细胞周期的恢复方法,通常在细胞中无同源基因组作为模板时(例如G1期)发生。
在利用NHEJ对损伤的基因或核酸进行修复的过程中,NHEJ修复区中的核酸序列出现一些插入和/或删除(插入缺失,indel),此类插入和/或删除导致读码框位移,产生移码突变的转录组mRNA。其结果是,由于无义介导的衰变(nonsense-mediated decay)或正常蛋白无法合成,造成固有功能丧失。此外,即使读码框保持不变,序列中相当数量的插入或缺失造成的突变也可导致蛋白功能破坏。由于相比蛋白中非重要区域的突变,对重要功能结构域中的突变可能耐受性更低,突变为基因座依赖型的。
由于不能预测在天然状态下由NHEJ产生的插入缺失突变,特定的插入缺失序列优选位于指定的损伤区中,并可来自于微同源的小区域。常规地,删除的长度范围为1bp-50bp,插入趋向于更短,并通常包含直接包围损伤区域的短重复序列。
此外,NHEJ是造成突变的过程,当不必须生成特定的最终序列时,可将NHEJ用于对短序列基序进行删除。
可通过该NHEJ对CRISPR复合体靶向的基因进行特异性敲除。可使用CRISPR酶(例如Cas9或Cpf1)切割靶基因或核酸的双链或两条单链,并可借助NHEJ使得靶基因或核酸中的损伤双链或两条单链具有插入缺失,从而诱导靶基因或核酸的特异性敲除。此处,CRISPR酶所切割的靶基因或核酸的位点可在非编码区或编码区;此外,由NHEJ所恢复的靶基因或核酸的位点可在非编码区或编码区。
同源介导的修复(HDR)
HDR是无错修正方法,其使用同源序列作为模板对损伤的基因或核酸进行修复或恢复,一般而言,为修复或恢复损伤DNA(即,恢复细胞的固有信息),利用未被修饰的互补碱基序列的信息或者姐妹染色单体的信息对损伤DNA进行修复。HDR最常见的类型为同源重组(HR)。HDR是通常出现在活跃分裂的细胞的S期或G2/M期的修复或恢复方法。
为借助HDR而不使用细胞的姐妹染色单体或互补碱基序列对损伤的DNA进行修复或恢复,可将使用互补碱基序列或同源碱基序列的信息人工合成的DNA模板(即,包含互补碱基序列或同源碱基序列的核酸模板)提供至细胞来修复损伤DNA。此处,当进一步将核酸序列或核酸片段添加至核酸模板来修复损伤DNA时,可将进一步添加至损伤DNA的核酸序列或核酸片段敲入。进一步添加的核酸序列或核酸片段可为对由正常基因或核酸的突变造成的修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸,但本发明不限于此。
在一个实例中,可使用CRISPR复合体切割靶基因或核酸的双链或单链,可将核酸模板(该核酸模板包含与临近切割位点的碱基序列互补的碱基序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸中被切割的碱基序列。
此处,包含互补碱基序列的核酸模板可具有损伤DNA(即,互补碱基序列被切割的双链或单链),并进一步包含待插入至损伤DNA的核酸序列或核酸片段。可使用包含互补碱基序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至损伤DNA(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变造成的修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。互补碱基序列可为与损伤DNA具有互补结合的碱基序列(即,靶基因或核酸被切割的双链或单链的左侧或右侧的碱基序列)。或者,互补碱基序列可为与损伤DNA具有互补结合的碱基序列(即,靶基因或核酸被切割的双链或单链的5'和3'端)。互补碱基序列可为15-3000个碱基的序列,可根据核酸模板或靶基因的大小对互补碱基序列的长度或大小进行适当设计。此处,作为核酸模板,可使用双链或单链的核酸,或者其可为线性或环状,但本发明不限于此。
在另一实例中,可使用CRISPR复合体切割靶基因或核酸的双链或单链,可将核酸模板(该核酸模板包含临近切割位点的碱基序列的同源碱基序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸中被切割的碱基序列。
此处,包含同源碱基序列的核酸模板可为损伤DNA(即,被切割的双链或单链同源碱基序列),并进一步包含待插入至损伤DNA的核酸序列或核酸片段。可使用包含同源碱基序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至损伤DNA(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变造成的修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。同源碱基序列可为损伤DNA,即,与靶基因或核酸被切割的双链或单链碱基序列左侧和右侧的碱基序列具有同源性的碱基序列。或者,同源碱基序列可为与损伤DNA具有同源性的碱基序列,即,与靶基因或核酸被切割的双链或单链的5'和3'端具有同源性的碱基序列。同源碱基序列可为15-3000个碱基的序列,可根据核酸模板或者靶基因或核酸的大小对同源碱基序列的长度或大小进行适当设计。此处,作为核酸模板,可使用双链或单链的核酸,或者其可为线性或环状,但本发明不限于此。
存在不同于NHEJ和HDR的对损伤DNA进行修复或恢复的方法。
单链退火(SSA)
SSA是对靶核酸中存在的两个重复序列间的双链断裂进行修复的方法,一般使用多于30个碱基的重复序列。可对重复序列进行切割(以产生粘性末端),从而在靶核酸双链的各断裂端产生单链;并且,在切割后利用RPA蛋白对含有重复序列的单链垂悬部分(overhang)进行包覆,来防止重复序列彼此的不适当退火。RAD52结合至垂悬部分上的各重复序列,并排列能够对互补重复序列进行退火的序列。退火后,垂悬部分的单链悬垂(flap)被切割,合成新DNA来填充特定缺口,从而恢复DNA双链。该修复的结果是两个重复间的DNA序列被删除,删除长度可取决于多种因素(包括此处使用的两个重复的位置和切割的路径或进行度)。
就对靶核酸序列进行修饰或修正而言,与HDR类似,SSA使用互补序列(即互补重复序列);与HDR不同,SSA不需要核酸模板。
单链断裂修复(SSBR)
SSBR借助与上述修复机制不同的机制对基因组中的单链断裂进行修复。在单链DNA断裂的情况下,PARP1和/或PARP2识别断裂并动员修复机制。PARP1对DNA断裂的结合和活性是暂时的,通过促进损伤区域中SSBR蛋白复合体的稳定性来促进SSBR。SSBR复合体中最重要的蛋白是XRCC1,它与促进DNA的3'和5'端加工的蛋白相互作用来稳定DNA。末端加工通常涉及将损伤的3'端修复为羟基化状态和/或将损伤的5'端修复为具有磷酸部分,并在末端加工后发生DNA缺口填充。存在两种DNA缺口填充方法,即短补丁(patch)修复和长补丁修复,短补丁修复涉及单碱基的插入。在DNA缺口填充后,DNA连接酶促进末端连接。
错配修复(MMR)
MMR作用于错配的DNA碱基。MSH2/6或MSH2/3复合体各自具有ATPase活性,并因此在识别错配和引发修复中起到重要作用。MSH2/6主要识别碱基-碱基错配并识别一个或两个碱基的错配,而MSH2/3主要识别更长的错配。
碱基切除修复(BER)
BER是在整个细胞周期中均活跃的修复方法,其用于从基因组中去除较小的非螺旋扭曲碱基损伤区。在损伤的DNA中,通过切割连接碱基与脱氧核糖-磷酸骨架的N-糖苷键去除损伤的碱基,随后切割磷酸二酯键骨架,从而生成单链DNA断裂。去除由此形成的损伤单链末端,并利用新的互补碱基填充由于单链去除而造成的缺口,随后利用DNA连接酶将新填充的互补碱基的末端连接至骨架,实现对损伤DNA的修复。
核苷酸切除修复(NER)
NER是对于从DNA中去除较大的螺旋扭曲损伤而言重要的切除机制,当识别到损伤时,去除含有损伤区域的短单链DNA片段,产生22-30个碱基的单链缺口。利用新的互补碱基填充产生的缺口,并利用DNA连接酶将新填充的互补碱基的末端连接至骨架,实现对损伤DNA的修复。
基因操纵效果
对靶基因或核酸的操纵或修正主要可产生敲除、敲减和敲入的效果。
敲除
术语“敲除”是指靶基因或核酸的失活,而“靶基因或核酸的失活”是指不发生靶基因或核酸的转录和/或翻译的状态。通过敲除可对造成疾病的基因或具有异常功能的基因的转录和翻译进行抑制,阻止蛋白表达。
例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行编辑或修正时,可使用CRISPR复合体对靶基因或核酸进行切割。可利用CRISPR复合体通过NHEJ对损伤的靶基因或核酸进行修复。由于NHEJ,损伤的靶基因或核酸可具有插入缺失,从而可诱导针对靶基因或核酸的特异性敲除。
敲减
术语“敲减”是指靶基因或核酸的转录和/或翻译或靶蛋白的表达降低。通过敲减对基因或蛋白的过表达进行调节,可预防发病或可治疗疾病。
例如,当利用gRNA-CRISPR失活酶-转录抑制活性结构域复合体(即,包含转录抑制活性结构域的CRISPR失活复合体)对靶基因或核酸进行编辑或修正时,CRISPR失活复合体可特异性地结合至靶基因或核酸,可借助CRISPR失活复合体中包含的转录抑制活性结构域对靶基因或核酸的转录进行抑制,从而诱导敲减(其中,相应基因或核酸的表达被抑制)。
敲入
术语“敲入”是指将特定核酸或基因插入至靶基因或核酸,此处,“特定核酸”是指待被插入或者被表达的感兴趣的基因或核酸。通过敲入将触发疾病的突变基因修正为正常或者插入正常基因来诱导正常基因表达,可将该突变基因用于疾病的治疗中。
此外,敲入可进一步需要供体(donor)。
例如,当借助gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行编辑或修正时,可利用CRISPR复合体切割靶基因或核酸。可通过HDR来修复使用CRISPR复合体损伤的靶基因或核酸。此处,可借助供体将特定核酸插入至损伤的基因或核酸。
术语“供体”是指帮助基于HDR修复损伤的基因或核酸的核酸序列,此处,供体可包含特定核酸。
供体可为双链核酸或单链核酸。
供体可以以线性或环状形式存在。
供体可包含与靶基因或核酸具有同源性的核酸序列。
例如,供体可包含与待插入特定核酸的位置(例如损伤核酸的上游(左)和下游(右))处的碱基序列分别具有同源性的核酸序列。此处,待插入的特定核酸可位于与损伤核酸下游的核酸序列具有同源性的核酸序列和与损伤核酸上游的核酸序列具有同源性的核酸序列之间。此处,同源核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全同源性。
供体可任选包含额外核酸序列。此处,额外核酸序列可在增强供体稳定性、敲入效率或HDR效率方面发挥作用。
例如,额外核酸序列可为富含A和T的核酸序列(即富A-T结构域)。此外,额外核酸序列可为支架/基质附着区(SMAR)。
在涉及本发明的基因操纵效果的一个示例性实施方式中,利用gRNA-CRISPR酶复合体获得的经操纵的靶基因(即,经操纵的不饱和脂肪酸生物合成相关因子)可具有以下组成。
在一个示例性实施方式中,当不饱和脂肪酸生物合成相关因子是基因时,
通过gRNA-CRISPR酶复合体进行人工操纵的不饱和脂肪酸生物合成相关因子的组成可以在位于组成所述不饱和脂肪酸生物合成相关因子的核酸序列中的PAM序列中或临近所述PAM序列的5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp或1bp-30bp并优选3bp-25bp的区域中包含如下中的一种或多种核酸修饰:
一个或多个核苷酸的删除或插入;
利用不同于野生型基因的一个或多个核苷酸进行的置换;以及
一个或多个外源核苷酸的插入。
此外,在组成不饱和脂肪酸生物合成相关因子的核酸序列中可包含一个或多个核苷酸的化学修饰。
此处,“外源核苷酸”是包括全部外来核苷酸(例如异源核苷酸或人工合成的核苷酸)而并非不饱和脂肪酸生物合成相关因子天生所包含的核苷酸的概念。外源核苷酸还包括表达具有特定功能的蛋白的具有几百bp、几千bp或几万bp的大小的核苷酸以及具有50bp或更小的大小的小寡核苷酸。此类外源核苷酸可为供体。
化学修饰可包括甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化,例如,核苷酸中所包含的部分官能团被氢原子、氟原子、-O-烷基、-O-酰基和氨基中的任一者取代,但本发明不限于此。另外,为了增加核酸分子的转移能力,官能团还可以被-Br、-Cl、-R、-R'OR、-SH、-SR、-N3和-CN(R=烷基、芳基、亚烷基)中的任一者取代。另外,至少一个核苷酸的磷酸骨架可被烷基膦酸酯(alkylphosphonate)形式、氨基磷酸酯(phosphoroamidate)形式和硼代磷酸盐(boranophosphate)形式中的任一者取代。另外,化学修饰可为核酸分子中包含的至少一种核苷酸被锁核酸(LNA)、解锁核酸(UNA)、吗啉基和肽核酸(PNA)中的任一者取代,并且化学修饰可为核酸分子与选自于由脂质、细胞穿透肽和细胞靶向配体所组成的组中的一种或多种结合。
为形成期望的不饱和脂肪酸生物合成控制系统,可以将利用gRNA-CRISPR酶复合体进行的人工修饰应用于组成不饱和脂肪酸生物合成相关因子的核酸。
包含不饱和脂肪酸生物合成相关因子的核酸修饰的区域可为靶区域或靶序列。
此种靶序列可为gRNA-CRISPR酶复合体的靶标,该靶序列可包含CRISPR酶所识别的PAM序列或不包含该PAM序列。此种靶序列可为本领域普通技术人员在gRNA设计阶段提供重要标准。
此类核酸修饰包括核酸的“切割”。
靶区域中的术语“切割”是指多核苷酸共价骨架的断裂。切割包括磷酸二酯键的酶促水解或化学水解,但本发明并不限于此,还包括多种其它方法。切割在单链和双链上均可进行,双链切割可由不同的单链切割而引起。双链切割可产生平末端或交错(staggered)末端。
当使用失活CRISPR酶时,其可诱导具有特定功能的因子靠近靶区域或不饱和脂肪酸生物合成相关因子的某个区域而不进行切割过程。根据该特定功能,不饱和脂肪酸生物合成相关因子的核酸序列中可包含一个或多个核苷酸的化学修饰。
在一个实例中,可经由通过gRNA-CRISPR酶复合体进行的核酸切割,通过靶活性和非靶活性产生多个插入缺失。
术语“插入缺失”是在DNA碱基序列的部分碱基中/之间出现的插入或缺失突变的统称术语。当gRNA-CRISPR酶复合体切割如上所述的不饱和脂肪酸生物合成相关因子的核酸(DNA或RNA)时,插入缺失可在通过HDR或NHEJ机制进行修复的过程中被引入靶序列。
本发明的经人工操纵的不饱和脂肪酸生物合成相关因子是指通过此类核酸的切割和插入缺失或使用供体的插入等对原始基因的核酸序列进行了修饰;并且有助于期望的用于控制不饱和脂肪酸生物合成的系统(例如表现出促进或抑制特定不饱和脂肪酸的效果)。
例如,可借助经人工操纵的不饱和脂肪酸生物合成相关因子促进特定蛋白的表达及其活性。
可借助经人工操纵的不饱和脂肪酸生物合成相关因子使特定蛋白失活。
在一个实例中,可对基因组中各个不饱和脂肪酸生物合成相关因子(例如反向调节基因,如FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因)的特定靶区域进行切割来敲减或敲除这些基因。
在另一实例中,为改变(例如阻断、反向调节或减少)FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因的转录,可使用与转录阻遏结构域或染色质修饰蛋白融合的酶促失活CRISPR酶来介导靶向敲减。
可通过经人工操纵的不饱和脂肪酸生物合成相关因子来调节不饱和脂肪酸的产生。
可通过经人工操纵的不饱和脂肪酸生物合成相关因子来产生特定不饱和脂肪酸的含量增加或减少的植物体或使用该植物体的加工产品。
在本发明的一个示例性实施方式中,对于经人工操纵的不饱和脂肪酸生物合成相关因子,可根据gRNA-CRISPR酶复合体的构成特征(例如,包含于或靠近不饱和脂肪酸生物合成相关因子的靶区域的主要PAM序列的差异)提供多种经人工操纵的不饱和脂肪酸生物合成相关因子。
下文中,尽管就CRISPR酶和不饱和脂肪酸生物合成相关基因的代表性实例进行了说明,然而它们仅是具体实例,因而本发明不限于此。
例如,当CRISPR酶是SpCas9蛋白时,PAM序列为5'-NGG-3'(N为A、T、G或C);切割的碱基序列区(靶区域)可为靶基因内临近5’-NGG-3’序列的5’端和/或3’端的碱基序列中的连续的1bp-25bp(例如17bp-23bp或21bp-23bp)的区域。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a)删除临近5'-NGG-3'(N为A、T、C或G)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b)利用不同于野生型基因的核苷酸的核苷酸置换临近5'-NGG-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
c)将一个或多个核苷酸插入至临近5'-NGG-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d)选自a)-c)中的两者以上的组合。
例如,当CRISPR酶是CjCas9蛋白时,PAM序列为5'-NNNNRYAC-3'(N各自独立地为A、T、G或C;R为A或G;Y为C或T);切割的碱基序列区(靶区域)可为靶基因内临近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp或21bp-23bp)的区域。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a')删除临近5'-NNNNRYAC-3'(N各自独立地为A、T、G或C;R为A或G;Y为C或T)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b')利用不同于野生型基因的核苷酸的核苷酸置换临近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
c')将一个或多个核苷酸插入至临近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d')选自a')-c')中的两者以上的组合。
例如,当CRISPR酶是StCas9蛋白时,PAM序列为5'-NNAGAAW-3'(N各自独立地为A、T、G或C;W为A或T);切割的碱基序列区(靶区域)可为靶基因内临近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp或21bp-23bp)的区域。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a”)删除临近5'-NNAGAAW-3'(N各自独立地为A、T、G或C;W为A或T)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b”)利用不同于野生型基因的核苷酸的核苷酸置换临近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
c”)将一个或多个核苷酸插入至临近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d”)选自a”)-c”)中的两者以上的组合。
例如,当CRISPR酶是NmCas9蛋白时,PAM序列为5'-NNNNGATT-3'(N各自独立地为A、T、G或C);切割的碱基序列区(靶区域)可为靶基因内临近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp或21bp-23bp)的区域。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a”')删除临近5'-NNNNGATT-3'(N各自独立地为A、T、G或C)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b”')利用不同于野生型基因的核苷酸的核苷酸置换临近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
c”')将一个或多个核苷酸插入至临近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d”')选自a”')-c”')中的两者以上的组合。
例如,当CRISPR酶是SaCas9蛋白时,PAM序列为5'-NNGRR(T)-3'(N各自独立地为A、T、G或C;R为A或G;(T)为随机可增加序列);切割的碱基序列区(靶区域)可为靶基因内临近5'-NNGRR(T)-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp或21bp-23bp)的区域。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a””)删除临近5'-NNGRR(T)-3'(N各自独立地为A、T、G或C;R为A或G;(T)为随机可增加序列)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b””)利用不同于野生型基因的核苷酸的核苷酸置换临近5'-NNGRR(T)-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
c””)将一个或多个核苷酸插入至临近5'-NNGRR(T)-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d””)选自a””)-c””)中的两者以上的组合。
例如,当CRISPR酶是Cpf1蛋白时,PAM序列为5'-TTN-3'(N为A、T、G或C);切割的碱基序列区(靶区域)可为临近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp、17bp-30bp或17bp-26bp)的区域。
Cpf1蛋白可由如下微生物衍生而来:例如俭菌(GWC2011_GWC2_44_17)、毛螺菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌(ND2006)、Porphyromonascrevioricanis、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌(MA2020)、新凶手弗朗西斯菌(U112)、CandidatusMethanoplasma termitum或挑剔真杆菌;例如俭菌(GWC2011_GWC2_44_17)、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、Moraxellabovoculi(237)、稻田钩端螺旋体、毛螺菌(MA2020)、新凶手弗朗西斯菌(U112)、CandidatusMethanoplasma termitum或挑剔真杆菌,但本发明不限于此。
本发明可提供通过不饱和脂肪酸生物合成相关因子的核酸序列中的如下修饰制备的经人工操纵的不饱和脂肪酸生物合成相关因子(如经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因):
a””')删除临近5'-TTN-3'(N为A、T、G或C)序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp)的区域中的一个或多个核苷酸;
b””')利用不同于野生型基因的核苷酸的核苷酸置换临近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp)的区域中的一个或多个核苷酸;
c””')将一个或多个核苷酸插入至临近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp)的区域;或者
d””')选自a””')-c””')中的两者以上的组合。
在另一示例性实施方式中,当不饱和脂肪酸生物合成相关因子是蛋白时,经人工操纵的蛋白包括参与通过gRNA-CRISPR酶复合体的直接或间接作用形成的新的或改变的不饱和脂肪酸生物合成的全部蛋白。
例如,经人工操纵的蛋白可为由通过gRNA-CRISPR复合体进行人工操纵的不饱和脂肪酸生物合成因子(基因)表达的蛋白,或者因此类蛋白活性的影响而导致增加或减少的其它蛋白,但本发明并不限于此。
经人工操纵的不饱和脂肪酸生物合成相关因子(蛋白)可具有与经人工操纵的不饱和脂肪酸生物合成相关因子(基因)的组成相对应的氨基酸组成和活性。
作为实施方式,可提供(i)表达特征被改变的经人工操纵的蛋白。
例如,蛋白修饰可具有一种或多种特征:
在不饱和脂肪酸生物合成相关因子的核酸序列中的PAM序列中或临近所述PAM序列的5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,
由于一个或多个核苷酸的删除或插入而造成表达水平减少或增加;
由于被不同于野生型基因的核苷酸的一个或多个核苷酸置换而造成表达水平减少或增加;
由于一个或多个外源核苷酸的插入而造成表达水平减少或增加、或者融合蛋白表达或特定蛋白独立表达;以及
受上述蛋白的表达特征影响而造成第三蛋白的表达水平减少或增加。
可提供(ii)结构特征被改变的经人工操纵的蛋白。
例如,蛋白修饰可具有一种或多种特征:
在不饱和脂肪酸生物合成相关因子的核酸序列中的PAM序列中或临近所述PAM序列的5’端和/或3’端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,
由于一个或多个核苷酸的删除或插入而造成密码子改变、氨基酸改变和三维结构改变;
由于被不同于野生型基因的核苷酸的一个或多个核苷酸置换而造成密码子改变、氨基酸改变和由此而来的三维结构改变;
由于一个或多个外源核苷酸的插入而造成密码子改变、氨基酸改变和三维结构改变,或者造成与特定蛋白的融合结构或从中分离出特定蛋白的独立结构;以及
受上述结构特征被改变的蛋白影响而造成第三蛋白的密码子改变、氨基酸改变和三维结构改变。
可提供(iii)功能特征被改变的经人工操纵的蛋白。
例如,蛋白修饰可具有一种或多种特征:
在不饱和脂肪酸生物合成相关因子的核酸序列中的PAM序列中或临近所述PAM序列的5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,
由于一个或多个核苷酸的删除或插入而造成的蛋白修饰使得特定功能活化或失活或者引入新的免疫功能;
由于被不同于野生型基因的核苷酸的一个或多个核苷酸置换而造成的蛋白修饰使得特定功能活化或失活或者引入新功能;
由于一个或多个外源核苷酸的插入而造成的蛋白修饰使得特定功能活化或失活或者引入新功能,特别地,可通过特定蛋白的融合表达或独立表达而向现有功能引入第三功能;以及
受上述功能特征被改变的蛋白影响而造成第三蛋白的功能改变。
此外,可包含通过在组成不饱和脂肪酸生物合成相关因子的核酸序列中的一个或多个核苷酸的化学修饰进行人工操纵的蛋白。
例如,可通过甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化而造成蛋白的表达特征、结构特征和功能特征中的一种或多种特征的改变。
例如,可通过核苷酸的化学修饰使第三蛋白与基因的核酸序列结合,从而实现第三结构和功能。
5.其它额外成分
任选地,可添加额外成分来增强引导核酸-编辑蛋白复合体的效率或改善对损伤基因或核酸的修复效率。
任选地,可使用额外成分来改善引导核酸-编辑蛋白复合体的效率。
激活子(Activator)
额外成分可用作激活子来提高引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
术语“激活子”是指作用于使得引导核酸-编辑蛋白复合体与靶核酸、基因或染色体间的结合稳定或者使得引导核酸-编辑蛋白复合体能够更容易地接近靶核酸、基因或染色体的核酸。
激活子可为双链核酸或单链核酸。
激活子可为线性或环状。
激活子可分为使得引导核酸-编辑蛋白复合体与靶核酸、基因或染色体间的结合稳定的“协助部(helper)”以及使得引导核酸-编辑蛋白复合体能够更容易地接近靶核酸、基因或染色体的“护送部(escorter)”。
协助部可提高引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
例如,协助部包含与靶核酸、基因或染色体具有同源性的核酸序列。因此,当引导核酸-编辑蛋白复合体与靶核酸、基因或染色体结合时,协助部包含的同源核酸序列可与靶核酸、基因或染色体形成额外的互补结合,来稳定引导核酸-编辑蛋白复合体与靶核酸、基因或染色体间的结合。
护送部可提高引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
例如,护送部包含与靶核酸、基因或染色体具有同源性的核酸序列。此处,护送部中包含的同源核酸序列可与引导核酸-编辑蛋白复合体的引导核酸形成部分互补结合。因此,与引导核酸-编辑蛋白复合体形成部分互补结合的护送部可与靶核酸、基因或染色体形成部分互补结合,其结果是可允许引导核酸-编辑蛋白复合体精确接近靶核酸、基因或染色体的位置。
同源核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全同源性。
此外,额外成分可任选地用于改善损伤基因或核酸的修复效率。
辅助子(assistor)
额外成分可用作辅助子来改善损伤基因或核酸的修复效率。
术语“辅助子”是指参与损伤基因或核酸(例如由引导核酸-编辑蛋白复合体切割的基因或核酸)的修复过程或提高修复效率的核酸。
辅助子可为双链核酸或单链核酸。
辅助子可以以线性或环状形式存在。
根据修复方法,辅助子可分为参与借助NHEJ的修复过程或改善其修复效率的“NHEJ辅助子”以及参与借助HDR的修复过程或改善其修复效率的“HDR辅助子”。
NHEJ辅助子可参与借助NHEJ对损伤基因或核酸进行修复的过程或改善其修复效率。
例如,NHEJ辅助子可包含与损伤核酸序列的一部分具有同源性的核酸序列。此处,同源核酸序列可包含与损伤核酸序列一端(例如3'端)处的核酸序列具有同源性的核酸序列以及与损伤核酸序列另一端(例如5'端)处的核酸序列具有同源性的核酸序列。此外,可包含与损伤核酸序列上游和下游的碱基序列各自具有同源性的核酸序列。具有此类同源性的核酸序列可帮助损伤核酸序列的两部分被置于紧密靠近的位置,从而使得借助NHEJ对损伤核酸进行修复的效率增加。
HDR辅助子可参与借助HDR对损伤基因或核酸进行修复的过程或改善其修复效率。
例如,HDR辅助子可包含与损伤核酸序列的一部分具有同源性的核酸序列。此处,同源核酸序列可包含与损伤核酸序列一端(例如3'端)处的核酸序列具有同源性的核酸序列以及与损伤核酸序列另一端(例如5'端)处的核酸序列具有同源性的核酸序列。或者,可包含与损伤核酸序列上游和下游的碱基序列各自具有同源性的核酸序列。具有此类同源性的核酸序列可作为损伤核酸序列的模板,使得借助HDR对损伤核酸进行修复的效率增加。
在另一实例中,HDR辅助子可包含与损伤核酸序列的一部分具有同源性的核酸序列以及特定核酸(例如待插入的核酸或基因)。此处,同源核酸序列可包含与损伤核酸序列上游和下游的碱基序列各自具有同源性的核酸序列。特定核酸可位于与损伤核酸下游的碱基序列具有同源性的核酸序列和与损伤核酸上游的碱基序列具有同源性的核酸序列之间。具有此类同源性的核酸序列和特定核酸可作为供体将特定核酸插入至损伤核酸,从而使得HDR的敲入效率增加。
同源核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全同源性。
6.受试者
术语“受试者”是指导入引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;其中运行(operates)引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或获取自所述有机体的试样或样本。
受试者可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的有机体。
有机体可为细胞、组织或植物。
细胞可为真核细胞。
真核细胞可为植物细胞。
组织可为植物的组织,例如叶、茎、根、花、果实或愈伤组织等。
植物可为从种子到成熟体的各个时期的植物。
植物可为包含不饱和脂肪酸的植物体。
此外,受试者可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的试样或样本。
可从植物体获得试样或样本。
在本发明中,作为具体实例,受试者可包含引导核酸-编辑蛋白复合体的靶基因或核酸。
此处,靶基因可为不饱和脂肪酸生物合成相关因子,例如FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因。
靶基因可为野生型或野生型的经修饰的形式。
在本发明的一个示例性实施方式中,受试者可包含通过引导核酸-编辑蛋白复合体进行操纵的基因或核酸。
此处,经操纵的基因可为不饱和脂肪酸生物合成相关因子,例如FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因。
此处,引导核酸可靶向不饱和脂肪酸生物合成相关因子,例如FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因。
引导核酸可以是与FAD2基因、FAD3基因、FAD6基因、FAD7基因和/或FAD8基因的靶序列互补的核酸序列。
引导核酸可靶向一种或多种基因。
引导核酸可同时靶向两种以上基因。此处,两种以上基因可以是同源基因或异源基因。
引导核酸可靶向一种或多种靶序列。
可根据靶序列的数量或位置将引导核酸设计成多种形式。
在本发明的一个示例性实施方式中,引导核酸可以是与表1中列出的序列的一个或多个靶序列互补的核酸序列。
在某个实施方式中,对FAD2基因的人工操纵而言,提供了对应于SEQ ID NO:1-SEQID NO:30的靶序列中的任一者的引导核酸序列。
在某个实施方式中,对FAD2基因的人工操纵而言,提供了编辑蛋白,所述编辑蛋白与对应于SEQ ID NO:1-SEQ ID NO:30(例如SEQ ID NO:7或SEQ ID NO:30)的靶序列中的任一者的引导核酸序列相互作用(例如与所述引导核酸序列形成复合体)。
在某个实施方式中,提供了各个基因的核酸修饰产物及其表达产物,在所述核酸修饰产物中,在SEQ ID NO:1-SEQ ID NO:30(例如SEQ ID NO:7或SEQ ID NO:30)中任一者的靶序列区域处发生人工操纵。
7.递送
可借助多种递送方法以多种形式将引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或导入受试者。
可以以DNA、RNA或混合形式将引导核酸递送入或导入受试者。
可以以编码编辑蛋白的DNA、RNA、DNA/RNA混合物、肽、多肽或者蛋白的形式将编辑蛋白递送入或导入受试者。
可以以编码各成分(即引导核酸或编辑蛋白)的DNA、RNA或其混合物的形式将引导核酸-编辑蛋白复合体递送入或导入受试者。
引导核酸-编辑蛋白复合体可以作为引导核酸(具有DNA、RNA或其混合物的形式)与编辑蛋白(具有肽、多肽或蛋白的形式)的复合体递送入或导入受试者。
此外,可借助多种递送方法以多种形式将能够提高或抑制引导核酸-编辑蛋白复合体的效率的额外成分递送入或导入受试者。
可以以DNA、RNA、DNA/RNA混合物、肽、多肽或者蛋白的形式将额外成分递送入或导入受试者。
i)以DNA、RNA或其混合物的形式递送
可借助本领域已知的方法将编码引导核酸和/或编辑蛋白的DNA、RNA或其混合物的形式递送入或导入受试者。
或者,可借助载体、非载体或其组合将编码引导核酸和/或编辑蛋白的DNA、RNA或其混合物的形式递送入或导入受试者。
载体可为病毒载体或非病毒载体(例如质粒)。
非载体可为裸DNA、DNA复合体或mRNA。
基于载体的导入
可借助载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者。
载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
例如,载体可同时包含分别编码引导核酸和编辑蛋白的核酸序列。
例如,载体可包含编码引导核酸的核酸序列。
作为实例,引导核酸中包含的结构域可全部包含于一个载体中,或可将其分割并随后包含于不同载体中。
例如,载体可包含编码编辑蛋白的核酸序列。
在一个实例中,在编辑蛋白的情况下,编码编辑蛋白的核酸序列可包含于一个载体中,或可将其分割并随后包含于数个载体中。
载体可含有一种或多种调节/控制成分。
此处,调节/控制成分可以包括:启动子、增强子、内含子、多聚腺苷酸信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为受试者特异性启动子。
启动子可为病毒或非病毒启动子。
就启动子而言,可根据控制区(即,编码引导核酸或编辑蛋白的核酸序列)而使用适当的启动子。
例如,可用于引导核酸的启动子可为35S、CaMV35S、H1、EF-1a、tRNA或U6启动子。例如,可用于编辑蛋白的启动子可为35S、CaMV35S、CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
例如,可用于引导核酸和/或编辑蛋白的启动子可为根特异性表达启动子、种子特异性启动子、全身(whole-body)表达诱导型启动子或者叶特异性或其它组织特异性启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
病毒可为花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。
一般说来,病毒可感染宿主(例如细胞),由此将编码病毒遗传信息的核酸导入宿主或将编码遗传信息的核酸插入宿主基因组。可使用具有此类特征的病毒将引导核酸和/或编辑蛋白导入受试者。借助病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中瞬时表达。或者,借助病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中长时间持续表达(例如1、2或3周,1、2、3、6或9个月,1或2年,或永久)。
根据病毒的类型,病毒的包装能力可在至少2kb至50kb间变化。取决于此类包装能力,可设计包含引导核酸或编辑蛋白的病毒载体或者包含引导核酸和编辑蛋白二者的病毒载体。或者,可设计包含引导核酸、编辑蛋白和额外成分的病毒载体。
在一个实例中,可借助重组花叶病毒实施编码引导核酸和/或编辑蛋白的核酸序列的递送或导入。
在另一实例中,可借助重组腺病毒实施编码引导核酸和/或编辑蛋白的核酸序列的递送或导入。
在又一实施方式中,可借助重组AAV实施编码引导核酸和/或编辑蛋白的核酸序列的递送或导入。
在又一实例中,可借助混合病毒(例如本文列出的病毒中的一种以上的混合)实施编码引导核酸和/或编辑蛋白的核酸序列的递送或导入。
此外,可将载体包含在细菌中并导入受试者。
此处,可将载体包含在农杆菌中并导入受试者,但本发明不限于此。
一般而言,利用农杆菌将期望的遗传物质传递至受试者的方法是最广泛使用的,并且在植物的情况下,为了对植物进行基因修饰,可以以被称为质粒的核酸蛋白的形式将农杆菌的DNA插入植物体的染色体。这可用于将遗传物质传递至植物体的细胞中,并且所传递的遗传物质融合在细胞中。上述方法可广泛用于生产经农杆菌基因修饰的作物,除此之外,其还可用作针对遗传转化用于对细胞的反应进行研究的系统。
基于非载体的导入
可使用非载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者。
非载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。
可借助电穿孔、粒子轰击、声致穿孔(sonoporation)、磁性转染、瞬时细胞压缩或挤压(transient cell compression or squeezing)(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所记载的)、脂质介导的转染、树枝状大分子、纳米粒子、磷酸钙、二氧化硅、硅酸盐(Ormosil)或它们的组合将非载体递送入或导入受试者。
作为实例,可通过将细胞与编码引导核酸和/或编辑蛋白的核酸序列在卡盒(cartridge)、腔室(chamber)或比色皿(cuvette)中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。
在另一实例中,可使用纳米粒子实施非载体递送。纳米粒子可为无机纳米粒子(例如磁性纳米粒子、二氧化硅等)或有机纳米粒子(例如聚乙二醇(PEG)包覆的脂质等)。纳米粒子的外表面可缀合有能够进行附着的带正电的聚合物(例如聚乙烯亚胺、聚赖氨酸、聚丝氨酸等)。
在某个实施方式中,可使用脂质壳(lipid shell)实施非载体递送。
在某个实施方式中,可使用外泌体(exosome)实施非载体递送。外泌体是用于传递蛋白和RNA的内源性纳米囊泡,其可将RNA递送至脑和其它靶器官。
在某个实施方式中,可使用脂质体实施非载体递送。脂质体是球形囊泡结构,其由围绕内部水性区室的单个或多个层状脂质双层以及相对不透明的外部亲脂性磷脂双层组成。虽然脂质体可由数种不同类型的脂质制成,但磷脂最常用于生产作为药物运载体的脂质体。
可包含其它添加物。
ii)以肽、多肽或蛋白的形式递送
可借助本领域已知的方法以肽、多肽或蛋白的形式将编辑蛋白递送入或导入受试者。
可借助电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所记载的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将肽、多肽或蛋白形式递送入或导入受试者。
肽、多肽或蛋白可与编码引导核酸的核酸序列一起递送。
在一个实例中,可通过将待导入编辑蛋白的细胞与引导核酸一起(或不与引导核酸一起)在卡盒、腔室或比色皿中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。
iii)以核酸-蛋白混合物的形式递送
可以以引导核酸-编辑蛋白复合体的形式将引导核酸和编辑蛋白递送入或导入受试者。
例如,引导核酸可为DNA、RNA或其混合物。编辑蛋白可为肽、多肽或蛋白。
在一个实例中,可以以包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体(即核糖核蛋白(RNP))的形式将引导核酸和编辑蛋白递送入或导入受试者。
在本发明中,作为用于将引导核酸和/或编辑蛋白递送入受试者的方法的实施方式,下面将对gRNA、CRISPR酶或gRNA-CRISPR酶复合体的递送进行描述。
在本发明的实施方式中,可使用载体将编码gRNA和/或CRISPR酶的核酸序列递送入或导入受试者。
载体可包含编码gRNA和/或CRISPR酶的核酸序列。
例如,载体可同时包含编码gRNA和CRISPR酶的核酸序列。
例如,载体可包含编码gRNA的核酸序列。
在一个实例中,gRNA中包含的结构域可包含于一个载体中,或可将其分割并随后包含于不同载体中。
例如,载体可包含编码CRISPR酶的核酸序列。
在一个实例中,在CRISPR酶的情况下,编码CRISPR酶的核酸序列可包含于一个载体中,或可将其分割并随后包含于若干载体中。
载体可包含一种或多种调节/控制成分。
此处,调节/控制成分可以包括:启动子、增强子、内含子、多聚腺苷酸信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为受试者特异性启动子。
启动子可为病毒或非病毒启动子。
就启动子而言,可根据控制区(即,编码gRNA和/或CRISPR酶的核酸序列)而使用适当的启动子。
例如,可用于gRNA的启动子可为35S、CaMV35S、H1、EF-1a、tRNA或U6启动子。例如,可用于CRISPR酶的启动子可为35S、CaMV35S、CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
例如,可用于gRNA和/或CRISPR酶的启动子可为根特异性表达启动子、种子特异性启动子、全身表达诱导型启动子或者叶特异性或其它组织特异性启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
病毒可为花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。
一般说来,病毒可感染宿主(例如细胞),由此将编码病毒遗传信息的核酸导入宿主或将编码遗传信息的核酸插入宿主基因组。可使用具有此类特征的病毒将gRNA和/或CRISPR酶导入受试者。使用病毒导入的gRNA和/或CRISPR酶可在受试者(例如细胞)中瞬时表达。或者,使用病毒导入的gRNA和/或CRISPR酶可在受试者(例如细胞)中长时间持续表达(例如1、2或3周,1、2、3、6或9个月,1或2年,或永久)。
根据病毒的类型,病毒的包装能力可在至少2kb至50kb间变化。取决于此类包装能力,可设计仅包含gRNA或CRISPR酶的病毒载体或者包含gRNA和CRISPR酶二者的病毒载体。或者,可设计包含gRNA、CRISPR酶和额外成分的病毒载体。
在一个实例中,可借助重组花叶病毒实施编码gRNA和/或CRISPR酶的核酸序列的递送或导入。
在另一实例中,可借助重组腺病毒实施编码gRNA和/或CRISPR酶的核酸序列的递送或导入。
在又一实例中,可借助重组AAV实施编码gRNA和/或CRISPR酶的核酸序列的递送或导入。
在再一实例中,可借助混合病毒(例如本文列出的病毒中的一种以上的混合)实施编码gRNA和/或CRISPR酶的核酸序列的递送或导入。
可将载体包含在细菌中并导入受试者。
此处,可将载体包含在农杆菌中并导入受试者,但本发明不限于此。
作为实例,可将包含编码gRNA和/或CRISPR酶的核酸序列的载体包含在农杆菌中并导入植物体。
在本发明的一个示例性实施方式中,可将gRNA-CRISPR酶复合体递送入或导入受试者。
例如,gRNA可以以DNA、RNA或其混合物的形式存在。CRISPR酶可以以肽、多肽或蛋白的形式存在。
在一个实例中,可以以包含RNA型gRNA和蛋白型CRISPR的gRNA-CRISPR酶复合体(即核糖核蛋白(RNP))的形式将gRNA和CRISPR酶递送入或导入受试者。
可借助电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所记载的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将gRNA-CRISPR酶复合体递送入或导入受试者。
8.转化体(Transformant)
术语“转化体”是指其中导入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;其中表达引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或者获取自所述有机体的试样或样本。
转化体可为其中以DNA、RNA或其混合物的形式导入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体。
例如,转化体可为其中导入了包含编码引导核酸和/或编辑蛋白的核酸序列的载体的有机体。此处,载体可为非病毒载体、病毒载体或重组病毒载体。
在另一实例中,转化体可为其中以非载体形式导入了编码引导核酸和/或编辑蛋白的核酸序列的有机体。此处,非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。
转化体可为其中以肽、多肽或蛋白的形式导入了编辑蛋白、引导核酸-编辑蛋白复合体或引导核酸的有机体。
转化体可为其中以DNA、RNA、肽、多肽、蛋白或它们的混合物的形式导入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体。
例如,转化体可为其中导入了包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体的有机体。
转化体可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的有机体。
有机体可为细胞、组织或植物。
细胞可为原核细胞或真核细胞。
真核细胞可为植物细胞,但本发明不限于此。
组织可为植物体的组织,例如根、茎、叶、花、果实或愈伤组织等。
转化体可为其中导入了或表达引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的植物体,或获取自所述植物体的试样或样本。
试样或样本可为根、茎、叶、花、果实、愈伤组织或它们的细胞。
[用途]
本发明的一个示例性实施方式涉及用于生产如下方面的用途:用于人工操纵受试者(例如植物)的不饱和脂肪酸生物合成相关因子的组合物;其中借助经人工操纵的不饱和脂肪酸生物合成相关因子控制了特定脂肪酸的含量的植物体;或使用所述植物体的加工产品。
特定不饱和脂肪酸
大豆(Glycine max L.)
大豆是世界各地种植最广泛的作物,在生产和使用方面提供最优质的植物油和蛋白质。转化技术被广泛用于改善大豆中多种有效基因的遗传特征。基于子叶节(CN)方法,借助使用农杆菌的转化系统已开发出转基因大豆植物体(Hinchee等,1988,Nat.Biotechnol.,第6卷,915-922);最近,使用半粒外植体改善了用于产生稳定转化体的系统(Paz等,2006,Plant Cell Rep.,第25卷,206-213)。此外,借助硫醇化物的混合使用和农杆菌浓缩物在目标部位施加损伤和超声降解引起转化效率的正向改善(Meurer等,1998,Plant Cell Rep.,第18卷,180-186;Olhoft等,2003,Planta,第216卷,723-735;Kim等,2013,Plant Biotechnol Rep.,第7卷,425?433;Kim等,2016,Plant Biotechnol Rep.,第10卷,257-267)。
大豆总组成中含有约20%的脂肪,并且这些脂肪由脂肪酸组成。脂肪酸由饱和脂肪酸和不饱和脂肪酸组成。不饱和脂肪酸包括油酸、亚油酸和α-亚麻酸。其中,α-亚麻酸为植物omega-3脂肪酸,已知其可抑制癌细胞生长、预防心血管疾病、抑制炎症和血液凝固以及降解脂肪。亚油酸为omega-6脂肪酸,不同于α-亚麻酸,已知其促进癌细胞生长、降低血压、产生炎症和血栓以及积聚脂肪。
据报道,脂肪中低比例的omega-6/omega-3具有抑制上述疾病的作用。在一些实例中,当该比例为4:1时,对心血管疾病的预防可以很优异并且血液循环可得以改善;当该比例为2-3:1时,类风湿性关节炎的炎症可得以抑制;因此,已知最理想的比例为2-1:1。大豆油含有54%的omega-6脂肪酸和8%的omega-3脂肪酸,这两种脂肪酸的比例非常高,为6-7:1。
在大豆的不饱和脂肪酸代谢中,已知FAD2基因作用于将油酸变为亚油酸,而FAD3基因则作用于将亚油酸变为α-亚麻酸。在脂肪酸代谢中,已报道了FAD2基因突变引起的油酸和亚油酸含量变化。当FAD2基因中存在突变时,油酸含量增加,亚油酸含量减少,从而亚油酸与α-亚麻酸的比例得以调整,但在找到4:1以下的满意比例方面仍然是受限的。因此,控制油酸和亚油酸的含量是有必要的。
特定不饱和脂肪酸
本发明的一个示例性实施方式可提供特定不饱和脂肪酸的含量增加的植物体或使用该植物体的加工产品。
此处,特定不饱和脂肪酸可为C8-24:D1不饱和脂肪酸。
特定不饱和脂肪酸可为C16-22:D1不饱和脂肪酸。
特定不饱和脂肪酸可为C18:D1不饱和脂肪酸。
特定不饱和脂肪酸可为油酸。
或者,
特定不饱和脂肪酸可为通过从C8-24:D2不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过从C16-22:D2不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过从C18:D2不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;以及
特定不饱和脂肪酸可为通过从亚油酸中去除一个双键所产生的不饱和脂肪酸。
本发明的另一示例性实施方式涉及特定不饱和脂肪酸的含量减少的植物体或使用该植物体的加工产品。
此处,特定不饱和脂肪酸可为C8-24:D2不饱和脂肪酸。
特定不饱和脂肪酸可为C16-22:D2不饱和脂肪酸。
特定不饱和脂肪酸可为C18:D2不饱和脂肪酸。
特定不饱和脂肪酸可为亚油酸。
或者,
特定不饱和脂肪酸可为通过在C8-24:D1不饱和脂肪酸中形成一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过在C16-22:D1不饱和脂肪酸中形成一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过在C18:D1不饱和脂肪酸中形成一个双键所产生的不饱和脂肪酸;以及
特定不饱和脂肪酸可为通过在油酸中形成一个双键所产生的不饱和脂肪酸。
或者,
特定不饱和脂肪酸可为通过从C8-24:D3不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过从C16-22:D3不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;
特定不饱和脂肪酸可为通过从C18:D3不饱和脂肪酸中去除一个双键所产生的不饱和脂肪酸;以及
特定不饱和脂肪酸可为通过从α-亚麻酸中去除一个双键所产生的不饱和脂肪酸。
在一个实施方式中,特定不饱和脂肪酸可为C18:D1不饱和脂肪酸或C18:D2不饱和脂肪酸。
在一个实施方式中,特定不饱和脂肪酸可为油酸或亚油酸。
在另一示例性实施方式中,本发明可提供额外的第三体内机制(其参与功能被人工修饰的特定因子(例如已知为不饱和脂肪酸生物合成相关因子的基因)的多种功能)的控制系统的用途。
例如,功能被人工修饰的特定因子可为选自于FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因中的一种或多种基因。
该第三机制可以是与上述基因相关的不同于不饱和脂肪酸的生物合成的植物体内的机制。
用于控制不饱和脂肪酸的组合物
本发明的一个示例性实施方式涉及用于使用经人工操纵的不饱和脂肪酸生物合成相关因子来控制植物的不饱和脂肪酸的含量的组合物。
所述组合物可包含经人工操纵的不饱和脂肪酸生物合成相关因子或可人工操纵不饱和脂肪酸生物合成相关因子的操纵组合物。
在一个示例性实施方式中,组合物可包含经人工操纵的不饱和脂肪酸生物合成相关因子(即,基因和/或蛋白)。
在一个示例性实施方式中,组合物可包含可人工操纵不饱和脂肪酸生物合成相关因子的操纵组合物。
操纵组合物可包含引导核酸-编辑蛋白复合体。
操纵组合物可包含引导核酸和/或编辑蛋白。
操纵组合物可包含编码引导核酸和/或编辑蛋白的核酸。
操纵组合物可包含病毒,所述病毒包含编码引导核酸和/或编辑蛋白的核酸。
在另一示例性实施方式中,组合物可进一步包含额外要素。
额外要素可包括用于传递至受试者植物体内的合适的运载体。
在示例性实施方式中,组合物可包含不饱和脂肪酸生物合成相关因子的表达产物,所述不饱和脂肪酸生物合成相关因子的表达产物被操纵至足以增加或减少特定不饱和脂肪酸的含量的量。
“足以增加或减少特定不饱和脂肪酸的含量的量”意味着使特定不饱和脂肪酸的含量增加或减少所需要的有效量。
在一个示例性实施方式中,本发明可提供如下用于控制不饱和脂肪酸的组合物:
用于控制特定不饱和脂肪酸的含量的组合物,所述组合物包含:能够与选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的核酸序列中的一个或多个靶序列各自形成互补结合的引导核酸或编码该引导核酸的核酸序列;以及编辑蛋白或编码该编辑蛋白的核酸序列;
用于控制特定不饱和脂肪酸的含量的组合物,所述组合物包含:能够与选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的靶序列各自形成互补结合的引导核酸或编码该引导核酸的核酸序列;以及编辑蛋白或编码该编辑蛋白的核酸序列;以及
用于控制特定不饱和脂肪酸的含量的组合物,所述组合物包含由引导核酸或编码该引导核酸的核酸序列与编辑蛋白形成的复合体,所述引导核酸能够与选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的靶序列各自形成互补结合。
此处,引导核酸或编码该引导核酸的核酸序列以及编码编辑蛋白的核酸序列可以以一个或多个载体的形式存在。它们可以以同种载体或异种载体的形式存在。
控制不饱和脂肪酸的方法
在本发明的另一示例性实施方式中,本发明提供了控制不饱和脂肪酸的含量的方法,所述方法包括生产上述组合物并将有效量的该组合物给予靶植物体。
基因操纵
可使用通过操纵机体基因来控制不饱和脂肪酸的含量的方法。该控制方法可包括将用于操纵植物体基因的基因操纵组合物导入所述植物体。
基因操纵组合物可包含引导核酸-编辑蛋白复合体。
可将基因操纵组合物注入特定植物类型。
此处,特定植物类型可为种子,但本发明不限于此。
在一方面,本发明可提供修饰植物细胞中的靶多核苷酸的方法。
在一个示例性实施方式中,所述方法包括从植物获得细胞或细胞群作为样品;以及修饰所述细胞或细胞群。可在植物体外的任何步骤实施培养。可将所述细胞或细胞群再次导入植物。
此外,在另一示例性实施方式中,本发明可提供人工操纵细胞的方法,所述方法包括将以下物质导入植物细胞:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸能够与选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的各个靶序列形成互补结合;以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
引导核酸和编辑蛋白可以以核酸序列的形式存在于一个或多个载体,或者存在于引导核酸和编辑蛋白二者组合的复合体中。
导入步骤可参考上述“7.递送”部分的技术。
例如,导入阶段可通过选自于如下方法中的一种或多种方法实现:基因枪、电穿孔、脂质体、质粒、病毒载体、纳米粒子和蛋白质易位结构域(PTD)融合蛋白方法。
例如,病毒载体可为选自于由如下病毒载体所组成的组中的一种或多种:花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
例如,可将载体包含在农杆菌内并进行导入。
当使用根据本发明的部分示例性实施方式的方法和组合物对不饱和脂肪酸生物合成相关因子进行人工操纵时,控制不饱和脂肪酸的类型和/或含量是可能的,例如增加或减少特定不饱和脂肪酸和/或改变特定不饱和脂肪酸的含量,因此,可获得其中对人健康有益的不饱和脂肪酸增加或者对人健康有害的不饱和脂肪酸减少的植物和/或其加工产品(食品等)。
其它用途
在任意示例性实施方式中,本发明可提供包含上述组合物的用于制备用于控制不饱和脂肪酸的含量的组合物的试剂盒。
可借助本领域已知的常规制备方法来制备所述试剂盒。
所述试剂盒可进一步包含可检测标签。术语“可检测标签”是指用于在不含标签的相同类型分子之中特异性检测含有标签的分子的原子或分子。可检测标签可附着至与蛋白特异性结合的抗体或其片段、相互作用蛋白、配体、纳米粒子或适配体。可检测标签可包括放射性核素、荧光团和酶。
在任意示例性实施方式中,本发明可提供筛选能够控制选自于经人工操纵的FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因中的一种或多种基因的表达水平的物质的方法。
在任意示例性实施方式中,本发明可提供如下方法:通过分析选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的序列来向受试者提供关于经人工操纵的靶位置处的序列的信息的方法。
此外,本发明提供了使用所提供的信息构建文库的方法。
此处,可使用已知的数据库。
在具体的示例性实施方式中,本发明可提供可用于使用本发明的方法进行研究的植物或细胞。
使用本发明的方法可生产在与不饱和脂肪酸的生物合成相关的一个或多个核酸序列中包含染色体编辑的植物或细胞。所述核酸序列可为能够编码与不饱和脂肪酸的生物合成相关的蛋白序列的序列或者与不饱和脂肪酸的生物合成相关的参考序列。
在一个示例性实施方式中,使用由本发明的方法制造的植物或细胞,使用在涉及不饱和脂肪酸生物合成的研究中常规使用的测量法,可研究植物或细胞中不饱和脂肪酸生物合成的机制及突变效果。或者,使用所述植物或细胞,可研究活性化合物在不饱和脂肪酸生物合成中的作用。
在另一示例性实施方式中,使用由本发明的方法制造的植物或细胞,可评估可用的基因操纵策略的效果。换言之,通过对编码与不饱和脂肪酸生物合成相关的蛋白的染色体序列进行修饰,可促进或抑制相应不饱和脂肪酸的生物合成。具体而言,该方法包括:通过编辑编码与不饱和脂肪酸生物合成相关的蛋白的染色体序列而形成经修饰的蛋白,产生对植物或细胞的修饰。因此,在部分示例性实施方式中,通过与野生型的不饱和脂肪酸生物合成的机制进行比较,可评估经基因修饰的植物的效果。
通过经人工操纵的不饱和脂肪酸生物合成相关因子以及由此而在功能方面经人工修饰的不饱和脂肪酸控制系统,可将经基因修饰的植物用于生产特定不饱和脂肪酸增加或减少的植物体。通过控制涉及多种不饱和脂肪酸生物合成相关因子的各种机制,可改善不饱和脂肪酸控制系统。
实施例
在下文中,将参考实施例进一步详细地描述本发明。
这些实施例仅为了进一步详细地描述本发明而提供,对本领域普通技术人员显而易见的是,本发明的范围不限于以下实施例。
实验方法
1、gRNA设计
使用CRISPR RGEN工具(Institute for Basic Science,韩国)选择大豆FAD2基因的CRISPR/Cas9靶位点。根据CRISPR酶的种类,各基因的靶位点可以是不同的,对SpCas9而言的基因的靶序列总结在上表1中。
2、用于大豆转化的载体的构建
在大豆转化试验中,使用包含用于靶向FAD2基因的FAD2-7或FAD2-30gRNA的pPZP载体,并且,该载体还包含Cas9。用所构建的pPZP-FAD2-7载体和pPZP-FAD2-30载体(图1)转化根癌农杆菌(Agrobacterium tumefaciens)菌株EHA105。
3、大豆转化体和T1种子的产生
1)种子灭菌和浸泡
用盐酸气(通过混合氯漂白剂(100mL 12%次氯酸钠)和强盐酸(12N HCl,5mL)而生成)将种子灭菌20小时后,在1%次氯酸钠中悬浮培养10分钟来进行二次灭菌,然后用无菌水以10分钟的间隔清洗三次。将各个无菌种子放入50mL锥形管内,随后将无菌水倒入锥形管内,在室温下进行浸泡20小时。
2)接种物(根癌农杆菌)的制备
在大豆转化试验中,使用构建在根癌农杆菌菌株EHA105中的pPZP-FAD2-7载体和pPZP-FAD2-30载体,并包含PPTR。将含有所述载体的细菌菌株划线在固体YEP培养基[75mg/L奇霉素(spectinomycin)、25mg/L利福平、10g/L蛋白胨、5g/L NaCl、5g/L酵母提取物、1.5%(w/v)琼脂(pH 7.0)]上并在28℃下培养,由此获得单菌落;将菌落悬浮在10mL液体YEP培养基(含有与固体YEP培养基相同的抗生素)中,并在28℃下以220rpm振荡至OD650达0.6-0.8。将10mL 30%甘油储液添加至完全生长的细菌细胞并与之混合,将1mL细胞悬液各自分装至1.5mL管,用液氮快速冷冻并保存在-70℃。接种前一天,将保存在-70℃的1mL根癌农杆菌储液添加至200mL液体YEP培养基(含有抗生素)中,并在培养箱中以25℃、250rpm振荡培养至OD650达0.6-0.8。接种当日,将200mL液体YEP培养基分成50mL,以20℃、3,270g离心10分钟。向各个管中的根癌农杆菌团添加15mL液体共培养培养基(CCM;0.32g/L B5盐、1.67mg/L BA、20mM MES、0.25mg/L GA3、0.2mM乙酰丁香酮、3.3mM L-半胱氨酸、1.0mM硫代硫酸钠、1.0mM DTT、3%蔗糖;pH 5.4)。
3)接种和共培养
在通过插入两个子叶之间的手术刀将经浸泡的种子垂直切至下胚轴(hypocotyl)之后,去除种皮。在子叶下方约1cm处切割胚轴,并用手术刀(#11刀片)将附着胚轴的一侧创伤7-8次。此处,用15mL浓缩液涂覆手术刀并在目标位点制造创伤。将约50个外植体(explants)放入15mL共培养/根癌农杆菌并超声处理(sonication)20秒,随后接种30分钟。在将各个外植体从管中取出并放在滤纸上去除水分之后,将滤纸片放在固体CCM(与液体CCM相同,琼脂(0.7%))上,然后将10个外植体放在滤纸上(近轴面朝下)。将板用微孔带(micropore tape)密封,并在25℃下进行18小时光周期共培养,进行5天。
4)洗涤和芽诱导(shoot induction)
共培养5天后,用液体1/2芽诱导培养基(SIM)简单洗涤外植体10分钟以进行灭菌。将外植体放置在滤纸上以除去水分,随后对于每个板将六个外植体包埋在含有不含选择性抗生素的SI-①(芽诱导培养基;3.2g/L B5盐、1.67mg/L BA、3mM MES、0.8%琼脂、3%蔗糖、250mg/L头孢噻肟、50mg/L万古霉素、100mg/L替卡西林;pH 5.6)的板中,并将外植体的再生部分以约30°的角度朝上放置。将每个板用微孔带密封,并在25℃下进行18小时光周期培养。
两周后,将发芽的外植体包埋在含有10mg/L选择性抗生素PPT的SI-②(与SI-①相同,加入10mg/L DL-草铵膦,pH 5.6)中,将除了芽以外的其它部分去除并包埋,使得近轴部分面向下方。
5)芽伸长
两周后,将褐变的芽/嫩芽(shoot pad)用手术刀(#15刀片)切下并包埋在含有5mg/L选择性抗生素PPT的芽伸长培养基(SEM;4.4g/L MS盐、3mM MES、0.5mg/L GA3、50mg/L天冬酰胺、100mg/L焦谷氨酸、0.1mg/L IAA、1mg/L玉米素(zeatin)、3%蔗糖、0.8%琼脂、250mg/L头孢噻肟、50mg/L万古霉素、100mg/L替卡西林、5mg/L DL-草铵膦;pH 5.6)中。每两周,将芽/嫩芽转移至新鲜SEM,使用手术刀(#15刀片)上侧将芽的褐变部分除去并逐渐将嫩芽刮去,使得培养基得以良好吸收。当芽生长至培养皿的盖子时,将两个培养皿(100mm×40mm)叠放以使得芽生长至约8cm。将每个板用微孔带密封,并在25℃下进行18小时光周期培养。
6)生根、驯化(acclimatization)和PPT涂叶(leaf painting)
当经由SEM选择而伸长的芽为4cm以上时,用手术刀(#11刀片)将芽切下并转移至生根培养基(RM;4.4g/L MS盐、3mM MES、3%蔗糖、0.8%琼脂、50mg/L头孢噻肟、50mg/L万古霉素、50mg/L替卡西林、25mg/L天冬酰胺、25mg/L焦谷氨酸;pH 5.6)中。此处,将由切割分离的伸长芽的下部浸入1mg/mL IBA中3分钟,随后放入含有RM的试验管中。
当根充分长成时,用三蒸水将培养基从根上洗掉;将长成的根移植至含有床土(bed soil)(Bio Plug No.2,Heungnong seeding)和蛭石(vermiculite)的混合物(2:1)的小盆(6cm×6cm×5.6cm)中并放置在Magenta盒中。约10天之后,用100mg/L DL-草铵膦对叶表面进行涂叶。
7)T1种子的产生
当植物体充分长成时,将植物体移植至较大的盆,并用具有约10个孔的透明塑料盖将其盖住。10天后,用(BAYER,53mg/L)处理植物体。其结果是,非转化体(Glycinemax L.Kwangan,NT)敏感反应(sensitively reacted)并因而失败;与之相对,转化体没有显示任何变化并表现出抗性。将表现出抗性的9个大豆转化体(8个pPZP-FAD2-7和1个pPZP-FAD2-30)转移至温室,从而获得T1种子。
8)导入T1转化体的基因的去除分析和T2种子的产生
为确认转基因T1植物体的导入基因被去除,播种T1种子,使植物体生长超过小盆15cm以上并具有9片以上叶子,然后用草铵膦进行涂叶。将选定的转基因植物体转移至较大的盆(直径20cm×高度25cm)并使其在温室中生长,从而获得T1样品并采集T2种子。
4、基因传递分析
定量1g瞬时转化体的叶子并用液氮进行冷冻,在研钵中充分研磨经冷冻的叶子,然后用CTAB方法提取基因组DNA。为确定基因是否导入,利用gRNA FAD2-7和FAD2-30、选择性基因Bar以及Cas9基因的序列进行PCR。为确认FAD2-7基因和FAD2-30基因的导入,使用以下引物。
对于FAD2-7基因而言,使用启动子AtU6p正向引物(5'-GAATGATTAGGCATCGAACC-3')和FAD2-7反向引物(5'-AAACTCCTCAAGGGTTCCAAACAC-3')。对于FAD2-30基因而言,使用启动子AtU6p正向引物(5'-GAATGATTAGGCATCGAACC-3')和FAD2-30反向引物(5'-AAACTCCTCAAGGGTTCCAAACACC-3')。为确认Bar基因的导入,使用Bar正向引物(5'-TCCGTACCGAGCCGCAGGAA-3')和Bar反向引物(5'-CCGGCAGGCTGAAGTCCAGC-3')。
此外,为确认Cas9的导入,使用如下三个引物组进行PCR:Cas9-①正向引物(5'-ATGGACAAGAAGTACAGCATCGGC-3')和Cas9-①反向引物(5'-AACTTGTAGAACTCCTCCTGGCTG-3')组;Cas9-②正向引物(5'-TTCAGGAAGTCCAGGATGGTCTTG-3')和Cas9-②反向引物(5'-AGAACTGGAAGTCCTTGCGGAAGT-3')组;以及Cas9-③正向引物(5'-CTGAGCGAGCTGGACAAGGCCGG-3')和Cas9-③反向引物(5'-TTAGGCGTAGTCGGGCACGTCGTA-3')组。
5、基因去除分析
定量1g转基因T1植物体的叶子并用液氮进行冷冻,在研钵中充分研磨经冷冻的叶子。将0.5g经研磨的叶子放入2mL管中,加入1mL溶液(通过以20:1的比例混合十六烷基三甲基铵(cTAB)缓冲液和β-巯基乙醇(2-ME)制备而成)并在65℃加热块中处理1小时,随后加入10μL RNAse(1.5mg/150μL H2O),使其在37℃下孵育1小时。1小时后,添加相同体积的氯仿:异戊醇(24:1)试剂并充分混合,随后以4℃、12000rpm离心10分钟。将上清液转移至新管,并用氯仿:异戊醇(24:1)试剂再处理一次。将上清液放入相同体积的异丙醇中后,颠倒3-4次进行混合,置于-20℃冰箱1小时,以4℃、12000rpm离心10分钟。弃掉上清液后,向其中加入1mL 70%乙醇,将所得溶液再次离心2分钟,由此获得团块。弃掉上清液后,将团块在室温下干燥20分钟,随后溶解在30μL蒸馏水中以提取基因组DNA。将所提取的基因组DNA稀释20倍并将其用作模板。
对选择性抗生素基因BAR和导入基因的碱基序列进行PCR(由如下步骤组成:95℃预变性10min;95℃变性30s、55℃-65℃退火30s、72℃延伸30s-1.5min,进行35个循环;以及额外地72℃延伸10min),使用PCR试剂盒(Prime Taq Premix,GENETBIO,韩国)确定结果。
6、油酸含量分析
对于脂肪酸分析,对从各转化体获得的3粒大豆种子各自进行分析。将每个种子放入纸袋中,用锤子粉碎,用5mL提取溶剂(氯仿:己烷:甲醇,8:5:2)在室温下对脂肪酸进行提取12小时。将150μL提取的脂肪酸转移至小瓶,加入75μL甲基化试剂(0.25M甲醇钠甲醇溶液:石油醚:乙醚,1:5:2),随后加入己烷至达到1mL。注入1μL样品并使用气相色谱仪(GC,Aglient Technologies,USA)进行分析,分析条件在下表2中示出。用每种脂肪酸的面积相对于脂肪酸的总面积来计算脂肪酸比率。
表2用于分析大豆中脂肪酸的GC条件
项目 条件
仪器 Agilent 7890A
0.25μm i.d.×30m DB-FFAP毛细管柱
检测器 火焰离子化检测器
柱箱温度 230℃
注入温度 210℃
检测器温度 250℃
载气 N<sub>2</sub>(1.5mL/min)
注入体积 1μL
7、FAD2基因序列的分析
使用Hipi Plus DNA聚合酶(Elpis-bio)对靶区域进行PCR扩增,以具有200bp-300bp的大小。使用MiSeq系统(Illumina)对由上述方法获得的PCR产物进行测序,随后用CRISPR RGEN工具(www.rgenome.net)的Cas分析器进行分析。
实施例1转化体载体和转化体的产生
为敲除FAD2基因,如表1所示,设计靶向FAD2基因的引导RNA,并将其与Cas9蛋白一起克隆至pPZP载体中,由此构建用于大豆转化的载体(图1)。如图2所示,经过植物的再生过程,总共产生9个转化体(T0)(8个pPZP-FAD2-7和1个pPZP-FAD2-30)(图3)。从转化体T0收集T1种子,由此产生转化体T1(图10)。
实施例2用于确定基因传递至转化体中的PCR分析
从FAD2-7和FAD2-30 T0转化体分离DNA,并根据上述方法进行PCR,确认了所导入的引导RNA FAD2-7和FAD2-30以及选择性基因Bar和Cas9全部导入(图4)。
实施例3转基因大豆中油酸含量的分析
根据上述方法分析FAD2-7和FAD2-30 T1种子的油酸含量。FAD2-7和FAD2-30 T1种子中的油酸含量显著高于野生型种子(例如Glycine max L.Pungsan、Glycine maxL.Kwangan和Glycine max L.Hosim)(图5)。
实施例4转基因大豆中FAD2基因序列的分析
为确认FAD2-7和FAD2-30 T1种子的FAD2基因中是否诱导了突变,根据上述方法对插入缺失频率(图6)和序列(图7)进行分析。确认了FAD2-7 T1种子中诱导了突变。
此外,为确认FAD2基因中是否诱导了突变,通过深度测序对T1转化体进行分析。结果是,确认了在除了FAD-7#1-1及FAD2-30#2-4、#9-1和#3-1以外的其它T1转化体的10号染色体(chr10)和20号染色体(chr20)中FAD2基因的靶位点均诱导了突变,并发生敲除(图8和图9)。
实施例5转基因大豆的导入基因的去除分析
为确认选定的T1转化体的基因去除,针对导入载体的选择性基因BAR和导入基因进行PCR。结果是,确认在1个FAD2-7 T1转化体中导入基因和BAR基因两者均被去除;并且,在15个FAD2-30 T1转化体中,确认了其中的基因部分未被去除的个体(9-1、19-1、21-1、21-5)(图11)。
工业实用性
通过使用经人工操纵的不饱和脂肪酸生物合成相关因子以及由此而经人工修饰的不饱和脂肪酸控制系统,可制造使用对人健康有益的特定脂肪酸的含量增加或者对人健康有害的特定脂肪酸的含量减少的植物体的加工产品,并且因此可用于食品。
<110> TOOLGEN INCORPORATED
<120> 通过FAD2的基因组编辑生产油酸含量增加的植物及其生产方法
<130> OPP16-053
<160> 41
<170> KoPatentIn 3.0
<210> 1
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 1
atagattggc catgcaatga ggg 23
<210> 2
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 2
aatagattgg ccatgcaatg agg 23
<210> 3
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 3
ccttggagaa cccaatagat tgg 23
<210> 4
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 4
tgggtgattg ctcacgagtg tgg 23
<210> 5
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 5
ttttagtccc ttatttctca tgg 23
<210> 6
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 6
aaacacttca tcacggtcaa ggg 23
<210> 7
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 7
gtgtttggaa cccttgagag agg 23
<210> 8
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 8
gtgaatggtg gctttgtgtt tgg 23
<210> 9
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 9
acaaagccac cattcactgt tgg 23
<210> 10
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 10
agttggccaa cagtgaatgg tgg 23
<210> 11
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 11
ttgagttggc caacagtgaa tgg 23
<210> 12
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 12
tgaaaggtca taaacaacat agg 23
<210> 13
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 13
caaacacttc atcacggtca agg 23
<210> 14
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 14
aaccaaaatc caaagttgca tgg 23
<210> 15
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 15
tgggagcata agggtggtag tgg 23
<210> 16
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 16
aatatatggg agcataaggg tgg 23
<210> 17
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 17
gtttggctgc tatgtgttta tgg 23
<210> 18
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 18
tttggctgct atgtgtttat ggg 23
<210> 19
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 19
ttggctgcta tgtgtttatg ggg 23
<210> 20
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 20
gcaactatgg acagagatta tgg 23
<210> 21
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 21
caccatttta caaggcactg tgg 23
<210> 22
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 22
cttcatctgg ctccacatag agg 23
<210> 23
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 23
ctctatgtgg agccagatga agg 23
<210> 24
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 24
ttctcggatg ttccttcatc tgg 23
<210> 25
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 25
agatgaagga acatccgaga agg 23
<210> 26
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 26
gatgaaggaa catccgagaa ggg 23
<210> 27
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 27
catccgagaa gggcgtgtat tgg 23
<210> 28
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 28
gtaccaatac acgcccttct cgg 23
<210> 29
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 29
agaagggcgt gtattggtac agg 23
<210> 30
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<400> 30
ttgggacaaa cacttcatca cgg 23
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 31
gaatgattag gcatcgaacc 20
<210> 32
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 32
aaactcctca agggttccaa acac 24
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 33
aaactcctca agggttccaa acacc 25
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 34
tccgtaccga gccgcaggaa 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 35
ccggcaggct gaagtccagc 20
<210> 36
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 36
atggacaaga agtacagcat cggc 24
<210> 37
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 37
aacttgtaga actcctcctg gctg 24
<210> 38
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 38
ttcaggaagt ccaggatggt cttg 24
<210> 39
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 39
agaactggaa gtccttgcgg aagt 24
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 40
ctgagcgagc tggacaaggc cgg 23
<210> 41
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 41
ttaggcgtag tcgggcacgt cgta 24

Claims (25)

1.通过经人工操纵的不饱和脂肪酸生物合成相关因子使C8-24:D1不饱和脂肪酸的含量增加的植物。
2.如权利要求1所述的植物,
其中,所述C8-24:D1不饱和脂肪酸为C16-22:D1不饱和脂肪酸。
3.如权利要求1所述的植物,
其中,所述C8-24:D1不饱和脂肪酸为C18:D1不饱和脂肪酸。
4.如权利要求1所述的植物,
其中,所述经人工操纵的不饱和脂肪酸生物合成相关因子在核酸序列中包含通过引导核酸-编辑蛋白复合体人工引起的修饰。
5.如权利要求1所述的植物,
其中,所述经人工操纵的不饱和脂肪酸生物合成相关因子为选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种。
6.如权利要求1所述的植物,
其中,所述经人工操纵的不饱和脂肪酸生物合成相关因子为通过引导核酸-编辑蛋白复合体进行人工操纵的不饱和脂肪酸生物合成相关基因;
其中,所述经人工操纵的不饱和脂肪酸生物合成相关因子包含一种或多种核酸修饰,所述核酸修饰为:
在组成所述不饱和脂肪酸生物合成相关因子的核酸序列中的原型间隔区邻近基序(PAM)序列中或在临近所述PAM序列的5'端和/或3'端的连续的1bp-50bp碱基序列区内的以下修饰中的至少一种:一个或多个核苷酸的删除或插入;用不同于野生型基因的一个或多个核苷酸进行的置换;以及一个或多个外源核苷酸的插入;
或者
在组成所述不饱和脂肪酸生物合成相关因子的核酸序列中的一个或多个核苷酸的化学修饰。
7.如权利要求6所述的植物,
其中,所述PAM序列例如为如下序列中的一种或多种(以5'至3'方向来描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;R为A或G;Y为C或T);以及
TTN(N为A、T、C或G)。
8.如权利要求4所述的植物,
其中,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
9.一种引导核酸,所述引导核酸能够与FAD2基因的核酸序列中的SEQ ID NO:1-SEQ IDNO:30的靶序列形成互补结合。
10.如权利要求9所述的引导核酸,
其中,所述引导核酸能够与SEQ ID NO:7或SEQ ID NO:30的靶序列形成互补结合。
11.如权利要求9所述的gRNA分子,
其中,所述引导核酸为18bp-23bp的核苷酸。
12.一种用于基因操纵的组合物,所述组合物包含:
引导核酸或编码该引导核酸的核酸序列,所述引导核酸能够与FAD2基因的核酸序列中的SEQ ID NO:1-SEQ ID NO:30的靶序列形成互补结合;以及
编辑蛋白或编码该编辑蛋白的核酸序列。
13.如权利要求12所述的用于基因操纵的组合物,
其中,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
14.如权利要求12所述的用于基因操纵的组合物,
其中,所述基因操纵包含一种或多种核酸修饰,所述核酸修饰为:
在组成所述FAD2基因的核酸序列中的原型间隔区邻近基序(PAM)序列中或在临近所述PAM序列的5'端和/或3'端的连续的1bp-50bp碱基序列区内的以下修饰中的至少一种:一个或多个核苷酸的删除或插入;用不同于野生型基因的一个或多个核苷酸进行的置换;以及一个或多个外源核苷酸的插入;
或者
在组成所述FAD2基因的核酸序列中的一个或多个核苷酸的化学修饰。
15.如权利要求14所述的用于基因操纵的组合物,
其中,所述PAM序列例如为如下序列中的一种或多种(以5'至3'方向来描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;R为A或G;Y为C或T);以及
TTN(N为A、T、C或G)。
16.如权利要求12所述的用于基因操纵的组合物,
其中,所述用于基因操纵的组合物形成于农杆菌载体系统之中。
17.如权利要求12所述的用于基因操纵的组合物,
其中,所述用于基因操纵的组合物形成于病毒载体系统之中。
18.如权利要求17所述的用于基因操纵的组合物,
其中,所述病毒载体为选自于如下病毒载体中的一种或多种:花叶病毒、逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒和痘病毒。
19.通过经人工操纵的不饱和脂肪酸生物合成相关因子使C8-24:D2不饱和脂肪酸的含量减少的植物。
20.如权利要求19所述的植物,
其中,所述C8-24:D2不饱和脂肪酸为C16-22:D2不饱和脂肪酸。
21.如权利要求19所述的植物,
其中,所述C8-24:D2不饱和脂肪酸为C18:D2不饱和脂肪酸。
22.如权利要求19所述的植物,
其中,所述经人工操纵的不饱和脂肪酸生物合成相关因子在核酸序列中包含通过引导核酸-编辑蛋白复合体人工引起的修饰。
23.使用C8-24:D1不饱和脂肪酸的含量增加或C8-24:D2不饱和脂肪酸的含量减少的植物的加工产品。
24.如权利要求23所述的加工产品,
其中,所述加工产品为能够被人和/或动物摄取的食品。
25.一种用于基因操纵的试剂盒,所述试剂盒包含:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸能够分别与选自于由FAD2基因、FAD3基因、FAD6基因、FAD7基因和FAD8基因所组成的组中的一种或多种基因的靶序列形成互补结合;以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下蛋白所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。
CN201780086719.3A 2016-12-22 2017-09-26 具有经基因修饰的fad2的富含油酸的植物体及其生产方法 Pending CN110325643A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662438018P 2016-12-22 2016-12-22
US62/438,018 2016-12-22
PCT/KR2017/010576 WO2018117377A1 (ko) 2016-12-22 2017-09-26 Fad2 유전자 조작된 올레인산 강화 식물체 및 이의 제조 방법

Publications (1)

Publication Number Publication Date
CN110325643A true CN110325643A (zh) 2019-10-11

Family

ID=62626791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780086719.3A Pending CN110325643A (zh) 2016-12-22 2017-09-26 具有经基因修饰的fad2的富含油酸的植物体及其生产方法

Country Status (7)

Country Link
US (3) US20200208166A1 (zh)
KR (1) KR102117110B1 (zh)
CN (1) CN110325643A (zh)
AU (2) AU2017379402B2 (zh)
BR (1) BR112019012779A2 (zh)
EA (1) EA202091316A1 (zh)
WO (1) WO2018117377A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111073904A (zh) * 2019-12-10 2020-04-28 北大荒垦丰种业股份有限公司 大豆主栽品种的遗传转化、基因编辑及分析方法
CN114107370A (zh) * 2021-12-03 2022-03-01 山东舜丰生物科技有限公司 利用Cas12i在大豆中进行基因编辑的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230026234A (ko) 2021-08-17 2023-02-24 세종대학교산학협력단 고올레인산 함유 종자를 생성하는 식물체 및 이의 제조 방법
KR102588622B1 (ko) 2022-01-19 2023-10-12 세종대학교산학협력단 지방산 함량이 변형된 종자를 생성하는 대두 형질전환체 제조용 재조합 벡터

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008006171A1 (en) * 2006-07-14 2008-01-17 Commonwealth Scientific And Industrial Research Organisation Altering the fatty acid composition of rice
WO2011005998A1 (en) * 2009-07-08 2011-01-13 The Curators Of The University Of Missouri Method to develop high oleic acid soybeans using conventional soybean breeding techniques
WO2014141147A1 (en) * 2013-03-15 2014-09-18 Cellectis Modifying soybean oil composition through targeted knockout of the fad2-1a/1b genes
WO2015026886A1 (en) * 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
US20150067922A1 (en) * 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7566813B2 (en) * 2002-03-21 2009-07-28 Monsanto Technology, L.L.C. Nucleic acid constructs and methods for producing altered seed oil compositions
UA118090C2 (uk) * 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
EP3372679A1 (en) * 2012-10-23 2018-09-12 Toolgen Incorporated Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
KR101601868B1 (ko) * 2013-02-13 2016-03-09 경북대학교 산학협력단 지방산 함량이 조절된 콩 식물체 및 이의 제조방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008006171A1 (en) * 2006-07-14 2008-01-17 Commonwealth Scientific And Industrial Research Organisation Altering the fatty acid composition of rice
WO2011005998A1 (en) * 2009-07-08 2011-01-13 The Curators Of The University Of Missouri Method to develop high oleic acid soybeans using conventional soybean breeding techniques
WO2014141147A1 (en) * 2013-03-15 2014-09-18 Cellectis Modifying soybean oil composition through targeted knockout of the fad2-1a/1b genes
US20150067922A1 (en) * 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
WO2015026886A1 (en) * 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PHAM A.T. ET AL: "A novel FAD2-1 A allele in a soybean plant introduction offers an alternate means to produce soybean seed oil with 85% oleic acid content", 《THEOR APPL GENET》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111073904A (zh) * 2019-12-10 2020-04-28 北大荒垦丰种业股份有限公司 大豆主栽品种的遗传转化、基因编辑及分析方法
CN111073904B (zh) * 2019-12-10 2023-12-22 北大荒垦丰种业股份有限公司 大豆主栽品种的遗传转化、基因编辑及分析方法
CN114107370A (zh) * 2021-12-03 2022-03-01 山东舜丰生物科技有限公司 利用Cas12i在大豆中进行基因编辑的方法

Also Published As

Publication number Publication date
AU2017379402A1 (en) 2019-07-18
WO2018117377A1 (ko) 2018-06-28
US20220228160A1 (en) 2022-07-21
KR102117110B1 (ko) 2020-05-29
BR112019012779A2 (pt) 2020-02-27
AU2017379402B2 (en) 2022-03-10
EA202091316A1 (ru) 2020-08-18
US20200208166A1 (en) 2020-07-02
AU2022204029A1 (en) 2022-06-30
KR20180073430A (ko) 2018-07-02
US20240102035A1 (en) 2024-03-28

Similar Documents

Publication Publication Date Title
AU2019299296B2 (en) Method for site-specific mutagenesis of medicago sativa gene by using CRISPR/Cas9 system
AU2013312352B2 (en) Engineered transgene integration platform (ETIP) for gene targeting and trait stacking
JP3537434B2 (ja) Δ6−デサチュラーゼによるガンマリノレン酸の製造
JP4515904B2 (ja) 真菌からの脂肪酸不飽和化酵素
US20220228160A1 (en) Oleic acid -enriched plant body having genetically modified fad2 and production method thereof
CN1930293B (zh) 具有降低的饱和脂肪酸水平的转基因植物及其制备方法
CN108138156A (zh) 用于无标记基因组修饰的方法和组合物
CN110462043A (zh) 具有修饰的性状的植物
TW200815593A (en) Zinc finger nuclease-mediated homologous recombination
CA2250091A1 (en) Sunflower seeds with enhanced saturated fatty acid contents
JPH01500718A (ja) ブラッシカの種における形質転換及び外来遺伝子の発現
CN106164275A (zh) 蜈蚣草植酸酶核苷酸和氨基酸序列及使用方法
CN110475861A (zh) 固氮酶多肽在植物细胞中的表达
CN109983122A (zh) 植物中的靶向基因组优化
Neelakandan et al. CRISPR/Cas9 based site-specific modification of FAD2 cis-regulatory motifs in peanut (Arachis hypogaea L)
CN112481309B (zh) Ago蛋白的用途及组合物和基因编辑方法
KR20210137928A (ko) CRISPR/Cpf1 시스템을 기반으로 한 유전체 단일 염기 편집 방법 및 이의 용도
CN110747224B (zh) 一种富脂微拟球藻叶绿体转基因系统及其应用
EA046169B1 (ru) Обогащенный олеиновой кислотой растительный организм, имеющий генетически модифицированный fad2, и способ его получения
KR101229887B1 (ko) 베타카로틴 생합성용 폴리뉴클레오티드 및 이를 이용한 형질전환 식물
KR101424123B1 (ko) 캡산틴을 생성하는 형질전환 컬러쌀 및 이의 제조방법
Penewit et al. Recombineering in Staphylococcus aureus
KR20230047550A (ko) GmIPK1 유전자 교정에 의해 피트산 함량이 감소된 콩 식물체의 제조방법 및 상기 방법에 의해 제조된 피트산 함량이 감소된 유전체 교정 콩 식물체
CN116694656A (zh) 烟草NtCrtZ基因及其应用
CN117616125A (zh) 无毒素芦荟及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination