CN117043331A - 诱导型嵌合体 - Google Patents

诱导型嵌合体 Download PDF

Info

Publication number
CN117043331A
CN117043331A CN202280023833.2A CN202280023833A CN117043331A CN 117043331 A CN117043331 A CN 117043331A CN 202280023833 A CN202280023833 A CN 202280023833A CN 117043331 A CN117043331 A CN 117043331A
Authority
CN
China
Prior art keywords
plant
leu
lys
glu
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280023833.2A
Other languages
English (en)
Inventor
E·波蒂里
T·凯利赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Crop Protection AG Switzerland
Original Assignee
Syngenta Crop Protection AG Switzerland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Crop Protection AG Switzerland filed Critical Syngenta Crop Protection AG Switzerland
Publication of CN117043331A publication Critical patent/CN117043331A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/12Leaves
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • C07K14/721Steroid/thyroid hormone superfamily, e.g. GR, EcR, androgen receptor, oestrogen receptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • C12N15/8238Externally regulated expression systems chemically inducible, e.g. tetracycline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Physiology (AREA)
  • Environmental Sciences (AREA)
  • Botany (AREA)
  • General Chemical & Material Sciences (AREA)
  • Endocrinology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Permanent Magnet Type Synchronous Machine (AREA)

Abstract

披露了用于在植物的种子中产生多个独特编辑的系统和方法。在一个实例中,方法包括向植物细胞或植物组织中引入编码DNA修饰酶的核酸、任选地编码至少一种指导RNA(gRNA)的核酸,以及诱导型系统序列,其中该诱导型系统序列在植物所希望的生长阶段被诱导,并且在花原基细胞和花生殖器官中的至少一者中介导该DNA修饰酶的表达或者将该DNA修饰酶易位至细胞核;以及(ii)在该花原基和该花生殖器官中的至少一者中介导多个编辑。该方法还可包括将该植物细胞或植物组织再生为具有多个种子的植物,其中该种子含有多个独特编辑。

Description

诱导型嵌合体
技术领域
本发明的领域涉及植物生物技术,尤其涉及植物中的基因编辑。本发明的领域进一步涉及诱导型基因编辑系统,其目的是通过在植物生命周期所希望的阶段诱导该系统而在后代中获得多个编辑。
序列表
本申请附有一个序列表,该序列表名为INDYMOS_ST25.txt,创建于2022年3月14日,大小为约137千字节。该序列表通过引用以其全文并入本文。该序列表随同此申请经由EFS-Web提交,并且符合37C.F.R.§1.824(a)(2)-(6)和(b)。
背景技术
对用来改善作物的数量和质量的科学方法的开发是一项至关重要的工作。基因编辑(例如,通过靶向诱变、插入事件、等位基因取代等)是一种非常重要的技术,广泛用于改善各种作物的数量和质量两者。目前有许多种编辑特异性基因靶的方法,这些方法包括成簇规律间隔短回文重复(CRISPR)和CRISPR相关序列(Cas)酶、转录激活因子样效应物核酸酶(TALEN)、兆核酸酶和锌指。但是基因编辑并不总是一件容易的事。
通过基因组编辑可以相对容易地完成关闭基因功能的编辑(通常称为“敲除”)。通过使用定点核酸酶(例如Cas9或Cas12a)和相关的CRISPR指导RNA(gRNA),可以容易地在靶基因的编码序列中产生小的插入或缺失(“indel”),这常常会导致截短蛋白质或产生异常序列的移码。与这些熟知的基因敲除方法相比,实现其他类型的编辑(例如诱导部分丧失功能或获得功能的等位基因的编辑,或改变基因的表达水平或蛋白质产物的功能的编辑)可能需要大量劳动力。这些编辑中的许多需要等位基因取代,而等位基因取代是非常低效的。同样地,进行缺失整个外显子或基因或染色体区域(大缺失)的编辑可能是具有挑战性的,因为这些编辑可能需要同时对多于一个gRNA靶位点进行切割。类似地,引入SNP的编辑-例如,将胞嘧啶核苷酸改变为胸腺嘧啶核苷酸,可以利用碱基编辑技术,但是只能在与靶位点相关的某些窗口中进行。这些只是一些实例,说明由于所使用的DNA修饰酶系统缺乏完全的特异性或缺乏效率,获得所希望的编辑结果是具有挑战性的。
等位基因取代(有时也称为“等位基因交换(allele swapping)”)是一种利用同源重组或同源定向修复的编辑方法,用来将植物细胞中的内源序列替代为可提供的新序列。虽然在酵母和许多动物系统中这是相当容易做到的,但在植物中却是非常具有挑战性的,因为非同源末端连接途径在植物的DNA修复中占据主导。此外,此过程需要递送丰富的供体DNA至切割位点以作为经由同源重组的DNA修复模板。此递送并不容易完成,在植物中尤其如此。出于此原因,植物中的等位基因取代典型地是非常昂贵的且需要大量劳动力。例如,如果希望转化植物并进行等位基因取代,可能需要生成一千个稳定转化的事件,才能确保在这些事件中的一个或两个中产生一个等位基因交换。效率通常小于1%,在一些情况下,效率在0%和0.3%之间。甚至在最好的作物、品系和构建体设计中,效率仍然是非常低的。
本申请人认为,产生等位基因取代、大缺失、某些碱基编辑和各种其他编辑结果的成本和劳动强度已经成为了植物育种的主要瓶颈。很少有方法可以缓解该过程的极低效率问题。因此,本披露涉及这些问题中的至少一个或另外的问题。
除了等位基因取代之外,基因组编辑的另一个主要挑战是制备广泛多样的序列(基因座的等位基因多样性)所需的时间和劳动。例如,通过修饰基因的调控区(启动子)来产生基因编码序列的多样性等位基因阵列或产生表达多样性是非常耗时和昂贵的。在许多实施例中,本披露还涉及成本效益好的用于产生等位基因系列的方法。基于下文的详细说明,这些益处和其他益处将是显而易见的。
发明内容
本发明的目的是解决在植物中有效获得可遗传编辑的挑战。为了应对该挑战,一个实施例提供了用于在植物的后代中产生多个独特编辑的方法,该方法包括:(a)向植物细胞或植物组织中引入表达盒,其中该表达盒包含(i.)编码DNA修饰酶的核酸;(ii.)编码至少一种指导RNA的任选的核酸;以及(iii.)与该编码DNA修饰酶的核酸可操作连接的诱导因子;(b.)在所希望的植物发育阶段诱导该诱导因子;以及(c.)将该植物细胞或植物组织生成为具有后代的植物,其中该后代共同包含多个独特编辑。
在一个实施例中,诱导因子是转录效应子或易位效应子;该诱导因子由化学品诱导,其中该化学品选自抗生素、金属、类固醇、杀昆虫剂、激素、醇和醛;该抗生素是四环素或其化学模拟物;该金属是铜或含铜化合物;该类固醇是选自由以下组成的组的糖皮质激素:地塞米松、倍氯米松、倍他米松、布地奈德、可的松、氢化可的松、甲泼尼龙、泼尼松龙、泼尼松、曲安奈德、及其任何化学模拟物;该糖皮质激素是地塞米松;该杀昆虫剂选自由以下组成的组:虫酰肼、甲氧虫酰肼、及其任何化学模拟物;该激素选自由以下组成的组:雌性激素、雌激素、17-β-雌二醇、及其任何化学模拟物;该醇选自由以下组成的组:乙醇及其任何化学模拟物;该醛选自由以下组成的组:乙醛及其任何化学模拟物。
在另一个实施例中,转录效应子选自由以下组成的组:醇依赖性效应子、乳糖依赖性效应子、半乳糖依赖性效应子和lexA依赖性效应子;该醇依赖性效应子是alc效应子。在一方面,alc效应子是包含alcA启动子的构巢曲霉alc效应子。
在另一个实施例中,方法进一步包括另外的表达盒,该另外的表达盒包含编码alcR转录因子激活基因的核苷酸序列;从而形成alcA/alcR诱导型系统。在一方面,方法包括在所希望的植物发育阶段施用醇。
在另一个实施例中,乳糖依赖性效应子是pOp效应子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码LhG4转录因子激活基因的核苷酸序列;从而形成LhG4/pOp诱导型系统。
在另一个实施例中,半乳糖依赖性调节子是Gal4 UAS效应子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码Gal4转录因子激活基因的核苷酸序列;从而形成GVG诱导型系统或VGE诱导型系统。
在另一个实施例中,LexA依赖性效应子是至少一种lexA操纵子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码LexA:VP16:ER激活子的核苷酸序列;从而形成XVE诱导型系统。
在一个实施例中,DNA修饰酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、嵌合FEN1-FokI、Mega-TAL和CRISPR核酸酶。在一方面,CRISPR核酸酶是Cas核酸酶、Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶、与脱氨酶结构域融合的Cas12a、Cas12i核酸酶、Cas12j核酸酶、CasX核酸酶、CasY核酸酶、Cas13核酸酶、Cas14核酸酶。
在另一个实施例中,易位因子是糖皮质激素受体。在一方面,糖皮质激素受体包含SEQ ID NO:6。在另一方面,糖皮质激素受体与CRISPR核酸酶可操作地连接。在另一个实施例中,糖皮质激素受体连接的CRISPR核酸酶是经修饰以包含糖皮质激素受体结合结构域(“GR-Cas12a”)的修饰的Cas12a核酸酶。在一方面,GR-Cas12a包含SEQ ID NO:7。在另一个实施例中,方法进一步包括:在施用地塞米松之后,GR-Cas12a从植物细胞或植物组织的细胞质易位至细胞核。
在方法的另一个实施例中,独特编辑是插入缺失突变、核苷酸置换、等位基因取代、染色体易位或供体核酸的插入。
在方法的另一个实施例中,植物细胞或植物组织是双子叶植物细胞或植物组织。在一方面,双子叶植物细胞或植物组织选自由以下组成的组:拟南芥属、向日葵、大豆、番茄、芸苔属物种、杨属(白杨)、桉树、烟草、大麻、马铃薯、棉花、玉米、稻、小麦、大麦、甘蔗、短绒野大豆和其他野生大豆属物种。
在方法的另一个实施例中,植物细胞或植物组织是单子叶植物细胞或植物组织。在一方面,单子叶植物细胞或植物组织选自由以下组成的组:玉米、小麦、稻、墨西哥类蜀黍、高粱和大麦。在一方面,单子叶植物细胞或植物组织是玉米。
在一个实施例中,植物细胞或植物组织是玉米,并且其中所希望的发育阶段选自由以下组成的组:VE、V1、V2、V(n)、VT、R1、R2、R3、R4、R5和R6阶段;其中(n)是代表存在的叶环数的整数。
在另一个实施例中,植物细胞或植物组织是大豆,并且其中所希望的发育阶段选自由以下组成的组:VE、VC、V1、V2、V(n)、R1、R2、R3、R4、R5、R6、R7和R8阶段;其中(n)是代表存在的三小叶数的整数。
在另一个实施例中,方法进一步包括(d.)使共同包含多个独特编辑的后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;(e.)测量步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物中的至少一种表型;以及(f.)任选地基于该至少一种表型的测量选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
在又一个实施例中,方法进一步包括(d.)使共同包含多个独特编辑的后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;(e.)对步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物进行基因分型;以及(f.)任选地基于步骤b的基因型选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
本发明的另一个实施例是通过以上列举的方法产生的编辑的植物。
本发明的另一个实施例是诱导型基因编辑系统,其包含表达盒,该表达盒包含(a.)编码DNA修饰酶的核酸;(b.)编码至少一种指导RNA的任选的核酸;以及(c.)与该编码DNA修饰酶的核酸可操作连接的诱导因子。在一个实施例中,系统进一步包含具有表达盒的细胞。在一方面,细胞是真核细胞。在另一方面,真核细胞是植物细胞。
对序列表中的序列的简述
SEQ ID NO:1是载体24902。其包含组成型表达的GVG蛋白的核苷酸序列。还参见图2。
SEQ ID NO:2是载体25657。其包含稻密码子优化的GR-LbCas12的核苷酸序列,该核苷酸序列缺乏核定位信号(“NLS”)并在N末端具有由长接头隔开的糖皮质激素受体(“GR”)结合结构域。产生的嵌合GR-Cas12是组成型表达的,但定位于细胞质。当存在DEX时,GR-Cas12a易位至细胞核。还参见图3。
SEQ ID NO:3是载体25765。其包含AlcA/AlcR乙醇依赖性诱导型系统的核苷酸序列。还参见图4。
SEQ ID NO:4是载体25881。其包含AlcA/AlcR乙醇依赖性诱导型系统的核苷酸序列,以在乙醇和/或乙醛的存在下诱导Cas12a的表达。还参见图5。
SEQ ID NO:5是GVG蛋白的氨基酸。
SEQ ID NO:6是糖皮质激素受体的氨基酸序列。
SEQ ID NO:7是具有融合糖皮质激素受体的Cas12a蛋白的氨基酸序列。
SEQ ID NO:8是614个碱基对的gl1片段扩增子。
SEQ ID NO:9是用于产生gl1扩增子的引物GL1_F。
SEQ ID NO:10是用于产生g1l扩增子的引物GL1_R。
SEQ ID NO:11是实例gl1共有序列。
SEQ ID NO:12是gl1序列的编辑。
SEQ ID NO:13是gl1序列的编辑。
SEQ ID NO:14是gl1序列的编辑。
SEQ ID NO:15是gl1序列的编辑。
SEQ ID NO:16是gl1序列的编辑。
SEQ ID NO:17是gl1序列的编辑。
SEQ ID NO:18是gl1序列的编辑。
SEQ ID NO:19是gl1序列的编辑。
SEQ ID NO:20是gl1序列的编辑。
SEQ ID NO:21是gl1序列的编辑。
SEQ ID NO:22是gl1序列的编辑。
SEQ ID NO:23是gl1序列的编辑。
SEQ ID NO:24是gl1序列的编辑。
SEQ ID NO:25是gl1序列的编辑。
SEQ ID NO:26是gl1序列的编辑。
SEQ ID NO:27是gl1序列的编辑。
SEQ ID NO:28是gl1序列的编辑。
SEQ ID NO:29是gl1序列的编辑。
SEQ ID NO:30是gl1序列的编辑。
SEQ ID NO:31是gl1序列的编辑。
SEQ ID NO:32是gl1序列的编辑。
SEQ ID NO:33是gl1序列的编辑。
SEQ ID NO:34是gl1序列的编辑。
SEQ ID NO:35是gl1序列的编辑。
SEQ ID NO:36是gl1序列的编辑。
SEQ ID NO:37是gl1序列的编辑。
SEQ ID NO:38是gl1序列的编辑。
SEQ ID NO:39是gl1序列的编辑。
SEQ ID NO:40是gl1序列的编辑。
SEQ ID NO:41是gl1序列的编辑。
SEQ ID NO:42是gl1序列的编辑。
SEQ ID NO:43是gl1序列的编辑。
SEQ ID NO:44是gl1序列的编辑。
SEQ ID NO:45是gl1序列的编辑。
SEQ ID NO:46是gl1序列的编辑。
SEQ ID NO:47是gl1序列的编辑。
SEQ ID NO:48是gl1序列的编辑。
SEQ ID NO:49是gl1序列的编辑。
SEQ ID NO:50是gl1序列的编辑。
SEQ ID NO:51是gl1序列的编辑。
SEQ ID NO:52是gl1序列的编辑。
SEQ ID NO:53是gl1序列的编辑。
SEQ ID NO:54是gl1序列的编辑。
SEQ ID NO:55是gl1序列的编辑。
SEQ ID NO:56是gl1序列的编辑。
SEQ ID NO:57是gl1序列的编辑。
SEQ ID NO:58是gl1序列的编辑。
SEQ ID NO:59是gl1序列的编辑。
SEQ ID NO:60是gl1序列的编辑。
SEQ ID NO:61是gl1序列的编辑。
SEQ ID NO:62是gl1序列的编辑。
SEQ ID NO:63是gl1序列的编辑。
SEQ ID NO:64是gl1序列的编辑。
SEQ ID NO:65是gl1序列的编辑。
SEQ ID NO:66是gl1序列的编辑。
SEQ ID NO:67是gl1序列的编辑。
SEQ ID NO:68是gl1序列的编辑。
SEQ ID NO:69是载体27057。其包含LbCas12a的地塞米松诱导型表达的核苷酸序列。cGal4VP16GR是组成型表达的,并且在DEX的存在下定位于细胞核、与GAL4 UAS启动子结合、并驱动LbCas12a的转录。指导RNA靶向无毛1(GL1)基因的第二外显子进行表型筛选。构建体含有用于选择拟南芥转化体的卡那霉素抗性盒。使用锤头型核酶设计,由大豆S-腺苷甲硫氨酸合成酶(SAMS)启动子表达指导RNA。还参见图7。
附图说明
图1是作为Cas12a表达的函数的gl1诱变的图示。
图2是载体24902的质粒图谱。
图3是载体25657的质粒图谱。
图4是载体25765的质粒图谱。
图5是载体25881的质粒图谱。
图6是拟南芥中野生型和gl1突变体的外观照片。
图7是载体27057的质粒图谱。
定义
虽然认为以下术语可以被本领域普通技术人员很好地理解,还是对以下定义进行了陈述,以便于解释本申请披露的主题。
除非下文中另有定义,否则本文所用的所有技术和科学术语旨在具有与本领域普通技术人员通常所理解的相同的含义。对本文采用的技术的提及旨在是指本领域中通常所理解的技术,包括对本领域普通技术人员而言很清楚的那些技术的变型和/或等效技术的替代物。虽然认为以下术语可以被本领域普通技术人员很好地理解,还是对以下定义进行了陈述,以便于解释本申请披露的主题。
如本文所用,“CRISPR酶”意指从细菌CRISPR系统分离的任何I型、II型、IV型或V型酶或其任何人工的、合成的或以其他方式改变的同源物。特别地,该定义涵盖Cas9、Cas12a(也称为Cpf1)、Cas12i、Cas12j、Cms1、MAD7、Cas13、Cas14等及其突变体。参见美国专利号10,227,611;美国专利号10,000,772;美国专利号9,790,490;美国专利号9,896,696;美国专利号9,982,279;WO 2014/093595;WO 2017/184768;WO 2018/195545;所有都以其全文通过引用并入本文。此外,这些酶的修饰也在该定义的范围内,例如,包含脱氨酶结构域或核酸外切酶结构域、转座酶结构域、逆转录酶结构域等的融合酶,例如Cas9-BE(Cas9和碱基编辑器结构域(例如APOBEC)的融合体;参见)、Cas12a-BE(Cas12a和碱基编辑器结构域(例如APOBEC)的融合体,并且进一步任选地包含尿嘧啶DNA糖基化酶)、或者Cas9-RT(与逆转录酶结构域融合的Cas酶;参见WO 2020/191233,其通过引用以其全文并入本文)。同样,这些酶的无核酸酶活性(“dCas”)或切口酶(“nCas”)版本也在该定义的范围内。“CRISPR酶”和“CRISPR核酸酶”在全文中可互换使用。
如本文所用,“诱导型嵌合体”是指使用诱导型系统在后代植物中获得编辑的嵌合体。适用的诱导型系统包括但不限于AlcA/AlcR诱导型系统、LhG4/pOp诱导型系统、GVG诱导型系统和VGE诱导型系统。诱导型系统在功能上、可操作上或物理上与CRISPR酶相连。在诱导型系统诱导后,CRISPR酶被表达或可替代地易位至细胞核。为了在植物中获得嵌合体,重要的是诱导与目的植物组织的发育同时发生。如果在叶的发育中需要嵌合体,则诱导将大约在叶细胞开始发育和/或分化时发生。如果在植物的后代中需要嵌合体,则诱导大约在花原基细胞开始发育时发生。
如本文所用,“化学模拟物”意指具有与另一种化学品相似的结构和/或作用的化学品。例如,地塞米松的化学模拟物可以具有与地塞米松相似的结构,或者可以是地塞米松的修饰版本。在任一情况下,地塞米松的化学模拟物将能够在DEX诱导型系统中执行与地塞米松相似的功能。此外,乙醛的化学模拟物可以具有与乙醛相似的结构,或者可以是乙醛的修饰版本。在任一情况下,乙醛的化学模拟物将能够在AlcA/AlcR诱导型系统中执行与乙醛相似的功能。同样,乙醇的化学模拟物可以代谢为乙醛,类似于乙醇代谢为乙醛,以便在AlcA/AlcR诱导型系统中发挥作用。
如本文所用,“基因分型”是指分析生物体或细胞遗传密码的任何分析方法。基因分型的方法包括桑格测序、下一代测序(“NGS”)、聚合酶链式反应(“PCR”)和TaqMan分析等。基因分型可包括靶区域的PCR扩增,随后是桑格测序和使用ICE分析的色谱解卷积(参见ice.synthego.com)。基因分型方法可以是手动或自动的。基因分型包括全基因组测序、SNP检测、单体型分析、接合性分析和偶然存在分析。
如本文所用,“易位效应子”是指细胞内运动所依赖的分子(蛋白质分子或其他分子)。例如但不限于,当与异源蛋白融合时,糖皮质激素受体作为易位效应子起作用。
根据长期存在的专利法公约,在本申请(包括权利要求)中使用的术语“一个/一种(a/an)”和“该/所述(the)”是指“一个/种或多个/种”。例如,短语“一个/种细胞”是指一个/种或多个/种细胞,并且在一些实施例中可以是指组织和/或器官。类似地,短语“至少一个/种”当在本文中用于指代实体时,是指例如,1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100个或更多个该实体,包括但不限于1与100之间的所有整数值以及大于100的整数。
如本文所用,词语“和/或”是指并且涵盖相关列出项中一个或多个的任何和全部可能组合,以及当以替代性方式(“或”)解释时缺少组合的情况,并且是指单独或组合存在的实体。因此,例如,短语“A、B、C和/或D”包括单独地A、B、C和D,但也包括A、B、C和D的任何和所有组合和子组合(例如,AB、AC、AD、BC、BD、CD、ABC、ABD和BCD)。在一些实施例中,“和/或”所指的一个或多个元件也可以单独存在于一个或多个组合和/或一个或多个子组合中的单次或多次出现中。
除非另外指示,本说明书和权利要求中使用的表示成分的量、反应条件等的所有数字应被理解为在所有情况下用术语“约”来修饰。如本文所用的术语“约”,当指代可测量的值例如质量、重量、时间、体积、浓度或百分比的量时,意味着涵盖在一些实施例中与规定量相比±20%的变化、在一些实施例中与规定量相比±10%的变化、在一些实施例中与规定量相比±5%的变化、在一些实施例中与规定量相比±1%的变化、在一些实施例中与规定量相比±0.5%的变化、以及在一些实施例中与规定量相比±0.1%的变化,因为此类变化适合于进行所披露的方法和/或使用所披露的组合物、核酸、多肽等。因此,除非相反地指示,在本说明书和所附权利要求中所陈述的数值参数是可以取决于试图通过本申请披露的主题获得的所希望的特性而变化的近似值。当术语“约”用于本披露的上下文中(例如与温度或分子量值组合)时,确切值(即,无“约”)可以是优选的。
如本文所用,术语“等位基因”是指遗传基因座处的变体或替代序列形式。在二倍体中,在每一个基因座处的单个等位基因由后代个体分别从每一个亲本处遗传。虽然本领域普通技术人员理解在任何特定个体中的等位基因不必代表存在于该物种中的所有等位基因,但是存在于二倍体生物体中的给定基因座的两个等位基因占据一对同源染色体上相对应的位置。
单位、前缀以及符号可以其SI公认的形式来表示。除非另外指示,否则核酸以5′至3′方向从左到右书写;氨基酸序列分别以N末端至C末端方向从左到右书写。氨基酸在本文中可由其通常已知的三字母符号或由IUPAC-IUB生物化学命名委员会推荐的单字母符号来提及。同样地,核苷酸可由其普遍接受的单字母代码来提及。
如本文所用,短语“与……相关联”是指两个实体之间的可识别和/或可测定的关系。例如,短语“与HI相关联”是指性状、基因座、基因、等位基因、标志、表型等或其表达,它们的存在或不存在可以影响植物或其后代表现HI或单倍体诱导的范围和/或程度。因此,当标志与性状连锁并且当标志的存在指示了所希望的性状或性状形式是否会和/或会以什么程度发生在包含标志的植物/种质中时,该标志与该性状“相关联”。类似地,当标志与等位基因连锁并且当标志的存在指示了等位基因是否存在于包含标志的植物/种质中时,该标志与该等位基因“相关联”。例如,“与HI相关联的标志”是指其存在或不存在可以用于预测植物是否会和/或会以什么程度展现单倍体诱导的标志。
“与……相关联/可操作地连接”还可以指物理上或功能上相关的两种核酸。例如,启动子或调控DNA序列被说成“与”对RNA或蛋白质进行编码的DNA序列“相关联”,条件是将这两条序列可操作地连接,或设定为使该调控DNA序列将影响编码或结构DNA序列的表达水平。
“编码序列”是核酸序列,其转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA),然后优选在生物体中翻译以产生蛋白质。
如本文所用,“密码子优化的”序列意指如下核苷酸序列,其中密码子被选择以反映宿主细胞或生物体可以具有的特定密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组DNA构建体的DNA序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物细胞、植物细胞、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,将其通过引用并入本文。在实施例中,本披露的多核苷酸被密码子优化用于在植物细胞(例如,双子叶植物细胞或单子叶植物细胞)或细菌细胞中表达。
术语“包含”(comprising)与“包括”(including)、“含有”(containing)和“特征在于”(characterized by)是同义的,是包含性的或开放式的,并且不排除另外的未列举的元件和/或方法步骤。“包含”是意指所指定的元件和/或步骤存在,但是其他元件和/或步骤可以添加进来并且仍然落入相关主题的范围内的术语。
如本文所用,短语“由……组成”排除未具体列举的任何元件、步骤或成分。当短语“由……组成”出现在权利要求主体的子句中,而不是直接地接在前序部分后面时,它只限制该子句中所阐述的元件;其他元件并不整体排除在该权利要求之外。
如本文所用,短语“基本上由……组成”(以及语法变体)限制相关的披露或权利要求的范围至规定的材料和/或步骤,加上并不实质上影响所披露的和/或所要求保护的主题的一个或多个基本和新颖特征的那些。术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(having)”以及其词形变化意指“包括但不限于”。这些术语指示所说明的特征、整数、步骤、操作、要素、或组分的存在但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。术语“由其组成”意指“包括并且限于”。
关于术语“包含”、“基本上由……组成”和“由……组成”,在本文中使用这三个术语之一的情况下,本申请披露和要求保护的主题可以在一些实施例中包括使用其他两个术语中的任一个。例如,如果主题在一些实施例中涉及编码包含与SEQ ID NO:至少95%相同的氨基酸序列的多肽的核酸。应当理解的是,所披露的主题因此还涵盖编码在一些实施例中基本上由与SEQ ID NO:至少95%相同的氨基酸序列组成的多肽的核酸以及编码在一些实施例中由与SEQ ID NO:至少95%相同的氨基酸序列组成的多肽的核酸。类似地,还应当理解的是,在一些实施例中,用于所披露的主题的方法包括本文所披露的步骤,在一些实施例中,用于本申请披露的主题的方法基本上由披露的步骤组成,并且在一些实施例中,用于本申请披露的主题的方法由本文所披露的步骤组成。
在本披露的上下文中,“对应于(corresponding to或corresponds to)”意指当将参考序列的氨基酸序列与不同于参考序列的第二氨基酸序列(例如,变体序列或同源序列)比对时,“对应于”该第二氨基酸序列中某些枚举的位置的氨基酸是与参考氨基酸序列中的这些位置比对的那些,但是不一定在相对于本披露的特定参考氨基酸序列而言的这些精确的数字位置中。
如本文所用,术语“事件”是指制备以具有在自然界中通常不会发现的非天然DNA的遗传工程化的生物体或细胞,例如,遗传工程化的植物或种子。事件可包括将转基因插入至生物体的DNA中的转基因事件。事件还可包括将具体转基因插入至染色体上的特定位置。事件还可包括插入缺失和点突变的任何组合。
如本文所用,术语“基因”是指包括DNA序列的遗传单位,该遗传单位占据染色体上的特定位置并且含有生物体中的具体特征或性状的遗传指令。
“遗传图谱”是对给定物种内的一个或多个染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格形式描绘。
如本文所用,“基因调控网络”(或“GRN”)是分子调控物(molecular regulator)的集合,它们与彼此以及细胞中的其他物质相互作用,以控制mRNA和蛋白质的基因表达水平。该调控物可以是DNA、RNA、蛋白质以及这些的复合物。GRN还可包括如本文所用的“基因家族”。“基因家族”是指一组若干个相似的基因,它们通常具有相似的生物化学功能。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。
如本文所用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列的表达的核酸序列,包含可操作地连接至目的核苷酸序列的启动子,该目的核苷酸序列可操作地连接至终止信号。它还典型地包含核苷酸序列的适当翻译所需的序列。包含目的核苷酸序列的表达盒可能具有其组分中的至少一种,该组分相对于它的其他组分中的至少一种而言是异源的。表达盒还可以是天然存在的但已经以用于异源表达的重组形式获得的表达盒。然而,典型地,表达盒相对于宿主而言是异源的,即表达盒的特定核酸序列不是天然存在于宿主细胞中的,并且必须已经通过转化事件引入到宿主细胞或宿主细胞的祖先中。核苷酸序列在表达盒中的表达可以在组成型启动子或诱导型启动子的控制下,该启动子只在宿主细胞暴露于一些特定的外界刺激时才启动转录。在多细胞生物体(如植物)的情况下,启动子对于特定组织、或器官、或者发育阶段也可以是特异的。
包含目的核苷酸序列的表达盒可以是嵌合的,这意味着它的组分中的至少一种相对于它的其他组分中的至少一种而言是异源的。表达盒也可以是包含驱动其天然基因的天然启动子的表达盒;然而,它已经以可用于异源表达的重组形式获得。表达盒的这种用途使它在其被引入的细胞中不是如此天然存在的。
表达盒还可以任选地包括在植物中发挥作用的转录和/或翻译终止区(即,终止区)。多种转录终止子是可供用于在表达盒中使用的并且负责在超出目的异源核苷酸序列时的转录终止以及正确的mRNA多腺苷酸化。终止区对于转录起始区可以是天然的,对于可操作地连接的目的核苷酸序列可以是天然的,对于植物宿主可以是天然的,或者可以是衍生自另一种来源(即,对于启动子、目的核苷酸序列、植物宿主、或其任何组合而言是外来的或异源的)。适当的转录终止子包括但不限于CAMV 35S终止子、tml终止子、胭脂碱合酶终止子和/或豌豆rbcs E9终止子。这些终止子可以在单子叶植物和双子叶植物两者中使用。此外,可以使用编码序列的天然转录终止子。任何已知在植物中发挥作用的可供使用的终止子均可以在本披露的上下文中使用。
当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或含有其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物体来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包括植物基因多核苷酸,该植物基因多核苷酸包括植物基因的cDNA形式;cDNA可以以正义方向(以产生mRNA)或反义方向(以产生与mRNA转录物互补的反义RNA转录物)被表达。在本披露的一个方面,异源基因与内源植物基因的区别在于,异源基因多核苷酸典型地与包含调控元件如启动子的多核苷酸接合,未发现这些多核苷酸与异源基因编码的蛋白质的基因或与染色体中的植物基因多核苷酸天然地相关联,或者这些多核苷酸与在自然界中未发现的染色体的部分(例如,在通常不表达基因的基因座中表达的基因)相关联。另外,“异源”多核苷酸是指不与多核苷酸被引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。异源核酸序列或核酸分子可以包含嵌合序列,如嵌合表达盒,在该表达盒中,启动子和编码区衍生自多源生物体。启动子序列可以是组成型启动子序列、组织特异性启动子序列、化学诱导型启动子序列、伤口诱导型启动子序列、胁迫诱导型启动子序列、或发育阶段特异性启动子序列。
“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序列。
当参考多核苷酸(如植物的基因、ORF或其部分、或转基因)使用时,术语“表达”是指通过基因的“转录”(即经由RNA聚合酶的酶促作用)将基因中编码的遗传信息转化为RNA(例如,mRNA、rRNA、tRNA或snRNA),并在适用的情况下(例如,如果基因编码蛋白质)通过mRNA的“翻译”转化为蛋白质的过程。基因表达可以在该方法的许多阶段进行调节。例如,分别在反义构建体或dsRNA构建体的情况下,表达可仅指反义RNA的转录或仅指dsRNA的转录。在实施例中,“表达”是指正义(mRNA)或功能性RNA的转录和稳定累积。“表达”还可指蛋白质的产生。
如本文所用,称为“单倍体”的植物在单倍体植物中具有减少数量的染色体(n),并且它的染色体组等于配子的染色体组。在单倍体生物中,仅存在正常染色体数量的一半。因此二倍体生物(例如,玉米)的单倍体示出单倍性;四倍体生物(例如,黑麦草)的单倍体示出二倍性;六倍体生物(例如,小麦)的单倍体示出三倍性;等等。如本文所用,被称为“双单倍体”的植物通过使染色体的单倍体组加倍而开发。从自交到任何数量的世代的双单倍体植物获得的植物或种子仍然可以被鉴定为双单倍体植物。双单倍体植物被认为是纯合植物。如果植物是可育的,即使该植物的整个营养部分不是由具有加倍的染色体组的细胞组成的,该植物也被认为是双单倍体;也就是说,如果植物含有活的配子,即使该植物在营养组织中是嵌合的,该植物也将被认为是双单倍体。
如本文所用,术语“人诱导的突变”是指由于直接或间接的人类作用而发生的任何突变。此术语包括但不限于通过任何靶向诱变方法获得的突变。
如本文所用,“引入”是指递送、表达、施用、运输、转移、渗透或其他相似的术语以指示所希望的物体的核酸或蛋白质或其组合向一个物体的递送。例如,可将编码定点核酸酶的核酸和任选地至少一种指导RNA引入植物细胞中。
如本文所用,术语“标志探针”和“探针”是指可以用于检测较大序列内序列的存在或不存在的核苷酸序列或核酸分子,例如,通过核酸杂交与标志或标志基因座的全部或部分互补的核酸探针。包含约8、10、15、20、30、40、50、60、70、80、90、100个或更多个连续核苷酸的标志探针可以用于核酸杂交。
如本文所用,当鉴定HI相关的基因座的存在/不存在时,术语“分子标志”可以用于指如上文所定义的遗传标志,或其用作参比点的编码产物(例如,蛋白质)。分子标志可衍生自基因组核苷酸序列或表达的核苷酸序列(例如,衍生自RNA、cDNA等)。该术语也指与标志序列互补或与位于其侧翼的核苷酸序列,例如,用作能够扩增标志序列的探针和/或引物的核苷酸序列。当核苷酸序列在溶液中特异性杂交时,这些核苷酸序列是“互补的”(例如,根据沃森-克里克碱基配对原则)。此术语也指通过与标志序列互补或与位于其侧翼的核苷酸序列(例如,用作能够扩增标志序列的探针和/或引物的核苷酸序列)的不存在指示性状的遗传标志。
如本文所用,术语“核苷酸序列”、“多核苷酸”、“核酸序列”、“核酸分子”和“核酸片段”是指单链或双链的RNA或DNA的聚合物,任选地含有合成的、非天然的、和/或改变的核苷酸碱基。“核苷酸”是从其构建DNA或RNA聚合物并且由嘌呤或嘧啶碱基、戊糖和磷酸基团组成的单体单元。核苷酸(通常以其5'-单磷酸酯形式发现)以其单字母名称表示如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。
如本文所用,术语“核苷酸序列同一性”是指在两个多核苷酸的对应位置处存在相同的核苷酸。当进行比对以获得最大对应时(例如,在比较窗口中),如果在两个多核苷酸中的核苷酸序列是相同的,则多核苷酸具有“相同的”序列。通常通过在比较窗口上比较这两个序列的部分来进行两个或更多个多核苷酸之间的序列比较,以鉴定并比较序列相似性的局部区域。比较窗口通常是从约20至200个连续核苷酸。多核苷酸的“序列同一性百分比”,例如约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性,可以在比较窗口上通过比较两个最佳比对的序列来确定,其中为了两个序列的最佳比对,与参考序列相比,在比较窗口中的多核苷酸序列的部分可以包括添加或缺失(即,空位)。在一些实施例中,通过以下方式计算百分比:(a)确定在两个序列中出现相同的核酸碱基的位置的数量;(b)将匹配位置的数量除以比较窗口中位置的总数量;并且(c)将结果乘以100。
适于确定百分比序列同一性和序列相似性的算法的一个实例是BLAST算法,它描述于Altschul等人,1990中。在一些实施例中,序列同一性百分比是指进行比较的SEQ IDNo:1的最大ORF中的gDNA、cDNA或预测的蛋白质序列之一的全长上的序列同一性。在一些实施例中,确定核酸序列同一性百分比的计算在计算中并不包括所比较的核酸之一包括“N”(即,其中在该位置可以存在任何核苷酸)的任何核苷酸位置。
术语“开放阅读框”(ORF)是指编码多肽的核酸序列。在一些实施例中,ORF包含翻译起始密码子(即,起始密码子)、翻译终止(termination)(即,终止(stop)密码子)、以及其间的编码多肽中存在的氨基酸的核酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(即,密码子)的单位,它对应地指明蛋白质合成(mRNA翻译)的起始和链终止。
如本文所用,术语“表型”、“表型性状”或“性状”是指植物或植物细胞的一种或多种性状。表型是可通过裸眼或通过本领域已知的任何其他评估手段(例如,显微术、生物化学分析、或电子机械测定)观察的。在一些情况下,表型直接由单一基因或遗传基因座控制(即,对应于“单基因性状”)。在其他情况下,表型是若干个基因之间相互作用的结果,在一些实施例中,其也由植物和/或植物细胞与其环境相互作用引起。
如本文所用,术语“植物”可以是指全株植物、其任何部分、或从植物衍生的细胞或组织培养物。可用于本披露方法的植物种类通常与适于转化技术的高等植物种类一样广泛,这些高等植物种类包括单子叶植物和双子叶植物两者,包括来自但不限于以下属的物种:南瓜属、蔷薇属、葡萄属、胡桃属、草莓属、莲属、苜蓿属、红豆草属、三叶草属、葫芦巴属、豇豆属、柑桔属、亚麻属、老鹳草属、木薯属、胡萝卜属、拟南芥属、芸苔属、萝卜属、芥菜属、颠茄属、辣椒属、曼陀罗属、莨菪属、番茄属、烟草属、茄属、矮牵牛属、洋地黄属、玉米属、墨角兰属(Majorana)、菊苣属(Ciahorium)、向日葵属、莴苣属、雀麦属(Bromus)、天门冬属、金鱼草属、西丽草属(Heterocallis)、涅墨属(Nemesis)、天竺葵属、黍属(Panieum)、狼尾草属、毛茛属、千里光属、蛾蝶花属、甜瓜属、蓝英花属(Browaalia)、大豆属、豌豆属、菜豆属、黑麦草属、稻属、燕麦属、大麦属、黑麦属、葱属和小麦属。
植物细胞是从植物取得的植物细胞,或者是通过培养从取自植物的细胞衍生的植物细胞。因此,术语“植物细胞”包括但不限于种子、悬浮培养物、胚、分生区、愈伤组织、叶、芽、配子体、孢子体、花粉和小孢子内的细胞。短语“植物部分”是指植物的一部分,包括单细胞和细胞组织(例如植物中完整的植物细胞)、细胞团块和可以再生植物的组织培养物。植物部分的实例包括但不限于来自以下各项的单细胞和组织:花粉、胚珠、叶、胚、根、根尖、花药、花、果实、茎、芽和种子;以及接穗、根茎、原生质体、愈伤组织等。
如本文所用,术语“引物”是指如下寡核苷酸,当置于诱导引物延伸产物合成的条件下(例如,在核苷酸和用于聚合的试剂(如DNA聚合酶)的存在下以及在合适的温度和pH下)时,其能够与核酸靶退火(在一些实施例中,特异性地与核酸靶退火),以允许DNA聚合酶和/或逆转录酶与其附接,从而用作DNA合成的起始点。在一些实施例中,采用一个或多个引物来扩增植物核酸(例如,使用聚合酶链式反应;PCR)。
如本文所用,术语“探针”是指可以与靶核酸序列中的互补序列形成氢键合的双链体的核酸(例如,单链核酸或双链或更高级核酸的链、或其子序列)。典型地,探针具有足够的长度以便与其互补序列形成稳定且序列特异性的双链体分子,并且这样可以在一些实施例中用于检测在多个核酸中存在的目的序列。
如本文所用,术语“后代”和“后代植物”是指从一个或多个亲本植物通过营养生殖或有性繁殖产生的植物。后代植物可以通过克隆单一亲本植物或使单一亲本植物自交、或者通过使两个或更多个亲本植物杂交来获得。例如,后代植物可以通过一个亲本植物的克隆或自交或者通过两个亲本植物的杂交而获得,并且包括自交体以及F1或F2或甚至更远的世代。F1是产生自两个亲本的第一代后代(两个亲本中至少一个是第一次用作性状的供体),而第二代(F2)或后续代(F3、F4等)的后代是产生于F1、F2等的自交、互交、回交和/或其他杂交的样本。因此,F1可以是(并且在一些实施例中是)从两个纯育亲本(即,对于目的性状或其等位基因而言纯育的亲本中的每一个都是纯合的)之间的杂交产生的杂交种,而F2可以是(并且在一些实施例中是)从F1杂交种自花授粉产生的后代。
本披露多肽的“部分”或“片段”将理解为意指相对于本披露的参考氨基酸序列或核酸序列而言长度减少的氨基酸序列或核酸序列。根据本披露,在适宜的情况下,这种部分或片段可以包括于它作为组分的较大多肽或核酸内(例如,标记的或融合蛋白或表达盒)。在实施例中,“部分”或“片段”基本上保留了活性如杀昆虫活性(例如,全长蛋白或核酸的杀昆虫活性(例如,至少40%、50%、60%、70%、80%、85%、90%、95%或甚至100%的活性),或者具有比全长蛋白更高的活性如杀昆虫活性。
术语“蛋白质”、“肽”和“多肽”在本文中可互换使用。
如本文所用,术语“启动子”是指通常位于编码序列翻译起始位点上游(5')的多核苷酸,其通过提供对正确转录所需的RNA聚合酶和其他因子的识别来控制编码序列的表达。例如,启动子可以含有包含被RNA聚合酶识别的基础启动子元件的区域、含有编码序列的5'非翻译区(UTR)的区域和任选地内含子。
如本文所用,短语“重组”是指在相似或相同核苷酸序列的区域中,在配对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉互换”)。“重组事件”在本文中被理解为在一些实施例中是指减数分裂交叉互换。
如本文所用,术语“重组”是指核酸分子(例如,DNA或RNA)或蛋白质或生物体的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如本文所用,“重组核酸分子”是包含多核苷酸组合的核酸分子,这些多核苷酸不会天然地共同存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含不同于通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组DNA中和该宿主细胞基因组相关侧翼DNA中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物体中的重组RNA/或蛋白分子的表达。如本文所用,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有可掺入到其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,重组植物明显不同于相关的野生型植物。“重组”细菌是自然界中未发现的细菌,该细菌包含异源核酸分子。可以通过用核酸分子转化细菌,或通过将质粒从一种细菌菌株接合样转移到另一种细菌菌株、由此使该质粒包含核酸分子来产生此类细菌。
如本文所用,术语“参考序列”是指用作核苷酸序列比较的基础的确定的核苷酸序列。
如本文所用,术语“再生”及其语法变体是指从组织培养物中产生植物。
“调控元件”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调控序列包括增强子、启动子、翻译增强子序列、内含子、终止子和多腺苷酸化信号序列。它们包括天然序列和合成序列、以及可能是合成序列与天然序列的组合的序列。调控序列可以决定表达水平、表达的空间模式和时间模式,并且对于启动子的子集,决定在诱导性条件下的表达(由外部因子,例如光、温度、化学品和激素来调节)。
如本文所用,短语“严格杂交条件”是指多核苷酸典型地在复杂的核酸混合物中与其靶子序列杂交(但基本上不与其他序列杂交)的条件。严格条件是序列依赖性的并且在不同的环境下可以是不同的。
典型地,较长的序列在较高的温度下特异性杂交。核酸杂交的全面指南可见于Sambrook和Russell,2001中。通常,对于在确定的离子强度pH下的特异性序列,将严格条件选择为比热熔点(Tm)低约5℃-10℃。Tm是50%的与靶互补的探针杂交靶序列处于平衡状态时(在靶序列过量存在时,在Tm时,50%的探针被占据处于平衡状态)的温度(在确定的离子强度、pH、和核酸浓度下)。示例性严格条件是如下这些:盐浓度小于约1.0M钠离子、典型地在pH 7.0至8.3下约0.01至1.0M钠离子浓度(或其他盐),并且对于短探针(例如,10至50个核苷酸)温度为至少约30℃而对于长探针(例如,大于50个核苷酸)至少约60℃。
还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。另外的示例性严格杂交条件包括50%甲酰胺、5x SSC和1% SDS,在42℃孵育;或SSC、1% SDS,在65℃孵育;在65℃用0.2x SSC和0.1% SDS洗涤一次或多次。对于PCR,约36℃的温度典型地用于低严格扩增,但是取决于引物长度,退火温度可以在约32℃与48℃(或更高)之间变化。在许多的参考文献中提供了用于确定杂交参数的另外的指南(参见例如,Ausubel等人,1999)。
如本文所用,术语“性状”是指目的表型、促成目的表型的基因、以及与促成目的表型的基因相关联的核酸序列。例如,“HI性状”是指单倍体诱导表型、以及促成单倍体诱导的基因(例如,玉米中的matl或稻中的Os03g27610)和与单倍体诱导表型的存在或不存在相关联的核酸序列(例如,HI相关的基因产物)。
如本文所用,术语“转基因”是指通过某些形式的人工转移技术引入生物体或一个或多个其祖先中的核酸分子。因此,人工转移技术创建了“转基因生物体”或“转基因细胞”。应当理解的是,人工转移技术可以在祖先生物体(或其中的细胞和/或可以发育成祖先生物体的细胞)中发生,并且即使一种或多种自然和/或辅助育种导致了人工转移的核酸分子存在于后代个体中,具有人工转移的核酸分子或其片段的任何后代个体仍然被认为是转基因的。
如本文所用,术语“靶向诱变”或“诱变策略”是指导致所选择的基因的有意诱变的任何诱变方法。靶向诱变包括CRISPR、TILLING、TALEN方法和其他尚未发现但可以用于实现相同结果的其他方法。
“转化”是用于将异源核酸引入到宿主细胞或生物体的方法。在特定实施例中,“转化”意指DNA分子稳定地整合到目的生物体的基因组(核或质体)中。在一些特定实施例中,引入植物、植物部分和/或植物细胞中是经由:细菌介导的转化,粒子轰击转化,磷酸钙介导的转化,环糊精介导的转化,电穿孔,脂质体介导的转化,纳米粒子介导的转化,聚合物介导的转化,病毒介导的核酸递送,晶须介导的核酸递送,微量注射,超声处理,浸润,聚乙二醇介导的转化,原生质体转化,或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物机制,或其组合。用于转化植物的程序是本领域熟知的和常规的并且普遍描述于文献中。
用于植物转化的方法的非限制性实例包括经由以下的转化:细菌介导的核酸递送(例如,经由来自土壤杆菌属的细菌),病毒介导的核酸递送,碳化硅或核酸须晶介导的核酸递送,脂质体介导的核酸递送,微量注射,微粒轰击,磷酸钙介导的转化,环糊精介导的转化,电穿孔,纳米粒子介导的转化,超声处理,浸润,PEG介导的核酸吸收,以及导致向植物细胞中引入核酸的任何其他电学、化学、物理(机械)和/或生物机制,包括其任何组合。本领域已知的各种植物转化方法的一般指南包括Miki等人(“Procedures for IntroducingForeign DNA into Plants[将外来DNA引入至植物中的程序]”于Methods in PlantMolecular Biology and Biotechnology[植物分子生物学和生物技术的方法]中,Glick,B.R.和Thompson,J.E.,编辑(CRC Press,Inc.[CRC出版有限公司],波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(2002,Cell Mol Biol Lett[细胞分子生物学快报]7:849-858(2002))。
“转化的”和“转基因”是指异源核酸分子已经引入其中的宿主生物体(例如细菌或植物)。核酸分子可以被稳定地整合到宿主的基因组中,或者核酸分子还可以作为染色体外分子存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因后代。“非转化的”、“非转基因”、或“非重组”宿主是指不含异源核酸分子的野生型生物体,例如细菌或植物。
特别考虑到人们可以诱变启动子以潜在地改善元件在植物中表达转基因的效用。这些元件的诱变可以随机进行,并且在试错程序(trial-by-error procedure)中筛选诱变的启动子序列的活性。可替代地,可以鉴定为启动子提供希望的表达特征或为启动子提供表达增强活性的特定序列,并且可以经由突变将这些或类似序列引入启动子中。进一步考虑到人们可以诱变这些序列以便增强其转基因在特定物种中的表达。用于诱变编码本发明的启动子序列的DNA区段的手段是本领域技术人员熟知的。如所指示的,可以通过随机或位点特异性诱变程序对启动子或其他调控元件进行修饰。启动子和其他调控元件可以通过在编码相应的未修饰序列的序列中添加或缺失一个或多个核苷酸改变它们的结构来进行修饰。
可以根据本领域已知的技术中的任一种进行诱变,例如但不限于合成在特定调控序列的序列内具有一个或多个突变的寡核苷酸。特别地,位点特异性诱变是通过对基础DNA(underlying DNA)的特异性诱变可用于制备启动子突变体的技术。还可以使用RNA指导的内切核酸酶(“RGEN”,例如,CRISPR/Cas9)。例如,结合一个或多个前述考虑,通过将一个或多个核苷酸序列改变引入DNA中,该技术进一步提供制备和测试序列变体的现成能力。位点特异性诱变允许通过使用编码所希望的突变的DNA序列的特定寡核苷酸序列以及足够数量的相邻核苷酸来提供足够大小和序列复杂性的引物序列以在正在详细研究的缺失连接片段的两侧形成稳定的双链体而产生突变体。典型地,长度为约17个至约75个核苷酸或更多个核苷酸的引物是优选的,其中序列连接片段的两侧上约10个至约25个或更多个残基被改变。
在根据本发明分离出包含启动子的克隆的情况下,人们可能希望界定克隆内的启动子区域。用于制备诱变的启动子的一种有效的靶向手段依赖于在启动子序列内鉴定推定的调控元件。这可以通过与已知以相似的组织特异性或发育独特模式表达的启动子序列进行比较来引发。在具有相似的表达模式的启动子之间共享的序列可能是转录因子结合的候选物,并且因此可能是赋予表达模式的元件。这些推定的调控元件的确认可以通过对每个推定的调控序列进行缺失分析,接着通过测定与每个构建体功能性附接的报告基因对每个缺失构建体进行功能分析来实现。因此,一旦提供了起始启动子序列,就可以容易地制备起始启动子的许多不同的缺失突变体中的任何一个。
本文所披露的发明提供了包含可以用于构建新颖嵌合调控元件的调控元件片段的多核苷酸分子。包含这些多核苷酸分子的片段和至少一个其他调控元件或片段的新颖组合可以在植物中构建和测试并且被认为是在本发明的范围内。因此,嵌合调控元件的设计、构建和使用是本发明的一个实施例。本发明的启动子包括显示与本发明的启动子序列具有同源性的、已知影响基因调控的顺式元件的同系物。
本文所述的转录调控核酸之一的功能等价片段包含至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个碱基对的转录调控核酸。然后,通过缺失编码mRNA的5'非翻译区的区域获得的转录调控核酸的等价片段将仅提供(未转录的)启动子区域。5'非翻译区可以通过本领域已知的方法(例如5'-RACE分析)容易地确定。因此,本文所述的一些转录调控核酸是其他序列的等价片段。
如上文所指示的,也可以随机制备本发明的启动子的缺失突变体并且然后对其进行测定。按照此策略,制备一系列构建体,每个构建体含有启动子的不同部分(亚克隆),并且然后筛选这些构建体的活性。用于筛选活性的合适手段是将含有缺失区段的缺失的启动子或内含子构建体附接至选择性标志或筛选性标志,并且仅分离表达标志基因的那些细胞。以这种方式,鉴定了许多不同的、缺失的启动子构建体,其仍然保留了所希望的、甚至增强的活性。由此通过比较所选择的构建体来鉴定活性所需的最小区段。然后,此区段可以用于构建用于表达外源基因的载体。
本文所述的“至少一个表达盒”尤其是指包括诱导型系统序列和编码待由细胞表达的DNA修饰酶的核酸的DNA。在一个实例中,至少一个表达盒是载体DNA的组分,并且在细胞中转化之后表达。如本文所述的至少一个表达盒将通常包括多个表达盒,例如:包含调控序列和编码gRNA的核酸的表达盒;包含引发供体DNA复制的调控序列的表达盒;包含调控序列和选择性标志或其一些组合的表达盒,例如包含编码在诱导型系统序列控制下的Cas酶和gRNA的DNA的表达盒。本文所述的至少一个表达盒可以包含另外的调控元件。在此上下文中的术语应被广义地理解为包含可以影响至少一个表达盒的构建或功能的所有序列。例如,调控元件可以修饰原核生物体或真核生物体中的转录和/或翻译。本文所述的至少一个表达盒可以在待表达的核酸序列的下游(在3'方向)并且任选地含有另外的调控元件,例如转录或翻译增强子。每个另外的调控元件都可以可操作地连接至待表达的核酸序列(或转录调节核苷酸序列)。另外的调控元件可以包含可以修饰或增强表达调控特性的另外的启动子、最小启动子、启动子元件或转座子元件。至少一个表达盒还可以含有一个或多个内含子、一个或多个外显子和一个或多个终止子。
另外,考虑到将来自多于一个启动子的元件组合的启动子可能是有用的。例如,美国专利号5,491,288披露了将花椰菜花叶病毒启动子与组蛋白启动子组合。因此,可以将来自本文所披露的启动子(例如FMOS启动子)的元件与来自其他启动子(FMOS或其他)的元件组合,只要维持FMOS功能即可。例如,在某些实施例中FMOS启动子中的内含子可以被来自其他启动子的内含子(例如来自泛素启动子的内含子)替代。另外,在一些实施例中,还可以延长FMOS启动子,例如通过与来自其他启动子的内含子融合,例如将FMOS启动子与泛素启动子的内含子融合。
术语“载体”是指用于将一种或多种核酸转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的一个或多个核苷酸序列的核酸分子。示例性载体包括质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。
具体实施方式
本披露尤其涉及用于改善基因编辑效率(例如,用于降低在植物DNA中产生编辑(例如新突变或事件)所需的转化数量)的系统和方法。
在各个实施例中,本披露涉及用于在植物的种子中产生多个独特编辑(例如,多个独特等位基因取代、多个独特碱基插入、多个独特碱基缺失或多个独特点突变)的方法。
一个实施例提供了用于在植物的后代中产生多个独特编辑的方法,该方法包括:(a)向植物细胞或植物组织中引入表达盒,其中该表达盒包含(i.)编码DNA修饰酶的核酸;(ii.)编码至少一种指导RNA的任选的核酸;以及(iii.)与该编码DNA修饰酶的核酸可操作连接的诱导因子;(b.)在所希望的植物发育阶段诱导该诱导因子;以及(c.)将该植物细胞或植物组织生成为具有后代的植物,其中该后代共同包含多个独特编辑。在一个实施例中,诱导因子是转录效应子或易位效应子;诱导因子由化学品诱导,其中该化学品选自抗生素、金属、类固醇、杀昆虫剂、激素、醇和醛;该抗生素是四环素或其化学模拟物;该金属是铜或含铜化合物;该类固醇是选自由以下组成的组的糖皮质激素:地塞米松、倍氯米松、倍他米松、布地奈德、可的松、氢化可的松、甲泼尼龙、泼尼松龙、泼尼松、曲安奈德、及其任何化学模拟物;该糖皮质激素是地塞米松;该杀昆虫剂选自由以下组成的组:虫酰肼、甲氧虫酰肼、及其任何化学模拟物;该激素选自由以下组成的组:雌性激素、雌激素、17-β-雌二醇、及其任何化学模拟物;该醇选自由以下组成的组:乙醇及其任何化学模拟物;该醛选自由以下组成的组:乙醛及其任何化学模拟物。在另一个实施例中,转录效应子选自由以下组成的组:醇依赖性效应子、乳糖依赖性效应子、半乳糖依赖性效应子和lexA依赖性效应子;该醇依赖性效应子是alc效应子。在一方面,alc效应子是包含alcA启动子的构巢曲霉alc效应子。
在另一个实施例中,方法进一步包括另外的表达盒,该另外的表达盒包含编码alcR转录因子激活基因的核苷酸序列;从而形成alcA/alcR诱导型系统。在一方面,方法包括在所希望的植物发育阶段施用醇。
在另一个实施例中,乳糖依赖性效应子是pOp效应子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码LhG4转录因子激活基因的核苷酸序列;从而形成LhG4/pOp诱导型系统。
在另一个实施例中,半乳糖依赖性调节子是Gal4 UAS效应子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码Gal4转录因子激活基因的核苷酸序列;从而形成GVG诱导型系统或VGE诱导型系统。
在另一个实施例中,LexA依赖性效应子是至少一种lexA操纵子。在一方面,方法进一步包括另外的表达盒,该另外的表达盒包含编码LexA:VP16:ER激活子的核苷酸序列;从而形成XVE诱导型系统。
在一个实施例中,DNA修饰酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、嵌合FEN1-FokI、Mega-TAL和CRISPR核酸酶。在一方面,CRISPR核酸酶是Cas核酸酶、Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶、与脱氨酶结构域融合的Cas12a、Cas12i核酸酶、Cas12j核酸酶、CasX核酸酶、CasY核酸酶、Cas13核酸酶、Cas14核酸酶。
在另一个实施例中,易位因子是糖皮质激素受体。在一方面,糖皮质激素受体包含SEQ ID NO:6。在另一方面,糖皮质激素受体与CRISPR核酸酶可操作地连接。在另一个实施例中,糖皮质激素受体连接的CRISPR核酸酶是经修饰以包含糖皮质激素受体结合结构域(“GR-Cas12a”)的修饰的Cas12a核酸酶。在一方面,GR-Cas12a包含SEQ ID NO:7。在另一个实施例中,方法进一步包括:在施用地塞米松之后,GR-Cas12a从植物细胞或植物组织的细胞质易位至细胞核。
在方法的另一个实施例中,独特编辑是插入缺失突变、核苷酸置换、等位基因取代、染色体易位或供体核酸的插入。
在方法的另一个实施例中,植物细胞或植物组织是双子叶植物细胞或植物组织。在一方面,双子叶植物细胞或植物组织选自由以下组成的组:拟南芥属、向日葵、大豆、番茄、芸苔属物种、杨属(白杨)、桉树、烟草、大麻、马铃薯、棉花、玉米、稻、小麦、大麦、甘蔗、短绒野大豆和其他野生大豆属物种。
在方法的另一个实施例中,植物细胞或植物组织是单子叶植物细胞或植物组织。在一方面,单子叶植物细胞或植物组织选自由以下组成的组:玉米、小麦、稻、墨西哥类蜀黍、高粱和大麦。在一方面,单子叶植物细胞或植物组织是玉米。
在一个实施例中,植物细胞或植物组织是玉米,并且其中所希望的发育阶段选自由以下组成的组:VE、V1、V2、V(n)、VT、R1、R2、R3、R4、R5和R6阶段;其中(n)是代表存在的叶环数的整数。
在另一个实施例中,植物细胞或植物组织是大豆,并且其中所希望的发育阶段选自由以下组成的组:VE、VC、V1、V2、V(n)、R1、R2、R3、R4、R5、R6、R7和R8阶段;其中(n)是代表存在的三小叶数的整数。
在另一个实施例中,方法进一步包括(d.)使共同包含多个独特编辑的后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;(e.)测量步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物中的至少一种表型;以及(f.)任选地基于该至少一种表型的测量选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
在又一个实施例中,方法进一步包括(d.)使共同包含多个独特编辑的后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;(e.)对步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物进行基因分型;以及(f.)任选地基于步骤b的基因型选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
本发明的另一个实施例是通过以上列举的方法产生的编辑的植物。
本发明的另一个实施例是诱导型基因编辑系统,其包含表达盒,该表达盒包含(a.)编码DNA修饰酶的核酸;(b.)编码至少一种指导RNA的任选的核酸;以及(c.)与该编码DNA修饰酶的核酸可操作连接的诱导因子。在一个实施例中,系统进一步包含具有表达盒的细胞。在一方面,细胞是真核细胞。在另一方面,真核细胞是植物细胞。
实例
实例1.醇诱导的嵌合体
在该实例中,嵌合体可以在植物生命所希望的发育(例如花原基发育)阶段通过向包含与GE系统可操作连接的AlcR/AlcA诱导型系统的植物施用乙醇来诱导。在AlcR/AlcA系统中,AlcR转录因子和AlcA启动子分离自构巢曲霉。当包含该系统的植物暴露于乙醇时,植物将乙醇代谢为乙醛,乙醛与AlcR缀合激活AlcA启动子,从而驱动下游基因的表达。
所用的材料:(1)在诱导期间和两周内在28℃下的两个室。(2)用载体25881转化拟南芥植物,该载体包含用于在拟南芥中表达的具有卡那霉素选择标志的乙醇诱导型基因编辑系统,包括三个盒。在第一表达盒中,来自构巢曲霉的双子叶优化的醇受体基因(AlcR)由组成型启动子prAtEF1aA1驱动。在第二表达盒中,prAlcA(由AlcA启动子和35S最小启动子的融合体组成的嵌合启动子(描述于Caddick等人,1998.Nature Biotechnology[自然生物技术]))驱动Cas12a的表达。在乙醇的存在下,AlcR与AlcA启动子结合并激活转录。第三表达盒包含靶向无毛1(GL1)基因的第二外显子的gRNA。
处理:(1)用2%乙醇水溶液浸泡过夜。(2)对照植物在相同条件下生长,不同之处是不接受乙醇,仅用水浸泡。
编辑取样:从植物的不同部分收获8-16个长角果,使种子发芽,并将植物取样用于测序,将来自一个长角果的所有种子种到同一个盆中。在种子种植入土中之后,在4℃下春化两天。
在抽苔之后,第一长角果需要约一月才能收获。
A.浸泡处理号1
将植物用2%乙醇浸泡。将对照保存在没有乙醇的独立室中。
B.qRT PCR结果
我们最初在用2%乙醇浸泡过夜之后的第二天(17小时)和在6天之后(144小时)测试了Cas12a转录物的水平,该实验被命名为“1_6_天”。我们发现,Cas12a在开始用2%乙醇浸泡之后17小时被诱导,但其在144小时之后回到水对照水平。为了更好地估计诱导的Cas12a转录物随时间的表达谱,我们用第二批25881拟南芥植物进行了另一个名为“时间过程(Timecourse)”的实验,其中在浸泡后17、46、70和94小时取样。在第二实验(“时间过程”)中,装有对照植物的托盘被放置在用2%乙醇浸泡那些旁边。在17小时之后,对照植物显示出Cas12a转录物的激活,这表面上是由来自2%alc托盘的乙醇蒸汽引起。因此,“时间过程”实验第1天(17小时)的水对照数据点被排除在分析之外。
我们使用TaqMan qRT-PCR量化了Cas12a转录物的水平(表1)。基于来自这些实验的结果,我们选择每4天用2%乙醇浸泡以维持Cas12a诱导。
表1.Cas12a表达的量化水平
/>
/>
/>
/>
/>
/>
/>
/>
*相对于内源性对照x1000
我们还进行了比较花和叶中Cas12a表达的实验。该实验使用来自上述T1植物子集的T2植物进行。数据显示醇诱导Cas12a系统地表达(在叶和花中)。
表2.比较叶和花组织中Cas12a的表达。
/>
/>
/>
/>
/>
*相对于内源性对照x1000
C.表达式时间线
Cas12a醇诱导和gl1诱变
为了优化gl1诱变的速率,我们将T1事件分成四批以在种植之后的不同时间进行诱导。第一批中的植物在移植至土壤中之后23天被诱导,此时它们都处于营养阶段。第二批中的植物在移植之后34天被诱导,此时除了两个以外,所有植物都处于营养阶段。第三批中的植物在移植之后44天被诱导,并且此时全部开花。第四批中的植物在移植之后47天被诱导。所有植物在其最初诱导之后每四天浸泡以维持Cas12a激活。所有植物在诱导之前和诱导后一天取叶样品。此外,在稍后的时间点对一些植物取样以测量Cas12a。
表3,显示了在第一次用醇诱导之前和之后的不同时间,相对于内源性对照的Cas12a的表达水平。
/>
/>
/>
/>
/>
/>
*相对于内源性对照x1000
我们从每个处理中选择了T1植物的子集以对T2代中的gl1诱变速率进行评分。从衰老的T1植物中单独收集八至十六个长角果,并将其所有种子撒在单独的2”x 2”盆中。使盆在4℃下分层四天,并随后放置在设定为23℃、具有12小时光照的生长室中。通过计算没有毛状体的幼苗数量并将它们除以盆中的幼苗总数,对叶的无毛表型进行评分。一些幼苗是嵌合体,其中一个或多个叶中的部分是无毛的,并且部分具有毛状体,我们将这些幼苗评分为无毛的。将平均无毛1率计算为同一T1事件的所有盆中无毛幼苗的平均率。
表4,显示了在种植之后的四个不同时间对用醇诱导的28个T1事件测量的gl1率。gl1诱变率计算为T2代中每盆gl1幼苗的平均率(gl1幼苗/幼苗总数)。每个盆都种植有来自独特T1事件长角果的种子。
/>
为了评估由醇诱导型Cas12a产生的等位基因,我们将单独的T2 gl1幼苗取样到96孔板中用于DNA提取、PCR扩增和gl1中靶序列周围区域的桑格测序。因为gl1是隐性的,如果它们是杂合的,则gl1中的大量缺失预计不会产生无毛的幼苗;此外,3聚体缺失可能导致部分功能丧失或不丧失功能。为了捕获被杂合性或部分功能丧失“掩盖”的gl1的另外等位基因,我们还对五个幼苗池中的野生型幼苗进行了测序。使用Q5 DNA聚合酶(NEB)用引物GL1_F(CGTGTCACGAAAACCCATC)和GL1_R(TCAACTTAACCGGCCAAATC)扩增614个碱基对的gl1片段,并用引物GL1_F进行桑格测序。使用Synthego公司的ICE CRISPR分析工具分析所得的痕量色谱图,以推断编辑的性质(www.biorxiv.org/content/10.1101/251082v3)。
/>
/>
/>
二十四株植物(植物01-24)在处理组(即2%乙醇浸泡托盘)中,并且八株植物(植物33-40)在对照组(即无乙醇)中。在17小时、46小时、70小时和94小时收集qRT PCR样品。
将从拟南芥植物花序的不同部分收集种子,并种植这些种子以评价无毛1靶基因的基因编辑。
通过观察叶上毛状体的存在/不存在以及通过TaqMan和gl1测序两者对编辑进行表型评估。
实例2.DEX诱导的嵌合体
构建了用于DEX诱导型Cas12a活性的两个载体。在第一载体25657中,糖皮质激素受体(GR)与Cas12a融合,由组成型启动子prAtEF1aA1-07(SEQ ID NO:2;图3)驱动。在第二版本载体27057中,存在由pr35S驱动的Gal4-VP16-GR的融合体。以下提供了这两种构建体的更多细节。
在第一实例中,大鼠糖皮质激素受体(GR)的激素结合结构域与选择的编辑酶融合。通过将GR结构域与Cas12a融合,这使得其核定位依赖于DEX的施用。用载体25657转化拟南芥植物,该载体包含使DEX诱导型Cas12a(“GR-Cas12a”)能够表达的序列。GR-Cas12a缺乏NLS,但在N末端包含由长接头隔开的糖皮质激素受体(GR)结合结构域。GR-Cas12蛋白由拟南芥启动子prAtEF1aA1组成型表达,但仍定位于细胞质。在糖皮质激素例如地塞米松(“DEX”)的存在下,GR-Cas12a易位至细胞核。该载体还编码指导RNA,其靶向拟南芥中无毛1(gl1)基因第二外显子处的5'-ccacatctctttagccctatcaa-3’。
转化的拟南芥植物生长至所希望的发育阶段,例如在花序发育期间,此时将对植物施用糖皮质激素,例如地塞米松。DEX施用可以是经表面、根浸泡或其他方式。允许植物正常发育,并分析后代的嵌合体。通过观察叶上毛状体的存在/不存在(参见图6)以及通过TaqMan和gl1测序两者来对编辑进行表型评估。然而,发现25657实施例在编辑方面不如期望的那样有效,这是因为Cas12a的版本不够活跃,或者因为与GR-Cas12a融合体相关的其他原因。该问题也反映在Cas12a的表达不够高。
对于载体27057,该系统基于类固醇(如地塞米松)与重组蛋白GVG(由酵母(酿酒酵母)GAL4 DNA结合结构域、单纯疱疹VP16激活结构域和来自大鼠(褐家鼠(Rattusnorvegicus))糖皮质激素受体(GR)的激素结合结构域构成)的相互作用特性。糖皮质激素受体(“GR”)的激素结合结构域具有277个氨基酸的大小。在不存在类固醇的情况下,GVG与含有热休克蛋白90(“HSP90”)的胞质复合物相互作用,并保持定位于细胞质,使其转录失活。用合成类固醇激素地塞米松处理之后,GVG/HSP90相互作用被破坏,并且GVG蛋白定位于细胞核,在细胞核中与由多拷贝GAL4上游激活序列(GAL4 UAS)构成的调控序列结合。一旦与该启动子区域结合,VP16结构域激活下游基因的转录。如上所述将该载体转化到拟南芥中,并通过观察叶上毛状体的存在/不存在以及通过TaqMan和gl1测序两者对编辑进行表型评估。
实例3.诱导的嵌合体
当与基因编辑技术组合并在所希望的发育阶段部署时,其他诱导型系统可用于获得诱导的嵌合体。可用的系统包括半乳糖依赖性效应子(例如,VGE诱导型系统)和lexA依赖性效应子(例如,LexA:VP16:ER激活子(XVE诱导型系统))。
在VGE系统中,激活子是以N末端至C末端方向的VP16:Gal4:ER。在该系统中,效应子是在最小启动子上游包含至少一个但通常是四个、五个或六个Gal4-UAS元件的启动子。
在基于lexA依赖性效应子的系统(例如,XVE诱导型系统(如下所述:I.Moore等人,Transactivated and chemically inducible gene expression in plants[植物中的反式激活和化学诱导型基因表达],PLANT J.[植物杂志],45:651-683(2006),图3))中,激活子包含由例如35S启动子组成型表达的进一步与类固醇受体融合的Lex:VP16融合蛋白。类固醇受体可以是糖皮质激素受体(“GR”)或雌二醇受体(“ER”)。在XVE系统中,激活子包含以N末端至C末端方向的lexA阻遏物结构域融合VP16转录激活结构域和人雌性激素受体ER融合(“Lex:VP16:ER”或“XVE”;这些术语可互换使用)。效应子是在最小启动子上游包含至少一个但通常是四个、五个、六个、七个或八个lexA操纵子的启动子,从而激活目的基因的转录。在雌性激素(如17-β-雌二醇)的存在下,XVE与lexA结构域的多个拷贝结合,从而激活下游靶标(在本例中为Cas12a)的转录。可替代地,Cas12a可以组成型表达,并且XVE激活gRNA分子的转录。
可同时利用其他系统来获得诱导型嵌合体。参见下表6。
表6,显示了可用于植物的化学诱导型系统。
1J.Zuo和N.-H.Chua,Chemical-inducible systems for regulated expressionof plant genes[植物基因调控表达的化学诱导型系统],CURRENT OP.BIOTECHNOL.[当代生物技术观点],11(2):146-151,157(2000)(表中的参考数字与引用的出版物相关联)。
参考文献
Moore,et al.,Transactivated and chemically inducible gene expressionin plants,PLANT J.,45:651-683(2006).
L.Borghi,Inducible Gene Expression Systems for Plants.In:Hennig L.,C.(eds)Plant Developmental Biology.Methods in Molecular Biology(Methods and Protocols),vol 655.Humana Press,Totowa,NJ.doi.org/10.1007/978-1-60761-765-5_5.
Zuo and N.-H.Chua,Chemical-inducible systems forregulated expressionof plant genes,CURRENT OP.BIOTECHNOL.,11(2):146-151(2000).
序列表
<110> 先正达农作物保护股份公司(Syngenta)
Bortiri, Esteban
Kelliher, Tim
<120> 诱导型嵌合体
<130> 81776-INDYMOS
<160> 7
<170> PatentIn 3.5版
<210> 1
<211> 13484
<212> DNA
<213> 人工序列
<220>
<223> 载体24902
<220>
<221> 启动子
<222> (521)..(1045)
<223> 35S启动子
<220>
<221> 基因
<222> (1071)..(2384)
<223> cGal4VP16GR-n1 GAL4结合结构域-VP16激活结构域-GR(糖皮质激素受体)融合体(GVG)
<220>
<221> 终止子
<222> (2396)..(3038)
<223> PsE9终止子
<400> 1
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180
tccctaatta gctaacccgg gggcgcgccg ggaccgagat tagccttttc aatttcagaa 240
agaatgctaa cccacagatg gttagagagg cttacgcagc aggtctcatc aagacgatct 300
acccgagcaa taatctccag gaaatcaaat accttcccaa gaaggttaaa gatgcagtca 360
aaagattcag gactaactgc atcaagaaca cagagaaaga tatatttctc aagatcagaa 420
gtactattcc agtatggacg attcaaggct tgcttcacaa accaaggcaa gtaatagaga 480
ttggagtctc taaaaaggta gttcccactg aatcaaaggc catggagtca aagattcaaa 540
tagaggacct aacagaactc gccgtaaaga ctggcgaaca gttcatacag agtctcttac 600
gactcaatga caagaagaaa atcttcgtca acatggtgga gcacgacaca cttgtctact 660
ccaaaaatat caaagataca gtctcagaag accaaagggc aattgagact tttcaacaaa 720
gggtaatatc cggaaacctc ctcggattcc attgcccagc tatctgtcac tttattgtga 780
agatagtgga aaaggaaggt ggctcctaca aatgccatca ttgcgataaa ggaaaggcca 840
tcgttgaaga tgcctctgcc gacagtggtc ccaaagatgg acccccaccc acgaggagca 900
tcgtggaaaa agaagacgtt ccaaccacgt cttcaaagca agtggattga tgtgatatct 960
ccactgacgt aagggatgac gcacaatccc actatccttc gcaagaccct tcctctatat 1020
aaggaagttc atttcatttg gagagaacac gggggactct agtttaaaca atggcagatc 1080
caatgaagct actgtcttct atcgaacaag catgcgatat ttgccgactt aaaaagctca 1140
agtgctccaa agaaaaaccg aagtgcgcca agtgtctgaa gaacaactgg gagtgtcgct 1200
actctcccaa aaccaaaagg tctccgctga ctagggcaca tctgacagaa gtggaatcaa 1260
ggctagaaag actggaacag ctatttctac tgatttttcc taggtcgagc gcccccccga 1320
ccgatgtcag cctgggggac gagctccact tagacggcga ggacgtggcg atggcgcatg 1380
ccgacgcgct agacgatttc gatctggaca tgttggggga cggggattcc ccgggtccgg 1440
gatttacccc ccacgactcc gccccctacg gcgctctgga tatggccgac ttcgagtttg 1500
agcagatgtt taccgatgcc cttggaattg acgagtacgg tggggatcca attcagcaag 1560
ccactgcagg agtctcacaa gacacttcgg aaaatcctaa caaaacaata gttcctgctg 1620
cattaccaca gctcacccct accttggtgt cactgctgga ggtgattgaa cccgaggtgt 1680
tgtatgcagg atatgatagc tctgttccag attcagcatg gagaattatg accacactca 1740
acatgttagg tgggcgtcaa gtgattgcag cagtgaaatg ggcaaaggcg ataccaggct 1800
tcagaaactt acacctggat gaccaaatga ccctgctaca gtactcatgg atgtttctca 1860
tggcatttgc cctgggttgg agatcataca gacaatcaag tggaaacctg ctctgctttg 1920
ctcctgatct gattattaat gagcagagaa tgtctctacc ctgcatgtat gaccaatgta 1980
aacacatgct gtttgtctcc tctgaattac aaagattgca ggtatcctat gaagagtatc 2040
tctgtatgaa aaccttactg cttctctcct cagttcctaa ggaaggtctg aagagccaag 2100
agttatttga tgagattcga atgacttata tcaaagagct aggaaaagcc atcgtcaaaa 2160
gggaagggaa ctccagtcag aactggcaac ggttttacca actgacaaag cttctggact 2220
ccatgcatga ggtggttgag aatctcctta cctactgctt ccagacattt ttggataaga 2280
ccatgagtat tgaattccca gagatgttag ctgaaatcat cactaatcag ataccaaaat 2340
attcaaatgg aaatatcaaa aagcttctgt ttcatcaaaa atgacttgag ctcttagctt 2400
tcgttcgtat catcggtttc gacaacgttc gtcaagttca atgcatcagt ttcattgcgc 2460
acacaccaga atcctactga gtttgagtat tatggcattg ggaaaactgt ttttcttgta 2520
ccatttgttg tgcttgtaat ttactgtgtt ttttattcgg ttttcgctat cgaactgtga 2580
aatggaaatg gatggagaag agttaatgaa tgatatggtc cttttgttca ttctcaaatt 2640
aatattattt gttttttctc ttatttgttg tgtgttgaat ttgaaattat aagagatatg 2700
caaacatttt gttttgagta aaaatgtgtc aaatcgtggc ctctaatgac cgaagttaat 2760
atgaggagta aaacacttgt agttgtacca ttatgcttat tcactaggca acaaatatat 2820
tttcagacct agaaaagctg caaatgttac tgaatacaag tatgtcctct tgtgttttag 2880
acatttatga actttccttt atgtaatttt ccagaatcct tgtcagattc taatcattgc 2940
tttataatta tagttatact catggatttg tagttgagta tgaaaatatt ttttaatgca 3000
ttttatgact tgccaattga ttgacaacat gcatcaataa cctgcaggtc gaagcttgca 3060
tgccggtcga ctctagagga tccgggtgac agccctccga cgggtgacag ccctccgacg 3120
ggtgacagcc ctccgaattc tagaggatcc gggtgacagc cctccgacgg gtgacagccc 3180
tccgacgggt gacagccctc cgaattcgag ctcggtaccc ggggatctgt cgacctcgat 3240
cgagatcttc gcaagaccct tcctctatat aaggaagttc atttcatttg gagaggacac 3300
gctgaagcta gtcgactcta gcctgcgatc gctaaaaaat ggccctgtcc aacaagttca 3360
tcggcgacga catgaagatg acctaccaca tggacggctg cgtgaacggc cactacttca 3420
ccgtgaaggg cgagggcagc ggcaagccct acgagggcac ccagacctcc accttcaagg 3480
tgaccatggc caacggcggc cccctggcct tctccttcga catcctgtcc accgtgttca 3540
tgtacggcaa ccgctgcttc accgcctacc ccaccagcat gcccgactac ttcaagcagg 3600
ccttccccga cggcatgtcc tacgagagaa ccttcaccta cgaggacggc ggcgtggcca 3660
ccgccagctg ggagatcagc ctgaagggca actgcttcga gcacaagtcc accttccacg 3720
gcgtgaactt ccccgccgac ggccccgtga tggccaagaa gaccaccggc tgggacccct 3780
ccttcgagaa gatgaccgtg tgcgacggca tcttgaaggg cgacgtgacc gccttcctga 3840
tgctgcaggg cggcggcaac tacagatgcc agttccacac ctcctacaag accaagaagc 3900
ccgtgaccat gccccccaac cacgtggtgg agcaccgcat cgccagaacc gacctggaca 3960
agggcggcaa cagcgtgcag ctgaccgagc acgccgtggc ccacatcacc tccgtggtgc 4020
ccttctgaag taacgcgttt atgatcgttc aaacatttgg caataaagtt tcttaagatt 4080
gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca 4140
tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt 4200
cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa 4260
attatcgcgc gcggtgtcat ctatgttact agatcggacc gctaattagc taagagacac 4320
ttgtgtgatt gagagaaaca ctaatcttgt gaggactgaa gtttggtgat tatttcttgt 4380
gatctgtcga caaaaatatc aaatggggtt tcttttacaa attatttacc taaatgaatc 4440
tgttttgaaa atatttactc cattgggtct atttttttat tacaaagcgt ctccctgaag 4500
ggcgcgttcc ccgtgaaagt gacacgtggc aggacttggg acgtgccctg cgtacaggcg 4560
cgatagttag tgttgttaca gcaggcgcat cgggtcgtgt tggggaccaa ggtacgacag 4620
gtcgcgctgg gtgacccaga cacgacccaa ttgggtcgca ctttatttaa tattttttat 4680
attttgtata ttgtttttat ttaatatatt tttatattat tttatttaat ttttttatat 4740
tttatataat agtttctata ttaaataaat tcttagcatt atgtatgatt ttaaagtcat 4800
aaataatttt ttatattgtt tttatttact atatttttta tattttattt aatatttata 4860
tattaaataa atccttcata ttagaaaaaa taaagaaaat attaaataaa atataaaata 4920
taaaaaagta aaaaatatta aataaaataa tataaaaaat attataaaaa caatataaaa 4980
aatataaaaa tatttaataa aataataaaa aaaatattat tttaaataaa attatttatg 5040
actttaaact ctaaagttga attttaaaaa aatataattt ttttacgatt ttagtaaaaa 5100
aaaaatacaa gccgcacaat acaagtcgcc ttctcaaacc cttcctcacg acattctcgg 5160
accttatgac accgtcacca aaacaatgat ccacgcgata ttaggcgcgt gcaaatcact 5220
ctaatccgaa actagtagac atgggaagca cgagctatac gcgagcgttt caattgccgc 5280
cacgaaagca gagaaggcca gaaacggaac cacggtaaaa tggtaagggt attttcgtaa 5340
acagaagaaa agagttgtag ctataaataa accctctaac ccacggcgca ctatttctct 5400
tcactccttc gttcactctt cttctcttgc ggctagggtt ttagcgcagc ttcttctagg 5460
ttcgttctct tccgccgctc tatggatttt aaaccttcga atcatgttta ttccattgaa 5520
ttatgttgct tgcagtttat attttctgaa tctgtagttg ttgtcttcaa tttatcctat 5580
gctttataga tcaatctttt gtgtgtgtag tacgtaattt ttgttctttt tgcttttcgt 5640
tcaagttgtt gggaataatc ggggtatcat gttttgatat tgtttgtttt cttttttgac 5700
tgcttaataa tttttaagtt ggttttggtt ttggggtttt atgtgcttgt tatattcaaa 5760
tctttgtgat ccagatctta caaaagtttt gggtttaagg atgtttttgg ctgatgatga 5820
atagatctat aaactgttcc ttttaatcga ttcaagctta ggattttact aggcttttgc 5880
gaataaatac gtgacagtaa gctaattatg tccttttttt gtctcaatca tatctgtctg 5940
ggtgtgccat aatttgtgat atgtctatct ggtagaatct tgtgttttat gctttacgat 6000
ttggtatacc tgtttttgaa cttgttgtat gatgggtatt tagatcaccc tatctttttt 6060
atgcttctgg aagttttatg taaatgtcga atatcttaat gttgttgaac ttataatgtt 6120
gtgttgatgt atgtatgatg gttttgacaa cttttttcac tggttctgaa agttttatgt 6180
aaattgcaaa tatgttaatg ttgttgaact tatttttttt ccttcgatgt tgttttgatg 6240
tatgtatgat ggttttcacc gtagtttcta tggctaatat cttaatgttg ttgagcttat 6300
ttttttcctt atatgttgtg ttgatgtatt gtatgatggt tttgacaact tttttagttt 6360
ctttgcagat ttaaggaaga aaaaaaaaat ggctcttgtt gctagaccag tgctttctgc 6420
tagagttgct gcttctagac caagagttgc tgcaagaaag gctgttagag tgtctgctat 6480
gtctcatggt gcttcatcta gaccagctac tgctagaaag tcctctggac tttctggaac 6540
tgttaggatt ccaggcgata agtctatttc ccaccgttct ttcatgttcg gaggacttgc 6600
ttctggtgag actagaatta ctggacttct tgagggcgag gatgttatta acactggaaa 6660
ggctatgcag gctatgggag ctagaattag aaaagagggc gatacctgga ttattgatgg 6720
tgttggaaac ggtggacttc ttgctccaga agctccactt gatttcggaa acgctgctac 6780
tggatgcaga cttactatgg gacttgttgg agtgtacgat ttcgattcca ccttcattgg 6840
agatgcttct cttactaaga ggccaatggg aagagtgctt aacccactta gagagatggg 6900
agttcaggtt aagtctgagg atggtgatag gcttccagtt actcttagag gaccaaagac 6960
tccaacccca attacttaca gagtgccaat ggcttctgct caagttaagt ctgctgttct 7020
tcttgctgga cttaacactc caggtattac cactgtgatc gagccaatta tgaccagaga 7080
tcataccgag aagatgcttc aaggattcgg agctaacctt accgttgaaa ctgatgctga 7140
tggtgttagg accattagac ttgagggaag aggaaagctt accggacaag ttattgatgt 7200
tccaggtgat ccatcttcta ccgctttccc tcttgttgct gctcttttgg ttccaggatc 7260
tgatgtgacc attcttaacg tgctcatgaa cccatctagg accggactta ttcttaccct 7320
tcaagaaatg ggcgctgata ttgaggttat caacccaaga cttgctggtg gtgaagatgt 7380
tgctgatctt agggttaggt cctctactct taagggtgtt actgttccag aagatagggc 7440
tccatccatg attgatgagt acccaattct tgctgtggct gctgctttcg ctgaaggtgc 7500
tactgttatg aacggacttg aggaacttag ggtgaaagag tctgataggc tttctgctgt 7560
tgctaacgga cttaagctta acggtgtgga ttgtgatgag ggtgagactt ctcttgttgt 7620
tagaggtaga ccagatggaa agggacttgg aaacgcttct ggtgcagcag ttgcaactca 7680
tcttgatcat aggatcgcta tgtccttcct tgttatgggt cttgtttctg agaacccagt 7740
taccgttgat gatgctacta tgattgctac cagcttccca gagttcatgg atcttatggc 7800
tggacttgga gctaagattg agctttctga taccaaggct gcctgactaa ttagctaaga 7860
gcttgatccg tcgacctgca gatcgttcaa acatttggca ataaagtttc ttaagattga 7920
atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 7980
taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 8040
cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 8100
tatcgcgcgc ggtgtcatct atgttactag atccctgcag gcccgggggc gcgccctaat 8160
tagctaacgg ccaggatcgc cgcgtgagcc tttagcaact agctagatta attaacgcaa 8220
tctgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 8280
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 8340
atcagaatta attctcatgt ttgacagctt atcatcgact gcacggtgca ccaatgcttc 8400
tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 8460
attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 8520
cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 8580
tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatgagg gaagcgttga 8640
tcgccgaagt atcgactcaa ctatcagagg tagttggcgt catcgagcgc catctcgaac 8700
cgacgttgct ggccgtacat ttgtacggct ccgcagtgga tggcggcctg aagccacaca 8760
gtgatattga tttgctggtt acggtgaccg taaggcttga tgaaacaacg cggcgagctt 8820
tgatcaacga ccttttggaa acttcggctt cccctggaga gagcgagatt ctccgcgctg 8880
tagaagtcac cattgttgtg cacgacgaca tcattccgtg gcgttatcca gctaagcgcg 8940
aactgcaatt tggagaatgg cagcgcaatg acattcttgc aggtatcttc gagccagcca 9000
cgatcgacat tgatctggct atcttgctga caaaagcaag agaacatagc gttgccttgg 9060
taggtccagc ggcggaggaa ctctttgatc cggttcctga acaggatcta tttgaggcgc 9120
taaatgaaac cttaacgcta tggaactcgc cgcccgactg ggctggcgat gagcgaaatg 9180
tagtgcttac gttgtcccgc atttggtaca gcgcagtaac cggcaaaatc gcgccgaagg 9240
atgtcgctgc cgactgggca atggagcgcc tgccggccca gtatcagccc gtcatacttg 9300
aagctaggca ggcttatctt ggacaagaag atcgcttggc ctcgcgcgca gatcagttgg 9360
aagaatttgt tcactacgtg aaaggcgaga tcaccaaagt agtcggcaaa taaagctcta 9420
gtggatctcc gtacccaggg atctggctcg cggcggacgc acgacgccgg ggcgagacca 9480
taggcgatct cctaaatcaa tagtagctgt aacctcgaag cgtttcactt gtaacaacga 9540
ttgagaattt ttgtcataaa attgaaatac ttggttcgca tttttgtcat ccgcggtcag 9600
ccgcaattct gacgaactgc ccatttagct ggagatgatt gtacatcctt cacgtgaaaa 9660
tttctcaagc gctgtgaaca agggttcaga ttttagattg aaaggtgagc cgttgaaaca 9720
cgttcttctt gtcgatgacg acgtcgctat gcggcatctt attattgaat accttacgat 9780
ccacgccttc aaagtgaccg cggtagccga cagcacccag ttcacaagag tactctcttc 9840
cgcgacggtc gatgtcgtgg ttgttgatct agatttaggt cgtgaagatg ggctcgagat 9900
cgttcgtaat ctggcggcaa agtctgatat tccaatcata attatcagtg gcgaccgcct 9960
tgaggagacg gataaagttg ttgcactcga gctaggagca agtgatttta tcgctaagcc 10020
gttcagtatc agagagtttc tagcacgcat tcgggttgcc ttgcgcgtgc gccccaacgt 10080
tgtccgctcc aaagaccgac ggtctttttg ttttactgac tggacactta atctcaggca 10140
acgtcgcttg atgtccgaag ctggcggtga ggtgaaactt acggcaggtg agttcaatct 10200
tctcctcgcg tttttagaga aaccccgcga cgttctatcg cgcgagcaac ttctcattgc 10260
cagtcgagta cgcgacgagg aggtttatga caggagtata gatgttctca ttttgaggct 10320
gcgccgcaaa cttgaggcag atccgtcaag ccctcaactg ataaaaacag caagaggtgc 10380
cggttatttc tttgacgcgg acgtgcaggt ttcgcacggg gggacgatgg cagcctgagc 10440
caattcccag atccccgagg aatcggcgtg agcggtcgca aaccatccgg cccggtacaa 10500
atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca ggccgcccag 10560
cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga 10620
atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag gaagccgccc 10680
aagggcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg cacccgcgat 10740
agtcgcagca tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg acgagctggc 10800
gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg gccggccggc 10860
atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct aaccgaatcc 10920
atgaaccgat accgggaagg gaagggagac aagcccggcc gcgtgttccg tccacacgtt 10980
gcggacgtac tcaagttctg ccggcgagcc gatggcggaa agcagaaaga cgacctggta 11040
gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa gaaggccaag 11100
aacggccgcc tggtgacggt atccgagggt gaagccttga ttagccgcta caagatcgta 11160
aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tggctgattg gatgtaccgc 11220
gagatcacag aaggcaagaa cccggacgtg ctgacggttc accccgatta ctttttgatc 11280
gatcccggca tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa 11340
gccagatggt tgttcaagac gatctacgaa cgcagtggca gcgccggaga gttcaagaag 11400
ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta cgatttgaag 11460
gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct accgcaacct gatcgagggc 11520
gaagcatccg ccggttccta atgtacggag cagatgctag ggcaaattgc cctagcaggg 11580
gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt acattgggaa cccaaagccg 11640
tacattggga accggaaccc gtacattggg aacccaaagc cgtacattgg gaaccggtca 11700
cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta aaactcttta 11760
aaacttatta aaactcttaa aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca 11820
gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg ccccgccgct 11880
tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat 11940
ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc gccggcgctg aggtctgcct 12000
cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc cagccagaaa 12060
gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt gattttgaac 12120
ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg atccttcaac 12180
tcagcaaaag ttcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 12240
gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 12300
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 12360
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 12420
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 12480
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagctctg 12540
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 12600
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 12660
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 12720
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 12780
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 12840
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 12900
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 12960
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 13020
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 13080
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 13140
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 13200
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 13260
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 13320
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 13380
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 13440
ttatcaaaaa ggatcttcac ctagatcctt ttgatccgga atta 13484
<210> 2
<211> 15227
<212> DNA
<213> 人工序列
<220>
<223> 载体25657
<220>
<221> 启动子
<222> (217)..(1376)
<223> AtEF1aA1启动子
<220>
<221> 基因
<222> (1395)..(6008)
<223> GR-LbCas12a 稻密码子优化的cLbCas12a-02,不具有NLS,
在N末端添加由长接头隔开的糖皮质激素受体(GR)结合结构域。
<220>
<221> 终止子
<222> (6017)..(6269)
<223> tNOS
<220>
<221> 启动子
<222> (6288)..(7901)
<223> prGmSAMS
<220>
<221> 尚未归类的特征
<222> (7914)..(7950)
<223> 锤头型核酶
<220>
<221> 尚未归类的特征
<222> (7951)..(7994)
<223> 靶向AtGL1的LbCas12a指导RNA
<220>
<221> 尚未归类的特征
<222> (7995)..(8062)
<223> HDV核酶
<220>
<221> 终止子
<222> (8063)..(8408)
<223> tAtUbq3
<400> 2
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180
tccctaatta gctaacccgg gggcgcgccg ggacccaagc ttgatatcgg aagtttctct 240
cttgagggag gttgctcgtg gaatgggaca catatggttg ttataataaa ccatttccat 300
tgtcatgaga ttttgaggtt aatatatact ttacttgttc attattttat ttggtgtttg 360
aataaatgat ataaatggct cttgataatc tgcattcatt gagatatcaa atatttactc 420
tagagaagag tgtcatatag attgatggtc cacaatcaat gaaatttttg gaagacgaac 480
atgtataacc atttgcttga ataaccttaa ttaaaaggtg tgattaaatg atgtttgtaa 540
catgtagtac taaacattca taaaacacaa ccaacccaag aggtattgag tattcacggc 600
taaacagggg cataatggta atttaaagaa tgatattatt ttatgttaaa ccctaacatt 660
ggtttcggat tcaacgctat aaataaaacc actctcgttg ctgattccat ttatcgttct 720
tattgaccct agccgctaca cacttttctg cgatatctct gaggtaagcg ttaacgtacc 780
cttagatcgt tctttttctt tttcgtctgc tgatcgttgc tcatattatt tcgatgattg 840
ttggattcga tgctctttgt tgattgatcg ttctgaaaat tctgatctgt tgtttagatt 900
ttatcgattg ttaatatcaa cgtttcactg cttctaaacg ataatttatt catgaaacta 960
ttttcccatt ctgatcgatc ttgttttgag attttaattt gttcgattga ttgttggttg 1020
gtggatctat atacgagtga acttgttgat ttgcgtattt aagatgtatg tcgatttgaa 1080
ttgtgattgg gtaattctgg agtagcataa caaatccagt gttccctttt tctaagggta 1140
attctcggat tgtttgcttt atatctcttg aaattgccga tttgattgaa tttagctcgc 1200
ttagctcaga tgatagagca ccacaatttt tgtggtagaa atcggtttga ctccgatagc 1260
ggctttttac tatgattgtt ttgtgttaaa gatgattttc ataatggtta tatatctcta 1320
ctgtttttat tgattcaata tttgattgtt cttttttttg cagatttgtt gaccagggat 1380
cccctaaata gaccatggct attcagcaag ccactgcagg agtctcacaa gacacttcgg 1440
aaaatcctaa caaaacaata gttcctgctg cattaccaca gctcacccct accttggtgt 1500
cactgctgga ggtgattgaa cccgaggtgt tgtatgcagg atatgatagc tctgttccag 1560
attcagcatg gagaattatg accacactca acatgttagg tgggcgtcaa gtgattgcag 1620
cagtgaaatg ggcaaaggcg ataccaggct tcagaaactt acacctggat gaccaaatga 1680
ccctgctaca gtactcatgg atgtttctca tggcatttgc cctgggttgg agatcataca 1740
gacaatcaag tggaaacctg ctctgctttg ctcctgatct gattattaat gagcagagaa 1800
tgtctctacc ctgcatgtat gaccaatgta aacacatgct gtttgtctcc tctgaattac 1860
aaagattgca ggtatcctat gaagagtatc tctgtatgaa aaccttactg cttctctcct 1920
cagttcctaa ggaaggtctg aagagccaag agttatttga tgagattcga atgacttata 1980
tcaaagagct aggaaaagcc atcgtcaaaa gggaagggaa ctccagtcag aactggcaac 2040
ggttttacca actgacaaag cttctggact ccatgcatga ggtggttgag aatctcctta 2100
cctactgctt ccagacattt ttggataaga ccatgagtat tgaattccca gagatgttag 2160
ctgaaatcat cactaatcag ataccaaaat attcaaatgg aaatatcaaa aagcttctgt 2220
ttcatcaaaa agggggcggg ggctcaggcg ggggcgggag cggcggcggg ggctctgggg 2280
gcggcggcag cggcgggggc ggcagcgggg gcggcgggtc gatgtcaaag ctcgagaaat 2340
tcaccaactg ttattcgttg agcaaaacac tgcggtttaa agcgattcca gtcggcaaga 2400
ctcaagagaa tatagacaat aagcggctgt tggtggaaga tgaaaagcgc gcggaagact 2460
acaaaggggt gaagaagttg ttggacagat actacctctc ttttatcaat gatgtcttgc 2520
actcaatcaa attgaagaat ctgaacaact acatctccct cttcagaaag aaaacaagga 2580
cagaaaagga gaataaggaa cttgaaaatt tggagatcaa tctgaggaaa gagatcgcga 2640
aagcctttaa aggcaacgaa ggatacaaaa gtctgttcaa gaaggatata attgagacaa 2700
ttttgccaga gttcctcgat gacaaggacg agattgcgct ggtcaattcg ttcaacggat 2760
tcacaacagc attcacaggc ttctttgata atcgggaaaa tatgttctct gaggaggcaa 2820
agtccacttc tattgcgttc aggtgtatca atgagaatct cactaggtac atttccaaca 2880
tggatatctt tgagaaggtt gacgcaattt ttgacaagca cgaagttcag gagattaagg 2940
agaagatcct caattccgat tatgacgttg aggacttctt cgagggtgag ttttttaatt 3000
tcgtgctcac tcaagagggt atcgacgtgt ataatgcgat catcggtggg ttcgtgactg 3060
agtccggtga aaagattaag ggattgaacg agtatatcaa cctttacaac caaaagacga 3120
aacagaagct gccaaagttc aagcctcttt acaaacaggt tctttcagac cgcgagtcac 3180
tctcgttcta tggggagggc tacacttcgg atgaggaagt cctggaggtg ttcaggaata 3240
ctctcaataa gaattcggag attttctctt ctataaaaaa actggaaaag ttgtttaaga 3300
attttgacga atactctagc gccggcatat ttgtgaaaaa cggcccggcc atatcaacga 3360
taagtaaaga tatcttcggc gaatggaacg tgatcagaga caaatggaac gcggagtatg 3420
acgatattca cctgaagaag aaggctgtcg taacggagaa gtacgaggat gatcgcagga 3480
aaagcttcaa aaagatcgga agtttcagcc tggaacagtt gcaggagtat gctgacgccg 3540
atcttagcgt cgtcgagaag ttgaaggaga taatcatcca aaaggtcgac gagatatata 3600
aagtctatgg atcaagtgaa aaactgttcg acgccgactt cgttttggag aagtccctga 3660
agaagaacga cgctgttgtt gccattatga aggatctgct cgacagcgtg aagagtttcg 3720
agaactatat taaggctttt ttcggggagg ggaaggagac taacagagat gagtccttct 3780
acggagactt cgtcctcgcg tacgatatac tccttaaggt agaccacatc tacgacgcaa 3840
tcagaaatta cgtgacacaa aagccgtaca gcaaggacaa gttcaaactc tacttccaga 3900
acccccagtt catgggcggc tgggacaagg acaaggaaac ggattacagg gctacgatcc 3960
tgaggtatgg ttcaaaatac tacttggcga ttatggacaa gaagtacgcc aagtgtctcc 4020
agaagattga caaagacgat gtcaatggca attatgagaa gatcaactac aagctgcttc 4080
cgggtccgaa caagatgctc ccaaaggttt tcttcagcaa gaaatggatg gcctactata 4140
acccaagcga ggacatccag aagatttata agaacggtac gttcaagaag ggcgacatgt 4200
tcaatcttaa cgactgtcac aagctgatcg acttcttcaa agactcaatt agccggtacc 4260
caaagtggtc taacgcctat gacttcaact tttcggaaac cgagaagtac aaggatatag 4320
ccggatttta tagagaggtg gaagagcagg gctacaaggt gtcattcgag tccgccagca 4380
agaaggaagt ggacaagctc gtggaagagg gtaagctcta catgttccag atttataata 4440
aagactttag cgataagagc cacgggacac ctaatctcca cacaatgtat ttcaagctgc 4500
tcttcgacga gaataaccac ggccaaatca ggttgtcagg aggggctgaa ctcttcatgc 4560
ggcgcgctag ccttaagaag gaggagcttg tagtccaccc tgcgaatagt ccaattgcga 4620
ataagaaccc ggacaatcct aaaaagacta caacattgag ctacgacgtg tacaaggata 4680
agaggttttc cgaggatcag tacgagctcc acatcccgat tgcgatcaac aagtgcccaa 4740
agaatatttt caagataaac acagaggtgc gtgtactcct gaagcatgac gacaatcctt 4800
acgtcattgg gattgatcgg ggcgagagga acctcctcta tattgtggtg gtggacggga 4860
aggggaacat agtcgaacag tactccctta acgaaataat taacaatttc aacggcatcc 4920
gtatcaagac cgactaccat tcgttgctgg acaagaagga gaaggagaga tttgaggcgc 4980
ggcaaaattg gacaagtatc gagaacatca aggaactcaa agcaggttat atctctcaag 5040
ttgtgcataa gatatgcgag ctggttgaga agtatgacgc agtgatcgct cttgaggacc 5100
tcaactcggg ctttaagaat tctagagtta aagtggagaa gcaggtctat caaaagttcg 5160
agaagatgct tatagataag ctcaactaca tggtcgataa gaaatcgaac ccatgtgcca 5220
ccggcggcgc actcaaaggt taccaaataa caaacaaatt cgagtccttc aaatcgatga 5280
gtactcagaa tgggttcata ttttatatac cggcgtggct tacgtctaag atcgacccgt 5340
caactggttt tgtcaacctg ttgaagacga aatacacgtc cattgccgat tcaaaaaagt 5400
tcatatctag ttttgatcgt attatgtacg tcccagagga agatcttttc gagtttgctc 5460
tcgactacaa aaacttttcg cgcaccgatg cggattacat taaaaaatgg aaactctatt 5520
cgtacggcaa cagaatcagg atttttcgca accctaagaa gaataacgtc tttgattggg 5580
aggaagtttg cttgactagc gcgtacaagg agctctttaa taagtatggc attaactacc 5640
aacagggtga tatcagagca ctgctttgcg aacaatctga caaggctttc tactcatcct 5700
tcatggcttt gatgagcctg atgctccaga tgagaaattc aattacaggc agaaccgacg 5760
tggatttctt gatctccccg gttaaaaatt ctgatggcat cttttacgat agcaggaact 5820
atgaagcgca agagaatgcg attctgccaa aaaatgcaga cgccaacggt gcctataaca 5880
tcgccaggaa agtcctgtgg gcgatcggcc agttcaaaaa ggccgaagac gaaaaattgg 5940
acaaggtcaa aatcgctatc agcaacaaag agtggctgga gtatgctcag acatccgtaa 6000
agcattgatt aattaagatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc 6060
tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat 6120
aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca 6180
attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc 6240
gcgcgcggtg tcatctatgt tactagatct tcgaattaac tagctagtcc accctcacaa 6300
aaaaggttat tgcctaatta atagtaggga ttgaagaagt atcaataatc aataagaggg 6360
acatttggat tgacacaaac tattagtata aaaaaaaaat gtaaaactaa atggacaaca 6420
atctaagaaa gcgagtatgt gttgtactcg gaaaacataa cataatgtga ttttgattgt 6480
ggaaactgaa aacaataaca attaagtttt atttatctct ttgcctaaca atttttttaa 6540
ttactttttt tatagttttt atgatgaaga taattaatat tttttacaaa tattatattt 6600
tcctttttac catctttgaa gataattgct tttttttcca atttagacaa atatttgagt 6660
atcaatgata ttccttttta atccattatt gcaatttaaa agaccatcaa tgattacatt 6720
ttcaatcaaa tgactttatt agtcttcact ttacatcgat ttaaatcaaa ctaataattt 6780
tgtatggact aaatctctga acatttttat atttacaaca tattttaaca tttattaaat 6840
aattagtatt taatactatt agtagaataa tgggagtagc aggagggagg cactgagaga 6900
atagagatgg catggaagta agcaatcaag tcaaaatcag agttggccaa ccccaaaggc 6960
tgtagtaggt aagcatggcc cattttagtt tttacattca tctctcattt tcacctcaac 7020
ggttcagatt caatctgact ccccgatctc agccgtggat tcaaatgcca cctcaggcac 7080
atgcaattcc aaatggatga acctaaccca caatctaatc ttgttactta ggggcttttc 7140
cgtcattaaa tgacaccacc tacccccttc tccctataaa tggcaactca atccccccct 7200
tagaactcgc agcgcttgat ttgaggccag gcaagcccca ctcaaccacc acacctctcc 7260
tcgttcacgc tacccctttc tgctcttctt ctacctttca aggtactctt ctttccctct 7320
gttgctgcaa ccttctcttt ctttaagatt gcctcaattt cggatcttgc acctctgggt 7380
tgctttgctt tgctttttcc tctactgggt tgatttctgt ttccctaaac cggtttagac 7440
gaatgtgaac actacttctt ttgtttaatt actctggaat acgtgttagg ctttcagatc 7500
tagttgaaat cgtattgcac ttttaggggg agtttggatt tctaataaga aattgacctt 7560
ttgctgagaa ttggttcggt gattagaggg tttccgtaaa tttttgaagt tttacatgct 7620
tgtatctgtt tatttttgtt tctcacatct attattgtta ggtgaaggaa attatgtatt 7680
gagagtctgt ctgatactaa atataaacac ctcaataggg gctctaacac tgattttatc 7740
atttgctgct tgtgtgtatg gttaaagaaa ggcaattgtg ttttaatttt ctgcaagctt 7800
tcgtttgctg aattttatgc atatattttc ctcccttttg tgaacttcct ttttgtagtt 7860
ctaattccat ttttggtgtc tgcagtttta aaagtataaa gggatccaaa ttactgatga 7920
gtccgtgagg acgaaacgag taagctcgtc taatttctac taagtgtaga tccacatctc 7980
tttagcccta tcaaggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat 8040
gcttcggcat ggcgaatggg acagcttttt gtgatctgat gataagtggt tggttcgtgt 8100
ctcatgcact tgggaggtga tctatttcac ctggtgtagt ttgtgtttcc gtcagttgga 8160
aaaacttatc cctatcgatt tcgttttcat tttctgcttt tcttttatgt accttcgttt 8220
gggcttgtaa cgggcctttg tatttcaact ctcaataata atccaagtgc atgttaaaca 8280
atttgtcatc tgtttcggct ttgatatact actggtgaag atgggccgta ctactgcatc 8340
acaacgaaaa ataataataa gatgaaaaac ttgaagtgga aaaaaaaaac ttgaatgttc 8400
actactacgg accgctagtg catgcactga ctaattagct aactggcaga caaagtggca 8460
gacatactgt cccacaaatg aagatggaat ctgtaaaaga aaacgcgtga aataatgcgt 8520
ctgacaaagg ttaggtcggc tgcctttaat caataccaaa gtggtcccta ccacgatgga 8580
aaaactgtgc agtcggtttg gctttttctg acgaacaaat aagattcgtg gccgacaggt 8640
gggggtccac catgtgaagg catcttcaga ctccaataat ggagcaatga cgtaagggct 8700
tacgaaataa gtaagggtag tttgggaaat gtccactcac ccgtcagtct ataaatactt 8760
agcccctccc tcattgttaa gggagcaaga cctaaaccat gattgaacaa gatggattgc 8820
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 8880
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 8940
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 9000
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 9060
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 9120
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 9180
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 9240
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 9300
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 9360
acggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 9420
actgtggccg gctgggtgtg gcagaccgct atcaggacat agcgttggct acccgtgata 9480
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 9540
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgatgagagc 9600
tctagatccc cgaatttccc cgatcgttca aacatttggc aataaagttt cttaagattg 9660
aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta cgttaagcat 9720
gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat gattagagtc 9780
ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa 9840
ttatcgcgcg cggtgtcatc tatgttacta gatcattagc ctgcaggccc gggttagtct 9900
aattagctaa cggccaggat cgccgcgtga gcctttagca actagctaga gcgatcgccg 9960
caatctgtta ttaagttgtc taagcgtcaa tttgtttaca ccacaatata tcctgccacc 10020
agccagccaa cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag 10080
cccatcagaa ttaattctca tgtttgacag cttatcatcg actgcacggt gcaccaatgc 10140
ttctggcgtc aggcagccat cggaagctgt ggtatggctg tgcaggtcgt aaatcactgc 10200
ataattcgtg tcgctcaagg cgcactcccg ttctggataa tgttttttgc gccgacatca 10260
taacggttct ggcaaatatt ctgaaatgag ctgttgacaa ttaatcatcc ggctcgtata 10320
atgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagaccatg agggaagcgt 10380
tgatcgccga agtatcgact caactatcag aggtagttgg cgtcatcgag cgccatctcg 10440
aaccgacgtt gctggccgta catttgtacg gctccgcagt ggatggcggc ctgaagccac 10500
acagtgatat tgatttgctg gttacggtga ccgtaaggct tgatgaaaca acgcggcgag 10560
ctttgatcaa cgaccttttg gaaacttcgg cttcccctgg agagagcgag attctccgcg 10620
ctgtagaagt caccattgtt gtgcacgacg acatcattcc gtggcgttat ccagctaagc 10680
gcgaactgca atttggagaa tggcagcgca atgacattct tgcaggtatc ttcgagccag 10740
ccacgatcga cattgatctg gctatcttgc tgacaaaagc aagagaacat agcgttgcct 10800
tggtaggtcc agcggcggag gaactctttg atccggttcc tgaacaggat ctatttgagg 10860
cgctaaatga aaccttaacg ctatggaact cgccgcccga ctgggctggc gatgagcgaa 10920
atgtagtgct tacgttgtcc cgcatttggt acagcgcagt aaccggcaaa atcgcgccga 10980
aggatgtcgc tgccgactgg gcaatggagc gcctgccggc ccagtatcag cccgtcatac 11040
ttgaagctag gcaggcttat cttggacaag aagatcgctt ggcctcgcgc gcagatcagt 11100
tggaagaatt tgttcactac gtgaaaggcg agatcaccaa agtagtcggc aaataaagct 11160
ctagtggatc tccgtaccca gggatctggc tcgcggcgga cgcacgacgc cggggcgaga 11220
ccataggcga tctcctaaat caatagtagc tgtaacctcg aagcgtttca cttgtaacaa 11280
cgattgagaa tttttgtcat aaaattgaaa tacttggttc gcatttttgt catccgcggt 11340
cagccgcaat tctgacgaac tgcccattta gctggagatg attgtacatc cttcacgtga 11400
aaatttctca agcgctgtga acaagggttc agattttaga ttgaaaggtg agccgttgaa 11460
acacgttctt cttgtcgatg acgacgtcgc tatgcggcat cttattattg aataccttac 11520
gatccacgcc ttcaaagtga ccgcggtagc cgacagcacc cagttcacaa gagtactctc 11580
ttccgcgacg gtcgatgtcg tggttgttga tctagattta ggtcgtgaag atgggctcga 11640
gatcgttcgt aatctggcgg caaagtctga tattccaatc ataattatca gtggcgaccg 11700
ccttgaggag acagataaag ttgttgcact cgagctagga gcaagtgatt ttatcgctaa 11760
gccgttcagt atcagagagt ttctagcacg cattcgggtt gccttgcgcg tgcgccccaa 11820
cgttgtccgc tccaaagacc gacggtcttt ttgttttact gactggacac ttaatctcag 11880
gcaacgtcgc ttgatgtccg aagctggcgg tgaggtgaaa cttacggcag gtgagttcaa 11940
tcttctcctc gcgtttttag agaaaccccg cgacgttcta tcgcgcgagc aacttctcat 12000
tgccagtcga gtacgcgacg aggaggttta tgacaggagt atagatgttc tcattttgag 12060
gctgcgccgc aaacttgagg cagatccgtc aagccctcaa ctgataaaaa cagcaagagg 12120
tgccggttat ttctttgacg cggacgtgca ggtttcgcac ggggggacga tggcagcctg 12180
agccaattcc cagatccccg aggaatcggc gtgagcggtc gcaaaccatc cggcccggta 12240
caaatcggcg cggcgctggg tgatgacctg gtggagaagt tgaaggccgc gcaggccgcc 12300
cagcggcaac gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc ggccgctgat 12360
cgaatccgca aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat taggaagccg 12420
cccaagggcg acgagcaacc agattttttc gttccgatgc tctatgacgt gggcacccgc 12480
gatagtcgca gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga ccgacgagct 12540
ggcgaggtga tccgctacga gcttccagac gggcacgtag aggtttccgc agggccggcc 12600
ggcatggcca gtgtgtggga ttacgacctg gtactgatgg cggtttccca tctaaccgaa 12660
tccatgaacc gataccggga agggaaggga gacaagcccg gccgcgtgtt ccgtccacac 12720
gttgcggacg tactcaagtt ctgccggcga gccgatggcg gaaagcagaa agacgacctg 12780
gtagaaacct gcattcggtt aaacaccacg cacgttgcca tgcagcgtac gaagaaggcc 12840
aagaacggcc gcctggtgac ggtatccgag ggtgaagcct tgattagccg ctacaagatc 12900
gtaaagagcg aaaccgggcg gccggagtac atcgagatcg agctggctga ttggatgtac 12960
cgcgagatca cagaaggcaa gaacccggac gtgctgacgg ttcaccccga ttactttttg 13020
atcgatcccg gcatcggccg ttttctctac cgcctggcac gccgcgccgc aggcaaggca 13080
gaagccagat ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg agagttcaag 13140
aagttctgtt tcaccgtgcg caagctgatc gggtcaaatg acctgccgga gtacgatttg 13200
aaggaggagg cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa cctgatcgag 13260
ggcgaagcat ccgccggttc ctaatgtacg gagcagatgc tagggcaaat tgccctagca 13320
ggggaaaaag gtcgaaaagg tctctttcct gtggatagca cgtacattgg gaacccaaag 13380
ccgtacattg ggaaccggaa cccgtacatt gggaacccaa agccgtacat tgggaaccgg 13440
tcacacatgt aagtgactga tataaaagag aaaaaaggcg atttttccgc ctaaaactct 13500
ttaaaactta ttaaaactct taaaacccgc ctggcctgtg cataactgtc tggccagcgc 13560
acagccgaag agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct acgccccgcc 13620
gcttcgcgtc ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct acggccaggc 13680
aatctaccag ggcgcggaca agccgcgccg tcgccactcg accgccggcg ctgaggtctg 13740
cctcgtgaag aaggtgttgc tgactcatac caggcctgaa tcgccccatc atccagccag 13800
aaagtgaggg agccacggtt gatgagagct ttgttgtagg tggaccagtt ggtgattttg 13860
aacttttgct ttgccacgga acggtctgcg ttgtcgggaa gatgcgtgat ctgatccttc 13920
aactcagcaa aagttcgatt tattcaacaa agccgccgtc ccgtcaagtc agcgtaatgc 13980
tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg agcatcaaat 14040
gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 14100
gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 14160
ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 14220
ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagct 14280
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 14340
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 14400
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 14460
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 14520
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 14580
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 14640
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 14700
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 14760
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 14820
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 14880
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 14940
tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 15000
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 15060
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 15120
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 15180
agattatcaa aaaggatctt cacctagatc cttttgatcc ggaatta 15227
<210> 3
<211> 13770
<212> DNA
<213> 人工序列
<220>
<223> 载体25765
<220>
<221> 启动子
<222> (217)..(1376)
<223> prAtEF1aA1
<220>
<221> 基因
<222> (1395)..(3857)
<223> 来自构巢曲霉的AlcR拟南芥优化的醇受体基因(AlcR)
<220>
<221> 终止子
<222> (3869)..(4121)
<223> tNOS
<220>
<221> 启动子
<222> (4128)..(4463)
<223> prAlcA
<220>
<221> 外显子
<222> (4482)..(5096)
<223> Gus
<220>
<221> 内含子
<222> (5097)..(5505)
<223> iAtBAF60
<220>
<221> 外显子
<222> (5506)..(6702)
<223> Gus
<220>
<221> 终止子
<222> (6711)..(6950)
<223> tPI2
<400> 3
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180
tccctaatta gctaacccgg gggcgcgccg ggacccaagc ttgatatcgg aagtttctct 240
cttgagggag gttgctcgtg gaatgggaca catatggttg ttataataaa ccatttccat 300
tgtcatgaga ttttgaggtt aatatatact ttacttgttc attattttat ttggtgtttg 360
aataaatgat ataaatggct cttgataatc tgcattcatt gagatatcaa atatttactc 420
tagagaagag tgtcatatag attgatggtc cacaatcaat gaaatttttg gaagacgaac 480
atgtataacc atttgcttga ataaccttaa ttaaaaggtg tgattaaatg atgtttgtaa 540
catgtagtac taaacattca taaaacacaa ccaacccaag aggtattgag tattcacggc 600
taaacagggg cataatggta atttaaagaa tgatattatt ttatgttaaa ccctaacatt 660
ggtttcggat tcaacgctat aaataaaacc actctcgttg ctgattccat ttatcgttct 720
tattgaccct agccgctaca cacttttctg cgatatctct gaggtaagcg ttaacgtacc 780
cttagatcgt tctttttctt tttcgtctgc tgatcgttgc tcatattatt tcgatgattg 840
ttggattcga tgctctttgt tgattgatcg ttctgaaaat tctgatctgt tgtttagatt 900
ttatcgattg ttaatatcaa cgtttcactg cttctaaacg ataatttatt catgaaacta 960
ttttcccatt ctgatcgatc ttgttttgag attttaattt gttcgattga ttgttggttg 1020
gtggatctat atacgagtga acttgttgat ttgcgtattt aagatgtatg tcgatttgaa 1080
ttgtgattgg gtaattctgg agtagcataa caaatccagt gttccctttt tctaagggta 1140
attctcggat tgtttgcttt atatctcttg aaattgccga tttgattgaa tttagctcgc 1200
ttagctcaga tgatagagca ccacaatttt tgtggtagaa atcggtttga ctccgatagc 1260
ggctttttac tatgattgtt ttgtgttaaa gatgattttc ataatggtta tatatctcta 1320
ctgtttttat tgattcaata tttgattgtt cttttttttg cagatttgtt gaccagggat 1380
cccctaaata gaccatggct gatactcgaa gaagacagaa tcattcttgt gatccatgcc 1440
gcaaaggtaa acgtcggtgt gacgcacctg aaaacagaaa tgaagcaaac gagaatggat 1500
gggtgagctg ttcaaactgt aagagatgga acaaagattg cactttcaac tggttatcgt 1560
cccagagaag caaggcgaaa ggtgcagctc cacgggctcg aaccaagaaa gctagaactg 1620
ccaccacgac atctgaacca tcaacatctg cagcaaccat tccaacacca gagtcggaca 1680
accatgacgc tcctccggtg ataaactctc acgatgccct ccctagttgg acccagggac 1740
tattatcgca tcctggggac ctttttgact tttctcatag tgccattccg gcgaatgcag 1800
aagatgcagc caatgttcaa tcggatgctc catttccatg ggatcttgca attccaggtg 1860
atttctcaat gggacagcag cttgagaaac ctctctcccc tttgtcattc caagctgtcc 1920
tattacctcc tcattcccca aacacagatg atcttataag agagctagaa gagcaaacca 1980
ctgatcctga ttcagttacg gacacaaaca gtgtgcaaca agttgctcaa gatggatcct 2040
tgtggtcaga caggcaaagt ccgttactac ctgaaaattc tctctgcatg gcttcggact 2100
caaccgctcg tagatatgca cggagtacaa tgacaaaaaa cttgatgcgt atctaccatg 2160
attccatgga gaacgctctt tcttgctggc tcactgaaca caattgtcct tattctgatc 2220
aaatctctta tctcccacct aagcaaaggg ctgaatgggg tcctaattgg agcaatagga 2280
tgtgtataag ggtttgtaga cttgatcgtg taagtacgtc actgagaggc agagcattat 2340
cagcagaaga agacaaagct gctgctagag cccttcatct ggcgattgtt gcattcgcat 2400
ctcaatggac gcaacacgct caacgcggag ctggtttgaa tgtcccggct gacattgctg 2460
ccgacgaaag atcaatcagg agaaacgctt ggaatgaggc aagacacgcg ttgcagcata 2520
ctactgggat cccttctttc cgagtgattt tcgctaatat catcttcagc ctgactcaga 2580
gtgtactgga tgatgatgaa caacatggaa tgggtgcgcg attggacaag cttttggaga 2640
atgatggtgc accggttttc ttggaaactg ctaataggca attgtacaca tttcgtcaca 2700
agtttgccag aatgcaacgg agaggcaagg cttttaatcg cttacccggt ggttccgtcg 2760
cttccacttt tgctggaata tttgagaccc caactccatc tagtgagtct cctcaacttg 2820
atccagttgt tgcatctgag gaacatcgta gcactctatc gctcatgttc tggcttggaa 2880
taatgtttga tacactttca gctgcaatgt accagagacc attagtggta tctgatgagg 2940
attcacagat atccagtgct tctcccccga gacgaggcgc cgagactcct atcaatttag 3000
actgttggga acctccacgt caagtccctt cgaatcaaga aaagtctgat gtttggggag 3060
atttgtttct cagaacatca gactctttac cagatcatga atcacacaca cagatttctc 3120
agccagctgc aaggtggcct tgcacctatg agcaggctgc ggccgcattg agctcagcga 3180
cacctgttaa ggttttgctc tacaggagag tgactcaact gcaaacactt ctatacaggg 3240
gggcgtctcc agcgaggctt gaagctgcga tccaaagaac cctttacgtg tataatcact 3300
ggacagctaa gtatcaacct ttcatgcagg attgtgttgc aaatcatgag ttgttgccca 3360
gccggattca gtcatggtac gtcatccttg acggccattg gcatcttgct gctatgttgc 3420
ttgctgatgt gttagaaagc atagatagag attcgtatag cgatataaac cacattgatt 3480
tggttacgaa gttgcgtctc gataatgctc tagccgtctc tgcccttgcg agatcttcct 3540
tgcgtggtca agagcttgat ccggggaaag catcaccaat gtataggcat ttccatgata 3600
gtctaacgga agtggctttt cttgtcgagc cgtggactgt agtacttatt cactcttttg 3660
caaaggcagc ttatattctc ttagattgtt tggatctcga cggacaagga aacgcactgg 3720
cgggctacct gcagctccgt cagaactgca actattgcat ccgagctctt cagtttttag 3780
gtagaaaatc cgatatggca gctctagtag ctaaagacct cgagaggggt ttaaacggaa 3840
aagttgatag ctttctgtga ttaattaaga tcgttcaaac atttggcaat aaagtttctt 3900
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 3960
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 4020
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 4080
ggataaatta tcgcgcgcgg tgtcatctat gttactagat ctccggatcg atagttgtga 4140
tagttcccac ttgtccgtcc gcatcggcat ccgcagctcg ggatagttcc gacctaggat 4200
tggatgcatg cggaaccgca cgagggcggg gcggaaattg acacaccact cctctccacg 4260
caccgttcaa gaggtacgcg tatagagccg tatagagcag agacggagca ctttctggta 4320
ctgtccgcac gggatgtccg cacggagagc cacaaacgag cggggccccg tacgtgctct 4380
cctaccccag gatcgcatcc ccgcatagct gaacatctat ataaagaccc ccaaggttct 4440
cagtctcacc aacatcatca accggatccc ctaaatagac c atg gta cgt cct gta 4496
Met Val Arg Pro Val
1 5
gaa acc cca acc cgt gaa atc aaa aaa ctc gac ggc ctg tgg gca ttc 4544
Glu Thr Pro Thr Arg Glu Ile Lys Lys Leu Asp Gly Leu Trp Ala Phe
10 15 20
agt ctg gat cgc gaa aac tgt gga att gat cag cgt tgg tgg gaa agc 4592
Ser Leu Asp Arg Glu Asn Cys Gly Ile Asp Gln Arg Trp Trp Glu Ser
25 30 35
gcg tta caa gaa agc cgg gca att gct gtg cca ggc agt ttt aac gat 4640
Ala Leu Gln Glu Ser Arg Ala Ile Ala Val Pro Gly Ser Phe Asn Asp
40 45 50
cag ttc gcc gat gca gat att cgt aat tat gcg ggc aac gtc tgg tat 4688
Gln Phe Ala Asp Ala Asp Ile Arg Asn Tyr Ala Gly Asn Val Trp Tyr
55 60 65
cag cgc gaa gtc ttt ata ccg aaa ggt tgg gca ggc cag cgt atc gtg 4736
Gln Arg Glu Val Phe Ile Pro Lys Gly Trp Ala Gly Gln Arg Ile Val
70 75 80 85
ctg cgt ttc gat gcg gtc act cat tac ggc aaa gtg tgg gtc aat aat 4784
Leu Arg Phe Asp Ala Val Thr His Tyr Gly Lys Val Trp Val Asn Asn
90 95 100
cag gaa gtg atg gag cat cag ggc ggc tat acg cca ttt gaa gcc gat 4832
Gln Glu Val Met Glu His Gln Gly Gly Tyr Thr Pro Phe Glu Ala Asp
105 110 115
gtc acg ccg tat gtt att gcc ggg aaa agt gta cgt atc acc gtt tgt 4880
Val Thr Pro Tyr Val Ile Ala Gly Lys Ser Val Arg Ile Thr Val Cys
120 125 130
gtg aac aac gaa ctg aac tgg cag act atc ccg ccg gga atg gtg att 4928
Val Asn Asn Glu Leu Asn Trp Gln Thr Ile Pro Pro Gly Met Val Ile
135 140 145
acc gac gaa aac ggc aag aaa aag cag tct tac ttc cat gat ttc ttt 4976
Thr Asp Glu Asn Gly Lys Lys Lys Gln Ser Tyr Phe His Asp Phe Phe
150 155 160 165
aac tat gcc gga atc cat cgc agc gta atg ctc tac acc acg ccg aac 5024
Asn Tyr Ala Gly Ile His Arg Ser Val Met Leu Tyr Thr Thr Pro Asn
170 175 180
acc tgg gtg gac gat atc acc gtg gtg acg cat gtc gcg caa gac tgt 5072
Thr Trp Val Asp Asp Ile Thr Val Val Thr His Val Ala Gln Asp Cys
185 190 195
aac cac gcg tct gtt gac tgg cag gtaccaagct gcgaatcttc gtttttttaa 5126
Asn His Ala Ser Val Asp Trp Gln
200 205
ggaattctcg atctttatgg tgtataggct ctgggttttc tgttttttgt atctcttagg 5186
attttgtaaa ttccagatct ttctatggcc acttagtagt atatttcaaa aattctccaa 5246
tcgagttctt cattcgcatt ttcagtcatt ttctcttcga cgttgttttt aagcctgggt 5306
attactccta tttagttgaa ctctgcagca atcttagaaa attagggttt tgaggtttcg 5366
atttctctag gtaaccgatc tattgcattc atctgaattt ctgcatatat gtcttagatt 5426
tctgataagc ttacgatacg ttaggtgtaa ttgaagttta tttttcaaga gtgttatttt 5486
ttgtttctga atttttcag gtg gtg gcc aat ggt gat gtc agc gtt gaa ctg 5538
Val Val Ala Asn Gly Asp Val Ser Val Glu Leu
210 215
cgt gat gcg gat caa cag gtg gtt gca act gga caa ggc act agc ggg 5586
Arg Asp Ala Asp Gln Gln Val Val Ala Thr Gly Gln Gly Thr Ser Gly
220 225 230
act ttg caa gtg gtg aat ccg cac ctc tgg caa ccg ggt gaa ggt tat 5634
Thr Leu Gln Val Val Asn Pro His Leu Trp Gln Pro Gly Glu Gly Tyr
235 240 245
ctc tat gaa ctg tgc gtc aca gcc aaa agc cag aca gag tgt gat atc 5682
Leu Tyr Glu Leu Cys Val Thr Ala Lys Ser Gln Thr Glu Cys Asp Ile
250 255 260
tac ccg ctt cgc gtc ggc atc cgg tca gtg gca gtg aag ggc gaa cag 5730
Tyr Pro Leu Arg Val Gly Ile Arg Ser Val Ala Val Lys Gly Glu Gln
265 270 275 280
ttc ctg att aac cac aaa ccg ttc tac ttt act ggc ttt ggt cgt cat 5778
Phe Leu Ile Asn His Lys Pro Phe Tyr Phe Thr Gly Phe Gly Arg His
285 290 295
gaa gat gcg gac ttg cgt ggc aaa gga ttc gat aac gtg ctg atg gtg 5826
Glu Asp Ala Asp Leu Arg Gly Lys Gly Phe Asp Asn Val Leu Met Val
300 305 310
cac gac cac gca tta atg gac tgg att ggg gcc aac tcc tac cgt acc 5874
His Asp His Ala Leu Met Asp Trp Ile Gly Ala Asn Ser Tyr Arg Thr
315 320 325
tcg cat tac cct tac gct gaa gag atg ctc gac tgg gca gat gaa cat 5922
Ser His Tyr Pro Tyr Ala Glu Glu Met Leu Asp Trp Ala Asp Glu His
330 335 340
ggc atc gtg gtg att gat gaa act gct gct gtc ggc ttt aac ctc tct 5970
Gly Ile Val Val Ile Asp Glu Thr Ala Ala Val Gly Phe Asn Leu Ser
345 350 355 360
tta ggc att ggt ttc gaa gcg ggc aac aag ccg aaa gaa ctg tac agc 6018
Leu Gly Ile Gly Phe Glu Ala Gly Asn Lys Pro Lys Glu Leu Tyr Ser
365 370 375
gaa gag gca gtc aac ggg gaa act cag caa gcg cac tta cag gcg att 6066
Glu Glu Ala Val Asn Gly Glu Thr Gln Gln Ala His Leu Gln Ala Ile
380 385 390
aaa gag ctg ata gcg cgt gac aaa aac cac cca agc gtg gtg atg tgg 6114
Lys Glu Leu Ile Ala Arg Asp Lys Asn His Pro Ser Val Val Met Trp
395 400 405
agt att gcc aac gaa ccg gat acc cgt ccg caa ggt gca cgg gaa tat 6162
Ser Ile Ala Asn Glu Pro Asp Thr Arg Pro Gln Gly Ala Arg Glu Tyr
410 415 420
ttc gcg cca ctg gcg gaa gca acg cgt aaa ctc gac ccg acg cgt ccg 6210
Phe Ala Pro Leu Ala Glu Ala Thr Arg Lys Leu Asp Pro Thr Arg Pro
425 430 435 440
atc acc tgc gtc aat gta atg ttc tgc gac gct cac acc gat acc atc 6258
Ile Thr Cys Val Asn Val Met Phe Cys Asp Ala His Thr Asp Thr Ile
445 450 455
agc gat ctc ttt gat gtg ctg tgc ctg aac cgt tat tac gga tgg tat 6306
Ser Asp Leu Phe Asp Val Leu Cys Leu Asn Arg Tyr Tyr Gly Trp Tyr
460 465 470
gtc caa agc ggc gat ttg gaa acg gca gag aag gta ctg gaa aaa gaa 6354
Val Gln Ser Gly Asp Leu Glu Thr Ala Glu Lys Val Leu Glu Lys Glu
475 480 485
ctt ctg gcc tgg cag gag aaa ctg cat cag ccg att atc atc acc gaa 6402
Leu Leu Ala Trp Gln Glu Lys Leu His Gln Pro Ile Ile Ile Thr Glu
490 495 500
tac ggc gtg gat acg tta gcc ggg ctg cac tca atg tac acc gac atg 6450
Tyr Gly Val Asp Thr Leu Ala Gly Leu His Ser Met Tyr Thr Asp Met
505 510 515 520
tgg agt gaa gag tat cag tgt gca tgg ctg gat atg tat cac cgc gtc 6498
Trp Ser Glu Glu Tyr Gln Cys Ala Trp Leu Asp Met Tyr His Arg Val
525 530 535
ttt gat cgc gtc agc gcc gtc gtc ggt gaa cag gta tgg aat ttc gcc 6546
Phe Asp Arg Val Ser Ala Val Val Gly Glu Gln Val Trp Asn Phe Ala
540 545 550
gat ttt gcg acc tcg caa ggc ata ttg cgc gtt ggc ggt aac aag aaa 6594
Asp Phe Ala Thr Ser Gln Gly Ile Leu Arg Val Gly Gly Asn Lys Lys
555 560 565
ggg atc ttc act cgc gac cgc aaa ccg aag tcg gcg gct ttt ctg ctg 6642
Gly Ile Phe Thr Arg Asp Arg Lys Pro Lys Ser Ala Ala Phe Leu Leu
570 575 580
caa aaa cgc tgg act ggc atg aac ttc ggt gaa aaa ccg cag cag gga 6690
Gln Lys Arg Trp Thr Gly Met Asn Phe Gly Glu Lys Pro Gln Gln Gly
585 590 595 600
ggc aaa caa tga ttaattaaga ccctagactt gtccatcttc tggattggcc 6742
Gly Lys Gln
aacttaatta atgtatgaaa taaaaggatg cacacatagt gacatgctaa tcactataat 6802
gtgggcatca aagttgtgtg ttatgtgtaa ttactaatta tctgaataag agaaagagat 6862
catccatatt tcttatccta aatgaatgtc acgtgtcttt ataattcttt gatgaaccag 6922
atgcatttta ttaaccaatt ccatataccg gaccgctagt gcatgcactg actaattagc 6982
taactggcag acaaagtggc agacatactg tcccacaaat gaagatggaa tctgtaaaag 7042
aaaacgcgtg aaataatgcg tctgacaaag gttaggtcgg ctgcctttaa tcaataccaa 7102
agtggtccct accacgatgg aaaaactgtg cagtcggttt ggctttttct gacgaacaaa 7162
taagattcgt ggccgacagg tgggggtcca ccatgtgaag gcatcttcag actccaataa 7222
tggagcaatg acgtaagggc ttacgaaata agtaagggta gtttgggaaa tgtccactca 7282
cccgtcagtc tataaatact tagcccctcc ctcattgtta agggagcaag acctaaacca 7342
tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg 7402
gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag 7462
cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc 7522
aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc 7582
tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg 7642
atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc 7702
ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca 7762
tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag 7822
agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg 7882
gcgaggatct cgtcgtgacc cacggcgatg cctgcttgcc gaatatcatg gtggaaaatg 7942
gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcagaccgc tatcaggaca 8002
tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc 8062
tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg 8122
acgagttctt ctgatgagag ctctagatcc ccgaatttcc ccgatcgttc aaacatttgg 8182
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 8242
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 8302
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 8362
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agatcattag 8422
cctgcaggcc cgggttagtc taattagcta acggccagga tcgccgcgtg agcctttagc 8482
aactagctag agcgatcgcc gcaatctgtt attaagttgt ctaagcgtca atttgtttac 8542
accacaatat atcctgccac cagccagcca acagctcccc gaccggcagc tcggcacaaa 8602
atcaccactc gatacaggca gcccatcaga attaattctc atgtttgaca gcttatcatc 8662
gactgcacgg tgcaccaatg cttctggcgt caggcagcca tcggaagctg tggtatggct 8722
gtgcaggtcg taaatcactg cataattcgt gtcgctcaag gcgcactccc gttctggata 8782
atgttttttg cgccgacatc ataacggttc tggcaaatat tctgaaatga gctgttgaca 8842
attaatcatc cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga 8902
aacagaccat gagggaagcg ttgatcgccg aagtatcgac tcaactatca gaggtagttg 8962
gcgtcatcga gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag 9022
tggatggcgg cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc 9082
ttgatgaaac aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg 9142
gagagagcga gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc 9202
cgtggcgtta tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc 9262
ttgcaggtat cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag 9322
caagagaaca tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc 9382
ctgaacagga tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg 9442
actgggctgg cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag 9502
taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg 9562
cccagtatca gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct 9622
tggcctcgcg cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca 9682
aagtagtcgg caaataaagc tctagtggat ctccgtaccc agggatctgg ctcgcggcgg 9742
acgcacgacg ccggggcgag accataggcg atctcctaaa tcaatagtag ctgtaacctc 9802
gaagcgtttc acttgtaaca acgattgaga atttttgtca taaaattgaa atacttggtt 9862
cgcatttttg tcatccgcgg tcagccgcaa ttctgacgaa ctgcccattt agctggagat 9922
gattgtacat ccttcacgtg aaaatttctc aagcgctgtg aacaagggtt cagattttag 9982
attgaaaggt gagccgttga aacacgttct tcttgtcgat gacgacgtcg ctatgcggca 10042
tcttattatt gaatacctta cgatccacgc cttcaaagtg accgcggtag ccgacagcac 10102
ccagttcaca agagtactct cttccgcgac ggtcgatgtc gtggttgttg atctagattt 10162
aggtcgtgaa gatgggctcg agatcgttcg taatctggcg gcaaagtctg atattccaat 10222
cataattatc agtggcgacc gccttgagga gacagataaa gttgttgcac tcgagctagg 10282
agcaagtgat tttatcgcta agccgttcag tatcagagag tttctagcac gcattcgggt 10342
tgccttgcgc gtgcgcccca acgttgtccg ctccaaagac cgacggtctt tttgttttac 10402
tgactggaca cttaatctca ggcaacgtcg cttgatgtcc gaagctggcg gtgaggtgaa 10462
acttacggca ggtgagttca atcttctcct cgcgttttta gagaaacccc gcgacgttct 10522
atcgcgcgag caacttctca ttgccagtcg agtacgcgac gaggaggttt atgacaggag 10582
tatagatgtt ctcattttga ggctgcgccg caaacttgag gcagatccgt caagccctca 10642
actgataaaa acagcaagag gtgccggtta tttctttgac gcggacgtgc aggtttcgca 10702
cggggggacg atggcagcct gagccaattc ccagatcccc gaggaatcgg cgtgagcggt 10762
cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg gtgatgacct ggtggagaag 10822
ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg cagaagcacg ccccggtgaa 10882
tcgtggcaag cggccgctga tcgaatccgc aaagaatccc ggcaaccgcc ggcagccggt 10942
gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac cagatttttt cgttccgatg 11002
ctctatgacg tgggcacccg cgatagtcgc agcatcatgg acgtggccgt tttccgtctg 11062
tcgaagcgtg accgacgagc tggcgaggtg atccgctacg agcttccaga cgggcacgta 11122
gaggtttccg cagggccggc cggcatggcc agtgtgtggg attacgacct ggtactgatg 11182
gcggtttccc atctaaccga atccatgaac cgataccggg aagggaaggg agacaagccc 11242
ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt tctgccggcg agccgatggc 11302
ggaaagcaga aagacgacct ggtagaaacc tgcattcggt taaacaccac gcacgttgcc 11362
atgcagcgta cgaagaaggc caagaacggc cgcctggtga cggtatccga gggtgaagcc 11422
ttgattagcc gctacaagat cgtaaagagc gaaaccgggc ggccggagta catcgagatc 11482
gagctggctg attggatgta ccgcgagatc acagaaggca agaacccgga cgtgctgacg 11542
gttcaccccg attacttttt gatcgatccc ggcatcggcc gttttctcta ccgcctggca 11602
cgccgcgccg caggcaaggc agaagccaga tggttgttca agacgatcta cgaacgcagt 11662
ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc gcaagctgat cgggtcaaat 11722
gacctgccgg agtacgattt gaaggaggag gcggggcagg ctggcccgat cctagtcatg 11782
cgctaccgca acctgatcga gggcgaagca tccgccggtt cctaatgtac ggagcagatg 11842
ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag gtctctttcc tgtggatagc 11902
acgtacattg ggaacccaaa gccgtacatt gggaaccgga acccgtacat tgggaaccca 11962
aagccgtaca ttgggaaccg gtcacacatg taagtgactg atataaaaga gaaaaaaggc 12022
gatttttccg cctaaaactc tttaaaactt attaaaactc ttaaaacccg cctggcctgt 12082
gcataactgt ctggccagcg cacagccgaa gagctgcaaa aagcgcctac ccttcggtcg 12142
ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg cggccgctgg ccgctcaaaa 12202
atggctggcc tacggccagg caatctacca gggcgcggac aagccgcgcc gtcgccactc 12262
gaccgccggc gctgaggtct gcctcgtgaa gaaggtgttg ctgactcata ccaggcctga 12322
atcgccccat catccagcca gaaagtgagg gagccacggt tgatgagagc tttgttgtag 12382
gtggaccagt tggtgatttt gaacttttgc tttgccacgg aacggtctgc gttgtcggga 12442
agatgcgtga tctgatcctt caactcagca aaagttcgat ttattcaaca aagccgccgt 12502
cccgtcaagt cagcgtaatg ctctgccagt gttacaacca attaaccaat tctgattaga 12562
aaaactcatc gagcatcaaa tgaaactgca atttattcat atcaggatta tcaataccat 12622
atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 12682
tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 12742
atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 12802
ccggtgagaa tggcaaaagc tctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 12862
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 12922
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 12982
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 13042
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 13102
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 13162
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 13222
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 13282
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 13342
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 13402
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 13462
ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 13522
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 13582
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 13642
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 13702
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttgatc 13762
cggaatta 13770
<210> 4
<211> 17492
<212> DNA
<213> 人工序列
<220>
<223> 载体25881
<220>
<221> 启动子
<222> (217)..(1376)
<223> prAtEF1aA1
<220>
<221> 基因
<222> (1395)..(3860)
<223> 针对双子叶植物中表达而优化的来自构巢曲霉的AlcR转录因子。
<220>
<221> 终止子
<222> (3869)..(4121)
<223> tNOS
<220>
<221> 启动子
<222> (4128)..(4463)
<223> prAlcA
<220>
<221> 基因
<222> (4482)..(8264)
<223> LbCas12a 该Cas12a是来自毛螺菌科(Lachnospiraceae)细菌ND2006的稻密码子优化的版本
<220>
<221> 终止子
<222> (8272)..(8511)
<223> tPI2
<220>
<221> 启动子
<222> (8550)..(10163)
<223> prGmSAMS
<220>
<221> 尚未归类的特征
<222> (10176)..(10212)
<223> 锤头型核酶
<220>
<221> 尚未归类的特征
<222> (10213)..(10256)
<223> 靶向AtGl1的LbCas12a指导RNA
<220>
<221> 尚未归类的特征
<222> (10257)..(10324)
<223> HDV核酶
<400> 4
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180
tccctaatta gctaacccgg gggcgcgccg ggacccaagc ttgatatcgg aagtttctct 240
cttgagggag gttgctcgtg gaatgggaca catatggttg ttataataaa ccatttccat 300
tgtcatgaga ttttgaggtt aatatatact ttacttgttc attattttat ttggtgtttg 360
aataaatgat ataaatggct cttgataatc tgcattcatt gagatatcaa atatttactc 420
tagagaagag tgtcatatag attgatggtc cacaatcaat gaaatttttg gaagacgaac 480
atgtataacc atttgcttga ataaccttaa ttaaaaggtg tgattaaatg atgtttgtaa 540
catgtagtac taaacattca taaaacacaa ccaacccaag aggtattgag tattcacggc 600
taaacagggg cataatggta atttaaagaa tgatattatt ttatgttaaa ccctaacatt 660
ggtttcggat tcaacgctat aaataaaacc actctcgttg ctgattccat ttatcgttct 720
tattgaccct agccgctaca cacttttctg cgatatctct gaggtaagcg ttaacgtacc 780
cttagatcgt tctttttctt tttcgtctgc tgatcgttgc tcatattatt tcgatgattg 840
ttggattcga tgctctttgt tgattgatcg ttctgaaaat tctgatctgt tgtttagatt 900
ttatcgattg ttaatatcaa cgtttcactg cttctaaacg ataatttatt catgaaacta 960
ttttcccatt ctgatcgatc ttgttttgag attttaattt gttcgattga ttgttggttg 1020
gtggatctat atacgagtga acttgttgat ttgcgtattt aagatgtatg tcgatttgaa 1080
ttgtgattgg gtaattctgg agtagcataa caaatccagt gttccctttt tctaagggta 1140
attctcggat tgtttgcttt atatctcttg aaattgccga tttgattgaa tttagctcgc 1200
ttagctcaga tgatagagca ccacaatttt tgtggtagaa atcggtttga ctccgatagc 1260
ggctttttac tatgattgtt ttgtgttaaa gatgattttc ataatggtta tatatctcta 1320
ctgtttttat tgattcaata tttgattgtt cttttttttg cagatttgtt gaccagggat 1380
cccctaaata gaccatggct gatactcgaa gaagacagaa tcattcttgt gatccatgcc 1440
gcaaaggtaa acgtcggtgt gacgcacctg aaaacagaaa tgaagcaaac gagaatggat 1500
gggtgagctg ttcaaactgt aagagatgga acaaagattg cactttcaac tggttatcgt 1560
cccagagaag caaggcgaaa ggtgcagctc cacgggctcg aaccaagaaa gctagaactg 1620
ccaccacgac atctgaacca tcaacatctg cagcaaccat tccaacacca gagtcggaca 1680
accatgacgc tcctccggtg ataaactctc acgatgccct ccctagttgg acccagggac 1740
tattatcgca tcctggggac ctttttgact tttctcatag tgccattccg gcgaatgcag 1800
aagatgcagc caatgttcaa tcggatgctc catttccatg ggatcttgca attccaggtg 1860
atttctcaat gggacagcag cttgagaaac ctctctcccc tttgtcattc caagctgtcc 1920
tattacctcc tcattcccca aacacagatg atcttataag agagctagaa gagcaaacca 1980
ctgatcctga ttcagttacg gacacaaaca gtgtgcaaca agttgctcaa gatggatcct 2040
tgtggtcaga caggcaaagt ccgttactac ctgaaaattc tctctgcatg gcttcggact 2100
caaccgctcg tagatatgca cggagtacaa tgacaaaaaa cttgatgcgt atctaccatg 2160
attccatgga gaacgctctt tcttgctggc tcactgaaca caattgtcct tattctgatc 2220
aaatctctta tctcccacct aagcaaaggg ctgaatgggg tcctaattgg agcaatagga 2280
tgtgtataag ggtttgtaga cttgatcgtg taagtacgtc actgagaggc agagcattat 2340
cagcagaaga agacaaagct gctgctagag cccttcatct ggcgattgtt gcattcgcat 2400
ctcaatggac gcaacacgct caacgcggag ctggtttgaa tgtcccggct gacattgctg 2460
ccgacgaaag atcaatcagg agaaacgctt ggaatgaggc aagacacgcg ttgcagcata 2520
ctactgggat cccttctttc cgagtgattt tcgctaatat catcttcagc ctgactcaga 2580
gtgtactgga tgatgatgaa caacatggaa tgggtgcgcg attggacaag cttttggaga 2640
atgatggtgc accggttttc ttggaaactg ctaataggca attgtacaca tttcgtcaca 2700
agtttgccag aatgcaacgg agaggcaagg cttttaatcg cttacccggt ggttccgtcg 2760
cttccacttt tgctggaata tttgagaccc caactccatc tagtgagtct cctcaacttg 2820
atccagttgt tgcatctgag gaacatcgta gcactctatc gctcatgttc tggcttggaa 2880
taatgtttga tacactttca gctgcaatgt accagagacc attagtggta tctgatgagg 2940
attcacagat atccagtgct tctcccccga gacgaggcgc cgagactcct atcaatttag 3000
actgttggga acctccacgt caagtccctt cgaatcaaga aaagtctgat gtttggggag 3060
atttgtttct cagaacatca gactctttac cagatcatga atcacacaca cagatttctc 3120
agccagctgc aaggtggcct tgcacctatg agcaggctgc ggccgcattg agctcagcga 3180
cacctgttaa ggttttgctc tacaggagag tgactcaact gcaaacactt ctatacaggg 3240
gggcgtctcc agcgaggctt gaagctgcga tccaaagaac cctttacgtg tataatcact 3300
ggacagctaa gtatcaacct ttcatgcagg attgtgttgc aaatcatgag ttgttgccca 3360
gccggattca gtcatggtac gtcatccttg acggccattg gcatcttgct gctatgttgc 3420
ttgctgatgt gttagaaagc atagatagag attcgtatag cgatataaac cacattgatt 3480
tggttacgaa gttgcgtctc gataatgctc tagccgtctc tgcccttgcg agatcttcct 3540
tgcgtggtca agagcttgat ccggggaaag catcaccaat gtataggcat ttccatgata 3600
gtctaacgga agtggctttt cttgtcgagc cgtggactgt agtacttatt cactcttttg 3660
caaaggcagc ttatattctc ttagattgtt tggatctcga cggacaagga aacgcactgg 3720
cgggctacct gcagctccgt cagaactgca actattgcat ccgagctctt cagtttttag 3780
gtagaaaatc cgatatggca gctctagtag ctaaagacct cgagaggggt ttaaacggaa 3840
aagttgatag ctttctgtga ttaattaaga tcgttcaaac atttggcaat aaagtttctt 3900
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 3960
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 4020
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 4080
ggataaatta tcgcgcgcgg tgtcatctat gttactagat ctccggatcg atagttgtga 4140
tagttcccac ttgtccgtcc gcatcggcat ccgcagctcg ggatagttcc gacctaggat 4200
tggatgcatg cggaaccgca cgagggcggg gcggaaattg acacaccact cctctccacg 4260
caccgttcaa gaggtacgcg tatagagccg tatagagcag agacggagca ctttctggta 4320
ctgtccgcac gggatgtccg cacggagagc cacaaacgag cggggccccg tacgtgctct 4380
cctaccccag gatcgcatcc ccgcatagct gaacatctat ataaagaccc ccaaggttct 4440
cagtctcacc aacatcatca accggatccc ctaaatagac catggctcct aagaagaagc 4500
ggaaggttgg tattcacggg gtgcctgcgg cttcaaagct cgagaaattc accaactgtt 4560
attcgttgag caaaacactg cggtttaaag cgattccagt cggcaagact caagagaata 4620
tagacaataa gcggctgttg gtggaagatg aaaagcgcgc ggaagactac aaaggggtga 4680
agaagttgtt ggacagatac tacctctctt ttatcaatga tgtcttgcac tcaatcaaat 4740
tgaagaatct gaacaactac atctccctct tcagaaagaa aacaaggaca gaaaaggaga 4800
ataaggaact tgaaaatttg gagatcaatc tgaggaaaga gatcgcgaaa gcctttaaag 4860
gcaacgaagg atacaaaagt ctgttcaaga aggatataat tgagacaatt ttgccagagt 4920
tcctcgatga caaggacgag attgcgctgg tcaattcgtt caacggattc acaacagcat 4980
tcacaggctt ctttgataat cgggaaaata tgttctctga ggaggcaaag tccacttcta 5040
ttgcgttcag gtgtatcaat gagaatctca ctaggtacat ttccaacatg gatatctttg 5100
agaaggttga cgcaattttt gacaagcacg aagttcagga gattaaggag aagatcctca 5160
attccgatta tgacgttgag gacttcttcg agggtgagtt ttttaatttc gtgctcactc 5220
aagagggtat cgacgtgtat aatgcgatca tcggtgggtt cgtgactgag tccggtgaaa 5280
agattaaggg attgaacgag tatatcaacc tttacaacca aaagacgaaa cagaagctgc 5340
caaagttcaa gcctctttac aaacaggttc tttcagaccg cgagtcactc tcgttctatg 5400
gggagggcta cacttcggat gaggaagtcc tggaggtgtt caggaatact ctcaataaga 5460
attcggagat tttctcttct ataaaaaaac tggaaaagtt gtttaagaat tttgacgaat 5520
actctagcgc cggcatattt gtgaaaaacg gcccggccat atcaacgata agtaaagata 5580
tcttcggcga atggaacgtg atcagagaca aatggaacgc ggagtatgac gatattcacc 5640
tgaagaagaa ggctgtcgta acggagaagt acgaggatga tcgcaggaaa agcttcaaaa 5700
agatcggaag tttcagcctg gaacagttgc aggagtatgc tgacgccgat cttagcgtcg 5760
tcgagaagtt gaaggagata atcatccaaa aggtcgacga gatatataaa gtctatggat 5820
caagtgaaaa actgttcgac gccgacttcg ttttggagaa gtccctgaag aagaacgacg 5880
ctgttgttgc cattatgaag gatctgctcg acagcgtgaa gagtttcgag aactatatta 5940
aggctttttt cggggagggg aaggagacta acagagatga gtccttctac ggagacttcg 6000
tcctcgcgta cgatatactc cttaaggtag accacatcta cgacgcaatc agaaattacg 6060
tgacacaaaa gccgtacagc aaggacaagt tcaaactcta cttccagaac ccccagttca 6120
tgggcggctg ggacaaggac aaggaaacgg attacagggc tacgatcctg aggtatggtt 6180
caaaatacta cttggcgatt atggacaaga agtacgccaa gtgtctccag aagattgaca 6240
aagacgatgt caatggcaat tatgagaaga tcaactacaa gctgcttccg ggtccgaaca 6300
agatgctccc aaaggttttc ttcagcaaga aatggatggc ctactataac ccaagcgagg 6360
acatccagaa gatttataag aacggtacgt tcaagaaggg cgacatgttc aatcttaacg 6420
actgtcacaa gctgatcgac ttcttcaaag actcaattag ccggtaccca aagtggtcta 6480
acgcctatga cttcaacttt tcggaaaccg agaagtacaa ggatatagcc ggattttata 6540
gagaggtgga agagcagggc tacaaggtgt cattcgagtc cgccagcaag aaggaagtgg 6600
acaagctcgt ggaagagggt aagctctaca tgttccagat ttataataaa gactttagcg 6660
ataagagcca cgggacacct aatctccaca caatgtattt caagctgctc ttcgacgaga 6720
ataaccacgg ccaaatcagg ttgtcaggag gggctgaact cttcatgcgg cgcgctagcc 6780
ttaagaagga ggagcttgta gtccaccctg cgaatagtcc aattgcgaat aagaacccgg 6840
acaatcctaa aaagactaca acattgagct acgacgtgta caaggataag aggttttccg 6900
aggatcagta cgagctccac atcccgattg cgatcaacaa gtgcccaaag aatattttca 6960
agataaacac agaggtgcgt gtactcctga agcatgacga caatccttac gtcattggga 7020
ttgatcgggg cgagaggaac ctcctctata ttgtggtggt ggacgggaag gggaacatag 7080
tcgaacagta ctcccttaac gaaataatta acaatttcaa cggcatccgt atcaagaccg 7140
actaccattc gttgctggac aagaaggaga aggagagatt tgaggcgcgg caaaattgga 7200
caagtatcga gaacatcaag gaactcaaag caggttatat ctctcaagtt gtgcataaga 7260
tatgcgagct ggttgagaag tatgacgcag tgatcgctct tgaggacctc aactcgggct 7320
ttaagaattc tagagttaaa gtggagaagc aggtctatca aaagttcgag aagatgctta 7380
tagataagct caactacatg gtcgataaga aatcgaaccc atgtgccacc ggcggcgcac 7440
tcaaaggtta ccaaataaca aacaaattcg agtccttcaa atcgatgagt actcagaatg 7500
ggttcatatt ttatataccg gcgtggctta cgtctaagat cgacccgtca actggttttg 7560
tcaacctgtt gaagacgaaa tacacgtcca ttgccgattc aaaaaagttc atatctagtt 7620
ttgatcgtat tatgtacgtc ccagaggaag atcttttcga gtttgctctc gactacaaaa 7680
acttttcgcg caccgatgcg gattacatta aaaaatggaa actctattcg tacggcaaca 7740
gaatcaggat ttttcgcaac cctaagaaga ataacgtctt tgattgggag gaagtttgct 7800
tgactagcgc gtacaaggag ctctttaata agtatggcat taactaccaa cagggtgata 7860
tcagagcact gctttgcgaa caatctgaca aggctttcta ctcatccttc atggctttga 7920
tgagcctgat gctccagatg agaaattcaa ttacaggcag aaccgacgtg gatttcttga 7980
tctccccggt taaaaattct gatggcatct tttacgatag caggaactat gaagcgcaag 8040
agaatgcgat tctgccaaaa aatgcagacg ccaacggtgc ctataacatc gccaggaaag 8100
tcctgtgggc gatcggccag ttcaaaaagg ccgaagacga aaaattggac aaggtcaaaa 8160
tcgctatcag caacaaagag tggctggagt atgctcagac atccgtaaag cataagcgtc 8220
ctgctgccac caaaaaggcc ggacaggcta agaaaaagaa gtgattaatc ggaccctaga 8280
cttgtccatc ttctggattg gccaacttaa ttaatgtatg aaataaaagg atgcacacat 8340
agtgacatgc taatcactat aatgtgggca tcaaagttgt gtgttatgtg taattactaa 8400
ttatctgaat aagagaaaga gatcatccat atttcttatc ctaaatgaat gtcacgtgtc 8460
tttataattc tttgatgaac cagatgcatt ttattaacca attccatata ccggaccgaa 8520
tctagattca gaacgaatta actagctagt ccaccctcac aaaaaaggtt attgcctaat 8580
taatagtagg gattgaagaa gtatcaataa tcaataagag ggacatttgg attgacacaa 8640
actattagta taaaaaaaaa atgtaaaact aaatggacaa caatctaaga aagcgagtat 8700
gtgttgtact cggaaaacat aacataatgt gattttgatt gtggaaactg aaaacaataa 8760
caattaagtt ttatttatct ctttgcctaa caattttttt aattactttt tttatagttt 8820
ttatgatgaa gataattaat attttttaca aatattatat tttccttttt accatctttg 8880
aagataattg cttttttttc caatttagac aaatatttga gtatcaatga tattcctttt 8940
taatccatta ttgcaattta aaagaccatc aatgattaca ttttcaatca aatgacttta 9000
ttagtcttca ctttacatcg atttaaatca aactaataat tttgtatgga ctaaatctct 9060
gaacattttt atatttacaa catattttaa catttattaa ataattagta tttaatacta 9120
ttagtagaat aatgggagta gcaggaggga ggcactgaga gaatagagat ggcatggaag 9180
taagcaatca agtcaaaatc agagttggcc aaccccaaag gctgtagtag gtaagcatgg 9240
cccattttag tttttacatt catctctcat tttcacctca acggttcaga ttcaatctga 9300
ctccccgatc tcagccgtgg attcaaatgc cacctcaggc acatgcaatt ccaaatggat 9360
gaacctaacc cacaatctaa tcttgttact taggggcttt tccgtcatta aatgacacca 9420
cctaccccct tctccctata aatggcaact caatcccccc cttagaactc gcagcgcttg 9480
atttgaggcc aggcaagccc cactcaacca ccacacctct cctcgttcac gctacccctt 9540
tctgctcttc ttctaccttt caaggtactc ttctttccct ctgttgctgc aaccttctct 9600
ttctttaaga ttgcctcaat ttcggatctt gcacctctgg gttgctttgc tttgcttttt 9660
cctctactgg gttgatttct gtttccctaa accggtttag acgaatgtga acactacttc 9720
ttttgtttaa ttactctgga atacgtgtta ggctttcaga tctagttgaa atcgtattgc 9780
acttttaggg ggagtttgga tttctaataa gaaattgacc ttttgctgag aattggttcg 9840
gtgattagag ggtttccgta aatttttgaa gttttacatg cttgtatctg tttatttttg 9900
tttctcacat ctattattgt taggtgaagg aaattatgta ttgagagtct gtctgatact 9960
aaatataaac acctcaatag gggctctaac actgatttta tcatttgctg cttgtgtgta 10020
tggttaaaga aaggcaattg tgttttaatt ttctgcaagc tttcgtttgc tgaattttat 10080
gcatatattt tcctcccttt tgtgaacttc ctttttgtag ttctaattcc atttttggtg 10140
tctgcagttt taaaagtata aagggatcca aattactgat gagtccgtga ggacgaaacg 10200
agtaagctcg tctaatttct actaagtgta gatccacatc tctttagccc tatcaaggcc 10260
ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc atggcgaatg 10320
ggacagcttt ttgtgatctg atgataagtg gttggttcgt gtctcatgca cttgggaggt 10380
gatctatttc acctggtgta gtttgtgttt ccgtcagttg gaaaaactta tccctatcga 10440
tttcgttttc attttctgct tttcttttat gtaccttcgt ttgggcttgt aacgggcctt 10500
tgtatttcaa ctctcaataa taatccaagt gcatgttaaa caatttgtca tctgtttcgg 10560
ctttgatata ctactggtga agatgggccg tactactgca tcacaacgaa aaataataat 10620
aagatgaaaa acttgaagtg gaaaaaaaaa acttgaatgt tcactactac ggacgaccgc 10680
tagtgcatgc actgactaat tagctaactg gcagacaaag tggcagacat actgtcccac 10740
aaatgaagat ggaatctgta aaagaaaacg cgtgaaataa tgcgtctgac aaaggttagg 10800
tcggctgcct ttaatcaata ccaaagtggt ccctaccacg atggaaaaac tgtgcagtcg 10860
gtttggcttt ttctgacgaa caaataagat tcgtggccga caggtggggg tccaccatgt 10920
gaaggcatct tcagactcca ataatggagc aatgacgtaa gggcttacga aataagtaag 10980
ggtagtttgg gaaatgtcca ctcacccgtc agtctataaa tacttagccc ctccctcatt 11040
gttaagggag caagacctaa accatgattg aacaagatgg attgcacgca ggttctccgg 11100
ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg 11160
atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc 11220
tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga 11280
cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc 11340
tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag 11400
tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat 11460
tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg 11520
tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca 11580
ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccacggc gatgcctgct 11640
tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg 11700
gtgtggcaga ccgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg 11760
gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc 11820
gcatcgcctt ctatcgcctt cttgacgagt tcttctgatg agagctctag atccccgaat 11880
ttccccgatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt 11940
cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg 12000
taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt 12060
taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg 12120
tcatctatgt tactagatca ttagcctgca ggcccgggtt agtctaatta gctaacggcc 12180
aggatcgccg cgtgagcctt tagcaactag ctagagcgat cgccgcaatc tgttattaag 12240
ttgtctaagc gtcaatttgt ttacaccaca atatatcctg ccaccagcca gccaacagct 12300
ccccgaccgg cagctcggca caaaatcacc actcgataca ggcagcccat cagaattaat 12360
tctcatgttt gacagcttat catcgactgc acggtgcacc aatgcttctg gcgtcaggca 12420
gccatcggaa gctgtggtat ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct 12480
caaggcgcac tcccgttctg gataatgttt tttgcgccga catcataacg gttctggcaa 12540
atattctgaa atgagctgtt gacaattaat catccggctc gtataatgtg tggaattgtg 12600
agcggataac aatttcacac aggaaacaga ccatgaggga agcgttgatc gccgaagtat 12660
cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg 12720
ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt gatattgatt 12780
tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg atcaacgacc 12840
ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta gaagtcacca 12900
ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa ctgcaatttg 12960
gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg atcgacattg 13020
atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta ggtccagcgg 13080
cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta aatgaaacct 13140
taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta gtgcttacgt 13200
tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg 13260
actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa gctaggcagg 13320
cttatcttgg acaagaagat cgcttggcct cgcgcgcaga tcagttggaa gaatttgttc 13380
actacgtgaa aggcgagatc accaaagtag tcggcaaata aagctctagt ggatctccgt 13440
acccagggat ctggctcgcg gcggacgcac gacgccgggg cgagaccata ggcgatctcc 13500
taaatcaata gtagctgtaa cctcgaagcg tttcacttgt aacaacgatt gagaattttt 13560
gtcataaaat tgaaatactt ggttcgcatt tttgtcatcc gcggtcagcc gcaattctga 13620
cgaactgccc atttagctgg agatgattgt acatccttca cgtgaaaatt tctcaagcgc 13680
tgtgaacaag ggttcagatt ttagattgaa aggtgagccg ttgaaacacg ttcttcttgt 13740
cgatgacgac gtcgctatgc ggcatcttat tattgaatac cttacgatcc acgccttcaa 13800
agtgaccgcg gtagccgaca gcacccagtt cacaagagta ctctcttccg cgacggtcga 13860
tgtcgtggtt gttgatctag atttaggtcg tgaagatggg ctcgagatcg ttcgtaatct 13920
ggcggcaaag tctgatattc caatcataat tatcagtggc gaccgccttg aggagacaga 13980
taaagttgtt gcactcgagc taggagcaag tgattttatc gctaagccgt tcagtatcag 14040
agagtttcta gcacgcattc gggttgcctt gcgcgtgcgc cccaacgttg tccgctccaa 14100
agaccgacgg tctttttgtt ttactgactg gacacttaat ctcaggcaac gtcgcttgat 14160
gtccgaagct ggcggtgagg tgaaacttac ggcaggtgag ttcaatcttc tcctcgcgtt 14220
tttagagaaa ccccgcgacg ttctatcgcg cgagcaactt ctcattgcca gtcgagtacg 14280
cgacgaggag gtttatgaca ggagtataga tgttctcatt ttgaggctgc gccgcaaact 14340
tgaggcagat ccgtcaagcc ctcaactgat aaaaacagca agaggtgccg gttatttctt 14400
tgacgcggac gtgcaggttt cgcacggggg gacgatggca gcctgagcca attcccagat 14460
ccccgaggaa tcggcgtgag cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg 14520
ctgggtgatg acctggtgga gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc 14580
gaggcagaag cacgccccgg tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa 14640
tcccggcaac cgccggcagc cggtgcgccg tcgattagga agccgcccaa gggcgacgag 14700
caaccagatt ttttcgttcc gatgctctat gacgtgggca cccgcgatag tcgcagcatc 14760
atggacgtgg ccgttttccg tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc 14820
tacgagcttc cagacgggca cgtagaggtt tccgcagggc cggccggcat ggccagtgtg 14880
tgggattacg acctggtact gatggcggtt tcccatctaa ccgaatccat gaaccgatac 14940
cgggaaggga agggagacaa gcccggccgc gtgttccgtc cacacgttgc ggacgtactc 15000
aagttctgcc ggcgagccga tggcggaaag cagaaagacg acctggtaga aacctgcatt 15060
cggttaaaca ccacgcacgt tgccatgcag cgtacgaaga aggccaagaa cggccgcctg 15120
gtgacggtat ccgagggtga agccttgatt agccgctaca agatcgtaaa gagcgaaacc 15180
gggcggccgg agtacatcga gatcgagctg gctgattgga tgtaccgcga gatcacagaa 15240
ggcaagaacc cggacgtgct gacggttcac cccgattact ttttgatcga tcccggcatc 15300
ggccgttttc tctaccgcct ggcacgccgc gccgcaggca aggcagaagc cagatggttg 15360
ttcaagacga tctacgaacg cagtggcagc gccggagagt tcaagaagtt ctgtttcacc 15420
gtgcgcaagc tgatcgggtc aaatgacctg ccggagtacg atttgaagga ggaggcgggg 15480
caggctggcc cgatcctagt catgcgctac cgcaacctga tcgagggcga agcatccgcc 15540
ggttcctaat gtacggagca gatgctaggg caaattgccc tagcagggga aaaaggtcga 15600
aaaggtctct ttcctgtgga tagcacgtac attgggaacc caaagccgta cattgggaac 15660
cggaacccgt acattgggaa cccaaagccg tacattggga accggtcaca catgtaagtg 15720
actgatataa aagagaaaaa aggcgatttt tccgcctaaa actctttaaa acttattaaa 15780
actcttaaaa cccgcctggc ctgtgcataa ctgtctggcc agcgcacagc cgaagagctg 15840
caaaaagcgc ctacccttcg gtcgctgcgc tccctacgcc ccgccgcttc gcgtcggcct 15900
atcgcggccg ctggccgctc aaaaatggct ggcctacggc caggcaatct accagggcgc 15960
ggacaagccg cgccgtcgcc actcgaccgc cggcgctgag gtctgcctcg tgaagaaggt 16020
gttgctgact cataccaggc ctgaatcgcc ccatcatcca gccagaaagt gagggagcca 16080
cggttgatga gagctttgtt gtaggtggac cagttggtga ttttgaactt ttgctttgcc 16140
acggaacggt ctgcgttgtc gggaagatgc gtgatctgat ccttcaactc agcaaaagtt 16200
cgatttattc aacaaagccg ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca 16260
accaattaac caattctgat tagaaaaact catcgagcat caaatgaaac tgcaatttat 16320
tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 16380
actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 16440
gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 16500
aatcaccatg agtgacgact gaatccggtg agaatggcaa aagctctgca ttaatgaatc 16560
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 16620
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 16680
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 16740
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 16800
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 16860
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 16920
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 16980
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 17040
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 17100
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 17160
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 17220
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 17280
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 17340
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 17400
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 17460
atcttcacct agatcctttt gatccggaat ta 17492
<210> 5
<211> 437
<212> PRT
<213> 人工序列
<220>
<223> Gal4VP16GR
<400> 5
Met Ala Asp Pro Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp
1 5 10 15
Ile Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys
20 25 30
Ala Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr
35 40 45
Lys Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg
50 55 60
Leu Glu Arg Leu Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Ser Ser
65 70 75 80
Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly
85 90 95
Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu
100 105 110
Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His
115 120 125
Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu
130 135 140
Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Asp Pro
145 150 155 160
Ile Gln Gln Ala Thr Ala Gly Val Ser Gln Asp Thr Ser Glu Asn Pro
165 170 175
Asn Lys Thr Ile Val Pro Ala Ala Leu Pro Gln Leu Thr Pro Thr Leu
180 185 190
Val Ser Leu Leu Glu Val Ile Glu Pro Glu Val Leu Tyr Ala Gly Tyr
195 200 205
Asp Ser Ser Val Pro Asp Ser Ala Trp Arg Ile Met Thr Thr Leu Asn
210 215 220
Met Leu Gly Gly Arg Gln Val Ile Ala Ala Val Lys Trp Ala Lys Ala
225 230 235 240
Ile Pro Gly Phe Arg Asn Leu His Leu Asp Asp Gln Met Thr Leu Leu
245 250 255
Gln Tyr Ser Trp Met Phe Leu Met Ala Phe Ala Leu Gly Trp Arg Ser
260 265 270
Tyr Arg Gln Ser Ser Gly Asn Leu Leu Cys Phe Ala Pro Asp Leu Ile
275 280 285
Ile Asn Glu Gln Arg Met Ser Leu Pro Cys Met Tyr Asp Gln Cys Lys
290 295 300
His Met Leu Phe Val Ser Ser Glu Leu Gln Arg Leu Gln Val Ser Tyr
305 310 315 320
Glu Glu Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu Ser Ser Val Pro
325 330 335
Lys Glu Gly Leu Lys Ser Gln Glu Leu Phe Asp Glu Ile Arg Met Thr
340 345 350
Tyr Ile Lys Glu Leu Gly Lys Ala Ile Val Lys Arg Glu Gly Asn Ser
355 360 365
Ser Gln Asn Trp Gln Arg Phe Tyr Gln Leu Thr Lys Leu Leu Asp Ser
370 375 380
Met His Glu Val Val Glu Asn Leu Leu Thr Tyr Cys Phe Gln Thr Phe
385 390 395 400
Leu Asp Lys Thr Met Ser Ile Glu Phe Pro Glu Met Leu Ala Glu Ile
405 410 415
Ile Thr Asn Gln Ile Pro Lys Tyr Ser Asn Gly Asn Ile Lys Lys Leu
420 425 430
Leu Phe His Gln Lys
435
<210> 6
<211> 277
<212> PRT
<213> 褐家鼠
<400> 6
Met Gln Gln Ala Thr Ala Gly Val Ser Gln Asp Thr Ser Glu Asn Pro
1 5 10 15
Asn Lys Thr Ile Val Pro Ala Ala Leu Pro Gln Leu Thr Pro Thr Leu
20 25 30
Val Ser Leu Leu Glu Val Ile Glu Pro Glu Val Leu Tyr Ala Gly Tyr
35 40 45
Asp Ser Ser Val Pro Asp Ser Ala Trp Arg Ile Met Thr Thr Leu Asn
50 55 60
Met Leu Gly Gly Arg Gln Val Ile Ala Ala Val Lys Trp Ala Lys Ala
65 70 75 80
Ile Pro Gly Phe Arg Asn Leu His Leu Asp Asp Gln Met Thr Leu Leu
85 90 95
Gln Tyr Ser Trp Met Phe Leu Met Ala Phe Ala Leu Gly Trp Arg Ser
100 105 110
Tyr Arg Gln Ser Ser Gly Asn Leu Leu Cys Phe Ala Pro Asp Leu Ile
115 120 125
Ile Asn Glu Gln Arg Met Ser Leu Pro Cys Met Tyr Asp Gln Cys Lys
130 135 140
His Met Leu Phe Val Ser Ser Glu Leu Gln Arg Leu Gln Val Ser Tyr
145 150 155 160
Glu Glu Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu Ser Ser Val Pro
165 170 175
Lys Glu Gly Leu Lys Ser Gln Glu Leu Phe Asp Glu Ile Arg Met Thr
180 185 190
Tyr Ile Lys Glu Leu Gly Lys Ala Ile Val Lys Arg Glu Gly Asn Ser
195 200 205
Ser Gln Asn Trp Gln Arg Phe Tyr Gln Leu Thr Lys Leu Leu Asp Ser
210 215 220
Met His Glu Val Val Glu Asn Leu Leu Thr Tyr Cys Phe Gln Thr Phe
225 230 235 240
Leu Asp Lys Thr Met Ser Ile Glu Phe Pro Glu Met Leu Ala Glu Ile
245 250 255
Ile Thr Asn Gln Ile Pro Lys Tyr Ser Asn Gly Asn Ile Lys Lys Leu
260 265 270
Leu Phe His Gln Lys
275
<210> 7
<211> 1537
<212> PRT
<213> 人工序列
<220>
<223> GR-Cas12a
<400> 7
Met Ala Ile Gln Gln Ala Thr Ala Gly Val Ser Gln Asp Thr Ser Glu
1 5 10 15
Asn Pro Asn Lys Thr Ile Val Pro Ala Ala Leu Pro Gln Leu Thr Pro
20 25 30
Thr Leu Val Ser Leu Leu Glu Val Ile Glu Pro Glu Val Leu Tyr Ala
35 40 45
Gly Tyr Asp Ser Ser Val Pro Asp Ser Ala Trp Arg Ile Met Thr Thr
50 55 60
Leu Asn Met Leu Gly Gly Arg Gln Val Ile Ala Ala Val Lys Trp Ala
65 70 75 80
Lys Ala Ile Pro Gly Phe Arg Asn Leu His Leu Asp Asp Gln Met Thr
85 90 95
Leu Leu Gln Tyr Ser Trp Met Phe Leu Met Ala Phe Ala Leu Gly Trp
100 105 110
Arg Ser Tyr Arg Gln Ser Ser Gly Asn Leu Leu Cys Phe Ala Pro Asp
115 120 125
Leu Ile Ile Asn Glu Gln Arg Met Ser Leu Pro Cys Met Tyr Asp Gln
130 135 140
Cys Lys His Met Leu Phe Val Ser Ser Glu Leu Gln Arg Leu Gln Val
145 150 155 160
Ser Tyr Glu Glu Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu Ser Ser
165 170 175
Val Pro Lys Glu Gly Leu Lys Ser Gln Glu Leu Phe Asp Glu Ile Arg
180 185 190
Met Thr Tyr Ile Lys Glu Leu Gly Lys Ala Ile Val Lys Arg Glu Gly
195 200 205
Asn Ser Ser Gln Asn Trp Gln Arg Phe Tyr Gln Leu Thr Lys Leu Leu
210 215 220
Asp Ser Met His Glu Val Val Glu Asn Leu Leu Thr Tyr Cys Phe Gln
225 230 235 240
Thr Phe Leu Asp Lys Thr Met Ser Ile Glu Phe Pro Glu Met Leu Ala
245 250 255
Glu Ile Ile Thr Asn Gln Ile Pro Lys Tyr Ser Asn Gly Asn Ile Lys
260 265 270
Lys Leu Leu Phe His Gln Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly
275 280 285
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
290 295 300
Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr
305 310 315 320
Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr
325 330 335
Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg
340 345 350
Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu
355 360 365
Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn
370 375 380
Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn
385 390 395 400
Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys
405 410 415
Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile
420 425 430
Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala
435 440 445
Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe
450 455 460
Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile
465 470 475 480
Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met
485 490 495
Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln
500 505 510
Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe
515 520 525
Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp
530 535 540
Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys
545 550 555 560
Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys
565 570 575
Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp
580 585 590
Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu
595 600 605
Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe
610 615 620
Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr
625 630 635 640
Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile
645 650 655
Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn
660 665 670
Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu
675 680 685
Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe
690 695 700
Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val
705 710 715 720
Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys
725 730 735
Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu
740 745 750
Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu
755 760 765
Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly
770 775 780
Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val
785 790 795 800
Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile
805 810 815
Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu
820 825 830
Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu
835 840 845
Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu
850 855 860
Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys
865 870 875 880
Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro
885 890 895
Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met
900 905 910
Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly
915 920 925
Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu
930 935 940
Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn
945 950 955 960
Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala
965 970 975
Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu
980 985 990
Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu
995 1000 1005
Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
1010 1015 1020
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp
1025 1030 1035
Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu
1040 1045 1050
Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His
1055 1060 1065
Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys
1070 1075 1080
Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe
1085 1090 1095
Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys
1100 1105 1110
Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg Val Leu
1115 1120 1125
Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp Arg Gly
1130 1135 1140
Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn
1145 1150 1155
Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
1160 1165 1170
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys
1175 1180 1185
Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu
1190 1195 1200
Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His
1205 1210 1215
Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu
1220 1225 1230
Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu
1235 1240 1245
Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
1250 1255 1260
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly
1265 1270 1275
Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys
1280 1285 1290
Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp
1295 1300 1305
Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu
1310 1315 1320
Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser
1325 1330 1335
Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu
1340 1345 1350
Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr
1355 1360 1365
Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile
1370 1375 1380
Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val
1385 1390 1395
Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile
1400 1405 1410
Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser
1415 1420 1425
Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met
1430 1435 1440
Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe
1445 1450 1455
Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser
1460 1465 1470
Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala
1475 1480 1485
Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala
1490 1495 1500
Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val
1505 1510 1515
Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr
1520 1525 1530
Ser Val Lys His
1535

Claims (52)

1.一种用于在植物的后代中产生多个独特编辑的方法,所述方法包括:
a.向植物细胞或植物组织中引入表达盒,其中所述表达盒包含
i.编码DNA修饰酶的核酸;
ii.编码至少一种指导RNA的任选的核酸;和
iii.与所述编码DNA修饰酶的核酸可操作连接的诱导因子;
b.在所希望的植物发育阶段诱导所述诱导因子;以及
c.将所述植物细胞或植物组织生成为具有后代的植物,其中所述后代共同包含多个独特编辑。
2.如权利要求1所述的方法,其中所述诱导因子是转录效应子或易位效应子。
3.如权利要求1所述的方法,其中所述诱导因子由化学品诱导。
4.如权利要求3所述的方法,其中所述化学品选自抗生素、金属、类固醇、杀昆虫剂、激素、醇和醛。
5.如权利要求4所述的方法,其中所述抗生素是四环素或其化学模拟物。
6.如权利要求4所述的方法,其中所述金属是铜或含铜化合物。
7.如权利要求4所述的方法,其中所述类固醇是选自由以下组成的组的糖皮质激素:地塞米松、倍氯米松、倍他米松、布地奈德、可的松、氢化可的松、甲泼尼龙、泼尼松龙、泼尼松、曲安奈德、及其任何化学模拟物。
8.如权利要求7所述的方法,其中所述糖皮质激素是地塞米松。
9.如权利要求4所述的方法,其中所述杀昆虫剂选自由以下组成的组:虫酰肼、甲氧虫酰肼、及其任何化学模拟物。
10.如权利要求4所述的方法,其中所述激素选自由以下组成的组:雌性激素、雌激素、17-β-雌二醇、及其任何化学模拟物。
11.如权利要求4所述的方法,其中所述醇选自由以下组成的组:乙醇及其任何化学模拟物。
12.如权利要求4所述的方法,其中所述醛选自由以下组成的组:乙醛及其任何化学模拟物。
13.如权利要求2所述的方法,其中所述转录效应子选自由以下组成的组:醇依赖性效应子、乳糖依赖性效应子、半乳糖依赖性效应子和lexA依赖性效应子。
14.如权利要求13所述的方法,其中所述醇依赖性效应子是alc效应子。
15.如权利要求14所述的方法,其中所述alc效应子是包含alcA启动子的构巢曲霉alc效应子。
16.如权利要求15所述的方法,其进一步包括另外的表达盒,所述另外的表达盒包含编码alcR转录因子激活基因的核苷酸序列;从而形成alcA/alcR诱导型系统。
17.如权利要求16所述的方法,其中步骤b中的所述诱导包括在所述所希望的植物发育阶段施用醇。
18.如权利要求2所述的方法,其中所述乳糖依赖性效应子是pOp效应子。
19.如权利要求18所述的方法,其进一步包括另外的表达盒,所述另外的表达盒包含编码LhG4转录因子激活基因的核苷酸序列;从而形成LhG4/pOp诱导型系统。
20.如权利要求2所述的方法,其中半乳糖依赖性调节子是Gal4UAS效应子。
21.如权利要求20所述的方法,其进一步包括另外的表达盒,所述另外的表达盒包含编码Gal4转录因子激活基因的核苷酸序列;从而形成GVG诱导型系统或VGE诱导型系统。
22.如权利要求2所述的方法,其中所述LexA依赖性效应子是至少一种lexA操纵子。
23.如权利要求22所述的方法,其进一步包括另外的表达盒,所述另外的表达盒包含编码LexA:VP16:ER激活子的核苷酸序列;从而形成XVE诱导型系统。
24.如权利要求1所述的方法,其中所述DNA修饰酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、嵌合FEN1-FokI、Mega-TAL和CRISPR核酸酶。
25.如权利要求24所述的方法,其中所述CRISPR核酸酶是Cas核酸酶、Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶、与脱氨酶结构域融合的Cas12a、Cas12i核酸酶、Cas12j核酸酶、CasX核酸酶、CasY核酸酶、Cas13核酸酶、Cas14核酸酶。
26.如权利要求2所述的方法,其中易位因子是糖皮质激素受体。
27.如权利要求26所述的方法,其中所述糖皮质激素受体包含SEQ ID NO:6。
28.如权利要求27所述的方法,其中所述糖皮质激素受体与CRISPR核酸酶可操作地连接。
29.如权利要求28所述的方法,其中糖皮质激素受体连接的CRISPR核酸酶是经修饰以包含糖皮质激素受体结合结构域(“GR-Cas12a”)的修饰的Cas12a核酸酶。
30.如权利要求29所述的方法,其中所述GR-Cas12a包含SEQ ID NO:7。
31.如权利要求30所述的方法,其中在施用地塞米松之后,所述GR-Cas12a从所述植物细胞或植物组织的细胞质易位至细胞核。
32.如权利要求1所述的方法,其中所述独特编辑是插入缺失突变、核苷酸置换、等位基因取代、染色体易位或供体核酸的插入。
33.如权利要求1所述的方法,其中所述植物细胞或植物组织是双子叶植物细胞或植物组织。
34.如权利要求33所述的方法,其中所述双子叶植物细胞或植物组织选自由以下组成的组:拟南芥属、向日葵、大豆、番茄、芸苔属物种、杨属(白杨)、桉树、烟草、大麻、马铃薯、棉花、玉米、稻、小麦、大麦、甘蔗、短绒野大豆和其他野生大豆属物种。
35.如权利要求1所述的方法,其中所述植物细胞或植物组织是单子叶植物细胞或植物组织。
36.如权利要求35所述的方法,其中所述单子叶植物细胞或植物组织选自由以下组成的组:玉米、小麦、稻、墨西哥类蜀黍、高粱和大麦。
37.如权利要求36所述的方法,其中所述单子叶植物细胞或植物组织是玉米。
38.如权利要求1所述的方法,其中植物细胞或植物组织是玉米,并且其中所述所希望的发育阶段选自由以下组成的组:VE、V1、V2、V(n)、VT、R1、R2、R3、R4、R5和R6阶段;其中(n)是代表存在的叶环数的整数。
39.如权利要求1所述的方法,其中植物细胞或植物组织是大豆,并且其中所述所希望的发育阶段选自由以下组成的组:VE、VC、V1、V2、V(n)、R1、R2、R3、R4、R5、R6、R7和R8阶段;其中(n)是代表存在的三小叶数的整数。
40.如权利要求1所述的方法,其进一步包括:
41.使共同包含多个独特编辑的所述后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;
42.测量步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物中的至少一种表型;以及
43.任选地基于对所述至少一种表型的测量选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
44.如权利要求1所述的方法,其进一步包括:
45.使共同包含多个独特编辑的所述后代生长为幼苗、小植株、未成熟植物、成熟植物或衰老植物;
46.对步骤a的幼苗、小植株、未成熟植物、成熟植物或衰老植物进行基因分型;以及
47.任选地基于步骤b的基因型选择幼苗、小植株、未成熟植物、成熟植物或衰老植物。
48.一种通过如权利要求1至41中任一项所述的方法产生的编辑的植物。
49.一种诱导型基因编辑系统,所述诱导型基因编辑系统包含表达盒,所述表达盒包含:
a.编码DNA修饰酶的核酸;
b.编码至少一种指导RNA的任选的核酸;以及
c.与所述编码DNA修饰酶的核酸可操作连接的诱导因子。
50.如权利要求43所述的系统,其进一步包含具有所述表达盒的细胞。
51.如权利要求44所述的系统,其中所述细胞是真核细胞。
52.如权利要求45所述的系统,其中所述真核细胞是植物细胞。
CN202280023833.2A 2021-03-24 2022-03-17 诱导型嵌合体 Pending CN117043331A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163165224P 2021-03-24 2021-03-24
US63/165,224 2021-03-24
PCT/US2022/020690 WO2022203927A1 (en) 2021-03-24 2022-03-17 Inducible mosaicism

Publications (1)

Publication Number Publication Date
CN117043331A true CN117043331A (zh) 2023-11-10

Family

ID=83396151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280023833.2A Pending CN117043331A (zh) 2021-03-24 2022-03-17 诱导型嵌合体

Country Status (12)

Country Link
US (1) US20240167046A1 (zh)
EP (1) EP4314276A1 (zh)
JP (1) JP2024512050A (zh)
KR (1) KR20230158660A (zh)
CN (1) CN117043331A (zh)
AR (1) AR125192A1 (zh)
AU (1) AU2022245134A1 (zh)
BR (1) BR112023019521A2 (zh)
CA (1) CA3212095A1 (zh)
CL (1) CL2023002802A1 (zh)
IL (1) IL305892A (zh)
WO (1) WO2022203927A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6723896B1 (en) * 1999-11-12 2004-04-20 The Rockefeller University Inducible site-specific recombination for the activation and removal of transgenes in transgenic plants
WO2015048707A2 (en) * 2013-09-30 2015-04-02 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
WO2019126562A1 (en) * 2017-12-22 2019-06-27 Bio-Rad Laboratories, Inc. Controlling phenotype of organisms with crispr/cas gene targeting
WO2020131788A1 (en) * 2018-12-21 2020-06-25 Syngenta Participations Ag Simultaneous gene editing and haploid induction

Also Published As

Publication number Publication date
AU2022245134A1 (en) 2023-09-14
KR20230158660A (ko) 2023-11-21
CA3212095A1 (en) 2022-09-29
JP2024512050A (ja) 2024-03-18
EP4314276A1 (en) 2024-02-07
BR112023019521A2 (pt) 2023-10-31
WO2022203927A1 (en) 2022-09-29
US20240167046A1 (en) 2024-05-23
IL305892A (en) 2023-11-01
AR125192A1 (es) 2023-06-21
CL2023002802A1 (es) 2024-02-02

Similar Documents

Publication Publication Date Title
KR102630763B1 (ko) 동시 유전자 편집 및 반수체 유도
CN108368517B (zh) 用于快速植物转化的方法和组合物
CN101889088B (zh) 从植物基因组中切除核酸序列的方法
CN110283840B (zh) 陆地棉基因组的精确高效编辑方法
KR100785946B1 (ko) 식물 형질전환 벡터
TW200530398A (en) P EF-TU expression units
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
CN106906175A (zh) 用于生产尸胺的方法和重组微生物
AU2023282248A1 (en) Induced expression in plants
CN106834338B (zh) 拟南芥基因rem16的表达载体及其在调控植株开花期中的应用
CN108203714A (zh) 一种棉花基因的编辑方法
CN113621642A (zh) 一种用于农作物杂交育种制种的遗传智能化育制种系统及其应用
EP1144665A1 (en) Methods for transforming plastids
CN110656114A (zh) 一种烟草色素合成相关的基因及其应用
CN110760538B (zh) 一种创制枯萎病抗性西瓜种质材料的方法
KR20230163460A (ko) 식물에서의 증가된 형질전환성 및 반수체 유도
CN109321576A (zh) 一种无腺体低棉酚棉花种质的创制方法
CN110643628B (zh) 水稻bZIP基因及其下游基因qLTG3-1在提高植物耐低温上的应用
CN117043331A (zh) 诱导型嵌合体
KR20210137055A (ko) 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제
CN109232726B (zh) 蛋白质OsVPE2在调控植物液泡无机磷输出能力中的应用
CN109485707B (zh) 蛋白质OsVPE1在调控植物液泡无机磷输出能力中的应用
KR20210084557A (ko) 오크로박트럼-매개 유전자 편집을 위한 조성물 및 방법
TW201210471A (en) Method for enhancing thermotolerance of plant and applicatibility of transgenic plant
CN106459161A (zh) 涉及谷氨酸受体多肽编码基因的构建体和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination