CN107849581A - 用于植物中的特异性核酸编辑的方法和构建体 - Google Patents

用于植物中的特异性核酸编辑的方法和构建体 Download PDF

Info

Publication number
CN107849581A
CN107849581A CN201680042299.4A CN201680042299A CN107849581A CN 107849581 A CN107849581 A CN 107849581A CN 201680042299 A CN201680042299 A CN 201680042299A CN 107849581 A CN107849581 A CN 107849581A
Authority
CN
China
Prior art keywords
plant
sequence
grna
target
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680042299.4A
Other languages
English (en)
Inventor
H·哈林
S·马丁-奥蒂戈萨
M·尼森
C·施特赖内尔
N·舒曼
E·扬戴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE102015006335.9A external-priority patent/DE102015006335A1/de
Priority claimed from DE102015014252.6A external-priority patent/DE102015014252A1/de
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Publication of CN107849581A publication Critical patent/CN107849581A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/04Stems
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/12Leaves
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8203Virus mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • C12N15/8207Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated by mechanical means, e.g. microinjection, particle bombardment, silicon whiskers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)
  • Physiology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明涉及靶向修饰植物靶结构中的核酸靶区域的方法和构建体。本发明特别涉及直接获得植物或者植物材料的方法和构建体,所述植物或植物材料包含以靶向方式引入分生组织细胞中的核酸编辑。混合物可以瞬时和/或稳定方式引入。本发明还涉及新的植物优化引入策略。本发明进一步涉及进行体外筛选试验以在体外对合适的gRNA候选物就其效力进行初查。

Description

用于植物中的特异性核酸编辑的方法和构建体
技术领域
本发明特别涉及制备植物、植物材料或者植物细胞的方法,包括提供至少一个gRNA以及CRISPR核酸酶或其催化活性片段和/或效应子结构域,或者至少一个重组构建体,并将其引入包含至少一个分生组织细胞的靶植物结构中,所述重组构建体包含gRNA以及CRISPR核酸酶或催化活性片段和/或效应子结构域或其编码序列,以及至少一个调节序列和/或定位序列,基于此,可以直接获得在靶区域中包含靶向修饰的核酸的植物、植物材料或者植物细胞,其中所述至少一个重组构建体优选不是染色体或者染色体外整合的。另外,公开了合适的重组构建体和载体以及将这些构建体和载体引入靶植物结构中的方法。最后,公开了重组构建体用于特异性修饰植物细胞中的靶核酸区域的用途,以及根据本发明方法可以获得或者获得的植物、植物材料或植物细胞。此外,公开了一种体外筛选方法作为初步检测,以容易地高通量确定gRNA或gRNA编码序列(与CRISPR核酸酶包括Cas和/或Cpf1核酸酶或者其变体或其催化活性片段一起)对于靶向修饰植物细胞中特定核酸靶区域的功能性。本文公开的方法特别适于靶向引入、修饰或者消除植物中希望的性状,特别是在靶向性状开发的框架中,以确保高度特异性和有效编辑。
发明背景
基因组编辑是一种分子生物学方法,通过基因组编辑可以将特异性修饰如插入、缺失或者点突变或者其组合引入活生物体的基因组中。为此,需要特定的分子工具,首先所述分子工具具有核酸酶活性,但是最重要的是其可以以足够的特异性被引导至待修饰的靶序列,以规划和进行特异性的定点诱变。在过去的几年中,在植物生物技术领域,特异性基因组编辑已经发展成为常规的培育和转基因策略的替代方式。然而,目前可用的工具,如锌指核酸酶(ZFN)或者“转录激活子样效应子核酸酶”(TALEN)仅有限程度地用于植物生物技术,这是因为偶发的低效及也因为构建体复杂及设计昂贵。
近年来已经广泛使用的用于精确及定点基因组修饰的进一步的分子工具是基于CRISPR核酸酶的系统。这些核酸酶包括尤其是Cas(CRISPR相关基因)核酸酶或者Cpf1核酸酶,组成了在文献中描述为“CRISPR”系统(规律成簇的间隔短回文重复序列)的一部分。这个系统最初在1987年鉴定,当分析大肠杆菌(E.coli)的iap基因时,鉴定了在细菌基因组中天然存在的重复序列。后来发现这些20-50个核苷酸的回文DNA重复序列遵循一个模式。然后采用了首字母缩写CRISPR(Jansen,R.et al,“Identification of genes that areassociated with DNA repeats in prokaryotes”,Mol.Microbiol.,2002,43(6),1565-1575),基于此,研究更密切的聚焦于细菌。最后,有报道CRISPR基因座构成一种细菌免疫系统类型,且可以赋予针对噬菌体的免疫性(Barrangou et al“CRISPR provides acquiredresistance against viruses in prokaryotes”Science 2007,315:1709.1712),其中侵入的噬菌体DNA首先作为前间区序列安装进CRISPR基因座,然后该基因座转录并最后激活CRISPR介导的沉默机制。
功能特性逐步导致该系统被用作高等生物体的基因组修饰的通用工具。同时,描述了大量CRISPR/Cas系统(见例如Van der Oost et al“Unravelling the structuraland mechanistic basis of CRISPR-Cas systems“Nature 2014,482:331-338,Makarovaet al.,An updated evolutionary classification of CRISPR-Cas systems“,NatureReviews Microbiology 13,722–736);迄今为止分析仍远未完成。
由于细菌II型CRISPR系统的揭示和利用,目前可以使用具有巨大潜力的进一步的基因组编辑系统。
迄今已经描述了5种类型(I-V)的CRISPR系统(Barrangou et al.,2007,Science,315(5819):1709-12;Bouns et al.,2008,Science,321(5891):960-4;Marraffini andSontheimer,2008,Science,322(5909):1843-5;Makarova et al.,NatureRev.Microbiol.,13,722-736,2015),其中每个系统均包含一簇CRISPR相关基因(Cas或者其它基因)及属于其的CRISPR阵列。这些特征性CRISPR阵列由重复序列(直接重复,所谓重复序列(repeat))组成,其中嵌入非重复序列的短区段(间隔序列),其中间隔序列源自外源遗传物质的短片段(前间区序列)。随后将CRISPR阵列转录为短CRISPR RNA(crRNA),其中crRNA将CRISPR系统的Cas蛋白或者其它效应子核酸酶指引至各自的靶核酸分子,其中裂解是通过Watson-Crick碱基配对发生。I型和III型CRISPR系统使用Cas蛋白与crRNAs的复合物以识别及随后裂解靶核酸(Wiedenheft etal.,2011,Nature,477(7365):486-9)。不同的是,II型CRISPR系统以其天然形式识别和裂解,其靶DNA与RNA指导的核酸酶Cas9及两个非编码RNA(crRNA和反式激活RNA(tracrRNA))相互作用(Garneau et al.,2010;Sapranauskas et al.,2011,Nucleic Acids Res.,39(21);9275-82;Deltcheva et al.,2011,Nature,471(7340);602-7)。也已经提议了一种可能的IV型CRISPR系统(Makarova etal.,Biol.Direct,6(38),2011)。
在天然系统中由CRISPR/Cas介导的免疫应答需要CRISPR-RNA(crRNA),其中这种控制Cas核酸酶特异性激活的指导RNA的成熟在迄今已经鉴定的不同CRISPR系统之间显著不同。首先,也称作间隔序列的侵入DNA被整合在CRISPR基因座的近端的两个相邻重复区域之间。II型CRISPR系统编码Cas9核酸酶作为在干扰步骤中关键酶,其含有crRNA及反式激活RNA(tracrRNA)作为指导基序。这些杂交并形成双链(ds)RNA区域,其由RNAseIII识别且可以裂解以形成成熟的crRNA。然后将这些与Cas分子相关联以将核酸酶特异性定向于靶核酸区域。
重组CRISPR/Cas系统或者一般而言,CRISPR/核酸酶系统通过小的单独剪裁的非编码RNA(指导RNA或者gRNA)组合可能修饰的核酸酶使得可以进行靶向的DNA识别和/或结合,及任选存在的单链或双链断裂的产生。重组gRNA分子可包含可变DNA识别区及核酸酶相互作用区,及因此可以特别设计,不依赖于特异性靶核酸和希望的核酸酶(Jinek et.al.,2012,supra)。作为进一步的安全性机制,PAM(前间区序列邻近基序)必须存在于靶核酸区域;这些是DNA序列,其在II型CRISPR系统中直接紧接着Cas9/RNA复合物识别的DNA。来自酿脓链球菌(Streptococcus pyogenes)的Cas9的PAM序列事实上是NGG或者NAG(标准IUPAC核苷酸编码)(Jinek et al,“Aprogrammable dual-RNA-guided DNAendonuclease inadaptive bacterial immunity“,Science 2012,337:816-821)。来自金黄色葡萄球菌(Staphylococcus aureus)的Cas9的PAM序列是NNGRRT或者NNGRR(N)。已知进一步的变体CRISPR/Cas9系统。因此,脑膜炎双球菌(Neisseria meningitidis)Cas9在PAM序列NNNNGATT裂解。嗜热链球菌(Streptococcus thermophilus)Cas9在PAM序列NNAGAAW裂解。进一步地,通过使用修饰的Cas多肽,可以获得特异性单链断裂。组合使用Cas切口酶与各种重组gRNA也可以通过双重DNA切口诱导高度特异性DNA双链断裂。此外,通过使用两个gRNA,可以优化DNA结合的特异性,从而优化DNA裂解。
除了CRISPR/Cas系统之外,近年来也阐述了所谓的CRISPR/Cpf1系统,其适合作为以与CRISPR/Cas系统类似的方式靶向基因组编辑的工具(见Zetsche et al.,“Cpf1Is aSingel RNA-Guides Endonuclease of a Class 2CRISPR-Cas System,”Cell,163,pp.1-13,October 2015)。CRISPR/Cpf1系统也称作V型CRISPR系统(Makarova et al.,NatureRev.Microbiol.,2015,above)。与II型CRISPR/Cas系统的Cas9核酸酶不同,Cpf1核酸酶不需要另外的反式激活tracr-RNA。Cpf1识别T富集的PAM序列,裂解靶DNA,产生“粘性末端”,即突出端,相反,Cas9产生“平末端”。与Cas核酸酶一样,Cpf1核酸酶含有RuvC样核酸内切酶,而不同的是,其缺少第二HNH核酸内切酶结构域(Makarova&Koonin,MethodsMol.Biol.,1311,47-75,2015)。I、II和IV型CRISPR系统目前称为1类系统,而II型和IV型系统被认为是2类(cf.Makarova et al.,Nature Rev.Microbiol.,2015,above)。
植物细胞内的DNA双链断裂通过“非同源末端接合”(NHEJ)或者“同源重组”((HR),也称作“同源定向修复”(HDR))被修复。此外,已经描述了在植物中所谓的替代性末端接合(AEJ)途径(Charbonnel C,Allain E,Gallego ME,White CI(2011)Kinetic analysis ofDNAdouble-strand break repair pathways in Arabidopsis.DNARepair(Amst)10:611–619)。
因此在US 2015/082478 A1中提议使用单独的HDR DNA修复载体以引入双链断裂,其是先前通过重组CRISPR/Cas系统获得的。除了细菌基因组的遗传修饰之外,复杂的真核生物基因组的修饰由于这种基因组的复杂性而构成了巨大的挑战,需要提供这样的分子工具,即其可实现特异性基因组修饰而无不希望的脱靶结果,即在靶细胞的基因组或者非基因组DNA内不希望的突变或修饰。
US 8 697 359 B1揭示了使用CRISPR/Cas技术,可以修饰真核生物基因组、特别是哺乳动物基因组,优选用于治疗目的。在这方面,通过特异性引入Cas9核酸内切酶以及指导RNA(gRNA)以可编程方式抑制靶基因的表达。这种gRNA是每个Cas9 CRISPR系统的基本元件,因为事实上其指导实际的Cas核酸酶特异于(基因组)靶DNA。为此目的,另外针对Cas9-CRISPR系统揭示了tracr(反式激活CRISPR RNA)序列和tracr伴侣(mate)序列,其可以包含在gRNA中,其中tracr序列杂交并因此可被识别。但是,并没有揭示使用CRISPR技术来修饰复杂的植物基因组以及所需的分子工具。
另一方面,WO 2015/026885A1特别涉及CRISPR/Cas技术在植物中的应用。然而,在此仅公开了总体策略和合适的分子工具,其必须在成功引入CRISPR/Cas工具之后进行植物愈伤组织的传代培养、选择和再生,因此不能直接获得含有希望的DNA修饰的植物或植物材料,且其含有希望的DNA修饰。
关于CRISPR/Cas技术在植物基因组的基因组编辑中的应用开发的实际状态的综述可见于Bortesi&Fischer(“The CRISPR/Cas9system for plant genome editing andbeyond“,Biotechnology Advances,33,pages 41-52,20.12.2014)。这篇综述特别报道了提供特异性gRNA以在玉米中进行靶向的问题。此外,讨论了高脱靶突变率的问题,这些问题不仅在哺乳动物细胞中使用CRISPR/Cas时观察到,而且在植物细胞中使用时也观察到;在此,为了在各靶细胞/各靶生物体中获得没有脱靶效应的定点靶向修饰,设计独特的CRISPR/Cas工具是决定性的。进一步地,Bortesi&Fischer认可CRISPR/Cas系统也可以用于DNA的表观遗传学修饰,因为CRISPR/Cas系统也可用于裂解甲基化的DNA,但是声称目前为止不知道应用于植物中。
此外,Guilinger等描述了FokI核酸酶以切口酶形式使用,并因此产生较高的特异性(Guilinger et al;Fusion of catalytically inactive Cas9to FokI nucleaseimproves the specificity of genome modification,doi:10.1038/nbt.2909)。然而,Guilinger等仅呈现了对于人细胞的数据,而不是对于植物细胞的数据。
Mali et al 2013涉及人细胞中的CRISPR/Cas系统的使用,其中使用Cas9的核酸酶-zero变体或者适体结合的gRNA,其可以融合于转录激活物结构域(Mali,P.,et al(2013),"CAS9transcriptional activators for target specificity screening andpaired nickases for cooperative genome engineering)。然而,Mali等未提及相应的系统可以怎样使用以及以什么程度用于植物细胞中。
总之,现在使用的许多策略在植物领域只是暂时或瞬时的,这意味着突变存在于已经分化的细胞中,例如在叶中,但是这些突变不能通过种系遗传。此外,还有策略需要将编码序列包括需要的调节序列如启动子和终止子稳定整合进基因组中,由此随后可以产生世代继承的稳定突变。然而,CRISPR/Cas工具仍包含在植物的基因组中,因此也包含在潜在的植物产品例如水果和种子中,考虑到相应产品的风险评估这是不可取的。
因此,植物生物技术中的CRISPR/Cas策略仍然低效,但是其特征还在于困难和昂贵的构建体设计以及频繁出现脱靶效应。此外,目前的许多策略是基于将CRISPR/Cas工具以稳定的方式整合到植物细胞的基因组中,或者将CRISPR/Cas工具引入分化的组织的细胞中,例如叶子中。因此,通过稳定的策略,后代遗传了各个工具如Cas9而不仅仅是由其所致特异性DNA修饰。在转化进分化的细胞和组织后,由CRISPR/Cas工具引入的突变仅在相关细胞中有效,但不能进一步通过种系遗传。具体而言,关于植物中正面性状的靶向开发,包括抗性,特别是对害虫和环境影响(例如寒冷、干旱、盐含量、增加的产量或除草剂抗性)的抗性,建立可靠的方法以靶向地激活和失活或者修饰基因组材料以及在植物细胞中沉默RNA具有重要的经济利益。
关于合适gRNA的选择,已经存在电脑(in silico)工具,其可以鉴定合适的gRNA及其随后产生所述gRNA(见:https://www.dna20.com/eCommerce/cas9/input),但是目前没有特定工具可以用于总是具有复杂基因组的重要农作物中。此外,可用的工具未提供关于电脑确定的gRNA在随后的植物细胞内的体外或体内检测中的实际效力的信息。
因此,一直需要建立基于gRNA和CRISPR核酸酶或gRNA及其它效应子结构域的瞬时以及任选地还是可诱导的方法和构建体,以在靶植物细胞中对靶序列进行所需的修饰,其中只有靶序列的修饰而不是构建体被传递给后代。此外,大大需要基于CRISPR的方法,其提供了在植物细胞或植物组织中直接进行种系修饰的可能性,使得所述修饰可以被遗传,且可以直接从得自含有特定基因组修饰的修饰的植物细胞或组织的植物中收获种子,而不必实施困难和昂贵的中间步骤。最后,需要特别拓宽由CRISPR/Cas工具提供的RNA指导的DNA修饰系统,其中不仅基因组靶结构而且任何作为靶结构的核酸不仅能以受控方式在细胞的基因组中修饰,而且实际上也在细胞质或质体中修饰。就这一点而言,目前也期望合适的插入系统,其允许CRISPR/Cas工具的靶向插入,从而允许植物靶结构内的靶区域的靶向修饰。
此外,需要有效的体外筛选方法,通过该方法可以在高通量的体外测定中检查植物细胞内的gRNA的效力,并进行可靠的预测,以避免昂贵和漫长的植物材料尝试。
最终目标是优化基因组编辑方法的精确性,特别是修饰较大的真核生物基因组,包括植物基因组和来自动物生物体的基因组,以获得更少的脱靶效应,并且理想的是,通过创建修复矩阵连同实际的基因组修改工具,获得靶向、插入、双链断裂的最佳修复
发明概述
因此,本发明的目的是提供允许植物组织或植物细胞、特别是分生组织细胞的瞬时转化的方法和分子工具,从而允许任何植物细胞区室中的任何靶核酸区域的受控修饰。同样,一个目的是建立用于本公开的分子工具的合适的插入方法。另外,应该建立合适的体外筛选测定或检测,由此可以预先在体外鉴定合适的功能性gRNA,以便能够有效地减少在植物体中(in planta)的后续努力或在植物组织中的体外的后续努力。
本发明的一个目的是在一个在植物生物技术中广泛应用的系统中将上述优点组合。
特别地,产生帮助植物栽培的工具,使得感兴趣的性状可以插入植物基因组中,或者同样从其中移除或修饰。
这个目的通过如在所附权利要求中要求的以及在说明书、附图和所附序列表中所描述的本文所提供的方法和构建体来实现。特别地,这个目的是通过提供包括转化或转染至少一个分生组织细胞的方法而实现。此外,这个目的通过提供包含特别修饰的CRISPR工具和/或其它效应子结构域的重组构建体来实现。最后,通过提供适当的调节序列和定位序列来实现这一目的,其允许将感兴趣的重组构建体以受控的方式指引至感兴趣的靶植物结构的任何可选区室中。
以这种方式,在任何靶核酸区域中的至少一个特异性修饰可以在植物细胞、特别是分生组织植物细胞的任何区室中获得。由于如此修饰的至少一个分生组织细胞可以通过随后的细胞分裂和分化为其后代而传递靶核酸区域中的特异性修饰,和/或具有从分生组织细胞长成完全修饰的植物生物体的潜力,可以提供植物或植物材料或植物细胞,而不必进行进一步的复杂培养或杂交和选择步骤(尤其是复杂的回交程序)。而且,从以此方式修饰的至少一个分生组织靶细胞中可以直接(unmittelbar und direkt)获得植物、植物材料或植物细胞。以这种方式,有可能在分生组织中仅短暂地产生或提供或激活gRNA和/或CRISPR核酸酶或其一个或多个催化活性片段和/或其它效应子结构域,因此这些重组大分子随后,即在gRNA和/或CRISPR核酸酶或其催化活性片段和/或其它效应子结构域已经进行其期望的目的之后,优选降解,因为其没有整合到基因组或内源染色体外的DNA中;这对于植物产品的监管方面和风险评估可能是有利的。本发明使用的CRISPR核酸酶或其催化活性片段在造成DNA(双链或单链)断裂的催化结构域中也可以含有一或多个突变。这导致了对于Cas核酸酶的广泛的应用,并且在基于Cas的切口酶的情况下,以更高的结合特异性应用,因为使用两个CRISPR/Cas构建体以在希望的位点切割DNA双链的两条单链。甚至在本文中提出了Cas-zero变体,以及它们与其它效应子结构域的组合使用以优化特异性核酸编辑。
此外,发现根据本文提供的方法通过利用CRISPR工具及其它效应子结构域(如DNA或RNA或组蛋白修饰或DNA或RNA或组蛋白结合多肽或核酸,包含例如任何类型的单体、二聚或多聚核酸酶,包括切口酶、转录激活物和阻抑物、磷酸酶、糖基化酶或可以进行表观遗传修饰的酶如甲基化酶、乙酰化酶、甲基转移酶或组蛋白脱乙酰酶、适体(包括单链DNA或RNA序列以及肽)、荧光蛋白、生物发光蛋白、标记核酸序列或标记氨基酸序列等以及其组合)的作用机制,于是已知特异性基因组编辑的范围可以扩展到一般的核酸编辑,其本身不限于基因组DNA。
关于本文揭示的编辑基因组DNA的方面,还应该产生DNA修复矩阵或HDR矩阵,其可以以靶向方式与CRISPR工具一起插入感兴趣的靶细胞或靶结构中,以便控制易错的内源性NHEJ修复系统,及还能够在双链断裂位置插入希望的核酸。
因此,本公开提供了以以下方式使用CRISPR/Cas机制的可能性:不仅允许DNA的核溶解(nucleolytic)裂解,而且还允许植物细胞中的基因组DNA的任何修饰,例如表观遗传学修饰以及RNA(例如mRNA)的修饰。
通过使用包含启动子、终止子、转录因子结合位点或内含子的其它调节序列和/或包含核、线粒体和质体定位序列的定位序列,本发明还提供了以特异性方式修饰靶植物结构的任何靶核酸区域的可能性,因此例如线粒体和质体DNA也可以作为编辑靶位。此外,还提出了特异性修饰RNA例如mRNA的可能性,其中在此也可以利用是CRISPR/Cas系统的基础的gRNA-指导的序列识别和根据本发明的“重新编程”以拓宽CRISPR/Cas技术的应用领域。
本文还提供了方法和构建体,通过所述方法和构建体,在重组构建体上提供了已经与另外的效应子结构域连接的gRNA和/或CRISPR核酸酶或其催化活性片段。
此外,提供了一种方法,其中在不同的重组构建体上分别提供至少一个gRNA以及至少一个CRISPR核酸酶或其催化活性片段和/或至少一个另外的效应子结构域。根据该方法,所述gRNA组分可以以DNA或RNA提供,CRISPR核酸酶或其变体或其催化活性片段可以以DNA或RNA或以多肽序列提供,效应子结构域可以以DNA或RNA提供。
另外的目的是提供可以是可诱导的或者组织或细胞器特异性的特异性构建体的可能性,及通过建立植物特异性构建体和方法来最小化不想要的脱靶效应的可能性。最后,在一个方面,设计了方法和构建体,其不仅提供特定基因敲入的可能性而且还提供了,例如,特定基因敲除、遗传片段的插入、特异性表观遗传学修饰、点突变引入、乙酰化、甲基化、磷酸化、糖基化、通过抗性标记或荧光蛋白标记、转录的激活或重引发、双链或单链核酸的特异性切割、核酸的结合等的可能性,由此拓宽了在植物栽培中的应用领域。从培养和管理的角度来看,希望通过修饰获得的特征在至少一代具有稳定的遗传性,同时在所得植物或者所得植物细胞中不存在所需的CRISPR/Cas系统的构建体。
最后,一个目标是产生一种在体外测定中鉴定gRNA或gRNA编码序列的体外筛选方法,以鉴定gRNA或gRNA编码序列,其与CRISPR核酸酶或催化活性片段适合于在植物细胞中靶向修饰核酸靶区域。
根据下面的详细描述和实施例、附图、序列表及特别是所附专利权利要求,本发明的具体方面和实施方案将变得明显。
附图简述
图1A-F(图1A-F)显示了各种大小的玉米胚。在此分析的胚中,分生组织清晰可见,是胚中心的盘状结构。根据胚的大小和发育阶段,分生组织处于不同的发育阶段,易于发现或难以发现。此外,分生组织用星号(*)标示。
图2A和B(图2A和B)示出0.5mm(A)和1mm玉米胚(B)的分生组织的直接对比。在这两种情况中,分生组织可见,是胚中心的盘状结构,但是在1mm的胚中,分生组织已经被很多叶组织包围。这使得接近分生组织更加困难,由此优选具有暴露的分生组织的较小的胚。
图3A-D(图3A-D)示出在玉米幼苗中制备的分生组织。由于幼苗中的分生组织完全被叶包围,所以必须将其切除以便可以进行轰击、显微注射等。为此,将外部组织结构完全去除以暴露分生组织(箭头所示)。
图4A-C(图4A-C)示出在较老的玉米植物中制备的分生组织。由于在较老植物和幼苗中的分生组织完全被叶包围,因此需要进行制备以便能够进行轰击、显微注射等。为此,完全除去外部组织结构以暴露分生组织(箭头所示)。
图5A和B(图5A和B)示出对玉米胚分生组织的生物射弹测试轰击。在图5(A)中示出具有盘状分生组织结构的胚的示意图(由双环和箭头突出显示)。图5(B)示出测试轰击后的荧光(b/w图像中的白色区域)。对于测试轰击,使用编码荧光蛋白的基因。可以检测到在分生组织区域(双环表示)中蛋白质的明确表达。
图6示出在成熟玉米植物中雄穗分生组织的制备。分生组织(箭头表示)通过窗口样的孔暴露。然后可以通过例如轰击或显微注射等方法引入重组构建体。其优点是植物没有受到严重损害,分生组织没有完全暴露(大约1-2天后,雄穗分生组织在开口中不再可见,因为它进一步向上移动),因此降低氧化和进一步损害。
图7A和B(图7A和B)示出来自玉米的暴露的雄穗分生组织的生物射弹测试轰击。图7(A)是玉米雄穗的分生组织的示意图。图7(B)示出在测试轰击后的荧光(b/w图像中的白色区域)。对于测试轰击,使用编码荧光蛋白的基因。可检测到蛋白质在分生组织区域中的明确表达。
图8示出用于评估感兴趣的gRNA的效率的体外测定的结果。在此起始植物是玉米植物,靶基因是hmg13基因(HMG转录因子13;GRMZM2G066528)。该图示出在默认参数为100V的1%凝胶中分离的结果,并通过溴化乙锭提供的荧光进行观测。分子大小标记(以碱基对给出;GeneRuler 1kb plus DNA ladder(Thermo Fisher Scientific Inc.,USA;SM1331)20000、10000、7000、5000、4000、3000、2000、1500、1000、700、500、400、300、200、75bp)位于第3、6、10、12和14列。针对gRNA 14(SEQID NO:41)、gRNA 16(SEQ ID NO:42)、分子标记、gRNA 37(SEQ ID NO:43)、gRNA 38(SEQ ID NO:44)、分子标记、gRNA 39(SEQ ID NO:45)、gRNA43(SEQ ID NO:46)、gRNA 18(SEQ ID NO:47)、分子标记、gRNA 52(SEQID NO:48)、分子标记、gRNA 39(SEQ ID NO:45)和gRNA 43(SEQ ID NO:46)的结果在其它列中从左至右示出。给出的SEQ ID NO表示在gRNA中各个不同的前间区序列,gRNA的剩余区域在本发明使用的所有gRNA中均是相同的。
图9A和B(图9A和B)示出在不同压力下(以psi表示:磅/平方英寸)的玉米胚轰击检测结果。授粉后7-10天轰击玉米胚,2天后进行显微分析。表达载体以质粒使用,其特别编码荧光标记。图9(A)在六个单独的图示中示出1350psi的轰击。图9(B)在四个单独的图示中示出1550psi的轰击。相比之下,在靠下的图中可以看到明显更多的荧光,黑白图中的较亮区域表示。然而,荧光/亮度增加,即插入效率提高,可能伴随降低的胚萌发。
图10A和B(图10A和B)示出玉米胚以及局部分生组织的两个视图。最初,这些数据由荧光标记表示。图10(A)和(B)中用星号表示原始分析中荧光的累积。图10(A)示出胚,图10(B)示出较深的层,其中在分生区域(用星号标记)中也可以看到荧光。用激光扫描显微镜记录图像,用于轰击的载体是编码荧光蛋白的表达载体。胚层已经用合适的颜料染色。
图11A和B(图11A和B)示出根据实施例3的在较老的玉米植物(5-10天龄幼苗)中暴露的分生组织的水平轰击。因为与在幼苗中一样,分生组织在较老植物中被叶子完全包围,必须提前制备以便进行轰击等等。为此,除去所有的外部叶子。在轰击后一天用激光扫描显微镜记录图像,用于轰击的载体是荧光蛋白编码表达载体。图11(A)示出侧视图的制备的分生组织的显微镜记录。图11(B)示出在该侧视图中检测到的荧光(白色点)。胚层已经用合适的颜料染色。
图12A-C(图12A-C)示出根据实施例3的在较老的玉米植物(5-10天龄幼苗)中暴露的分生组织的垂直轰击。因为与在幼苗中一样,在较老植物中的分生组织由叶子完全环绕,因此必须加以制备以能接受轰击。为此,外部叶子被完全去除。在轰击后一天用激光扫描显微镜记录图像,用于轰击的载体是编码荧光蛋白的表达载体。图12(A)示出顶视图中制备的分生组织的显微镜记录。图12(B)示出在该视图中检测到的荧光(白点)。图12(C)示出其中检测到荧光的区域,扩大了2倍。胚层已经用合适的颜料染色。
图13A和B(图13A和B)示出在分生组织区域也具有瞬时荧光的正在萌发的胚。在图13(A)中可以看到胚靶结构,相同的靶结构示于图13(B),插入的标记的荧光使得可以通过荧光显微镜观测。通过插入合适的荧光标记获得荧光。在黑白图像中,图13(B)中的白色区域对应于已经检测到荧光的区域。
图14示出根据实施例1的举例的质粒pJET1.2-hmg-exon3-5的载体图。
图15示出根据实施例1的举例的质粒pJET1.2-hmg-3’part/part的载体图。
图16示出根据实施例1的举例的质粒pEn Chimera-hmg-gRNA14的载体图。
图17A和B(图17A和B)示出用于本文揭示的方法的2-gRNA策略。图17A示出两种gRNA(gRNA-1和gRNA-2)的使用,其激活基因组DNA区域,目的是通过CRISPR核酸酶例如Cas核酸酶或者任何其它CRISPR核酸酶从基因组DNA区域切除位于它们之间的区域。(RE:限制酶)。图17B示出在对玉米植物的基因组使用2-gRNA策略之后的编辑事件的分析结果。为此,从玉米植物中分离基因组DNA,并用PCR扩增靶基因hmg13基因(HMG-转录因子13;GRMZM2G066528)。图17B示出在1%凝胶中分离的结果,标准参数为100V,并且随后通过溴化乙锭获得的荧光进行观测。第5列包含分子大小指示剂(以碱基对给出;GeneRuler 50bpDNA Ladder(Thermo Fisher Scientific Inc.,USA;SM0373)1000、900、800、700、600、500、400、300、250、200、150、100、50bp)。第1列和第2列分别显示未编辑的玉米植物的结果,第4列显示编辑成功后的结果。PCR产物较小,因为两个gRNA靶区域之间的区域已被切除。
图18显示本氏烟(Nicotiana benthamiana)NbTTG1基因的一部分。gRNA靶区域用阴影箭头表示,引物结合位点(fw:正向,re:反向)用黑色箭头表示。此外还指出了限制性内切酶的切割位点,其用于编辑结果分析的构架中。
图19:在未接种的远端本氏烟叶组织中获得的TRV。图19示出使用得自病毒脆裂病毒(TRV)的表达,用红色荧光蛋白构建体(RFP)和对照构建体对本氏烟(N.benthamiana)的叶接种。构建体pZFN-tDT-nptll起着对照的作用,允许RFP在接种叶中但不在远端叶中的表达。在图19的黑白图示中,亮区对应于最初检测到的红色荧光,而黑区表示其中不能检测到荧光的那些区域。
图20A-H(图20A-H)示出已经感染能表达红色荧光蛋白的TRV的各种开花结构的荧光显微镜记录。所有图A到H均在左侧示出光场记录,中间是红色滤光片的记录,右侧是绿色(GPF)滤光片的记录。后者用作自发荧光的对照。图20A(黑白原始记录)和B(调节对比度/曝光的A副本)显示开花分生组织。图20C(原始黑白)和D(调节对比度/曝光的C副本)示出花芽。雌蕊记录在图20E(黑白原始记录)和F(调节对比度/曝光的E副本)。图20G(黑白原始记录)和H(调节对比度/曝光的G副本)示出具有暴露子房的制备的雌蕊。
图21示出在接种pTRV1(=阴性对照)、pTRV1+pTRV2-tDTco(=阳性对照)及pTRV1+pTRV2-Cas9 10dpl的本氏烟中定量TRV效价。
图22示出在转基因玉米植物的叶材料中表达并随后分离的Cas9(160kDa)中的蛋白质指示。PageRuler预染蛋白质梯度(10-170kDa;从上到下170、130、100、70、55、40、35、25、15、10kDa)用于大小标准。曝光时间是30分钟。第1列:预染色的蛋白质标记;第2列:来自表达Cas9的玉米的10μg蛋白质;第3列:来自表达Cas9的玉米的15μg蛋白质;第4列:来自表达Cas9的玉米的20μg蛋白质。
图23显示了举例的病毒序列(BMV)。箭头表示用于gRNA量化系统的各种引物组合。“Fw”表示正向引物,“re”表示反向引物,两侧是感兴趣的序列。整合到待分析的感兴趣构建体中的HMG转录因子基因的特定gRNA以“hmg gRNA”表示。图示的嵌合RNA(“Chimera RNAMali et al.”)描述了一种嵌合的人工RNA构建体,由Mali et al.,2013的揭示所支持,其中描述的gRNA已经被特别调整以适合用于植物细胞中,如在实施例中阐述。
图24显示了V7阶段的基因型A188的玉米植物(左侧图像),在保护雄穗组织的区域插入人工窗口后的相同植物(中间图像),以及随后在暴露的雄穗区域中注射农杆菌溶液(右手图像)。
图25A-C(图25A-C)示出玉米植物的未成熟的胚(图25A),将其分离并随后用包含CRISPR/Cas9构建体和表达红色荧光蛋白的质粒的颗粒轰击进行轰击。图25B显示了轰击后第一天的荧光显影(白色和亮区)。图25C显示从图25A和B的胚获得的成熟玉米植物,将其以这种方式轰击并随后生长到成熟。
图26示出根据下文详细描述的方法获得的不成熟的甜菜(Beta vulgaris)胚。
图27A和B(图27A和B):图27A:分生组织转化后的未成熟的小麦谷粒。图27B:对应于图27A的荧光记录。亮区对应于检测到的荧光(黑白记录中的亮/白色区域)。在分生组织转化后,发芽的小麦植物可以从处理的小麦谷粒(A和B)中直接获得。
图28显示了左侧图像中小麦中未成熟花序的定位。中间图像和右侧图像显示了从左到右的已经转化的分生组织的进一步发展,如下所述。
发明详述
定义
如本文所用,术语“植物”或“植物细胞”涉及植物生物体、植物器官、分化和未分化的植物组织、植物细胞、种子及其子代或后代。“植物细胞”包括例如种子、成熟和未成熟的胚、分生组织、幼苗、愈伤组织、叶、花、根、植物芽、配子体、孢子体、花粉和小孢子、原生质体、大型藻类和微藻类的细胞。
如本文所用,术语“可育植物”是指能够繁殖的可育植物,即可育植物是能够产生活的雄性和雌性配子的植物。因此,雄性不育植物是不能产生活的雄性配子的植物,但其可以是雌性可育的。雌性不育植物是不能产生活的雌性配子的植物,其中该植物仍然可以是雄性可育的。
如本文所用,“植物材料”是指可以得自任何发育阶段的植物获得的任何材料。因此,该术语包括植物细胞、组织和器官以及形成的植物结构,以及相关的亚细胞成分如核酸、多肽,以及存在于植物细胞内和/或可以由其产生的所有化学植物物质。
如本文所用,术语“染色体或染色体外整合”涉及瞬时引入和/或形成本发明的一种或多种重组构建体,并且涉及所述一种或多种重组构建体随后在靶植物结构例如细胞中的命运,其中所述一种或多种重组构建体以及其引入条件均保持一种方式,由此在包含所述基因组的靶植物结构如细胞中的内源核酸材料中或者靶植物结构的染色体外核酸中没有发生所述至少一个重组构建体的整合,由此所述至少一个重组构建体不是经染色体或染色体外整合进靶细胞内源DNA/RNA中,并因此不传代至细胞的后代。因此,所述一个或多个重组构建体或其转录或翻译产物在靶细胞中仅暂时有活性,即瞬时的,组成型或可诱导,但不能被靶细胞的后代继承,即它们也不是有活性地存在于靶细胞后代中。
如本文所用,术语“同源重组”表示在所有生物体中发生的过程。这需要同源的双链DNA部分。因此“同源”意味着两个序列的核苷酸序列有很大的相似性。对于天然存在的双链断裂,可以通过同源重组来修复损伤,因为可以将生物体基因组中完整染色单体的数据用作模板。根据本发明,如果在基因组编辑的框架中将靶向的且精确的双链断裂插入感兴趣的核酸靶区域中,在此也可以使用同源重组修复该断裂,结果其中DNA修复基质的靶向设计可用于获得对待修复的感兴趣的核酸靶区域的靶向作用。如自然界中发生一样,不同生物体在同源重组和异源重组的比例是不同的(参见上文,NHEJ)。通常,同源区域的长度影响同源重组事件的频率,即较长的同源区域导致更高的频率。用于获得同源重组的同源区域的长度取决于物种。在一些情况下,可能有必要使用具有同源性(homologie)的至少5千碱基(kb),但在仅具有约25个碱基对(bp)的同源区域中也已经观察到同源重组。
“同源介导的修复”(HDR)是指修复双链以及单链DNA断裂的细胞机制。因此,HDR包含同源重组元件,以及所谓的单链退火(SSA)(Lieber Michael et al.,Annu.Rev.Bichem.79:181-211,2010)。细胞中最常见的HDR形式是同源重组,其中这种类型的修复也需要供体与受体DNA之间的序列同源性最高。其它形式的HDR包括单链退火(SSA)。SSA是非保守的,自然地发生在>30bp直接重复之间,并导致缺失。通过与具有双链断裂的HDR不同的机制(Davis和Maizels PNAS,2014E924-32),利用缺口即单链断裂获得HDR。因为根据本发明,CRISPR核酸酶被提议其既诱导双链断裂又诱导单链断裂,因此术语“HDR”或同源重组涉及通过使用合适的修复基质修复以有靶向方式插入的单链断裂或双链断裂。
如本文所用,“除草剂抗性”和“除草剂耐受性”是指植物或植物细胞对除草剂或杀虫剂的作用的抗性或耐受性。这种性质通常通过至少一种蛋白质或RNA来获得,其已被人工插入到植物细胞中,例如作为转基因,或者可以通过(靶向)修饰内源基因获得。
如本文所用,根据本发明在重组微生物,植物或细胞的情况下的术语“子代或后代”是指通过自然繁殖的无性细胞分裂和分化过程衍生自原始生物体或细胞的这种生物体或者这种细胞的后代。本领域的技术人员意识到生物体基因组中的突变可以在细胞分裂和分化过程中以天然的方式引入,因此子代或后代在基因组上不同于亲本生物体,但仍然可以归属于相同的(亚)种。因此,除了特定引入的修饰之外,通过将修饰引入到其它DNA区域的天然过程修饰的这样的后代也包含在本发明中的术语“后代”中。
如本文所用,术语“CRISPR核酸酶”通常指在天然存在的CRISPR系统中存在的核酸酶,以及其修饰、其突变和其催化活性片段。天然存在的CRISPR基因座中,CRISPR核酸酶是形成效应子分子的分子,并且可以通过与crRNA和任选的tracrRNA或与人工gRNA一起相互作用来识别和/或切割核酸靶结构。因此,CRISPR核酸酶包含Cas核酸酶、Cpf1核酸酶或其它CRISPR效应子结构域和/或核酸酶结构域,其包含Csf1及其组合和变化。此外,该术语还包括已经以靶向方式修饰的核酸酶,其中每一个都被转化为切口酶以获得单链断裂,或者为了结合和识别目的而不是为了获得双链断裂而转化的核酸酶-null变体。因为在相关参考文献中,术语“CRISPR/Cas”同时被确定为所有类型的CRISPR系统的同义词,所以如果不是特别指出,根据本发明该术语应用于任何I-V型CRISPR系统以及相关效应子蛋白。
如本文所用,术语“载体”或“载体系统”是指可以将包含核酸或甚至多肽以及其它序列如调节序列或定位序列的重组构建体直接或间接引入希望的靶细胞或靶植物结构、引入希望的细胞区室中的转运工具。根据本发明,在含有待特异性修饰的核酸的靶植物细胞或者靶植物结构中直接实施直接引入被。间接引入包括引入叶或其它植物器官和组织的结构细胞,其不直接包含感兴趣的靶植物细胞,但是其确保包含本发明的重组构建体的载体的系统增殖和转运至靶植物结构,即分生组织或者细胞或者干细胞。如本文所用,在氨基酸序列转染中所用术语“载体”或“载体系统”包括用于肽或蛋白质转染的合适的物质,例如离子脂质混合物,或者适合于转染核酸的物质,例如载体材料,通过所述载体材料可以将核酸和氨基酸序列通过颗粒轰击(例如使用金和钨颗粒)引入细胞中。此外,特别是当应用本发明揭示的方法和构建体时,这个术语还包括病毒载体,即修饰的病毒如衍生自如下病毒之一的那些病毒:玉米条纹病毒(MSV)、大麦条纹花叶病毒(BSMV)、雀麦草花叶病毒(BMV,访问号码:X58456;RNA2:X58457;RNA3:X58458)、玉米斑纹病毒(MSpV)、玉米雷亚多非纳病毒(MYDV)、玉米黄矮病毒(MYDV)、玉米矮小花叶病毒(MDMV)、Benyviridae科的正链RNA病毒例如甜菜坏死黄脉病毒(访问号码:RNA1:NC_003514;RNA2:NC_003515;RNA3:NC_003516;RNA4:NC_003517)或者雀麦花叶病毒科例如苜蓿花叶病毒属的病毒(访问号码:RNA1:NC_001495;RNA2:NC_002024;RNA3:NC_002025)或者雀麦花叶病毒属,例如BMV(见上文),或者南瓜花叶病毒(Cucumovirus)属,例如黄瓜花叶病毒(访问号码:RNA1:NC_002034;RNA2:NC_002035;RNA3:NC_001440),或者Oleavirus属,花椰菜病毒科的dsDNA病毒,特别是Badnavirus或Caulimovirus家族(Familie),例如各种香蕉条纹病毒(见例如访问号码:NC_007002、NC_015507、NC_006955或NC_003381)或者花椰菜花叶病毒(访问号码:NC_001497),或者Cavemovirus、Petuvirus、Rosadnavirus、Solendovirus、Soymovirus或Tungrovirus属的病毒,Closteroviridae科的正链RNA病毒,例如Ampelovirus、Crinivirus,例如莴苣侵染性黄化病毒(访问号码:RNA1:NC_003617;RNA2:NC_003618)或者番茄褪绿病毒(访问号码:RNA1:NC_007340;RNA2:NC_007341)、Closterovirus如甜菜黄化病毒(访问号码:NC_001598),或者Velarivirus,双生病毒科的单链DNA(+/-)病毒,例如Becurtovirus、菜豆金色花叶病毒属家族的病毒,例如菜豆金色花叶病毒、烟草曲茎病毒、烟草斑点曲叶病毒、番茄萎黄斑点病毒、番茄矮叶病毒、番茄金色花叶病毒、番茄曲叶病毒、番茄斑点病毒或者番茄黄斑病毒,或者双生病毒科的曲顶病毒属,例如甜菜曲顶病毒,或者双生病毒科的Topocuvirus、Turncurtvirus或Mastrevirus属,例如玉米条纹病毒(见上文)、烟草黄矮病毒、小麦矮小病毒,黄症病毒科的正链RNA病毒,例如黄症病毒属,例如大麦黄矮病毒-PAV(访问号码:NC_004750),或者Polerovirus属,例如马铃薯卷叶病毒(访问号码:NC_001747),矮化病毒科的单链DNA病毒,包括矮化病毒或Babuvirus属,分体病毒科的双链RNA病毒,包括α双分病毒(Alphapartitivirus)、β双分病毒(Betapartitivirus)或δ双分病毒(Deltapartitivirus)家族,马铃薯纺锤形块茎类病毒科的类病毒、马铃薯Y病毒科的正链RNA病毒,例如包括Brambyvirus、Bymovirus、Ipomovirus、橙桑花叶病毒(Macluravirus)、Poacevirus属,例如小麦花叶病毒(访问号码:NC_012799),或者马铃薯Y病毒科的马铃薯Y病毒Potyvirus属,例如甜菜花叶病毒(访问号码:NC_005304)、玉米矮花叶病毒(访问号码:NC_003377)、马铃薯Y病毒(访问号码:NC_001616),或者玉米花叶病毒(访问号码:NC_018833),或者马铃薯Y病毒科的Tritimovirus属,例如雀麦草条纹花叶病毒(访问号码:NC_003501)或者小麦条纹花叶病毒(访问号码:NC_001886)、假病毒科的单链RNA病毒,例如假病毒或者Sirevirus属,呼肠病毒科的双链RNA病毒,例如水稻矮小病毒(访问号码:RNA1:NC_003773;RNA2:NC_003774;RNA3:NC_003772;RNA4:NC_003761;RNA5:NC_003762;RNA6:NC_003763;RNA7:NC_003760;RNA8:NC_003764;RNA9:NC_003765;RNA10:NC_003766;RNA11:NC_003767;RNA12:NC_003768),番茄丛矮病毒科的正链RNA病毒,例如包括以下属:α坏死病毒、Aureusvirus、β坏死病毒、香石竹斑驳病毒、香石竹病毒Gallantivirus、Macanavirus、Machlomovirus、黍花叶病毒、番茄丛矮病毒、幽影病毒或者Zeavirus,例如玉米坏死条纹病毒(访问号码:NC_007729),或者Virgaviridae科的正链RNA病毒,例如真菌传杆状病毒属,大麦病毒,例如大麦条纹花叶病毒(访问号码:RNA1:NC_003469;RNA2:NC_003481;RNA3:NC_003478),或者花生丛簇病毒(Pecluvirus)、Pomovirus、烟草花叶病毒或烟草脆裂病毒属,例如烟草脆裂病毒(访问号码:RNA1:NC_003805;RNA2:NC_003811),以及单股反链病毒目、特别是弹状病毒科的负链RNA病毒,例如大麦黄色条点花叶病毒(访问号码:KM213865)或莴苣坏死黄化病毒(访问号码/标本:NC_007642/AJ867584),Picornavirales目、特别是Secoviridae科的正链RNA病毒,例如豇豆花叶病毒、蚕豆萎蔫病毒、线虫传多角体病毒、Cheravirus、Sadwavirus、欧防风黄点病毒、Torradovirus或水稻矮化病毒属,Tymovirales目、特别是α弯曲病毒科的正链RNA病毒,例如青葱病毒、Lolavirus、柑橘病毒或马铃薯X病毒属的病毒,Tymovirales、特别是β弯曲病毒科,例如毛状病毒、香石竹潜伏病毒、Citrivirus、Foveavirus、Tepovirus或Vitivirus属的病毒,Tymovirales目、特别是芜菁发黄镶嵌病毒科的正链RNA病毒,例如Maculavirus、玉米雷亚多非纳病毒或者芜菁黄花叶病毒属的病毒,及细菌载体,如农杆菌(Agrobacterium spp.),例如根癌农杆菌(Agrobacteriumtumefaciens)。最后,该术语还包括合适的转运工具以将线性核酸(单链或双链)引入靶细胞中。了解本发明揭示的构建体,本领域的技术人员将知道载体必须包含的所有进一步的序列,以便在期望的靶细胞中起作用。这种载体的常规产生、加工和使用也为本领域技术人员已知。
如本文所用,术语“载体系统”表示由至少一个或多个载体组成或者包含其的系统。因此,载体系统可以包含含有/编码包含核酸和/或氨基酸序列的两种不同重组构建体的载体。此外,载体系统还可以含有若干载体,其依次含有/编码根据本发明的至少一个核酸或氨基酸序列。
如本文所用,术语“数量性状基因座”或“QTL”是指与在至少一个指定遗传背景如至少一个栽培群中数量表型性状的差异表达相关的DNA区域。QTL区域包含影响所述性状的基因或者与其紧密连接。QTL的等位基因可以因此包含在连贯的基因组区域或连接基团内的多个基因或其它遗传因子,例如单倍型。QTL的等位基因可以在指定窗口内指示单倍型,其中该窗口表示连贯的基因组区域,其可以用一系列的一个或多个多态性标记上定义和(回溯)引用。单倍型可以定义为在指定窗口内的每个标记中的等位基因的独特指纹。
如在下文将更详细地描述,本领域技术人员可利用许多方法来鉴定那些植物靶结构,其包含至少一个分生组织细胞,或整个植物或其植物材料或植物细胞,这有助于在其核酸靶区域中或其附近的基因组DNA的靶向修饰,而不使用可被检查的标记表型。这样的方法基于对感兴趣的核酸靶区域或靶序列的直接分析,以示出该核酸区域或序列中的任意修饰,并且包括但不限于PCR方法、测序、核酸酶消化、southern印迹、northern印迹,以及其任意组合。
如本文所用,术语“核酸”或“核酸序列”是指天然和合成的脱氧核糖核酸(DNA)和核糖核酸(RNA),其也可含有合成的核苷酸类似物。如果相关的话,根据本发明使用的用于合成所需产物(如蛋白质或RNA或用于其特异性对照,例如CRISPR核酸酶(特别包括Cas核酸酶或Cpf1核酸酶)或gRNA)的核酸可以“适应用于靶植物结构”。在一个实施方案中,所述序列可以是密码子优化的,即基因或RNA的密码子使用特异性适应于靶细胞/靶生物体。本领域的技术人员熟知,考虑特定的物种依赖性密码子的使用,可以修饰编码感兴趣的蛋白质的希望的靶基因而不修饰翻译的蛋白质序列。因此,本发明的核酸可特异性适用于或者适用于如下植物的密码子使用:大麦(Hordeum vulgare)、高粱(Sorghum bicolor)、黑麦(Secale cereale)、小黑麦(Triticale)、甘蔗(Saccharum officinarium)、玉米(Zeamays)、小米(Setaria italic)、水稻(Oryza sativa)、小粒野生稻(Oryza minuta)、澳洲野生稻(Oryza australiensis)、高杆野生稻(Oryza alta)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、球茎大麦(Hordeum bulbosum)、二穗短柄草(Brachypodiumdistachyon)、Hordeum marinum、山羊草(Aegilops tauschii)、苹果(Malus domestica)、甜菜(Beta vulgaris)、向日葵(Helianthus annuus)、澳大利亚胡萝卜(Daucusglochidiatus)、美洲野生胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucuscarota)、巨桉(Eucalyptus grandis)、普通黄色猴面花(Erythranthe guttata)、Genliseaaurea、美花烟草(Nicotiana sylvestris)、烟草(Nicotiana tabacum)、绒毛状烟草(Nicotiana tomentosiformis)、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、黄瓜(Cucumissativus)、川桑(Morus notabilis)、拟南芥(Arabidopsis thaliana)、深山南芥(Arabidopsis lyrata)、Arabidopsis arenosa、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米芹(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa-pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsuta)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、Brassica juncacea、黑芥菜(Brassica nigra)、萝卜(Raphanussativus)、意大利芝麻菜(Eruca vesicaria sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、大豆(Glycine max)、棉花(Gossypium ssp.)或者毛果杨(Populustrichocarpa)。此外,根据本发明,gRNA序列或编码gRNA序列必须适应靶植物结构内的靶核酸区域。在另一个实施方案中,gRNA或编码gRNA序列还必须在与Cas核酸酶和/或效应子结构域相互作用或结合相关的区域中进行调整。
如本文所用,术语“序列”是指核酸序列及氨基酸序列,其中所述序列除了天然核苷酸和氨基酸之外还可以含有合成类似物或合成键连作为构建元件。
术语“多肽”、“多肽序列”、“蛋白质序列”和“氨基酸序列”在本文中可互换使用。
如本文所用,术语“催化活性片段”,特别是关于CRISPR核酸酶或其变体,是指源于给定氨基酸模板序列的氨基酸核心序列,其条件为所得催化活性片段包含模板序列的部分活性中心及因此如常地完成与模板序列相同的酶功能。这些修饰,即截短为本领域技术人员所熟知,并且与有空间需求的酶特别用于产生包含催化活性片段的多层面及更稳定的截短的酶。
如本文所用,术语“调节序列”是指可以控制所述核酸序列的顺式或反式转录和/或翻译的核酸或蛋白质序列。
如本文所用,术语“构建体”或“重组构建体”(在本文中可互换使用)是指这样的构建体,其包含,尤其是,质粒或质粒载体、粘粒、酵母或细菌人工染色体(YAC和BAC)、噬菌粒、噬菌体载体、表达盒、单链或线性核酸序列或氨基酸序列,以及病毒载体,即修饰的病毒,其可以根据本发明被引入到靶细胞中。本发明的重组构建体可包括CRISPR/Cas工具或其部分,所述CRISPR/Cas工具或其部分包含核酸或氨基酸序列形式的至少一种gRNA或至少一种CRISPR核酸酶变体和/或至少一种另外的效应子结构域。此外,重组构建体可以包含调节序列和/或定位序列。重组构建体可整合到质粒载体中,和/或从多肽序列形式的质粒载体分离,或作为未连接到质粒载体中的单链或双链核酸。引入后,构建体优选是染色体外的并且不整合到基因组中,并且通常是双链或单链DNA、双链或单链RNA或多肽的形式。如本文所用,“质粒载体”涉及最初从质粒获得的构建体。这些通常是双链核酸序列形式的环状、自主复制的染色体外元件。在基因工程中,这些原始质粒以靶向方式修饰,其中插入抗性基因、靶核酸、定位序列、调节序列等。由此保持原始质粒的结构组分如复制起点。用于感兴趣靶细胞的众多质粒载体是可商购的,并且其针对特定克隆策略的修饰为本领域技术人员熟知。这些已知的质粒载体在本文中也被称为标准载体,其中这意味着基础载体是可商购的,并且可以容易地由相应技术领域的技术人员调整为适合相应实验的需要。
术语“增强子”或“增强子元件”是指具有特征序列的碱基/核苷酸序列。增强子是顺式调节元件之一,可以影响转录复合物在启动子上的结合,及因此的基因的转录活性。启动子是可调节编码序列或功能性RNA表达的DNA序列。启动子序列由相对于调节序列的近端和远端元件组成,其中后者通常被称为增强子。启动子可以具有广泛的活性范围,然而它们也可以在组织中有活性,或者在例如根细胞、种子、分生组织细胞等中具有发育特异性活性或可激活。同样地,存在具有组成型活性的启动子以及可诱导启动子,其中诱导可以通过多种环境效应来刺激。存在强启动子,其可以激活所调节的序列的高水平转录,以及弱启动子。启动子通常是被强调节的。本发明的启动子可以是含有天然内源性启动子,或者人工(合成/嵌合)的启动子或转基因启动子,其得自另一物种,或者是人工或者或合成/嵌合的,即这种形式不存在于自然中,或者是由各种启动子元件组成。
如本文所用,术语“3’非编码序列”、“转录终止子”、“终止子”或“终止子序列”是指位于编码序列的下游、即编码序列3'-方向的DNA序列,并包含聚腺苷酸化识别序列和编码调节序列的其它序列,所述调节序列能够影响mRNA加工和/或基因表达。聚腺苷酸化信号通常特征在于其导致poly-A-核苷酸被添加到mRNA前体的3'-末端。
如本文所用,术语“功能性连接”是指核酸序列与单个核酸片段的结合,使得基因或调节序列或其它区域的各个片段以物理方式连接,并且各个序列或区段可以相互调节、杂交或相互影响。然后启动子与编码序列功能性连接,只要其能调节该编码序列的表达即可,即编码序列然后受到所述启动子的转录调节。此外,编码序列可以以顺时针或逆时针方向与调节序列功能性连接。互补RNA区域基本上可以在5’端与靶mRNA、在3’端与靶mRNA或者在靶mRNA内部直接或者间接连接,或者互补性第一区域在5’端及其互补体在3’端与靶mRNA功能性连接。
如本文所用,术语“稳定转化”或“稳定整合”是指将感兴趣的核酸序列、例如以DNA修复基质或其一部分的形式或者合适的载体插入感兴趣的植物靶结构的基因组中,其中所述基因组包含核及核外基因组,基本上是细胞器的基因组,获得遗传稳定的及因此可遗传的基因组修饰。与此相反,本文使用的术语“瞬时转化”或“瞬时插入”或“瞬时整合”是指将感兴趣的核酸序列插入包含核、细胞器或细胞质的感兴趣的植物区室中,或者插入植物细胞内部的另一区室中,由此转录和/或翻译、或者在定向效应子分子(DNA、RNA或蛋白质)的情况中,插入的分子或复合物可以在植物细胞内发挥其效应,但是在细胞基因组中没有稳定的整合,因此没有相应序列和/或效应子分子的遗传。
如本文所用,术语“基因组”涉及遗传工程材料的全部,包括存在于生物体的细胞或病毒或细胞器中的基因和非编码序列,及因此包含核(如果存在的话)及核外(如果存在的话)基因组。此外,如本文所用,术语“基因组”涉及作为祖先生物体的(单倍体)单元遗传的整套染色体。
在植物物种中开发新的分子标记的一个动机是通过标记辅助选择(MAS)在靶向植物育种中获得提高的效力的潜力。基因技术标记-等位基因或者上述数量性状基因座(QTL)等位基因,被用于鉴定植物或植物材料或植物细胞,其在一个基因座或在许多未连接或连接的基因座含有所需基因型的,例如单倍型,从中可以推测其可以将希望的基因型与希望的表型一起传递给其后代。就标记辅助选择而言,如本文所用的术语“标记”因此可以表示标记和QTL基因座。一旦确定了共同分离的所需的表型和多态性染色体基因座,例如标记基因座或QTL,有可能使用这些多态性基因座来选择对应于所需表型的等位基因。这种方法被称为标记辅助选择(MAS)。为此,在来自待分析植物的生物样品中检测对应于标记核酸的核酸序列。这可以以核酸探针与标记杂交的形式来证明,例如使用等位基因特异性杂交、Southern印迹分析、Northern印迹分析、原位杂交、引物杂交随后PCR扩增标记区域等等,或通过其任意组合。本领域技术人员已知许多用于检测标记的方法。在包括至少一种植物细胞、优选分生组织细胞的感兴趣的生物样品中确认存在或不存在特定标记之后,选择该植物,并且可以随后用于通过选择性育种获得后代植物。同样,本发明的方法可以用于分析在植物体中靶向修饰的分生组织细胞中是否存在特定标记。优选从这些分生组织细胞中获得雌性或雄性配子或生殖细胞,其中特别是以这种方式在植物体中改良的植物的花粉可以直接用于随后的选择性育种。因为在经典植物育种中希望将感兴趣的性状插入靶植物中,其编码高产量和/或其它所需性状,为了开发改良的植物,对于标记辅助选择有很大的兴趣,以减少大量样品的制作和昂贵的测试所需的时间。
根据本发明的方法,表型标记也可以以靶向方式插入感兴趣的植物靶结构中。如本文所用,“表型标记”是指可以选择的标记,其有助于检查及感兴趣的植物细胞或靶结构的可检测性。表型标记通常包括可用于感兴趣的植物靶结构中的阳性或阴性选择标记,如可见标记或者(抗生素)抗性基因。可以使用可用于感兴趣的植物靶结构、特别是分生组织细胞的任何类型的植物标记。可选择的或可检测的标记通常包含待鉴定的DNA区段,其允许细胞或在感兴趣的细胞内用“标签”进行标记的分子被鉴定(通常在特定条件下)。这样的标记可以编码选自但不限于产生RNA、肽或蛋白质的活性,或者该标记可以提供RNA、肽、蛋白质、无机和有机化合物或复合物等的结合位点。举例来说,选择性标记包括但不限于包含限制酶切位点的DNA区段;包含荧光探针的DNA区段;编码提供其它毒性化合物抗性的产物的DNA区段包括抗生素,例如壮观霉素、氨苄青霉素、卡那霉素、四环素、BASTA、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码感兴趣的植物靶细胞在自然条件下不具有的产物的DNA区段,例如tRNA基因、营养缺陷型标记等;编码可易于鉴定的产物,特别是可目测标记的DNA区段,所述标记例如表型标记如β半乳糖苷酶,GUS,荧光蛋白如绿色荧光蛋白(GFP)及其它荧光蛋白如蓝色(CFP)、黄色(YFP)或者红色(RFP)荧光蛋白,以及表面蛋白,其中呈现出高荧光强度的那些荧光蛋白是特别感兴趣的,因为如果分析包含多种类型组织或细胞的复合植物靶结构或者植物材料或者植物而不是单个细胞,也可以在深层组织中鉴定这些蛋白质;新的PCR引物位点;根据本发明不能被限制性核酸内切酶或者其它DNA修饰酶或者效应子结构域修饰的DNA序列的记录;用于特异性修饰的DNA序列,例如表观遗传修饰,如甲基化;及携带PAM基序的DNA序列,其可以在本发明的合适CRISPR系统中鉴定;以及不具有PAM基序的DNA序列,如天然存在于内源植物基因组序列中。
本发明的方法可以特别用于植物的育种,以便在包含至少一个分生组织细胞的感兴趣的植物或者至少一个植物靶结构中插入更多的转基因性状。目前,转基因性状是通过转化系统随机插入植物基因组中,其中这通过物理/机械方法或生物学方式进行,基本上包括植物材料的基因枪轰击或用农杆菌和/或病毒载体转化。在过去几年中,将转基因靶向插入植物细胞基因组的特异性方案变得越来越普遍。一种重要的技术基本上是位点特异性整合(SSI),其允许在已经插入转基因的染色体相同位点处靶向插入转基因。此外,在过去几年中,以靶向方式设计的靶特异性核酸酶系统已经越来越多地用于帮助通过核酸酶切割染色体靶点。目前常用于在真核生物基因组中基因组编辑的核酸酶包括例如大范围核酸酶、锌指大范围核酸酶、转录激活物样效应子核酸酶(TALEN)及不断发展的CRISPR家族,以及以靶向方式修饰的变体及其催化活性片段。具体而言,基于CRISPR的核酸酶系统已被证明对于感兴趣的核酸靶区域的高精度靶特异性和可编程修饰非常有用。由于CRISPR系统由gRNA(通常是嵌合的)引导,并且不允许仅基于蛋白质靶向和靶选择,所以这可以产生高水平的可靠性并减少不希望的脱靶效应。此外,本发明对于固有地由两种成分组成的CRISPR系统提供了进一步的优点,特别是可以靶向方式为gRNA和/或CRISPR核酸酶或其变体或催化活性片段提供另一个效应子结构域,由其可以显着扩大CRISPR系统的可变性和使用范围。通过对CRISPR核酸酶进行重新编程,可以产生核酸酶-null变体,其失去裂解DNA的催化活性,但保留其DNA识别功能。通过组合以这种方式修饰的分子与效应子结构域、特别是允许感兴趣的靶细胞基因组的表观遗传调节的效应子结构域,靶向表观遗传修饰如甲基化、去甲基化、乙酰化、去乙酰化、磷酸化、去磷酸化或者遍在化可以通过瞬时插入包含至少gRNA、至少一个CRISPR核酸酶和至少一个效应子结构域的CRISPR系统而插入感兴趣的真核生物细胞的细胞核中的核小体内的组蛋白或者另一任意蛋白中。结果,即使当用于此的CRISPR系统仅以瞬时方式插入感兴趣的植物靶结构并因此不能被遗传时,在染色体区域也获得靶向的结构调整,以获得修饰活化状态,其中这些结构调整然后有可能遗传。
本发明揭示的CRISPR系统以及尤其是用于至少一个分生组织细胞的靶向修饰的方法特别适用于植物细胞或生物体的基因组编辑,这是因为可以通过高水平的精确性避免对于靶细胞常常是致死的或者导致不希望的副作用的脱靶裂解。
在一个实施方案中,CRISPR系统的CRISPR核酸酶组分或者变体包括切口酶或核酸酶无效变体的变体或其活性片段可以稳定整合到植物基因组中。CRISPR核酸酶的表达可以通过植物特异性启动子调节,其中启动子是组成型启动子、组织特异性启动子或可诱导启动子,例如温度、胁迫、发育阶段或化学可诱导的启动子。没有CRISPR系统的其它必需组分,即合成的gRNA或crRNA,Cas核酸酶不能够裂解和/或识别DNA,使得仅存在Cas核酸酶对感兴趣的植物细胞及其代谢作用很小或者无作用。因此,本文描述方法对于植物育种和发育的方法的优点是可以产生和繁殖能够以组成型或可诱导方式表达Cas核酸酶或其变体或催化活性片段的细胞系或转基因植物细胞,而不会对细胞完整性或生存力产生不利影响。为了获得CRISPR核酸酶的活性,无论是稳定整合还是瞬时提供,如上所述,作为进一步的可靠性机制总是需要存在gRNA或crRNA,其可通过许多方法以稳定或瞬时的方式插入包含至少一个感兴趣的分生组织细胞的植物靶结构中。gRNA可以作为遗传构建体如载体形式的可转录DNA构建体插入细胞中,其中gRNA以组成型或可诱导方式转录,及因此可以功能性方式提供。或者,gRNA也可以作为RNA直接插入感兴趣的植物靶结构中。因此,CRISPR核酸酶和gRNA可以同时插入或者随着时间而补偿,其中优选gRNA和CRISPR核酸酶是以空间和时间提供,使得较不稳定的RNA和蛋白质CRISPR核酸酶可以化学计量理想的组成在感兴趣的细胞区室中相互作用。如果靶向修饰的靶是RNA,则感兴趣的区域是靶细胞的细胞质。如果感兴趣的核酸靶区域是基因组DNA或核小体,则感兴趣的区室是包含至少一个分生组织细胞的植物靶结构的细胞核。在这种配置中,需要将gRNA和/或CRISPR核酸酶与合适的核定位序列功能性连接,以使CRISPR分子或由gRNA和CRISPR核酸酶以及任选与之相关的效应子结构域组成的CRISPR复合物,可能到达他们的作用位置。在另一个实施方案中,如果核酸靶区域位于细胞器特别是质体中,则需要存在质体定位序列例如线粒体定位序列或叶绿体定位序列以将CRISPR工具导向根据本发明的作用位置。
本发明的gRNA可以是单个分子,或者可以以对应于crRNA和/或tracrRNA的两个单独的RNA的形式使用或存在。
如本文所用的术语“重组”是指一系列核酸或氨基酸,尤其是整体不是天然存在的。此外,术语“重组”也包括那些其核酸或氨基酸序列天然存在,但也可以通过靶向修饰或合成获得的核酸或氨基酸序列,例如,合成获得的核酸或氨基酸序列,或通过生物工程例如通过发酵过程获得的核酸或氨基酸序列,其可以存在于自然界中,但也可以以靶向方式在除了源生物体以外的生物体中产生。
本文使用的术语“表观遗传学”或“表观遗传”描述染色体区域的结构适应性调整,以编码、信号化、保存修饰的活化状态并可能将其传递到细胞后代。因此,通过在基因组DNA自身中不编码的修饰获得可能可遗传的修饰。
当本发明涉及百分比形式的核酸序列或蛋白质序列的“序列同源性”或“序列相同性”时,这些是指可以使用针对核酸序列的EMBOSS Water Pairwise Sequence Alignments(Nucleotide)(http://www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html)或者针对氨基酸序列的EMBOSS Water Pairwise Sequence Alignments(Protein)(http:// www.ebi.ac.uk/Tools/psa/emboss_water/)计算的数值。可得自European MolecularBiology Laboratory(EMBL)European Bioinformatics Institute(EBI)的局部序列比对的工具使用修改的Smith-Waterman算法(参见http://www.ebi.ac.uk/Tools/psa/和Smith,T.F.&Waterman,M.S.“Identification of common molecular subsequences”Journal of Molecular Biology,1981147(1):195-197)。此外,当使用修改的Smith-Waterman算法进行两个序列的各自配对比对时,应该使用目前得自EMBL-EBI的默认参数。这些参数如下:(i)对于氨基酸序列:矩阵=BLOSUM62,空位开放罚分=10,空位延伸罚分=0.5,和(ii)对于核酸序列:矩阵=DNAfull,空位开放罚分=10和空位延伸罚分=0.5。
在本发明的上下文中,术语“同源序列”或“同源物”或类似术语应理解为是指具有相同系统发生起源的核酸序列。优选地,由这些核酸序列编码的蛋白质具有相同的功能。同源核酸序列表现出至少70%、优选至少75%、至少80%、至少85%或至少90%、特别优选至少95%、至少96%、至少97%、98%或至少99%的序列相同性。
如本文所用的“核酸靶区域”指待修饰的靶生物或靶细胞的任何基因组和染色体外DNA或RNA,尤其是mRNA,其可以通过本发明的方法和构建体进行修饰,但是肯定不限于基因区域,即携带转录mRNA区域的信息的区域。因此,这些靶区域是天然的或内源的靶区域,其中术语“内源的”和“天然的”在本文中可互换使用。此外,术语“核酸靶区域”不限于内源性序列。如果人工核酸靶区域先前已经插入感兴趣的靶结构的靶细胞中,则术语“核酸靶区域”因此可以涉及人工插入的核酸靶区域。
如本文所用的“互补”或“互补性”描述了在两个DNA或RNA核酸区域之间其核碱基像锁和钥匙一样组合在一起并在彼此之间形成氢键(杂交)的关系。在这方面,碱基腺嘌呤和胸腺嘧啶/尿嘧啶或鸟嘌呤和胞嘧啶的Watson-Crick碱基配对被认为是互补的的关系。其它配对例如非Watson-Crick配对、反向Watson-Crick、Hoogsteen、反向Hoogsteen和摇摆配对涵盖在术语“互补”中,相应的碱基配对形成氢键,即基于其互补性两个不同的核酸链可以杂交在一起。
术语“杂交”或“杂交”应理解为意指以最大互补核酸链应用单链核酸分子的过程,即经历碱基配对。杂交的标准方法例如在Sambrook et al,,2001中描述。优选地,这应理解为是指至少65%、70%、75%、80%或85%,特别优选90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的核酸序列碱基与最大互补核酸链进行碱基配对。这种应用的可能性取决于杂交条件的严格性。术语“严格性”是指杂交条件。高度严格条件是难以碱基配对,而低度严格条件是便于碱基配对。杂交条件的严格性取决于例如盐浓度或离子强度和温度。一般来说,可以通过提高温度和/或通过降低盐含量来提高严格性。术语“严格杂交条件”应理解为指其中杂交主要仅在同源核酸序列之间发生的那些条件。术语“杂交条件”因此不仅指核酸实际应用期间的一般条件,而且还指随后的洗涤步骤中一般条件。严格杂交条件例如是其中主要是仅呈现至少70%、优选至少75%、至少80%、至少85%或至少90%、特别优选至少95%序列相同性的那些核酸杂交的条件。严格杂交条件的实例是:在65℃用4×SSC杂交,然后在65℃在0.1×SSC中洗涤,总共约1小时。此处使用的术语“严格杂交条件”还可以意指:在0.25M磷酸钠pH 7.2、7%SDS、1mM EDTA和1%BSA中在68℃杂交16小时,然后用2×SSC和0.1%SDS在68℃洗涤两次。优选地,杂交在严格条件下进行。
发明详述
一方面,本发明涉及生产植物、植物材料或植物细胞的方法,包括以下步骤:(i)提供包含至少一个分生组织细胞的靶植物结构,其中所述至少一个分生组织细胞包含至少一个靶核酸区;(ii)提供至少一个gRNA或提供一个或多个重组构建体,其中所述重组构建体包含至少一个gRNA或编码gRNA的序列,及任选至少一个调节序列和/或定位序列,及任选包括提供至少一种DNA修复模板或HDR模板,以及提供至少一种CRISPR核酸酶或其催化活性片段和/或效应子结构域,或者提供一种或多种重组构建体,其中所述重组构建体包含至少一个CRISPR核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列和/或至少一个效应子域或编码效应子结构域的序列,以及任选至少一个调节序列和/或定位序列,其中所述gRNA既能够与靶核酸区域的一部分杂交,也能够与CRISPR核酸酶或其催化活性片段和/或效应子结构域相互作用;其中,当所述gRNA或编码gRNA的序列和CRISPR核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列和/或效应子结构域或编码效应子结构域的序列由一个或多个重组构建体提供时,gRNA或编码gRNA的序列和CRISPR核酸酶或其催化活性片段或编码CRISPR核酸酶或其催化活性片段的序列和/或效应子结构域或编码效应子结构域的序列可以位于相同或不同重组构建体之上或之中;任选地:其中使得所述gRNA或编码gRNA的序列和/或Cas核酸酶或编码Cas核酸酶的序列和/或效应子结构域或编码效应子结构域的序列适合用于植物细胞中;(iii)任选地:提供至少一种载体以引入重组构建体/构建体;(iv)任选地:提供至少一种另外的重组构建体,其包含特异性同源定点修复靶植物结构中靶核酸区域或者将靶核酸插入靶植物结构中的重组核酸部分,优选包含至少一个调节序列,及提供任选存在的至少一个其它载体以引入至少一个其它重组构建体;(v)将gRNA、CRISPR核酸酶或其催化活性片段和/或效应子结构域和/或重组构建体引入靶植物结构中;(vi)在允许所引入的gRNA、CRISPR核酸酶或其催化活性片段和/或效应子结构域和/或所引入的重组构建体活化,从而允许靶植物结构中靶核酸区域特异性修饰的条件下培养靶植物结构,靶植物结构中的靶核酸区域,以获得包含至少一个分生组织细胞的靶植物结构,所述分生组织细胞包含所述靶核酸区域的特异性修饰;(vii)从特异性修饰的至少一个分生组织细胞获得植物、植物材料或植物细胞;(viii)其中通过细胞分裂和分化以及任选存在的异花授粉或自花授粉从特异性修饰的至少一个分生组织细胞直接获得所述植物、植物材料或植物细胞,及其中所获得的植物、植物材料或、植物细胞包含靶核酸区域的特异性修饰,其中包含至少一个gRNA或编码gRNA的序列和/或至少一种CRISPR核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列和/或至少一个效应子结构域或编码效应子结构域的序列的重组构建体优选不是染色体或染色体外整合的。
分生组织细胞属于植物中的组织类型,其被描述为分生组织或形成组织。如动物生物体中的干细胞一样,分生组织植物细胞(因为其是未分化的细胞)具有分化为任何特化的细胞类型的能力(取决于环境影响)。植物生物体中的发分生组织不仅存在于胚发育期间,而且还存在于整个生命周期中,因此根据本发明对分生组织细胞和组织的特异性修饰不限于植物胚或幼苗,而且也适用于较大的幼苗和成熟的植物,例如在可以从其产生生殖性植物器官的分生组织(例如玉米中雄穗或穗轴)。
根据一个实施方案,分生组织细胞是包含至少一种分生组织细胞或分生组织的植物胚或幼苗或植物的成熟或未成熟的植物细胞。
根据本发明方法的一个实施方案,包含至少一个gRNA、CRISPR核酸酶、任选地至少一个效应子结构域和任选的至少一个DNA修复基质的至少一种重组体构建体可以被瞬时插入到靶细胞中。在另一个实施方案中,至少一个重组构建体可以稳定插入包含至少一个分生组织细胞的感兴趣的植物靶结构中,所述重组构建体用于获得至少一个核酸靶区域的至少一个靶向修饰。在另一个实施方案中,至少一种重组构建体可以用于首先将CRISPR系统的组分、优选核酸酶或其变体或催化活性片段及任选效应子结构域稳定地插入植物靶结构的基因组中。随后,将其它组分(即gRNA)引入到至少一个另外的重组构建体上,任选在效应子结构域中,及任选地将DNA修复基质瞬时插入到植物靶结构中。在所有的实施方案中,可以将各个组分同时或相继地引入到不同构建体上。在瞬时引入的一些实施方案中,有利地,可以首先插入构建体,其携带该系统的一种或多种产物组分,即CRISPR核酸酶、其变体或其催化活性片段和任选的效应子结构域。任选地,如果这是DNA构建体,则该至少一个构建体可以首先被细胞翻译。携带gRNA和任选存在的进一步的DNA修复基质和/或效应子结构域的构建体然后可以以暂时补偿的方式引入。结果,可以确保较不稳定的gRNA可以直接与感兴趣的CRISPR核酸酶相互作用,并且gRNA的分解不会阻止有效的DNA编辑。
根据一个实施方案,分生组织细胞是单子叶植物或双子叶植物的细胞。
根据本发明,提供了一种特定的方法,其可以直接或间接特异性地控制作为靶植物结构的所有发育阶段的植物中的小分生组织细胞群。至少一个分生组织靶细胞可以被直接或者间接控制,即根据本发明的至少一种重组构建体可以直接引入至少一个分生组织靶细胞中,或者至少一种重组构建体可以借助合适的载体引入任何植物细胞或任何植物组织中,其中至少一个重组构建体然后可被转运到靶植物结构。这通过借助载体引入植物细胞或植物组织中的至少一种重组构建体的系统性增殖而实现。
如本文所用,术语“靶植物结构”包括至少一种分生组织植物细胞,其可以作为组织、植物材料、作为整个植物或作为分离的细胞而存在,其中分生组织植物细胞也含有至少一个核酸靶区域。包含在靶植物结构中的至少一个靶核酸区域包含DNA和RNA序列,并且可以染色体或染色体外存在于靶结构。因此,用于修饰感兴趣的核酸靶区域的基于CRISPR的靶向方法可以与基因组DNA的修饰一起使用,包括基因组DNA的表观遗传修饰,或者质体或线粒体DNA的修饰,以及与沉默形式RNA修饰一起使用。
在本发明的一个方面中,涉及将特定核酸修饰引入非染色体靶结构中,如本文所用术语“靶植物结构”包括至少一种植物细胞,其可以以组织、植物材料、作为整个植物或作为分离的细胞而呈现,其中所述植物细胞另外包含包含DNA和RNA的至少一个靶核酸区域。
根据本发明的一个方面,如果合适,通过瞬时引入CRISPR/Cas工具和/或其它效应子结构域修饰作为靶结构的分生植物细胞中的至少一个靶核酸区域。由于以这种方式修饰的至少一个分生组织细胞可以通过随后的细胞分裂和分化为其后代而直接在靶核酸区域中传递特定修饰,因此本发明的方法不需要任何更多的杂交和选择步骤以提供具有所需靶修饰的植物、植物材料或植物细胞。此外,从胚甚至次生分生组织如花粉或子房,任选地用自花授粉或者异花授粉,可以获得携带特异性引入的修饰的植物生物体或者靶植物结构。
在一个实施方案中,本发明的方法具有进一步的优点,即CRISPR/Cas工具和/或任何其它效应子结构域仅以瞬时方式被引入靶植物结构、优选分生组织细胞或分生组织中,由此不会发生CRISPR/Cas工具如CRISPR核酸酶和gRNA以及可能的调节序列和其它效应子结构域的稳定整合到靶植物结构的内源染色体或内源染色体外核酸中。
根据本发明,发现通过利用CRISPR/Cas工具的RNA指导的DNA修饰的作用机制,可以引入根据本发明提供的方法的其它效应子结构域,由此可以扩大特异性基因组编辑的范围。CRISPR核酸酶变体或其催化活性片段或者gRNA或两者可以与效应子结构域连接。
如本文所用,“效应子结构域”包括DNA-或RNA-修饰的或者DNA-或RNA-结合的多肽或核酸,包括所有类型的单体、二聚体或多聚体核酸酶,如TALE核酸酶、巨核酸酶、锌指核酸酶、核糖核酸酶、脱氧核糖核酸酶、外切核酸酶、内切核酸酶及I、II、III或IV型的限制性核酸内切酶等,并且包括切口酶、转录激活物和阻抑物、磷酸酶、糖苷酶或者可以导致表观遗传修饰的酶,例如是乙酰化酶、甲基化酶、甲基转移酶,可以结合甲基化DNA的蛋白质,或组蛋白脱乙酰酶,适体,包括单链DNA或RNA序列以及肽、荧光蛋白、标记核酸序列或标记氨基酸序列等以及其组合。关于一般的酶或多肽,术语“效应子结构域”还指相应酶或多肽的催化结构域或核结构域,例如结合蛋白,其中催化结构域或核结构域仍能够进行各天然酶或多肽的酶促或结合功能。这种截短的结构域的设计及其根据所需功能进行调适是本领域技术人员已知的。
就此而言,本发明提供方法和构建体,其中已经连接另外的效应子结构域的gRNA和/或CRISPR核酸酶或其催化活性片段可以作为重组构建体提供或在重组构建体上提供。然后将包含至少一个效应子结构域的gRNA和/或CRISPR核酸酶引入靶结构的至少一个重组构建体中,以在转录和任选的翻译之后形成功能性复合物。
在另一个实施方案中,提供方法,其中至少一种gRNA或至少一种CRISPR核酸酶或其催化活性片段和/或至少一个另外的效应子结构域分别在不同的重组构建体上提供。依据此方法,gRNA组分作为DNA或RNA提供,CRISPR核酸酶或其变体或催化活性片段可以以DNA或RNA或者多肽序列提供,效应子结构域可以作为DNA或RNA或多肽序列提供。任选至少包含一个效应子结构域的gRNA和CRISPR核酸酶可因此在体外预装配,然后插入靶结构中。
根据本发明的一个实施例,其包括同时插入至少一个gRNA和至少一个CRISPR核酸酶变体或催化其活性片段及至少一个效应子结构域,效应子结构域可以通过核酸或氨基酸接头与gRNA或CRISPR核酸酶变体或催化活性片段连接,以确保结构域彼此理想的排列,从而彼此通过足够的结构域灵活性确保其功能性。根据一个实施方案,为了产生以靶向方式优化的植物、植物材料或植物细胞,优选除了gRNA和CRISPR核酸酶Cas或Cpf1核酸酶之外,还提供DNA修复基质,其包含单独的效应子结构域。该实施方案是特别优选的,如果使用CRISPR核酸酶或其催化活性片段,其能够催化靶向DNA双链断裂的引入在感兴趣的靶核酸靶区域中。另外提供单链或双链DNA形式的DNA修复基质,可以优于植物细胞的天然的和易错的NHEJ修复机制,以带来基因组编辑的更高的精确度,以及提供靶向引入插入、突变或缺失的可能性。由此可以提供重组构建体的形式DNA修复基质,所述重组构建体可以单独地或者在用于所引入的gRNA和/或CRISPR核酸酶的相同构建体上。或者,可以通过转染或转化将DNA修复基质直接插入感兴趣的靶细胞或靶结构中。通常,DNA修复基质被设计为包含左侧和右侧同源臂,其位于CRISPR核酸酶切割位置的侧翼。两个同源臂可表现出数百个碱基对(bp)的长度,例如,至少100、至少200、至少300、至少400或至少500个碱基对(bp),至多1千碱基(kb)或更多。同源性区域,即序列匹配的区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-55、5-70、5-55、5-80、5-85、5-90、5-95、5-100、5-200、5-300,5-400、5-500、5-600、5-700、5800-5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500,5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-500,2800、5-2900、5-3000、5-3100个或更多个碱基,使得同源区域含有足够的同源性以允许与相应的基因组区域发生同源重组。在本文中“足够的同源性”是指两个多核苷酸表现出足够的结构相似性,因此可以用作同源重组的底物(substrate)。因此,对于相应的核酸序列,DNA修复基质的各个同源臂的同源性程度可以不同。通常,在较短的同源区域中需要较高程度的同源性,以获得互补核酸序列的足够累积。因此,同源性,即序列相同性的程度可以为至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%或100%。另外,DNA修复基质包含中心构建体,其携带待引入的序列例如转基因或将被引入的修饰。随后通过(定量)PCR检查在核酸靶结构中靶向修饰的成功引入。这样的构建体可以通过PCR用特异于两个同源臂的引物扩增,其序列可因此被确定以便确定所述修复是通过细胞自身NHEJ机制进行还是通过由DNA修复基质辅助的同源重组来进行。
根据另一个实施方案,首先提供至少一种第一植物、植物材料或植物细胞,其包含至少一种CRISPR核酸酶,优选Cas核酸酶或Cpf1核酸酶,其中所述CRISPR核酸酶以稳定或瞬时方式被整合。该实施方案是特别有利的,只要至少一种第一植物、植物材料或植物细胞稍后与至少一种第二植物杂交,其中第二植物或其至少一个植物分生组织细胞包含gRNA,其与第一植物的Cas核酸酶相互作用,并因此可以导致靶向的基因组编辑。本领域技术人员使用包括聚合酶链式反应等的方法容易地证实本发明的感兴趣的核酸靶区域中成功引入靶向修饰,特别是如果感兴趣的核酸靶区域及因此获知其中可以积累潜在PCR引物的区域,并且与设计gRNA和/或DNA修复基质相关。
可用于本发明中的激活物和阻抑物优选包含SEQ ID NO:1-4以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同源性的序列,尽管仍进行修饰,但是其与相应SEQ IDNO所示序列具有相同功能。
因此,本发明的靶向修饰可以包括:(i)核酸靶区域的至少一个核苷酸的交换;(ii)核酸靶区域中的至少一个核苷酸的缺失;(iii)核酸靶区域中至少一个核苷酸的插入;(iv)调节至少一个核酸靶区域的区域的靶向表观遗传修饰;(v)与核酸靶区域中的至少一个核苷酸结合和/或使其可视化;或者(vi)与至少一个RNA核酸靶区域相互作用和/或使其裂解,或者(i)至(vi)的任何组合。本发明的方法可以特别用于植物、植物材料或植物细胞中的精确和快速的性状开发。
在本发明第一方面的另一个实施方案中,提供了一种产生植物、植物材料或植物细胞的方法,其中提供了至少一种植物靶结构、包括至少一种分生组织细胞、至少一个gRNA、至少一种CRISPR核酸酶或其催化活性片段和/或效应子结构域以及至少一种DNA修复基质,其中感兴趣的核酸靶区域的靶向修饰包括至少一个异源序列,即非内源性序列,其包含选自报告基因、选择标记的基因,提供对疾病免疫性的基因,除草剂抗性基因,提供对昆虫或线虫抗性的基因,参与碳水化合物代谢的基因,参与脂肪酸代谢的基因,参与氨基酸代谢的基因,参与植物发育的基因,参与调节植物生长调节的基因,参与改良感兴趣的植物材料产量的基因,参与提供抗旱性的基因,参与提供耐热性的基因,参与提供盐抗性的基因,或者编码功能性RNA的基因,其中功能性RNA选自miRNA、siRNA或可以形成反向重复结构的另一RNA,例如ddRNAi构建体,其编码正义链和反义链以及连接正义链和反义链的发夹环,其插入包含至少一个分生组织细胞的感兴趣的植物靶结构的基因组。
此外,本发明的方法适合于形成复合性状基因座。复合性状基因座是具有至少两个修饰的核酸区域的染色体片段,并且可以在一个步骤中或相继整合如本发明的核酸靶区域中,其中至少两个修饰的核酸区域彼此遗传连接。所述至少两个修饰的核酸区域均来自内源植物基因座,或者所述修饰表示染色体DNA的突变或缺失,或者所述至少两个修饰的核酸区域是转基因序列或其组合。由于本发明的DNA修复基质可以具有长度为至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60,70、80、90、100、200、300、400、500、600、700、800、1000、2000、3000、4000bp或更多的中心构建体,因此本发明的方法适合于将复合性状基因座引入引入包含至少一个分生组织细胞的植物靶结构中,通过使用CRISPR系统和DNA修复基质可以将复合性状以更高精度和效率直接引入植物靶结构中。因为根据本发明的方法可以直接获得至少一种植物、至少一种植物材料或至少一种植物细胞,所以可以在短时间获得已经靶向修饰的植物细胞、植物材料或植物,且适合进一步的杂交育种、育种或进一步的靶向修饰。在一个实施方案中,在其基因组中具有第一靶向修饰的第一可育植物可以与第二植物杂交,所述第二植物在其基因组中具有第二靶向修饰,由此靶向修饰可以物理连接,即成为同一核酸分子的部分,其中根据本发明方法或者至少第一或第二或两种植物。修饰的核酸靶区域形式的人工识别位点可以通过CRISPR系统的固有性质和对PAM基序的了解以及人工gRNA与CRISPR核酸酶的相互作用而插入到基因座中,以便随后生成嵌套的(verschachtelten)复杂基因座,其包括多于一个的靶向修饰。
在另一个实施方案中,复合性状基因座也可以在一个步骤直接插入包含至少一个分生组织细胞的植物靶结构中。由于本发明的CRISPR系统可以缩放,其中包含许多CRISPR核酸酶,与CRISPR核酸酶和/或感兴趣的核酸靶区域任选比对的许多gRNA以及至少一个DNA修复基质,其除了适当的同源臂之外还包括将被整合到植物靶结构的基因组中的至少一个感兴趣的性状,因此通过本发明的方法并不是仅仅可以以靶向方式影响一个性状。相反,可以以稳定的方式在感兴趣的植物靶结构中引入复合的基因型性状,其抑制至少一种表型性状。
因此,在根据本发明的方法的一个实施方案中,揭示了在植物、植物材料或植物细胞中产生复合性状基因座的方法,其中所述方法包括以下步骤:(a)选择植物中感兴趣的基因组核酸靶区域,其中所述基因组核酸靶区域包含包含至少一个第一核酸靶序列和一个第二核酸靶序列;(b)将包含至少一个分生组织细胞的至少一个植物靶结构与至少一个第一gRNA、一个第二gRNA及任选至少一个DNA修复基质和至少一个CRISPR核酸酶或其催化活性片段接触,其中第一和第二gRNA以及至少一个CRISPR核酸酶或其催化活性片段可以形成复合物,其允许至少一个CRISPR核酸酶在至少一个第一和一个第二核酸靶区域中引入双链断裂或在切口酶的情况中引入单链断裂,其中任选地,至少一个gRNA或至少一种CRISPR核酸酶还包含效应子结构域,或者可以与至少一个效应子结构域结合;(c)鉴定来自步骤(b)的细胞,其包含在第一核酸靶序列上的至少一个第一靶向修饰,及在第二核酸靶序列上的一个第二修饰;及任选地,(d)从步骤(c)的至少一个分生组织细胞中获得第一可育植物,其中可育植物包含第一靶向核酸修饰及第二靶向核酸修饰,其中第一靶向核酸修饰与第二靶向核酸修饰是物理方式连接的,即位于相同核酸链上。
在另一个实施方案中,所述方法包括产生复合性状基因座的方法,其中在植物、植物材料或植物细胞中感兴趣的基因组核酸靶区域中的至少两个修饰的核酸靶序列被修饰,所述方法包括以下步骤:(a)在植物、植物材料或植物细胞中选择包含至少一个分生组织细胞的基因组靶区域,其中所述基因组靶区域包含第一核酸靶序列和第二核酸靶序列;(b)将包含至少一个分生组织细胞的至少一种植物细胞与DNA修复基质形式的第一gRNA、CRISPR核酸酶或其催化活性片段以及任选存在的第一供体DNA接触,其中所述第一gRNA和第一CRISPR核酸酶或其催化活性片段可形成复合物,其允许CRISPR核酸酶在第一核酸靶区域中插入双链断裂,其中所述gRNA和/或CRISPR核酸酶任选地可包含效应子结构域,或者与效应子结构域结合;(c)鉴定来自(b)的至少一个分生组织细胞,其包含在第一核酸靶序列中的第一靶向修饰;(d)从步骤(c)的细胞中获得第一可育植物,其中第一可育植物包含第一靶向修饰;(e)将包含至少一个分生组织细胞的至少一个植物、植物材料或植物细胞与DNA修复基质形式的第二gRNA、第二CRISPR核酸酶或其催化活性片段及任选存在的第二供体DNA接触;(f)鉴定步骤(e)的细胞,其中所述细胞包含在第二核酸靶序列中的至少一个第二靶向修饰;(g)从步骤(f)的细胞中获得第二可育植物,其中第二可育植物包含第二靶向修饰;及(h)从步骤(g)的第二可育植物中获得可育后代,其中可育后代植物在感兴趣的核酸靶区域中包含第一和第二靶向修饰,其中第一靶向修饰和第二靶向修饰是物理方式连接的。
因此,本发明的工具和方法是对于在高等植物生命中靶向且有效的基因组编辑的有价值的工具,通过使用CRISPR工具以及靶向同源重组作为修复机制。特别地,通过本发明的方法可以规避天然的、容易出错DNA修复机制“非同源末端连接”(NHEJ),其修复机制经常导致突变或染色体缺失。
根据本发明,所选择的性状以靶向修饰形式通过基因组编辑插入到植物中或者植物中触发,所述性状包括但不限于抗性,包括对除草剂和害虫的抗性,包括原核和真核的害虫和病毒,例如细菌、真菌、原生动物、植物致病病毒、线虫、昆虫或其它动物生物体,以获得更高的产量,其中产量可涉及任何期望的植物产物,例如增加的种子、果实、碳水化合物、蛋白质或脂肪产量或其它植物代谢产物,包含其它初级代谢产物或次级代谢产物等。基因组编辑的一个目标可以是内源性5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合酶基因。EPSP合酶天然地催化磷酸烯醇丙酮酸(PEP)和3-磷酸莽草酸转化成磷酸和5-烯醇丙酮酸莽草酸-3-磷酸,并且通过在该内源基因中引入靶向突变,可以获得突变的EPSP合酶编码基因,其表现出对除草剂N-(膦酰基甲基)甘氨酸或其盐的抗性。
此外,本发明的方法可以用于以靶向方式将性状引入植物中或修饰不希望的性状。因此,对含有低比例丙烯酰胺的食品或食物产品产生更大的期望。丙烯酰胺已经被归类为致癌物,是氨基酸天冬酰胺和谷氨酰胺的美拉德反应(当其与还原糖如醛糖(例如葡萄糖)或酮醇(acyloinen)在高于约170℃的温度反应时)的不希望的副产物。因此,在淀粉类植物产品例如马铃薯产品中,特别感兴趣的是降低形成丙烯酰胺的潜在离析物如天冬酰胺的含量,以产生安全的食品。因此,可以通过本发明的方法以靶向方式产生马铃薯植物,其可以以靶向方式进行修饰,由此通过影响天冬酰胺合成酶基因或者参与天冬酰胺代谢的一些其它基因,以靶向方式影响与天冬酰胺代谢相关的基因。
在植物细胞基因组中的感兴趣的另一内源靶基因是乙酰羟酸合酶(AHAS)基因,其可被修饰以呈现出除草剂的耐受性或抗性。AHAS抑制剂除草剂在全世界农业中是重要的除草剂。通过用本发明的方法修饰内源AHAS基因的至少一个等位基因,可以产生除草剂耐受性或抗性的植物细胞,根据本发明揭示的靶向分生组织细胞的方法可在短时间内从中获得可育的植物、植物材料或植物细胞。
植物,特别是对各种环境影响有抗性的用于能源和食品生产的作物,也变得越来越重要。这些环境影响包括热、干旱、寒冷、土壤和与此相关的营养供应的性质、盐度等。因此,特别感兴趣的是产生在环境条件变化及通常是低于最佳条件下茁壮成长的植物。这些性状还包括可根据本发明的方法以靶向方式引入植物、特别是作物植物中的性质,或者可以通过靶向修饰至少一个核酸靶区域而在感兴趣的至少一个植物靶结构中诱导的性质。
具体而言,关于植物农学上相关性状的优化,也可以特别感兴趣修饰内源序列,从而以靶向的方式控制包含启动子的调节序列。
因此,在根据本发明的一个实施方案中,提出了一种产生植物、植物材料或植物细胞的方法,其包含在感兴趣的至少一个分生组织细胞中的至少一种靶向修饰,其中所述靶向修饰是修饰内源启动子。启动子的靶向修饰可以包括用另一个启动子或其片段置换该启动子或其片段,其中启动子交换导致以下的任意组合:增加的启动子活性,增加的启动子组织特异性,增加的病原体诱导的启动子活性,降低的启动子活性,降低的启动子组织特异性,降低的病原体诱导的启动子活性,新的启动子活性,可诱导的启动子活性,病原体诱导的启动子活性,由启动子控制的可能的基因表达谱扩大,核酸靶区域的时间、空间或发育阶段基因表达的修饰(在这种情况中对于感兴趣的植物基因,仅在特定发育阶段具有活性的具有活性的启动子可同样在另一发育阶段也具有活性,或者关于空间,可以在另一组织中具有活性),或者DNA结合元件的突变,和/或DNA结合元件的缺失或添加。根据本发明的方法待修饰的启动子或其片段可以是在感兴趣的植物细胞中是内源的启动子或其片段,但其同样可以是人工启动子或转基因启动子,其存在于包含至少一个分生组织细胞的感兴趣的植物靶结构中。待修饰的启动子或其片段优选整合到包含至少一个分生组织细胞的感兴趣的植物靶结构的染色体或染色体外基因组中。待修饰的启动子或其片段也可以存在于染色体外非基因组整合的构建体上,例如,质粒。
这些内源基因表现出进一步感兴趣的性状,其编码相关的代谢、信息和/或信号转导蛋白,例如激酶、转录因子、锌指蛋白或热激蛋白。这些基因的靶向修饰以及由此编码的蛋白质有可能介入许多生理过程,从而提供了以靶向方式控制代谢过程的可能性。此外,这些基因以及相关的调节DNA元件和编码调节蛋白的区域是负责植物的可育性和/或不育性的感兴趣的核酸靶区域。
基于此可以根据本发明的方法以靶向方式修饰感兴趣的靶植物的反应可能性进一步的生物和非生物因素,包括营养短缺、暴露于有毒金属的反应、微量元素、质量(特别是种子或谷粒的质量)、优化的营养含量、淀粉质量和数量、种子或谷粒的大小、总碳水化合物含量(包括淀粉、蔗糖和其它单糖、二糖和多糖)、氮固定和使用、脂肪酸和/或油含量和/或脂肪/油的组成(包含饱和和不饱和脂肪)、增加的植物产品中赖氨酸或其它氨基酸或硫的含量,或者前述性状组合。可以增加谷物产量的示例性基因包括氨诱导的谷氨酸脱氢酶。影响氨基酸生物合成的基因是例如邻氨基苯甲酸合酶(EC4.1.3.27)。
在另一个实施方案中,靶向修饰的核酸靶区域可以是启动子,其中靶向修饰包括用植物泛素启动子置换天然EPSPS1启动子。
在另一个实施方案中,待以靶向方式使用的核酸靶区域可以是启动子,其中启动子的靶向修饰包括用胁迫诱导的RAB17玉米启动子置换玉米内源NPK1启动子。
在本发明的一个实施方案中,感兴趣的核酸靶区域可以是启动子,其中待靶向修饰的启动子选自玉米PEPC1启动子(Kausch et al.Plant Molecular Biology,45:1-15,2001)、玉米泛素启动子(UBI1ZM PRO,见Christensen et al.,Plant Molecular Biology18:675-689,1992)、玉米根met 2启动子、水稻肌动蛋白启动子(US-ACTIN PRO,McElroy etal.The Plant Cell,Issue 2,163-171,February 1990)、小米RCC3启动子、玉米GOS2启动子、玉米ACO2启动子,或者玉米的油质蛋白启动子。
由于如上所述本发明方法也适于通过CRISPR系统、特别是至少一种特定CRISPR核酸酶或其变体或活性片段与特定的gRNA和DNA修复基质的组合在感兴趣的核酸靶区域中引入靶向插入,所以本发明的另一个实施方案涉及产生将启动子或启动子元件插入包含至少一个分生组织细胞的植物靶结构中的感兴趣的基因组核酸靶区域中的方法,其中所述启动子插入可以导致任何以下表型修饰:增加的启动子活性,即增加的启动子强度,增加的启动子组织特异性,新的启动子活性,可诱导的启动子活性,扩大基因(其受启动子调节,或设定为通过引入外源启动子而受新引入的启动子的控制)的基因表达谱,,时间、空间或发育阶段基因表达的修饰,DNA结合元件的突变,和/或DNA结合元件的添加。根据本发明的方法可以引入包含至少一个分生组织细胞的感兴趣的植物靶结构中的所选择的启动子元件,包括但不限于启动子核元件,例如CAAT框、CCAAT框、Pribnow框,促进病原体诱导性的结合元件如W框、S框或D框和/或TATA框,可以影响翻译的调节序列,和/或用于获得可诱导表达的阻抑物系统,例如Tet-操纵子/阻抑物/诱导子元件,或者磺酰脲阻抑物/操纵子/诱导子元件。根据本发明可以引入感兴趣的植物靶结构的可以调节的启动子/操纵子系统为本领域技术人员已知。可以作为外源启动子引入感兴趣的植物靶结构的启动子例如是DRE启动子。该启动子最初由Yamaguchi-Shinozaki和Shinozaki(1994),Plant Cell 6,251-265描述为抗旱基因rd29A的启动子中的顺式操纵启动子元件,rd29A含有包含新碱基对的保守核序列TACCGACAT。因此,将DRE启动子引入任意植物基因的内源性启动子可以在干旱刺激下产生由该启动子调控的基因的可诱导表达。另一个实例包括ABA应答元件,其含有(c/T)ACGTGGC共有序列,并在许多ABA和/或胁迫调节的基因中发现(Busk&Pages(1998),PlantMol.Biol.37:425-435)。35S增强子或MMV增强子插入植物细胞的内源启动子区域中同样可以增加所调节的基因的表达。因此,根据本发明对启动子或其部分的靶向和精确修饰,可以靶向影响由该启动子调控的基因的表达,并且以这种方式引入的靶向修饰可以直接传递给子代,因为根据本发明的初级靶细胞是分生组织细胞,由此从中可以获得可育的植物或植物材料或植物细胞,其基因组具有期望的启动子修饰,并且还具有期望的表型性状,这是由启动子通过修饰的表达调节的基因的结果。
在根据本发明的另一实施例中提供了一种方法,其涉及使用本发明方法靶向修饰终止子。因此,包含至少一个分生组织细胞的植物靶结构中感兴趣的核酸靶区域可以是终止子,其中所述修饰包括用另一终止子或其片段置换一个终止子或其片段,其中终止子交换可包括一个或多个以下性状修饰:终止子活性增加,终止子组织特异性增加,终止子活性降低,终止子组织特异性降低,DNA结合元件突变和/或缺失或添加DNA结合元件。待靶向修饰的终止子(或其片段)可以是内源基因的终止子(或其片段),但其同样可以是人工或嵌合或合成的终止子,或者转基因终止子。同样地,置换终止子,即本发明的方法引入感兴趣的植物靶结构的基因组中的终止子或者其片段,也可以是内源终止子、人工终止子(包括嵌合终止子),或转基因终止子。示例的终止子可以选自玉米ARGOS8或SRTF18终止子、番茄PIN-II终止子、小米肌动蛋白终止子、小米-SB-GKAF终止子、水稻T28终止子、AT-T9终止子,或者GZ-W64-A终止子。根据本发明的一个优选实施方案,待置换的终止子元件与至少一种gRNA(与至少一个CRISPR核酸酶和感兴趣的核酸靶区域匹配)以及DNA修复基质组合使用,其中DNA修复基质的中心元件作为供体序列以将感兴趣的终止子或装置元件插入包含至少一个分生组织细胞的植物靶结构的基因组核酸靶区域中。
在另一个实施方案中,本发明的gRNA/CRISPR核酸酶/DNA修复基质系统用于分生组织细胞中以特异性地缺失锚定在感兴趣的植物靶结构中的终止子或终止子元件。
除了启动子和终止子之外,真核细胞的基因组中还存在对于调节基因或功能性RNA转录重要的其它调节序列。在本发明的一个实施方案中,本发明的CRISPR系统用于靶向修饰或替代这些调节序列,以便以稳定的方式将这些靶向修饰或替代锚定在感兴趣的植物靶结构的基因组中,通过最初修饰的分生组织细胞将其传递给后代,从而能够观察到以这种方式获得的植物材料或其植物细胞中的靶向表型修饰。根据本发明的示例调节序列包括但不限于3'UTR(非翻译)区、5'UTR区、转录激活物、转录增强子或阻抑物、翻译阻抑物、剪接因子、miRNA、siRNA、人工miRNA、lncRNA、启动子元件、CaMV 35S增强子、MMV增强子元件、SECIS元件、聚腺苷酸化信号和多聚泛素化位点。
在一些实施方案中,基因组编辑,即核酸靶区域的靶向修饰,包括置换调节元件的靶向修饰,导致一个或多个以下效应和/或表型表达:修饰的蛋白质翻译,RNA裂解,RNA剪接,及转录或翻译后修饰终止。在一个实施方案中,在分生组织细胞中以靶向方式修饰的感兴趣的核酸靶区域是多聚泛素化位点,其中多聚泛素化位点的靶向修饰导致对于感兴趣的靶蛋白质的修饰的蛋白质降解速率。泛素标签标记蛋白质,以便随后可将这些蛋白质还原成蛋白酶体,或通过称为自噬的过程分解。已知蛋白酶体抑制剂能够导致蛋白质过度生产。编码感兴趣的蛋白质的核酸靶区域的靶向修饰因此也可导致感兴趣的蛋白质的至少一个氨基酸修饰,其中所述修饰允许随后的蛋白质的聚泛素化,即翻译后修饰,这导致在感兴趣的蛋白质中修饰的蛋白质降解或者蛋白质降解速率。
在一个实施方案中,待修饰的基因组序列是玉米EPSP合酶基因中的多聚泛素化位点,其中多聚泛素化位点的靶向修饰导致蛋白质含量增加,因为相关蛋白质以较低速率分解。
在另一个实施方案中,根据本发明的方法靶向修饰的分生组织细胞内的基因组核酸靶序列是内含子位点,其中靶向修饰包括将内含子促进基序引入该内含子导致包含该内含子的基因的转录活性被调节(增加/减少)。
在另一个实施方案中,以靶向方式修饰的植物靶结构的基因组内的感兴趣的核酸靶区域是内含子位点,其中靶向修饰包括用另一内含子如大豆泛素内含子1置换特定内含子,例如大豆EPSP合酶1内含子。
在本发明的一个实施方案中,在感兴趣的植物的分生组织细胞的基因组中以靶向方式修饰的核酸靶序列是内含子或UTR位点,其中所述靶向修饰包括在该内含子或UTR位点中插入至少一个微小RNA,由此的包含内含子或UTR位点的基因的表达也导致该插入的微小RNA的表达,这又导致感兴趣的每个靶基因能被已经以这种方式转录的微小RNA“沉默”,无论其是内源植物基因还是植物害虫基因,而不影响携带内含子的基因的基因表达。基因沉默或基因关闭是基因表达降低或关闭的过程。在这种情况下的基因调节包括抑制遗传信息从DNA到mRNA的转移,或者随后存储在mRNA上的信息翻译成蛋白质。在将遗传信息从DNA转录到所转移的mRNA上之后发生的过程称为转录后基因沉默。这些现象通常被称为RNA干扰或RNAi,其是特定RNA分子参与的调节过程,例如微小RNA和siRNA或人工ddRNAi发夹构建体。转录后基因沉默可导致感兴趣的靶mRNA的集中降解,减少基因产物(蛋白质)的形成。结果,通过称为宿主诱导的基因沉默(HIGS)的方法,内源和外源性产物都可以沉默或以显著较低的频率翻译。
在一个实施方案中,本发明的方法用于靶向修饰包含至少一个分生组织细胞的植物靶结构内的核酸靶区域,使用CRISPR核酸酶和gRNA及任选存在的至少一个效应子结构域的组合,以靶向修饰转录因子,即突变或缺失转录因子,或将转录因子插入感兴趣的核酸靶区域,使用DNA修复基质形式的合适供体构建体。示例的转录因子是锌指转录因子或绒毡层发育和功能因子(TDF;DE 10 2015 004 187 A1)。将单个碱基对插入转录因子的编码序列中可导致移码突变,从而产生新的蛋白质,其仍显示出DNA结合活性,但却丧失了其转录激活能力。因此,例如突变的锌指转录因子蛋白竞争结合细胞分裂素氧化酶基因启动子,并阻断细胞分裂素氧化酶的表达。细胞分裂素氧化酶表达的降低可以增加水稻植物的细胞分裂素水平,并促进穗生长,而玉米中的穗生长可以增加,并且通常可以在许多植物中增加感兴趣的植物产物的产量。另一方面,突变的TDF可导致小麦雄性不育,这可有利地用于杂交小麦植物的产生。
在另一个实施方案中,本发明的方法可以用于靶向修饰包含至少一种分生组织细胞的植物靶结构中的感兴趣基因组核酸靶区域中的剪接,或者将剪接引入感兴趣的基因组核酸酸靶区域中。在真核细胞中,得自pre-mRNA分子及随后经历成熟过程的mRNA用于蛋白质的合成或表达。通过加入poly-A链对pre-mRNA分子进行加帽、剪接及随后稳定化。真核细胞对于所谓剪接已经开发了一种的复杂过程,其导致原始pre-mRNA分子的可变变异。在玉米细胞中,剪接过程可能受在外显子-内含子结合位点处的剪接影响。典型剪接位点的一个实例是AGGT。编码基因的序列可含有许多可变剪接位点,这可以影响pre-mRNA成熟过程的整体效率,从而决定性地限制蛋白质在细胞中的积累。本发明的gRNA/CRISPR核酸酶可以与效应子结构域和DNA修复基质一起使用,其可以用于将特定修饰模板引入感兴趣的植物靶结构中,以修饰基因组核酸靶区域,由此典型剪接位点以高精度插入特定位置或在此产生。在一个实施方案中,例如可以影响植物EPSP合酶基因,其中该基因的靶向修饰包括修饰可变剪接位点,由此这种靶向基因组编辑导致增加的功能性基因转录和基因产物的产生。
如果本发明的方法具有作为核酸靶区域的内源植物基因,则可以通过靶向修饰可以获得一种或多种以下效应:增加的蛋白质/酶活性,增加的感兴趣的蛋白质的功能性,降低的蛋白质活性,降低的蛋白质功能性,定点突变,蛋白质结构域的置换,蛋白质敲除,新的蛋白质功能性或修饰的蛋白质功能性。
在一个实施方案中,蛋白质敲除可以包括将终止密码子引入感兴趣的编码序列中。
在另一个实施方案中,蛋白质敲除可包括在感兴趣的编码序列中的起始密码子的缺失。
在根据本发明的另一个实施方案中,本发明的方法可以用于靶向沉默感兴趣的基因。
在一个实施方案中,目标是内源植物基因的基因沉默,在另一个实施方案中,其表达修饰的靶基因不是内源植物基因,而是植物病原体的基因,包括细菌基因、真核生物基因,包括来自原生动物、线虫、真菌、昆虫或其它食肉动物或植物病原体的基因,或者病毒基因。用于沉默基因的称为RNAi的过程发生在感兴趣的靶结构的细胞质中,因为这是其所需的蛋白质和蛋白质复合物以其功能形式存在之处。因此,本发明的方法因此可以用于两个不同的实施方案中:(1)可以通过本发明的方法以靶向方式将反向基因片段插入到感兴趣的核酸靶区域中。随后可以转录这些基因片段,产生双链RNA结构,例如RNA发夹结构,其随后可以沉默内源或外源基因。或者,根据如上文所述的第一个实施方案,核酸序列还可以以靶向的方式将引入基因组核酸靶区域中,其编码miRNA或siRNA其被编码为功能性RNA,其中siRNA或miRNA构建体随后介导基因沉默或基因关闭;(2)在第二个实施方案中,本发明的CRISPR核酸酶和相关的gRNA可被修饰,由此人工CRISPR系统特异于作为核酸靶结构的RNA。为此,其它效应子结构域可以与gRNA和/或修饰的CRISPR核酸酶相关联。当在基因沉默方法框架中直接修饰RNA而不是靶向修饰基因组靶区域时,这个方法是特别有利的。
在另一个实施方案中,本发明的方法在植物育种过程中适于促进的性状作图。关于定性性状,本发明的方法可用于靶向消除所鉴定的染色体区域中的候选基因,以基于此确定基因的缺失对于感兴趣的性状的表达是否有影响。关于数量性状,感兴趣性状的表达由多个不同的且大小、复杂性和统计学意义显著不同的数量性状基因座(QTL)控制,其也可以位于植物的基因组中分散的多个染色体上。因此,QTL是染色体的部分或许多染色体的部分,其对于特定的数量表型性状的表达具有影响。与独立的性状(例如植物花色存在众多不同的分化状态)不同,可以测量数量或一致性状而不用连续范围梯度。在对定义复杂性状的QTL区域产生负面影响的情况下,本发明的方法可因此用于一个实施方案中,通过标记辅助的作图消除包含至少一个分生组织细胞的植物靶结构内的全部染色体区域,以标记用于选择性缺失或者再分配的特定区域。
在本发明的另一个实施方案中,通过两个单独的成对gRNA/CRISPR核酸酶、任选使用DNA修复基质,本发明的方法可以用于修饰感兴趣的基因组区域,其侧翼是两个不同的核酸靶区域。这些修饰可以同时或相继进行。所述去除优选同时进行,且随后可以修复所得的缺失,任选使用DNA修复基质,通过连接没有缺失的靶核酸靶区域的两个染色体末端而进行。
在另一个实施方案中,感兴趣的靶区域可以通过倒位、裂解位点突变或者感兴趣的区域的倍增而修饰。
本发明的示例的除草剂抗性蛋白质或基因包括乙酰乳酸合酶(ALS)抑制剂(特别是如果除草剂是磺酰脲类型),和编码针对抑制谷氨酰胺合酶作用的除草剂(例如草丁膦或BASTA,草甘膦)的抗性的基因,,例如EPSP合酶基因及GAT基因,HPPD抑制剂如HPPD基因等。因此,bar基因编码对除草剂BASTA的抗性,而nptII基因提供抗生素卡那霉素和遗传霉素(G418)抗性,ALS基因突变体编码或提供对除草剂氯磺隆的抗性。
根据本发明提供对疾病或植物病原体抗性的基因可以提供对植物害虫的抗性,例如玉米根虫、葡萄肖叶甲(Bromius obscurus)或其幼虫、欧洲玉米螟等。疾病抗性基因和/或昆虫抗性基因包含用于抗微生物的的溶菌酶或杀菌肽,或用于抗真菌病原体的蛋白质如防御素、葡聚糖酶或几丁质酶的基因,或用于防治线虫或昆虫的苏云金杆菌(Bacillusthuringiensis)内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶。
此外,如上所述,根据本发明的方法可用于产生雄性或雌性不育植物。产生雄性不育玉米植物是有利的,因为这种植物不需要手工或机械除去雄穗,即产生花粉的雄性花序,除去雄穗可能是耗时且昂贵的。示例的雄性不育基因是例如MS26、MS45或MSCA1。玉米植物可以通过自花授粉和异花授粉技术进行栽培。玉米植株在雄穗上有雄花,雌花在雌穗上,同一植株既有雄花又有雌花。结果,玉米植物可以通过自花授粉和异花授粉再生。育种计划组合两或多个品系或者来自称为育种集合的不同来源的希望的性状,从中获得新的近交品系或DH(双单倍体)品系,其通过自交和随后选择期望的表型而开发。杂交玉米类型是两个这样的近交品系或DH品系之间的杂交,其中两个亲本近交系或DH品系均携带一个或多个在另一个亲本品系中缺少的或可以互补另一个品系的所需特征。然后将新的近亲或DH系与其它近交系或DH系杂交,并检测其杂种,以鉴定那些潜在的经济和农学有益的植物。第一代的杂种后代(以及第一代的后代)被标记为F1。F1杂种比其亲本更强壮和健康。这种作用也称为杂种优势,可以以多种方式自身表达,例如增加的植物生长或增加的产量。杂种玉米种子可以使用雄性不育系统产生,通过手工或机械除去雄穗。通过去除雄穗,近交系的雌花只能用感兴趣的雄性近交系的花粉授粉。所得种子因此是杂种(F1)并且产生杂种植物。然而,通常很难防止雌性植物的自花授粉,特别是在田间试验中。结果,雌性近交系的种子随后与杂种种子一起收获。如上所述,雌性近交系或DH系的种子因为没有发生杂种优势效应而在经济上不如F1种子有利。因此,对于雄性不育植物的植物育种有很高的需求,其可以用于生产用于农业上感兴趣的植物例如玉米或小麦的杂交种子,这可以理想地以低劳动力和生产成本获得。例如,在玉米植物或小麦中导致雄性不育的突变在现有技术中通过许多方法获得,例如使用X射线或UV辐射、化学处理,或通过插入可转座元件(Chaubal et al.,2000AM.J.Bot.87:1193-1201)。然而仍然强烈需求影响感兴趣的植物中雄性能育性的新基因,以及用于将该基因或感兴趣的靶向修饰精确插入感兴趣植物的基因组中的可靠方法。负责雄性不育的基因例如包括来自拟南芥的败育小孢子(AMS)基因、拟南芥MS1基因、NEF1基因、拟南芥AtGPAT1基因、拟南芥dde2-2-突变、拟南芥faceless pollen-1基因(flp1)、拟南芥雄性性母细胞死亡1基因、绒毡层特异性锌指基因(TAZ1)、绒毡层决定簇1基因和绒毡层发育和功能(TDF)基因。
由于本发明的方法适合于在包含至少一种分生组织细胞的植物靶结构的核酸靶区域中的靶向修饰的稳定及瞬时整合,因此可以直接获得雄性或雌性不育植物或植物材料,例如因为根据本发明的方法可以引入分生组织细胞的靶向修饰直接传递给该细胞的后代。使用本发明的体内技术,因此无需进一步杂交可以获得雄性或雌性不育植物,特别是玉米植物。
在本发明的一个实施方案中,提供了适于选择或限定在核酸靶区域包括基因组靶区域或RNA靶区域中包含至少一个靶向修饰的植物、植物材料或植物细胞的方法,其中所述方法包括以下步骤:
a)获得在至少一个分生组织细胞中包含至少一个CRISPR核酸酶或其变体或催化活性片段的第一植物,其中所述CRISPR核酸酶能够在感兴趣的基因组靶区域或RNA核酸靶区域中插入双链或单链断裂;
b)获得包含至少一个gRNA的第二植物,所述gRNA能与步骤a)的CRISPR核酸酶或其变体或催化活性片段形成复合物;
c)将来自步骤a)的第一植物与来自步骤b)的第二植物杂交;
d)检测来自步骤c)的后代或其细胞在感兴趣的核酸靶区域中的修饰;
e)选择后代植物、植物材料或植物细胞,其在感兴趣的至少一个核酸靶区域中包含希望的靶修饰。
在本发明的这种选择方法的另一个实施方案中,所述gRNA和/或CRISPR核酸酶还包含至少一个效应子结构域,其与或者可以与gRNA和/或CRISPR核酸酶结合,和/或如果在重组构建体上提供gRNA和/或CRISPR核酸酶以及至少一个效应子结构域,则为效应子结构域的编码序列。效应子结构域可以以共价或非共价的方式与gRNA和/或CRISPR核酸酶结合或连接。
在本发明的另一个实施方案中,提供了用于选择感兴趣的植物、植物材料或植物细胞的方法,其包含已经以靶向方式修饰的核酸靶区域,在其基因组或其转录组中,即特定时间点细胞中所有转录的基因或功能性RNA的全部,其中该方法包括以下步骤:
(a)获得包含至少一个CRISPR核酸酶或其变体或催化活性片段的第一植物,所述酶在核酸靶区域中可以导致双链断裂、单链断裂和/或特异性DNA键合;
(b)获得包含gRNA的第二植物,其中所述gRNA能与CRISPR核酸酶或其变体或催化活性片段形成复合物,其中所述Cas核酸酶、其变体或其催化活性片段以及gRNA直接提供或以至少一个重组构建体的形式提供,及其中gRNA和/或CRISPR核酸酶或其变体或催化活性片段与或者可以与至少一个效应子结构域或效应子结构域编码序列结合;及其中来自(a)的第一植物或来自(b)的第二植物也包含DNA修复基质,其包含至少一个供体DNA作为其中心组分,其中DNA修复基质通过转化或转染或者以重组方式以至少一个重组构建体形式直接引入第一或第二植物、植物材料或植物细胞;
(c)将来自步骤(a)的第一植物与来自来自步骤(b)的第二植物杂交,及任选地,提供至少一个gRNA和/或一个DNA修复基质,只要其不是稳定地整合到第一和/或第二植物的基因组中即可;
(d)就在感兴趣的至少一个核酸靶区域中是否可以观测到靶向修饰来评估来自步骤(c)的植物的后代或其植物细胞;以及
(e)选择后代植物或其植物材料或植物细胞,其包含引入感兴趣的至少一个靶核酸区域中的希望的插入,其中所述插入是作为DNA修复基质的部分经由供体DNA引入。
因此,本发明的方法适于获得感兴趣的转基因的高精度基因靶向,和/或还产生复杂的转基因性状基因座,因为如上所述,根据本发明的方法,多个转基因也可以是同时或连续地插入包含至少一个分生组织细胞的感兴趣的植物靶结构中。更复杂的转基因性状基因座是携带许多彼此遗传连接的转基因的基因组基因座。通过彼此的0.1、0.2、0.3、0.4、0.5、1、2或甚至高达5厘摩(cM)之内插入单独的转基因,可以将转基因构建为单个的遗传基因座(参见例如US2013/0263324A1)。厘摩指示两个连接的基因、标记、核酸靶区域或基因座或其任意一对之间的距离,其中1%的减数分裂产物是重组的。因此,1厘摩(centimorgan)等于相应于两个连接的基因、标记、核酸靶区域、基因座或其任意一对之间的1%平均重组频率的距离。在选择包含感兴趣的转基因的感兴趣的植物、植物材料或植物细胞之后,含有至少一个转基因的那些植物然后可以杂交,以产生包含两个转基因的F1植物、植物材料或植物细胞。然后,这些F1植物的1/500的后代包含两个不同的转基因,在同一染色体上重组。复合基因座然后可以用作进一步育种,作为具有两种转基因性状的唯一基因座。根据本发明的方法,可以根据需要重复该方法,以在复杂基因座中收集尽可能多的或期望的性状。随后,可以鉴定与感兴趣的表型或性状相关的染色体区间。本领域技术人员可用许多方法来鉴定染色体区间。绘制这样的染色体区间的边界,使得它们包含与控制感兴趣性状的基因连接的标记。换言之,绘制或定义染色体区间,由此位于区间内的每个任意标记、包括限定区间边界的末端标记可以用作标记。在一个实施方案中,染色体区间可以包含至少一个或多于一个QTL。然而,同一区间内多个QTL的强表达的接近性可以掩盖在诊断中特定标记与特定QTL的相关性,因为标记可表示与多于一个QTL的连接。相反,有时不清楚如果两个紧密在一起的标记展示为与所需表型性状的分离,那么这些标记中的每一个是否鉴定相同的QTL或两个不同的QTL。
进一步地,根据本发明的第一方面,揭示了根据上述方法之一获得或者可以获得的植物、植物材料或植物细胞。
本领域的技术人员已知根据本发明可用作载体的微生物和病毒的培育和培养的方法。
在一个实施方案中,借助至少一种载体或载体系统将本发明的重组构建体引入到靶植物结构中。
在另一个实施方案中,将本发明的重组构建体直接引入靶细胞中而无需另外的载体,优选通过机械方法、通过转染或通过使用胞吞作用。
本发明的一个实施方案也设想将至少一个重组构建体引入到靶植物结构中。
本发明的载体和载体系统包括选自SEQ ID NO:12-15和25-38以及与这些序列具有至少66%、67%、68%、69%、70%71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同源性的序列,这些序列尽管修饰,但仍实现与相应SEQ ID NO所示各个未修饰的载体或载体系统相同的功能。所引用的载体和载体系统可以包括密码子优化的或截短的重组构建体,或者其可以含有特定点突变以确保它们在不同靶细胞中的活性。SEQ ID NO:31的序列是一个杂合序列,其中雀麦草花叶病毒(参见NCBI:DQ530425)的Fescue区段RNA3的BclI与BssHII裂解位点之间的区域被置换为R_BMV_RNA3_SI13′A/G的相应区段(Hema&Kao 2004,Journal of Virology)。此外,根据本发明,可以设想农杆菌为载体并且可以单独使用或与其它引入方式或载体组合使用。根据一个实施方案,以上列举的具有SEQ ID NO:12-15和25-38或者具有上述序列同源性的序列的载体和载体系统可作为框架结构用于此目的,以将本发明的包含至少一个gRNA以及至少一个CRISPR核酸酶和/或至少一个效应子结构域的重组构建体引入靶植物结构中。在这方面所需的分子生物学方法和程序是本领域技术人员所熟知的。
本发明的重组构建体包括选自SEQ ID NO:23和24以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列,尽管进行了修饰,仍然实现与相应SEQ IDNO所示未修饰重组构建体相同的功能。所引用的重组构建体可以包含密码子优化的或截短的序列,或者它们可以包含特定的点突变以确保或修饰其在各种靶细胞中的活性或结合性质。在SEQID NO:23中,位置16239-16258对应于各个感兴趣的gRNA的位置,其可以根据靶核酸序列进行修饰。在SEQ ID NO:24中,位置16645-16664对应于感兴趣的各个gRNA的位置,其可以且必须根据靶核酸序列进行修饰。
一方面,本发明涉及生产植物、植物材料或植物细胞的方法,其中所述重组构建体选自SEQ ID NO:23、25和24以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列。
另一方面,本发明涉及通过一种方法可以获得或者获得的植物、植物材料或植物细胞,所述方法包括将根据SEQ ID NO:23和24以及与这些序列具有66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列的重组构建体引入包含至少一个分生组织细胞的靶植物结构。
在又一方面,本发明涉及根据SEQ ID NO:23和24以及与这些序列具有至少66%、67%、68%、69%、70%、71%%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的序列的至少一个重组构建体在特异性修饰植物细胞中至少一个靶核酸区域中的应用。
这样的所有Cas-多肽序列以及Cas-编码核酸序列适用于本发明,其已经被特别优化用于植物细胞中或者其编码构建体携带合适调节序列,所述调节序列可以允许植物细胞在提供的细胞区室、包括细胞核、细胞溶质、线粒体、、质体、包括叶绿体中适当的转录和/或翻译。进一步地,在一个实施方案中,相应的CRISPR核酸酶必须具有其固有的核酸酶功能。因此,衍生自天然CRISPR核酸酶的催化活性片段根据本发明的也可以用作CRISPR核酸酶,只要该催化活性片段仍完成与其衍生自之中的天然酶相同的酶催化功能即可。
或者,在本发明的一个方面,可以使用Cas切口酶或其催化活性片段,即被修饰以使其仅切割一个DNA并且不像在天然CRISPR核酸酶中一样产生DNA双链断裂的Cas多肽。这意味着首先存在提高特异性的可能性,因为为了进行双链断裂,必须使用包含Cas切口酶的两种重组构建体。另一方面,存在可以引入特异性补偿的双链断裂而不是钝切口的可能性。
最后,根据本发明的一个方面,也可以使用Cas-zero核酸酶或其催化活性片段,即不再具有任何核酸酶活性的变体。在这方面,提高了CRISPR核酸酶与根据本发明的另外的效应子结构域一起使用的可能性,即另外的DNA或RNA修饰或者DNA或RNA结合多肽或核酸,由此扩大了用于将特定修饰引入靶植物结构中的范围。
本领域技术人员知道CRISPR核酸酶的催化结构域中的特定突变是感兴趣的,以将其“重新编程”为切口酶或核酸内切酶-zero变体。
用于本发明中的CRISPR核酸酶或其催化活性片段或编码CRISPR核酸酶或其催化活性片段的的序列例如是SEQ ID NO 16-22和UniProtKB/Swiss-Prot数据库登录号Q99ZW2(SEQ ID NO:39)中所揭示,且还包含与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同源性的那些序列,尽管进行了修饰,仍然完成与相应SEQ ID NO所示未修饰序列相同的功能,或者其可以在所述数据库登录号下存取。
在本发明的另一方面,使用基于RNA控制的DNA修饰的活性机制的CRISPR/Cas系统,由此CRISPR核酸酶代替或与CRISPR核酸酶一起被特定调适的gRNA引导至靶植物结构中靶核酸区域的希望位置,由此效应子结构域可以特异性地放置以进行希望的核酸编辑。
在该方面的一个实施方案中,靶核酸区域是基因组DNA。
在该方面的另一个实施方案中,靶核酸区域是线粒体或质体DNA,其中重组构建体包含定位序列,其包括重组构建体在相应靶区室例如在线粒体或叶绿体中定位。
在一个实施方案中,CRISPR核酸酶或其催化活性片段或编码CRISPR核酸酶或其催化活性片段的序列和/或效应子结构域或编码效应子结构域的序列另外包含选自核定位序列、质体定位序列、优选线粒体定位序列和叶绿体定位序列。核定位方法可选自SEQ ID NO:49-58,其揭示了以下序列:单份的猿猴病毒40(SV40):MAPKKKRKV;根癌农杆菌(A.tumefaciens)VirD2(pTiA6):KRPRDRHDGELGGRKRAR;根癌农杆菌VirD2(pTiC58):KRPREDDDGEPSERKRER;A tumefaciens VirE2(pTiA6)#1:KLRPEDRYVQTERGRR;根癌农杆菌VirE2(pTiC58)#1:KLRPEDRYIQTEKYGRR;根癌农杆菌VirE2(pTiA6)#2:KRRYGGETEIKLKSK;根癌农杆菌(PtiC58)#2:KTKYGSDTEIKLKSK;发根农杆菌(A.rhizogenes)GALLS(pRil 724):KRKRAAAKEEIDSRKKMARH;发根农杆菌GALLS(pRiA4):KRKRVATKEEIEPHKKMARR;发根农杆菌GALLS VirD2(pRiA4):KRPRVEDDGEPSERKRAR。
一个或多个核定位序列可以与效应子结构域结合,其优选地联合在质粒载体上。
在另一个实施方案中,gRNA或编码gRNA的序列另外包含选自核定位序列、质体定位序列,优选线粒体定位序列和叶绿体定位序列的序列。
在该方面的又一个实施方案中,靶核酸区域是任何植物区室中的核糖核酸(RNA),例如细胞溶质。根据该实施方案,可以提供能够与靶RNA结构相互作用的特异性修饰的gRNA。gRNA可以另外包含另外的效应子结构域,例如适体。
本领域技术人员会意识到,设计与至少一个CRISPR核酸酶和/或至少一个效应子结构域一起使用的相应的至少一种gRNA取决于特异性,特别是CRISPR核酸酶和/或效应子结构域以及待特异性修饰的靶核酸区域的结合和识别性质。
野生型CRISPR核酸酶,特别是Cas9型核酸酶在靶DNA序列中产生平末端双链断裂,即没有单链DNA突出端。而且,这些核酸酶也可以留下单核苷酸突出端,得自DNA双链的两个链的位移裂解。为此,靶细胞的内源DNA修复机制被激活,包括所谓的非同源末端连接,NHEJ。然而,这种机制易错,特别是因为以此方式插入和缺失(INDEL)可以引入在双链断裂的位置。因此可以在各个DNA链重结合的位点建立突变。通过NHEJ,可以介导单个或多个基因敲除,其中在特定的DNA断裂之后,将DNA链与通过移码或其它突变获得的修饰的序列置于一起,可以再次通过内源性机制阻止一个或多个感兴趣的基因的功能表达。进一步的修复机制是同源性定向修复(HDR)或同源重组(HR)。这些机制使用同源DNA作为模板或基质,从中可以复制序列信息以修复DNA断裂。至少一次精确的编辑、插入或基因交换可以通过DNA修复基质靶向提供而发生,其在特定长度上与其中在感兴趣的靶细胞内诱导DNA断裂的基因组DNA区域同源。以这种方式获得的精确修饰不包含希望的或可控制的突变,这在任何基因编辑方法中总是需要的。修复机制NHEJ和HDR/HR都构成了在本发明的每个细胞中存在的天然发生的DNA修复机制。
在根据本发明的所有方面的一个实施方案中,提供了DNA修复基质或修复模板,其以位点定向和精确方式修复单链或双链断裂,所述断裂先前通过CRISPR核酸酶或其变体或催化活性片段和/或效应子结构域插入在感兴趣的核酸区域中。
根据II型CRISPR/Cas系统的上述机制,定点引入靶核酸区域修饰的决定性因素是gRNA序列的特定选择和特定设计,以避免裂解靶区域以外的脱靶区域。根据使用的CRISPR/Cas工具和任选其它效应子结构域鉴定合适的PAM基序以及使用该信息设计合适的重组构建体为本领域技术人员已知。
根据本发明的一个实施方案,细胞的基因组或染色体外靶核酸区域因此针对合适的PAM序列首先进行研究,以能够特异性地设计合适的gRNA。
如本文所用,术语“指导RNA”或“gRNA”表示单链或双链或部分双链的核酸分子,其可以由天然或合成的RNA和/或天然或合成的DNA组成,并且具有能够与CRISPR核酸酶或其催化活性片段构建复合物的功能,由此使CRISPR核酸酶或其催化活性片段能够识别靶核酸区域。另外,除了CRISPR核酸酶相互作用结构域之外,gRNA还可以作为识别结构域与感兴趣的互补靶核酸分子进行特异性杂交。因此,如上所述,gRNA包含crRNA和任选的tracrRNA。因此gRNA可以是合成的双分子,其联合许多功能的,或者gRNA可以仅包含一种功能。crRNA和/或tracrRNA的长度可以在2、3、4、5、6、7、8、9,10、11、12、13、14、15、16、17、18、19,20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个核苷酸。因此,gRNA可以通过互补的碱基配对形成内在的发夹区域,由此天然的tracrRNA/crRNA发夹结构被模仿(参见Jinek et al,2012,,上文),另外根据期望的靶结构而包含合适的识别结构域。如果选择Cpf1核酸酶作为CRISPR核酸酶被选择,则gRNA可以是不包含tracrRNA使用的结构的crRNA(参见Zetsche et al.,2015,上文)。因此,本发明的gRNA可以包含一个或多个间隔区,其与结合配体或靶分子不相互作用,而是用于gRNA的正确折叠和定向,或者用于crRNA和tracrRNA的连接。这些间隔区可以由DNA和/或RNA组成,并且表现出长度为至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸。本发明的gRNA包含至少一个由RNA组成的亚区,其中所述RNA可以由天然或合成的核苷酸形成。如果需要的话,感兴趣的gRNA优选在其5'或3'末端可以进行修饰,其中所述修饰选自加入如下基团:吖啶,胺,生物素,级联蓝,胆固醇,Cy3@,Cy5@,Cy5.5@daboyl,地高辛配基,二硝基苯基,EDANS,6-FAM,荧光素或其衍生物,3'-甘油基,HEX,IRD-700,IRD-800,JOE,磷酸,补骨脂素,罗丹明,巯基(SH),间隔基团,TAMRA,TET,AMCA-S",SE,BODIPY<0>,MarinaOregonRhodamineRhodol和Rhodol锁核酸(LNA),5-甲基DC,2,6-二氨基嘌呤,2'-Fluor A,2'-Fluor U,2'-O-甲基RNA,一种或多种硫代磷酸酯如spine,聚乙二醇连接,或者导致环化的共价5'-3'连接,或其组合。对于具体的实施方案,感兴趣的是以有针对性的方式减少gRNA的长度,以便设计包含少于100个核苷酸、少于95个核苷酸、少于90个核苷酸、少于85个核苷酸、少于80个核苷酸、少于75个核苷酸、少于70个核苷酸、少于65个核苷酸、少于60个核苷酸、少于55个核苷酸、少于50个核苷酸核苷酸、少于45个核苷酸、少于40个核苷酸、少于35个核苷酸或者少于30个核苷酸的gRNA,以便通过缩短获得更高特异性的CRISPR核酸酶。在其它实施方案中,本发明的gRNA可以包含至少一个效应子结构域,例如适体,或者DNA或RNA修饰的分子,或者蛋白质或肽的结合位点,从而扩大gRNA分子的功能性。
在根据本发明的另一个实施方案中,至少一个gRNA还可以与至少一种核酸分子在体外或体内结合,所述核酸分子在CRISPR核酸诱导双链断裂后用于特异性DNA修复。这种(DNA)修复基质或HDR基质可以作为单链和/或双链DNA直接或以重组构建体的形式插入感兴趣的靶结构中。因此,修复基质允许靶向的同源重组,由此可以显著扩大基因组编辑的特异性和应用范围。
根据本发明,可以使用特别调整适用于植物细胞中的gRNA。
另外,根据本发明,本文所述的任何gRNA可另外引入至少一个效应子结构域如适体,与效应子结构域结合或一起,使得gRNA的功能性扩大。可以使用合适的重组构建体和/或载体将包含gRNA和至少一个效应子结构域的重组构建体引入到靶植物结构作为DNA或RNA构建体。效应子结构域不仅可以由核酸组成,而且可以是由多肽或其编码序列组成。
在一个实施方案中,将与CRISPR核酸酶或其催化活性片段和/或效应子结构域、例如DNA-或RNA-修饰或者DNA-或RNA-结合多肽或核酸结合的gRNA引入靶植物结构中。
在另一个实施方案中,将gRNA引入靶植物结构中作为独立于CRISPR核酸酶和/或效应子结构域例如DNA或RNA修饰或DNA或RNA结合多肽或核酸的单独的重组构建体。
可以将gRNA引入到靶植物结构中作为DNA或RNA分子。因此,在一个实施方案中,可以将gRNA以合成的核酸的形式例如以RNA或者也可以以与CRISPR核酸酶或其催化活性片段的复合物形式直接引入,或者在另一个实施方案中以可激活和可转录的重组DNA构建体的形式引入靶细胞中。此外,根据本发明,可以使用单个gRNA,或者可以将一个或多个重组构建体中的双重或多个gRNA同时引入细胞中,其中所述gRNA具有相同或单独的调节序列。根据在下文更详细解释本发明方面,可以选择插入靶细胞的合适gRNA,其中该方面提供了用于鉴定gRNA或gRNA编码序列的体外筛选方法。
由于常规CRISPR/Cas gRNA的相互作用结构域总是与相同CRISPR核酸酶相互作用,因此携带不同识别序列作为另一个组分的各个gRNA可以用于多路复用策略,即一个策略中特异性修饰若干个靶区域。在这方面,PAM序列可能总是需要位于靶区域附近或在靶区域内。合适的gRNA的设计可以由已知本领域技术人员经由电脑模拟而确定,其知道所使用的CRISPR核酸酶、核酸靶区域,选自突变、插入或缺失的希望的核酸修饰的类型,以及希望的靶细胞。然而,这些gRNA在体内的有效性以及可能的脱靶效应必须针对每种gRNA单独进行评估。此外,对于未确定的系统,例如分生组织植物细胞的瞬时转化,必须确定合适的载体和方法以引入至少一个gRNA与至少一个合适的Cas核酸酶和/或至少一个效应子域例如DNA-或RNA修饰的或者DNA-或RNA-结合的多肽或核酸,从而可以保证两个分子在靶细胞中的改变的活性。除了纯粹的设计和合成或提供gRNA之外,植物基因组是非常复杂这一事实是另一困难,迄今为止还没有可靠的预测试方法,可以得出关于与希望的CRISPR核酸酶或其催化活性片段相互作用的选择的gRNA实际上是否能够有效修饰植物细胞中的核酸靶区域的结论。
在本发明的一个实施方案中,本发明的方法以及由此产生的植物、植物材料或细胞基于靶细胞中天然存在的DNA修复机制。
在根据本发明的方面的另一个实施方案中,先前由CRISPR核酸酶或其催化活性片段和/或其它效应子结构域介导的单链或双链DNA断裂的修复,是通过一个或多个HDR基质作为DNA修复模板修复的,其不是天然存在的,而是已经被引入到靶细胞中。
在本发明中,在一个实施方案中揭示了DNA修复基质,其可以任选地与CRISPR构建体和/或另外至少一个效应子结构域一起或在不同的时间被引入靶细胞中,以诱导特异性HDR机制,及因此诱导在双链断裂的位点的特定的核酸序列。就此而言,可以进行靶向的基因组编辑,其包括敲入和DNA损伤的特异性修复,以防止DNA断裂位点处的不希望的突变。敲入可以指在植物细胞的靶核酸中特异性插入至少一个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少15个核苷酸、至少20个核苷酸、至少50个核苷酸、至少100个核苷酸、至少200个核苷酸、至少500个核苷酸或至少1000个核苷酸。此外,敲入也可意味着引入完整基因表达盒,其可以包含高达10,000个核苷酸。基因组编辑也意味着用另一个核苷酸靶向置换至少一个核苷酸。此外,还可以通过两次、三次、四次或更多次置换或者插入和置换的组合获得敲入。“插入”是指在植物细胞的靶核酸中特异性插入至少一个核苷酸、至少2个核苷酸、至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少15个核苷酸、至少20个核苷酸、至少50个核苷酸、至少100个核苷酸、至少200个核苷酸、至少500个核苷酸、至少1000个核苷酸、至少2000个核苷酸、至少5000个核苷酸、至少10000个核苷酸或至少15000个核苷酸。作为插入的核酸序列可以是转录因子结合位点、调节序列、多肽编码序列、内含子序列,编码非编码RNA(例如IncRNA)的序列、表达盒、非编码序列,用作标记(特别是选择标记,例如在育种框架中用于标记辅助选择的标记),或RNAi构建体的序列或其部分。此外,敲入还可以通过缺失扰乱基因功能的序列区段(例如转座子插入的缺失)来引起。DNA修复基质可以引入感兴趣的靶植物结构中作为单链或双链核酸。
在一个实施方案中,靶核酸可被特异性关闭(敲除),即核酸的转录和任选的翻译被抑制。这可以通过特异性插入、突变或缺失调节序列例如靶核酸的启动子或终止子序列或者通过靶核酸本身或其一部分的特定突变或缺失进行。此外,改变靶核酸读框的特异性突变或缺失或者潜在剪接信号的特异性突变或缺失可导致敲除。在一个实施方案中,这种敲除不用通过NHEJ途径插入HDR基质进行;在另一个实施方案中,除CRISPR构建体和/或其它效应子结构域之外,还将HDR基质或DNA修复基质引入靶细胞。例如,特定的突变是用另一个核苷酸置换至少一个核苷酸,优选结果是涉及的密码子然后编码另一个氨基酸。植物细胞中特异性敲除的靶核酸具有至少一个特定的突变或缺失,但也可以包含2、3、4或更多个特定的突变和/或缺失。
在实施方案中,据其Cas或Cpf1基因或DNA形式的其它效应子核酸酶可以引入感兴趣的靶细胞中的相应构建体上,编码核酸酶的基因可以包含合适的启动子,其与编码核酸酶的序列功能性连接以改善其转录。启动子可以具有组成型活性,或者其可以是可诱导启动子,其首先在适当的刺激(化学或物理刺激,包括光、温度等)已经被加入或者已经起作用之后被激活。同样,编码gRNA的构建体可以包含合适的启动子。根据本发明,用于植物细胞的合适启动子可以选自:玉米-ubi-内含子启动子(SEQ ID NO:7),玉米U3启动子(SEQ IDNO:10),植物U6聚合酶III启动子,例如小麦U6启动子(SEQ ID NO:8),来源于水稻的U6启动子(see Mikami et al.,Plant Mol.Biol.2015,88(6),561-572),或来自拟南芥(Arabidopsis thaliana)的U6-26启动子,水稻U3启动子(SEQ ID NO:9)和短柄草(Brachypodium)EF1启动子(SEQ ID NO:40),或源自花椰菜花叶病毒的单一或双重35S启动子,其中包括35SPPDK启动子(参见Yoo et al.Nature Protocols 2,1565-1572(2007)),但启动子不限于此,因为启动子根据相应的植物细胞进行选择的。
在又一个实施方案中,植物细胞的天然NHEJ机制通过添加合适的抑制剂或通过靶向敲除或敲下参与NHEJ过程的内源核酸序列而可以有意抑制,于是促进在期望的核酸序列中引入靶向修饰,因为由此细胞的NHEJ机制可被重新引发。在本发明的一个实施方案中,其中靶植物结构是发育后期的秧苗/植物或植物胚或暴露的分生组织细胞的分离的分生组织细胞,将包含分生组织细胞的靶植物结构在引入本发明的至少一种重组构建体之前、期间和之后以防止分离的结构的氧化的方式培养。在一个实施方案中,这包括添加抗氧化剂。
下表1示出用于培养包含分生组织细胞的各种靶植物结构的合适培养基。根据本发明的任何方面,其它合适的反应条件例如缓冲液、添加剂、温度和pH条件以及任何所需的添加剂可以容易地由已知本发明的方法和构建体的领域技术人员确定。
表1:用于培养具有分生组织细胞的各种靶植物结构的培养基组分(MS培养基=Murashige Skoog培养基;MS盐=Murashige Skoog盐(ToshioMurashige,Folke Skoog:ARevised Medium for Rapid Growth and Bio Assayswith Tobacco TissueCultures.In:Physiologia Plantarum,issue 15(1962),Vol3,p.473-497,ISSN 0031-9317,doi:10.1111/j.1399-3054.1962.tb08052.x)。
将本发明的构建体瞬时引入分生组织细胞或组织中具有这样的优点,即它们从这些生殖组织中发育,由其特定的修饰可以稳定地传递到下一代,从而下一代没有先前已经引入的构建体。本发明的方法和构建体还意味着可以从以这种方式修饰的植物直接收获种子,其携带稳定的DNA修饰而不需要以愈伤组织生产和再生的形式的细胞培养的中间步骤,还可以省去需要选择和再生步骤以及为此所需的培养基和添加剂。
本发明的方法适用于在单子叶植物和双子叶植物中产生特异性DNA修饰。举例的单子叶植物是草类和谷类,如大麦、高粱、黑麦、小黑麦、甘蔗、玉米、小米、水稻、小粒野生稻、澳洲野生稻、高杆野生稻、小麦、硬粒小麦、球茎大麦、二穗短柄草、Hordeum marinum、山羊草。举例的双子叶植物是苹果、甜菜、向日葵、澳大利亚胡萝卜、美洲野生胡萝卜、Daucusmuricatus、胡萝卜、巨桉、普通黄色猴面花、Genlisea aurea、美花烟草、烟草、绒毛状烟草、番茄、马铃薯、中果咖啡、葡萄、黄瓜、川桑、拟南芥、深山南芥、Arabidopsis arenosa、须弥芥、卵叶须弥芥、弯曲碎米芹、北美独行菜、荠菜、Olmarabidopsis pumila、硬毛南芥、欧洲油菜、甘蓝、芜菁、Brassica juncacea、黑芥菜、萝卜、意大利芝麻菜、甜橙、麻风树、大豆、棉花或者毛果杨。
在一个实施方案中,用于特异性修饰靶核酸区域的核酸序列包含至少一或多个调节序列。
在一个实施方案中,用于特异性修饰靶核酸区域的核酸序列包含作为调节序列的至少一个或多个启动子,任选植物和组织特异性、表型、组成型或可诱导启动子,其适于在期望的靶细胞中诱导转录。启动子是参与识别和结合RNA聚合酶以及其它蛋白质以控制转录的核酸区域。gRNA或CRISPR核酸酶或其催化活性片段的编码序列的合适启动子是本领域技术人员熟知的。可诱导启动子的诱导可以通过刺激例如温度、化学品、pH、光、植物受伤后发出的内源植物信号等进行。举例的启动子选自SEQ ID NO:5-11,且还包括与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列,其尽管被修饰,但是仍完成与相应所示各自未修饰的序列相同的功能。其它有利的启动子选自细胞壁相关激酶(WAK)1和2的启动子(见例如Wagner TA,Kohorn BD.Wall-Associated Kinases Are Expressed Through thePlant Development and Are Required for Cell Expansion(Plant Cell)2001;13(2):303-318,以及例如NCBI记录:NCBI参考序列:NC_003070.9),SCARECROW1(scr1)基因的启动子(见例如Tissue Specificity and Evolution of Meristematic WOX3Function;RenaShimizu,Jiabing Ji,Eric Kelsey,Kazuhiro Ohtsu,Patrick S.Schnable and MichaelJ.Scanlon,Plant Physiology February 2009vol.149no.2841-850以及例如NCBI记录:NCBI参考序列:NC_003070.9),FAF2和FAF4基因的启动子(见例如the FANTASTIC FOURproteins influence shoot meristem size in Arabidopsis thaliana,Vanessa Wahl,Luise H Brand,Ya-Long Guo,Markus Schmid Wahl et al,BMC Plant Biology 2010,10:285http://www.biomedcentral.com/1471-2229/10/285以及例如NCBI记录:NCBI参考序列:NC_003070.9),OSH1基因的启动子(见例如Sato et al(1996)Proc.Natl.Acad.Sci.USA,93:8117-8122以及例如Genbank记录:Genbank:CP002688.1或GenBank:AP008209.2),或者金属蛋白基因的启动子,例如来自水稻的启动子(例如GenBank:BAD87835.1)。本发明的启动子可以是天然存在的、合成的或嵌合的启动子或其组合。本发明的优选启动子是在分生组织植物细胞中有活性的启动子或者在植物细胞的质体中有活性的启动子。在一个实施方案中,用于特异性修饰靶核酸区的核酸序列还包含至少一个终止子作为调节序列。
在一个实施方案中,用于特异性修饰靶核酸区域的核酸或氨基酸序列、包括gRNA和CRISPR核酸酶或其催化活性片段或其编码序列,包含一个或多个核定位序列(NLS),其导致用于特异性修饰靶核酸区域的核酸和多肽的核定位。
在一个实施方案中,包含用于特异性修饰靶核酸区域、gRNA和CRISPR核酸酶或其催化活性片段或其编码序列的核酸或氨基酸序列的重组构建体,包含一或多个质体定位序列(PLS),例如线粒体或叶绿体定位序列(MLS或CLS),其导致在相应植物质体中使用的特定修饰靶核酸区域的核酸和多肽的定位。
在一个实施方案中,本发明揭示的编码CRISPR核酸酶或其催化活性片段的核酸序列或者CRISPR核酸酶或催化活性片段还含有标签序列。标签序列是可位于CRISPR核酸酶或gRNA或编码CRISPR核酸酶或gRNA的核酸序列的上游和/或下游和/或序列内的核酸或蛋白质片段,以便任选地特别地允许其在靶细胞内的定位和可观测。特别优选的标签序列选自下列:聚组氨酸(His)-标签,谷胱甘肽-S-转移酶(GST)标签,硫氧还蛋白标签,FLAG标签,具有选自绿色荧光蛋白标签(GFP)、DsRed标签、mCherry标签等的荧光性质的标签,链霉亲和素或Strep标签,麦芽糖结合蛋白(MBP)标签,叶绿体转运肽,线粒体转运肽,snap标签和/或分泌标签。
在另一个实施方案中,提出了可以用于本发明的方法中的融合构建体。这些融合构建体包含融合蛋白以及融合核酸。融合蛋白可以由CRISPR核酸酶、其变体或催化活性片段,或编码CRISPR核酸酶或其变体或催化活性片段的序列作为元件,以及任选地前述标签和效应子结构域之一,或编码效应子结构域的核酸序列之一。结果,可以引入本发明的效应子结构域和/或一或多个相同或不同的CRISPR核酸酶或其变体或催化活性片段,作为感兴趣的植物靶结构中的物理连接的单位,或者将其在感兴趣的植物靶结构中表达。优选地,效应子结构域任选包含与CRISPR核酸酶的N-或C-末端或其变体或催化活性片段融合的氨基酸序列。任选存在的左侧氨基酸序列或编码该左侧序列的核酸序列允许CRISPR核酸酶以及效应子结构域两者理想地定位,而不相互影响,使得效应子结构域以及CRISPR核酸酶都可以发挥其活性。左侧氨基酸序列可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个氨基酸残基或者更多达50或100个氨基酸,在某些情况下甚至更长。此外,本发明还揭示了融合核酸,其中感兴趣的gRNA以共价方式与感兴趣的效应子结构域连接。此外,本发明还揭示了非共价融合核酸,其包含gRNA以及效应子结构域和/或DNA修复基质的,其中非共价连接可以通过杂交、即通过互补区碱基配对发生在各个组分的结合中。此外,本发明揭示了融合构建体,其中感兴趣的gRNA和/或CRISPR核酸酶在体外/离体与感兴趣的效应子结构域化学连接,并随后引入包含至少一个分生组织细胞的感兴趣的植物靶结构中,由此这些效应分子已经连接,从而增加感兴趣的植物细胞中的可利用性,借此可以增加本发明的方法的效率。此外,gRNA与效应分子和/或DNA修复基质的结合不仅可导致效应子结构域和/或DNA修复基质在基因组编辑框架中发挥其功能,而且增加gRNA的稳定性。具体而言,在其中通过转化或转染将gRNA直接插入包含至少一种分生组织靶细胞的靶植物靶结构中的实施方案中,这可以显着增加在其发挥gRNA功能之前细胞RNA对其的分解。
与gRNA和/或CRISPR核酸酶包括Cas核酸酶或Cpf1核酸酶的上述融合构建体,包括含融合蛋白和融合核酸和/或混合的融合蛋白、包括核酸和蛋白质,可以稳定或瞬时的方式作为重组构建体引入感兴趣的植物靶结构中,或至少一个分子作为RNA、DNA或蛋白质可以直接引入包含至少一个分生组织细胞植物靶结构中。例如,编码感兴趣的CRISPR核酸酶的基因可以首先被密码子优化。然后该基因可以稳定或瞬时方式以重组构建体的形式引入感兴趣的植物靶结构中。或者,CRISPR核酸酶也可以在体外翻译,随后作为蛋白质直接引入的感兴趣的植物靶结构中。在一个实施方案中,然后可以将gRNA作为RNA直接插入感兴趣的植物靶结构中。如下面更详细描述的,这可以通过颗粒轰击或本领域技术人员已知的其它转染方法进行。同样,上述功能构建体因此作为重组构建体插入或直接插入感兴趣的核酸靶区域。
在本发明的方法的一个实施方案中,可以将本发明的CRISPR系统、包括至少一个gRNA、一个CRISPR核酸酶、优选还有至少一个效应子结构域以及任选一个DNA修复基质的瞬时表达以瞬时的方式通过颗粒轰击引入包含至少一个分生组织细胞的感兴趣的植物靶结构中。为此,例如可以金或钨颗粒用聚乙烯亚胺(PEI)包被。为此,首先洗涤金颗粒,并在离心和任选洗涤之后重新悬浮于乙醇中,并储存于-20℃。为了用PEI(Sigma#P3143)包被颗粒,将洗涤的金颗粒在乙醇中离心,并弃去乙醇。然后将颗粒在ddH2O中洗涤一次以除去醇残余物,然后加入250μl的0.25mM PEI溶液中,随后进行脉冲超声波处理,以使颗粒悬浮。然后将密封的容器在干冰/乙醇混合物中快速冷冻,然后将悬浮液冻干过夜。此时,干燥的包被的金颗粒可以在-80℃储存至少三周。在进一步使用之前,将颗粒漂洗三次,在每种情况下用250μl的2.5mM HEPES缓冲液pH7.1漂洗,随后进行脉冲超声处理,然后短暂涡旋,然后离心。将颗粒悬浮在终体积为250μl的HEPES缓冲液中。在DNA结合发生之前,将25μl等分的颗粒转移到干净的反应容器中。为了将未包被的DNA与金颗粒结合,将颗粒进行脉冲超声波处理,然后加入1微克DNA(在5μl不含核酸酶的水中),小心吸取混合物数次,然后在室温下保温10分钟。短暂旋转颗粒,通常为10秒,除去沉淀,加入60μl新鲜乙醇。含有用PEI沉淀的DNA的颗粒在60μl乙醇中洗涤两次。然后将颗粒离心,移出沉淀,之后将颗粒重悬于45μl水中。为了将第二DNA(DNA-2)与其结合,使用沉淀,使用水溶性阳离子脂质转染试剂。将相应于第一DNA与之键合的金颗粒的45μl颗粒-DNA悬浮液进行短暂的超声处理,然后加入5μl的10纳克/微升DNA-2及2.5μl水溶性阳离子脂质转染试剂。该溶液在定轨摇床上保温10分钟,随后以10,000g离心1分钟。随后,移出沉淀,并将颗粒重悬于60μl乙醇中。然后可以将该溶液转移到大载体上,然后使用用PDS-1000装置进行颗粒轰击的标准方案,将第一和第二DNA依次结合的金颗粒转染到感兴趣的分生组织细胞中,使用PDS-1000仪器的颗粒轰击标准方案进行。仪器的标准方案可得自生产商(Bio-Rad)。
在根据本发明的一个实施方案中,用于生产植物、植物材料或植物细胞的方法还包括筛选步骤。在该步骤中,通过实施分析核酸序列的方法,例如通过聚合酶链式反应或探针检测靶区域,确定至少一个本发明的重组构建体的插入、激活和随后的反应是否导致靶核酸区域的期望的特异性修饰。进行这种筛选的方法是关于任何和所有靶植物结构以及靶核酸区域的领域技术人员已知的。然而,目前还没有标准方法能够使gRNA、CRISPR核酸酶或其催化活性片段与感兴趣的核酸靶区域有效相互作用,以检测感兴趣的gRNA对特异性核酸靶区域、特别是植物细胞内的核酸靶区域的在体外筛选方法中的实际功效,以便由此监测使用CRISPR/Cas构建体的时间支出和成本,特别是在高通量方法中。此外,大多数可用的计算机工具(参见https://www.dna20.com/eCommerce/cas9/input)特别用于大肠杆菌、酵母或动物基因组或模型植物,但不适用于重要的单子叶和(wie)双子叶作物植物,其经常与模型植物显著不同,特别是关于基因组区域中的PAM分布方面。
因此,在本发明的一个方面提供了一种体外筛选方法,用于在鉴定gRNA或gRNA编码序列,在体外测定中鉴定gRNA或gRNA编码序列以及CRISPR核酸酶或其催化活性片段适合于靶向修饰植物细胞中的核酸靶区域,所述方法包括以下步骤:(i)提供植物、植物材料或植物细胞的一个或多个核酸靶区域;(ii)将所述一个或多个核酸靶区域插入到至少一个载体中;(iii)提供至少一种gRNA;(iv)提供至少一种CRISPR核酸酶或其催化活性片段;(v)使至少一个CRISPR核酸酶或其催化活性片段与至少一种载体在体外在合适的反应条件下接触,允许gRNA与CRISPR核酸酶相互作用及因此CRISPR核酸酶或其催化活性片段的催化活性,其中在每种情况中将至少一个载体与一个gRNA和一个CRISPR核酸酶或其催化活性片段在单独的反应制备中接触;(vi)分析来自步骤(v)的反应产物;及(vii)鉴定能与特定CRISPR核酸酶或其催化活性片段一起在植物细胞中靶向修饰核酸靶区域的gRNA或gRNA编码序列。
根据本发明的这个方面,术语体外应理解为至少一个核酸靶区域不在其天然环境即植物细胞中,而是首先转移到合适载体中用于该体外筛选。然后可以在短时间内通过这种预筛选生成许多结果,这表明至少一种gRNA与相应CRISPR核酸酶或其催化活性片段相互作用用于靶向修饰完整的植物细胞中核酸靶区域的适合性。以这种方式确定的候选物然后可以以显着更高的成功率在体外和体内,包括在植物中使用。
在一个实施方案中,核酸靶区域的PCR扩增物根据该方面衍生自基因组DNA,其中基因组DNA除核基因组外还包含来自质体例如线粒体和叶绿体的基因组。在另一个实施方案中,核酸靶区域的PCR扩增物根据该方面衍生自植物RNA。
根据本发明的该方面的至少一个载体优选是质粒载体,但是也可以使用本发明揭示的适于克隆和稳定保存感兴趣的核酸靶区域中的PCR扩增物的任何其它载体。在至少一个载体中克隆一个或多个核酸靶区域为本领域技术人员已知。该载体可以理想地包含多于一个的靶感兴趣区域,从而可以分析多个感兴趣的靶区域。或者,也可以提供包含感兴趣的至少一个核酸靶区域的多个载体。
根据这个方面的gRNA必须以活性核糖核酸形式应用,即gRNA可以合成产生及任选也可以修饰。或者,也可以以重组方式产生gRNA,即通过体外或体内转录及任选通过纯化步骤产生。
CRISPR核酸酶或其催化活性片段以氨基酸序列提供。为此可以使用可商购的CRISPR核酸酶或其变体。或者,在另一个实施方案中CRISPR核酸酶或其活性片段可以以重组方式产生,并任选分离和/或纯化,然后用于本发明的体外筛选方法中。
在另一个实施方案中,已提供的CRISPR核酸酶或其活性片段与至少一个效应子结构域结合。关于可能的效应子领域及其潜在的优势和应用领域,因此应用本发明中的相应的早期陈述。通过在体外筛选过程中已经包括效应子结构域/Cas构建体,具有在预测试阶段已经可以分析各个效应子结构域的可能不希望的正向或协同效应的优势,所述效应子结构域对Cas或Cpf1构建体具有空间及化学/物理效应。这还涉及各个效应子结构域的实际应用领域之外的至少一个效应子结构域对gRNA-Cas相互作用以及随后与感兴趣的核酸靶区域的结合和修饰的一种可能的影响。
在合适的反应条件使至少一种gRNA和至少一种CRISPR核酸酶或催化其活性片段在体外与至少一种载体接触。在这种情况下,这些条件应被理解为允许gRNA与相应的CRISPR核酸酶或其催化活性片段结合及gRNA/Cas复合物与感兴趣的靶区域的相互作用及CRISPR核酸酶或其催化活性片段催化活性。了解根据本发明的任何方面揭示的方法和构建体的领域技术人员可易于确定合适的反应条件,例如需要的缓冲液、添加剂和特定的辅因子,包括温度和pH条件,以及必要时的其它添加剂。
根据一个实施方案,根据体外筛选方法以定性方式分析反应产物。根据另一个实施方案,根据体外筛选方法以定量方式分析反应产物。根据另一个实施方案,根据体外筛选方法以定性和定量方式分析反应产物。
在这个方面的一个实施方案中,体外筛选方法是高通量方法,即可以同时检测在单独的反应容器中的一或多个载体上的多个gRNA和/或多个CRISPR核酸酶或其催化活性片段和/或多个核酸靶区域。这种扩大规模对于快速获得关于至少一个靶核酸靶区域的合适的成对gRNA/Cas候选物的多个数据具有特别的优势。或者,哪个gRNA/Cas候选物对特别有效地相互作用的问题可以作为变量进行分析,尤其是在检验新的CRISPR核酸酶或其催化活性片段的应用时。作为进一步的问题,可以检测在将效应子结构域添加到CRISPR核酸酶或其催化活性片段对于gRNA/Cas相互作用或随后的CRISPR核酸酶或其催化活性片段的活性是否有影响。
根据本发明,载体和/或重组构建体可用于通过机械方法,包括颗粒轰击、显微注射和电穿孔,或者通过诱导内吞作用、合适的载体、直接转染等对植物细胞中的靶核酸区域进行特异性修饰。在本发明的一个实施方案中,载体和/或重组构建体是通过颗粒轰击引入靶区域或靶植物结构中。为此,例如将载体首先在金或钨颗粒上沉淀,然后用由此获得的颗粒或者进一步加工的颗粒使用合适的设备轰击靶细胞/靶植物结构。
在本发明的另一个实施方案中,通过显微注射将载体和/或重组构建体直接或间接引入靶细胞或靶植物结构中。
在本发明的另一个实施方案中,载体和/或重组构建体通过喷雾随后摄入,例如在病毒感染期间,或渗入引入靶细胞或靶植物结构中。
根据一个实施方案,载体和/或重组构建体通过颗粒轰击引入分生组织细胞中。该方法适用于将包含双链质粒DNA、线性单链或双链DNA、单链或双链RNA和多肽以及其组合的重组构建体在植物发育的不同阶段引入所有类型的植物分生组织中。金和钨尤其可以用作重组构建体的载体材料。
在本发明的另一个实施方案中,通过显微注射将本发明的载体和/或重组构建体直接引入靶细胞或靶细胞的希望区室中。
根据该另外的实施方案,通过显微注射将载体和/或重组构建体引入分生组织细胞中。这种类型的引入适用于所有类型的分生组织(参见下文实施例2)。另外,使用该实施方案的引入适于引入包含双链质粒DNA、线性单链或双链DNA、单链或双链RNA和多肽以及其组合的重组构建体。
在本发明的另一个实施方案中,本发明的载体通过使用高电压脉冲的电穿孔方式引入。
在本发明的另一个实施方案中,本发明的载体通过胞吞作用被引入,即通过其可将外源性物质摄入细胞的内源性机制。
在一个实施方案中,载体是包含至少一种重组构建体的病毒载体。使用病毒载体引入意味着载体及其包含的至少一个重组构建体可以增殖。根据本发明可以使用或修饰的合适的病毒载体选自但不限于SEQ ID NO:12-15和25-38,还包括与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列。本领域的技术人员了解可以用作病毒载体的天然存在病毒的序列必须对应于待引入的所需重组构建体,以及感兴趣的靶植物结构进行调适。
在另一个实施方案中,通过农杆菌介导的转化,特别是根癌农杆菌或发根农杆菌介导的转化,将重组构建体引入到靶植物结构中。这种类型的引入为各种靶植物以及其各种靶植物结构领域的技术人员熟知。
本领域的技术人员知道引入类型的选择取决于适当的靶植物细胞以及待引入的构建体;因此根据靶细胞的不同,可能需要不同的引入模式。
在本发明的另一个实施方案中,通过上述引入方法的组合引入本发明的载体和/或重组构建体。因此,例如含有至少一种感兴趣的重组构建体的病毒载体可以作为另外的载体借助根癌农杆菌引入到靶植物结构中,或实际上通过颗粒轰击或显微注射引入。
在本发明的一个方面,揭示了用于将本发明的载体和/或重组构建体引入分生组织植物细胞和组织的特殊方法。为了转化或转染分生组织细胞和组织,其可及性是一个决定性因素,其中植物各个发育阶段中各种植物分生组织类型的可及性的差异很大。
在根据本发明的一个实施方案中,提出了提供包含至少一个分生组织细胞的靶植物结构的方法,其中根据本发明的至少一个重组构建体可以被引入到靶植物结构中。作为一个关键步骤,该实施方案的方法包括确保尚未包含分化的分生组织细胞的感兴趣的分生组织结构能够被接近。如果靶植物结构是胚中的分生组织,则必须选择合适大小的植物胚并将本发明的至少一个重组构建体指向更深的、即最内层的分生组织细胞作为靶位,因为外层的分生组织细胞可能已经达到了一定程度的分化,因此不再符合本发明。优选地,选择植物胚的尺寸使得它们具有暴露的分生组织。对于玉米胚,这意味着最大直径小于1.5mm,优选小于1mm、特别优选小于0.7mm、更特别优选小于0.5mm作为最大直径的胚可以有利地用于本发明中。因此,本发明中的分生组织细胞是这样的分生组织细胞,其分化程度仍然允许其在感兴趣的核酸区域的特异性修饰之后从细胞中产生所有期望类型的植物细胞,特别是从中可以直接或间接再生可育植物的那些类型。
在另一个实施方案中,揭示了一种制备包含至少一种分生组织细胞的靶植物结构的方法,其中可以引入本发明的至少一个重组构建体,其中分生组织细胞是幼苗或更老的植物的细胞。
根据该实施方案,分生组织必须完全或几乎完全剖离出来。此外,必须注意的是更深层的,即最里面的分生组织细胞用本发明的至少一个重组构建体靶向转化或转染,因为外层中的分生组织细胞可能已经达到一定程度的分化,因此不再适用于本发明。根据该实施方案,暴露的分生组织经历氧化。为了避免损伤分生组织细胞,优选采用合适的抗氧化保护措施,例如使用抗氧化剂或进一步的保护措施以确保包括至少一个分生组织细胞的靶植物结构的进一步发育。
序列表–自由文本
以下细节以自由文本显示序列表中所提供的细节的德语翻译(数字识别<223>),分别为相应的序列识别号而提供。所有在数字识别<213>下的序列含有“人工序列”相关的信息。
SEQ ID NO:1
<223>VP16包含激活物的序列
SEQ ID NO:2
<223>VP16激活物
SEQ ID NO:3
<223>VP64具有甘氨酸丝氨酸间隔序列的激活物
SEQ ID NO:23
<223>Vector1_TaU6
SEQ ID NO:24
<223>Vector1_ZmU3
SEQ ID NO:41to 48
原型间隔区指导RNA 14,原型区间指导RNA 16,原型区间指导RNA37,原型区间指导RNA 38,原型区间指导RNA 39,原型区间指导RNA 43,原型区间指导RNA 18或原型间隔区域指导RNA 52。
实施例
现在借助于如下非限制性实施例更详细地解释本发明。
实施例1:CRISPR/Cas构建体的产生
所述构建体基于Mali et al,2013的公开产生。启动子特别使用的是针对特定植物启动子并调适为适合于各个靶基因的gRNA。
用于单子叶植物的构建体:
所用的启动子是玉米-Ubi-内含子启动子(SEQ ID NO:7)、玉米U3启动子(SEQ IDNO:10)、小麦U6启动子(SEQ ID NO:8)、水稻U3启动子(SEQ ID NO:9)和短柄草EF1启动子(SEQ ID NO:40)。举例的构建体具有SEQ ID NO:23序列(vector1_TaU6标准)。
用于双子叶植物的构建体:
这里使用欧芹-Ubi4(SEQ ID NO:5)和拟南芥U6启动子(SEQ ID NO:6)。举例的构建体具有SEQ ID NO:24序列(Vector 1_ZmU3标准)。
针对各自的靶基因确定各个gRNA并克隆到上述载体中的相应位置。gRNA序列的位置对应于SEQ ID NO:23和24中表示为“n”的核苷酸。
为了减少必须插入植物中以获得基因组编辑的gRNA的数量,建立了用于测试候选gRNA的体外测定法,以便只有最合适的候选物被插入植物中。
为此,潜在合适的gRNA首先通过计算机分析定义。由于如在说明书的导言部分中所解释的gRNA的双重功能,该定义取决于感兴趣的核酸靶区域,特别是使用的PAM基序以及期望的CRISPR核酸酶或其催化活性片段。
为了测试不同基因的不同gRNA,第一步通过PCR扩增感兴趣的核酸靶区域或其次区域,并将其克隆到标准载体中。在这个意义上的“标准载体”表示可商购的载体或载体系统,其可以通过本领域技术人员已知的方式容易地调试为适合希望的测定的要求,特别是因为它们用作克隆感兴趣的核酸的主链。举例的载体可以选自:pJet(Thermo FisherScientific,Inc.,USA)、pGEM-T(Promega BioSciences,LLC,USA)或pBluescript(Addgene,USA)。这些载体在新开发的体外测定中用作底物。第二步通过体外转录(Invitrogen MAXIscript T7Kit;Cat.No.AM1312M)产生各种gRNA。
随后在体外测定中检测gRNA,并且选择潜在的最佳候选物用于进一步的在植物体中的检测。为此,使用玉米植物A188hmg13基因作为示例的感兴趣的核酸区域(HMG转录因子13;参见来自EnsemblePlants的基因GRMZM2G066528或玉米基因组数据库)。将其通过PCR扩增,并克隆进pJET1.2的多克隆位点,首先是包含外显子3-5(hmg-fw4和hmg-432,见图14)的部分,其次是hmg-3'部分(hmg-fw3和hmg-re1,见图15)。之后,通过用PvuI消化使质粒线性化,并且为了防止再循环,将载体骨架去磷酸化。将所得产物应用于制备的凝胶上。随后,测量所得线性化载体的浓度。对于典型的分析,使用3μl的30nM载体作为Cas消化的底物,在每种情况下进行至少三次。将待测试的gRNA变体克隆到载体pEn-嵌合体中(参见例如关于gRNA14的图16)。按照分子生物学中的标准方法进行该载体中的克隆,这将在下面举例说明。来自pEn-嵌合体的序列位于SEQ ID NO:59中。RNA嵌合体位于其上,其可以通过Bbsl+Oligo相对容易地指定。随后,可以通过入口LR反应将其移至pDe-CAS9中。RNA嵌合体受启动子AtU6-26控制。然后将所得载体用NcoI和XbaI消化,其中所得的片段包含感兴趣的gRNA。将希望的包含gRNA的片段通过常规方法经凝胶分离、提取并洗涤。对于测定,将1μg所得片段用作模板进行体外转录(Invitrogen MAXIscript T7Kit;Cat.No.AM1312M)。举例的制备物包含:10μl模板(1μg);2μl的10×转录因子(Invitrogen);1μl的10mM ATP;1μl的10mMCTP;1μl的10mM GTP;1μl的10mM UTP;2μl的T7-RNA聚合酶(Invitrogen);4μl的H2O。将制备物正常在37℃保温2小时。加入H2O以获得100μl的体积,并且根据制造商的说明书(QiagenRNeasy Kit)纯化RNA。洗脱后(用50μl H2O洗涤两次),确定所得RNA的精确体积和浓度。对于进一步的分析,使用15ng/μl的体外转录物,因此使用长度为140个核苷酸的RNA需要300nM。随后,如下进行体外消化:反应制备物的体积通常为30μl。为了确保最佳的裂解效率,重要的是保持Cas9和gRNA与各自的核酸靶区域的摩尔比为10:10:1或更高。首先,提供300nM的各个待测gRNA。另外,为每种情况提供30nM底物DNA,每种情况下包含单个核酸靶区域。如下顺序组合反应制备物:
然后将其小心混合并短暂旋转,然后将制备物在37℃下再孵育1小时。任选地,可以通过加入1μl酶并在37℃孵育15-30分钟进行蛋白酶K的处理。在这一点,可以进行片段分析。
图8中列举了10个选择的gRNA例如与Cas9核酸酶相互作用的结果。从这些结果清楚地看出,各个gRNA与配对CRISPR核酸酶关于感兴趣的核酸靶区域裂解效率方面存在定性和定量差异。
用来自除了化脓链球菌(S.pyogenes)之外的来源的CRISPR核酸酶和具有至少一个点突变的Cas核酸酶,例如Cas切口酶进行进一步的实验(数据未显示),以便在体外测试这些其它Cas核酸酶在与相应的gRNA相互作用对植物核酸靶区域的效率。此外,进行了第一次成功的体外实验,示出已经在预筛选中鉴定的感兴趣的成对的Cas核酸酶gRNA也适用于靶向修饰RNA以及植物线粒体或质体DNA的,如通过该测定的广泛应用范围而证明。
为了测试该方法对于其它重要作物植物的广泛适用性,使用衍生自其它作物植物例如甜菜、欧洲油菜和高粱的核酸靶区域同样进行新的体外筛选方法。
为此,由于植物基因组的特异性,有必要进行新的计算机分析,以便能够确定合适的靶区域,从而确定合适的gRNA。此外,在该方法的开发框架中,使用了其它Cas核酸酶、切口酶、Cpf核酸内切酶及其衍生的酶活性片段,其另外携带效应子结构域。此外,可选的Cas蛋白或具有点突变的Cas蛋白也可以用于该测定中以检测不同Cas蛋白的效率。特别是与测试的gRNA直接相互作用。
这是为了解决许多问题:(1)哪种gRNA表现出特别高的活性?(2)gRNA中的修饰有哪些影响,如不同长度的前间区序列或错配?(3)哪些Cas蛋白与哪些gRNA最好地整合?(4)哪种CRISPR核酸酶,即Cas核酸酶或Cpf1核酸酶,或CRISPR核酸酶中的哪些突变对酶的酶促作用有影响?(5)效应子结构域的结合及从而产生更具空间需求的Cas构建体是否影响与所讨论的gRNA的相互作用,从而影响感兴趣的核酸区域的靶向修饰的效率?在进一步的一系列实验过程中,迄今为止已经确定特别是CRISPR核酸酶在其催化活性最小片段上的减少对于靶向裂解效力是有利的。而且,已经发现效应子结构域可能与CRISPR核酸酶或gRNA结合。特别是在这此体外筛选是必不可少的,因为这些修饰的CRISPR核酸酶或gRNA的效力由于效应子结构域的较高的空间需求而较低,导致检测到Cas难以与gRNA相互作用。尽管如此,仍然鉴定出了有效的Cas-gRNA效应子结构域对。
令人惊讶的是,发现体外预试验即筛选的结果也与其在后续试验中的功效相关。
在进一步的测试中,图8中示出的所有gRNA关于其在植物分生组织中实际的定点修饰中的效力进行测试。结果,体外试验证明对于评估所使用的gRNA的效力是理想的,因为不是所有使用的gRNA都导致模板中的体内或体外裂解。具体而言,已经证明在体外筛选测定中使用成对的Cas-gRNA特别有效,该效率在随后使用植物材料的在体外或体内检测中也证实。玉米植株作为这些后续研究的起始植物,靶基因hmg13特别作为靶起作用。
实施例2:引入CRISPR/Cas构建体
将实施例1中描述的构建体使用各种方法引入分生组织。其基础是分生组织的可及性;所用材料决定了所用的各种方法(见实施例4)。
采用了以下方法:
-颗粒轰击:
颗粒轰击可用于所有使用的分生组织。用ds质粒DNA、线性dsDNA、RNA和蛋白质以及病毒颗粒进行轰击。例如,金和钨可以用作载体材料。借助于红色荧光蛋白进行胚分生组织(图5)和雄穗分生组织(图7)的测试轰击;示出通过颗粒轰击可以将DNA引入这些细胞。因此,要观测的重要事情是根据各自的材料使用合适的轰击设置。因此,较高的轰击可能导致瞬时转染的增加(参见图9关于这方面的图像),但是例如强烈破坏胚也使得无法萌发和发育。因此,根据作为靶结构的感兴趣的植物材料,为了将颗粒轰击的适当条件调整到各个实验的相应要求,需要进行一些初步的工作。
因此,必要的是对于使用的植物材料以及在不损害植物组织或破坏待插入的构建体的预期效果(瞬时插入对稳定插入)确立合适的轰击方法。
显微注射:
可以对所有的分生组织进行显微注射,最好使用带有显微操作器的显微镜。由于某些分生组织结构例如制备的雄穗和雌穗分生组织的大小,显微注射也可以通过显微镜监测进行。可以使用各种方法进行注射,并且如上针对颗粒轰击(实施例1)所述用不同的分子进行。一方面,将液体溶液中的ds质粒DNA、线性dsDNA、RNA和蛋白质通过微型或纳米套管注射进分生组织细胞中,另一方面,将ds质粒DNA、线性dsDNA、RNA和蛋白质以及病毒颗粒用于微针或纳米针,并通过针刺移至分生组织细胞中。
该技术的进一步发展包括使用碳化硅(SiC)晶须(例如Silara碳化硅晶须)和显微注射的组合。由此将ds质粒DNA、线性DNA、RNA、蛋白质或病毒颗粒沉淀在碳化硅上,并通过显微注射插管将其注射到分生组织中。
这提供了不仅可以转染一个分生组织细胞的优点,而且通过晶须的分布可以平行地穿透许多细胞。因为没有必要用套管穿透细胞且晶须明显较小,所以对细胞的损伤较小。
维管穿刺感染/接种(VPI):
“维管穿刺感染”或接种是在Benavente,2012(Virus-Induced Gene Silencingin the Diverse Maize Lines Using the Brome Mosaic Virus-based silencingvector)和Louie,1995(Louie R,1995.Vascular puncture of maize kernels for themechanical transmission of maize white line mosaic virus and other viruses ofmaize.Phytopathology 85:139-143)中描述的一种方法,用于将病毒、病毒颗粒、农杆菌和裸露的DNA引入完整的玉米籽粒中。这种技术能够在胚和分生组织附近靶向插入。它提供了不需要预备步骤的优点,并且可以立即使用发芽的种子。这导致对组织的损害最小,并且对植物发育只有轻微的破坏。该方法已被如下修改和实施:将含有感兴趣的核酸靶区域的种子在30℃水中浸泡4小时。然后将种子在室温下在湿毛巾中温育过夜。随后,将质粒或质粒混合物或感兴趣的病毒移液到载有胚的种仁侧上。通常,制备100μl质粒混合物,浓度为每种质粒37.5μg/100μl或1.5μg/4μl。使用开槽工具,将接种物沿着胚在盾片中朝向维管束移动1-2mm。将保留的针以45°的角度插入待处理的籽粒表面。在距离胚1mm处进行两次接种,以避免伤害胚。然后这些接种留在种仁上。
实施例3:玉米幼苗和/或胚的瞬时分生组织转化/分生组织的本发明处理
各个阶段对分生组织的可及性差异很大。因此,在胚中(图1和2),分生组织相对容易接近,只要使用合适大小的胚即可。重要的是转化分生组织更深层的细胞,因为上层细胞已经经历了一定程度的分化并且不再适合。图10和11显示了玉米胚的两个视图,以及由星号表示的分生组织的位置。最初,这些数据通过荧光标记可见。由此可见,通过提供新方法可以靶向植物分生组织细胞和组织。结果,获得了将核酸结构例如载体以及特别是RNA和氨基酸插入植物靶细胞中的新方法。应用范围包括用于植物细胞靶向基因工程修饰的许多可能的构建体,例如CRISPR/Cas构建体、病毒载体、RNAi构建体等,以获得在植物细胞的核酸靶区域中的靶向敲入、敲除或者靶向点突变。
幼苗和较老的植物中的分生组织必须被完全剖开,因为它们已经被如此多层的组织所包围,使得它们不能被轰击或显微注射。图3和4显示了可以用于转化的制备的分生组织。在这里,对于胚分生组织,上层细胞已经经历了一定程度的分化,不再适合。因此,必须转化分生组织内部的细胞。暴露的分生组织可以水平和垂直轰击。在详细的研究中发现,通过垂直轰击,合适的分生区域的命中率显着增加(见图11和图12)。这再一次表明,尽管颗粒轰击是已知且已经确立的方法,但是其有效应用仍需要针对在特定植物组织转化中的特定问题优化各种参数(插入的构建体、待转化的材料的形状和阶段、压力、方向等)。
由于分离的分生组织是游离的及因此暴露在大量的氧化作用下并导致死亡,因此其被用抗氧化剂处理以使幼苗发育成植物。
为了使雄穗分生组织可接近,开发了一种尽可能少地损害植物和分生组织的方法。为此,在雄穗分生组织层面,通过叶片切开一种窗口(图6)。这确保了叶子不会死亡,且植物可以进一步完全正常发育,并且分生组织仍然可以受剩余叶子保护。另外,分生组织很快(在几小时/几天内)向上移动,由此其被再次完全保护。这降低了分生组织氧化并因此而死亡的可能性。这种方法有可以确保几乎正常的花发育,并获得用于自交或授粉的花粉。这提供了已经可以从植物中获得以靶向修饰的生殖细胞的益处,使得冗长的体外培养步骤变得不必要。
然后使用上述方法进行转染(参见实施例2)。
栽培萌发的胚和植物使其自花授粉并收获。使用幼苗和成熟植物也获得相似结果,不需要萌发。
实施例4:成功特异性遗传修饰的检测
可以使用不同方法在不同时间检测:
靶核酸区域的希望的特异性修饰的存在可以在幼苗、发育中的植物和花粉的早期阶段分析,从而可以获得成功突变的迹象。然而只有当分析自花授粉的后代时获得明确结果,因为这些提供了遗传突变的证据。
-富集PCR:
这种方法适用于限制酶位点被特定突变破坏的情况。在这种情况下,分离的基因组或染色体外DNA用酶消化,所述酶在该位点切割使得野生型DNA被裂解。接下来,使用位于基因组上限制酶位点上游或下游的引物进行PCR。在理想情况下,当发生突变并且在该位点不切割DNA时,仅获得一种产物。因为通常地,基因组或染色体外DNA的消化不是100%消化,所获得的PCR扩增材料然后用酶重新消化,以确定突变已经发生并且限制性酶位点已经被突变。然后将未消化的片段克隆并测序,以便对突变进行精确分析。如果核酸靶区域是RNA,则可以在进行富集PCR之前使用本领域技术人员已知的方法首先将其转录成DNA。
-测序
如果不可以进行富集聚合酶链反应,则使用下一代测序(NGS)策略对特定区域进行测序,并检查获得的序列的突变。
-全基因组测序(WGS)以鉴定脱靶效应:
为了排除不需要的突变的可能性,对具有希望突变的候选物进行WGS。
另外的分析通过使用特异性PCR和qPCR系统证明没有(Abwesenheits-Nachweis)所使用的构建体和病毒组成。
实施例5:病毒载体
病毒的优点是其可以作为完整的病毒颗粒以及DNA或RNA被引入到靶植物结构中。通过实施例2中列举的输送方法实现病毒的插入。通过这些方式,获得进入感兴趣各个分生组织靶区域的靶向插入。
另外,病毒提供了在细胞中繁殖的可能性。先决条件是这个功能并没有通过修饰RNA/DNA序列而被破坏。这具有如下优点:首先,分生组织不必被直接感染,或者仅感染少数细胞就足够了,尽管如此还是会发生几种类型细胞或组织的增殖。
在本申请中,除了实施例2中描述的输送方法之外,还存在用于插入病毒或病毒颗粒的其它可能性。
将病毒颗粒、病毒的体外转录物或携带病毒的编码T-DNA的农杆菌通过将其摩擦或通过渗透(用和不用真空)插入到叶中,以产生原发感染。然后通过系统扩散感染相应的靶细胞和靶组织。
此外,具有高滴度植物病毒的植物汁液用于感染。为此,用病毒感染烟草或菠菜,随后分离含有病毒的植物汁液分离并用于感染玉米植物。
除了广泛的感染可能性和扩散能力之外,DNA病毒还具有提供用于同源重组(HR)的DNA模板的优点。在这种情况下,在引入双链断裂之后,通过在一个或多个细胞内病毒的复制以提供大量的模板用于同源重组。结果,模板片段的同源重组和掺入以更高的频率发生。
在一系列检测中,不同的BMV(见SEQ ID NO:25-31或者DSMZ申请号:BMV Virus-Inoculum:PV-0945;reference for BMV plasmids(C13/F1+F2&C13/F3-13m):Benaventeet al.,Maydica,Vol.57,No.3(2012):“Virus-Induced Gene Silencing in DiverseMaize Lines Using the Brome Mosaic Virus-based silencing vector.”)和BSMV(包含选自如下的至少一个序列:SEQ ID NO:32-37或者DSMZ申请号:BSMV Virus-Inoculum:PV-0330;Reference for BSMV plasmids(pCaBS-a&pCaBS-b&pCa-gbLIC):Yuan,C.,et al.,(2011).PLoS One 6(10):e26468:“A high throughput barley stripe mosaic virusvector for virus induced gene silencing in monocots and dicots.”)、病毒颗粒、质粒或者质粒混合物因此被插入感兴趣的植物或者植物细胞中。其中,用相应的病毒、质粒或质粒混合物感染本氏烟、玉米A188、玉米Va35和菠菜(Spinacia oleracea)。使用摩擦接种、维管穿刺感染/接种或农杆菌传递的转化。
对于摩擦接种,制备含有相似浓度的不同质粒的DNA质粒包被用于初次接种。举例来说,每种质粒以6μg/μl的浓度使用。然后以相同体积比混合相同浓度的不同质粒。对于每片叶子,将6μl质粒混合物滴加到其上已经分布有碳化硅的叶片表面上。然后用手指摩擦使质粒混合物进入叶的表面。或者,可以使用感染了病毒的植物汁液作为原料。对于第二次接种,将感染了病毒的新鲜或冷冻植物叶子在匀浆器中研磨,并将所得粉末/产物溶解在3-4ml接种缓冲液(在500ml去离子水中的0.2406g KH2PO4+0.543gNa2HPO4)。此时,将少量碳化硅加入质粒混合物或植物汁液中。通过摩擦将质粒混合物或植物汁液引入叶子的上表面和下表面,其中这是通过将一个或多个手指浸入接种物中然后小心地将接种物小心地施用至至少一片叶子来实现的,其中叶子是最好由另一只手支撑。摩擦接种也可以与先前对植物叶片的损伤(切口)相结合,其中首先用解剖刀在叶片中产生切口,然后直接在损伤的叶片中进行摩擦接种。
对于由农杆菌(Ab)传递的转化,首先将Ab培养物在含有合适的抗生素、10mM MES和200μm ACE的30ml液体LuriaBroth中于28℃培养过夜。第二天,将过夜培养物以4400rpm离心15分钟。移出沉淀,然后将菌体(Pellet)以4400rpm再次离心2分钟。移出剩余的沉淀,将菌体重新悬浮于重悬浮介质(5ml H2O,10mM MES,10mM MgCl2+20μM ACE)中。使用重悬浮介质将悬浮液的光密度OD600调整到1.5。然后将稀释的Ab悬浮液在室温下保温4小时。然后,Ab悬液的渗透优选发生在感兴趣叶片如本氏烟叶片的下表面,其中通常每株植物接种2片叶子。
下面的表2示出使用不同的转化方法的所选病毒和植物物种的示例结果:
表2:病毒感染实验概述(WpI:感染后周数)
表2中的白色背景表明,对于该实验可以获得系统性感染。浅灰色背景表示局部感染,深灰色背景表示低感染率。
从ELISA或通过RT-PCR获得成功感染的证据。
实施例6:2-gRNA策略
为了靶向扩散基因组DNA及通过使用CRISPR核酸酶从基因组特异性切除感兴趣的核酸靶区域,确立所谓的2-gRNA策略(参见图17A和B)。如图17A所示,首先为此分离基因组DNA,并用感兴趣的限制酶(RE)消化,其裂解位点位于感兴趣的PCR产物内。可以使用可以在两个gRNA靶区域之间裂解的任何RE。以这种方式,由于gRNA靶区域之间的区域不再存在,所以发生潜在编辑的DNA的积聚,并且所选择的限制酶不能裂解该DNA。随后,利用结合两个gRNA靶区域的上游和下游的引物进行PCR扩增,即其可以通过杂交在合适的反应条件下积聚。如有必要,可以使用巢式引物组进行更新的Re-PCR。编辑成功后,所得PCR产物比未编辑的DNA产物要小(见图17B)。图17B中的图示示出在对玉米植物的基因组DNA使用2-gRNA策略后的编辑分析结果。从玉米植株中分离基因组DNA,用PCR扩增靶基因hmg13-基因(HMG-转录因子13;GRMZM2G066528)。未编辑的HMG转录因子13基因的序列在SEQ ID NO:60中示出。
SEQ ID NO:60的核苷酸位置1-98和SEQ ID NO:60的核苷酸位置912-1023对应于在成功编辑后保留的hmg基因区域。SEQ ID NO:60的核苷酸位置82-101和SEQ ID NO:60的核苷酸位置909-928是各gRNA靶区域。
图17B示出使用100V的标准参数在1%凝胶中分离的结果以及通过用溴化乙锭获得的具有不同对比度水平的荧光观测结果。第1列和第2列示出未编辑的玉米植株的结果,第4列显示成功编辑后的结果。由于两个gRNA靶区域之间的区域已被切除,因此PCR产物较小。这种方法因此代表了快速而有效的实验确认基因组编辑的一个策略。
SEQ ID NO:61示出用2-gRNA策略hmg13编辑后小PCR产物的测序结果。通过SEQ IDNO:61的位置98和99处的两个碱基C和T之间的靶向编辑发生缺失。
实施例7:烟草中的基因组编辑
选择NbTTG1作为本氏烟的基因组编辑工作的靶基因,其直系同源基因在功能失调时在拟南芥中导致毛状体表型。针对相应的拟南芥基因AtTTG1(AT5G24520)描述了突变体:
-ttg1(EMS-突变体):叶表面和茎上没有毛状体。
由于不存在棕色色素而产生的黄色种子。
-ttg1-13(快中子突变体):无毛状体,透明的种子外壳,根毛的数量增加。
通过序列比较鉴定本氏烟中直向同源基因,并通过PCR扩增基因组基因座。有关的部分如图18所示。如上所述,基于该序列选择适当的gRNA。用于基因组编辑的组分通过TRV(烟草脆裂病毒)引入植物(参见下文实施例8)。上文实施例6中概述的2-gRNA策略在此也用于分析成功的编辑。
如下表3所示,通过两种gRNA的不同组合可以在NbTTG1基因中产生不同大小的缺失。Cas9核酸酶用于该检测,但该方法可用于任何CRISPR核酸酶。
表3
gRNAs 缺失
gRNA1+gRNA4 232bp
gRNA2+gRNA4 216bp
gRNA3+gRNA4 206bp
gRNA4+gRNA5 446bp
gRNA1+gRNA3 25bp
实施例8:由烟草脆裂病毒(TRV)传送的本氏烟中CRISPR-Cas的表达
对于烟草的叶片接种,首先将农杆菌(Ab)培养物在28℃下在30ml含有选择性抗生素的液体LuriaBroth(LB)培养基中培养过夜。第二天,过夜培养物以4400rpm离心15分钟。弃去沉淀,将pellet再次以4400rpm离心2分钟。弃去剩余的沉淀,将pellet重新悬浮于5ml重悬浮介质(10mM MES,10mM MgCl2,20μM ACE)中。使用重悬浮介质将悬浮液在600nm处的光密度(OD600)调整到0.8。然后将稀释的Ab悬浮液在室温下保温4小时。随后用注射器或套管在感兴趣叶片如本氏烟叶片的下表面渗入Ab悬液,其中通常接种每株植物的3片叶子。为了使TRV的系统传播效力可见,用RFP/pTRV2(红色荧光标记+TRV作为病毒载体)接种叶片及用pZFN-tDT-nptII作为对照。如图19所示,可以在直接接种的叶片中以及在未接种的远端叶片(最初的红色荧光在图19中用浅色和/或白色区域指示)中检测到清晰的RFP荧光。
构建体pZFN-tDT-nptII作为对照,其仅允许在接种叶中表达RFP,而不在远端叶中表达。
此外,已经证实甚至通过这些TRV方法可以激活分生组织,允许通过特定的CRISPR方法对这种类型的组织进行靶向修饰。为此,将本氏烟植物用TRV感染,其中所述构建体包含编码红色荧光蛋白的基因,例如tdT等。通过用适当的方式(荧光显微镜,双目)检测红色荧光,可以确定TRV在植物中位置。在此使用具有高强度的荧光标记可以是有利的,因为这些标记也可以在较深的组织层中容易地检测到。图20A至H示出花分生组织、花蕾、雌蕊或者具有暴露的子房的制备的雌蕊的图像记录。所有的图像都证实荧光标记在相应的植物分生组织细胞或组织中作为靶结构的成功表达,从而证明了所选择的插入方法的效力。
最后,通过标准双抗体夹心(DAS)ELISA在接种和未接种的烟草叶中定量TRV效价。为此,从待分析的每种植物收获10-12dpl叶材料作为ELISA的起始材料,其中对于每种植物,产生以下混合物样品:(i)来自两个TRV接种的叶的混合物样品;(ii)来自两个未接种的叶的混合物样品。压榨收获的叶材料,并将收集的植物汁液以1:50的稀释度用于DAS-ELISA。使用兔多克隆抗血清进行DAS-ELISA。所述抗血清得自Loewea公司,并标记为“Tobacco Rattle Tobravirus Broad Range TRV”(目录号07152S)。通过OD405的光度测量,在应用底物4-硝基苯基磷酸酯60分钟后,进行ELISA的评估。以这种方式,在如下接种的本氏烟中量化TRV效价:(i)pTRV1(=阴性对照);(ii)pTRV1+pTRV2-tDTco(=阳性对照)及(iii)pTRV1+pTRV2-Cas9。结果如图21所示。
实施例9:CRISPR工具的定量
举例来说,通过RT-PCR检测Cas9转录物。为此,从待分析的每个植物收获10-12dpl叶材料作为ELISA的起始材料,其中为每种植物产生以下混合物样品:(i)来自两个TRV接种叶的混合物样品;(ii)来自两个未接种叶子的混合物样品(参见实施例8)。首先,使用RNeasy Mini试剂盒(Qiagen)从收获的叶片材料中提取RNA。在每种情况下,使用REvertAidH Minus First Strand cDNA合成试剂盒(Thermo Fisher Scientific)将500ng RNA随后转录成cDNA。该cDNA在随后的PCR中用作模板以检测Cas9。使用Cas9特异性引物。
从转基因玉米植物的叶材中制备蛋白质提取物,并在4%-20%SDS-PAGE梯度凝胶上分离。用来自ActiveMotif的单克隆抗体(目录号61577)检测160kDa Cas9。这个检测系统的文件如图22所示。
为了定量RNA并确定是否发生通过亚基因组启动子传递的gRNA的表达,建立基于SYBR绿色的定量RT-PCR系统。当以相同PCR效力扩增时,可以通过比较gRNA量与病毒蛋白质的转录水平进行量化。该系统如图23所示,例如使用雀麦草花叶病毒(BMV)。
实施例10:病毒表达系统
除了上述病毒载体之外,本发明的CRISPR工具和方法同样可以经病毒引入其它植物系统中。取决于感兴趣的靶植物、转化的类型以及将被感染的靶组织,可以使用不同的方法。
Ugaki et al.(1991,Nucleic Acids Res.,Replication of a geminivirusderived shuttle vector in maize endosperm cells)的系统适用于玉米胚乳细胞作为主要靶结构。利用小麦矮小病毒(WDV)作为载体,因此通过玉米胚乳培养物的原生质体转化可以获得感染的培养物。为此,使用经修饰的病毒,其携带新霉素磷酸转移酶基因II(nptII)代替外壳蛋白(CP)。根据Matzeit et al.(1991,Nucleic Acid Res.,19(2),371-377)的方法,以小麦矮小病毒为荷载的瞬时复制系统可用于小麦靶植物。由此转染来自小麦悬浮培养物的原生质体。病毒的CP基因再次由感兴趣的标记基因取代。
此外,可以使用基于玉米条纹病毒的系统,这是本领域技术人员已知的并且在Palmer&Rybicki(2000,Archives of Virology,146(6),1089-1104)中描述。将三天龄的幼苗在胚芽鞘节点感染,及可以获得感兴趣的重组构建体的瞬时表达。通过置换病毒CP和MP基因,可以防止病毒的系统扩散,从而仅感染前两或三片叶子。
如上所述,大麦条纹花叶病毒(BSMV)也适合作为病毒载体。对BSMV基因组进行集中转化以确立已知的植物原生质体载体(参见Joshi et al.,1991,EMBO J.,9(9),2663-2669)。根据Joshi et al.,1990所述,该载体携带萤光素酶(luc)报道基因,适合玉米和烟草原生质体的原生质体转染。
BSMV(见Manning et al.,2010,New Phytologist,187(4),1034-1047)、WDV、小麦线条花叶病毒(WSMV)(Choi et al.,2000,Plant J.,23(4),547-55)、番茄黄化曲叶病毒(TYLCV)(Peretz et al.,2007,Plant Physiol.,145(4),12514-1263)和雀麦草花叶病毒(BMV)(French et al.,1986,Science 231(4743),1294-7)也适合作为用于在小麦、大麦和烟草中转染原生质体、幼苗、叶柄和其它植物细胞或组织的系统,如在参考文献中全面描述。具体而言,BSMV载体(参见上述Manning et al.,2000)适合以修饰形式作为载体用于病毒诱导的基因沉默。为此,通过抑制病毒外壳蛋白的表达,通过定点诱变修饰BSMV基因组。关于此,TYLCV(见上文Peretz等,或EP 2 436 769A1))被弱化,并且可用作植物的病毒穿梭载体,以及大肠杆菌已经在病毒外壳蛋白中缺失,所述序列包含在该基因的N-末端附近60个碱基对。
基于病毒载体的甜菜转化的具体方法同样是已知的。为此,适合的是甜菜曲顶病毒(BCTV)(Kim et al.,Plant Mol.Biol.,2007,64(1-2):103-12)、甜菜黄化病毒(BYV)(Prokhnevsky et al.,Molecular Biotechnology,57(2),101-110,2015)、甜菜土传花叶病毒(BSBMV)(Dach et al.,2015ASSBT proceedings conference transcript,47thannual meeting of the work group,Virus Diseases of Plants”,Section C)或甜菜坏死黄脉病毒(BNYVV)(Hamza et al.,2015,ASSBT论文集)。这些载体不仅适合作为甜菜的载体,而且适用于其它双子叶植物,例如,菠菜。
许多方法同样可用于作为模式植物的烟草,通过病毒载体进行转化。这些方法中的许多基于农杆菌渗入。合适的病毒包括烟草花叶病毒(TMV)、马铃薯病毒X(PVX)、豇豆花叶病毒(CPMV)、豆黄矮病毒(BeYDV)、李痘病毒(PPV)(参见Gleba et al.,2014,or Slazar-Gonzalez et al.,2015,Plant Mol.Biol.,87:203-217)。此外,已经描述了多种其它系统,例如使用卷心菜叶卷曲病毒(CaLCuV)(Yin et al.,2015,Nature Scientific Reports,5:14926,2015)、烟草脆裂病毒(TRV)(Ali et al.,2015,Genome Biology,16:238)或烟草黄矮双生病毒(TYDV)(Dugdale et al.,2014,Nat.Protoc.,9(5),1010-27)作为病毒。
以上的所有载体均含有用于引入感兴趣的靶基因的克隆位点。也可以通过可用的诱变方法将特异性裂解位点容易地引入感兴趣的病毒基因组中。
实施例11:对植物进行开窗的优化方法
为了进一步优化CRISPR构建体的靶向引入以及因此基因组编辑的效果,进一步改进了上面实施例3中概述的方法。最初的方法包括用一个封闭物例如特殊的薄纸封闭人工插入的窗口。然而根据暴露情况而存在一些缺点,受伤的和暴露的植物组织可能更容易被真菌感染,或暴露的雄穗部分、被轰击的部分与空气更多接触,这可能导致暴露的雄穗结构或未成熟的花及因此各个雄穗分支的干燥。出于这个原因,在第一步中将如上所述转化的暴露的雄穗组织用润湿的棉垫或棉纸覆盖。因此,尽管这种方法仍然容易发生真菌感染,但可以显著降低干燥。为了解决这个问题,将蜡或凡士林样物质应用于受伤部位(转化后)。测试了多种物质,包括凡士林、天然蜡与凡士林的混合物及为愈合伤口、特别是用于树木的其它市售产品。这种方法为本领域、特别是嫁接领域的技术人员已知。
另外,受伤部位用特殊的嫁接胶带包裹,显著改良伤口的闭合性,从而防止真菌感染,使转化的分生组织完全成熟。使用这个策略,转化形式的大多数雄穗可以成熟。由此获得75%或更高的成功率,即暴露的和转化的雄穗组织能够长成至植物完全成熟。
实施例12:农杆菌注射
为了进一步扩大可能的应用领域的广度,对实施例3中概述的方法进行修改,由此不使用颗粒轰击,而使用由农杆菌(Ab)引起的转化。在初步测试中,首先测试未成熟的雄穗组织对于Ab的易感性。为此,将红色荧光蛋白在预先分离自植物的未成熟的雄穗组织中进行体外转化。在分离的时候,植物处于V6-V7阶段,雄穗长约2-3厘米。将Ab设定OD600为1.0,将穗与Ab悬浮液保温10分钟。感染后两天观测红色荧光。在穗中观测到许多红色荧光点,证实了Ab浸润对于雄穗组织转化的适合性。在下一步中,使用V6-V7阶段的植物,如上所述在未成熟的雄穗组织区域中对植物开窗。将含有红色荧光表达构建体的Ab以OD为0.7直接注射到穗组织中。将大约100-200μl的Ab悬浮液注射到每个雄穗中。开窗顺序以及Ab注射顺序如图24所示。
此时,如上所述将雄穗用凡士林/石蜡覆盖,并在注射后两天监测红色荧光的发展。为了抑制Ab的过度生长,在初次注射后2-7天将抗生素溶液施用于感染组织。处理后的穗能够长成成熟,进行自花授粉。T1代的分子学分析证实成功的转化。由此证实,在植物体中的方法适于在植物体中转化分生组织细胞,而不损害雄穗的进一步发育,由此所得花粉可以直接得自植物,而不需要漫长的(体外)培育过程,并且可以直接用于授粉。
实施例13:对不同玉米基因型的适用性
针对不同的玉米基因型,特别是A188、Va35和A632,测试上述雄穗转化实验。对于每个基因型,其中雄穗组织可以转化的植物生长阶段是不同的。然而这很容易确定。例如,在A188中,所述阶段是V6-V7,而A632在V7到V9阶段被靶向。在所有这些基因型中都有可以合适的方式暴露雄穗,即可以对植物开窗而不损害其或穗组织,并可以获得成熟的产生花粉的花药。
实施例14:胚分生组织轰击
为了进一步优化本文所述的方法,确立所谓的胚分生组织轰击,其允许直接从未成熟胚有效地获得植物,而不需要耗时且易于污染的细胞培养物作为中间步骤。为此,对基因型A188和A632以管道模式对胚分生组织区域进行颗粒轰击。用CRISPR/Cas9构建体和表达红色荧光蛋白的质粒一起轰击大约100个胚(图25A)。在轰击后一天观测荧光发展(图25B)。许多胚显示出荧光,因此成功和功能性地引入了CRISPR构建体。使用成功转化的胚继续工作。发芽后,在分子水平上分析了25%的植物。在温室中使所有其它荧光阳性植物成熟。一旦植物到达繁殖阶段,从雄穗和雌穗中取出样品,并检验CRISPR/Cas9活性。例如,当通过PCR鉴定成功的结果时,将植物用于自花授粉,并且同样分析所得子代。
以这种方式产生的植物产生两种基因型的种子,并且是可育的。虽然可以通过这种方法毫无困难地生产出可育的植物,但是这些植物呈现出较慢的生长速度和略弯曲的生长(图25C),其花粉可以直接用于进一步的实验。因此,这种类型的转化也是在感兴趣的分生组织或细胞中快速及有效地引入CRISPR构建体或者得自其的基因组编辑的一种非常有效的方法,然后能够直接获得并进一步使用来自该组织的生殖组织。
实施例15:在不同类型植物中接近分生组织
如上所述,希望的是针对各种不同植物产生植物原位转化,并将其与本文公开的方法组合,从而可以通过CRISPR系统获得许多分生组织靶结构的靶向修饰。具体地,将感兴趣的CRISPR构建体瞬时插入植物分生组织靶结构是很令人感兴趣的,因为这将允许对感兴趣核酸靶区域的靶向修饰,这种修饰而非CRISPR构建体本身随后可以传递到进一步世代中。
可以在植物原位发育成繁殖器官的组织是有限的。最重要的是苗分生组织。这种分生组织由一组细胞限定,其可以分化成所有营养器官和细胞,以及高于地面的繁殖器官。其由有限数目的可以(重)编程的细胞组成,以便自身分化成所有植物器官。这种分生组织正常具有圆顶形状(Kuppelform)。细胞的外层称为L1层,形成所有表皮组织的基础。分生组织的内层(L2和L3)形成器官的其余部分,因此是用于本发明目的的感兴趣的靶。分生组织是在胚发育非常早期形成的。在营养生长后,分生组织发育成花分生组织以便产生植物的繁殖器官。可以产生修饰的繁殖器官的组织是:(1)胚的苗分生组织,(2)小植物或营养阶段的植物的苗分生组织,及(3)花分生组织或花序。
当这种组织的遗传信息被非病毒方法(基因枪、显微注射、农杆菌等)修饰时,可能的情况是不是所有这些分生组织的细胞均以靶向方式被修饰。因此,一些分化的植物器官被修饰,一些保持野生基因型。以此方式获得嵌合体。
各种不同谷物植物的靶向操作的一种替代方法是转化小孢子(未成熟花粉)或花粉粒。这些组织随后可以被用于授粉其它植物,获得修饰的后代。在参考文献资源中仅有少量例子,大部分是插入基因的轰击和瞬时表达分析(Twell et al.,1989,Obert et al.,2008)。
然而,已进一步开发技术允许小孢子或花粉以靶向方式成熟,并且通过后续授粉而获得修饰的后代。这些技术的方法对于各种作物植物是非常类似的。可以直接靶向未成熟的花药中的小孢子,或者通过释放小孢子到培养基中而靶向。这种靶向可以例如通过轰击或显微注射而进行。这一技术已被成功用于产生转基因烟草植物(Touraev et al.,1997)和棉花(Gounaris et al.,2005)。与使用成熟花粉的靶向一样,最近获得的花粉可以通过轰击或者超声处理(Eapen(2011)),并且立即用于例如玉米雌穗的授粉(Horikawa etal.,1997)。随后可以分析后代中以靶向方式引入的转基因或基因组事件的存在。
甜菜:
如Zhang et al.(2008)所述获得未成熟胚,用于甜菜中分生组织的转化。从生长于温室的植物中在开花14天后获得花的穗状花序。将它们在30%漂白剂中灭菌30分钟。分离未成熟的胚(IE),随后在具有各种植物生长调节剂的固体MS培养基中培养4周。这种未成熟胚的图像在图26中示出。顶端苗分生组织可以以靶向方式处理,直接在这些未成熟胚中进行,其中可以借助于显微镜获得分生组织区域的靶向激活。或者,可以实施随机靶向技术,例如轰击。在靶向后植物继续成熟。这种胚成熟是在保温箱中在黑暗下大约20-30℃的温度进行的。成熟期持续大约1-4周。一旦胚达到成熟及开始萌发,将其转移到固体MS培养基并且暴露于光,由此可以发育小植物。当这些小植物足够强壮时,在大约1-4周适应环境期之后,将它们转移到土壤中。然后栽培这些植物,分析后代。
靶向来自甜菜的成熟胚需要除去坚硬的蒴苞(Fruchthülle)(Hermann et al.,2007)。胚位于中间,顶端苗分生组织是可及的。在除去果皮之前,种子必须通过在乙醇中漂白而灭菌。果皮随后可以用手术刀或其它锋利工具除去,暴露胚。这个胚然后置于合适培养基中用于感兴趣转化方法。成熟胚的分生组织或者完整胚随后可以使用显微镜直接进行转化,随机激活分生组织区域。在温箱中、黑暗下、20-30℃大约1-10天的休眠期后,胚萌发,可以种植小植物。甜菜植物然后可以生长至成熟,分析后代。
甜菜苗中的苗分生组织可以通过在分生组织区域的靶向切割而被靶向(Artschwager,1926)。为此,靶向这些类型的苗分生组织,例如通过颗粒轰击。在检查基因表达之前进行颗粒穿透测试。瞬时GUS表达在分生组织的第一和第二细胞层中检测到。具有GUS活性的分裂细胞显示细胞在轰击后存活(Mahn et al.,1995)。还提议具有减毒农杆菌菌株的分生组织可以用于甜菜转化(Kerns et al.,1988)。由此可以使用不同的方法(显微注射、农杆菌)和处于不同发育阶段的不同植物组织。为本发明目的,对来自体外繁殖的幼苗的分生组织进行轰击。除去叶材料,直至分生组织被暴露。然后在分生组织区域进行垂直切口,或者垂直提供所述区域,不进行切口。在用基因枪轰击后,外植体被留在体外。在轰击细胞一天后,示出细胞展示作为标记被引入细胞中的β-葡糖醛酸酶活性,证明甜菜的分生组织区域适合用于颗粒轰击,因此适合用于插入基因组编辑工具,例如CRISPR工具。
此外,甜菜的花序也可以以靶向方式修饰,在成熟期间,在开花之前,或直接在未成熟的花中进行。然后花可以继续成熟,授粉后收获种子,分析后代。在甜菜中,花序由开放的主轴组成,其具有许多闭合的、分叉的和向心的分枝的花序。每个花序单元的末端花和侧花在后期发育阶段合并。五个雄蕊原始来源于彼此,它们通过形成来自环状插入(interkalierenden)分生组织的(内部)雄蕊环而在花发育过程中发生(Olvera等人,2008)。
小麦:
另一种方法是针对作为靶植物的小麦开发的。为此,开花后5-20天收集来自未成熟的穗的未成熟籽粒。这些籽粒通过用漂白剂和乙醇进行表面处理而灭菌。然后在显微镜下用解剖刀提取未成熟的胚。这些胚显示不同程度暴露的分生组织。然后用这些分生组织经历各种转化方法,如Sautter等(1995年)所述。图27A和B显示了其图像。如此处理胚后,如Matthys-Rochon等人(1998)所述,将其进一步培养,特别是在胚培养基中培养。然后将萌发的小植物(图27C)在适应环境后转移至温室。以正常的方式培育植物,随后分析后代.
如Sautter等,1995中所述,同样可以将小麦中的苗分生组织靶向修饰。为此,通过在70%乙醇中浸泡2分钟,之后是次氯酸钠处理和四次水洗,之后是次氯酸钠处理和四次水中漂洗,将种子灭菌并洗涤以产生营养苗端分生组织。然后将无菌种子置于试管中的补加100mg/l头孢噻肟、2%蔗糖和0.8%Difco琼脂的MS培养基上。随后通过去除胚芽鞘和前三至五片叶而暴露6-10天龄植物的苗端分生组织。然后将根修剪至约5mm。然后向外植体中补充不同的蔗糖浓度(最佳:10%)并置于MS基础培养基(0.8%琼脂糖)上。
在颗粒轰击后,然后将外植体转移到MS琼脂糖上进一步培养。
而且,在小麦中花器官也可以被靶向。苗分生组织自身在发育非常早期、在播种几周后就分化成了的不成熟的穗或苗。这些不成熟的穗可以在轴的底部发现(见图28,左图)。通过在苗中切口而在这些未成熟的穗中形成一个窗口。各种转化技术可以通过这个窗口到达分生组织。转化后,关闭伤口,进一步培养转化的系统直至种子达到成熟(见图28,中、左、右图像),随后对后代进行分析。或者,将未成熟的小穗从花序上取出,体外灭菌,并以靶向方式分离。然后可以在Barnabas等人,1992的基础上进行体外成熟和种子生产。
此外还显示对于小麦,可以使用基因枪靶向不成熟的花序(Leduc等,1994,Sautter等,1995)。已经显示在轰击后,以这种方式处理的组织中的细胞表达插入的报道基因,并且可以继续分裂。
欧洲油菜:
对于油菜也已经表明,苗端分生组织已经在所谓的“心期”中发育。Huang等人,2009描述了也可以与本发明的方法一起使用的用于这个阶段的油菜的转化方法。
而且,当用油菜作为靶植物时,萌发后或者当植物已经达到2-8叶期时,苗分生组织可以以靶向方式被转化。为此,用解剖刀小心地去除覆盖分生组织的叶原基。然后暴露的分生组织优选用抗氧化剂处理以保护它们。随后,分生组织区域可以通过各种转化技术进行转化。这里也可以继续培育植物,直到繁殖器官达到成熟,并且可以分析其后代中以靶向方式引入的修饰的存在。
油菜花也可以被靶向。油菜花序中的花不断产生。花簇的尖端产生新鲜的花。油菜花器官转化可采取两种方法。在第一种方法中,可以原位打开未成熟的花,并且可以以靶向方式激活繁殖组织。处理后,去除未处理的花序和外壳,然后盖上花序,以促进自花授粉。收获种子,分析后代。在第二种方法中,将所有分化的花小心地从花簇/圆锥花序中去除,并使花分生组织暴露。然后用各种类型的转化处理这些分生组织。然后覆盖分生组织,以便继续正常发育。收获所有的外壳/荚,并根据其分子生物学和表型对后代进行测试。
大豆:
对于大豆转化,分生组织区域同样可以以靶向方式被激活。
如McCabe(McCabe等,1988)所述,将来自胚的苗分生组织暴露于光并转化。为此,将成熟大豆种子(BR-16,Doko RC,BR-91和Conquista)在70%乙醇中进行表面灭菌1分钟,接着在1%次氯酸钠中浸泡20分钟,然后在无菌蒸馏水中漂洗3次。种子在蒸馏水中浸泡18-20小时。从种子切下胚轴,通过除去初生叶暴露顶端分生组织。将胚轴置于轰击培养基(BM:MS(Murashige and Skoog,1962)简单盐,3%蔗糖和0.8%PhytagelTMSigma,pH 5.7)中,使顶端在具有12ml培养基的5cm培养皿中向上取向。一旦从胚轴获得的苗达到2-3cm的长度,从每个叶子的基部取1mm长的部分用于GUS分析(β-葡糖醛酸酶)(McCabe等,1988)。将表达外源DNA的苗或萌芽逐个转移到含有0.2升高压灭菌的肥土(蛭石(1:1))的塑料罐中,然后用塑料袋和橡皮筋密封覆盖而保持在温室中。1周后取下橡皮筋。又过了一个星期,塑料袋也被取出。一旦适应环境的小植物达到约10厘米的长度,将它们转移到具有5升肥土的盆中,直到种子开始发育(McCabe等,1988)。一旦小植物长出,取叶样品用于分析。然后植物生长成熟,以分析其后代的靶向修饰。
或者,未成熟胚的分生组织被激活用于靶向转化。为此,在开花后5-20天收获豆荚,在心期和子叶期之间用解剖刀和抓取工具提取胚。将这些胚置于胚生长培养基上,并用各种递送/转化方法以靶向方式转化苗端分生组织。然后胚在黑暗中生长1到10周,直到达到完全成熟,如Buchheim等人所述(1989),并暴露于光照下进行胚萌发。以这种方式生长的小植物在温室中培养成熟。收获种子,分析后代。如Chee等人,1989中所述,在萌发的大豆小植物的苗分生组织中靶向引入重组构建体。将来自大豆L.Merr(Cv A0949)的种子通过浸泡于15%Clorox溶液15分钟,然后用无菌蒸馏水进行多次漂洗而灭菌。将种子置于培养皿中的无菌湿纸巾上,在26℃黑暗中放置18至24小时进行萌发。去除种皮,并且去除每个萌发种子的两个子叶中的一个,将半个种子与幼苗的苗芽(胚芽)、子叶节和邻近的子叶组织用含有二元质粒pGA482G的无毒农杆菌品系C58Z707的液体培养物接种过夜。农杆菌转化也可以被其它引入或转化方法取代。在Chowrira等人,1995中描述了另一种方法。通过去除周围叶组织暴露小植物(7-10天龄)的顶芽。用注射器注射外源DNA,同时含有lipofectin作为转染剂,随后电穿孔分生组织。植物在没有选择的情况下生长到成熟,随后可以以这种方式获得嵌合植物。然后分析其后代。
如Shou et al(2002年)所述,使用授粉的大豆花的柱头。简而言之,所有的实验都是在下午晚些时候进行的,使用当天早上自然授粉的花。为了将大豆花的柱头/柱头暴露在光下,去除两个花瓣和一个龙骨瓣。将柱头在花房和柱头之间的边界处切断,并将质粒DNA(浓度为25、80、100或150μg/ml)施用于暴露的柱头。处理的花被标记,在同一节点上未处理的花和芽被移除。单个收获从处理的花形成的豆荚。或者,大豆花序花分生组织可以在它到达末期之前以靶向方式被转化,其中当花开始进一步发育时,去除原生的花(primordien)。这个曝露(exposition)通过用手术刀切除原生的花而获得。花分生组织一旦被转化则立即被覆盖。在花序可以发育后,及自花授粉开始后,可以收获处理的植物的苗,处理种子,并且可以测试后代的靶向基因组修饰。
棉花:
本发明的用于插入感兴趣的靶向修饰的实验可以针对棉花进行,其中来自胚的分生组织如等人(2005年)所述处理。为此,手工收获种子(variation 7mH,CD-401,Antares和ITA94),并用酸处理除去纤维材料。加入浓硫酸,用玻璃棒将种子(3ml/g种子)充分搅拌1分钟。然后将种子立即转移到5升水中,用蒸馏水漂洗三次,并在纸巾上干燥。成熟种子用70%乙醇表面灭菌10分钟,然后在2.5%次氯酸钙中处理1分钟,并在无菌蒸馏水中漂洗三次。然后将种子在蒸馏水中浸泡24小时,然后种子在室温下在黑暗中萌发16小时。从种子切下胚轴,并通过去除子叶来暴露顶端分生组织。将外植体转移到含有3%葡萄糖(5mg/l苄基氨基嘌呤(BAP),0.8%Phytagel(Sigma))的MS培养基中。设定pH值为5.7以进行高压灭菌。如上所述制备胚轴,并置于5cm培养皿中的12ml轰击培养基(MS简单盐培养基,3%葡萄糖,5mg/l BAP和0.8%Phytagel Sigma,pH 5.7)中,顶端朝上。在这一点,分生组织可以被转化或转染。经处理的顶端分生组织在黑暗中培养。显示生长的分生组织被转移到生长室中。然后将小植物转移至温室并培养至成熟。随后分析后代。
或者,如Rajasekaran(2013)所述,转化胚分生组织。
在另一种方法中,根据Mauney(1961)描述的方案,体外靶向未成熟胚分生组织。使用的培养基由White的营养混合物所有成分加上5倍正常浓度的补充剂(40mg/l腺嘌呤硫酸盐,250mg/l酪蛋白水解物,150ml/l椰奶和7克/升NaCl)组成。培养基用8g/l bacto琼脂和20g/l蔗糖作为碳水化合物来源而凝固。这种培养基使培养方法成功的最重要的特征是渗透压调整到高水平,其可以通过加入7g/l的NaCl来实现。胚在这个培养基上生长3-4周后,将它们转移到具有中等渗透压(3g/l NaCl,而不是7g/l)的培养基中,然后再转移到没有NaCl的培养基中生长2-5周。最后培养基中成功培养的胚萌发,并被种植在土壤中。
为了转化棉花小植物中的苗分生组织,将分生组织按照Zapata等人(1999)所述的第一种方法转化。在旋转振荡器(50%Clorox(1小时))中用浓硫酸以50rpm对种子进行表面灭菌(1小时),并用灭菌的双蒸水漂洗至少三次。然后将种子置于用0.15%(质量/体积)的Gelrite固化的培养基(pH 5.7)上,所述培养基含有来自Murashige and Skoog(MS)(Murashige and Skoog,1962)的无机盐和2%蔗糖,用于萌发。种子在28℃、黑暗中保温约3-4天。分离苗尖,然后转移到MS无机盐(Murashige和Skoog,1962)中,其中含有100mg/l肌醇,0.5mg/l硫胺素/HCl,0.5mg/l烟酸,0.5mg/l吡哆醇/HCl,3%蔗糖和0.15%(质量/体积)Gelrite,pH 5.7。分离后,可以进行感兴趣的重组构建物的输送,并且随后可以将植物材料转移到新的培养基中。重要的转化的顶端被转移到新的培养基上。然后将存活的顶端转移到相同的培养基中,但没有卡那霉素。一旦根开始发育,将具有根的植物(T0)转移到土壤中,并使其在温室中成长。然后可以进行后代分析。
或者,棉花分生组织如Keshamma等(2008)所述进行转化。为此,来自品系NC-71的种子在蒸馏水中浸泡过夜,首先用1%Bavastin表面灭菌10分钟,然后用0.1%HgCl2表面灭菌几秒钟,然后用蒸馏水充分洗涤。种子能够在培养皿中在黑暗中在30℃萌发。使用两日龄的幼苗作为外植体。具有直的胚芽/苗芽的幼苗被感染,其中它们与子叶分离,而不损害它们,由此使得分生组织可见。然后可以使用感兴趣的转染或转化方法。随后将幼苗转移到高压灭菌的Soilrite(蛭石等价物)中,浇水,并在无菌条件下在生长室中覆盖萌发,每盆5棵幼苗。5至6天后,将幼苗转移至含有农杆菌的盆中,并使其生长至少10天,然后将其转移至温室。然后可以分析成熟的植物。
在另一种方法中,棉花分生组织根据McCabe等人(1993)进行转化。
在另一种方法中,根据Gounaris等人(2005)的方法,棉花花可以以靶向方式转化。为此,Christina型棉花植物被用于转化。用作花粉受体的花必须在预期的开裂前两天与雄性生殖细胞分离。在授粉日的早晨,开花后1-2小时采集具有完整雄蕊的供体花。然后可以用感兴趣的转化或转染方法处理每个供体花。这些花序被用于进一步授粉受体花(事先去除雄性生殖细胞之后)。授粉的花可以继续发育和产生种子。后代可以进行分子生物学分析。在另一种方法中,花分生组织或未成熟的花可以以靶向方式进行遗传修饰。为此,通过去除原始部分和花苞来暴露形成花枝,花芽和未成熟花的分生组织。然后根据本发明可以使用感兴趣的输送方法(转化/转染,生物学、化学或机械性的)。随后,处理区被覆盖,并允许继续生长。然后收获花。后代可以进行生物学及它们的表型分析。
水稻:
如果感兴趣的靶植物是水稻,则可以使用以下方法在分生组织靶结构中引入靶向基因组修饰。
根据Naseri等人,2014的方法,水稻种子(水稻,Hashimi)通过在90%乙醇中浸泡(1分钟)进行灭菌,并用水洗涤三次。将无菌种子在22℃下置于湿棉上两天。在种子表面上后来会发育苗的地方,用根癌农杆菌接种饱和种子的胚顶端分生组织。用针(毫米,预先浸入根癌农杆菌接种物)将表面穿透至约1至1.5毫米的深度。然后将接种的种子在瓶中用铝箔覆盖,置于在湿的珍珠岩上的滤纸上,在23℃黑暗中保温9天。70%到75%的接种种子萌发。为了杀死根癌农杆菌,将幼苗在室温下浸入头孢噻肟的水溶液(1000ppm)中1小时。为了形成根,将幼苗放在Yoshida溶液中。最后,将幼苗种在盆中,在未灭菌条件下生长至成熟(T0)。这使得自我授粉,从而产生T1代。
在另一种方法中,激活未成熟胚的分生组织用于以本发明的CRISPR工具靶向修饰。授粉后3-12天收获未成熟的种子。将未成熟的胚置于成熟培养基中(Ko等人,1983),然后可以使用感兴趣的转化/转染方法。如Ko等人(1983)所述,将胚生长至成熟。收获种子,并根据后代的分子生物学对其进行分析。
按照Muniz de Padadua等人(2001)的描述处理来自水稻植物的分生组织。为此,将水稻种子表面灭菌并在体外萌发。在约4天后,从上胚轴的第一节间的远端部分和胚芽鞘切下苗端。在曝露之后,可以使用感兴趣的输送系统。这使得根部形成。然后将植物转移至温室,进一步培养,随后分析后代。
如Rodin等人(2014)所述,处理未成熟的水稻穗,用于花器官的靶向。使用根据BBCH量表(Lancashire等人,1991)在第51阶段(圆锥花序发育开始:花序顶端突出于叶鞘外)的花序,然后可以对其进行处理,并且可以随后对其后代进行分析。此外,花分生组织可以被激活。为此,通过去除周围组织来暴露分生组织,然后进行转化和进一步培养,并且随后分析后代。此外,可以在分化之前,或者在周围原基被移除之后,通过转化或转染处理未成熟的穗。经处理的穗可以继续发育。收获这些花的所得种子,并检查后代的靶向编辑事件(Itoh等,2005)。
实施例16:瞬时转化方法
特别对于分生组织的在植物体中转化,对产生瞬时转化方法有很大兴趣,特别是用于引入感兴趣的CRISPR工具,因为结果是,仅待引入的靶向修饰而非工具本身可以传递到细胞后代中。因为行政审批规定和严格的安全性考虑,以此方式控制的及可以以此方式控制的方法对于植物育种领域的重要性日益增加。瞬时和稳定的转化方法必须当然适应待被转化的组织。为此,进行了下述实验,其可以部分广泛和一般地使用,及可以部分用于特异性组织(花粉、分生组织、花等)。
Cas9:
Cas9得自New England Biolabs(NEB)、PNA BIO、ToolGen、LDBIOPHARMA或者ABM,或者如Liu et al.(2015)所述,纯化Cas9。
sgRNA的体外转录:
体外转录如Zuris et al.5(2015)所述进行。用T7RNA High Yield Synthesis试剂盒(NEB)根据厂商指导在体外转录含有T7启动子结合位点后接20bp sgRNA靶序列的线性DNA片段。用乙醇沉淀体外转录的RNA,在10%聚丙烯酰胺标准TBE尿素凝胶(Bio-Rad)上凝胶电泳纯化。切下的凝胶片段在420μl 300mM NaCl中在摇床表面在4℃提取过夜。凝胶纯化的sgRNA用乙醇沉淀,溶解于水中,然后通过UV吸收定量sgRNA浓度。然后,sgRNA可以速冻,并储存在-80℃。或者,如Kim et al.(2014)所述获得gRNA。为此,用MEGAshortscript T7试剂盒(Ambion)通过T7-RNA聚合酶run-off反应体外转录RNA。通过累积和延伸两个互补寡核苷酸产生gRNA或crRNA的模板。转录的RNA通过酚-氯仿提取、氯仿提取和乙醇沉淀而纯化。纯化的RNA通过光谱测定而定量。
或者,可以进行另一种方案(在Ramakrishna et al.,2014中描述)。为此,通过T7-RNA聚合酶run-off反应体外转录RNA。用于sgRNA转录的模板通过退火/杂交和延伸两个互补寡核苷酸而产生。转录的RNA在8%变性尿素-PAGE凝胶上分离。RNA置于无核酸酶水中,随后通过酚-氯仿提取、氯仿提取和乙醇沉淀而纯化和获得。纯化的RNA通过光谱测定定量。
复合蛋白质Cas9和gRNA:
如Zuris et al.(2015)所述,将1μl 200μM Cas9蛋白与2μl 50μM sgRNA混合并在室温保温5分钟以引入Cas9-sgRNA复合物,之后将复合物与3μlRNAiMAX或Lipofectamine2000混合,保温30分钟,之后注射。或者,复合如Kim et al.,2014所述进行。为此,将Cas9蛋白(4.5-45mg)与体外转录的sgRNA(6-60mg)预混合。将在储存缓冲液(20mM HEPES,pH 7.5,150mM KCl,1mM DTT,和10%甘氨酸)中的Cas9蛋白与sgRNA溶解在无核酸酶水中,混合,在室温保温10分钟。
农杆菌(Ab)
用Ab进行花粉转化:
如Li et al.(2004)所述进行花粉转化。为此采集具有新鲜开放的和暴露的花药的花。将Ab溶液等份转移到无菌1.5ml试管中,在3000rpm离心10分钟。沉淀重悬(于花粉萌发培养基中,具有大约50mg花粉/ml),施加真空(-80Pa)30分钟,然后缓慢释放。悬液随后在3000rpm离心5分钟,沉淀即花粉直接用于授粉。
用Ab进行苗端分生组织转化:
基于Chee et al.,1989的方案转化来自幼苗的分生组织。在3个不同位置进行接种,即30’/2gauge针插入到胚芽、子叶和相邻区域中,在每个注射点注射30ml Ab细胞。继续用Ab感染的种子的萌发过程,将种子转移到无菌湿纸上,进一步在28℃保温(黑暗中大约4小时)。然后,为完全发育,将幼苗种植到地中。或者,可以使用Keshamma et al.(2008)中描述的方案。然后一旦存在胚芽,则通过分离子叶而不破坏它们来感染幼苗,由此分生组织是可见的。然后刺入分生组织,然后浸入农杆菌培养物60分钟。感染后,用无菌水短暂洗涤幼苗,随后置于高压灭菌的Soilrite上。
颗粒轰击:
如下进行胚分生组织的轰击:在轰击前0-6小时将胚芽鞘期或心期的胚置于补加渗压剂的胚成熟培养基中。根据使用亚精胺的常规DNA沉淀进行颗粒加工和制备。使用蛋白质/RNA混合物,进行来自Martin-Ortigosa et al.(2014)的方案,其中混合物与金颗粒一起干燥或冻干。轰击后16-24小时,将胚置于不含渗压剂的成熟培养基中
花药轰击:
花药轰击可以根据Twell et al.,1989进行。为此,将1d植物花药进行表面消毒,之后在10%Clorox中释放花粉10分钟,并在无菌蒸馏水中洗涤花药。用无菌刀片将花药横切,将20个花药切片置于表面积为4cm2的固体MSO培养基上,暴露药室(Theken)。
在另一个方法中,花药被轰击,如Obert(Obert et al.,2008)所述。为此,一旦小孢子在单核发育中期,则迅速采集穗/花药。在我们的研究中使用两种不同的预处理以及使用未处理的材料。为进行冷处理,植物材料置于在5℃的冷室中的湿滤纸上(Dedicova etal.,1999)。材料预处理之后(14天冷储存),选择精确处于合适阶段的含有小孢子的穗的具体部分,用作进一步实验材料。该材料表面消毒(于70%(vol./vol.)醇中),用无菌蒸馏水洗涤3次。为进行甘露糖醇预处理,将含有处于正确阶段的小孢子的新鲜穗的合适部分表面消毒(于70%醇中),用无菌蒸馏水洗涤3次。在预处理后在无菌条件下分离花药,或者将花药置于栽培培养基(FHG media,Kasha et al.,2001)表面上。轰击条件是:距离(微载体-培养皿中的花药):9cm;压力设定为650、900和1,100psi。然后在组织培养生长室中在26℃于黑暗下培养花药培养物。
在另一方法中(Touraev et al.(1997)),单细胞小孢子和在二细胞中期的花粉粒在分离后立即在各自培养基中被轰击。含义大约5x105个细胞的悬液(0.7ml)平均涂布在无菌滤纸(Whatman No.1)上,转移到10cm培养皿(Sterilin,Great Britain)。使用氦驱动的PDS-1000/He颗粒发射系统(Bio-Rad,USA)进行基因枪转化。轰击基本上如Sanfor et al.(1993)所述进行。质粒DNA沉淀在平均直径的1.1μm金颗粒(Bio-Rad,USA)上。每个转化包括3次轰击。将被轰击的小孢子或二细胞中期花粉粒从滤纸上洗下来,在单独的成熟培养基中保温。
花的轰击:
基于Twell et al.,1989的方案,轰击多组(每组10朵)具有完整弯曲花瓣的花,其中截短的花梗悬浮于蒸馏水中。
花粉的轰击:
基于Twell et al.,1989的方案,将来自成熟花的花粉收集到无菌微离心试管中。在轰击之前,以大约106粒/ml的密度将干花粉样品悬浮于液体MSO培养基中。将花粉悬液(1ml)直接吸取到含有用琼脂增稠的MSO培养基的9cm培养皿的表面上,其上预先放置具有尼龙膜(Genescreen,NEN)的无菌Whatman no.1滤纸。在植物材料被转移到MSO培养基后,在60分钟内进行轰击。将质粒DNA沉淀在钨微粒上,如Klein et al.所述进行轰击。轰击后,培养皿或者完整的花在蒸馏水中在26℃、光照下保温。
在另一方法中,花粉轰击如Horikawa et al.(1997)所述进行。为此,从突出的雄穗采集成熟花粉粒。非常快速地进行随后的轰击准备步骤,因为花粉的寿命迅速降低。花粉浸于含有30g/l蔗糖的液体MS培养基(pH 5.8)中,将4.0x105花粉粒(于1ml培养基中)通过真空过滤吸附到一片微滤膜(孔径0.45um,Fuji Film Co.,Tokyo)表面上。微滤膜置于培养皿中的1%琼脂平板上以准备用颗粒炮(Partikelkanone)轰击。
用处理的花粉授粉:
为了用被轰击的花粉授粉,使用Touraev et al.,1997所述的方案。为此,在授粉前一天,开花后不久当成熟花仍具有闭合花药时,将其去雄。在不含槲皮素的GK培养基中重复洗涤体外成熟的花粉,然后以3μl小滴转移到柱头组织。选择展示良好柱头分泌产生的柱头用于吸管授粉。为防止交叉授粉,在气候室中的所有其它花芽均在开花前一天移出。3-4周后收集种子囊或荚。
在另一方法中,使用Horikawa et al.(1997)所述方法。为此,将花粉置于1ml液体MS培养基中。在丝发育后3天立即通过将花粉,吸取到穗的丝上(先前用穗袋覆盖)将其用于授粉。在20个穗上进行授粉处理。作为对照,花粉用不含DNA的样品授粉。
用HELIOS轰击花:
花和花序的轰击用来自Bio-Rad的Handpistole“Helios”根据厂商指导进行。一旦花序或者花被暴露,用在50-300psi的1-5次射击轰击它们。然后覆盖暴露的分生组织,花序或者花能够继续成熟。
在另一方法中,进行Gounaris et al.,2005所述的方案。在预期授粉2天前将作为花粉受体的花去雄。在授粉日早晨,从开花后1-2小时的供体花采集完整雄蕊。每个供体花置于培养皿平面上用尼龙网覆盖,用来自颗粒炮的4-5次射击处理。颗粒炮用氦压400psi操作,并且配有颗粒扩散屏。氦气纯度是4.5类(99.994%)。每个被轰击的花序用于授粉大约15-20个去雄的受体花。被授粉的花能够继续发育,由此产生种子。
显微注射:DNA/RNA/蛋白质及组合
胚显微注射:
使用Neuhaus et al.,1987所述方法进行胚显微注射。为此,用连接于硅氧烷试管的手工微毛细管逐个肉眼选择置于盖玻片上的胚,以大约2μl的小滴转移到物体载体(object carrier)的培养基上,用于显微注射(Spangenberg et al.,1986)。进行显微注射,胚状体用保留毛细管固定位置,显微注射到各细胞中。外源DNA以线性(在插入基因以外裂解质粒)和超螺旋分子的1:1混合物注射,量为50mM NaCl,50mM tris-HCl,pH 7.8中大约0.5μg/μl。
用农杆菌(Ab)显微注射苗分生组织:
如Sivakumar et al.(2014)所述进行用Ab显微注射苗分生组织。100μl培养物用胰岛素针管显微注射到萌发的棉花种子的胚苗端分生组织中。显微注射培养物1-5次(0.5-1.0mm深)以检查显微注射次数在胚苗端分生组织中及附近的作用。将感染的种子在无菌滤纸(Whatman no.1)上快速擦拭之后除去过量细菌培养物。种子在1/2强度MS培养基上于黑暗下共栽培2天。共栽培后,将幼苗用头孢噻肟(200mg/l)洗涤,转移到含有头孢噻肟和潮霉素B的抗生素选择培养基中。
在苗分生组织中显微注射DNA:
如Lusardi et al.,(1994)所述进行显微注射。成熟干燥种子用无水乙醇洗涤30秒,随后用补加0.01%Tween 80的市售漂白剂(2.5%NaClO)灭菌(振荡20分钟)。然后,种子用无菌蒸馏水漂洗4-5次。通过在9cm培养皿中将种子在滤纸之间用无菌蒸馏水在27℃、黑暗下3-4天保温而诱导萌发。在这段时间,苗穿过种皮(Kern-Integument),达到大约0.8-1.0cm长度。在这一点,在盾片结水平将苗从种子移出。在立体显微镜下移除胚芽鞘和5或6个胚的子叶。制备胚的叶后,在各种发育阶段暴露由两个叶层围绕的无覆盖的顶端。分离的顶端在9cm培养皿中的补加2%蔗糖并用0.8%DifcoBacto-Agar(Difco Lab.Detroit)增稠的MS培养基中栽培,进一步用27℃/22℃温度方案和16/8小时光/暗照明方案生长。在10天内发育正常植物。在接下来的15-20天,它们达到足够转移到盆中的大小,并置于温室中。为显微注射,将用于注射的质粒溶解于注射缓冲液(10mM Tris-HCl and 0.1M EDTA,pH 7.5)中。注射缓冲液过滤通过一次性过滤单元(Schleicher and Schuell,Germany),以灭菌溶液并且防止颗粒污染。所有注射均在无菌条件下进行。从玉米分离的苗分生组织转移到9cm培养皿中,MS补加2%蔗糖并用0.8%Difco Bacto Agar增稠。顶端定位于培养基上,以便顶端穹顶清晰可见。分生组织的L2层细胞用配有来自Research Instruments(UK)的胚分离器系统的(大功率)立体显微镜(放大至200x;SV 8,Zeiss,Germany)注射。在一些实验中,使用FITC右旋糖的共注射以便更好鉴定感染的细胞(Neuhaus et al.,1993;Schnorf et al.,1991)。将注射毛细管(尖端直径小于1μm)装在系统的机械显微操作器上,其与显微注射器(Eppendorf 5242 microinjector)连接,器以恒定体积将大约3pl输送进细胞中(Neuhauset al.,1986,1987;Schnorf et al.,1991)。胚分离器系统的第二操作器用于在注射期间稳定和移动顶端。该操作器为此也配有显微针,以便能够移动和固定顶端分生组织,由此它们可以在正确位置被处理。
晶须(whisker)
如Frame et al.(1994)所述进行在各种分生组织中的经晶须的输送。暴露的组织用在25μl质粒DNA中的40μl 5%whisker悬浮液处理。反应容器的内容物首先轻轻搅拌,然后垂直置于Vortex Genie II涡旋混合器(Scientific Industries Inc.,Bohemia,NY)的多样品转头中,或者水平置于Mixomat Amalgammischer(Degussa CanadaLtd.Burlington,Ontario)的保持器中。通过在全速(Vortex Genie II)混合或者在固定速度混合1秒钟(Mixomat)而进行转化60秒。
或者,将晶须与DNA/RNA一起或蛋白质混合晶须上样到显微操作器的吸管中,然后显微注射进分生组织。
细胞穿透肽:DNA/RNA/蛋白质及其组合
混合细胞穿透肽和Cas9蛋白和gRNA:
使用基于Ramakrishna et al.,2014的方案使用细胞穿透肽。铺板后一天,细胞相继或同时用Opti-MEM及用Ca9-M9R和sgRNA:9R洗涤。在10mg sgRNA和30-50mg 9R肽在250ml(用于相继处理)或100ml(用于同时处理)Opti-MEM培养基中在室温保温30分钟期间形成sgRNA:9R复合物。
胚:
TAT肽(Tat,Tat2,M-Tat)用于将GUS酶引入小麦胚中。TAT肽和GUS酶首先在不同的微离心试管中制备。未标记的TAT肽(4μg)加入到无菌水中(终体积:100μl)。类似地,1μgGUS酶(Sigma Aldrich)加入到无菌水中获得终体积100μl。两个试管的内容物混合在一起,产生4:1比例的肽和蛋白质混合物。混合物在室温保温1小时,然后在存在和不存在渗透剂(tuluol/乙醇1:40,vol./vol.相对于肽/蛋白质混合物的整体体积)时加入到分离的未成熟胚(在2ml微离心试管中)。在室温保温1小时后,胚用缓冲液洗两次,在室温进行渗透性和胰蛋白酶处理(1:1(vol./vol.)渗透性缓冲液)5分钟。胚用渗透性缓冲液洗涤2次,随后进行胚的组织化学GUS分析。经ChariotProtein Transduction试剂盒(Active Motif,Carlsbad,CA,USA)根据厂商指导将1μg GUS酶转染以用于输送。可渗透的和不可渗透的胚与chariot-GUS复合物保温1小时。所有保温后步骤均与针对TAT肽所述的那些步骤相同。
小孢子的转化:
使用细胞穿透肽的小孢子转化根据Shim et al.(2012)进行。小孢子提取根据Eudes and Amundsen(2005)进行,所有分离小孢子的步骤用NPB-99液体培养基进行。在用NPB-99洗涤小孢子后,将2-3ml小孢子溶液层置于2-3ml含有400mM甘露糖醇和10mM MES,pH7.0的30%Percoll溶液中。将小孢子在4℃、100x g离心5分钟。在裂Percoll/NPB-99解位点形成条带的细胞在新的15ml离心试管中用NPB-99稀释到15ml,然后再次离心。弃掉沉淀,将小孢子重悬于大约1ml NPB-99培养基中。用血细胞计确定小孢子浓度,调节到2.5x 105细胞/ml。如下将包括对照在内的5个处理加到同一提取的小孢子悬液:T1,对照处理,包含200μl T无菌水;T2,于100μl无菌水中的1μg dsDNA被加入到在100μl无菌水中稀释的4μgTAT2,温和混合,产生1:4的dsDNA与TAT2比率(dsDNA:TAT2);T3,在100μl无菌水中稀释的1μg dsDNA和在100μl无菌水中稀释的6μl Chariot(Active Motif,Carlsbad,CA)混合在一起(dsDNA-Pep1);T4,在50μl无菌水中的4μg RecA(MJS Biolynx,Brockville,Canada;#UB70028)和在50μl无菌水中的1μg dsDNA混合在一起15分钟,向dsDNA-RecA溶液中加入在100μl无菌水中的6μl Chariot溶液,获得终体积200μl于2ml微离心试管中(dsDNA-RecA-TAT2)。在室温(RT)保温15分钟后,向所有制备物中加入5μl Lipofectamine(Invitrogen,Carlsbad,Ca;#11,668to 019),然后进一步在室温保温5分钟。混合物然后立即加入到在2ml微离心试管中的50000个沉淀小孢子中,保温15分钟。任何向每个试管中加入100μlNPB-99,在室温保温45分钟。转染的小孢子然后被沉淀,取沉淀,细胞用NPB-99洗涤2次。然后将1ml NPB-99加入到每个试管中的小孢子中,小心混合,将500μl等份吸取到含有3mlNPB-99+10%Ficoll(Sigma,St.Louis,MO;F4375;NPB-99-10F)和100mg/l抗生素头孢噻肟(Sigma;#C7039)的35mm培养皿中。
电穿孔
花粉转化::
根据Shi et al.(1996)建立的方案进行电穿孔花粉转化。为此,成熟花粉、萌发花粉或无外壁层的花粉用场强度750-1250V/cm、恒定脉冲13ms电穿孔。
超声处理
花粉超声处理:
如Wang et al.(2000)所述通过超声处理进行花粉转化。为此,在早晨采集0.3g新鲜花粉,在20ml含有5%蔗糖的溶液中与大约10μg感兴趣质粒DNA混合。在加入质粒DNA之前和之后用超声处理溶液。使用来自NingboXinzi Scientific Instrument Institute的JY92-II超声装置,用于超声处理的参数是:声波强度:300W,8次处理,间隔5和10秒。随后用处理的花粉对angeclippte玉米丝进行授粉。
实施例部分引用的参考文献列表:
F.J.,et al.(2005)."Germ line genetic transformation in cotton(Gossypium hirsutum L.)by selection of transgenic meristematic cells with aherbicide molecule."Plant Science 168(5):1227-1233/Record#:2408
Artschwager,E.(1926)."Anatomy of the vegetative organs of the sugarbeet."J.agric.Res 33:143-176/Record#:2352
Barnabas,B.,et al.(1992)."In vitro pollen maturation and successfulseed production in detached spikelet cultures in wheat(Triticum aestivumL.)."Sexual Plant Reproduction 5(4):286-291/Record#:2374
Buchheim,J.A.,et al.(1989)."Maturation of Soybean Somatic Embryos andthe Transition to Plantlet Growth."Plant Physiology 89(3):768-775/Record#:2402
Chee,P.P.,et al.(1989)."Transformation of soybean(Glycine max)byinfecting germinating seeds with Agrobacterium tumefaciens."Plant Physiology91(3):1212-1218/Record#:2392
Chowrira,G.,et al.(1995)."Electroporation-mediated gene transfer intointact nodal 30 meristemsin planta."Molecular Biotechnology 3(1):17-23/Record#:2393
Eapen,S.(2011)."Pollen grains as a target for introduction of foreigngenes into plants:an assessment."Physiology and Molecular Biology of Plants17(1):1-8/Record#:2384
Frame,B.R.,et al.(1994)."Production of fertile transgenic maizeplants by silicon carbide whisker-mediated transformation."The Plant Journal6(6):941-948/Record#:1755
Gounaris,Y.,et al.(2005)."Pollen-mediated genetic transformation ofcotton with the Arabidopsis thaliana hmgr cDNA using the particle gun."Journal of Food Agriculture and Environment 3(2):157-160/Record#:2330
Grandjean,O.,et al.(2004)."In Vivo Analysis of Cell Division,CellGrowth,and Differentiation at the Shoot Apical Meristem in Arabidopsis."ThePlant Cell 16(1):74-87/Record#:2387
Hermann,K.,et al.(2007)."1-Aminocyclopropane-1-carboxylic acid andabscisic acid during the germination of sugar beet(Beta vulgaris L.):acomparative study of fruits and seeds."Journal of Experimental Botany 58(11):3047-3060/Record#:2370
Horikawa,Y.,et al.(1997)."Transformants through pollination of maturemaize(Zea mays L.)pollen delivered bar gene by particle gun."Journal ofJapanese Society of Grassland Science(Japan)/Record#:2383
Huang,Y.,et al.(2009)."Probing the endosperm gene expressionlandscape in Brassica napus."BMC Genomics 10(1):256/Record#:2377
Itoh,J.-I.,et al.(2005)."Rice Plant Development:from Zygote toSpikelet."Plant and Cell Physiology 46(1):23-47/Record#:2416
Keshamma,E.,et al.(2008)."Tissue culture-independent in plantatransformation strategy:an Agrobacterium tumefaciens-mediated gene transfermethod to overcome recalcitrance incotton(Gossypium hirsutum L.)."Journal ofCotton Science 12(3):264-272/Record#:2405
Kim,S.,et al.(2014)."Highly efficient RNA-guided genome editing inhuman cells via delivery of purified Cas9 ribonucleoproteins."Genome Research24(6):1012-1019/Record#:2288
Ko,S.-W.,et al.(1983)."A simplified method of embryo culture in riceof Oryza sativa L."Bot.Bull.Acad.Sin 24:97-101/Record#:2415
Krens,F.A.,et al.(1988)."Transformation and regeneration in sugarbeet (Beta vulgaris L.)induced by‘shooter’mutants of Agrobacteriumtumefaciens."Euphytica 39(3):185-194/Record#:1426
Leduc,N.,et al.(1994)."Gene transfer to inflorescence and flowermeristems using ballistic micro-targeting."Sexual Plant Reproduction 7(2):135-143/Record#:2345
Li,X.,et al.(2004)."Improvement of cotton fiber quality bytransforming the acsA and acsB genes into Gossypium hirsutum L.by means ofvacuum infiltration."Plant Cell Reports 22(9):691-697/Record#:2419
Liu,J.,et al.(2015)."Efficient delivery of nuclease proteins forgenome editing in human stem cells and primary cells."Nat.Protocols 10(11):1842-51859/Record#:2421
Lusardi,M.C.,et al.(1994)."An approach towards genetically engineeredcell fate mapping in maize using the Lc gene as a visible marker:transactivation capacity of Lc vectors in differentiated maize cells andmicroinjection of <i>Lc</i>vectors into somatic embryos and shoot apicalmeristems."The Plant Journal 5(4):571-582/Record#:82
Mahn,A.,et al.(1995)."Transient gene expression in shoot apicalmeristems of sugarbeet seedlings after particle bombardment."Journal ofExperimental Botany 46(10):1625-1628/Record#:2367
Martin-Ortigosa,S.,et al.(2014)."Proteolistics:a biolistic method forintracellular delivery of proteins."Transgenic Research:1-14/Record#:2260
Matthys-Rochon,E.,et al.(1998)."In vitro development of maizeimmature embryos:a tool for embryogenesis analysis."Journal of ExperimentalBotany 49(322):839-845/Record#:2285
Mauney,J.R.(1961)."The Culture In vitro of Immature Cotton Embryos."Botanical Gazette 122(3):205-209/Record#:2409
McCabe,D.E.,et al.(1993)."Transformation of elite cotton cultivarsvia particle bombardment of meristems."Nature Biotechnology 11(5):596-598/Record#:2404
McCabe,D.E.,et al.(1988)."Stable transformation of soybean(Glycinemax)by particle acceleration."Nature Biotechnology 6(8):923-926/Record#:2391
Muniz de Péadua,V.,et al.(2001)."Transformation of Brazilian eliteIndica-type rice(Oryza sativa L.)by electroporation of shoot apex explants."Plant Molecular Biology Reporter 19(1):55-64/Record#:2412
Naseri,G.,et al.(2014)."In planta transformation of rice(Oryzasativa)using thaumatin-like protein gene for enhancing resistance to sheathblight."African Journal of Biotechnology 11(31)/Record#:2411
Neuhaus,G.,et al.(1987)."Transgenic rapeseed plants obtained by themicroinjection of DNA into microspore-derived embryoids."Theoretical andApplied Genetics 75(1):30-36/Record#:2123
Obert,B.,et al.(2008)."Genetic transformation of barley microsporesusing anther bombardment."Biotechnology Letters 30(5):945-949/Record#:2068
Olvera,H.F.,et al.(2008)."Floral and Inflorescence Morphology andOntogeny in Beta vulgaris,with Special Emphasis on the Ovary Position."Annalsof Botany 102(4):643-651/Record#:2372
Rajasekaran,K.(2013).Biolistic Transformation of Cotton ZygoticEmbryo Meristem.T Transgenic Cotton.958:47-57/Record#:2403
Ramakrishna,S.,et al.(2014)."Gene disruption by cell-penetratingpeptide-mediated delivery of Cas9 protein and guide RNA."Genome Research 24(6):1020-1027/Record#:2287
Ritchie,G.L.,et al.(2007)."Cotton growth and development."Fromhttp://cotton.tamu.edu/mwg-internal/de5fs23hu73ds/progress?id=-gCnQaUKIguBsRa08L1m_QGlEFw5-bHQ3iPfT8R-CI,/Record#:2410
Rod-in,W.,et al.(2014)."The floral-dip method for rice(Oryza sativa)transformation."Journal of Agricultural Technology 10(2):467-474/Record#:2414
Sautter,C.,et al.(1995).Ballistic microtargeting of visible markergenes to the shoot meristem of wheat.Gene Transfer to Plants,Springer:152-156/Record#:2339
Sautter,C.,et al.(1995)."Shoot apical meristems as a target for genetransfer by microballistics."Euphytica 85(1-3):45-51/Record#:2373
Shi,H.,et al.(1996)."Exine-detached pollen of Nicotiana tabacum as anelectroporation target for gene transfer."Acta Botanica Sinica 38(8):626-630/Record#:2417
Shim,Y.-S.,et al.(2012)."dsDNA and protein co-delivery in triticalemicrospores."In Vitro Cellular&Developmental Biology-Plant:1-10/Record #:1253
Shou,H.,et al.(2002)."Irreproducibility of the soybean pollen-tubepathway transformation procedure."Plant Molecular Biology Reporter 20(4):325-334/Record#:2399
Sivakumar,S.,et al.(2014)."Optimization of factors influencingmicroinjection method for Agrobacterium-Mediated transformation of EmbryonicShoot Apical Meristem in Cotton(Gossypium hirsutum L.cv.SVPR-2)."International Journal of Current Biotechnology/Record#:2420
Touraev,A.,et al.(1997)."Plant male germ line transformation."ThePlant Journal 12(4):949-956/Record#:2380
Twell,D.,et al.(1989)."Transient expression of chimeric genesdelivered into pollen by microprojectile bombardment."Plant Physiology 91(4):1270-1274/Record#:2316
Vain,P.,et al.(1993)."Osmotic treatment enhances particlebombardment-mediated transient and stable transformation of maize."Plant CellReports 12(2):84-88/Record#:20
Wang,J.,et al.(2000)."Transgenic maize plants obtained by pollen-mediated transformation."Acta Botanica Sinica 43(3):275-279/Record #:2418
Wiebold,W.J.(2012)."Arrested Development in the Soybean Field."From
http://ipm.missouri.edu/IPCM/2012/10/Arrested-Development-in-the-Soybean-Field//Record#:2400
Zapata,C.,et al.(1999)."Transformation of a Texas cotton cultivar byusing Agrobacterium and the shoot apex."Theoretical and Applied Genetics 98(2):252-256/Record#:2407
Zhang,C.-L.,et al.(2008)."Efficient somatic embryogenesis in sugarbeet (Beta vulgaris L.)breeding lines."Plant Cell,Tissue and Organ Culture 93(2):209-221/Record#:1461
Zuris,J.A.,et al.(2015)."Cationic lipid-mediated delivery of proteinsenables efficient protein-based genome editing in vitro and in vivo."NatBiotech 33(1):73-80/Record#:2303
序列表
<110> KWS种子欧洲股份公司
<120> 用于植物中的特异性核酸编辑的方法和构建体
<130> KWS0228PCT
<150> DE 10 2015 006 335.9
<151> 2015-05-19
<150> DE 10 2015 014 252.6
<151> 2015-11-05
<160> 61
<170> PatentIn version 3.5
<210> 1
<211> 259
<212> DNA
<213> Artificial sequence
<220>
<223> VP16 activator comprising sequence
<400> 1
ctaagctttc gacggccccc ccgaccgacg tcagcctggg ggacgagctc cacttagacg 60
gcgaggacgt ggcgatggcg catgccgacg cgctagacga tttcgatctg gacatgttgg 120
gggacgggga ttccccgggg ccgggattta ccccccacga ctccgccccc tacggcgctc 180
tggatacggc cgacttcgag tttgagcaga tgtttaccga tgcccttgga attgacgagt 240
acggtgggta gagatcttc 259
<210> 2
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> VP16 activator
<400> 2
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1 5 10
<210> 3
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> VP64 activator with glycine serine spacers
<400> 3
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 4
<211> 615
<212> DNA
<213> Arabidopsis thaliana EAR 1 repressor
<400> 4
atggagagat caaacagcat agagttgagg aacagcttct atggccgtgc aagaacttca 60
ccatggagct atggagatta tgataattgc caacaggatc atgattatct tctagggttt 120
tcatggccac caagatccta cacttgcagc ttctgcaaaa gggaattcag atcggctcaa 180
gcacttggtg gccacatgaa tgttcacaga agagacagag caagactcag attacaacag 240
tctccatcat catcttcaac accttctcct ccttacccta accctaatta ctcttactca 300
accatggcaa actctcctcc tcctcatcat tctcctctaa ccctatttcc aaccctttct 360
cctccatcct caccaagata tagggcaggt ttgatccgtt ccttgagccc caagtcaaaa 420
catacaccag aaaacgcttg taagactaag aaatcatctc ttttagtgga ggctggagag 480
gctacaaggt tcaccagtaa agatgcttgc aagatcctga ggaatgatga aatcatcagc 540
ttggagcttg agattggttt gattaacgaa tcagagcaag atctggatct agaactccgt 600
ttgggtttcg cttaa 615
<210> 5
<211> 972
<212> DNA
<213> Petroselinum crispum Parsley_Ubi4
<400> 5
aaaaattacg gatatgaata taggcatatc cgtatccgaa ttatccgttt gacagctagc 60
aacgattgta caattgcttc tttaaaaaag gaagaaagaa agaaagaaaa gaatcaacat 120
cagcgttaac aaacggcccc gttacggccc aaacggtcat atagagtaac ggcgttaagc 180
gttgaaagac tcctatcgaa atacgtaacc gcaaacgtgt catagtcaga tcccctcttc 240
cttcaccgcc tcaaacacaa aaataatctt ctacagccta tatatacaac ccccccttct 300
atctctcctt tctcacaatt catcatcttt ctttctctac ccccaatttt aagaaatcct 360
ctcttctcct cttcattttc aaggtaaatc tctctctctc tctctctctc tgttattcct 420
tgttttaatt aggtatgtat tattgctagt ttgttaatct gcttatctta tgtatgcctt 480
atgtgaatat ctttatcttg ttcatctcat ccgtttagaa gctataaatt tgttgatttg 540
actgtgtatc tacacgtggt tatgtttata tctaatcaga tatgaatttc ttcatattgt 600
tgcgtttgtg tgtaccaatc cgaaatcgtt gatttttttc atttaatcgt gtagctaatt 660
gtacgtatac atatggatct acgtatcaat tgttcatctg tttgtgtttg tatgtataca 720
gatctgaaaa catcacttct ctcatctgat tgtgttgtta catacataga tatagatctg 780
ttatatcatt ttttttatta attgtgtata tatatatgtg catagatctg gattacatga 840
ttgtgattat ttacatgatt ttgttattta cgtatgtata tatgtagatc tggacttttt 900
ggagttgttg acttgattgt atttgtgtgt gtatatgtgt gttctgatct tgatatgtta 960
tgtatgtgca gc 972
<210> 6
<211> 384
<212> DNA
<213> Arabidopsis thaliana Arabidopsis_U6
<400> 6
ctttttttct tcttcttcgt tcatacagtt tttttttgtt tatcagctta cattttcttg 60
aaccgtagct ttcgttttct tctttttaac tttccattcg gagtttttgt atcttgtttc 120
atagtttgtc ccaggattag aatgattagg catcgaacct tcaagaattt gattgaataa 180
aacatcttca ttcttaagat atgaagataa tcttcaaaag gcccctggga atctgaaaga 240
agagaagcag gcccatttat atgggaaaga acaatagtat ttcttatata ggcccattta 300
agttgaaaac aatcttcaaa agtcccacat cgcttagata agaaaacgaa gctgagttta 360
tatacagcta gagtcgaagt agtg 384
<210> 7
<211> 1502
<212> DNA
<213> Zea spp. Maize_Ubi_Intron
<400> 7
tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat 60
aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta 120
tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag 180
tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt 240
tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc 300
aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag 360
ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc 420
taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat 480
agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa 540
ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgatcgacg 600
agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt cgggccaagc gaagcagacg 660
gcacggcatc tctgtcgctg cctctggacc cctctcgaga gttccgctcc accgttggac 720
ttgctccgct gtcggcatcc agaaattgcg tggcggagcg gcagacgtga gccggcacgg 780
caggcggcct cctcctcctc tcacggcacc ggcagctacg ggggattcct ttcccaccgc 840
tccttcgctt tcccttcctc gcccgccgta ataaatagac accccctcca caccctcttt 900
ccccaacctc gtgttgttcg gagcgcacac acacacaacc agatctcccc caaatccacc 960
cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc tctctacctt 1020
ctctagatcg gcgttccggt ccatggttag ggcccggtag ttctacttct gttcatgttt 1080
gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140
gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200
tggctctagc cgttccgcag acgggatcga tctaggatag gtatacatgt tgatgtgggt 1260
tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc taaccttgag 1320
tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg atatacttgg 1380
atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca tacgctattt 1440
atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca 1500
gg 1502
<210> 8
<211> 360
<212> DNA
<213> Triticum spp. U6
<400> 8
gaccaagccc gttattctga cagttctggt gctcaacaca tttatattta tcaaggagca 60
cattgttact cactgctagg agggaatcga actaggaata ttgatcagag gaactacgag 120
agagctgaag ataactgccc tctagctctc actgatctgg gcgcatagtg agatgcagcc 180
cacgtgagtt cagcaacggt ctagcgctgg gcttttaggc ccgcatgatc gggctttgtc 240
gggtggtcga cgtgttcacg attggggaga gcaacgcagc agttcctctt agtttagtcc 300
cacctcgcct gtccagcaga gttctgaccg gtttataaac tcgcttgctg catcagactt 360
<210> 9
<211> 377
<212> DNA
<213> Oryza spp. U3
<400> 9
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
<210> 10
<211> 763
<212> DNA
<213> Zea spp. U3
<400> 10
gaattccatc taagtatctt ggtaaagcat ggattaattt ggatgcccac ttcaggtcta 60
tgcagctccg gtgccttgtg attgtgagtt gtgaccgatg ctcatgctat tctgcatttc 120
tgcgatgtat gtagctagta gatcttcaaa actaacaccg catgccatca tcatccactg 180
cttgatttta gtctcaccgc tggccaaaaa tgtgatgatg ccagaaacct caactacctt 240
gaatcaacac gggcccaaca gtgtgatgac gacagaaaca aaaaaaaatg agccaatagt 300
tcagaaggag gcactatgca gaaactacat ttctgaaggt gactaaaagg tgagcgtaga 360
gtgtaattac tagtagttta gccaccatta cccaaatgct ttcgagcttg tattaagatt 420
tcctaagctg agcatcatca ctgatctgca ggccaccctc gcttcgctgc caagatcaac 480
agcaaccatg tggcggcaac atccagcatt gcacatgggc taaagattga gctttgtgcc 540
tcgtctaggg atcagctgag gttatcagtc tttccttttt ttcatccagg tgaggcatca 600
agctactact gcctcgattg gctggacccg aagcccacat gtaggatacc agaatgggcc 660
gacccaggac gcagtatgtt ggccagtccc accggttagt gccatctcgg ttgctcacat 720
gcgtagaagc cagcttaaaa atttagcttt ggtgactcac agc 763
<210> 11
<211> 1880
<212> DNA
<213> Brachypodium spp. EF1
<400> 11
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag 1880
<210> 12
<211> 2690
<212> DNA
<213> Maize Streak Virus (MSV) South African Strain
<400> 12
atggatccac agaacgccct gtattatcag ccgcgggtac ccactgcagc tccgacatcc 60
ggaggagtgc cgtggagtcg cgtaggcgag gtagctattt tgagctttgt tgcattgatt 120
tgcttttacc tgctttacct ttgggtgctg agagacctta tcttagttct gaaggctcga 180
caaggcagat ccacggagga gctgatattt ggtggacaag ctgtggatag gagcaaccct 240
atccctaatc taccagcacc accaagtcag ggcaatcccg ggccatttgt tccaggcacg 300
ggataagcaa tcagccatgt ccacgtccaa gaggaagcgg ggagatgatg cgaattggag 360
taagcgggtg cctaagaaga agccttcttc agctgggctg aagagggctg gaagcaaggc 420
cgataggcca tccctccaaa tccagacact ccagcatgct gggaccacca tgataactgt 480
cccatccgga ggagtatgtg acctcatcaa cacctatgcc cgaggatctg acgagggcaa 540
ccgccacacc agcgagactc tgacgtacaa gatcgccgtc gactaccact tcgttgccga 600
cgcggctgcc tgccgctact ccaacaccgg aaccggtgta atgtggctgg tgtatgacac 660
cactcccggc ggacaagctc cgaccccgca aactatattt gcctaccctg acacgctaaa 720
agcgtggccg gccacatgga aagtgagccg ggagctgtgt catcgcttcg tggtgaaacg 780
gcgatggttg ttcaacatgg agaccgacgg tcggattggt tcggatatcc ctccctcgaa 840
tacaagttgg aagccttgca agcgcaacat ctacttccac aagttcacga gtgggttggg 900
agtgagaacg cagtggaaga atgtaacgga cggaggagtt ggtgccatcc agagaggagc 960
tttgtacatg gtcattgccc ccggcaatgg ccttacattt actgcccatg ggcagacccg 1020
cctgtacttt aagagtgttg gcaaccagta atgaataaaa acgcccgttt tattatatct 1080
gatgaatgct gaaagcttac attaatatgt cgtgcgatgg cacgaaaaaa cacacgcaat 1140
caatacaggg gggtagtcgg cgggcggcta agggtggtgc tcggcgggca aaacatcgaa 1200
aaatcaagat ctatatgaat tacacttcct ccgtaggagg aagcacaggg ggagaatacc 1260
acttctcccc cggcgacata atgtaaatga tgcagtttgc ctcgaaatac tccagctgcc 1320
ctggagtcat ttccttcatc caatcttcat ccgagttggc gaggattatt gtaggcttag 1380
acttcttctg cacctttttc ttcttaccat acttggggtt tacaatgaaa tccctctgac 1440
agccaactaa ctgtttccaa caaggacaga atttaaacgg aatatcatct acgatgttgt 1500
agattgcgtc ttcgttgtat gaagaccaat caacattatt ttgccagtaa ttatgaaccc 1560
ctaggcttct ggcccaagta gattttccgg ttcttgttgg gccgacgatg tagaggctct 1620
gctttcttga tctttcatct gatgactgga tacagaatcc atccattgga ggtcagagat 1680
tgcatcctcg agggtataac aggtaggttg aaggagcatg taagcttcgg gactaacctg 1740
gaagatgtta ggctggagcc aatcattgat tgactcatta caaagtaaat caggtgagga 1800
gggtggatga ggattggtga actcttcctg aatctcagga aaaagcttat ttgcagagta 1860
ttcaaaatac tgcaattttg tggaccaatc aaagggaagc tctttctgga tcatggagag 1920
gtactctgct ttggaagtag cgtgtgaaat aatgtctcgc attatttcat ctttagaagg 1980
ctttttttcc tttacctctg aatcagattt tcctaggaag ggggacttcc taggaatgaa 2040
agtacctctc tcaaacacag ccagaggttc cttgagaatg taatccctca ctctgttaac 2100
tgacttggca ctctgaatat ttgggtgaaa cccatttata tcaaagaacc ttgagtcaga 2160
tatccttacc ggcttctctg tctgaagcaa tgcatgtaaa tgcaaacttc catctttatg 2220
tgcctctcgg gcacatagaa tatacttggg aatccaacga acgacgagct cccagatcat 2280
ctgacaggcg atttcaggat tttctggaca ctttggatag gttaggaacg tgttagcgtt 2340
cctgtgtgag aactgacggt tggatgagga ggaggccata gcagacgacg gaggctgagg 2400
ctgagggatg gcagactggg agctccaaac tctatagtat acccgtgcgc cttcgaaatc 2460
cgccgctccc ttgtcttata gtggttgtaa atgggccgga ccggtccggc ccagcaggaa 2520
aagaaggcgc gcactaatat taccgcgcct tcttttcctg cgagggcccg gtagggaccg 2580
agcgctttga tttaaagcct ggttctgctt tgtatgattt atctaaagca gcccaatcta 2640
aagaaaccgg tcccgggcac tataaattgc ctaacaagtg cgattcattc 2690
<210> 13
<211> 6337
<212> DNA
<213> Maize rayado fino virus (MYDV)
<400> 13
gtcctctgcc cccttcttgc gcccgatcgc cgcaagtcgc attctgcacc agctctcgct 60
cgtccagaaa cagatcaatc tttcggcctc ttttcttgca ctcttcttcg ttgcacctct 120
ctagatgtct agtttcctgc gtggtggcca tctcctcagc ggagtcgagt ccctcacacc 180
aaccactcac cgcgacacca tcactgcacc catcgttgag tcccttgcca ccccccttcg 240
ccgatccctc gaacgctacc cttggtccat cccaaaggag ttccattcgt tcctccatac 300
ctgtggcgtc gacatctccg gcttcggcca tgccgctcat ccccaccctg tccacaagac 360
catcgagacc cacctccttc tcgatgtctg gcccaattac gcccggggct tgtctgatgt 420
catgttcatc aagcccgaga agttcgccaa gctccagtcc cgacagccca atttcgccca 480
cctcatcaac taccggctcg tgcctaaaga caccacccgg tacccttcca cttccacgaa 540
tctcccggac tgcgagaccg tcttcatgca tgatgcgctc atgtactaca ccccagggca 600
gatcgctgac ctcttcttcc tttgccccca gctccagaag atctacgcct cgctggtcgt 660
ccctgcagag tcgagtttca cgcatctctc gctccatccg gaactttacc gcttccgttt 720
ccagggttct gaccttgtct acgagccgga gggcaaccct gccgccaact acacgcagcc 780
gcgttcggcc ctcgactggc tccagaccac cggcttcacc gtcggtcacg aattcttctc 840
cgtcacactt ctcgactctt tcggcccggt ccattccctc ctcatccagc gtggccgccc 900
ccctgtcttt caggccgaag acgtcgcttc cttccgcgtc ccggacgccg tcgccctccc 960
tgctcctgcc tccctccacc aggacctgcg tcaccgactg gtcccccgca aggtgtacga 1020
cgcactcttc aactacgtcc gagccgtccg cacccttcgg gtcacagacc ccgctggttt 1080
cgtccggacc caggtcggta agcctgagta cagttgggtc acctcttccg cctgggacaa 1140
tctccagcac ttcgcgctcc agactgccgc cgttcgtccc aacacctcgc atcccctctt 1200
tcagtcgccc ttcgcccgtt tgtcccattg gctccgcacc cacacttggg cgctctggtg 1260
catggcttcc ccctcggcct ctgtctccgc ttgggccgct gccagcgctc ttggccggct 1320
cctcccgctt cacaccgacc gtctcaggtt gttcggcttc gacatcgttg ggcggagatt 1380
ctggcctcgt ctcccattcc atggccccga gccaaggttc ctttgggaga cccatccagc 1440
ctgccgcccg ccagtgctct tcgccgactc ggcctttgag tgccaaatcc ttgctggttt 1500
ggcaaaccgg tgttctccct cccccttctg gtcgcgcttg ttccccacgg cctctccgcc 1560
gcactgggtc gcctattcag ccttggccct agctgcagtg ccacttgctg cgttagcgtt 1620
gcgctggttt tacggcccgg attctcccca ggctcttcat gatcagtacc acgccacctt 1680
ccatcccgac ccgtggactc ttgacctccc ccgccggctt cgccgcttcg agcgcgagcc 1740
cttcatgcgg acgggttccg caccttcgcc tcagtcgctc cctccttctg gaggctctct 1800
tcttcctgtc gagcctcctc ttgcttcgag cgagcccgag cctgcccttg agccgccatc 1860
ccccgcggcc ccggtcccga ctccttctcc agctccagtt ccagagcctc ctccttctcc 1920
cgagtcagtc gcccctccag tcgccgtcgc ctcgcccgcc gtgcaacctg ttcgggctcc 1980
gtccccctct ccagcgcttt tgggcgccga gcttcgtttc ggggatcttc ctcctgtctc 2040
tgcttgggac agtgaccccg agatttcgaa gcttggtgag tccacccaag gcaccgtttt 2100
tgctgtcacc cccggccctc gcgctcctga gccagacact gcccgcttag acgctgatcc 2160
ttcggctagc ggccccgtta tggagttccg cgagcttcag aagggcgctt acatcgagcc 2220
gactggcgct ttcctcaccc gggctcgcaa ctcggtgtcc tccagcatcc cttatcctgc 2280
gagggcggct tgtcttctcg tggccgtcag tcaagcaaca gggctcccca cccgcactct 2340
ctgggctgcc ctctgtgcta atcttccgga ttccgttctt gacgacggct cgctcgccac 2400
cttgggcctc accaccgacc acttcgccgt cctcgcccgc atcttctcct tgaggtgccg 2460
cttcgtgagt gagcatggcg atgttgagct cgggctccac gacgccacct ctcgctttac 2520
gatccgccac acccccggcc acttcgagct cgtggccgac aacttctccc ttcccgctct 2580
cgtcggcgcc tcttctgttc caggctccga cctagccgaa gcgtgcaagc gtttcgtggc 2640
tccggaccgc accgttcttc cattccggga cgtccacatc catcgcaccg acgtccgccg 2700
tgccaaaaac ctcatttcca acatgaagaa cggcttcgac ggtgtcatgg cgcaggccaa 2760
tcctctggat ccgaagagtg cccgagagcg gttcctcatg ctcgactcct gcctcgacat 2820
tgccgcgcct cgccgggtcc gtcttatcca catagcgggc ttcgctggtt gcgggaaatc 2880
ctggccgatc tcccatctgc tccgtacccc cgccttccgt gttttcaagc tcgccgttcc 2940
aaccaccgag cttcgcgacg agtggaaggc cctcatggat cctcgcgacc aggacaagtg 3000
gcgcttcggc acctgggagt cctctctcct caagactgcc cgcgtccttg tcattgatga 3060
ggtgtacaag atgcctcgcg ggtaccttga tctggccatc catgcggacg ccgccattca 3120
gttcgtgatt ttgctcggcg atccaattca aggcgagtac cattccacac atcccagctc 3180
ctccaatgcc cgcctttctc ccgagcatcg gtatctccgc ccgtatgtgg acttctactg 3240
cttctggagt cgtcgcatcc ctcggaacgt ggcccgcgcc ctcgatgtgc ccacgacctc 3300
gaccgagatg ggttttgctc gctactcgca gcagttccca ttctccggga agatcctcat 3360
ctcggcgcgc gactccgcca agagcttggc tgactgtggt tatcatgctg tcaccatagc 3420
tagcagccaa gggtccacta ttgccggccc agcttatgtc cacctcgaca atcattcgag 3480
gcgcctctca catcaacatt cgcttgtcgc catcactcga tccaagtccg gcatagtatt 3540
cactggcgac aaggctgcag cggatggcac ctcctctgct aatctccttt tctccgctgt 3600
gctcctcgac cgacgcctct cggtgcgctc tctcttcagc gcgctcctgc cttgctgtcc 3660
gtttgtcacg gagcctccaa cgtctcgagc cgttctcctt cgcggagccg gctacggcgt 3720
cgctcggccc cttcgcgctc gtgacgcccc tcctctcggc cccgatttcg tcggagatgt 3780
tattctggac tcctccgccc cgattcttgg cgacggatcg gccaacgctc cccaggtcag 3840
cactcacttt cttccagaga cgcgtcggcc tttgcacttc gacatccctt ccgcccgcca 3900
tcaagtggcc gatcatcctc tcgcgcccga tcactccgcc tgcgctatcg agcccgtgta 3960
ccctggcgag agcttcgaat ctctggcctc tcttttcctc ccccctacgg atgccgagag 4020
caaggagact tacttccgag gggagatgtc gaatcaattc cctcatctcg acaagccgtt 4080
cgagttaggt gcgcagacgt cgagcctcct cgcgccactc cacaactcca aacatgatcc 4140
cacgcttctc ccggcttcca tcggtaagag actgcgcttc cgtcactcag aggctcccta 4200
cgtcatcgct cctcgcgacg agatcttggg gtcactcctc tatgaggcct ggtgtcgagc 4260
ctatcgccgt tctcctcggg acgtcgagcc gttcgaccca gacctctacg ctgagtgcat 4320
taacctcaac gagttcgcgc agctctcctc caagacccag gcgactatca tggccaacgc 4380
caaccgcagc gacccagact ggcgctggtc cgccgttcgc attttcgcca agacgcagca 4440
taaggtcaac gagggctcgc ttttcggctc ctggaaagct tgccagaccc tcgcgcttat 4500
gcacgacgcc gtcgttttgc tccttggccc cgtcaagaag tatcaacgct tcttcgacca 4560
gcgcgatcgg ccttccactc tttacgtcca tgcgggccac acccccttcg agatggctga 4620
ctggtgccgc gcccatttga cccccgcggt caagctggcc aatgactaca ccgcctttga 4680
ccagtcacag cacggcgagg ctgttgtctt cgagcgctac aagatgaatc gtctctcaat 4740
tcctgccgag ctcgtggact tgcacgtcta tctgaagacc aatgtctcca cccagtttgg 4800
cccgttgacg tgcatgcgcc tcactggtga gcccggcacc tacgacgaca acaccgacta 4860
caacatcgcc gtgctccatc tcgagtacgc tgtcggctct actccgctca tggtctctgg 4920
tgatgactcg ctgctcgact ccgagcctcc tgtccgtgac cagtggtccg ccatcgctcc 4980
catgctcgct ctcaccttca agaaggagcg cggccgttat gccacttttt gcggctatta 5040
cgtcggcttc accggcgcgg tccgatcgcc tccggccctt tttgcgaagc ttatgattgc 5100
ggttgacgac ggatccatct ccgacaagct catcgcctat ctcacggagt tcaccgttgg 5160
tcattcttcc ggcgatgctt tctggaccat cctcccagtc gaagctgttc cttaccagag 5220
cgcctgcttt gacttcttct gccgtcgagc tccggcgcaa gccaaagtga tgttgcggct 5280
tggcgaggcc ccagagtctc ttctttccct ggcgttcgag ggtctgaagt gggcttccca 5340
ctcggtgtac gcccttatga attccagtca ccgacgccag ttgcttcata gctcccgccg 5400
ccctcgctct ctccccgagg accccgaagt gtcgcagctt cagggtgaat tgcttcatca 5460
gttccaatcg cttcacctcc cgcttcgtgg tggcctcatg ccaaatccgc tcgctgcgcc 5520
cttcaggctc cttcagcaaa gcagctccct tggtcccact tacgcagtcg cccccatcgc 5580
tcgcgctccc caggtccctc tgccctctat ggccgacaat gccacccaag tcgggcctgt 5640
tcctcctcgc gacgaccgcg ttgatcgcca gcctcctctt cctgatcctc ctcgtgtgct 5700
cgagacgacc ccgtcgcact tcctcgacct ccctttccaa tggaaggtca cggacttcac 5760
aggatacgcc gcctaccacg gaaccgacga cctgtccgcc tccgcggtac tgaccacgct 5820
ctgtgctccg taccgccacg ccgagctcct ctatgtcgag atctccgtcg ctccgtgtcc 5880
cccgtcgttc tccaagccca tcatgttcac cgtcgtctgg acaccggcca ccctgtcccc 5940
cgctgacggc aaggagaccg actactacgg gggccgtcag atcactgtgg gcgggcctgt 6000
cctgttgtcc agcaccaccg ccgtacccgc agacctggcc cgcatgaacc ccttcatcaa 6060
gtccagcgtc tcctacaatg acacgccccg ctggaccatg tctgtccccc ccgtcaccgg 6120
tggggacacc aagatcccgc tcgccactgc cttcgttcgc gggatcgtcc gcgtgtcagc 6180
cccctctggg actgccaccc cctctgcctg atccatcaag gcagcaataa tgcgagaagg 6240
aaaactcgcc cagccttgag ctggtaagct gttaaacctc cgcccatcca tgtttgcaaa 6300
atctaaggta gcaggtcggc cataagacct gtgggcc 6337
<210> 14
<211> 5612
<212> DNA
<213> Maize yellow dwarf virus (MYDV)
<400> 14
acaaaagggt tctagaggga ccctttatag cactcttctt tcaccagaag tttcatgcgc 60
tgtgagattc actttgacgg gacactcacg tttgctgaaa tcccccgtga tctcacaatc 120
cgccttttag agtttcaaac agctctaaga accatcgctt gttgtgttct caaccaacga 180
tacgatgctg aaactctggt gcgctctgct tttactattc tgcctctcat gctccgtgaa 240
ctcccattca cttgggagtt ccctagtgcg gtacacgccg cctttgcgaa gcatgcgtta 300
cgtaccgccg gcagaatacc tcctcccatg gaactcatct tccatggtga cacgccaaaa 360
cacatgtata gagatttcct ataccgcgtt gtcacgagag atattgcagc tagcctacag 420
agatctcacg agaatttcat ctgtggctat aaacgcttcc aactccggct ggaaagtgtt 480
tgcagaagag ttgagctcct tggtgacaca tttgcaccaa aacatatcga ggagctttca 540
tggtcttcgc ggactcgcgg tggacggggt gcaggcgctc gcaggaggct tcctgctcgc 600
tgtaatctac acctggagct acttgatatc gctgctcttt tgggttgtta caaccctggt 660
atgcagatat acgttccaga tgtcatcgat cgcctgtctc tacgtctgta caatgctctt 720
ggtccggctg gcttcaaaga tttttggagg gtggccggtt atgatcatct cgctgattgg 780
gactctgaca tcgaagctct ttcgggctct gtcattcaaa aagagctcaa tctcctttga 840
gatccctacc ccagggtaca agacagtaga gatacctcag aaaccaccca aagattgcgt 900
cttgctggtt caacacaacg acgctctcaa ttcccctgga ggatacgcat catgtgttcg 960
actcctcaac ggaagcaatg ctttgctcac tgcaaaacat gtttccaccc aggaaggtga 1020
tttgctcatc gcttcatcca gaactggaaa caggatcaag ttgtcattgt tcaacacaat 1080
cctaaccaca aagaattccg acgtgggtct ttatcaagga cctccaggtt gggaatcaat 1140
tcttggatgt aaagctgcag acatcgtacc agtggatggg ctctcatgtt gtgaggcctc 1200
catttatagg catgatggca actggatgcg ttccaacgca tccttggtcg gaacagaagg 1260
cacttttgtc tctgttttga gcaacaccat tgagggtttt agtggaactc cctattttaa 1320
cggaaaatcc attttgggag ttcatgtggg aggcaatgaa accagaacta acaatctgat 1380
ggcccccata cccagcatcc caggcctaac aaaacacaaa tatgtgtttg aatcgccaca 1440
actcagaggc cgcctgttta cagacgagga agttgagaaa ctcgaattcg agattgatga 1500
agctttccag aaagctcata atctcataca tttcaaatct aaaacaggaa gaaactgggc 1560
tgatgatgag gatgacatcc actttgaagc tccaaagttt cagggaaacg acgcacgcgg 1620
tcccgtccgc gaaaacaaaa cggtctctcc cacccctaca cactcgcccg tcgttacttc 1680
aggcaacgac actctcaaca aggtggtgga agcgttggtc tcgaagatcg acgtctcagt 1740
aatcgagcgg atggttgttc aaaagatctc ggaatcagct ttgaaacgcc caacgaacaa 1800
caatcggaaa cacaggcgaa agcccaaaac ttctcagcct actttgcctc cctctacaga 1860
tgggaggtac gtggcgcccg ctcgcagatc cccggcttcg aagcctgcgg atccctcccc 1920
aaatactact tcacaaaaca aaaagaagaa tcagagtggg ggaggttact tgcagaggga 1980
aacccggcgc tggcaagtaa agtcagcggc ttcgggtggc cccaattcgg acccgaggcc 2040
gaattgaaga gcctgcgcct tcaggcgcag agatggctct cacgcgcgga gtttgctaaa 2100
atcccgtcat ctgaggacag ggagcgcgtg atccggaaga ctgtggaggc atacaaaact 2160
tgccaaactc aatgccccaa gacttctcaa agcaacctgc ttgtgtggga agactttctc 2220
gaagatttca aacaagcagt gttctccctc gagcccgatg ccggtgttgg tgttcctttc 2280
gtgggatacg accggcgtac gcaccgtgga tggatcgaag atccaacact tctgccagtt 2340
cttgcccgca tgaccttcga ccgattacat aagatgtcga cggttaagtt tgagcaactt 2400
acagcagaac aattggtgca acagggcttg tgtgacccga tcagactatt tgtcaagggg 2460
gaacctcaca agcagtcaaa gctcgatgaa ggccgctacc gcctcattat gagtgtttcg 2520
ttgctggatc aactggtagc ccgggttctg tttcaaaatc agaacaagag ggaaattgca 2580
ctatggcgag ccataccctc aaaacccggt tttgggttgt ctacagacgc ccaatcgcga 2640
gaatttgtgc agaatctcgc gaaacagtgt ggggtcaaca cgactgaact tttggcaaat 2700
tggccaacct acactgttcc gactgactgc tctggtttcg actggagtgt tgcggattgg 2760
atgctccagg atgatatgga ggtccgcaac cgactcactc gcaacaacac agatctcacc 2820
aagcgcttgc gcgcttgctg gttgaaatgt atatccaatt ctgtgttgtg cttgagtgat 2880
ggcactctgc tagcccagcg catagcggga atccagaaat ctggttctta caacaccagt 2940
tcgagtaact ctcgaatccg agtgatggcc gcatatcatt gcggtgctac ctgggcgatg 3000
gctatgggtg atgatgcact cgagtcagtc gacacgaacc tagacgtgta taaaacacta 3060
ggattcaaag tcgaggtctc caaacaactg gagttttgtt ctcatatctt cgagaaggaa 3120
gaccttgctc gcccggttaa ccaaaacaag atgatctaca aactcttaca tggttacaac 3180
ccggcgaacg gctcttcgga ggtgatacag cgttatcttg acgcatgtat gagcgtactc 3240
aacgagttgc gccacgaccc cgaaaccgtt gagcttctgt accagtggct ggtcgctcca 3300
gtccagaaac aaaaagttta aaacagaagc tctcaagtca gccaggcaaa ttcgagttgc 3360
aagcactgga tgacctagtc tcgatacata aaccaccacg gattacaagt tcttagccgg 3420
gatcactctc ggcctttgca tcacattccc atttataatc cttggtgtgt acaaagtcta 3480
ccgtacggtc tccaacgata caagcaaact cgctaatgaa tttgggaggc cgtagaaatg 3540
gacgacgtgg aacacggtta cgcagacgcg tacgcattgc tcgcaccacc caaccaatgg 3600
ttgtggtcgc gcaaacccag cgtagacgcc gcatccgaag acgaggacga ccaagtggag 3660
acacttcagg aggacctcga gggcgaggag gctcgcggga gactttcgta ttttcgaagg 3720
attctatcgc gggcagtgcc tccggaaagc tcaccttcgg ggcgtctctt tctgagtgcg 3780
cagcattctc tggtggaatt ctcaaggcct accatgagta taagatcaca aaagtcatac 3840
tggagttcat ctccgaggcc ccttacaccg cagccggttc catcgcttat gagcttgatc 3900
cccacaacaa gctcagcacc ctcgcatcaa caatcaacaa attctcgatc gtcaagggtg 3960
gcaagcgtgc ctatacgtcc aaacaaatcg gaggtggagt atggcgagat tcgtccgaag 4020
accaatttgc aatactctac aagggcagtg gaaactcctc agttgccggc tcgttccgca 4080
tcacgatgga ggttcatacc caaaatccga aataggtaga cggagcttcc cctgcaccag 4140
acccaacacc gacaccaacc cccactccaa cacctactcc aactccaacg cccactcctg 4200
tgactcagga agccttctac ggctattctg gtgtcccaga atgtaagatc cagtccagaa 4260
agaactcgga attcatcgat atctattcgt tgaatttcgt taaattgttc tactggagag 4320
atgaggcgtg gagctcggag accctttcgg cgggatacat acaaaatgat tcgctccgcg 4380
caacccccta ccttttggtt ccgaccaaga agggaaaata ctctgtttat atagagtgtg 4440
agggttttca agcggttaaa gctaagggtg gtaacaacga cggcaagatg agtggttttg 4500
tcacgtatga taaagatcaa agcggttggc aagtgtactc atgggctggt tgctctctct 4560
cgcagatcaa agttaaagac actggtgtcg tggctcatcc cgacatgaag gtgaatggtt 4620
gctctttcac caaaggccaa cttattgaga gagattttat ttgttcgttc catctcgaag 4680
ctacggaaga tggatattgg gctttgcaag cccccccagt agagaagtct gatgaccaca 4740
attttattgt gtcatacggt tcttacaccg aaaagattct tgaatggggt tcagtatcca 4800
tatcaataga tgagataaat cgaacagaag ctcgcaagat tccgaaaagg gataaggatc 4860
tatcacaaag tggacgtttg gccgacatga ccaacgtccc cacagtgggg gtggttgtag 4920
cagcgaccac gaaaccggac ctgccggtag aacagccaaa ccagttggct gtggtggagc 4980
aacccactga agagcaacaa aagaaaaggg cgactatcga ccaatggctc gatgccgttg 5040
aagctcttgc tcccccagaa cctgaagggt tggtgacaca ggtgagacta ccaacagcag 5100
ctgaacgagg tttgacctcg caaaagctac ctttgcacca acgtggaacc ttcaaagacc 5160
tcgccaaccg agacgctgat acatacagtg tcgcatctcg tggattgact gggggcttga 5220
gaggaactcc cgcaacacct caggttgaaa cgattgagga gaaccccgtc caagtggacg 5280
atgattccaa atctctcgtt tcaagctcgt caaggcttac aggcggtctt cgtcttagaa 5340
cttcatatcg catgaccact caagaggcca agcaatatga tgagatcaga cgaagctttg 5400
gtaaagcacg cgcaaaagcc tattatgacg atttgtgtaa ggcgaactgg tattagccca 5460
cacaccctgg tcagggtcac agaccactcg ccggagtata aacgagatag gatggcaacc 5520
tagccactcc ccttcctccc gatgggaaat agggtgagtt ccaagcccaa ggaatgagat 5580
ttcagtgcaa tttttccact gaaatctatg gt 5612
<210> 15
<211> 9515
<212> DNA
<213> Maize dwarf mosaic virus (MDMV)
<400> 15
aaaaacaaca agactcaaca caacacaacc aaacacgacc aaacacaacc aaattacacg 60
ttattggagc acattcagtt tgcaggcaac ggttcgtttg caaggtgcat cgaaaagcct 120
ctctgaacac acgatcgcaa tggcaggaac ttggacccac gttactcaca agtggcagcc 180
aaaccttgac aaccctcgtg acgtcaggag aatcatggag ctgttcgctg caaagggcca 240
ggtctatgac gagaagcgag ctctggagca caacagtaaa ttacttcgta gagctcaggt 300
ggtggatgtc gaaccaatga tcacggttca accaaagaag tgtgcacaga tatggaaaga 360
ggtggtggat cataatccaa cacaccattt cgtgtacgca cgtttctctg aggttaagaa 420
gcaacagcct accaaaccag ttgcaacctc agttaataaa ctagtgagaa agactctaga 480
aatacgagag aattttccag tgaatgttga gtttattgga aagaaacgca agaacactac 540
gagagtctca ctgaggaaag tttttaacaa aactttctta cactgtggca cgcgacatga 600
gaacaaccaa ttcaagcgag ttgacacaaa catcactcga gattggattc cagtgctatc 660
aagcgtagca aaatgttatg cgacactgtc gtctaacatg atgcacaaca tacacaaagg 720
gcacagtggt ctaacgttca ttcaaaatgg tgaacttttc atagtccgag gaagacttag 780
aggtgaacta tgcaatagct tggactgtac aaaggaagtt caggagatag aacactacgc 840
agacccacag gcagctgatt tttggaaggg atacactaat gcatatgttg agaatagaaa 900
tatttcaacg acgcatacag agcatacgcc tacaatgaac ttagaaaagt gtggcaagcg 960
tatggcgtta ttggaagttc ttttccattc aacgttcaaa atcacatgca agcattgtaa 1020
cactgatgat cttgaattat cagatgatga attcggagaa aaactttaca agaacattca 1080
gcgcatcgaa gagcaacaga gtgaatatct agccgaggac caaaaactca aacgggtgtt 1140
atcattcatc aaggctagat gcacaccaaa gtttgatcac ttacctatga attggcaagt 1200
cgcagacatc attggacatt attcagataa tcaagcaaaa caaattttag atgtcaatga 1260
agcactgatt aaagtgaaca cactcacacc ttcagatgca ttaaaggcaa gtgcagctct 1320
tctcgagtta tcgagatggt ataagaatag gaaagaatca acaaaagagg acaacttatc 1380
cactttccgc aataagatat ctccaaagag cacgattaac ttagcattaa tgtgcgacaa 1440
tcaactcgat tcaaatggta actttgtttg gggaaagagg gaatatcatg caaaaagatt 1500
cttctcaaac tactttgaag ctgtggatcc agctgattca tatgaaaaac acgtaacacg 1560
ctttaatcca aacggacaaa gaaaattatc tatcggaaaa ttggttattc ctttggactt 1620
ccaacgtatc cgtgattcat ttgctggcat acctgtaaca aaacaaccgc tttcaaatgc 1680
ttgtctgagc agaatagaca aaacctacgt ctacccttgt tgctgtgtaa ctacagagtt 1740
tggacaacct gcatactcag aaataatacc tccgacaaag gggcatttaa ccattggtaa 1800
ttctgtggat ccgaagattg tcgatctgcc aaacacagac cctccaacga tgtatatttc 1860
gaaggacgga tattgctata taaacatttt cttggcagcc atgataaatg ttaatgagga 1920
ttcagctaag gattacacaa aattcatcag agatgaactc atagagagac ttggtaaatg 1980
gcccaaactt aaaaatgtag ctactgcatg ttatgcactt tctgtaatgt tcccagagat 2040
caagaacgct gagttacctc aaatcttggt tgatcatgaa aataagacaa tgcacgttgt 2100
ggattcatat ggatcactaa gcgttggcta tcacatcttg aaagcgaata ccgtgggaca 2160
actcatcaaa atgcagtacg agtcgatgga aagcgagatg agagaatatg cagttggtgg 2220
tacaataaca cacaaatcat tttccacctt aattagccat ctaatcaaga atatgtttaa 2280
gccacgtgaa atgcggaaaa taattgaaga agaacctttc ttaattatgc tatctgttgt 2340
atctcctact gttcttatat ctctatataa taattgtcac attgagaatg caatggcgta 2400
ttggataacg aagaatcaag gagtagcagc aatgttcgca caattggaag cccttgcaaa 2460
agaaacatca aaggcagagc ttttaatcca gcagatgaca atattagaga aagcttctaa 2520
tcagctaaaa ttggccgtga tgggtctaaa tcatgttgac ccagctaagc gattgctttg 2580
gtcacattta gaagtcatgt cgtcgagggc agccacaaat aaagatcttc tagaccaagg 2640
ctacgctcta tatagcgata ggttgtatgc catcatcgaa aaaacctatg tagatcagtt 2700
gaatcaagcg tggacagaat tatcattgtt tggaaaattc tccgaaacat ggcgtgtgta 2760
caaggacaag aaatactaca agccatcttt aatcctgcaa agaagcgtag atttaggcgc 2820
tgtctacaat atatcagtta cgcatcaaat atcaagttta gtgcagaaaa gtcgcagtcg 2880
agtcagctct actttaacca aactccacca aggttcatgt gataaactat atagtttgcg 2940
tactaaagct ataaatacaa tttattggtt tgttcctgat attttccgac ttattcacat 3000
tttcatagta ctaagtttat tatcaacagt agctaatact attatagtaa caatgcaaga 3060
ttacaagaaa ttacaaaaac aagttcgtga ggaagaatat gaaaaggaaa taagcgaagt 3120
acgcgctata cacgcgaagt tgcttaaaat acatgataac gaactcactt gcgaacagtt 3180
cctgcagtac attaacgaaa atcatccaag attaattgaa gcagctgttg aactatcagg 3240
agtgggtgtg atacatgagg gcaagtccaa ccttgaaatc aatctagagc aagcgatggc 3300
tattggaaca ctaatcacaa tgatatttga ccctacaaag agcgatgctg tatacaaagt 3360
attaaacaaa atgagaacaa ttttgagtac agttgaacaa gatgcacctt tcccacgcat 3420
tgatttcacg aatatctttc ggtcgcaggt aacccaccaa agtttagatt tggacgaccc 3480
tctcactatc aatactgata agaagcttac ggtggatttc gacacaaccc aagatcttcc 3540
agcagatact tttagtaatg atgtgacatt tgatcaatgg tggtcgaatc aactcgaaaa 3600
caatagaact gttccgcact acagacttgg tggtgagttc attgaattca cacgagaaaa 3660
agcagcatct gttagcatca gtatagcaca ttcgcaaatt gagaaagaat atttactcgg 3720
aggagcagtc ggttcgggaa aatcaacagg tttaccatac catttgagcc agcgaggaaa 3780
agttctttta ttagagccga cacgaccact cgcagaaaac gtctgtagac aactacaagg 3840
ggcaccgttc aatgtaagtc ctacgctaca gatgagaggt ttgagctcct ttggatcaac 3900
gcccattaca ataatgacat caggctttgc acttcatatg tacgcaaaca atccagacaa 3960
attgtcaaat tatgactttg tcattttcga tgaatgtcat attatggaag ccccagcaat 4020
ggccttttac tgtttgctaa aggagtacgc atttgatggg aaaataatta aggtctcagc 4080
cacaccacca ggaagggaat gtgaattctc tacgcaacac ccagtcgata ttcacgtttg 4140
cgagaattta actcaaaacc aattcgtgct tgaacttggg actggatcaa aagctgatgc 4200
cactaaatac ggtaacaaca ttctggttta cgtggctagc tacaacgatg ttgattcatt 4260
ggcaagagca ttaattgagc gacattattc agtgatcaaa gttgatggca gaacgatgaa 4320
gcagaacaca agtggaatcc atccaaacgg acatgatgga aagaaatgtt tcatagttgc 4380
caccaatatt atcgaaaacg gagtaacatt ggacgtcgac gtcgttgttg actttggcct 4440
taaggttacg gctgaattgg acgttgataa tagagcagta atgtatcgta aagtgagcat 4500
atcttatggt gagagaatcc aacgacttgg aagagttgga agaacaaaac cagggactgt 4560
cattagaatt ggaacaacca tgaagggact tcaagagata ccagctatga tagcaactga 4620
agcagctttc ctttgtttcg catatggcct caaggttata acacataacg tttcaactac 4680
acacctatcg aaatgcacgg ttaagcaagc gagaactatg atgccatttg agctttcacc 4740
attcattatg tctgaattag tcaaatttga tggctcaatg catcctcaaa tacatgagat 4800
tctcaagaaa tacaagctta gagaatccgt gatcatgttg cgaccaaatg caattcctca 4860
tacaaatgtt cacaactggt taacagttaa agactacaac aaaattggct gtgatcttga 4920
gctagacgat tatgtaaagg ttccatactt cataagaggc attcctgaga aagtgtattc 4980
agatatctat aagattgtac tcgaatatgg ttcgaccagt tgttatggaa gactatcaag 5040
tgcatgtgca ggaaaagtag cttacacatt acgcacggac ccctttgctt taccacgaac 5100
aatcgctatt gtgaatcagc tcatagctga ggaacacgca aaacgtgatc attataactc 5160
aatcacatca aacccatcat cttcacatgc tttttccctt acaggaattt gcaatatgtt 5220
agcctcaagg tacatgaagg accattcaag ggaaaacatt gagaaattga cacgtgttaa 5280
agaccaattg attgagttta gggggactgg aggtgagttc aaaaatccag aagatttgct 5340
tgaatttggt gggctagtta cagtcattca ccaaggctta gattccaccg cccggggtct 5400
acagctcaaa ggaaggtgga acggagactt gattcagcgc gatttgatga tatcagctgg 5460
cgttttcaca ggcggtctac tgatgctttg gttcctcttc cggaaatggt catcaacaga 5520
tgtcaaacat gaagctaaga caaaacgcag caggcaaaaa ctcaaattta ggcaagcgcg 5580
cgacagcaaa tatgcttatg acgttactgg atctaaggat gcaattgaag aaaattttgg 5640
atcagcttat gttaagaaag ataagaaaaa gggaacaaaa gttggattgg gagttaagca 5700
acataagttc tacatgctgt ataattttga tccacaagat tacaatctaa ttcgatttgt 5760
ggacccactt acaggtgcaa ctcttgatga gcaaattcac gcagatatca atatggtacg 5820
agaacatttc acagcaattc gagaagctgc cataaataat gaccaacttg agtatcaaca 5880
catttattca aatccaggaa ttaaagcata ttttatacga aatggatctc aaaatgctct 5940
caaagtcgac atgactccac acgaaccact aagggttgtt actggtaaca atatagcggg 6000
attccctgaa tacgaaggca cgctacgaca aaccggaaga gcacaagtga taccttcaga 6060
acaagtacca gcaccaaacg aggtggaagt ggagcacgaa gcaaaatcta tgttaacggg 6120
attggtggat tacacaccta tagctaatca gattggcata attgaaaatc attcagatga 6180
tgttaggctt tgcatgtatg ctataggata tggatcatac ttaatcactc ctgcacacct 6240
cttcaaagca agcaatggag agttaacatt tcgatcttcg cgaggggttt acaagatgag 6300
aaactcagtg gaagtaaagc tacaccacgt aaaggggcgc gatttggtta taattcaact 6360
ccccaaagat tttcctccat tcccacagaa actcaagttt caagcaccta atcgcgaaaa 6420
caaagtgtgc ttggttggcg tcaatttcca gcagaatcat tcttcatgtg tagtttctga 6480
gagtagcact attgcgccaa aaggaaataa tacattttgg agtcattgga tctcaacaac 6540
aggtggccaa tgtggtttac cattagttga tatgaaaacc agaagcatag ttggggtaca 6600
tagccttgca tccgtaaatg cgaacgtaaa tttcttcgta gcaatgccgg aagacttcaa 6660
cacatacctt agtgaacttg tctcgaagaa tgaatgggaa aaaggatggc aatataatcc 6720
aaatttaata tcctggagtg gactaaatct cgtatcctct gcacctaaag gcgcttttaa 6780
aacagcaaaa cttgttgagg atttatcatt tgatgttaca gaacaaggga tccaacatga 6840
aacatggcta acgaagcaca tacagcaaaa tttgcaagtt gtagccaaat gtcctggaca 6900
attggttaca aaacatgttg ttaaaggtcc gtgcccgcac tttgcactat acttatccac 6960
gcacgaggaa gctgagaagt tctttagacc gcttatgggc aaatatgata agagtagact 7020
caataaagca gctttcgtta aagatcttac aaaatatgca aaaccaactt atattggcga 7080
agtaaacact gcactatttg aaagagctgt tgagcatgtc atacaactcc tacgcaatgt 7140
tgggattcca acatgtgagt acatcacaga tgaagatgaa attttcaaat ctttaaacat 7200
gaatgctgcg gttggagcat tatacacagg aaagaagaga gaatattttt ctgaatacac 7260
acaagaggat agagcagaga taataaagca atcgtgcgaa agagtttacg aaggcaagct 7320
tggaatttgg aatgggtctc tcaaggctga aataagacct atagagaaaa cggaagcaaa 7380
taagacaagg acattcacag ccgcaccatt ggaaacattg ctagcgggta aggtgtgtgt 7440
cgatgatttc aataatcaat tttatgcaca ccacttaaat ggaccgtgga cagttggaat 7500
aactaaattc tacggtggtt ggaatagatt acttgagaag ctaccagatg gctggatcta 7560
ctgtgatgca gatggttcgc aactcgacag ttcgctcact ccttatctga taaatgcagt 7620
gctcaacatt cgattacaat ttatggagcc gtggaacatt ggtgaacaaa tgcttaaaaa 7680
tttatacacg gaaattgttt ttacaccaat tgcaacacct gatgggtcag tcatcaaaaa 7740
gtttaaaggc aacaatagtg gacagccatc aacagttgtt ggcaacacac taatggtgat 7800
catagccttt aactatacgt tgttatcgtg tggagttgac ttggagaagg ctgatgatgt 7860
gtgtcgaatg tatgcgaatg gagacgattt attacttgca gtgaacccaa cacatgttga 7920
cattctaaac gaatttggaa aacacttcgc agcgttaggg ttaaatttcg attttgaatc 7980
acgaacgaga gataaatcag aactttggtt catgtcaacg cgaggtatca agtacgaaga 8040
aatgtatatc ccaaaattgg aaaaagaacg aattgtagct attcttgaat gggatcgatc 8100
attaatccct caataccgtc ttgaagctgt ctgtgcagca atggttgagg catggggata 8160
taaagatttg ctccatgaga tacgtaagtt ctatgcgtgg ctgctcgaaa tgcaaccttt 8220
tgctaactta gcaaaggaag gctcagcacc gtacatagcc gagacagccc tgagaaactt 8280
gtatactggt gctaaggttt cagaagatga attgaatgtc tatgcacgac aattcttcga 8340
tgatctttca gattatttgg ccgatgaagt tatagatgtc aaacatcaag ctggtgagaa 8400
tgtcgatgct gggcagaaga ctgaagcaca gaaggaagca gagaggaagg cagctgaaga 8460
gaataaagca aaggaagctg aggctaaaca aaaggaaacc aaggagaaaa cgactgagaa 8520
agctggtgat ggcgagtcca cgggaaaaga caaagacgtg gacgccggaa cttcaggctc 8580
agtatcggta cctaagctaa aagctatgtc caaaaagatg cgtttgccac aagcgaaggg 8640
aaagaatatt ctccatcttg acttcctatt gaaatacaag ccacaacaac aagacttatc 8700
gaacacccga gcaaccaggg ctgaattcga tagatggtat gaagcagtgc agaaagaata 8760
cgaacttgat gatacacaaa tgacggttgt catgagtgga ttaatggttt ggtgcattga 8820
gaatggttgc tcaccaaaca tcaatggagt ctggacaatg atggatggag acgaacagag 8880
aacatttcct ttaaaacagg ttattggaaa tgcatctcca actttcagac aaattatgca 8940
tcattttagt gatgcagctg aagcatacat tgagtataga aattcaacag aaagatatat 9000
ggcgagatat ggacttcagc gaaacttaac cgactttagc cttgcacgct atgcatttga 9060
tttttacgag atatcatctc gaactccagc acgtgcaaag gaagcccaca tgcagatgaa 9120
ggccgcagca gtccgtggtt caaacacacg gatgtttggt cttgatggga atgtcggaga 9180
aacccaagaa aatacagaac gccacacagc tggcgacgtt agtcgcaaca tccactccct 9240
tttgggagtt cagcaggggc attgatacgg ggttcaactt ttacgcagta atttagtaat 9300
atataagtaa gctattgtgg tgaggttgta cctcgttagt tttatatata tattatgcta 9360
cgtacctact atgtctgcaa gtgagtgagg ttgcacctcg acacttatag tgggcactat 9420
tactagcttc gaatcacgag acggacggtc cattgagtgg ttctaccacg aggatgcagc 9480
gagtttcgtg gtgagagaca aaaaaaaaaa aaaaa 9515
<210> 16
<211> 3249
<212> DNA
<213> Neisseria meningitidis NmCas9
<400> 16
atggctgcct tcaaacctaa ttcaatcaac tacatcctcg gcctcgatat cggcatcgca 60
tccgtcggct gggcgatggt agaaattgac gaagaagaaa accccatccg cctgattgat 120
ttgggcgtgc gcgtatttga gcgtgccgaa gtaccgaaaa caggcgactc ccttgccatg 180
gcaaggcgtt tggcgcgcag tgttcgccgc ctgacccgcc gtcgcgccca ccgcctgctt 240
cggacccgcc gcctattgaa acgcgaaggc gtattacaag ccgccaattt tgacgaaaac 300
ggcttgatta aatccttacc gaatacacca tggcaacttc gcgcagccgc attagaccgc 360
aaactgacgc ctttagagtg gtcggcagtc ttgttgcatt taatcaaaca tcgcggctat 420
ttatcgcaac ggaaaaacga gggcgaaact gccgataagg agcttggcgc tttgcttaaa 480
ggcgtagccg gcaatgccca tgccttacag acaggcgatt tccgcacacc ggccgaattg 540
gctttaaata aatttgagaa agaaagcggc catatccgca atcagcgcag cgattattcg 600
catacgttca gccgcaaaga tttacaggcg gagctgattt tgctgtttga aaaacaaaaa 660
gaatttggca atccgcatgt ttcaggcggc cttaaagaag gtattgaaac cctactgatg 720
acgcaacgcc ctgccctgtc cggcgatgcc gttcaaaaaa tgttggggca ttgcaccttc 780
gaaccggcag agccgaaagc cgctaaaaac acctacacag ccgaacgttt catctggctg 840
accaagctga acaacctgcg tattttagag caaggcagcg agcggccatt gaccgatacc 900
gaacgcgcca cgcttatgga cgagccatac agaaaatcca aactgactta cgcacaagcc 960
cgtaagctgc tgggtttaga agataccgcc tttttcaaag gcttgcgcta tggtaaagac 1020
aatgccgaag cctcaacatt gatggaaatg aaggcctacc atgccatcag ccgtgcactg 1080
gaaaaagaag gattgaaaga caaaaaatcc ccattaaacc tttctcccga attacaagac 1140
gaaatcggca cggcattctc cctgttcaaa accgatgaag acattacagg ccgtctgaaa 1200
gaccgtatac agcccgaaat cttagaagcg ctgttgaaac acatcagctt cgataagttc 1260
gtccaaattt ccttgaaagc attgcgccga attgtgcctc taatggaaca aggcaaacgt 1320
tacgatgaag cctgcgccga aatctacgga gaccattacg gcaagaagaa tacggaagaa 1380
aagatttatc tgccgccgat tcccgccgac gaaatccgca accccgtcgt cttgcgcgcc 1440
ttatctcaag cacgtaaggt cattaacggc gtggtacgcc gttacggctc cccagctcgt 1500
atccatattg aaactgcaag ggaagtaggt aaatcgttta aagaccgcaa agaaattgag 1560
aaacgccaag aagaaaaccg caaagaccgg gaaaaagccg ccgccaaatt ccgagagtat 1620
ttccccaatt ttgtcggaga acccaaatcc aaagatattc tgaaactgcg cctgtacgag 1680
caacaacacg gcaaatgcct gtattcgggc aaagaaatca acttaggccg tctgaacgaa 1740
aaaggctatg tcgaaatcga ccatgccctg ccgttctcgc gcacatggga cgacagtttc 1800
aacaataaag tactggtatt gggcagcgaa aaccaaaaca aaggcaatca aaccccttac 1860
gaatacttca acggcaaaga caacagccgc gaatggcagg aatttaaagc gcgtgtcgaa 1920
accagccgtt tcccgcgcag taaaaaacaa cggattctgc tgcaaaaatt cgatgaagac 1980
ggctttaaag aacgcaatct gaacgacacg cgctacgtca accgtttcct gtgtcaattt 2040
gttgccgacc gtatgcggct gacaggtaaa ggcaagaaac gtgtctttgc atccaacgga 2100
caaattacca atctgttgcg cggcttttgg ggattgcgca aagtgcgtgc ggaaaacgac 2160
cgccatcacg ccttggacgc cgtcgtcgtt gcctgctcga ccgttgccat gcagcagaaa 2220
attacccgtt ttgtacgcta taaagagatg aacgcgtttg acggtaaaac catagacaaa 2280
gaaacaggag aagtgctgca tcaaaaaaca cacttcccac aaccttggga atttttcgca 2340
caagaagtca tgattcgcgt cttcggcaaa ccggacggca aacccgaatt cgaagaagcc 2400
gataccctag aaaaactgcg cacgttgctt gccgaaaaat tatcatctcg ccccgaagcc 2460
gtacacgaat acgttacgcc actgtttgtt tcacgcgcgc ccaatcggaa gatgagcggg 2520
caagggcata tggagaccgt caaatccgcc aaacgactgg acgaaggcgt cagcgtgttg 2580
cgcgtaccgc tgacacagtt aaaactgaaa gacttggaaa aaatggtcaa tcgggagcgc 2640
gaacctaagc tatacgaagc actgaaagca cggctggaag cacataaaga cgatcctgcc 2700
aaagcctttg ccgagccgtt ttacaaatac gataaagcag gcaaccgcac ccaacaggta 2760
aaagccgtac gcgtagagca agtacagaaa accggcgtat gggtgcgcaa ccataacggt 2820
attgccgaca acgcaaccat ggtgcgcgta gatgtgtttg agaaaggcga caagtattat 2880
ctggtaccga tttacagttg gcaggtagcg aaagggattt tgccggatag ggctgttgta 2940
caaggaaaag atgaagaaga ttggcaactt attgatgata gtttcaactt taaattctca 3000
ttacacccta atgatttagt cgaggttata acaaaaaaag ctagaatgtt tggttacttt 3060
gccagctgcc atcgaggcac aggtaatatc aatatacgca ttcatgatct tgatcataaa 3120
attggcaaaa atggaatact ggaaggtatc ggcgtcaaaa ccgccctttc attccaaaaa 3180
taccaaattg acgaactggg caaagaaatc agaccatgcc gtctgaaaaa acgcccgcct 3240
gtccgttaa 3249
<210> 17
<211> 3114
<212> DNA
<213> Parvibaculum lavamentivorans
<400> 17
atggagagga ttttcggctt tgacatcggc acaacaagta tcggattcag cgtgattgat 60
tacagtagca cccagtccgc aggcaacatc cagaggctgg gcgtgcgcat tttccctgag 120
gcaagggacc cagatgggac ccccctgaac cagcagcgga gacagaaacg catgatgagg 180
cgccagctgc gacggagaag gattcgccga aaggcactga atgagacact gcacgaagcc 240
ggctttctgc cagcttacgg gtctgcagat tggcccgtgg tcatggccga cgagccttat 300
gaactgcgga gaaggggact ggaggaaggc ctgagtgctt acgagttcgg acgggcaatc 360
tatcatctgg cccagcaccg gcattttaaa ggcagagaac tggaggaatc cgatacaccc 420
gaccctgatg tggacgatga gaaggaagcc gctaacgaga gagcagccac tctgaaggcc 480
ctgaaaaatg aacagaccac actgggagca tggctggccc gccgaccccc ttctgaccgc 540
aagcgaggaa tccacgccca taggaacgtg gtcgctgagg agttcgagcg cctgtgggaa 600
gtgcagtcca agtttcaccc cgctctgaaa tctgaggaaa tgcgggcaag aatcagtgat 660
acaattttcg cccagaggcc tgtgttttgg cgcaagaaca ctctgggaga gtgcagattc 720
atgcctggcg aaccactgtg tcccaagggg tcctggctgt ctcagcagcg gagaatgctg 780
gagaaactga acaatctggc tatcgcaggc gggaatgcta ggccactgga tgcagaggaa 840
cgcgacgcca ttctgagtaa gctgcagcag caggccagca tgtcctggcc aggcgtgcgg 900
tcagctctga aggcactgta caaacagaga ggcgagcccg gggctgaaaa gagcctgaaa 960
ttcaacctgg agctgggagg cgaatccaag ctgctgggaa atgccctgga ggctaaactg 1020
gcagatatgt ttggccctga ctggccagct cacccccgaa agcaggagat ccggcacgca 1080
gtgcatgaac ggctgtgggc tgcagattac ggcgagacac ccgacaagaa aagagtcatc 1140
attctgtccg agaaggatcg aaaagctcat cgggaagccg ctgcaaactc tttcgtggca 1200
gactttggaa ttactggcga gcaggcagct cagctgcagg ccctgaagct gccaaccggc 1260
tgggaacctt atagcatccc agcactgaac ctgttcctgg ccgagctgga aaagggggag 1320
aggtttggag ccctggtgaa tggacctgat tgggaaggct ggaggcgcac aaacttcccc 1380
caccgcaatc agcctactgg ggagatcctg gacaagctgc caagtcccgc ctcaaaagag 1440
gaaagggaac gcattagcca gctgcgcaac ccaaccgtgg tccgaacaca gaatgagctg 1500
agaaaggtgg tcaacaatct gatcgggctg tatggaaaac ccgatcgaat ccggattgaa 1560
gtgggccggg acgtcgggaa gtccaaaaga gaaagggagg aaatccagtc tggcattcga 1620
cggaacgaga agcagagaaa gaaagccact gaagatctga tcaaaaacgg aattgctaat 1680
cctagccggg acgatgtgga gaagtggatc ctgtggaaag agggccagga aagatgccca 1740
tacaccggcg accagattgg cttcaatgcc ctgtttagag aaggcagata tgaggtggaa 1800
cacatctggc ctcgctctcg aagttttgat aacagcccaa ggaataagac actgtgtcgc 1860
aaagacgtga acatcgagaa gggaaatagg atgcctttcg aggcatttgg ccatgacgaa 1920
gatcggtgga gcgccatcca gattagactg cagggcatgg tgtcagccaa agggggaact 1980
gggatgagcc ccggaaaggt caaacgcttc ctggctaaga ccatgcctga ggattttgca 2040
gcccggcagc tgaacgacac aagatacgct gcaaagcaga tcctggccca gctgaaaagg 2100
ctgtggccag acatgggacc tgaggctcca gtgaaggtcg aagcagtgac tggacaggtc 2160
accgcccagc tgcgcaaact gtggactctg aacaatattc tggctgacga tggggagaaa 2220
accagagcag atcacaggca ccatgccatc gacgctctga cagtggcctg cactcatcct 2280
ggaatgacca acaagctgag caggtattgg cagctgcgcg acgatccacg agcagagaag 2340
ccagctctga ctccaccctg ggataccatc cgcgccgacg ctgagaaagc cgtgtctgaa 2400
attgtggtca gtcaccgggt gagaaagaaa gtcagcggcc cactgcataa ggagactacc 2460
tacggcgata cagggactga cattaagacc aaatccggca catatagaca gttcgtgacc 2520
aggaagaaaa tcgagtcact gagcaagggg gagctggatg aaattcgcga cccccgaatc 2580
aaagaaattg tggcagctca cgtcgcagga cgaggaggcg accccaagaa ggccttccct 2640
ccatacccct gtgtgtctcc cggaggccct gagatccgga aggtcagact gaccagtaaa 2700
cagcagctga acctgatggc ccagacaggg aatggatacg ctgacctggg ctccaaccac 2760
catatcgcaa tctaccggct gcccgatggg aaggccgact tcgagattgt gtcactgttt 2820
gatgctagca gaaggctggc acagagaaat ccaatcgtgc agaggacacg agcagacgga 2880
gccagcttcg tcatgtccct ggcagccgga gaggccatca tgattcccga aggctcaaag 2940
aaagggatct ggattgtgca gggagtctgg gcaagcggac aggtggtcct ggagagggac 3000
accgatgctg accactctac aactacccgc cctatgccaa accccatcct gaaggacgat 3060
gccaagaaag tgagtatcga tcctattggc cgagtccggc catcaaatga ctaa 3114
<210> 18
<211> 3255
<212> DNA
<213> Corynebacterium diphtheriae
<400> 18
atgaagtacc atgtcggaat cgatgtcgga accttttctg tggggctggc tgctattgaa 60
gtggatgacg ctggaatgcc tattaagacc ctgagtctgg tgtcacacat tcatgactca 120
ggactggatc ctgacgagat caagagcgct gtgaccaggc tggcaagctc cggaatcgcc 180
cggagaacaa ggcgcctgta ccgacggaag agaaggcgcc tgcagcagct ggataagttc 240
atccagaggc agggctggcc agtgatcgag ctggaagatt acagcgaccc cctgtatcct 300
tggaaggtgc gcgccgaact ggccgcttct tatattgctg acgagaagga acggggggag 360
aaactgagtg tggctctgag acacatcgca aggcatcgcg gatggaggaa cccttacgcc 420
aaggtgtcta gtctgtatct gccagatggc ccctcagacg ccttcaaggc tattagggag 480
gaaatcaaac gcgctagcgg ccagcctgtg ccagagactg caaccgtcgg gcagatggtg 540
accctgtgcg aactgggcac actgaagctg cgaggagagg gaggagtgct gagtgcacgg 600
ctgcagcagt cagattacgc ccgcgagatc caggaaattt gtcgaatgca ggagatcggc 660
caggaactgt atcgcaagat cattgacgtg gtgttcgcag ccgagtcccc aaagggctct 720
gcctcaagcc gggtggggaa agatcctctg cagccaggaa agaacagagc actgaaagcc 780
agcgacgctt ttcagcgata ccggattgct gcactgatcg gcaatctgag agtcagggtg 840
gatggggaga agaggattct gagcgtggag gagaagaacc tggtgttcga ccacctggtg 900
aatctgactc caaagaaaga gcccgaatgg gtgaccatcg ccgaaattct gggcatcgat 960
cgcgggcagc tgatcggaac agctactatg accgacgatg gagagcgagc aggagcccga 1020
ccccctacac acgatactaa cagaagtatt gtgaacagcc ggatcgcacc actggtcgac 1080
tggtggaaaa cagctagcgc actggagcag cacgccatgg tgaaggcact gtccaacgcc 1140
gaagtcgacg attttgattc tcccgaggga gcaaaagtgc aggcattctt tgccgatctg 1200
gacgatgacg tccacgccaa gctggacagc ctgcatctgc ctgtgggacg agcagcttac 1260
tccgaggaca ctctggtcag actgacccga cggatgctga gtgatggggt ggacctgtat 1320
accgcccggc tgcaggagtt cggaattgaa cctagctgga ccccacccac accaagaatc 1380
ggagagcctg tcggcaatcc agccgtcgac cgggtgctga aaacagtgag cagatggctg 1440
gaatccgcaa caaagacttg gggcgcccca gagagggtca tcattgagca cgtgcgcgaa 1500
ggcttcgtca ctgagaaacg cgctcgagaa atggatgggg acatgagaag gcgcgcagcc 1560
cggaacgcca agctgtttca ggagatgcag gaaaagctga atgtgcaggg caaacccagt 1620
cgagccgatc tgtggagata ccagtcagtg cagagacaga actgccagtg tgcctattgc 1680
gggtccccaa ttaccttttc taatagtgaa atggaccaca tcgtgcccag agcagggcag 1740
ggatccacca acacaaggga gaatctggtc gccgtgtgcc atcgctgtaa ccagtctaag 1800
ggcaatacac ccttcgctat ttgggcaaaa aacacttcta tcgaaggggt cagtgtgaag 1860
gaggccgtgg aacggaccag acattgggtc actgataccg gcatgagaag cactgacttc 1920
aagaagttca ccaaggctgt ggtcgagcgg tttcagagag caacaatgga tgaggaaatc 1980
gacgccagaa gcatggaatc cgtcgcctgg atggctaatg agctgaggag ccgcgtggct 2040
cagcacttcg catcccatgg aaccacagtc agggtgtacc gaggcagcct gacagcagag 2100
gctcgacggg catctgggat cagtggaaag ctgaaattct ttgatggcgt ggggaagtcc 2160
aggctggata gaaggcacca tgctattgac gctgcagtga tcgcattcac ctctgactat 2220
gtggccgaaa cactggctgt ccgctcaaac ctgaaacaga gccaggccca ccgacaggag 2280
gctcctcagt ggagagagtt caccggcaag gatgcagagc atcgagcagc ttggagagtg 2340
tggtgccaga agatggaaaa actgagcgcc ctgctgaccg aggacctgcg agatgaccgg 2400
gtggtcgtga tgtctaacgt gcgactgcgg ctgggaaatg gcagtgccca caaggaaacc 2460
attggcaaac tgtcaaaggt gaaactgtcc tctcagctgt cagtcagcga tatcgacaaa 2520
gcaagttcag aggccctgtg gtgtgctctg accagagagc ccggattcga tcctaaggaa 2580
ggcctgcccg ctaaccctga gagacacatc agggtgaatg ggacacatgt ctacgccggg 2640
gacaatattg gactgtttcc agtgtcagca ggaagcatcg cactgagggg aggatacgca 2700
gagctgggca gctccttcca ccatgctcgc gtgtataaaa ttacttccgg caagaaaccc 2760
gcatttgcca tgctgagggt gtacaccatc gatctgctgc cttatcgcaa ccaggacctg 2820
tttagcgtgg aactgaagcc acagacaatg tccatgaggc aggctgagaa gaaactgcgc 2880
gacgctctgg caactgggaa tgcagaatat ctgggatggc tggtcgtgga tgacgagctg 2940
gtcgtggata catctaagat tgccactgac caggtcaaag cagtggaggc cgaactgggg 3000
actatccgcc gatggcgggt ggatggattc ttttccccct ctaaactgag actgaggcct 3060
ctgcagatgt ccaaggaggg gatcaagaaa gagtccgctc ccgaactgtc taaaatcatt 3120
gacagaccag gatggctgcc cgccgtgaac aagctgttct ctgatggaaa tgtcaccgtc 3180
gtgcggagag actctctggg acgcgtgcga ctggagagta cagcccacct gcctgtcact 3240
tggaaggtgc agtaa 3255
<210> 19
<211> 3393
<212> DNA
<213> Streptococcus pasteurianus
<400> 19
atgactaacg gcaagattct ggggctggac attggcatcg caagcgtggg ggtggggatt 60
attgaggcaa aaactggaaa ggtggtgcat gccaattccc ggctgttctc tgccgctaac 120
gctgagaaca atgcagaacg gagagggttt aggggatcta ggcgcctgaa tcgacggaag 180
aaacaccgcg tgaagcgagt ccgggatctg ttcgagaaat acggaatcgt caccgacttt 240
cgcaacctga atctgaaccc ttatgagctg cgagtgaagg gcctgaccga acagctgaaa 300
aacgaggaac tgttcgcagc cctgagaaca atctctaaga gaagggggat tagttacctg 360
gacgatgccg aggacgatag taccggatca acagactatg ctaagagcat cgatgagaat 420
cgccgactgc tgaaaaacaa gacaccaggc cagattcagc tggagaggct ggaaaagtac 480
ggccagctgc gcgggaattt caccgtctat gacgagaacg gggaagccca tcgcctgatc 540
aatgtgttta gtacatcaga ttacgagaaa gaagcacgga agatcctgga gacacaggcc 600
gactacaaca agaaaatcac agctgagttc attgacgatt atgtggaaat cctgacccag 660
aaacgaaagt actatcacgg ccccgggaac gaaaagagcc ggactgacta cggacggttc 720
cggaccgatg ggaccacact ggagaatatt ttcggaatcc tgattggcaa gtgcaacttt 780
taccctgatg aatatcgagc aagcaaggcc agctacaccg cacaggagta taatttcctg 840
aacgacctga acaatctgaa ggtgagcacc gaaacaggga agctgtcaac agagcagaaa 900
gaaagcctgg tggagtttgc caagaatact gctaccctgg gacccgctaa actgctgaag 960
gagatcgcaa aaattctgga ctgtaaggtg gatgagatca aaggatacag agaggacgat 1020
aaaggcaagc cagatctgca taccttcgag ccctatagga aactgaagtt taatctggaa 1080
agcatcaaca ttgacgatct gtcccgcgaa gtgatcgaca agctggctga tattctgact 1140
ctgaacaccg agagagaagg aatcgaggac gcaattaaga ggaatctgcc aaaccagttc 1200
acagaggaac agatcagcga gatcatcaag gtgcggaaga gccagtccac tgctttcaat 1260
aagggctggc actcttttag tgcaaaactg atgaacgagc tgatccccga actgtacgcc 1320
acctccgacg agcagatgac aattctgact cggctggaaa aattcaaggt caataagaaa 1380
agctccaaaa acacaaagac tatcgacgag aaggaagtca ctgatgagat ctacaatcct 1440
gtggtcgcca agagcgtgag acagaccatc aaaatcatta acgctgcagt caagaaatat 1500
ggcgacttcg ataagatcgt gattgaaatg ccacgggata aaaatgctga cgatgagaag 1560
aagttcatcg acaagagaaa taaggagaac aagaaggaaa aggacgatgc cctgaaaagg 1620
gccgcttacc tgtataattc tagtgacaag ctgcccgatg aggtgttcca cggcaacaag 1680
cagctggaaa ccaaaatccg actgtggtat cagcaggggg agcggtgcct gtatagtgga 1740
aagcccatct caattcagga gctggtgcat aactctaaca atttcgaaat cgatcacatt 1800
ctgcctctgt cactgagctt tgacgatagt ctggccaata aggtgctggt ctacgcttgg 1860
acaaaccagg agaaaggcca gaaaacccct tatcaggtca tcgactccat ggatgcagcc 1920
tggtctttca gggagatgaa ggactacgtg ctgaaacaga agggactggg caagaaaaag 1980
cgcgactatc tgctgactac cgagaacatc gataagattg aagtgaagaa gaagttcatc 2040
gagaggaatc tggtggatac tcgctacgca tctcgagtgg tcctgaactc tctgcagagt 2100
gccctgagag agctggggaa agacactaag gtgtctgtgg tcaggggaca gttcaccagt 2160
cagctgcgga gaaaatggaa gatcgataag agccgcgaga cataccacca tcacgcagtg 2220
gacgccctga tcattgctgc atcaagccag ctgaaactgt gggagaagca ggacaatccc 2280
atgtttgtgg attatggcaa gaaccaggtg gtcgacaaac agactgggga gatcctgtcc 2340
gtgtctgacg atgagtacaa ggaactggtg ttccagcccc cttatcaggg ctttgtgaat 2400
accatctcct ctaaagggtt cgaggacgaa attctgttta gctaccaggt ggattccaaa 2460
tataaccgga aggtcagtga cgcaaccatc tactcaacaa gaaaagccaa gattggcaag 2520
gataagaaag aggaaaccta cgtgctggga aaaatcaagg acatctactc ccagaatggc 2580
ttcgatacct tcatcaagaa gtacaacaaa gataagactc agttcctgat gtatcagaag 2640
gactctctga catgggagaa cgtgatcgaa gtcattctga gggactaccc aacaactaag 2700
aaaagcgagg acggcaaaaa tgatgtgaag tgcaacccct ttgaggaata caggcgcgag 2760
aatgggctga tctgtaagta ttccaagaaa gggaaaggaa ctcccatcaa gagcctgaag 2820
tactatgaca agaaactggg gaactgcatc gatattaccc cagaggaatc acgcaataag 2880
gtcatcctgc agagcattaa cccttggcga gccgacgtgt acttcaatcc agagacactg 2940
aagtacgaac tgatgggcct gaaatattca gatctgagct ttgaaaaggg cactgggaac 3000
taccatatca gccaggagaa atatgacgct atcaaagaga aggaaggaat tggcaagaaa 3060
tccgagttca agtttacact gtaccgcaac gacctgatcc tgatcaagga tatcgccagt 3120
ggcgagcagg aaatctacag attcctgtca agaactatgc ccaatgtgaa ccactacgtc 3180
gagctgaagc cttacgacaa ggaaaagttc gataacgtgc aggagctggt cgaagcactg 3240
ggagaggcag ataaagtggg acgatgtatc aaaggactga ataagccaaa catcagcatc 3300
tacaaggtga gaaccgacgt cctgggaaac aaatatttcg tgaagaaaaa gggcgacaaa 3360
cccaagctgg attttaagaa caacaagaag taa 3393
<210> 20
<211> 3249
<212> DNA
<213> Neisseria cinerea
<400> 20
atggctgcct tcaaacctaa tcctatgaac tacatcctgg gcctggacat tggaatcgct 60
tctgtcgggt gggctatcgt ggaaatcgac gaggaagaga accctatcag actgattgat 120
ctgggagtca gagtgtttga aagggcagag gtgccaaaga ccggcgactc cctggccgct 180
gcacggagac tggctcggtc tgtcaggcgc ctgacacgac ggagagcaca caggctgctg 240
cgagctaggc gcctgctgaa gagagagggc gtgctgcagg ccgctgactt cgatgaaaac 300
ggcctgatca agagcctgcc caatactcct tggcagctga gagcagccgc tctggacagg 360
aagctgaccc cactggagtg gtctgccgtg ctgctgcacc tgatcaagca tcgcggctac 420
ctgagtcagc gaaaaaatga aggggagaca gcagataagg agctgggagc actgctgaaa 480
ggagtggccg acaacactca tgctctgcag accggcgatt ttaggacacc cgctgagctg 540
gcactgaata agttcgaaaa agagagtgga cacattcgaa accagcgggg cgactattca 600
cataccttca accgcaagga tctgcaggcc gagctgaatc tgctgtttga aaagcagaaa 660
gagttcggga atccccacgt gtccgacggg ctgaaagaag gaatcgagac actgctgatg 720
actcagaggc ctgcactgtc tggcgatgcc gtgcagaaga tgctggggca ttgcaccttt 780
gaaccaacag agcccaaggc agccaaaaac acctacacag ccgagaggtt cgtgtggctg 840
acaaagctga acaatctgcg catcctggaa cagggcagtg agcggcccct gactgacacc 900
gaaagagcca cactgatgga tgagccttac aggaagtcta aactgactta tgcccaggct 960
cgcaagctgc tggacctgga cgatactgcc ttctttaagg gcctgaggta cgggaaagat 1020
aatgcagaag ccagcaccct gatggagatg aaggcctatc acgctatctc ccgcgccctg 1080
gaaaaagagg gcctgaagga caagaaatct cccctgaacc tgagtcctga actgcaggat 1140
gagattggga ccgcttttag cctgttcaag actgacgagg atatcaccgg acgcctgaaa 1200
gaccgagtgc agcccgaaat tctggaggca ctgctgaagc acatcagttt tgataaattc 1260
gtgcagattt cactgaaggc cctgcgacgg atcgtccctc tgatggagca gggcaatcgg 1320
tacgacgagg cctgcaccga gatctacgga gatcattatg gcaagaaaaa cacagaagag 1380
aaaatctatc tgccccctat tcctgccgac gagatccgga atccagtggt cctgagagct 1440
ctgtcacagg caagaaaagt gatcaacgga gtggtcagaa ggtacggcag ccctgctagg 1500
atccacattg aaaccgcacg cgaagtggga aagtccttta aagaccgcaa ggaaatcgag 1560
aagcgacagg aagagaatag aaaagatagg gaaaagtctg ctgcaaaatt cagggagtac 1620
tttccaaact tcgtgggcga acccaagagt aaagacatcc tgaagctgcg cctgtacgag 1680
cagcagcacg ggaagtgtct gtatagcgga aaagaaatta acctgggccg gctgaatgaa 1740
aagggctatg tggagatcga tcatgcactg cccttttcca gaacatggga cgattctttc 1800
aacaataagg tcctggctct ggggagcgag aaccagaaca agggaaatca gactccttac 1860
gaatatttca acgggaagga caatagccga gaatggcagg agtttaaagc ccgcgtggag 1920
acaagccggt tcccacgaag caagaaacag cggattctgc tgcagaagtt tgacgaagat 1980
ggattcaaag agagaaacct gaatgacacc cggtacatca acagatttct gtgccagttc 2040
gtggctgatc acatgctgct gaccggaaag ggcaaacgcc gagtctttgc aagcaacggc 2100
cagatcacaa atctgctgag gggcttctgg gggctgcgga aggtgagagc cgagaatgac 2160
cgccaccatg cactggatgc cgtggtcgtg gcttgttcca ctattgcaat gcagcagaag 2220
atcaccaggt ttgtgcgcta taaagagatg aacgccttcg acggaaagac aattgataaa 2280
gaaactggcg aggtgctgca ccagaaggca cattttcctc agccatggga gttcttcgcc 2340
caggaagtga tgatccgggt ctttgggaag cctgacggaa aaccagagtt cgaagaggcc 2400
gataccccag aaaagctgcg gacactgctg gctgaaaaac tgagctccag acccgaggca 2460
gtgcacaagt acgtcacccc cctgttcatt agcagggccc ctaatcgcaa aatgtccggg 2520
cagggacata tggagactgt gaaatcagct aagcggctgg acgaaggcat cagcgtgctg 2580
agagtcccac tgacccagct gaagctgaaa gatctggaga agatggtgaa ccgggaaaga 2640
gagcccaagc tgtatgaagc tctgaaagca agactggagg cccacaagga cgatccagct 2700
aaagcatttg ccgagccctt ctacaaatat gacaaggccg gcaatcggac acagcaggtg 2760
aaggctgtca gagtggagca ggtccagaaa actggggtct gggtgcacaa ccataatgga 2820
attgccgaca acgctacaat cgtccgggtg gatgtgttcg agaaaggcgg gaagtactat 2880
ctggtgccta tctactcctg gcaggtcgcc aagggaatcc tgccagatag agctgtcgtg 2940
cagggcaaag acgaagagga ttggactgtg atggacgatt ctttcgagtt taagttcgtc 3000
ctgtacgcaa acgacctgat caagctgaca gccaagaaaa atgaatttct ggggtatttc 3060
gtgtcactga acagggcaac tggagccatc gatattcgca cacatgacac tgatagcacc 3120
aagggaaaaa acggcatctt tcagtctgtg ggcgtcaaga ccgccctgag tttccagaaa 3180
tatcagattg acgaactggg gaaggagatc cgaccctgtc ggctgaagaa acgaccaccc 3240
gtgcggtaa 3249
<210> 21
<211> 3294
<212> DNA
<213> Staphylococcus aureus
<400> 21
aagcggaact acatcctggg cctggacatc ggcatcacca gcgtgggcta cggcatcatc 60
gactacgaga cacgggacgt gatcgatgcc ggcgtgcggc tgttcaaaga ggccaacgtg 120
gaaaacaacg agggcaggcg gagcaagaga ggcgccagaa ggctgaagcg gcggaggcgg 180
catagaatcc agagagtgaa gaagctgctg ttcgactaca acctgctgac cgaccacagc 240
gagctgagcg gcatcaaccc ctacgaggcc agagtgaagg gcctgagcca gaagctgagc 300
gaggaagagt tctctgccgc cctgctgcac ctggccaaga gaagaggcgt gcacaacgtg 360
aacgaggtgg aagaggacac cggcaacgag ctgtccacca aagagcagat cagccggaac 420
agcaaggccc tggaagagaa atacgtggcc gaactgcagc tggaacggct gaagaaagac 480
ggcgaagtgc ggggcagcat caacagattc aagaccagcg actacgtgaa agaagccaaa 540
cagctgctga aggtgcagaa ggcctaccac cagctggacc agagcttcat cgacacctac 600
atcgacctgc tggaaacccg gcggacctac tatgagggac ctggcgaggg cagccccttc 660
ggctggaagg acatcaaaga atggtacgag atgctgatgg gccactgcac ctacttcccc 720
gaggaactgc ggagcgtgaa gtacgcctac aacgccgacc tgtacaacgc cctgaacgac 780
ctgaacaatc tcgtgatcac cagggacgag aacgagaagc tggaatatta cgagaagttc 840
cagatcatcg agaacgtgtt caagcagaag aagaagccca ccctgaagca gatcgccaaa 900
gaaatcctcg tgaacgaaga ggatattaag ggctacagag tgaccagcac cggcaagccc 960
gagttcacca acctgaaggt gtaccacgac atcaaggaca ttaccgcccg gaaagagatt 1020
attgagaacg ccgagctgct ggatcagatt gccaagatcc tgaccatcta ccagagcagc 1080
gaggacatcc aggaagaact gaccaatctg aactccgagc tgacccagga agagatcgag 1140
cagatctcta atctgaaggg ctataccggc acccacaacc tgagcctgaa ggccatcaac 1200
ctgatcctgg acgagctgtg gcacaccaac gacaaccaga tcgctatctt caaccggctg 1260
aagctggtgc ccaagaaggt ggacctgtcc cagcagaaag agatccccac caccctggtg 1320
gacgacttca tcctgagccc cgtcgtgaag agaagcttca tccagagcat caaagtgatc 1380
aacgccatca tcaagaagta cggcctgccc aacgacatca ttatcgagct ggcccgcgag 1440
aagaactcca aggacgccca gaaaatgatc aacgagatgc agaagcggaa ccggcagacc 1500
aacgagcgga tcgaggaaat catccggacc accggcaaag agaacgccaa gtacctgatc 1560
gagaagatca agctgcacga catgcaggaa ggcaagtgcc tgtacagcct ggaagccatc 1620
cctctggaag atctgctgaa caaccccttc aactatgagg tggaccacat catccccaga 1680
agcgtgtcct tcgacaacag cttcaacaac aaggtgctcg tgaagcagga agaaaacagc 1740
aagaagggca accggacccc attccagtac ctgagcagca gcgacagcaa gatcagctac 1800
gaaaccttca agaagcacat cctgaatctg gccaagggca agggcagaat cagcaagacc 1860
aagaaagagt atctgctgga agaacgggac atcaacaggt tctccgtgca gaaagacttc 1920
atcaaccgga acctggtgga taccagatac gccaccagag gcctgatgaa cctgctgcgg 1980
agctacttca gagtgaacaa cctggacgtg aaagtgaagt ccatcaatgg cggcttcacc 2040
agctttctgc ggcggaagtg gaagtttaag aaagagcgga acaaggggta caagcaccac 2100
gccgaggacg ccctgatcat tgccaacgcc gatttcatct tcaaagagtg gaagaaactg 2160
gacaaggcca aaaaagtgat ggaaaaccag atgttcgagg aaaagcaggc cgagagcatg 2220
cccgagatcg aaaccgagca ggagtacaaa gagatcttca tcacccccca ccagatcaag 2280
cacattaagg acttcaagga ctacaagtac agccaccggg tggacaagaa gcctaataga 2340
gagctgatta acgacaccct gtactccacc cggaaggacg acaagggcaa caccctgatc 2400
gtgaacaatc tgaacggcct gtacgacaag gacaatgaca agctgaaaaa gctgatcaac 2460
aagagccccg aaaagctgct gatgtaccac cacgaccccc agacctacca gaaactgaag 2520
ctgattatgg aacagtacgg cgacgagaag aatcccctgt acaagtacta cgaggaaacc 2580
gggaactacc tgaccaagta ctccaaaaag gacaacggcc ccgtgatcaa gaagattaag 2640
tattacggca acaaactgaa cgcccatctg gacatcaccg acgactaccc caacagcaga 2700
aacaaggtcg tgaagctgtc cctgaagccc tacagattcg acgtgtacct ggacaatggc 2760
gtgtacaagt tcgtgaccgt gaagaatctg gatgtgatca aaaaagaaaa ctactacgaa 2820
gtgaatagca agtgctatga ggaagctaag aagctgaaga agatcagcaa ccaggccgag 2880
tttatcgcct ccttctacaa caacgatctg atcaagatca acggcgagct gtatagagtg 2940
atcggcgtga acaacgacct gctgaaccgg atcgaagtga acatgatcga catcacctac 3000
cgcgagtacc tggaaaacat gaacgacaag aggcccccca ggatcattaa gacaatcgcc 3060
tccaagaccc agagcattaa gaagtacagc acagacattc tgggcaacct gtatgaagtg 3120
aaatctaaga agcaccctca gatcatcaaa aagggcaaaa ggccggcggc cacgaaaaag 3180
gccggccagg caaaaaagaa aaagggatcc tacccatacg atgttccaga ttacgcttac 3240
ccatacgatg ttccagatta cgcttaccca tacgatgttc cagattacgc ttaa 3294
<210> 22
<211> 3012
<212> DNA
<213> Campylobacter lari
<400> 22
atgaggattc tggggtttga cattggcatt aacagcatcg ggtgggcttt tgtggagaac 60
gacgaactga aggactgcgg agtgcggatc ttcacaaagg ccgagaaccc aaaaaataag 120
gaaagcctgg cactgccccg gagaaatgca cgcagctcca ggcgccgact gaaacggaga 180
aaggcccggc tgatcgctat taagagaatc ctggccaaag agctgaagct gaactacaag 240
gactatgtcg cagctgatgg agagctgcca aaggcctacg aaggatccct ggcatctgtg 300
tacgagctgc ggtataaggc cctgacacag aacctggaaa ctaaagatct ggccagagtg 360
atcctgcaca ttgctaagca tagggggtac atgaacaaga acgagaagaa atcaaacgac 420
gctaagaaag gaaagatcct gagcgctctg aaaaacaatg cactgaagct ggagaactac 480
cagagcgtgg gcgaatactt ctacaaggag ttctttcaga aatacaagaa aaacacaaag 540
aacttcatca agatccgcaa cactaaggat aattacaaca attgcgtgct gtctagtgac 600
ctggaaaaag agctgaagct gatcctggaa aaacagaagg agttcggcta caactactct 660
gaagatttca tcaacgagat tctgaaggtc gccttctttc agcggcccct gaaggacttc 720
agtcacctgg tgggggcctg cactttcttt gaggaagaga aaagggcctg taagaacagc 780
tactctgcct gggagtttgt ggctctgacc aagatcatta acgagatcaa gagcctggag 840
aagatcagcg gcgaaattgt gccaacccag acaatcaacg aggtcctgaa tctgatcctg 900
gacaaggggt ctatcaccta caagaaattc agaagttgta tcaatctgca tgagagtatc 960
agcttcaaga gcctgaagta tgataaagaa aacgccgaga atgctaaact gatcgacttc 1020
cgcaagctgg tggagtttaa gaaagccctg ggagtccaca gcctgtcccg gcaggaactg 1080
gatcagatct ccactcatat caccctgatt aaggacaacg tgaagctgaa aaccgtcctg 1140
gagaaataca acctgagtaa tgaacagatc aacaatctgc tggaaattga gttcaacgat 1200
tatatcaacc tgagcttcaa ggccctggga atgattctgc cactgatgcg cgagggcaaa 1260
cgatacgacg aggcctgcga gatcgccaat ctgaaaccta agaccgtgga cgagaagaaa 1320
gatttcctgc cagcattttg tgattccatt ttcgcccacg agctgtctaa ccccgtggtc 1380
aatagggcta tcagcgaata ccgcaaggtg ctgaacgcac tgctgaagaa atatggaaag 1440
gtccacaaaa ttcatctgga gctggctcgc gacgtgggcc tgtccaagaa agcacgagag 1500
aagatcgaaa aagagcagaa ggaaaaccag gccgtgaatg catgggccct gaaggaatgc 1560
gagaatattg gcctgaaggc cagcgcaaag aacatcctga aactgaagct gtggaaagaa 1620
cagaaggaga tctgtatcta ctccggaaat aagatctcta ttgagcacct gaaagatgaa 1680
aaggccctgg aggtggacca tatctacccc tattctagga gtttcgacga ttcttttatc 1740
aacaaagtgc tggtgttcac caaggaaaat caggagaaac tgaacaagac acctttcgag 1800
gcctttggca agaatattga aaaatggagc aagatccaga ccctggctca gaacctgcca 1860
tacaagaaaa agaataagat tctggacgag aacttcaaag ataagcagca ggaggacttt 1920
atctctcgaa atctgaacga cacccggtat atcgctacac tgattgcaaa atacacaaag 1980
gagtatctga acttcctgct gctgagcgaa aatgagaacg ccaatctgaa gagtggcgaa 2040
aaagggtcaa agatccacgt gcagactatt agcgggatgc tgacctccgt cctgaggcac 2100
acatgggggt ttgacaaaaa ggatcgcaac aatcatctgc accatgcact ggatgccatc 2160
attgtggcct acagtacaaa ttcaatcatt aaggctttca gcgatttccg gaaaaaccag 2220
gagctgctga aggccagatt ctacgctaaa gaactgactt ccgataacta taaacatcag 2280
gtcaagttct ttgagccttt caagagtttt agagaaaaaa tcctgtcaaa gatcgacgag 2340
attttcgtgt ccaaaccacc tcgaaagcga gctaggcgcg cactgcacaa ggataccttt 2400
cattctgaga acaagatcat tgacaagtgc agctacaact ccaaggaagg cctgcagatt 2460
gccctgagct gtggaagagt gaggaaaatc ggcactaagt atgtcgagaa tgataccatc 2520
gtgagggtcg acattttcaa aaagcagaac aagttttacg ctatcccaat ctacgcaatg 2580
gattttgccc tggggatcct gcccaataag atcgtgatta ctggaaaaga taagaacaat 2640
aaccccaaac agtggcagac cattgacgaa tcatacgagt tctgctttag cctgtataag 2700
aatgacctga tcctgctgca gaaaaagaac atgcaggaac ctgagttcgc ctactataac 2760
gatttttcaa tcagcacatc aagcatttgt gtggagaaac acgacaacaa gttcgaaaat 2820
ctgactagca accagaagct gctgttttcc aatgcaaaag agggctctgt gaaggtcgaa 2880
agtctgggga tccagaacct gaaagtgttc gagaagtaca tcattacccc cctgggagat 2940
aaaattaagg ctgactttca gcctcgagaa aacatcagcc tgaaaaccag taaaaagtat 3000
ggcctgaggt aa 3012
<210> 23
<211> 16386
<212> DNA
<213> Artificial Sequence
<220>
<223> Vektor1_TaU6
<220>
<221> misc_feature
<222> (16239)..(16258)
<223> n is a, c, g, or t
<400> 23
ttgtacaaag tggttcgata attccgatcc agcctaggcc cgggcctgag gacgcgcctt 60
actagtggat cccttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 120
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 180
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 240
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 300
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 360
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 420
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 480
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 540
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 600
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 660
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 720
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 780
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 840
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 900
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 960
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 1020
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 1080
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 1140
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 1200
ctctccctct cgattacgag gtgtgttgtt catccgtccc gaatccatcc atcccctctt 1260
cagatgtgtt gttcatggct ctaatagctc tagatctgct tgtttgtgtt gtttagctct 1320
agatctactc gcgcgcgctt ctctctcgat ctcctgtaga acaattttgg ttggtttttt 1380
gtgcatatcc atggtaattt tgtctgcaat atggaggagg ctttctaagc tcctacgtag 1440
catcgatctt tagaattccc tcggtttctg tttatttctt cgcgagggct ctctgttatc 1500
tgtaggagta gctgtaagcg cggttcgtta cggattaatc gtcatgctta gttgaaccta 1560
tcggtcgaag gatttgtgtg ggttgtcgtg tagaattgac accatctact tactgtactg 1620
atatgccgat ctgtaggata ctcttcatta cttttgttta ctgctagttg tggtgtagat 1680
ttagcattct caaacccatg ctgtagcgtt tctaatattg ttacatagat ctaccggtgc 1740
ctgttaattg tattcgatcg ggcgtttcta catctgtccg cccacctagt tttatatgtg 1800
gtaatcaaaa ttgcgttgac ttcgtgatgc tgtctgtgta ctgtttttaa tcgctcttac 1860
ttagatgatc aacatggtga tggttacgat ttactgtttt ctaatccctg ttacttcgat 1920
gctgcagttt gattgatggg cccagaacga cgcccggccg acatccgccg tgccaccgag 1980
gcggacatgc cggcggtctg caccatcgtc aaccactaca tcgagacaag cacggtcaac 2040
ttccgtaccg agccgcagga accgcaggag tggacggacg acctcgtccg tctgcgggag 2100
cgctatccct ggctcgtcgc cgaggtggac ggcgaggtcg ccggcatcgc ctacgcgggc 2160
ccctggaagg cacgcaacgc ctacgactgg acggccgagt cgaccgtgta cgtctccccc 2220
cgccaccagc ggacgggact gggctccacg ctctacaccc acctgctgaa gtccctggag 2280
gcacagggct tcaagagcgt ggtcgctgtc atcgggctgc ccaacgaccc gagcgtgcgc 2340
atgcacgagg cgctcggata tgccccccgc ggcatgctgc gggcggccgg cttcaagcac 2400
gggaactggc atgacgtggg tttctggcag ctggacttca gcctgccggt accgccccgt 2460
ccggtcctgc ccgtcaccga gatctgaatg ccgaatttcc ccgatcgttc aaacatttgg 2520
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 2580
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 2640
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 2700
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgctcg 2760
aagatccccc gggctgcagg aattcaagct tggcactggc cgtcgtttta caacgtcgtg 2820
actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 2880
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 2940
atggcgaatg agcttgagct tggatcagat tgtcgtttcc cgccttcagt ttaaactatc 3000
agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt attagaataa 3060
cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg tgcatgccaa 3120
ccacagggtt cccctcggga tcaaagtact ttgatccaac ccctccgctg ctatagtgca 3180
gtcggcttct gacgttcagt gcagccgtct tctgaaaacg acatgtcgca caagtcctaa 3240
gttacgcgac aggctgccgc cctgcccttt tcctggcgtt ttcttgtcgc gtgttttagt 3300
cgcataaagt agaatacttg cgactagaac cggagacatt acgccatgaa caagagcgcc 3360
gccgctggcc tgctgggcta tgcccgcgtc agcaccgacg accaggactt gaccaaccaa 3420
cgggccgaac tgcacgcggc cggctgcacc aagctgtttt ccgagaagat caccggcacc 3480
aggcgcgacc gcccggagct ggccaggatg cttgaccacc tacgccctgg cgacgttgtg 3540
acagtgacca ggctagaccg cctggcccgc agcacccgcg acctactgga cattgccgag 3600
cgcatccagg aggccggcgc gggcctgcgt agcctggcag agccgtgggc cgacaccacc 3660
acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt cgagcgttcc 3720
ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg cgtgaagttt 3780
ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct gatcgaccag 3840
gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc gaccctgtac 3900
cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg cggtgccttc 3960
cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga acgccaagag 4020
gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt accgaagaga 4080
tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac gtctcaaccg 4140
tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc tggccggcca 4200
gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta tttgagtaaa 4260
acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa caaatacgca 4320
aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag gcaagacgac 4380
catcgcaacc catctagccc gcgccctgca actcgccggg gccgatgttc tgttagtcga 4440
ttccgatccc cagggcagtg cccgcgattg ggcggccgtg cgggaagatc aaccgctaac 4500
cgttgtcggc atcgaccgcc cgacgattga ccgcgacgtg aaggccatcg gccggcgcga 4560
cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg cgatcaaggc 4620
agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg ccaccgccga 4680
cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac aagcggcctt 4740
tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg aggcgctggc 4800
cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct acccaggcac 4860
tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg cccgcgaggt 4920
ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg taaagagaaa 4980
atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag cagcaaggct 5040
gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt tcagttgccg 5100
gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac cattaccgag 5160
ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat aaatgagtag 5220
atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag gcaccgacgc 5280
cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg gctgggttgt 5340
ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt gacggtcgca 5400
aaccatccgg cccggtacaa atcggcgcgg cgctgggtga tgacctggtg gagaagttga 5460
aggccgcgca ggccgcccag cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt 5520
ggcaagcggc cgctgatcga atccgcaaag aatcccggca accgccggca gccggtgcgc 5580
cgtcgattag gaagccgccc aagggcgacg agcaaccaga ttttttcgtt ccgatgctct 5640
atgacgtggg cacccgcgat agtcgcagca tcatggacgt ggccgttttc cgtctgtcga 5700
agcgtgaccg acgagctggc gaggtgatcc gctacgagct tccagacggg cacgtagagg 5760
tttccgcagg gccggccggc atggccagtg tgtgggatta cgacctggta ctgatggcgg 5820
tttcccatct aaccgaatcc atgaaccgat accgggaagg gaagggagac aagcccggcc 5880
gcgtgttccg tccacacgtt gcggacgtac tcaagttctg ccggcgagcc gatggcggaa 5940
agcagaaaga cgacctggta gaaacctgca ttcggttaaa caccacgcac gttgccatgc 6000
agcgtacgaa gaaggccaag aacggccgcc tggtgacggt atccgagggt gaagccttga 6060
ttagccgcta caagatcgta aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc 6120
tagctgattg gatgtaccgc gagatcacag aaggcaagaa cccggacgtg ctgacggttc 6180
accccgatta ctttttgatc gatcccggca tcggccgttt tctctaccgc ctggcacgcc 6240
gcgccgcagg caaggcagaa gccagatggt tgttcaagac gatctacgaa cgcagtggca 6300
gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc 6360
tgccggagta cgatttgaag gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct 6420
accgcaacct gatcgagggc gaagcatccg ccggttccta atgtacggag cagatgctag 6480
ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt 6540
acattgggaa cccaaagccg tacattggga accggaaccc gtacattggg aacccaaagc 6600
cgtacattgg gaaccggtca cacatgtaag tgactgatat aaaagagaaa aaaggcgatt 6660
tttccgccta aaactcttta aaacttatta aaactcttaa aacccgcctg gcctgtgcat 6720
aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc 6780
gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg 6840
ctggcctacg gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc 6900
gccggcgccc acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc 6960
tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga 7020
caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgacccag 7080
tcacgtagcg atagcggagt gtatactggc ttaactatgc ggcatcagag cagattgtac 7140
tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 7200
tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 7260
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 7320
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 7380
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 7440
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 7500
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 7560
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 7620
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 7680
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 7740
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 7800
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 7860
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 7920
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 7980
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 8040
ggattttggt catgcatgat atatctccca atttgtgtag ggcttattat gcacgcttaa 8100
aaataataaa agcagacttg acctgatagt ttggctgtga gcaattatgt gcttagtgca 8160
tctaatcgct tgagttaacg ccggcgaagc ggcgtcggct tgaacgaatt tctagctaga 8220
cattatttgc cgactacctt ggtgatctcg cctttcacgt agtggacaaa ttcttccaac 8280
tgatctgcgc gcgaggccaa gcgatcttct tcttgtccaa gataagcctg tctagcttca 8340
agtatgacgg gctgatactg ggccggcagg cgctccattg cccagtcggc agcgacatcc 8400
ttcggcgcga ttttgccggt tactgcgctg taccaaatgc gggacaacgt aagcactaca 8460
tttcgctcat cgccagccca gtcgggcggc gagttccata gcgttaaggt ttcatttagc 8520
gcctcaaata gatcctgttc aggaaccgga tcaaagagtt cctccgccgc tggacctacc 8580
aaggcaacgc tatgttctct tgcttttgtc agcaagatag ccagatcaat gtcgatcgtg 8640
gctggctcga agatacctgc aagaatgtca ttgcgctgcc attctccaaa ttgcagttcg 8700
cgcttagctg gataacgcca cggaatgatg tcgtcgtgca caacaatggt gacttctaca 8760
gcgcggagaa tctcgctctc tccaggggaa gccgaagttt ccaaaaggtc gttgatcaaa 8820
gctcgccgcg ttgtttcatc aagccttacg gtcaccgtaa ccagcaaatc aatatcactg 8880
tgtggcttca ggccgccatc cactgcggag ccgtacaaat gtacggccag caacgtcggt 8940
tcgagatggc gctcgatgac gccaactacc tctgatagtt gagtcgatac ttcggcgatc 9000
accgcttccc ccatgatgtt taactttgtt ttagggcgac tgccctgctg cgtaacatcg 9060
ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc 9120
cgaggcatag actgtacccc aaaaaaacat gtcataacaa gaagccatga aaaccgccac 9180
tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac cagttgcgtg acggcagtta 9240
cgctacttgc attacagctt acgaaccgaa cgaggcttat gtccactggg ttcgtgcccg 9300
aattgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac cctccgcgag 9360
atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc atcggtaaca 9420
tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg actgatgggc 9480
tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt tggctggctg 9540
gtggcaggat atattgtggt gtaaacaaat tgacgcttag acaacttaat aacacattgc 9600
ggacgttttt aatgtactga attaacgccg aattgctcta gccaatacgc aaaccgcctc 9660
tccccgcgcg ttggccgatt cattaattgc agcgtgaccc ggtcgtgccc ctctctagag 9720
ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 9780
gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 9840
taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 9900
catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 9960
tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 10020
ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 10080
acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 10140
ttttatttaa taatttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 10200
taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 10260
cagcctgtta aacgccgtcg atcgacgagt ctaacggaca ccaaccagcg aaccagcagc 10320
gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct ctggacccct 10380
ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga aattgcgtgg 10440
cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcaccggc 10500
agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata 10560
aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag cgcacacaca 10620
cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg 10680
tcctcccccc ccccccctct ctaccttctc tagatcggcg ttccggtcca tggttagggc 10740
ccggtagttc tacttctgtt catgtttgtg ttagatccgt gtttgtgtta gatccgtgct 10800
gctagcgttc gtacacggat gcgacctgta cgtcagacac gttctgattg ctaacttgcc 10860
agtgtttctc tttggggaat cctgggatgg ctctagccgt tccgcagacg ggatcgatct 10920
aggataggta tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag 10980
catctattca tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta 11040
taattatttt gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt 11100
ttttagccct gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc 11160
accctgttgt ttggtgttac ttctgcaggg gtaccgccat ggataagaag tactctatcg 11220
gactcgatat cggaactaac tctgtgggat gggctgtgat caccgatgag tacaaggtgc 11280
catctaagaa gttcaaggtt ctcggaaaca ccgataggca ctctatcaag aaaaacctta 11340
tcggtgctct cctcttcgat tctggtgaaa ctgctgaggc taccagactc aagagaaccg 11400
ctagaagaag gtacaccaga agaaagaaca ggatctgcta cctccaagag atcttctcta 11460
acgagatggc taaagtggat gattcattct tccacaggct cgaagagtca ttcctcgtgg 11520
aagaagataa gaagcacgag aggcacccta tcttcggaaa catcgttgat gaggtggcat 11580
accacgagaa gtaccctact atctaccacc tcagaaagaa gctcgttgat tctactgata 11640
aggctgatct caggctcatc tacctcgctc tcgctcacat gatcaagttc agaggacact 11700
tcctcatcga gggtgatctc aaccctgata actctgatgt ggataagttg ttcatccagc 11760
tcgtgcagac ctacaaccag cttttcgaag agaaccctat caacgcttca ggtgtggatg 11820
ctaaggctat cctctctgct aggctctcta agtcaagaag gcttgagaac ctcattgctc 11880
agctccctgg tgagaagaag aacggacttt tcggaaactt gatcgctctc tctctcggac 11940
tcacccctaa cttcaagtct aacttcgatc tcgctgagga tgcaaagctc cagctctcaa 12000
aggataccta cgatgatgat ctcgataacc tcctcgctca gatcggagat cagtacgctg 12060
atttgttcct cgctgctaag aacctctctg atgctatcct cctcagtgat atcctcagag 12120
tgaacaccga gatcaccaag gctccactct cagcttctat gatcaagaga tacgatgagc 12180
accaccagga tctcacactt ctcaaggctc ttgttagaca gcagctccca gagaagtaca 12240
aagagatttt cttcgatcag tctaagaacg gatacgctgg ttacatcgat ggtggtgcat 12300
ctcaagaaga gttctacaag ttcatcaagc ctatcctcga gaagatggat ggaaccgagg 12360
aactcctcgt gaagctcaat agagaggatc ttctcagaaa gcagaggacc ttcgataacg 12420
gatctatccc tcatcagatc cacctcggag agttgcacgc tatccttaga aggcaagagg 12480
atttctaccc attcctcaag gataacaggg aaaagattga gaagattctc accttcagaa 12540
tcccttacta cgtgggacct ctcgctagag gaaactcaag attcgcttgg atgaccagaa 12600
agtctgagga aaccatcacc ccttggaact tcgaagaggt ggtggataag ggtgctagtg 12660
ctcagtcttt catcgagagg atgaccaact tcgataagaa ccttccaaac gagaaggtgc 12720
tccctaagca ctctttgctc tacgagtact tcaccgtgta caacgagttg accaaggtta 12780
agtacgtgac cgagggaatg aggaagcctg cttttttgtc aggtgagcaa aagaaggcta 12840
tcgttgatct cttgttcaag accaacagaa aggtgaccgt gaagcagctc aaagaggatt 12900
acttcaagaa aatcgagtgc ttcgattcag ttgagatttc tggtgttgag gataggttca 12960
acgcatctct cggaacctac cacgatctcc tcaagatcat taaggataag gatttcttgg 13020
ataacgagga aaacgaggat atcttggagg atatcgttct taccctcacc ctctttgaag 13080
atagagagat gattgaagaa aggctcaaga cctacgctca tctcttcgat gataaggtga 13140
tgaagcagtt gaagagaaga agatacactg gttggggaag gctctcaaga aagctcatta 13200
acggaatcag ggataagcag tctggaaaga caatccttga tttcctcaag tctgatggat 13260
tcgctaacag aaacttcatg cagctcatcc acgatgattc tctcaccttt aaagaggata 13320
tccagaaggc tcaggtttca ggacagggtg atagtctcca tgagcatatc gctaacctcg 13380
ctggatctcc tgcaatcaag aagggaatcc tccagactgt gaaggttgtg gatgagttgg 13440
tgaaggtgat gggaaggcat aagcctgaga acatcgtgat cgaaatggct agagagaacc 13500
agaccactca gaagggacag aagaactcta gggaaaggat gaagaggatc gaggaaggta 13560
tcaaagagct tggatctcag atcctcaaag agcaccctgt tgagaacact cagctccaga 13620
atgagaagct ctacctctac tacctccaga acggaaggga tatgtatgtg gatcaagagt 13680
tggatatcaa caggctctct gattacgatg ttgatcatat cgtgccacag tcattcttga 13740
aggatgattc tatcgataac aaggtgctca ccaggtctga taagaacagg ggtaagagtg 13800
ataacgtgcc aagtgaagag gttgtgaaga aaatgaagaa ctattggagg cagctcctca 13860
acgctaagct catcactcag agaaagttcg ataacttgac taaggctgag aggggaggac 13920
tctctgaatt ggataaggca ggattcatca agaggcagct tgtggaaacc aggcagatca 13980
ctaagcacgt tgcacagatc ctcgattcta ggatgaacac caagtacgat gagaacgata 14040
agttgatcag ggaagtgaag gttatcaccc tcaagtcaaa gctcgtgtct gatttcagaa 14100
aggatttcca attctacaag gtgagggaaa tcaacaacta ccaccacgct cacgatgctt 14160
accttaacgc tgttgttgga accgctctca tcaagaagta tcctaagctc gagtcagagt 14220
tcgtgtacgg tgattacaag gtgtacgatg tgaggaagat gatcgctaag tctgagcaag 14280
agatcggaaa ggctaccgct aagtatttct tctactctaa catcatgaat ttcttcaaga 14340
ccgagattac cctcgctaac ggtgagatca gaaagaggcc actcatcgag acaaacggtg 14400
aaacaggtga gatcgtgtgg gataagggaa gggatttcgc taccgttaga aaggtgctct 14460
ctatgccaca ggtgaacatc gttaagaaaa ccgaggtgca gaccggtgga ttctctaaag 14520
agtctatcct ccctaagagg aactctgata agctcattgc taggaagaag gattgggacc 14580
ctaagaaata cggtggtttc gattctccta ccgtggctta ctctgttctc gttgtggcta 14640
aggttgagaa gggaaagagt aagaagctca agtctgttaa ggaacttctc ggaatcacta 14700
tcatggaaag gtcatctttc gagaagaacc caatcgattt cctcgaggct aagggataca 14760
aagaggttaa gaaggatctc atcatcaagc tcccaaagta ctcactcttc gaactcgaga 14820
acggtagaaa gaggatgctc gcttctgctg gtgagcttca aaagggaaac gagcttgctc 14880
tcccatctaa gtacgttaac tttctttacc tcgcttctca ctacgagaag ttgaagggat 14940
ctccagaaga taacgagcag aagcaacttt tcgttgagca gcacaagcac tacttggatg 15000
agatcatcga gcagatctct gagttctcta aaagggtgat cctcgctgat gcaaacctcg 15060
ataaggtgtt gtctgcttac aacaagcaca gagataagcc tatcagggaa caggcagaga 15120
acatcatcca tctcttcacc cttaccaacc tcggtgctcc tgctgctttc aagtacttcg 15180
atacaaccat cgataggaag agatacacct ctaccaaaga agtgctcgat gctaccctca 15240
tccatcagtc tatcactgga ctctacgaga ctaggatcga tctctcacag ctcggtggtg 15300
attcaagggc tgatcctaag aagaagagga aggtttgagg cgcgccgagc tccaggcctc 15360
ccagctttcg tccgtatcat cggtttcgac aacgttcgtc aagttcaatg catcagtttc 15420
attgcccaca caccagaatc ctactaagtt tgagtattat ggcattggaa aagctgtttt 15480
cttctatcat ttgttctgct tgtaatttac tgtgttcttt cagtttttgt tttcggacat 15540
caaaatgcaa atggatggat aagagttaat aaatgatatg gtccttttgt tcattctcaa 15600
attattatta tctgttgttt ttactttaat gggttgaatt taagtaagaa aggaactaac 15660
agtgtgatat taaggtgcaa tgttagacat ataaaacagt ctttcacctc tctttggtta 15720
tgtcttgaat tggtttgttt cttcacttat ctgtgtaatc aagtttacta tgagtctatg 15780
atcaagtaat tatgcaatca agttaagtac agtataggct tgagctccct aggcctgtta 15840
tccctaacaa gtttgtacaa aaaagcaggc tgagctcgac caagcccgtt attctgacag 15900
ttctggtgct caacacattt atatttatca aggagcacat tgttactcac tgctaggagg 15960
gaatcgaact aggaatattg atcagaggaa ctacgagaga gctgaagata actgccctct 16020
agctctcact gatctgggcg catagtgaga tgcagcccac gtgagttcag caacggtcta 16080
gcgctgggct tttaggcccg catgatcggg ctttgtcggg tggtcgacgt gttcacgatt 16140
ggggagagca acgcagcagt tcctcttagt ttagtcccac ctcgcctgtc cagcagagtt 16200
ctgaccggtt tataaactcg cttgctgcat cagacttgnn nnnnnnnnnn nnnnnnnngt 16260
tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg 16320
caccgagtcg gtgctttttt tctagaccca gctttcttgt acaaagttgg cattaaccca 16380
gctttc 16386
<210> 24
<211> 16792
<212> DNA
<213> Artificial Sequence
<220>
<223> Vektor1_ZmU3
<220>
<221> misc_feature
<222> (16645)..(16664)
<223> n is a, c, g, or t
<400> 24
ttgtacaaag tggttcgata attccgatcc agcctaggcc cgggcctgag gacgcgcctt 60
actagtggat cccttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 120
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 180
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 240
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 300
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 360
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 420
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 480
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 540
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 600
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 660
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 720
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 780
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 840
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 900
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 960
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 1020
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 1080
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 1140
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 1200
ctctccctct cgattacgag gtgtgttgtt catccgtccc gaatccatcc atcccctctt 1260
cagatgtgtt gttcatggct ctaatagctc tagatctgct tgtttgtgtt gtttagctct 1320
agatctactc gcgcgcgctt ctctctcgat ctcctgtaga acaattttgg ttggtttttt 1380
gtgcatatcc atggtaattt tgtctgcaat atggaggagg ctttctaagc tcctacgtag 1440
catcgatctt tagaattccc tcggtttctg tttatttctt cgcgagggct ctctgttatc 1500
tgtaggagta gctgtaagcg cggttcgtta cggattaatc gtcatgctta gttgaaccta 1560
tcggtcgaag gatttgtgtg ggttgtcgtg tagaattgac accatctact tactgtactg 1620
atatgccgat ctgtaggata ctcttcatta cttttgttta ctgctagttg tggtgtagat 1680
ttagcattct caaacccatg ctgtagcgtt tctaatattg ttacatagat ctaccggtgc 1740
ctgttaattg tattcgatcg ggcgtttcta catctgtccg cccacctagt tttatatgtg 1800
gtaatcaaaa ttgcgttgac ttcgtgatgc tgtctgtgta ctgtttttaa tcgctcttac 1860
ttagatgatc aacatggtga tggttacgat ttactgtttt ctaatccctg ttacttcgat 1920
gctgcagttt gattgatggg cccagaacga cgcccggccg acatccgccg tgccaccgag 1980
gcggacatgc cggcggtctg caccatcgtc aaccactaca tcgagacaag cacggtcaac 2040
ttccgtaccg agccgcagga accgcaggag tggacggacg acctcgtccg tctgcgggag 2100
cgctatccct ggctcgtcgc cgaggtggac ggcgaggtcg ccggcatcgc ctacgcgggc 2160
ccctggaagg cacgcaacgc ctacgactgg acggccgagt cgaccgtgta cgtctccccc 2220
cgccaccagc ggacgggact gggctccacg ctctacaccc acctgctgaa gtccctggag 2280
gcacagggct tcaagagcgt ggtcgctgtc atcgggctgc ccaacgaccc gagcgtgcgc 2340
atgcacgagg cgctcggata tgccccccgc ggcatgctgc gggcggccgg cttcaagcac 2400
gggaactggc atgacgtggg tttctggcag ctggacttca gcctgccggt accgccccgt 2460
ccggtcctgc ccgtcaccga gatctgaatg ccgaatttcc ccgatcgttc aaacatttgg 2520
caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt 2580
ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga 2640
tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata 2700
tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgctcg 2760
aagatccccc gggctgcagg aattcaagct tggcactggc cgtcgtttta caacgtcgtg 2820
actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 2880
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 2940
atggcgaatg agcttgagct tggatcagat tgtcgtttcc cgccttcagt ttaaactatc 3000
agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt attagaataa 3060
cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg tgcatgccaa 3120
ccacagggtt cccctcggga tcaaagtact ttgatccaac ccctccgctg ctatagtgca 3180
gtcggcttct gacgttcagt gcagccgtct tctgaaaacg acatgtcgca caagtcctaa 3240
gttacgcgac aggctgccgc cctgcccttt tcctggcgtt ttcttgtcgc gtgttttagt 3300
cgcataaagt agaatacttg cgactagaac cggagacatt acgccatgaa caagagcgcc 3360
gccgctggcc tgctgggcta tgcccgcgtc agcaccgacg accaggactt gaccaaccaa 3420
cgggccgaac tgcacgcggc cggctgcacc aagctgtttt ccgagaagat caccggcacc 3480
aggcgcgacc gcccggagct ggccaggatg cttgaccacc tacgccctgg cgacgttgtg 3540
acagtgacca ggctagaccg cctggcccgc agcacccgcg acctactgga cattgccgag 3600
cgcatccagg aggccggcgc gggcctgcgt agcctggcag agccgtgggc cgacaccacc 3660
acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt cgagcgttcc 3720
ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg cgtgaagttt 3780
ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct gatcgaccag 3840
gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc gaccctgtac 3900
cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg cggtgccttc 3960
cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga acgccaagag 4020
gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt accgaagaga 4080
tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac gtctcaaccg 4140
tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc tggccggcca 4200
gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta tttgagtaaa 4260
acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa caaatacgca 4320
aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag gcaagacgac 4380
catcgcaacc catctagccc gcgccctgca actcgccggg gccgatgttc tgttagtcga 4440
ttccgatccc cagggcagtg cccgcgattg ggcggccgtg cgggaagatc aaccgctaac 4500
cgttgtcggc atcgaccgcc cgacgattga ccgcgacgtg aaggccatcg gccggcgcga 4560
cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg cgatcaaggc 4620
agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg ccaccgccga 4680
cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac aagcggcctt 4740
tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg aggcgctggc 4800
cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct acccaggcac 4860
tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg cccgcgaggt 4920
ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg taaagagaaa 4980
atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag cagcaaggct 5040
gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt tcagttgccg 5100
gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac cattaccgag 5160
ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat aaatgagtag 5220
atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag gcaccgacgc 5280
cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg gctgggttgt 5340
ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt gacggtcgca 5400
aaccatccgg cccggtacaa atcggcgcgg cgctgggtga tgacctggtg gagaagttga 5460
aggccgcgca ggccgcccag cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt 5520
ggcaagcggc cgctgatcga atccgcaaag aatcccggca accgccggca gccggtgcgc 5580
cgtcgattag gaagccgccc aagggcgacg agcaaccaga ttttttcgtt ccgatgctct 5640
atgacgtggg cacccgcgat agtcgcagca tcatggacgt ggccgttttc cgtctgtcga 5700
agcgtgaccg acgagctggc gaggtgatcc gctacgagct tccagacggg cacgtagagg 5760
tttccgcagg gccggccggc atggccagtg tgtgggatta cgacctggta ctgatggcgg 5820
tttcccatct aaccgaatcc atgaaccgat accgggaagg gaagggagac aagcccggcc 5880
gcgtgttccg tccacacgtt gcggacgtac tcaagttctg ccggcgagcc gatggcggaa 5940
agcagaaaga cgacctggta gaaacctgca ttcggttaaa caccacgcac gttgccatgc 6000
agcgtacgaa gaaggccaag aacggccgcc tggtgacggt atccgagggt gaagccttga 6060
ttagccgcta caagatcgta aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc 6120
tagctgattg gatgtaccgc gagatcacag aaggcaagaa cccggacgtg ctgacggttc 6180
accccgatta ctttttgatc gatcccggca tcggccgttt tctctaccgc ctggcacgcc 6240
gcgccgcagg caaggcagaa gccagatggt tgttcaagac gatctacgaa cgcagtggca 6300
gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc 6360
tgccggagta cgatttgaag gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct 6420
accgcaacct gatcgagggc gaagcatccg ccggttccta atgtacggag cagatgctag 6480
ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt 6540
acattgggaa cccaaagccg tacattggga accggaaccc gtacattggg aacccaaagc 6600
cgtacattgg gaaccggtca cacatgtaag tgactgatat aaaagagaaa aaaggcgatt 6660
tttccgccta aaactcttta aaacttatta aaactcttaa aacccgcctg gcctgtgcat 6720
aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc 6780
gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg 6840
ctggcctacg gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc 6900
gccggcgccc acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc 6960
tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga 7020
caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgacccag 7080
tcacgtagcg atagcggagt gtatactggc ttaactatgc ggcatcagag cagattgtac 7140
tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 7200
tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 7260
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 7320
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 7380
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 7440
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 7500
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 7560
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 7620
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 7680
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 7740
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 7800
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 7860
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 7920
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 7980
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 8040
ggattttggt catgcatgat atatctccca atttgtgtag ggcttattat gcacgcttaa 8100
aaataataaa agcagacttg acctgatagt ttggctgtga gcaattatgt gcttagtgca 8160
tctaatcgct tgagttaacg ccggcgaagc ggcgtcggct tgaacgaatt tctagctaga 8220
cattatttgc cgactacctt ggtgatctcg cctttcacgt agtggacaaa ttcttccaac 8280
tgatctgcgc gcgaggccaa gcgatcttct tcttgtccaa gataagcctg tctagcttca 8340
agtatgacgg gctgatactg ggccggcagg cgctccattg cccagtcggc agcgacatcc 8400
ttcggcgcga ttttgccggt tactgcgctg taccaaatgc gggacaacgt aagcactaca 8460
tttcgctcat cgccagccca gtcgggcggc gagttccata gcgttaaggt ttcatttagc 8520
gcctcaaata gatcctgttc aggaaccgga tcaaagagtt cctccgccgc tggacctacc 8580
aaggcaacgc tatgttctct tgcttttgtc agcaagatag ccagatcaat gtcgatcgtg 8640
gctggctcga agatacctgc aagaatgtca ttgcgctgcc attctccaaa ttgcagttcg 8700
cgcttagctg gataacgcca cggaatgatg tcgtcgtgca caacaatggt gacttctaca 8760
gcgcggagaa tctcgctctc tccaggggaa gccgaagttt ccaaaaggtc gttgatcaaa 8820
gctcgccgcg ttgtttcatc aagccttacg gtcaccgtaa ccagcaaatc aatatcactg 8880
tgtggcttca ggccgccatc cactgcggag ccgtacaaat gtacggccag caacgtcggt 8940
tcgagatggc gctcgatgac gccaactacc tctgatagtt gagtcgatac ttcggcgatc 9000
accgcttccc ccatgatgtt taactttgtt ttagggcgac tgccctgctg cgtaacatcg 9060
ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc 9120
cgaggcatag actgtacccc aaaaaaacat gtcataacaa gaagccatga aaaccgccac 9180
tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac cagttgcgtg acggcagtta 9240
cgctacttgc attacagctt acgaaccgaa cgaggcttat gtccactggg ttcgtgcccg 9300
aattgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac cctccgcgag 9360
atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc atcggtaaca 9420
tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg actgatgggc 9480
tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt tggctggctg 9540
gtggcaggat atattgtggt gtaaacaaat tgacgcttag acaacttaat aacacattgc 9600
ggacgttttt aatgtactga attaacgccg aattgctcta gccaatacgc aaaccgcctc 9660
tccccgcgcg ttggccgatt cattaattgc agcgtgaccc ggtcgtgccc ctctctagag 9720
ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 9780
gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 9840
taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 9900
catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 9960
tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 10020
ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 10080
acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 10140
ttttatttaa taatttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 10200
taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 10260
cagcctgtta aacgccgtcg atcgacgagt ctaacggaca ccaaccagcg aaccagcagc 10320
gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct ctggacccct 10380
ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga aattgcgtgg 10440
cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcaccggc 10500
agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata 10560
aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag cgcacacaca 10620
cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg 10680
tcctcccccc ccccccctct ctaccttctc tagatcggcg ttccggtcca tggttagggc 10740
ccggtagttc tacttctgtt catgtttgtg ttagatccgt gtttgtgtta gatccgtgct 10800
gctagcgttc gtacacggat gcgacctgta cgtcagacac gttctgattg ctaacttgcc 10860
agtgtttctc tttggggaat cctgggatgg ctctagccgt tccgcagacg ggatcgatct 10920
aggataggta tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag 10980
catctattca tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta 11040
taattatttt gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt 11100
ttttagccct gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc 11160
accctgttgt ttggtgttac ttctgcaggg gtaccgccat ggataagaag tactctatcg 11220
gactcgatat cggaactaac tctgtgggat gggctgtgat caccgatgag tacaaggtgc 11280
catctaagaa gttcaaggtt ctcggaaaca ccgataggca ctctatcaag aaaaacctta 11340
tcggtgctct cctcttcgat tctggtgaaa ctgctgaggc taccagactc aagagaaccg 11400
ctagaagaag gtacaccaga agaaagaaca ggatctgcta cctccaagag atcttctcta 11460
acgagatggc taaagtggat gattcattct tccacaggct cgaagagtca ttcctcgtgg 11520
aagaagataa gaagcacgag aggcacccta tcttcggaaa catcgttgat gaggtggcat 11580
accacgagaa gtaccctact atctaccacc tcagaaagaa gctcgttgat tctactgata 11640
aggctgatct caggctcatc tacctcgctc tcgctcacat gatcaagttc agaggacact 11700
tcctcatcga gggtgatctc aaccctgata actctgatgt ggataagttg ttcatccagc 11760
tcgtgcagac ctacaaccag cttttcgaag agaaccctat caacgcttca ggtgtggatg 11820
ctaaggctat cctctctgct aggctctcta agtcaagaag gcttgagaac ctcattgctc 11880
agctccctgg tgagaagaag aacggacttt tcggaaactt gatcgctctc tctctcggac 11940
tcacccctaa cttcaagtct aacttcgatc tcgctgagga tgcaaagctc cagctctcaa 12000
aggataccta cgatgatgat ctcgataacc tcctcgctca gatcggagat cagtacgctg 12060
atttgttcct cgctgctaag aacctctctg atgctatcct cctcagtgat atcctcagag 12120
tgaacaccga gatcaccaag gctccactct cagcttctat gatcaagaga tacgatgagc 12180
accaccagga tctcacactt ctcaaggctc ttgttagaca gcagctccca gagaagtaca 12240
aagagatttt cttcgatcag tctaagaacg gatacgctgg ttacatcgat ggtggtgcat 12300
ctcaagaaga gttctacaag ttcatcaagc ctatcctcga gaagatggat ggaaccgagg 12360
aactcctcgt gaagctcaat agagaggatc ttctcagaaa gcagaggacc ttcgataacg 12420
gatctatccc tcatcagatc cacctcggag agttgcacgc tatccttaga aggcaagagg 12480
atttctaccc attcctcaag gataacaggg aaaagattga gaagattctc accttcagaa 12540
tcccttacta cgtgggacct ctcgctagag gaaactcaag attcgcttgg atgaccagaa 12600
agtctgagga aaccatcacc ccttggaact tcgaagaggt ggtggataag ggtgctagtg 12660
ctcagtcttt catcgagagg atgaccaact tcgataagaa ccttccaaac gagaaggtgc 12720
tccctaagca ctctttgctc tacgagtact tcaccgtgta caacgagttg accaaggtta 12780
agtacgtgac cgagggaatg aggaagcctg cttttttgtc aggtgagcaa aagaaggcta 12840
tcgttgatct cttgttcaag accaacagaa aggtgaccgt gaagcagctc aaagaggatt 12900
acttcaagaa aatcgagtgc ttcgattcag ttgagatttc tggtgttgag gataggttca 12960
acgcatctct cggaacctac cacgatctcc tcaagatcat taaggataag gatttcttgg 13020
ataacgagga aaacgaggat atcttggagg atatcgttct taccctcacc ctctttgaag 13080
atagagagat gattgaagaa aggctcaaga cctacgctca tctcttcgat gataaggtga 13140
tgaagcagtt gaagagaaga agatacactg gttggggaag gctctcaaga aagctcatta 13200
acggaatcag ggataagcag tctggaaaga caatccttga tttcctcaag tctgatggat 13260
tcgctaacag aaacttcatg cagctcatcc acgatgattc tctcaccttt aaagaggata 13320
tccagaaggc tcaggtttca ggacagggtg atagtctcca tgagcatatc gctaacctcg 13380
ctggatctcc tgcaatcaag aagggaatcc tccagactgt gaaggttgtg gatgagttgg 13440
tgaaggtgat gggaaggcat aagcctgaga acatcgtgat cgaaatggct agagagaacc 13500
agaccactca gaagggacag aagaactcta gggaaaggat gaagaggatc gaggaaggta 13560
tcaaagagct tggatctcag atcctcaaag agcaccctgt tgagaacact cagctccaga 13620
atgagaagct ctacctctac tacctccaga acggaaggga tatgtatgtg gatcaagagt 13680
tggatatcaa caggctctct gattacgatg ttgatcatat cgtgccacag tcattcttga 13740
aggatgattc tatcgataac aaggtgctca ccaggtctga taagaacagg ggtaagagtg 13800
ataacgtgcc aagtgaagag gttgtgaaga aaatgaagaa ctattggagg cagctcctca 13860
acgctaagct catcactcag agaaagttcg ataacttgac taaggctgag aggggaggac 13920
tctctgaatt ggataaggca ggattcatca agaggcagct tgtggaaacc aggcagatca 13980
ctaagcacgt tgcacagatc ctcgattcta ggatgaacac caagtacgat gagaacgata 14040
agttgatcag ggaagtgaag gttatcaccc tcaagtcaaa gctcgtgtct gatttcagaa 14100
aggatttcca attctacaag gtgagggaaa tcaacaacta ccaccacgct cacgatgctt 14160
accttaacgc tgttgttgga accgctctca tcaagaagta tcctaagctc gagtcagagt 14220
tcgtgtacgg tgattacaag gtgtacgatg tgaggaagat gatcgctaag tctgagcaag 14280
agatcggaaa ggctaccgct aagtatttct tctactctaa catcatgaat ttcttcaaga 14340
ccgagattac cctcgctaac ggtgagatca gaaagaggcc actcatcgag acaaacggtg 14400
aaacaggtga gatcgtgtgg gataagggaa gggatttcgc taccgttaga aaggtgctct 14460
ctatgccaca ggtgaacatc gttaagaaaa ccgaggtgca gaccggtgga ttctctaaag 14520
agtctatcct ccctaagagg aactctgata agctcattgc taggaagaag gattgggacc 14580
ctaagaaata cggtggtttc gattctccta ccgtggctta ctctgttctc gttgtggcta 14640
aggttgagaa gggaaagagt aagaagctca agtctgttaa ggaacttctc ggaatcacta 14700
tcatggaaag gtcatctttc gagaagaacc caatcgattt cctcgaggct aagggataca 14760
aagaggttaa gaaggatctc atcatcaagc tcccaaagta ctcactcttc gaactcgaga 14820
acggtagaaa gaggatgctc gcttctgctg gtgagcttca aaagggaaac gagcttgctc 14880
tcccatctaa gtacgttaac tttctttacc tcgcttctca ctacgagaag ttgaagggat 14940
ctccagaaga taacgagcag aagcaacttt tcgttgagca gcacaagcac tacttggatg 15000
agatcatcga gcagatctct gagttctcta aaagggtgat cctcgctgat gcaaacctcg 15060
ataaggtgtt gtctgcttac aacaagcaca gagataagcc tatcagggaa caggcagaga 15120
acatcatcca tctcttcacc cttaccaacc tcggtgctcc tgctgctttc aagtacttcg 15180
atacaaccat cgataggaag agatacacct ctaccaaaga agtgctcgat gctaccctca 15240
tccatcagtc tatcactgga ctctacgaga ctaggatcga tctctcacag ctcggtggtg 15300
attcaagggc tgatcctaag aagaagagga aggtttgagg cgcgccgagc tccaggcctc 15360
ccagctttcg tccgtatcat cggtttcgac aacgttcgtc aagttcaatg catcagtttc 15420
attgcccaca caccagaatc ctactaagtt tgagtattat ggcattggaa aagctgtttt 15480
cttctatcat ttgttctgct tgtaatttac tgtgttcttt cagtttttgt tttcggacat 15540
caaaatgcaa atggatggat aagagttaat aaatgatatg gtccttttgt tcattctcaa 15600
attattatta tctgttgttt ttactttaat gggttgaatt taagtaagaa aggaactaac 15660
agtgtgatat taaggtgcaa tgttagacat ataaaacagt ctttcacctc tctttggtta 15720
tgtcttgaat tggtttgttt cttcacttat ctgtgtaatc aagtttacta tgagtctatg 15780
atcaagtaat tatgcaatca agttaagtac agtataggct tgagctccct aggcctgtta 15840
tccctaacaa gtttgtacaa aaaagcaggc tgagctcgaa ttccatctaa gtatcttggt 15900
aaagcatgga ttaatttgga tgcccacttc aggtctatgc agctccggtg ccttgtgatt 15960
gtgagttgtg accgatgctc atgctattct gcatttctgc gatgtatgta gctagtagat 16020
cttcaaaact aacaccgcat gccatcatca tccactgctt gattttagtc tcaccgctgg 16080
ccaaaaatgt gatgatgcca gaaacctcaa ctaccttgaa tcaacacggg cccaacagtg 16140
tgatgacgac agaaacaaaa aaaaatgagc caatagttca gaaggaggca ctatgcagaa 16200
actacatttc tgaaggtgac taaaaggtga gcgtagagtg taattactag tagtttagcc 16260
accattaccc aaatgctttc gagcttgtat taagatttcc taagctgagc atcatcactg 16320
atctgcaggc caccctcgct tcgctgccaa gatcaacagc aaccatgtgg cggcaacatc 16380
cagcattgca catgggctaa agattgagct ttgtgcctcg tctagggatc agctgaggtt 16440
atcagtcttt cctttttttc atccaggtga ggcatcaagc tactactgcc tcgattggct 16500
ggacccgaag cccacatgta ggataccaga atgggccgac ccaggacgca gtatgttggc 16560
cagtcccacc ggttagtgcc atctcggttg ctcacatgcg tagaagccag cttaaaaatt 16620
tagctttggt gactcacagc attgnnnnnn nnnnnnnnnn nnnngtttta gagctagaaa 16680
tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc 16740
tttttttcta gacccagctt tcttgtacaa agttggcatt aacccagctt tc 16792
<210> 25
<211> 3256
<212> DNA
<213> Brome mosaic virus strain Fescue segment RNA1, complete sequencecDNA DQ530423
<400> 25
gagcgttaac gtagaccacg gaacgaggtt caatcccttg tcgaccacgg ttctactact 60
tgttctttgt ttttcaccaa caaaatgtca agttctatcg atttgctgaa gttgattgct 120
gagaagggtg ctgccagcca gagtgcccaa gacatcgtag acaatcaggt cgcgcaacag 180
ttatctgcgc agattgaata cgcgaaaagg tctaagaaaa tcaacgttcg caataagctc 240
tctattgagg aggctgacgc cttccgtgac cgttatggtg gtgcctttga tttaaatttg 300
actcagcagt atcatgcacc ccatagcctg gctggtgctc tgcgtgtagc ggagcattac 360
gactgtctcg acagttttcc ccctgaagac cccgttatag atttcggagg gtcttggtgg 420
catcactttt caagaaggga taaaagggtg cacagttgtt gtcctgtgtt gggtgttaga 480
gacgctgccc gacatgagga gaggatgtgc cgcatgcgga aaattttgca agaaagcgat 540
gatttcgatg aagtcccgaa cttttgtctt aaccgagctc aagattgtga tgtccaagct 600
gattgggcta tctgtatcca tggcggttat gatatgggct tccaaggtct gtgtgacgcc 660
atgcattcgc atggagtacg cgtactacgt ggtaccgtta tgttcgacgg cgccatgttg 720
tttgaccgcg agggttttct tcccttgctt aaatgtcact ggcaacgtga cgggtcaggc 780
gcggatgagg tgatcaaatt cgactttgaa aatgaaagca cattatctta catccatgga 840
tggcaagatt tgggctcctt tttcaccgag tcggtgcatt gcatcgatgg aaccacctat 900
ctgttggagc gcgaaatgct gaaatgtaac atcatgacct ataagatcat cgctacaaat 960
ttacgctgcc cccgggagac actacgtcac tgtgtatggt ttgaagacat atctaagtac 1020
gtgggagtct caatacctga agactggagt ctcaatcgct ggaaatgtgt gcgcgtcgcc 1080
aaaaccacag tgagagaggt agaggagata gctttcagat gtttcaagga aaataaagaa 1140
tggaccgaga acatgaaagc tgtcgcatct atcttatccg ccaagtcgtc gactgttatt 1200
attaacggtc aggctatcat ggctggtgag cgcttagaca ttgaagatta tcatctagtg 1260
gcctttgctt tgactttgaa tctgtatcaa aagtacgaaa agcttacggc cctccgcgat 1320
gggatggaat ggaaaggttg gtgccatcac ttcaaaacta ggttttggtg gggtggagat 1380
tcatccaggg cgaaagtagg atggctgaga acattggcta gcagatttcc cctactacgt 1440
ctggattctt atgcggacag ttttaagttt ctgactcgtc tctcaaacgt tgaagaattt 1500
gagcaagatt ctgtaccaat atcacgtttg agaacgtttt ggactgaaga ggacttattc 1560
gaccggctgg agcatgaagt gcagacagcc aagaccaagc gctcgaagaa gaaggcgata 1620
gtcccgccag ctgctgagat acctcaggag gagtttcatg atgcccctga gagttcgagc 1680
cctgagtccg tcagtgatga cgttaaaccg gtgactgatg tggtcccgga tgccgaggtg 1740
tctgttgagg taccaacgga ccctcgtggc atatctagac acggagccat gaaggaattt 1800
gtgcgttatt gtaagagatt acataacaac tccgagtcta atcttcgtca cctatgggac 1860
atttccggcg gtcgcggaag tgagatcgca aataagagca tcttcgagac ctaccatcgc 1920
atagacgata tggtgaatgt ccatttggcc aacggtaact ggttgtatcc taaaaaatac 1980
gattacaccg ttggatataa tgagcatggt ttaggtccga agcacgcaga tgaaacgtac 2040
attgttgata aaacatgtgc atgctctaac ttgagggaca ttgcagaagc tagcgccaaa 2100
gtttctgtcc ctacatgcga tatttccatg gttgatggag ttgcgggatg cggtaaaacc 2160
actgccataa aagatgcatt ccgtatggga gaggacctaa ttgtgacggc gaatcgtaaa 2220
tcggccgagg acgtcaggat ggctttattc cctgacactt ttaattccaa ggtagctttg 2280
gatgttgtgc gcaccgcgga ttctgcgatc atgcacggtg taccgtcctg tcataggctg 2340
cttgttgatg aggctggttt actacattac ggtcaactcc tggtggtggc tgctctgtct 2400
aaatgttcac aagttcttgc ctttggggac acagagcaga tttcgttcaa gtctcgtgac 2460
gcgggtttta aattgctcca cggtaatctg aaatatgatc gccgtgacgt tgttcacaag 2520
acttaccggt gtccgcaaga tgttatcgct gctgttaatc tgctgaagcg taaatgcggt 2580
aatagggaca cgaagtatca atcctggaca tctgagtcca aagtttctag aagtctcacg 2640
aagcgtcgta ttacttctgt tttgcaggtc actattgatc cgaacagaac gtatcttacg 2700
atgactcaag ctgataaagc ggcccttcaa acgagggcta aggactttcc cgtgagcaag 2760
gactggattg atggacatat aaaaacagta cacgaagcgc aagggatctc tgttgacaat 2820
gtcgctttgg ttcggcttaa gtcgaccaaa tgtgatttgt ttaaacatga ggagtactgt 2880
ttggttgcct taacacgaca caagaagtcc tttgagtatt gctttaacgg cgagctcgct 2940
ggtgatttga tctttaattg tgttaagtga tgcgcttgtc tctgtgtgag acctctgctc 3000
gaggagagcc ctgttccagg taggaacgtt gtggtctaac ttaagactag ctgaatcggt 3060
gctataaccg atagtcgtgg ttgacacgca gacctcttac aagagtgtct aggcgccttt 3120
gagagttact ctttgctctc ttcggaagaa cccctagggg ttcgtgcatg ggcttgcata 3180
gcaagtctta gaatgcgggt gccttacagt gttgaaaaac actgtaaatc tctaaaagag 3240
accattaatt aagctc 3256
<210> 26
<211> 2895
<212> DNA
<213> Brome mosaic virus strain Fescue segment RNA2, complete sequencecDNA DQ530424
<400> 26
gagcgttaac acgcgtgtaa accacggaac gaggttcaat cccttgtcga cccacggttt 60
gcgcaacaca catctaacct tgttgttgtt gtgttttgtt tctttctact atcaccaaga 120
tgtcttcgaa aacctgggat gatgatttcg ttcgccaggt cccgtctttc caatggatca 180
tagatcaatc cttagaagac gaggtggagg ctgctagcct tcaggtgcag gagccggcag 240
acggagttgc cattgacgga tctctcgcga gttttaaatt agctatagcg cccttggaga 300
taggaggggt gttcgatccc ccttttgacc gagtgcgctg gggctctatt tgcgataccg 360
tccagcaaat ggttcaacag ttcaccgata gaccactgat tcctcaggct gaaatggcac 420
ggatgttata tcttgacatt ccgggctctt ttgtgctcga agatgaaatc gatgactggt 480
atcctgagga tactagtgac ggttacggtg tatcgtttgc cgccgatgaa gatcatgcga 540
gcgatctaaa actcgccagt gattcctcga actgtgaaat tgaggaagtt cgtgttactg 600
gagatacccc caaggagctg acccttggag ataggtacat gggcattgac gaagagtttc 660
agactaccaa tactgattac gacatcactc ttcagatcat gaatcctatt gaacataggg 720
tttcgcgcgt tattgatacg cactgccatc cagataaccc tgacatctcc actgggccaa 780
tttatatgga gagagtcagc cttgctagaa cagaagcaac cagtcattcc atactgccaa 840
cccatgctta tttcgatgat tcgtaccatc aagcccttgt tgagaatggt gattattcca 900
tggactttga taggatcaga cttaagcaaa gtgatgtaga ctggtacagg gaccccgata 960
aatattttca accaaaaatg aatatcggga gtgctcagcg aagagttggt actcagaaag 1020
aagtcttaac cgcacttaaa aagcgaaacg cggatgttcc agaaatggga gacgcgatta 1080
acatgaagga aactgcgaag gctatagcaa agcgctttcg tagcacattc cttaatgttg 1140
acggtgaaga ctgtctgaga gcttctatgg atgtcatgac taagtgtctt gagtaccata 1200
agaagtgggg taagcacatg gacttacaag gtgtgaatgt ggcagcagag actgatttac 1260
gtcggtacca gcatatgctg aagtctgatg taaaacctgt tgtaactgac acccttcact 1320
tggaacgagc agtagcagct actataacat ttcatagtaa aggtgtgact agtaattttt 1380
cacccttttt cactgcttgt ttcgagaagt tatcattggc cctgaaatcc aggttcattg 1440
tgcctatcgg aaagatatcc tctctggagc ttaagaatgt ccgcttgaat aacagatact 1500
ttcttgaagc ggacctaagc aaatttgata aatctcaggg tgagctgcac ctagagtttc 1560
agagagagat acttcttgcg ctgggctttc cagcgccgct gacgaattgg tggtctgatt 1620
ttcatcgcga ttcttattta tcagaccctc atgccaaggt gggaatgtcc gtttccttcc 1680
aacgcagaac tggtgatgcg tttacatatt tcgggaatac tcttgtcact atggctatga 1740
ttgcatatgc ctctgatcta agtgactgtg actgtgcaat attctcagga gatgattctt 1800
taatcatttc taaagttaaa ccagtcttgg ataccgatat gttcacgtct ctctttaata 1860
tggagataaa agttatggac cctagtgtgc cctacgtttg tagtaagttt cttgttgaaa 1920
ctgaaatggg caattgggtg tctataccag accctatgag agagatccag cgcttagcta 1980
agcgaaagat tctgcgtgaa gaacagatgc tcagagcaca tttcgtttcc ttctgcgatc 2040
gaatgaagtt tattaatcaa cttgatgaga agatgattac gatgctctgt cattttgttt 2100
atctgaaata tgggaaagaa aaaccttgga ttttcgagga ggttagagct gctcttgcgg 2160
ctttttcttt atactccgag aatttcctga ggttctctga ttgctactgt accgaaggca 2220
tcagagttta tcagatgagc gatcctgtat gtaagttcaa acgcactatg gaagagcgta 2280
aaactgatgg tgactggttt cacaactgga agaatccaaa gtttcctggt gtgttagaca 2340
aagtctacag aacccttgga atttattcct cggactgtag tactaaggag ctccctgtca 2400
aacggatcgg acgtttacat gaggcccttg agcgtgagtc actcagatta gcgaatgatc 2460
gtaggaccac acaacgcttg aaaaagaagg tcgacgatta cgctaccggt agaggaggcc 2520
taacgtcagt tgatgctttg ctcttgaagt cccattgtga gacttttaag ccctctgatc 2580
tgagatgatc ggttctatat gatatatgaa cctaagctgt gagcagccct ttggttaagg 2640
ttaaaaactc ctggtcaggt agaccacttt ggctaagttt aaaagcttgt tgaatcagta 2700
caataactga tagtcgtggt tgacacgcag acctcttaca agagtgtcta ggtgcctttg 2760
agagttactc tttgctctct tcggaagaac ccttaggggt tcgtgcatgg gcttgcatag 2820
caagtcttag aatgcgggta ccgtacagtg ttgaaaaaca ctgtaaatct ctaaaagaga 2880
ccattaatta agctc 2895
<210> 27
<211> 2148
<212> DNA
<213> Brome mosaic virus strain Fescue segment RNA3 T1025C cDNA
<400> 27
gagcccatgg gttaacgtaa aataccaact aattctcgtt cgattccggc gaacattcta 60
ttttaccaac atcggttttt tcagtagtga tactgttttt gttcccgatg tctaacatag 120
tttctccctt cagtggttcc tcacgaacta cgtctgacgt tggcaagcaa gcgggaggta 180
ctagcgacga gaagctcatt gagtcgctgt tctctgaaaa ggctgtgaaa gagatagctg 240
ccgagtgtaa actcggatgt tataactatc tgaagtctaa tgaaccccgc aactatatag 300
acctggtgcc aaagtcacac gtatctgctt ggctctcatg ggctacaccc aagtatgata 360
aaggagagtt accttccagg ggattcatga acgttccacg catcgtttgt tttctcgttc 420
gtaccacaga tagcgcagag tccggttcta taaccgtgag cctgtgcgat tctggtaagg 480
ctgctcgtgc tggagtactc gaagccattg ataatcagga ggccacaatt cagttgtcgg 540
ctttacctgc tttgatagct ttgacgccta gctatgattg tccgatggaa gtcatcggcg 600
gtgatagcgg taggaatcga tgttttggga tagcaaccca acttagcggt gtggtgggga 660
caacaggttc cgttgcagtt actcatgctt attggcaagc taatttcaaa gcgaagccca 720
acaactataa gttgcatggt cccgctacaa ttatggtaat gccatttgac agactgagac 780
aactcgataa gaaaagcctc aaaaattaca tcagaggtat ttctaaccag tctgtggatc 840
atgggtatct tctcggaaga ccgttacaat ctgttgatca ggttgcccag gaagatttgt 900
tagttgagga atccgagtct ccttccgctc tcggcagagg tgtgaaggat agtaagtctg 960
tatccgcgtc atctgtcgct ggacttcctg tgtccagtcc ttcgcttaga attaaatagg 1020
taaatccggt ctaacaagct cggtccattt cgtggagtta agcaagctgg ggagaccccc 1080
gacagccgtt tggatcagcg ctcgcgtctc gtttgggttc aattccctta ccttacaacg 1140
gcgtgttgag ataggtcctc gggggaggtt atccatgttt gtggatattc tatgttgtgt 1200
gtctgagtta ttaaaaaaaa aaaaaaaaaa aaaagatcta tgtcctaatt cagcgtatta 1260
ataatgtcga cttcaggaac tggtaagatg actcgcgcgc agcgtcgagc tgccgctcgt 1320
agaaatcgtc ggaccgctac ggtccaaccg gtaattgtcg aaccattcgc tgctggccaa 1380
ggcaaggcca ttaaagcgat tgcaggatac agcatatcaa agtgggaggc gtcttcggac 1440
gcgattacag cgaaagccac caatgccatg agtatcactc tgccccatga gctctcttct 1500
gaaaagaata aggagcttaa ggtcggcagg gtgctgcttt ggttgggact tcttcctagc 1560
gttgctggga ggattaaggc ttgtgttgct gagaaacagg cacaggccga ggccgctttt 1620
caagtagcct tggcggttgc tgactcctcg aaagaggtgg tcgcggccat gtatacggac 1680
gcctttcgag gggcgactct gggggatttg cttaatctcc agatttatct gtatgcatct 1740
gaagcagtgc ctgctaaggc ggtcgttgta catctagaag ttgagcacgt aaggcctacg 1800
ttcgatgact tcttcacccc ggtttatagg tagtgcccct gctcggagag cccctgactg 1860
ggttaaagtc acaggcccct tgtctcaggt agagaccctg tccaggtagg acactttggc 1920
taaggttaaa agcttgttga atcagtacaa taactgatag tcgtggttga cacgcagacc 1980
tcttacaaga gtgtctaggt gcctttgaga gttactcttt gctctcttcg gaagaaccct 2040
taggggttcg tgcatgggct tgcatagcaa gtcttagaat gcgggtaccg tacagtgttg 2100
aaaaacactg taaatctcta aaagagacca ttaattaact gcaggctc 2148
<210> 28
<211> 2114
<212> DNA
<213> Brome mosaic virus strain Fescue segment RNA3 cDNA DQ530425
<400> 28
gtaaaatacc aactaattct cgttcgattc cggcgaacat tctattttac caacatcggt 60
tttttcagta gtgatactgt ttttgttccc gatgtctaac atagtttctc ccttcagtgg 120
ttcctcacga actacgtctg acgttggcaa gcaagcggga ggtactagcg acgagaagct 180
cattgagtcg ctgttctctg aaaaggctgt gaaagagata gctgccgagt gtaaactcgg 240
atgttataac tatctgaagt ctaatgaacc ccgcaactat atagacctgg tgccaaagtc 300
acacgtatct gcttggctct catgggctac acccaagtat gataaaggag agttaccttc 360
caggggattc atgaacgttc cacgcatcgt ttgttttctc gttcgtacca cagatagcgc 420
agagtccggt tctataaccg tgagcctgtg cgattctggt aaggctgctc gtgctggagt 480
actcgaagcc attgataatc aggaggccac aattcagttg tcggctttac ctgctttgat 540
agctttgacg cctagctatg attgtccgat ggaagtcatc ggcggtgata gcggtaggaa 600
tcgatgtttt gggatagcaa cccaacttag cggtgtggtg gggacaacag gttccgttgc 660
agttactcat gcttattggc aagctaattt caaagcgaag cccaacaact ataagttgca 720
tggtcccgct acaattatgg taatgccatt tgacagactg agacaactcg ataagaaaag 780
cctcaaaaat tacatcagag gtatttctaa ccagtctgtg gatcatgggt atcttctcgg 840
aagaccgtta caatctgttg atcaggttgc ccaggaagat ttgttagttg aggaatccga 900
gtctccttcc gctctcggca gaggtgtgaa ggatagtaag tctgtatccg cgtcatctgt 960
cgctggactt cctgtgtcca gtccttcgct tagaattaaa taggtaaatc cggtctaaca 1020
agcttggtcc atttcgtgga gttaagcaag ctggggagac ccccgacagc cgtttggatc 1080
agcgctcgcg tctcgtttgg gttcaattcc cttaccttac aacggcgtgt tgagataggt 1140
cctcggggga ggttatccat gtttgtggat attctatgtt gtgtgtctga gttattaaaa 1200
aaaaaaaaaa aaaaaaaaga tctatgtcct aattcagcgt attaataatg tcgacttcag 1260
gaactggtaa gatgactcgc gcgcagcgtc gagctgccgc tcgtagaaat cgtcggaccg 1320
ctacggtcca accggtaatt gtcgaaccat tcgctgctgg ccaaggcaag gccattaaag 1380
cgattgcagg atacagcata tcaaagtggg aggcgtcttc ggacgcgatt acagcgaaag 1440
ccaccaatgc catgagtatc actctgcccc atgagctctc ttctgaaaag aataaggagc 1500
ttaaggtcgg cagggtgctg ctttggttgg gacttcttcc tagcgttgct gggaggatta 1560
aggcttgtgt tgctgagaaa caggcacagg ccgaggccgc ttttcaagta gccttggcgg 1620
ttgctgactc ctcgaaagag gtggtcgcgg ccatgtatac ggacgccttt cgaggggcga 1680
ctctggggga tttgcttaat ctccagattt atctgtatgc atctgaagca gtgcctgcta 1740
aggcggtcgt tgtacatcta gaagttgagc acgtaaggcc tacgttcgat gacttcttca 1800
ccccggttta taggtagtgc ccctgctcgg agagcccctg actgggttaa agtcacaggc 1860
cccttgtctc aggtagagac cctgtccagg taggacactt tggctaaggt taaaagcttg 1920
ttgaatcagt acaataactg atagtcgtgg ttgacacgca gacctcttac aagagtgtct 1980
aggtgccttt gagagttact ctttgctctc ttcggaagaa cccttagggg ttcgtgcatg 2040
ggcttgcata gcaagtctta gaatgcgggt accgtacagt gttgaaaaac actgtaaatc 2100
tctaaaagag acca 2114
<210> 29
<211> 2145
<212> DNA
<213> Brome mosaic virus strain RNA3 R-BMV cDNA
<400> 29
gagcccatgg gttaacgtaa aataccaact aattctcgtt cgattccggc gaacattcta 60
ttttaccaac atcggttttt tcagtagtga tactgttttt gttcccgatg tctaacatag 120
tttctccctt cagtggttcc tcacgaacta cgtctgacgt tggcaagcaa gcgggaggta 180
ctagcgatga gaagctcatt gagtcgctgt tctctgaaaa ggctgtgaaa gagatagctg 240
ccgagtgtaa actcggatgt tataactatc tgaagtctaa tgaaccccgc aactatatag 300
acctggtgcc aaagtcacac gtatctgctt ggctctcatg ggctacatcc aagtatgata 360
aaggagagtt accttccagg ggattcatga acgttccacg catcgtttgt tttctcgttc 420
gtaccacaga tagcgcagag tccggttcta taaccgtgag cctgtgcgat tctggtaagg 480
ctgctcgtgc tggagtactc gaagccattg ataatcagga ggccacaatt cagttgtcgg 540
ctttacctgc tttgatagct ttgacgccta gctatgattg tccgatggaa gtcatcggcg 600
gtgatagcgg taggaatcga tgttttggga tagcaaccca acttagcggt gtggtgggga 660
caacaggttc cgttgcagtt actcatgcgt attggcaagc taatttcaaa gcgaagccca 720
acaactataa gttgcatggt cccgctacaa ttatggtaat gccatttgac agactgagac 780
aactcgataa gaaaagcctc aaaaattata ttagaggtat ttctaaccag tctgtggatc 840
atgggtatct tctcggaaga ccgttacaat ctgttgatca ggttgcccag gaagatttgt 900
tagttgagga atccgagtct ccttccgctc tcggcagagg tgtgaaggat agtaagtctg 960
tatccgcgtc atctgtcgct ggacttcctg tgtccagtcc tacgcttaga attaaatagg 1020
taaatccggt ctaacaagct cggtccattt cgtagagtta agcaagctgg ggagaccccc 1080
gacagccgtt tggatcagcg ctcgcgtctc gtttgggttc aattccctta ccttacaacg 1140
gcgtgttgag ataggtcctc gggggaggtt atccatgttt gtggatattc tatgttgtgt 1200
gtctgagtta ttattaaaaa aaaaaaaaaa agatctatgt cctaattcag cgtattaata 1260
atgtcgactt caggaactgg taagatgact cgcgcgcagc gtcgtgctgc cgctcgcaga 1320
aatcgttgga ccgctagggt ccaaccagta attgtcgaac cactcgctgc tggccaaggc 1380
aaggccatta aagcgattgc aggatacagc atatcaaagt gggaggcgtc ttcggacgcg 1440
attacagcga aagccaccaa tgccatgagt atcactctgc cccatgagct ctcttctgaa 1500
aagaataagg agcttaaggt cggcagggtg ctgctttggt tgggacttct tcctagcgtt 1560
gctgggagga ttaaggcttg tgttgctgag aaacaggcac aggccgaggc tgcttttcaa 1620
gtagccttgg cggttgcaga ctcctcgaaa gaggtggtcg cggccatgta tacggacgcc 1680
tttcgagggg cgactctggg ggatttgctt aatctccaga tttatctgta tgcatctgaa 1740
gcagtgcctg ctaaggcggt cgttgtacat ctagaagttg agcacgtaag gcctacgttc 1800
gatgacttct tcaccccggt ttataggtag tgcccctgct cggagagccc ctgactgggt 1860
taaagtcaca ggccccttgt ctcaggtaga gaccctgtcc aggtaggaca ctttggctaa 1920
ggttaaaagc ttgttgaatc agtacaataa ctgatagtcg tggttgacac gcagacctct 1980
tacaagagtg tctaggtgcc tttgagagtt actctttgct ctcttcggaa gaacccttag 2040
gggttcgtgc atgggcttgc atagcaagtc ttagaatgcg ggtaccgtac agtgttgaaa 2100
aacactgtaa atctctaaaa gagaccatta attaactgca ggctc 2145
<210> 30
<211> 2111
<212> DNA
<213> Brome mosaic virus strain RNA3 gi|331498|gb|J02042.1|MBRCG3Z Bromemosaic virus 3a and coat protein genes, complete cds
<400> 30
gtaaaatacc aactaattct cgttcgattc cggcgaacat tctattttac caacatcggt 60
tttttcagta gtgatactgt ttttgttccc gatgtctaac atagtttctc ccttcagtgg 120
ttcctcacga actacgtctg acgttggcaa gcaagcggga ggtactagcg atgagaagct 180
cattgagtcg ctgttctctg aaaaggctgt gaaagagata gctgccgagt gtaaactcgg 240
atgttataac tatctgaagt ctaatgaacc ccgcaactat atagacctgg tgccaaagtc 300
acacgtatct gcttggctct catgggctac atccaagtat gataaaggag agttaccttc 360
caggggattc atgaacgttc cacgcatcgt ttgttttctc gttcgtacca cagatagcgc 420
agagtccggt tctataaccg tgagcctgtg cgattctggt aaggctgctc gtgctggagt 480
actcgaagcc attgataatc aggaggccac aattcagttg tcggctttac ctgctttgat 540
agctttgacg cctagctatg attgtccgat ggaagtcatc ggcggtgata gcggtaggaa 600
tcgatgtttt gggatagcaa cccaacttag cggtgtggtg gggacaacag gttccgttgc 660
agttactcat gcgtattggc aagctaattt caaagcgaag cccaacaact ataagttgca 720
tggtcccgct acaattatgg taatgccatt tgacagactg agacaactcg ataagaaaag 780
cctcaaaaat tatattagag gtatttctaa ccagtctgtg gatcatgggt atcttctcgg 840
aagaccgtta caatctgttg atcaggttgc ccaggaagat ttgttagttg aggaatccga 900
gtctccttcc gctctcggca gaggtgtgaa ggatagtaag tctgtatccg cgtcatctgt 960
cgctggactt cctgtgtcca gtcctacgct tagaattaaa taggtaaatc cggtctaaca 1020
agctcggtcc atttcgtaga gttaagcaag ctggggagac ccccgacagc cgtttggatc 1080
agcgctcgcg tctcgtttgg gttcaattcc cttaccttac aacggcgtgt tgagataggt 1140
cctcggggga ggttatccat gtttgtggat attctatgtt gtgtgtctga gttattatta 1200
aaaaaaaaaa aaaaagatct atgtcctaat tcagcgtatt aataatgtcg acttcaggaa 1260
ctggtaagat gactcgcgcg cagcgtcgtg ctgccgctcg cagaaatcgt tggaccgcta 1320
gggtccaacc agtaattgtc gaaccactcg ctgctggcca aggcaaggcc attaaagcga 1380
ttgcaggata cagcatatca aagtgggagg cgtcttcgga cgcgattaca gcgaaagcca 1440
ccaatgccat gagtatcact ctgccccatg agctctcttc tgaaaagaat aaggagctta 1500
aggtcggcag ggtgctgctt tggttgggac ttcttcctag cgttgctggg aggattaagg 1560
cttgtgttgc tgagaaacag gcacaggccg aggctgcttt tcaagtagcc ttggcggttg 1620
cagactcctc gaaagaggtg gtcgcggcca tgtatacgga cgcctttcga ggggcgactc 1680
tgggggattt gcttaatctc cagatttatc tgtatgcatc tgaagcagtg cctgctaagg 1740
cggtcgttgt acatctagaa gttgagcacg taaggcctac gttcgatgac ttcttcaccc 1800
cggtttatag gtagtgcccc tgctcggaga gcccctgact gggttaaagt cacaggcccc 1860
ttgtctcagg tagagaccct gtccaggtag gacactttgg ctaaggttaa aagcttgttg 1920
aatcagtaca ataactgata gtcgtggttg acacgcagac ctcttacaag agtgtctagg 1980
tgcctttgag agttactctt tgctctcttc ggaagaaccc ttaggggttc gtgcatgggc 2040
ttgcatagca agtcttagaa tgcgggtacc gtacagtgtt gaaaaacact gtaaatctct 2100
aaaagagacc a 2111
<210> 31
<211> 2150
<212> DNA
<213> Brome mosaic virus C-BMVA/G
<400> 31
gagcccatgg gttaacgtaa aataccaact aattctcgtt cgattccggc gaacattcta 60
ttttaccaac atcggttttt tcagtagtga tactgttttt gttcccgatg tctaacatag 120
tttctccctt cagtggttcc tcacgaacta cgtctgacgt tggcaagcaa gcgggaggta 180
ctagcgacga gaagctcatt gagtcgctgt tctctgaaaa ggctgtgaaa gagatagctg 240
ccgagtgtaa actcggatgt tataactatc tgaagtctaa tgaaccccgc aactatatag 300
acctggtgcc aaagtcacac gtatctgctt ggctctcatg ggctacaccc aagtatgata 360
aaggagagtt accttccagg ggattcatga acgttccacg catcgtttgt tttctcgttc 420
gtaccacaga tagcgcagag tccggttcta taaccgtgag cctgtgcgat tctggtaagg 480
ctgctcgtgc tggagtactc gaagccattg ataatcagga ggccacaatt cagttgtcgg 540
ctttacctgc tttgatagct ttgacgccta gctatgattg tccgatggaa gtcatcggcg 600
gtgatagcgg taggaatcga tgttttggga tagcaaccca acttagcggt gtggtgggga 660
caacaggttc cgttgcagtt actcatgctt attggcaagc taatttcaaa gcgaagccca 720
acaactataa gttgcatggt cccgctacaa ttatggtaat gccatttgac agactgagac 780
aactcgataa gaaaagcctc aaaaattaca tcagaggtat ttctaaccag tctgtggatc 840
atgggtatct tctcggaaga ccgttacaat ctgttgatca ggttgcccag gaagatttgt 900
tagttgagga atccgagtct ccttccgctc tcggcagagg tgtgaaggat agtaagtctg 960
tatccgcgtc atctgtcgct ggacttcctg tgtccagtcc tacgcttaga attaaatagg 1020
taaatccggt ctaacaagct cggtccattt cgtagagtta agcaagctgg ggagaccccc 1080
gacagccgtt tggatcagcg ctcgcgtctc gtttgggttc aattccctta ccttacaacg 1140
gcgtgttgag ataggtcctc gggggaggtt atccatgttt gtggatattc tatgttgtgt 1200
gtctgagtta ttattaaaaa aaaaaaaaaa agatctatgt cctaattcag cgtattaatt 1260
taacaatgtc gacttcagga actggtaaga tgactcgcgc gcagcgtcga gctgccgctc 1320
gtagaaatcg tcggaccgct acggtccaac cggtaattgt cgaaccattc gctgctggcc 1380
aaggcaaggc cattaaagcg attgcaggat acagcatatc aaagtgggag gcgtcttcgg 1440
acgcgattac agcgaaagcc accaatgcca tgagtatcac tctgccccat gagctctctt 1500
ctgaaaagaa taaggagctt aaggtcggca gggtgctgct ttggttggga cttcttccta 1560
gcgttgctgg gaggattaag gcttgtgttg ctgagaaaca ggcacaggcc gaggccgctt 1620
ttcaagtagc cttggcggtt gctgactcct cgaaagaggt ggtcgcggcc atgtatacgg 1680
acgcctttcg aggggcgact ctgggggatt tgcttaatct ccagatttat ctgtatgcat 1740
ctgaagcagt gcctgctaag gcggtcgttg tacatctaga agttgagcac gtaaggccta 1800
cgttcgatga cttcttcacc ccggtttata ggtagtgccc ctgctcggag agcccctgac 1860
tgggttaaag tcacaggccc cttgtctcag gtagagaccc tgtccaggta ggacactttg 1920
gctaaggtta aaagcttgtt gaatcagtac aataactgat agtcgtggtt gacacgcaga 1980
cctcttacaa gagtgtctag gtgcctttga gagttactct ttgctctctt cggaagaacc 2040
cttaggggtt cgtgcatggg cttgcatagc aagtcttaga atgcgggtac cgtacagtgt 2100
tgaaaaacac tgtaaatctc taaaagagac cattaattaa ctgcaggctc 2150
<210> 32
<211> 3787
<212> DNA
<213> Barley stripe mosaic virus BSMV ND18 RNA1 U35767
<400> 32
gtatgtaagt tgcctttggg tgtaaaattt cttgcatgca cataatcgta atcgattctt 60
cttgatctct aaacaacact ttcccgttag catggctagc gatgagattg tccgcaatct 120
gatctcccgt gaggaggtga tgggtaattt gattagcaca gcttctagct cagtaaggtc 180
acccttacat gacgtactgt gctcgcacgt aaggaccatc gtcgattccg tggataagaa 240
agcggtcagt cgcaagcatg ttgatgtacg gcgcaacatc tcctctgaag agttacagat 300
gttgataaat gcatatcctg aatatgccgt ttcatcctca gcttgtgaat ctggtactca 360
tagcatggcg gcttgttttc gatttctgga gacagaatac ctcttagata tggttccaat 420
gaaagagact tttgtttatg acattggtgg taactggttt tctcatatga agtttcgtgc 480
tgatagagaa attcattgtt gctgtccgat cttatctatg agagattctg aaagactgga 540
aacacgcatg atggcaatgc aaaaatatat gcgtggatcg aaagacaaac cgttacgctt 600
gttaagccgt tatcaaaata tcctgcgtga acaagcggcg agaacaactg cctttatggc 660
aggtgaggtg aatgcgggtg ttctcgatgg agatgtgttt tgtgagaaca cttttcaaga 720
ctgtgtgaga caggtgcccg aaggtttttt gaagacagct atagcagttc atagcatcta 780
cgatatcaaa gtggaagaat ttgcgtctgc attgaaaaga aaaggtataa cacaggctta 840
tgggtgcttc ctgtttcctc ctgctgtatt gataggtcag aaggaaggta ttttaccttc 900
cgtggacggt cattacttgg tggagaatgg caggattaag ttcttctttg cgaatgatcc 960
gaatgccggt tactctcatg accttaagga ttatctgaag tatgtggaaa aaacctacgt 1020
ggatataaag gatggagtgt ttgctattga gctgatgcaa atgcgaggtg ataccatgtt 1080
ctttaagatc acggatgtca ccgcagcaat gtatcatatg aaatacagag gtatgaaacg 1140
tgatgaaaca ttcaaatgca ttccgttgct aaaaaattca tccgttgtcg tacctctatt 1200
ttcgtgggac aaccgttctt taaagatcac aagtggttta ttaccacgaa ctttggtcga 1260
gcaaggtgcg gcgtttatta tgaaaaacaa ggagaaggac ttgaacgttg ctgtgttgaa 1320
gaactatctt tccgctgtga acaactcata cattttcaac ggatcccagg ttagagatgg 1380
tgtgaaaatt gccccggatt taatctccaa attggcagtg actctgtacc tgagagaaaa 1440
ggtctatcga caaagagaaa attcaatcat aagttatttc gagcaagaaa tgcttcacga 1500
tcccaacttg aaagccatgt ttggagactt tctgtggttt gttccaaata ctctctcgag 1560
tgtctggaag aacatgcgaa aatcactgat ggaatggttt ggctacgcag aatttgactt 1620
gactactttt gatatttgcg atcccgttct ctacgtagag atagtggatc ggtataagat 1680
cattcaaaaa gggcgaattc cacttggtga gttttttgat tgtcatgaag aatgcgagaa 1740
ttacgaactg cgtgagaagg agaaaaatga cctagcggtg aaaatggccc agaaggtaac 1800
agggacggtg accgaatgcg agaaggacct gggacctctt gttcaaccga taaaacagat 1860
attggttcaa cttgtgatgc ccaatttggt cagagcgctg tgtagacctc gtagcccaac 1920
gtctcctttg gacttaaata tcccagggtc aactccatca cactcaagtt cagattctga 1980
acaatctatg actgaagaag cgagctgcgc cattgcgggt agcgtaccaa catgggaaat 2040
tgcgactaag aaagatctaa cctttcagcg aattgatgaa gatatgtctc gacgaactgg 2100
tatgcctcca agaccaaaag taacttctag ttacaacatg aatgccagag ctgagtttct 2160
ctactatcaa ctgtgtagcg tgatttgtga aagggctcag attttgagtg tcatcgaaga 2220
ctttcgtcag aatttgatat tctcagataa agtggccgtt ccattgaacg ctagattcta 2280
cagttttcag tcattgcaac ccggatgggt gttcaagact ccatcgcata gtgaagtagg 2340
ccacagttat gcagtacatt ttgacttcaa gacagttgga accgatttgg aagagagcct 2400
agctttttgc cgaatggtac cgatttcatg ggataaaagc ggcaaataca tcgcgacaac 2460
tcctcatttt cccgagagac atggttacta cgtgatttgt gacaacacta aattgtgtaa 2520
caattggctt atttacaata agttagttga tgtctacgca cgagtggctg atagacctct 2580
gagatttgag ttgattgacg gagttcctgg ctgcggaaag tcaaccatga ttttaaacag 2640
ctgtgatatt cgacgcgaag ttgttgttgg tgaaggaagg aatgcaactg atgacttaag 2700
ggagaggttc aagcgtaaga aaaatttgaa tagtaagact gctaatcata gagttcgaac 2760
gcttgacagc ttattacttg ctgaaggacc ttgtgtaccg caagctgata ggtttcattt 2820
tgatgaagct ctaaaagttc attacggcgc cataatgttc tgtgctgata agcttggtgc 2880
ctcagaaatt ctcgctcagg gagatagggc tcaactgccg atgatctgtc gtgtagaagg 2940
tattgaactt caatttcaat ctcctgatta cacgaagacg atcataaatc ctaagctacg 3000
atcataccgt atccctggag atgttgcctt ctatttgagt gctaaggaat tttacaaagt 3060
taaaggaata cctcaaaagg ttacaacttc taacagtgtg aaacgttccc tgtacgctag 3120
aggcgaaaca actccggaaa gattcgtgag tttgcttgat gttccggtga gaaaaaacac 3180
ccattatcta accttcttac aagctgagaa ggaaagtttg atgagtcatt tgattccaaa 3240
gggtgtgaag aaagagtcta tttcaacgat tcatgaggcg cagggtggta cctatgaaaa 3300
tgtgattctg gtccgtttgc aacggacgcc caatgaaatt tatccgggtg gacctaggtc 3360
cgccccttac attgtggttg ggacttcaag gcatacaaaa actttcactt attgtagtgt 3420
tacggacgat aagttgcttt tagatatcgc cgacgtcggt ggtattgcac atacacctat 3480
tcgtactttt gaatctcata tagtttaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540
aaaaaaaaat gtttgatcag atcattcaaa tctgatggtg cccatcaacc atatgatggg 3600
agtgtttgca agtccactat aatcgaactt gaaaacgatg cctgaattgg aaaccatgaa 3660
tcttaacgga ttctggagag aaaatttagg aattggtatg taagctacaa cttccggtag 3720
ctgcgtcaca ctttaagagt gtgcatactg agccgaagct cagcttcggt cccccaaggg 3780
aagacca 3787
<210> 33
<211> 3239
<212> DNA
<213> Barley stripe mosaic virus BSMV ND18 RNA2 U35770
<400> 33
gtaaaagaaa aggaacaacc ctgttgttgt tcgacgctat actaaatata tattatctta 60
ttagtgcatt tcttttacca cttcacagta tgccgaacgt ttctttgact gctaagggtg 120
gaggacacta caacgaggat caatgggata cacaagttgt ggaagccgga gtatttgacg 180
attggtgggt ccacgtagaa gcctggaata aatttctaga caatttacgt ggtatcaact 240
ttagcgttgc ttcctctcgg tcgcaagtcg ctgaatgctt agctgcgtta gatcgtgatc 300
tacctgctga tgtagacaga cggtttgcag gtgctagagg acaaattggt ttacccaatt 360
atcttcctgc gccaaaattc tttcgtctcg ataagcgaac tatcgctgaa ctgactagac 420
tctctcgtct tacggatcag ccgcacaaca atcgtgatat agagcttaac cgagcgaaaa 480
gagccacaac taacccatct cccccggcgc aggcaccgtc ggagaatctt actcttcgtg 540
atgttcaacc gttaaaggat agtgcgttgc attatcaata cgtgttgatt gacctacaga 600
gtgcgagact cccagtgtat accaggaaga ctttcgaacg tgaactcgct ttggaatgga 660
tcattccaga tgccgaggaa gcgtgacctg ctgttgaagc ggtaaaagga tgtacatatg 720
tatcttattt attttgttta tctattttct tttactttta gtttttgctt tttacgcgtt 780
aactagatgt attgacttta gccatggaca tgacgaaaac tgttgaggaa aagaaaacaa 840
atggaactga ttcagtgaaa ggtgtttttg aaaactcgac gattcccaaa gttccgactg 900
gacaggaaat gggtggtgac gattcttcta cttctaaatt aaaggaaact ctaaaagttg 960
ccgatcagac tccattgtcc gttgacaacg gtgccaaatc caaattggat tcttctgata 1020
gacaagttcc tggtcctaag ttggcaacaa ctgtggaaaa ggaacctgag ttgaaaccca 1080
acgttaagaa gtccaagaag aaaagaatcc aaaaacctgc tcaaccgagt aggcccaatg 1140
accttaaagg cgggactaag ggatcatctc aagtgggtga aaatgtgagt gagaactata 1200
ctgggatttc taaggaagca gctaagcaaa agcagaagac acccaagtct gtgaaaatgc 1260
aaagcaatct ggccgataag ttcaaagcga atgatactcg tagatcggaa ttaattaaca 1320
agtttcagca atttgtgcat gaaacctgtc ttaaatctga ttttgagtac actggtcgac 1380
agtatttcag agctagatca aatttctttg aaatgattaa gctcgcatcc ttgtatgaca 1440
aacatctaaa ggaatgtatg gcgcgagcct gcaccctaga acgagaacga ttgaagcgta 1500
agttactcct agtacgagct ttgaaaccag cagttgactt ccttacggga atcatctctg 1560
gagttcctgg ctcaggaaaa tcaaccattg tgcgtacttt gctcaaaggt gaatttccgg 1620
ctgtttgtgc tttggccaat cctgccttaa tgaacgacta ttctggtatt gaaggcgttt 1680
acgggttaga tgacctgttg ctttctgcag ttccgataac gtctgattta ttgatcatag 1740
atgaatatac acttgctgag agcgcggaaa tcctgttgtt acaacgaaga ctcagagcct 1800
ctatggtgtt gttagtcggg gatgtagctc aaggaaaagc caccactgct tccagtattg 1860
agtatttaac tctgccggtg atctacagat cagagacgac ttatcgtttg ggacaagaga 1920
ctgcttcgct ttgcagcaag cagggtaaca gaatggtttc aaagggtgga agggacacag 1980
tgatcattac tgattacgat ggcgaaacag atggaacgga gaaaaatatc gcttttactg 2040
tcgatacagt tcgagatgtg aaagattgcg ggtacgattg tgccctggca attgatgtgc 2100
aagggaaaga attcgattca gtgactttat tcctaaggaa cgaagaccgg aaagctttag 2160
cagataagca tttgcgttta gtcgctttga gcagacataa gtcgaagtta atcatcaggg 2220
ccgacgcgga aattcgtcaa gcattcctga caggtgatat tgacttgagc tctaaggcga 2280
gtaactctca tcgttattct gcaaaaccgg atgaagacca cagttggttc aaggccaaat 2340
aagtattggc caattgtcgc cggaatcggt gtcgttggat tgtttgcgta tttgatcttt 2400
tcaaatcaaa aacattctac ggaatccggc gataatattc acaaattcgc caacggaggt 2460
agttacaggg acgggtcaaa gagtataagt tataatcgta atcatccttt tgcctatggc 2520
aatgcctcat cccctggaat gttgttgccc gcaatgctta ccatcatcgg aatcatttcc 2580
tatttatggc gaacaagaga ttccgtgctc ggagactcag gcggaaacaa ttcctgcgga 2640
gaagactgtc agggcgaatg tcttaacgga cattctcgac gatcattact atgcgatatt 2700
ggctagtctt tttatcattg ctctatggtt attgtatata tatctaagca gtatacctac 2760
ggagactggt ccctacttct atcaagatct gaactctgtg aagatctatg gaataggggc 2820
tacgaatcca gaagttattg cggccatcca ccattggcag aagtaccctt ttggggaatc 2880
tccgatgtgg ggaggtttag tcagtgtttt gagcgttctt cttaaaccgc tgacgttagt 2940
ttttgcgtta agcttttttc tcttactttc ttcaaaaagg taaaaaaaaa aaaaaaaaaa 3000
atgtttgatc agatcattca aatctgatgg tgcccatcaa ccatatgatg ggagtgtttg 3060
caagtccact ataatcgaac ttgaaaacga tgcctgaatt ggaaaccatg aatcttaacg 3120
gattctggag agaaaattta ggaattggta tgtaagctac aacttccggt agctgcgtca 3180
cactttaaga gtgtgcatac tgagccgaag ctcagcttcg gtcccccaag ggaagacca 3239
<210> 34
<211> 2790
<212> DNA
<213> Barley stripe mosaic virus BSMV ND18 RNA3 U13917
<400> 34
gtatagcttg agcattaccg tcgtgtaatt gcaacacttg gcttgccaaa taacgctaaa 60
gcgttcacga aacaaacaac acttcggcat ggatgttgtg aagaaattcg ccgtcatgtc 120
agtgactgta gtagcaggtc ccgtccttac gctttcatca cctgtggtgg tgacgtttgg 180
aacaggctta attgccgtat ctttggtgaa acggttgcta caggaacaac cccgtgtaat 240
tgctcacgat cacgaacatt acccaggtgg ttctgagagc agttctagct cttgtgctac 300
cgcgcctatt ttacgtaatc tttcgcgaga tcagtgcgat tcagagaata ttggatgcag 360
ttctagcgcc tgttctccgt ctgaaattgt gaaagttaca aggcaggtag tgggagttga 420
acgtggtctt taccgggaca tttttcagga caacgaaatc ccatcagtca tggaagagaa 480
actgcagaaa ctcctttact ctgagggtga gaagattcga agacgttgcc aatttgaagc 540
atcaacgatg cactcacgca aagtaaaggt tccggaggta ggtactatcc cagatatcca 600
aacttggttc gatgctacgt ttcctggtaa ctccgttagg ttttctgatt tcgacggtta 660
tactgttgct acggaggaca ttaacatgga tgttcaggat tgtagactta agttcgggaa 720
gacttttcga ccttatgaat ttaaggaatc actgaaacca gtactgagga cagcaatgcc 780
agaaaaacga cagggtagtt tgattgaaag tgtgctggcc tttcgtaaaa gaaatttggc 840
tgcgcccaga ttacaaggag ctttgaatga atggcacaca attgagaatg tgctaacgaa 900
ggcgttaaag gtattcttct ttgaagattt aattgatcga acggatcact gcacttacga 960
gtcagcgctc agatggtggg ataaacaatc agtgacagct cgagcgcagc tcgtggcgga 1020
tcagcggagg ttatgtgatg ttgacttcac gacttataac ttcatgataa aaaatgatgt 1080
aaagccgaag ttagatctaa cacctcaagt tgaatatgca gctttgcaga ctgttgtata 1140
tcctgataag atagtcaatg ctttctttgg tccgatcata aaggagatta atgaacggat 1200
catcagagcg cttagacctc atgtggtctt taattctcgt atgactgctg atgaactgaa 1260
tgaaacagct gcctttttga cacctcataa gtacagagcc ttagagattg atttttcaaa 1320
atttgataaa tcaaagactg ggcttcatat caaagctgtc attggactct ataagctctt 1380
tggcctagat ggcctgttaa aagtgctctg ggaaaaatcg caatatcaga cttacgtgaa 1440
agatagaaac ttcggtctcg aggcatatct attgtatcag caaaagtcag gaaattgtga 1500
cacttacggt tcgaacacct ggtctgccgc cttggcgttg ttagattgtc ttcctttgga 1560
agatgcacat ttctgtgtat ttggtggtga tgattcattg atattgtttg atcagggata 1620
cataatttcc gacccatgcc ggcaacttgc cggtacttgg aatcttgaat gtaaagtgtt 1680
cgacttcaag taccccgcat tttgtggtaa atttctgctg tgcatagatg gaaaatatca 1740
atttgttcca gatgcggcaa aatttatcac aaaattaggt agaactgatg tgagagatgt 1800
agaagttttg agtgagattt atatctctat caatgacaat tacaaatctt acaaagactt 1860
taaggtgctt gatgctttgg ataaggcttt agtggataga tatcgatccc cttatagtgc 1920
tatttctgct ttggtttctt tatgttatca tatctttgac tttaataagt ttaagttgct 1980
gtttaattgt gaagggaaat ttgtggataa gaagctgaga aaagacttcg agtggtgaac 2040
tctaggtcct gatgtttaaa tctactgtat ttaccttcgc atgatggcta ctttctcttg 2100
tgtgtgttgt ggtaccttaa ctacaagtac ttactgtggt aagagatgtg agcgaaagca 2160
tgtatattct gaaacaagaa ataagagatt ggaactttac aagaagtatc tattggaacc 2220
gcaaaaatgc gccctgaatg gaatcgttgg acacagttgt ggaatgccat gctccattgc 2280
ggaagaggct tgtgatcaac tgccaatcgt gagtaggttc tgtggccaaa agcatgcgga 2340
tctgtatgat tcacttctga aacgttctga acaggagtta cttcttgaat ttctccagaa 2400
gaagatgcag gagctgaaac tttctcatat cgtaaaaatg gctaagcttg aaagtgaggt 2460
taacgcaata cgtaagtccg tagcttcttc ttttgaagat tctgttggat gtgatgattc 2520
ttcttccgtt tctaagtaaa aaaaaaaaaa aatgtttgat cagatcattc aaatctgatg 2580
gtgcccatca accatatgat gggagtgttt gcaagtccac tataatcgaa cttgaaaacg 2640
atgcctgaat tggaaaccat gaatcttaac ggactctgga gagaaaattt aggaattggt 2700
atgtaagcta caacttccgg tagctgcgtc acactttaag agtgtgcata ctgagccgaa 2760
gctcagcttc ggtcccccaa gggaagacca 2790
<210> 35
<211> 3768
<212> DNA
<213> Barley stripe mosaic virus BSMV_RNA1_gi|19744917|ref|NC_003469.1|
<400> 35
gtatgtaagt tgcctttggg tgtaaaattt cttgcatgca cataatcgta atcgattctt 60
cttgatctct aaacaacact ttcccgttag catggctagc gatgagattg tccgcaatct 120
gatctcccgt gaggaggtga tgggtaattt gattagcaca gcttctagct cagtaaggtc 180
acccttacat gacgtactgt gctcgcacgt aaggaccatc gtcgattccg tggataagaa 240
agcggtcagt cgcaagcatg aagatgtacg gcgcaacatc tcctctgagg aattgcagat 300
gttgataaat gcatatcctg aatatgccgt ttcatcctca gcttgtgaat ctggtactca 360
tagcatggcg gcttgttttc gatttctgga gacagaatat ctcttagata tggttccaat 420
gaaagagact tttgtttatg acattggtgg caactggttt tctcatatga agtttcgtgc 480
tgatagagaa attcattgtt gctgtccgat cttatctatg agagattctg aaagactgga 540
aacacgcatg atggcaatgc aaaaatatat gcgtggatcg aaagacaaac cgttacgctt 600
gttaagccgt tatcaaaata tcctgcgtga acaagcggcg agaacaactg cctttatggc 660
aggtgaggtg aatgcgggtg ttctcgatgg agatgtgttt tgtgagaaca cttttcaaga 720
ctgtgtgaga cgagtgcccg aaggtttttt gaagacagct atagcagttc atagcatcta 780
cgatatcaaa gtggaggaat ttgcgtctgc attgaaaaga aaaggtataa cacaggctta 840
tgggtgtttc ctgtttcctc ctgctgtatt gataggtcag aaggaaggca ttttaccttc 900
cgtggacggt cattacttgg tggagaatgg caggattaag ttcttctttg cgaatgatcc 960
gaatgccggt tactctcatg accttaagga ttatctgaag tatgtggaaa agacctatgt 1020
ggatatagag gatggagtgt ttgctattga gctgatgcaa atgcgaggtg ataccatgtt 1080
ctttaagatc acggatgtca ccgcagcaat gtatcatatg aaatacagag gtatgaaacg 1140
cgatgaaaca ttcaaatgca ttccgttgct aaagaattca tctgttgtcg tacctctatt 1200
ttcgtgggac aaccgttctt taaagatcac aagtggttta ctaccacgaa ctttggtcga 1260
gcagggtgcg gcttttatta tgaaaaacaa ggagaaggac ttgaacgttg ctgtgttgaa 1320
gaactatctt tccgctgtga acaactcata cattttcaac ggatcccagg ttagagatgg 1380
cgtgaaaatt gccccggatt taatctccaa gttggcagtg actctgtacc tgagagaaaa 1440
agtctatcga caaagagaaa attcaatcat aagttatttc gagcaagaaa tgcttcacga 1500
tcccaacttg aaagccatgt ttggagactt tctgtggttt gttccaaata ctctctcgag 1560
tgtctggaag aacatgcgaa aatcactgat ggaatggttt ggctacgcag aatttgactt 1620
gactactttt gatatttgcg atcccgttct ctatgtagag atagtggatc ggtataagat 1680
cattcaaaaa gggcgaattc cacttggtga gttctttgat tgtcatgaag aatgcgagaa 1740
ttacgaactg cgtgagaagg agaaaaacga cctagcggtg aaaatggccc agaaggtaac 1800
agggacggtg accgaatgcg agaaggacct gggacctctt gttcaaccga taaaagagat 1860
attggttcaa cttgtgatgc ccaatttggt cagagcgctg tgtagacctc gtagcccaac 1920
gtctcctttg gacttaaaaa gtatcccagg gtcaactcca tcacactcaa gttcagattc 1980
tgaacactct atgactgaag aagcgagctg caccattgcg ggtagcgtac caacatggga 2040
aattgcgact aggaaagatc taacctttca gcgaattgat gaagatatgt ctcgacgaac 2100
tggtatgcct ccaagaccaa aagtaacttc tagttacaac atgaatgcca gagctgagtt 2160
tctctactat caactgtgta gcgtgatttg tgaaagggct cagattttga gtgtcatcga 2220
agactttcgt cagaatttga tattctcaga taaagtggcc gttccattga acgctagatt 2280
ctacagtttt cagtcattga gacccggatg ggtgttcaaa actccatcgc atagtgaagt 2340
aggccacagt tatgcagtac attttgactt caagacaatt ggaaccgatt tggaagagag 2400
cctagctttt tgccgaatgg taccgatttc atgggataaa agcggcaaat acatcgcgac 2460
aactcctcat tttcccgaga gacatggtta ctacgtgatt tgtgacaaca ctaaattgtg 2520
taacaattgg cttatttaca ataagttagt tgacgtctac gcactagtgg ctgatagacc 2580
tctgagattc gagttgattg acggagttcc tggctgcgga aagtcaacca tgattttaaa 2640
cagctgtgat attcgacgcg aagttgttgt tggtgaagga cggaatgcaa ctgatgactt 2700
aagggagagg ttcaagcgta agaaaaattt gaatagtaag actgctaatc acagagttcg 2760
aacgcttgac agcttattac ttgctgaagg accttgtgta ccgcaagctg ataggtttca 2820
ttttgatgaa gctctaaaag ttcattacgg cgccataatg ttctgtgctg ataagcttgg 2880
tgcctcagaa attctcgctc agggagatag ggctcaattg ccaatgatct gtcgtgtaga 2940
aggtattgaa cttcaatttc aatctcctga ttacacgaag acgatcataa atcctaagct 3000
acggtcatac cgtatccctg gagatgttgc cttctatttg agtgctaagg aattttacaa 3060
agttaaagga atacctcaaa aggttataac ttctaacagt gtgaaacgtt ccttgtacgc 3120
tagaggcgaa acgactccgg aaagattcgt gagtttgctt gatgttccgg tgagaaaaga 3180
cacccactat ctaaccttct tacaagctga gaaggaaagt ttgatgagtc atttgattcc 3240
aaagggtgtg aagaaagagt ctatttcaac gattcatgag gcgcagggtg gtacctatga 3300
aaatgtgatt ctggtccgtt tgcaacggac gcccaatgaa atttatccgg gtggacctag 3360
gtccgcccct tacattgtgg ttgggacttc aaggcataca aaaactttca cttattgtag 3420
tgttacggac gataagttgc ttttagatat cgccgacgtc ggtggtattg cacatacacc 3480
tattcgtact tttgaatctc atatagttta aaaaaaaaaa aaaaaaaaaa tgtttgatca 3540
gatcattcaa atctgatggt gcccatcaac catatgatgg gagtgtttgc aagtccacta 3600
taatcgaact tgaaaacgat gcctgaattg gaaaccatga atcttaacgg attctggaga 3660
gaaaatttag gaattggtat gtaagctaca acttccggta gctgcgtcac actttaagag 3720
tgtgcatact gagccgaagc tcagcttcgg tcccccaagg gaagacca 3768
<210> 36
<211> 3289
<212> DNA
<213> Barley stripe mosaic virus BSMV_RNA2_gi|19744922|ref|NC_003481.1|
<400> 36
gtaaaagaaa aggaacaacc ctgttgttgt tcgacgctat actaaatata tattatctta 60
ttagtgcatt tcttttaccg cttcacagta tgccgaacgt ttctttgact gctaagggtg 120
gaggacacta catcgaggat caatgggata cacaagttgt ggaagccgga gtatttgacg 180
attggtgggt ccacgtagaa gcctggaata aatttctaga caatttacgt ggtatcaact 240
ttagcgttgc ttcctctcgg tcgcaagtcg ctgaatactt agctgcgtta gatcgtgatc 300
tacctgctga tgtagacaga cggtttgcag gtgctagggg acaaattggt tcacccaatt 360
atcttcctgc gccaaaattc tttcgtctcg ataagcgaac tatcgctgaa ctgactagac 420
tctctcgtct tacggatcag ccgcacaaca atcgcgatat agaacttaac cgagcgaaaa 480
gagccacaac taacccatct cccccggcgc aggcaccgtc ggagaatctc actcttcgtg 540
atgttcaacc gttaaaggat agtgcgttgc attatcaata cgtgttgatt gacctacaga 600
gtgcgagact cccggtgtat accaggaaga ctttcgaacg tgaactcgct ttggaatgga 660
tcattccaga tgccgaggaa gcgtgacctg ctgtcgaagc ggtaaaagga tgtacatatg 720
tatcttattt attttgttta tctattttct tttgctttta gtttttgctt tttacgcatt 780
aactagatgt attgacttta gccatggaca tgacgaaaac tgttgaggaa aagaaaacaa 840
atggaactga ttcagtgaaa ggtgtttttg aaaactcgac gattcccaaa gttccgactg 900
gacaggaaat gggtggtgac ggttcttcta cttctaaatt aaaggaaact ctgaaagttg 960
ccgatcagac tccattgtcc gttgacaatg gtgccaaatc caaattggat tcctctgata 1020
gacaagttcc tggagttgcc gatcagactc cattgtccgt tgacaatggt gccaaatcca 1080
aattggattc ctctgataga caagttcctg gacctgagtt gaaacccaac gttaagaagt 1140
ccaagaagaa aagaatccaa aaacctgctc aaccgagtgg gcccaatgac cttaaaggcg 1200
ggactaaggg atcatctcaa gtgggtgaaa atgtgagtga gaactatact gggatttcta 1260
aggaagcagc taagcaaaag cagaagacgc ccaagtctgt gaaaatgcaa agcaatctgg 1320
ccgataagtt caaagcgaat gatactcgta gatcggaatt aattaacaag tttcagcaat 1380
ttgtgcatga aacctgtctt aaatctgatt ttgagtacac tggtcgacag tatttcagag 1440
ctagatcaaa tttctttgaa atgattaagc tcgcatcctt gtatgacaaa catctaaagg 1500
aatgtatggc gcgagcctgc accctagaac gtgaacgatt gaagcgtaag ttactcctag 1560
tacgagcttt gaaaccagca gttgacttcc ttacgggaat catctctgga gttcctggct 1620
caggaaaatc aaccattgtg cgtactttgc tcaaaggtga atttccggct gtttgtgctt 1680
tggccaatcc tgccttaatg aacgactatt ctggtattga aggcgtttac gggttagatg 1740
acctgttgct ttctgcagtt ccgataacgt ctgatttatt gatcatagat gaatatacac 1800
ttgctgagag cgcggaaatc ctgttgttac aacgaagact cagagcctct atggtgttgt 1860
tagtcgggga tgtagctcaa ggaaaagcca ccactgcttc cagtattgag tatttaactc 1920
tgccggtgat ctacagatca gagacgactt atcgtttggg acaagagact gcttcgcttt 1980
gcagcaagca gggtaacaga atggtttcaa agggtggaag ggacacagtg atcattactg 2040
attacgatgg cgaaacagat gaaacggaga aaaatatcgc ttttactgtc gatacagttc 2100
gagatgtgaa agattgcggg tacgattgtg ccctggcaat tgatgtgcaa gggaaagaat 2160
tcgattcagt gactttattc ctaaggaacg aagaccggaa agctttagca gataagcatt 2220
tgcgtttagt cgctttgagc agacataagt cgaagttaat catcagggcc gacgcggaaa 2280
ttcgtcaagc attcctgaca ggtgatattg acttgagctc taaggcgagt aactctcatc 2340
gttattctgc aaaaccggat gaagaccaca gttggttcaa ggccaaataa gtattggcca 2400
attgtcgccg gaatcggtgt cgttggattg tttgcgtatt tgatcttttc aaatcaaaaa 2460
cattctacgg aatccggtga taatattcac aaattcgcca acggaggtag ttacagagac 2520
gggtcaaaga gtataagtta taatcgtaat catccttttg cctatggcaa tgcctcatcc 2580
cctggaatgt tgttgcccgc aatgcttacc atcatcggaa tcatttccta tttatggcga 2640
acaagagatt ccgtgctcgg agactcaggc ggaaacaact cctgtggaga agactgtcag 2700
ggcgaatgtc ttaacggaca ttctcgacga tcattactat gcgatattgg ctagtctttt 2760
tatcattgct ctatggctat tgtatatata tctaagcagt atacctacgg agactggtcc 2820
ctacttctat caagatctga actctgtgaa gatctatgga ataggggcta cgaacccaga 2880
agttattgcg gccatccacc attggcagaa gtaccctttt ggggaatctc cgatgtgggg 2940
aggtttaatc agtgttttga gtattcttct taaaccgctg acattagttt ttgcgttaag 3000
cttttttctc ttactttctt caaaaaggta aaaaaaaaaa aaaaaaaaaa atgtttgatc 3060
agatcattca aatctgatgg tgcccatcaa ccatatgatg ggagtgtttg caagtccact 3120
ataatcgaac ttgaaaacaa tgcctgaatt ggaaaccatg aatcttaacg gattctggag 3180
agaaaattta ggaattggta tgtaagctac aacttccggt agctgcgtca cactttaaga 3240
gtgtgcatac tgagccgaag ctcagcttcg gtcccccaag ggaagacca 3289
<210> 37
<211> 3164
<212> DNA
<213> Barley stripe mosaic virus BSMV_RNA3_gi|19744919|ref|NC_003478.1|
<400> 37
gtatagcttg agcattaccg tcgtgtaatt gcaacacttg gcttgccaaa taacgctaaa 60
gcgttcacga aacaaacaac aattcggcat ggatgttgtg aagaaattcg ccgtcatgtc 120
agtgactgta gtagcaggtc ccgtccttac gctttcatca cctgtggtgg tgacgtttgg 180
aacaagctta attgccgtat ctttggtgaa acggttgcta caggaacaac cccgtgtaat 240
tgctcacgat cacgaacatt acccaggtgg ttctgagagc agttctagct cttgtgctac 300
cgcgcctatt ttacgtaatc tttcgcgaga tcagtgcgat tcagagaata ttggatgcag 360
ttctagcgcc tgttctccgt ctgaaattgt gaaagttaca aggcaggtag tggaagttga 420
acgtggtctt taccgggaca aacaacaatt cggcatggat gttgtgaaga aattcgccgt 480
catgtcagtg actgtagtag caggtcccgt ccttacgctt tcatcacctg tggtggtgac 540
gtttggaaca agcttaattg ccgtatcttt ggtgaaacgg ttgctacagg aacaaccccg 600
tgtaattgct cacgatcacg aacattaccc aggtggttct gagagcagtt ctagctcttg 660
tgctaccgcg cctattttac gtaatctttc gcgagatcag tgcgattcag agaatattgg 720
atgcagttct agcgcctgtt ctccgtctga aattgtgaaa gttacaaggc aggtagtgga 780
agttgaacgt ggtctttacc gggacatttt tcaggacaac gaaatcccat cagtcatgga 840
agagaaactg cagaaactcc tttactctga gggtgagaag attcgaagac gttgccaatt 900
tgaagcatca acgatgcact cacgcaaagt aaaggttccg gaggtaggta ctatcccaga 960
tatccaaact tggttcgatg ctacgtttcc tggtaactcc gttaggtttt ctgatttcga 1020
cggttatact gttgctacgg aggacattaa catggatgtt caggattgta gacttaagtt 1080
cgggaagact tttcgacctt atgaatttaa ggaatcactg aaaccagtac tgaggacagc 1140
aatgccagaa aagcgacagg gtagtttgat tgaaagtgtg ctggcctttc gtaaaagaaa 1200
tttggctgcg cccagattac aaggggcttt gaatgaatgg cacacaattg agaatgtgct 1260
gaagaaggcg ttaaaggtat tcttctttga agatttaatt gatcgaacgg atcattgcac 1320
ttacgagtca gcgctcagat ggtgggataa acaatcagtg acggctcgag cgcagctcgt 1380
ggcggaccaa cggaggttat gtgatgttga cttcacgact tataacttca tgataaaaaa 1440
tgatgtaaaa ccgaagttag atctaacacc tcaagttgaa tatgcagctt tgcagactgt 1500
tgtgtatcct gataagatag tcaatgcttt ctttggtccg atcataaagg agattaatga 1560
acggatcatc agagcgctta gacctcatgt ggtctttaat tctcgtatga ctgctgatga 1620
actgaatgaa acagttgcct ttttgacacc tcacaagtac agagccttag agattgactt 1680
ttcaaaattt gataaatcaa agactgggct tcatatcaaa gctgtcattg gactctataa 1740
gctctttggt ctagatggcc tgttaaaagt actctgggaa aaatcgcaat atcagactta 1800
cgtgaaagat agaaacttcg gtctcgaggc atatctatta tatcagcaaa agtcaggaaa 1860
ttgtgacact tacggttcga acacctggtc tgccgccttg gcgttgttag attgtcttcc 1920
tttggaagat gcacatttct gtgtatttgg tggtgatgat tcattgatat tgtttgatca 1980
gggatacata atttccgacc catgccggca acttgccggt acttggaatc ttgaatgtaa 2040
agtgttcgac ttcaagtacc ccgcattttg tggtaaattt ctgctgtgca tagatggaaa 2100
atatcagttt gttccagatg cggcaaaatt tatcacaaaa ttaggtagaa ctgatgtgag 2160
agatgtagaa gttttgagtg agatttatat ctctatcaat gacaattaca aatcttacaa 2220
agactttaag gtgcttgatg ctttggataa ggctttagtg gacagatatc gatcccctta 2280
tagtgctatt tctgctttgg tttctttatg ttatcatatc tttgacttta ataagtttaa 2340
gttgctgttt aattgtgaag ggaaatttgt ggataagaag ctgagaaagg acttcgagtg 2400
gtgaactctg ggtcctgatg tttaaatcta ctgtatttac cttcgcatga tggctacttt 2460
ctcttgtgtg tgttgtggta cctcaactac aagtacttac tgtggtaaga gatgtgagcg 2520
aaagcatgta tattctgaaa caagaaataa gagattggaa ctttacaaga agtatctatt 2580
ggaaccgcaa aaatgcgccc tgaatggaat cgttggacac agttgtggaa tgccatgctc 2640
cattgcggaa gaggcttgtg atcaactgcc aatcgtgagt aggttctgtg gccaaaagca 2700
tgcggatctg tatgattcac ttctgaaacg ttctgaacag gagttacttc ttgaatttct 2760
ccagaagaag atgcaggagc tgaaactttc tcatatcgta aaaatggcta agcttgaaag 2820
tgaggttaac gcaatacgta agtccgtagc ttcttctttt gaagattctg ttggatgtga 2880
tgattcttct tccgtttcta agttgtaaaa aaaaaaaaaa aaaaaatgtt tgatcagatc 2940
attcaaatct gatggtgccc atcaaccata tgatgggagt gtttgcaagt ccactataat 3000
cgaacttgaa aacgatgcct gaattggaaa ccatgaatct taacggattc tggagagaaa 3060
atttaggaat tggtatgtaa gctacaactt ccggtagctg cgtcacactt taagagtgtg 3120
catactgagc cgaagctcag cttcggtccc ccaagggaag acca 3164
<210> 38
<211> 2360
<212> DNA
<213> Maize stripe virus segment 3, complete sequence GenBank: AJ969410.1
<400> 38
acacaaagtc ctgggtaaaa aatattattt tttatcaata tatatattac ttctgtccat 60
cgaagcatga acttttacac atcatctgtt ggagtgcgac aatacgacca ctctttattg 120
gtcttgaatg atctcaccaa cattcatatc acttgtgagg atgtccactg ctctgcaaag 180
ctcctctgct acatatatga tatctacaag tctaggtacc catcaatgga tgagcattct 240
ttcttgcgct tgctaaaagg tccagatgat gctgagatac ttagcacctt tttgagaaca 300
atcatttgga tactgtctca tgacagagac ttcccagatg agttcaggat tccagctaca 360
gcacttgctt cagtttatat aaaatattac tctgaattga aaccaagagc tcctaccacc 420
aattgttgga catgcagaat gtccaaaaac aatctacctt tccaagtccc ctcaataaag 480
ggattccctg ctgaagcaga gctatatata gttccaatct ctgatcatga tggaaagaca 540
atagagtttt caggaatgaa aacactgtac aagtctccaa gcaagaagaa acacaattat 600
gtcatttcat cagatatgcc cccacttagt gctagataca ctgtctggga tggcaaatag 660
agtagtatct gtagaatccc ctttctagga gtgtacggat aatgtaacta agttacattt 720
taagaataaa aaagtgtgct aagcacacta tccgaatagc aatcggatga aggccttaac 780
ctaatttttt gtttttttgc ttttttgttt tttatttgtt tttttgtttt ttcatttttt 840
tggttttttt aatatattat aagattttga gcactctaaa agctcaattt attatacaca 900
ctatatgtac atatcaataa tagtgaacta aaaagcacaa gcactaaaat ataatagaag 960
caaaagcaaa gcataataaa catcataaac tataataaga taatattgtt aaaccataat 1020
aataatgaca cacaaacact caatactaat attatcatac tctcattcat acttgttttt 1080
gattttccat tttcccattt ttttgttttt ttgtataatc taatttttat ggttttcttg 1140
atttttttga tttttttgtt tttttgttta aaacacacaa tacaataata taacacaaac 1200
aacacactta aatagaatat catgacacaa tgtgagcact tcccctgctc agtgccagac 1260
cgtcttatcc aacgcattct tccactttat gatgatatca tcatagtatg aggaactcac 1320
tcctcctcga agaactcaat gatcaatgcc ttcatctcat cctgagtctt tgagctgttg 1380
tctacaatgg ttttcatcaa gctgcactgt tctgccaaaa attgcttgac ctgagtacca 1440
taggagcaga caacattctt tccgaatgat gcaagcaagg ccaagaatga ctccttgaat 1500
ttctcattaa catagtatgg ctcacatact ttggtcctcc cagatttctt cttcgcttcg 1560
ttgaggtttt tggattgaca ggtgatgacc agcaaaccag tggtatactt tatcatgtct 1620
atgtctttga gcaatcctct ctccttcttt tttgtctctg gcattgtttt cttagtgacc 1680
aagaaagcat gaatcacatg aatgctgaaa agaatgtggt tgacactctt agttgtgcag 1740
tatggtgcag atgagctgtc aagtgtaata tattggggaa caaagtccca cagcagggaa 1800
tcagtcccag acatgctaag atcagatgaa tcaatagcca ttttcagacc agtgaactgt 1860
ttggtcacct cataggatac atttggaaag agttgagcta cccttcccag tgtaatagca 1920
tttgcgttgc tacccacaga tgaaactaat ccatagcggg caaccaatgc cgctgcttcc 1980
tcactgccag cagttgcctt ggttttctta gtgacatcct taacaaagcc agtccctcgg 2040
acatacctca tcacaatcat cttgacaaca tcttgagcaa gagttgcccc acccttgtct 2100
ttgagaatac caatcaaagt agccgcatca tagcctgcat accctatctg atcatgaaag 2160
gtggtcacag acgccttgtt atcagtgaga tacttcaaag catctttgga gatatcattg 2220
atagctttct ggagatcatt aagatttgca ggcttattag tggccatttt cttcaagggt 2280
attggtgcaa tggttatgat ttagaccttt ctttagttga tcaatacgaa atcgattaaa 2340
cgattaccca gactttgtgt 2360
<210> 39
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 39
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 40
<211> 1880
<212> DNA
<213> Brachypodium distachyon
<400> 40
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag 1880
<210> 41
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 14
<400> 41
tggttctgcc tctggtc 17
<210> 42
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 16
<400> 42
taacggatag cgctcctcgt 20
<210> 43
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 37
<400> 43
tggagcttac cgactcgctc 20
<210> 44
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 38
<400> 44
ggagcttacc gactcgctca 20
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 39
<400> 45
ggaaagctgc tggcgacagg 20
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 43
<400> 46
tcctggtcga acttttcagg 20
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 18
<400> 47
taattctagt acatggatat 20
<210> 48
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Protospacer Region guide RNA 52
<400> 48
cggtcataaa gcagctctca 20
<210> 49
<211> 9
<212> PRT
<213> Simian virus 40
<400> 49
Met Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 50
<211> 18
<212> PRT
<213> Agrobacterium tumefaciens
<400> 50
Lys Arg Pro Arg Asp Arg His Asp Gly Glu Leu Gly Gly Arg Lys Arg
1 5 10 15
Ala Arg
<210> 51
<211> 18
<212> PRT
<213> Agrobacterium tumefaciens
<400> 51
Lys Arg Pro Arg Glu Asp Asp Asp Gly Glu Pro Ser Glu Arg Lys Arg
1 5 10 15
Glu Arg
<210> 52
<211> 17
<212> PRT
<213> Agrobacterium tumefaciens
<400> 52
Lys Leu Arg Pro Glu Asp Arg Tyr Val Gln Thr Glu Arg Tyr Gly Arg
1 5 10 15
Arg
<210> 53
<211> 17
<212> PRT
<213> Agrobacterium tumefaciens
<400> 53
Lys Leu Arg Pro Glu Asp Arg Tyr Ile Gln Thr Glu Lys Tyr Gly Arg
1 5 10 15
Arg
<210> 54
<211> 15
<212> PRT
<213> Agrobacterium tumefaciens
<400> 54
Lys Arg Arg Tyr Gly Gly Glu Thr Glu Ile Lys Leu Lys Ser Lys
1 5 10 15
<210> 55
<211> 15
<212> PRT
<213> Agrobacterium tumefaciens
<400> 55
Lys Thr Lys Tyr Gly Ser Asp Thr Glu Ile Lys Leu Lys Ser Lys
1 5 10 15
<210> 56
<211> 20
<212> PRT
<213> Agrobacterium rhizogenes
<400> 56
Lys Arg Lys Arg Ala Ala Ala Lys Glu Glu Ile Asp Ser Arg Lys Lys
1 5 10 15
Met Ala Arg His
20
<210> 57
<211> 20
<212> PRT
<213> Agrobacterium rhizogenes
<400> 57
Lys Arg Lys Arg Val Ala Thr Lys Glu Glu Ile Glu Pro His Lys Lys
1 5 10 15
Met Ala Arg Arg
20
<210> 58
<211> 18
<212> PRT
<213> Agrobacterium rhizogenes
<400> 58
Lys Arg Pro Arg Val Glu Asp Asp Gly Glu Pro Ser Glu Arg Lys Arg
1 5 10 15
Ala Arg
<210> 59
<211> 3738
<212> DNA
<213> Artificial Sequence
<220>
<223> pEn Chimera Vector
<400> 59
gggcgaattg ggcccgacgt cgcatgctcc cggccgccat ggcggccgcg ggaattcgat 60
caaataatga ttttattttg actgatagtg acctgttcgt tgcaacaaat tgatgagcaa 120
tgctttttta taatgccaac tttgtacaaa aaagcaggct ctttttttct tcttcttcgt 180
tcatacagtt tttttttgtt tatcagctta cattttcttg aaccgtagct ttcgttttct 240
tctttttaac tttccattcg gagtttttgt atcttgtttc atagtttgtc ccaggattag 300
aatgattagg catcgaacct tcaagaattt gattgaataa aacatcttca ttcttaagat 360
atgaagataa tcttcaaaag gcccctggga atctgaaaga agagaagcag gcccatttat 420
atgggaaaga acaatagtat ttcttatata ggcccattta agttgaaaac aatcttcaaa 480
agtcccacat cgcttagata agaaaacgaa gctgagttta tatacagcta gagtcgaagt 540
agtgattggg gtcttcgaga agacctgttt tagagctaga aatagcaagt taaaataagg 600
ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttc tagacccagc 660
tttcttgtac aaagttggca ttaacccagc tttcttgtac aaagttggca ttataaaaaa 720
taattgctca tcaatttgtt gcaacgaaca ggtcactatc agtcaaaata aaatcattat 780
ttgatcacta gtgaattcgc ggccgcctgc aggtcgacca tatgggagag ctcccaacgc 840
gttggatgca tagcttgagt attctatagt gtcacctaaa tagcttggcg taatcatggt 900
catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 960
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 1020
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 1080
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 1140
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 1200
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 1260
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 1320
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 1380
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 1440
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 1500
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 1560
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 1620
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 1680
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 1740
gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 1800
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 1860
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 1920
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 1980
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 2040
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 2100
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 2160
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 2220
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 2280
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 2340
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 2400
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 2460
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 2520
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 2580
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 2640
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 2700
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 2760
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 2820
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 2880
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 2940
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3000
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gatgcggtgt 3060
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta agcgttaata 3120
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 3180
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 3240
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 3300
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 3360
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 3420
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 3480
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 3540
cgccgctaca gggcgcgtcc attcgccatt caggctgcgc aactgttggg aagggcgatc 3600
ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 3660
aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt 3720
gtaatacgac tcactata 3738
<210> 60
<211> 1023
<212> DNA
<213> Zea mays
<400> 60
ctttgacttt tcccttaatg acgacttatt atttaattta ctcgtcacga ttcccctctc 60
ctggtcgaac ttttcaggtg gggaaagctg ctggcgacag gtggaaatcc ctgagcgagt 120
cggtaagctc catcttctgt actaaagtag tagttgattg gactagaaat ctcgtgctga 180
ttaattgttt tacgcgtgcg tttgtgtgga ttgtaggaca aggctcccta tgtagccaag 240
gctaacaagc tcaagctcga gtacaacaag gccatcgctg cctacaacaa gggcgaggta 300
gggaaactga tgcttcaatt gcgttgttac ttaatgtgta tatagactgc tcctgctggt 360
catttattca aatacgtatg cttactgaac catgtgttgt ttgttcagag cactgcagct 420
aagaaggctc ctgccaagga ggaagaggag gaagatgaag aggagtctga caagtccaag 480
tcggaggtca atgacgagga tgatgaagag ggtagtgagg aggtatacaa aatctattcc 540
tgtcttctcc atattttttc cttagacaaa ataccaatta atccaggata catagcatgt 600
tcatgcatta agcaagttgc taaatttatc ttcgaccaca atgtagacct agtagtattg 660
tattggattc catcaatgca aaacatatgc agatttgcat atgcaaccct cttttgcaag 720
tcctcaatat gagcatttgt ttggaacacg gtgcattggc cttaggaagt ctttaaaaat 780
atgtcttccc tctgcttgca ggatgaagat gatgacgagt gatggagctc ctcgagacaa 840
tggaccgtgc ttcatccaac aatggagcgg ctacacaagg ccccgtggcg atcacaaaaa 900
aggagcctat atccatgtac tagaattatt cagtttcact ccacatcgtg atgttttatt 960
tttacttttg tcgtgctata acggatagcg ctcctcgttg gcgccactgg cgggtggttc 1020
tgc 1023
<210> 61
<211> 210
<212> DNA
<213> Artificial Sequence
<220>
<223> genome edited hmg13 gene
<400> 61
ctttgacttt tcccttaatg acgacttatt atttaattta ctcgtcacga ttcccctctc 60
ctggtcgaac ttttcaggtg gggaaagctg ctggcgactc catgtactag aattattcag 120
tttcactcca catcgtgatg ttttattttt acttttgtcg tgctataacg gatagcgctc 180
ctcgttggcg ccactggcgg gtggttctgc 210

Claims (16)

1.一种产生植物、植物材料或者植物细胞的方法,包括如下步骤:
(i)提供靶植物结构,其包含至少一个分生组织细胞,
其中所述至少一个分生组织细胞包含至少一个靶核酸区域;
(ii)提供至少一个gRNA或者提供一或多个重组构建体,
其中所述重组构建体包含:
(a)至少一个gRNA或者编码gRNA的序列,及
(b)任选存在的至少一个调节序列和/或定位序列,及
(c)任选存在的至少一个DNA修复基质,
及提供至少一种CRISPR核酸酶,优选Cas核酸酶或者Cpf1核酸酶或者其催化活性片段和/或效应子结构域,或者提供一或多个重组构建体,
其中重组构建体包含:
(a)至少一个CRISPR核酸酶或者其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列,和/或至少一个效应子结构域或者编码效应子结构域的序列,及
(b)任选存在的至少一个调节序列和/或定位序列,
其中所述gRNA能与所述靶核酸区域的区段杂交,也能与CRISPR核酸酶或其催化活性部分和/或效应子结构域相互作用;
其中,当所述gRNA或者编码gRNA的序列,及CRISPR核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列,和/或效应子结构域或者编码效应子结构域的序列由一或多个重组构建体提供时,所述gRNA或者编码gRNA的序列及CRISPR核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列和/或效应子结构域或者编码效应子结构域的序列位于相同或者不同的重组构建体之上或之中;
(iii)将所述gRNA、CRISPR核酸酶或其催化活性片段和/或效应子结构域和/或重组构建体引入所述靶植物结构中;
(iv)在允许所引入的gRNA、CRISPR核酸酶或其催化活性片段和/或效应子结构域和/或所引入的重组构建体激活,从而特异性修饰靶植物结构中的靶核酸区域的条件下培养所述靶植物结构,以获得包含至少一个分生组织细胞的靶植物结构,所述分生组织细胞包含靶核酸区域的特异性修饰;
(v)从特异性修饰的至少一个分生组织细胞获得植物、植物材料或者植物细胞;
其中通过细胞分裂和分化及任选存在的异花授粉或者自花授粉从特异性修饰的至少一个分生组织细胞直接获得所述植物、植物材料或者植物细胞,及
其中所获得的植物、获得的植物材料或者获得的植物细胞包含靶核酸区域的特异性修饰。
2.权利要求1的方法,其中在步骤(v)的植物、植物材料或者植物细胞中,所述重组构建体不是染色体或者染色体外整合的,所述重组构建体:
(a)包含至少一个gRNA或者编码gRNA的序列,或者
(b)包含至少一个CRISPR核酸酶,优选Cas核酸酶或者Cpf1核酸酶或者其催化活性片段,或者编码CRISPR核酸酶或其催化活性部分的序列和/或至少一个效应子结构域或者编码效应子结构域的序列。
3.权利要求1或2的方法,其中在步骤(ii)中,使所述gRNA或者编码gRNA的序列,和/或CRISPR核酸酶,优选Cas核酸酶或Cpf1核酸酶,或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列,和/或效应子结构域或者编码效应子结构域的序列适合在植物细胞中应用。
4.权利要求1-3之一的方法,其中在步骤(ii)与(iii)之间提供用于引入所述重组构建体的至少一个载体。
5.前述权利要求之一的方法,其中在步骤(ii)与(iii)之间提供包含重组核酸片段的至少一个另外的重组构建体,其用于特异性同源定向修复靶植物结构中的靶核酸区域或者插入至靶植物结构中的靶核酸区域,及任选存在的至少一个另外的载体以引入所述至少一个另外的重组构建体。
6.前述权利要求之一的方法,其中所述分生组织细胞是包含至少一个分生组织细胞或者分生组织的植物胚或幼苗或植物的成熟或者不成熟植物细胞。
7.权利要求1或2的方法,其中所述分生组织细胞是单子叶或者双子叶植物的细胞。
8.前述权利要求之一的方法,其中至少一个载体选自农杆菌(Agrobacterium spp.)、病毒或适于转染肽或多肽序列或者核酸序列的物质,或者其组合,所述病毒选自SEQ IDNO:12-15和25-38以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列。
9.前述权利要求之一的方法,其中将所述gRNA以天然或合成的核酸直接引入靶植物结构中,和/或将所述CRISPR核酸酶,优选Cas核酸酶或Cpf1核酸酶或其催化活性片段以多肽直接引入,和/或将效应子结构域以核酸或多肽直接引入。
10.前述权利要求之一的方法,其中所述gRNA或编码gRNA的序列,或者CRISPR核酸酶,优选Cas15核酸酶或Cpf1核酸酶或其催化活性片段或者编码CRISPR核酸酶或其催化活性片段的序列,或者效应子结构域或者编码效应子结构域的序列另外包含定位序列,所述定位序列选自核定位序列、质体定位序列,优选线粒体定位序列和叶绿体定位序列。
11.前述权利要求之一的方法,其中将内源性非同源末端结合(NHEJ)修复机制的抑制剂引入靶植物结构中。
12.前述权利要求之一的方法,其中所述重组构建体选自SEQ ID NO:23和24,以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%,93%、94%、95%、96%、97%、98%或99%序列同源性的序列。
13.根据前述权利要求之一的方法可获得或者获得的植物、植物材料或者植物细胞。
14.重组构建体,包含选自SEQ ID NO:23和24以及与所述序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列的核酸。
15.权利要求14的至少一个重组构建体或者包含选自SEQ ID NO:12-15和25-38以及与这些序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列的核酸的载体在特异性修饰靶植物结构中的至少一个靶核酸区域中的应用,所述靶植物结构包含至少一个分生组织细胞,其中所述至少一个分生组织细胞包含至少一个靶核酸区域。
16.一种在鉴定gRNA或者gRNA编码序列体外试验中鉴定gRNA或者gRNA编码序列的体外方法,所述gRNA与CRISPR核酸酶,优选Cas或Cpf1核酸酶或其催化活性片段一起适于靶向修饰植物细胞中的核酸靶区域,包括如下步骤:
(i)提供植物、植物材料或者植物细胞的一或多个核酸靶区域;
(ii)将所述一或多个核酸靶区域插入至少一个载体中;
(iii)提供至少一种gRNA;
(iv)提供至少一种CRISPR核酸酶或者其催化活性片段;
(v)使所述至少一种gRNA和所述至少一种CRISPR核酸酶或其催化活性片段在合适的反应条件下与所述至少一个载体在体外接触,所述合适的反应条件允许gRNA与CRISPR核酸酶相互作用,从而使CRISPR核酸酶或其催化活性片段具有催化活性,
其中在每种情况中,在单独的一组反应中,将所述至少一个载体与恰好一种gRNA和恰好一种CRISPR核酸酶或其催化活性片段接触;
(vi)分析来自步骤(v)的反应产物;及
(vii)鉴定能与特定CRISPR核酸酶或其催化活性片段一起以靶向方式修饰植物细胞中的核酸靶区域的gRNA或者gRNA编码序列。
CN201680042299.4A 2015-05-19 2016-05-19 用于植物中的特异性核酸编辑的方法和构建体 Pending CN107849581A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DE102015006335.9 2015-05-19
DE102015006335.9A DE102015006335A1 (de) 2015-05-19 2015-05-19 Verfahren und Konstrukte zur gezielten Nukleinsäure Editierung in Pflanzen
DE102015014252.6A DE102015014252A1 (de) 2015-11-05 2015-11-05 Verfahren und Konstrukte zur gezielten Nukleinsäure Editierung in Pflanzen
DE102015014252.6 2015-11-05
PCT/EP2016/061237 WO2016184955A2 (de) 2015-05-19 2016-05-19 Verfahren und konstrukte zur gezielten nukleinsäure editierung in pflanzen

Publications (1)

Publication Number Publication Date
CN107849581A true CN107849581A (zh) 2018-03-27

Family

ID=55274948

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680042299.4A Pending CN107849581A (zh) 2015-05-19 2016-05-19 用于植物中的特异性核酸编辑的方法和构建体
CN201680042685.3A Pending CN107849582A (zh) 2015-05-19 2016-05-19 用于植物的植物原位转化方法和制造工艺以及基于其且从中可获得的产物

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201680042685.3A Pending CN107849582A (zh) 2015-05-19 2016-05-19 用于植物的植物原位转化方法和制造工艺以及基于其且从中可获得的产物

Country Status (10)

Country Link
US (3) US20180142248A1 (zh)
EP (3) EP3095870A1 (zh)
CN (2) CN107849581A (zh)
AU (1) AU2016265197A1 (zh)
BR (2) BR112017024754A2 (zh)
CA (2) CA2986184A1 (zh)
DK (1) DK3298148T5 (zh)
EA (1) EA201792542A1 (zh)
ES (1) ES2953919T3 (zh)
WO (2) WO2016184989A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109456990A (zh) * 2018-10-24 2019-03-12 湖南杂交水稻研究中心 一种利用基因组编辑技术提高叶绿体遗传转化效率的方法
CN110343724A (zh) * 2018-04-02 2019-10-18 北京大学 用于筛选和鉴定功能性lncRNA的方法
WO2020083339A1 (zh) * 2018-10-24 2020-04-30 中国农业大学 一种基于大麦条纹花叶病毒的基因编辑载体系统
CN112779266A (zh) * 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
CN113234720A (zh) * 2021-04-22 2021-08-10 河南城建学院 小麦长链非编码RNAlncR156及其在调控小麦响应干旱胁迫中的应用
CN114269933A (zh) * 2019-06-28 2022-04-01 科沃施种子欧洲股份两合公司 通过使用grf1加强基因实现的增强的植物再生及转化
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
US11897920B2 (en) 2017-08-04 2024-02-13 Peking University Tale RVD specifically recognizing DNA base modified by methylation and application thereof

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017195906A1 (ja) 2016-05-13 2017-11-16 株式会社カネカ 植物のゲノム編集方法
CN109152343A (zh) 2016-05-13 2019-01-04 株式会社钟化 转化植物的制备方法
US11499158B2 (en) 2016-05-13 2022-11-15 Kaneka Corporation Method for modifying plant
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11168319B1 (en) 2017-02-28 2021-11-09 Inari Agriculture Technology, Inc. Plant cell culture
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019040645A1 (en) 2017-08-22 2019-02-28 Napigen, Inc. MODIFICATION OF THE GENOME OF ORGANITIES USING A POLYNUCLEOTIDE GUIDED ENDONUCLEASE
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
CN108004266B (zh) * 2017-12-11 2021-05-04 西北大学 一种蓝猪耳遗传转化方法
WO2019144124A1 (en) 2018-01-22 2019-07-25 Inari Agriculture, Inc. Plant gene editing systems, methods, and compositions
EP3546582A1 (en) * 2018-03-26 2019-10-02 KWS SAAT SE & Co. KGaA Promoter activating elements
JP6614622B2 (ja) * 2018-04-17 2019-12-04 国立大学法人名古屋大学 植物ゲノム編集方法
AU2019275110A1 (en) 2018-05-24 2020-10-22 Monsanto Technology Llc Genome editing in plants
EP3829292A4 (en) * 2018-06-01 2022-06-08 Pioneer Hi-Bred International, Inc. BRASSICA GENOME EDITING SYSTEMS AND METHODS
CN108998469A (zh) * 2018-08-02 2018-12-14 天津大学 一种快速的水稻成熟胚原位转基因方法
CN108950047B (zh) * 2018-08-08 2020-11-13 华南农业大学 一种CsTTG1基因与茶叶茸毛生长发育线性关系的鉴定方法
EP3956443A1 (en) * 2018-11-01 2022-02-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Targeted mutagenesis using base editors
EP3930449A4 (en) * 2019-02-25 2022-11-30 Syngenta Crop Protection AG COMPOSITIONS AND METHODS FOR CAUSING A DIVERSITY OF T1 EVENTS
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
JP7334898B2 (ja) * 2019-04-12 2023-08-29 国立大学法人東海国立大学機構 花粉への物質導入方法
US11746354B2 (en) 2019-07-19 2023-09-05 Inari Agriculture Technology, Inc. Homology dependent repair genome editing
US20220356484A1 (en) * 2019-09-06 2022-11-10 Dr. James Berman Genetic modification of plants
WO2021108337A1 (en) * 2019-11-26 2021-06-03 Syngenta Crop Protection Ag Methods of transformation
EP4086353A4 (en) * 2020-01-03 2024-03-06 Kaneka Corporation METHOD FOR PLANT MODIFICATION
BR112022015463A2 (pt) * 2020-02-28 2022-12-13 Kws Saat Se & Co Kgaa Edição de meristema de inflorescência imatura
WO2021170787A1 (en) * 2020-02-28 2021-09-02 KWS SAAT SE & Co. KGaA Method for rapid genome modification in recalcitrant plants
CN111454984A (zh) * 2020-03-04 2020-07-28 深圳大学 一种植物基因转化方法及其应用
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
AU2021353004A1 (en) 2020-09-30 2023-04-13 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
JP7345760B2 (ja) * 2020-10-07 2023-09-19 国立大学法人東海国立大学機構 花粉への物質導入方法
EP4326863A1 (en) * 2021-04-20 2024-02-28 Texas Tech University System Tissue-culture independent gene editing of cells by a long-distance rna transport system
CN113693086A (zh) * 2021-09-08 2021-11-26 山西省农业科学院园艺研究所 一种鸢尾植株专用抗旱剂
CN114375716A (zh) * 2022-01-19 2022-04-22 青海省农林科学院 一种青稞条纹病菌液体侵染鉴定方法
AR128260A1 (es) 2022-01-25 2024-04-10 Living Carbon PBC Composiciones y métodos para mejorar la productividad de la biomasa en plantas
WO2023172875A1 (en) * 2022-03-07 2023-09-14 Inedita Bio, Inc. Methods and compositions for intron mediated- expression of regulatory elements for trait development
WO2024030442A1 (en) * 2022-08-01 2024-02-08 Purdue Research Foundation Efficient genotype-independent in planta transformation of cereals
WO2024054536A2 (en) * 2022-09-08 2024-03-14 Paul Westmeyer Nanoscopic projectiles
CN116584376A (zh) * 2023-06-28 2023-08-15 湖北省农业科学院经济作物研究所 一种桑树快速杂交育种方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014194190A1 (en) * 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
CN104293827A (zh) * 2014-09-24 2015-01-21 华南农业大学 一种定点突变RNase ZS1获得温敏不育系的方法
WO2015026885A1 (en) * 2013-08-22 2015-02-26 Pioneer Hi-Bred International, Inc. Genome modification using guide polynucleotide/cas endonuclease systems and methods of use

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1288073C (en) * 1985-03-07 1991-08-27 Paul G. Ahlquist Rna transformation vector
US5910631A (en) 1993-09-03 1999-06-08 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Middle chain-specific thioesterase genes from Cuphea lanceolata
US5736369A (en) * 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US6051409A (en) 1995-09-25 2000-04-18 Novartis Finance Corporation Method for achieving integration of exogenous DNA delivered by non-biological means to plant cells
US6583335B1 (en) 1997-04-18 2003-06-24 Texas Tech University Direct transformation of higher plants through pollen tube pathway
NZ504300A (en) 1997-11-18 2002-06-28 Pioneer Hi Bred Int A method for directional stable transformation of eukaryotic cells using non-identical recombination sites
PL354925A1 (en) 1999-04-29 2004-03-22 Syngenta Ltd Herbicide resistant plants
US6846970B1 (en) 1999-07-19 2005-01-25 Plant Bioscience Limited Transformation method and transgenic plants produced thereby
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
AU2001287862B2 (en) 2000-09-29 2006-12-14 Syngenta Limited Herbicide resistant plants
US20030135891A1 (en) * 2001-12-04 2003-07-17 The Texas A&M University System Method of transforming intact plants
CA2851035C (en) 2002-07-18 2018-05-29 Stanislaw Flasinski Methods for using artificial polynucleotides and compositions thereof to reduce transgene silencing
CN1175724C (zh) * 2002-11-28 2004-11-17 上海交通大学 超声波辅助大豆原位丛生芽转化的方法
WO2004113573A2 (en) * 2003-06-19 2004-12-29 The Samuel Roberts Noble Foundation, Inc. Methods and compositions for analysis of plant gene function
CN1286978C (zh) * 2004-11-08 2006-11-29 安徽农业大学 简便高效的农杆菌介导玉米转基因方法
CN100451122C (zh) * 2006-03-07 2009-01-14 中国农业科学院油料作物研究所 油菜转基因的方法
CN101878307B (zh) 2007-09-27 2017-07-28 陶氏益农公司 以5‑烯醇式丙酮酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白
JP2011120478A (ja) 2008-03-31 2011-06-23 Japan Tobacco Inc アグロバクテリウム菌による形質転換植物の作成方法
CN106834320B (zh) 2009-12-10 2021-05-25 明尼苏达大学董事会 Tal效应子介导的dna修饰
AU2011207769B2 (en) 2010-01-22 2015-05-28 Corteva Agriscience Llc Targeted genomic alteration
BR112013024337A2 (pt) 2011-03-23 2017-09-26 Du Pont locus de traço transgênico complexo em uma planta, planta ou semente, método para produzir em uma planta um locus de traço transgênico complexo e construto de expressão
US20130145488A1 (en) 2011-12-06 2013-06-06 Iowa State University Research Foundation, Inc. Mesoporous silica nanoparticles suitable for co-delivery
WO2013096567A2 (en) 2011-12-21 2013-06-27 Duke University The hsf-like transcription factor, tbf1, is a major molecular switch for growth-to-defense transition in plants
CN102533851A (zh) * 2012-01-31 2012-07-04 安徽农业大学 一种高通量农杆菌介导的玉米基因原位转化方法
CN102558309B (zh) 2012-02-10 2014-09-17 浙江大学 一对转录激活子样效应因子核酸酶及其编码基因与应用
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
CN104428414B (zh) 2012-05-02 2022-01-21 陶氏益农公司 苹果酸脱氢酶的靶向修饰
KR102116153B1 (ko) 2012-05-07 2020-05-27 상가모 테라퓨틱스, 인코포레이티드 도입유전자의 뉴클레아제-매개 표적화된 통합을 위한 방법 및 조성물
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
CN105188767A (zh) 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
US20140096284A1 (en) 2012-10-01 2014-04-03 Iowa State University Research Foundation, Inc. Method for the delivery of molecules lyophilized onto microparticles to plant tissues
CN110669746B (zh) 2012-10-23 2024-04-16 基因工具股份有限公司 用于切割靶dna的组合物及其用途
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CN103898099B (zh) 2012-12-25 2017-08-25 袁晶 一种实现基因组定点修饰的蛋白表达载体的方法
EP3491915B1 (en) 2012-12-27 2023-05-31 Keygene N.V. Method for inducing a targeted translocation in a plant.
WO2014130955A1 (en) * 2013-02-25 2014-08-28 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
EP2970997A1 (en) * 2013-03-15 2016-01-20 Regents of the University of Minnesota Engineering plant genomes using crispr/cas systems
EP2981614A1 (en) 2013-04-02 2016-02-10 Bayer CropScience NV Targeted genome engineering in eukaryotes
EP3008186B1 (en) 2013-06-14 2018-11-28 Cellectis Methods for non-transgenic genome editing in plants
CN103382468B (zh) 2013-07-04 2015-04-29 中国科学院遗传与发育生物学研究所 一种水稻基因组定点改造方法
CN103343120B (zh) 2013-07-04 2015-03-04 中国科学院遗传与发育生物学研究所 一种小麦基因组定点改造方法
US20160264982A1 (en) 2013-07-16 2016-09-15 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Method for plant genome site-directed modification
CN103555711A (zh) 2013-07-22 2014-02-05 安徽省农业科学院水稻研究所 一种主要农作物非转基因的基因组定向分子改良方法和应用
US10077449B2 (en) 2013-11-04 2018-09-18 Dow Agrosciences Llc Universal donor system for gene targeting
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
CN103667338B (zh) 2013-11-28 2016-01-27 中国科学院遗传与发育生物学研究所 一种玉米基因组定点改造方法
CN103952405B (zh) 2014-05-13 2016-02-10 扬州大学 一种山羊mstn基因定点修饰系统及其应用
CN104212778A (zh) 2014-06-26 2014-12-17 绍兴市人民医院 基于TALEN和pMD18载体的定点突变系统及应用
KR20180015731A (ko) 2014-08-06 2018-02-13 주식회사 툴젠 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
EP3224363B1 (en) 2014-11-27 2021-11-03 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Nucleic acid constructs for genome editing
DE102015004187A1 (de) 2015-04-02 2016-10-06 Kws Saat Se Männlich sterile Pflanze der Gattung Triticum
CN105087641A (zh) * 2015-07-31 2015-11-25 贵州省园艺研究所 一种新的农杆菌介导的大白菜原位转基因方法
CN106811479B (zh) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014194190A1 (en) * 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
WO2015026885A1 (en) * 2013-08-22 2015-02-26 Pioneer Hi-Bred International, Inc. Genome modification using guide polynucleotide/cas endonuclease systems and methods of use
CN104293827A (zh) * 2014-09-24 2015-01-21 华南农业大学 一种定点突变RNase ZS1获得温敏不育系的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANDREW F. BENT: "Arabidopsis in Planta Transformation. Uses, Mechanisms, and Prospects for Transformation of Other Species", 《PLANT PHYSIOLOGY》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11897920B2 (en) 2017-08-04 2024-02-13 Peking University Tale RVD specifically recognizing DNA base modified by methylation and application thereof
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
CN110343724A (zh) * 2018-04-02 2019-10-18 北京大学 用于筛选和鉴定功能性lncRNA的方法
CN110343724B (zh) * 2018-04-02 2021-10-12 北京大学 用于筛选和鉴定功能性lncRNA的方法
CN109456990A (zh) * 2018-10-24 2019-03-12 湖南杂交水稻研究中心 一种利用基因组编辑技术提高叶绿体遗传转化效率的方法
WO2020083339A1 (zh) * 2018-10-24 2020-04-30 中国农业大学 一种基于大麦条纹花叶病毒的基因编辑载体系统
CN109456990B (zh) * 2018-10-24 2022-01-07 湖南杂交水稻研究中心 一种利用基因组编辑技术提高叶绿体遗传转化效率的方法
CN114269933A (zh) * 2019-06-28 2022-04-01 科沃施种子欧洲股份两合公司 通过使用grf1加强基因实现的增强的植物再生及转化
CN112779266A (zh) * 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
CN113234720A (zh) * 2021-04-22 2021-08-10 河南城建学院 小麦长链非编码RNAlncR156及其在调控小麦响应干旱胁迫中的应用
CN113234720B (zh) * 2021-04-22 2023-08-18 河南城建学院 小麦长链非编码RNAlncR156及其在调控小麦响应干旱胁迫中的应用

Also Published As

Publication number Publication date
US20180142248A1 (en) 2018-05-24
EP3095870A1 (en) 2016-11-23
DK3298148T3 (da) 2023-09-11
US11492630B2 (en) 2022-11-08
EP3298148B1 (de) 2023-07-26
ES2953919T3 (es) 2023-11-17
WO2016184955A2 (de) 2016-11-24
CA2989368A1 (en) 2016-11-24
WO2016184989A1 (en) 2016-11-24
BR112017024754A2 (pt) 2018-07-31
DK3298148T5 (da) 2023-09-18
EP3298148A2 (de) 2018-03-28
EP3298147A1 (en) 2018-03-28
US20230242926A1 (en) 2023-08-03
CA2986184A1 (en) 2016-11-24
BR112017024649A2 (pt) 2018-07-24
WO2016184955A3 (de) 2017-04-06
CN107849582A (zh) 2018-03-27
EA201792542A1 (ru) 2018-08-31
US20180223295A1 (en) 2018-08-09
AU2016265197A1 (en) 2017-12-14

Similar Documents

Publication Publication Date Title
CN107849581A (zh) 用于植物中的特异性核酸编辑的方法和构建体
KR102223568B1 (ko) 식물의 게놈 내의 외인성 서열의 통합을 위한 방법 및 조성물
KR102613296B1 (ko) 신규한 crispr 효소 및 시스템
KR102269374B1 (ko) 최적 대두 유전자좌
KR102269377B1 (ko) 최적 대두 유전자좌
AU2020264325A1 (en) Plant genome modification using guide rna/cas endonuclease systems and methods of use
KR20200128129A (ko) 식물 형질전환을 위한 방법
JP2020505074A (ja) ゲノム工学のためのエンドヌクレアーゼに対する修復鋳型の結合
CN108795972A (zh) 不使用转基因标记序列分离细胞的方法
AU2017248614B2 (en) Method for changing the intercellular mobility of an mRNA
KR20180002852A (ko) 가이드 RNA/Cas 엔도뉴클레아제 시스템
AU2016355682A1 (en) Haploid induction compositions and methods for use therefor
CN107429258A (zh) 用于加速的性状渐渗的方法和组合物
CN113473845A (zh) 经由基因组编辑进行基因沉默
TW200847918A (en) Manipulation of plant senescence using modified promoters
US20170314033A1 (en) Herbicide-resistant taraxacum kok-saghyz and taraxacum brevicorniculatum
WO2022026554A1 (en) Inir12 transgenic maize
Kang Application of CRISPR/Cas9-mediated genome editing for studying soybean resistance to soybean cyst nematode
JP2022522823A (ja) 天然miRNAのゲノム編集による標的遺伝子発現の抑制
KR102677877B1 (ko) 이중나선 dna의 표적화된 변형 방법
US11459577B2 (en) Targeted insertion sites in the maize genome
CN111019968B (zh) NTS/dNTS组合在制备植物突变体中的应用
CN111019969B (zh) 一种通过优化供体dna模板来提高基因精确替换效率的方法
RU2816649C1 (ru) Композиции для индукции гаплоидии и способы их применения
KR20200078200A (ko) 크리스퍼 연관 단백질 및 엑소뉴클레아제를 포함하는 변형된 크리스퍼 연관 단백질

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination