CN106687594A - 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 - Google Patents

用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 Download PDF

Info

Publication number
CN106687594A
CN106687594A CN201580048737.3A CN201580048737A CN106687594A CN 106687594 A CN106687594 A CN 106687594A CN 201580048737 A CN201580048737 A CN 201580048737A CN 106687594 A CN106687594 A CN 106687594A
Authority
CN
China
Prior art keywords
epsps
plant
cell
sequence
modification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580048737.3A
Other languages
English (en)
Inventor
V.德祖卡诺维
S.C.乔内斯
Z-B.刘
M.拉斯纳
L.A.赖兹尼克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Publication of CN106687594A publication Critical patent/CN106687594A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H4/00Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
    • A01H4/008Methods for regeneration to complete plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开包括对膦酰基甲基甘氨酸家族的除草剂,例如草甘膦具有抗性的突变植物的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别且任选地向细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。更具体地,提供了用于编辑细胞中的烯醇式丙酮基莽草酸‑3‑磷酸合酶(EPSPS)核苷酸序列的组合物和方法。所述方法和组合物采用向导多核苷酸/Cas内切核酸酶系统来提供用于编辑细胞基因组内的EPSPS核苷酸序列的有效系统。还提供了用于产生草甘膦耐受性植物细胞、植物外植体、种子和谷粒的组合物和方法。

Description

用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
本申请要求2014年7月11日提交的美国临时申请62/023246的权益,所述文献全文以引用方式并入本文。
技术领域
本公开涉及分子生物学领域,具体地,涉及用于针对除草剂抗性编辑细胞基因组的方法。
以电子方式递交的序列表的引用
通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表提交,该文件名称为“20150617_BB2366PCT_SeqLst_ST25.txt”,创建日期为2015年6月17日,文件大小为220千字节,并且该文件与本说明书同时提交。在这一ASCII格式的文件中包含的序列表为所述说明书的部分并且全文以引用方式并入本文。
背景技术
除草剂抗性植物可减少对用以控制杂草的耕种的需要,从而有效地降低种植者的成本。具有增加的除草剂抗性的作物的开发是当前农业实践中的重大突破,因为它为农民提供了新的杂草控制选择。
就此而言作为许多研究的主题的一种除草剂是N-膦酰基甲基甘氨酸,通常称为草甘膦。草甘膦抑制莽草酸途径,其导致包括氨基酸、激素和维生素的芳族化合物的生物合成。具体地,草甘膦通过抑制酶5-烯醇式丙酮基莽草酸-3-磷酸合酶(称为EPSPS)来遏制磷酸烯醇式丙酮酸(PEP)和3-磷酸基莽草酸向5-烯醇式丙酮基-3-磷酸莽草酸的转化。已使用植物基因工程方法修饰EPSP合酶DNA和所编码的蛋白质,并且将这些分子转入在农学上重要的植物中。已经分离出造成草甘膦抗性的I类EPSPS的变体(Pro-Ser,美国专利4,769,061;Gly-Ala,美国专利4,971,908;Gly-Ala、Gly-Asp,美国专利5,310,667;Gly-Ala、Ala-Thr,美国专利5,8866,775)。然而,许多EPSPS变体不是用于植物中的有效酶(Padgette等人,在“Herbicide-resistant Crops”中,第4章第53-83页.Stephen Duke编辑,Lewis Pub,CRC Press Boca Raton,Fla.1996)。一种I类EPSPS变体,即可操作地连接至异源启动子的T-102-I/P-106-S(TIPS),已经表现出为转基因玉米植物提供草甘膦(N-膦酰基甲基甘氨酸)抗性(美国专利6,040,497)。
仍然需要开发抗除草剂作物,尤其是抗草甘膦的作物。还需要开发包含通过基因编辑获得的突变基因的具有农业价值的抗除草剂作物,其中基因的突变导致除草剂抗性。
提供了用于产生表现出除草剂抗性且具体地草甘膦抗性的突变植物的组合物和方法。
发明内容
本公开包括对膦酰基甲基甘氨酸家族的除草剂,例如草甘膦具有抗性的突变植物的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别且任选地向细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。更具体地,提供了用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的组合物和方法。所述方法和组合物采用向导多核苷酸/Cas内切核酸酶系统来提供用于编辑细胞基因组内的EPSPS核苷酸序列的有效系统。待编辑的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。细胞包括但不限于植物细胞。还提供了用于产生草甘膦耐受性或草甘膦抗性植物细胞、植物外植体、种子和谷粒的组合物和方法。
因此,在本公开的第一实施方案中,所述方法包括一种用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的方法,该方法包括向所述细胞引入向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰。多核苷酸修饰模板还可包括EPSPS基因的非功能片段。
在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞中引入向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。可通过本领域已知的方法或者通过能够表达向导RNA的重组DNA构建体的表达而将向导RNA直接引入细胞。可通过本领域已知的方法或者通过能够表达Cas内切核酸酶的重组DNA构建体的表达而将Cas内切核酸酶直接引入细胞。多核苷酸修饰模板(EPSPS多核苷酸修饰模板)可包括EPSPS基因的部分片段(并且因此其自身不编码全功能性的EPSPS多肽)。
在其它实施方案中,所述方法包括一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,一种用于替换细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)启动子序列的方法,一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入启动子或调控元件的方法,一种用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的内含子元件的方法,所述方法包括向所述细胞中引入向导RNA、多核苷酸修饰模板和Cas内切核酸酶。细胞可以是但不限于任何植物细胞。
在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;d)选择表现出草甘膦抗性的子代植物。
在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及d)筛选不含所述向导RNA和Cas内切核酸酶的(c)的子代植物。
本发明提供包含经编辑的感兴趣的基因(诸如但不限于烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因序列)的植物、植物部分、植物细胞和种子,其中包含经编辑的感兴趣的基因的这些突变植物、植物部分、植物细胞和种子表现出除草剂抗性。
本文公开了本发明的方法和组合物的另外的实施方案。
附图和序列表简述
根据下列的详细描述和附图以及序列表,可以更全面地理解本发明,下列的详细描述和附图以及序列表形成本申请的一部分。序列描述以及所附序列表遵循如37 C.F.R.§§1.821-1.825所列出的关于专利申请中核苷酸和氨基酸序列公开的规定。序列描述包含如37 C.F.R.§§1.821-1.825中所限定的氨基酸的三个字母编码,其以引用方式并入本文。
附图
图1A示出含有双分子的双链向导多核苷酸,该双链向导多核苷酸包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸序列域(称为Cas内切核酸酶识别域或CER域)。双链向导多核苷酸的CER域包含沿着互补区域杂交的两个单独分子。这两个单独分子可为RNA、DNA和/或RNA-DNA组合序列。包含连接到CER域的VT域的双链向导多核苷酸的第一分子(示为cr核苷酸)被称为“crDNA”(当由DNA核苷酸的连续片段构成时)或“crRNA”(当由RNA核苷酸的连续片段构成时),或“crDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。包含CER域的双链向导多核苷酸的第二分子(示为tracr核苷酸)被称为“tracrRNA”(当由RNA核苷酸的连续片段构成时)或“tracrDNA”(当由DNA核苷酸的连续片段构成时),或“tracrDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。
图1B示出单链向导多核苷酸,该单链向导多核苷酸包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸域(称为Cas内切核酸酶识别域或CER域)。所谓“域”,意指核苷酸的连续片段,该连续片段可为RNA、DNA和/或RNA-DNA组合序列。单链向导多核苷酸包含通过连接子核苷酸序列(示为环)连接到tracr核苷酸(包含CER域)的cr核苷酸(包含连接到CER域的VT域)。由来自cr核苷酸和tracr核苷酸的序列构成的单链向导多核苷酸可被称为“单链向导RNA”(当由RNA核苷酸的连续片段构成时)或“单链向导DNA”(当由DNA核苷酸的连续片段构成时)或“单链向导RNA-DNA”(当由RNA核苷酸和DNA核苷酸的组合构成时)。
图2A至图2C示出用于Cas9、crRNA和tracrRNA表达的表达盒。图2A示出含有马铃薯ST-LS1内含子、SV40氨基末端核定位序列(SV40NLS)和VirD2羧基末端NLS(VirD2 NLS)的玉米密码子优化的Cas9基因(编码Cas9内切核酸酶),其可操作地连接至植物泛素启动子(UBIPro)(诸如但不限于SEQ ID NO:5)。玉米优化的Cas9基因(仅Cas9编码序列,不是NLS)对应于SEQ ID NO:5的核苷酸位置2037-2411和2601-6329,其中马铃薯内含子位于SEQ ID NO:5的第2412-2600位处。SV40NLS位于SEQ ID NO:5的第2010-2036位处。VirD2 NLS位于SEQ IDNO:5的第6330-6386位处。图2B示出可操作地连接至核苷酸序列的玉米U6聚合酶III启动子,该核苷酸序列编码可操作地连接至玉米U6终止子的crRNA分子。图2C示出可操作地连接至核苷酸序列的玉米U6聚合酶III启动子,该核苷酸序列编码可操作地连接至玉米U6PolIII终止子的tracrRNA分子。图2D示出了可操作地连接至玉米U6聚合酶III启动子的单链向导多核苷酸(向导RNA),其被玉米U6终止子终止。图2E示出了玉米优化的Cas9和单链向导RNA表达盒,二者结合到单个载体DNA上。
图3示出相对于在玉米基因组LIGCas-3靶位点处适当取向的PAM序列(AGG)(SEQID NO:14,表1)与基因组LIGCas-3靶位点相互作用的单链向导RNA/Cas9内切核酸酶复合物。该单链向导RNA(浅灰色背景,SEQ ID NO:8)是crRNA和tracrRNA之间的融合体并且包含与双链DNA基因组靶位点的一条DNA链互补的可变靶向域。Cas9内切核酸酶以深灰色示出。三角形指向有义DNA链和反义DNA链两者上的预期DNA切割位点。
图4A-B示出用于编辑感兴趣的核苷酸序列的单链向导RNA/Cas内切核酸酶系统的示意图。为了能够进行特定核苷酸编辑,将包含至少一个核苷酸修饰的多核苷酸修饰模板(当与待编辑的核苷酸序列比较时)与单链向导RNA和Cas内切核酸酶表达盒一起引入细胞。例如,如本文所示,待编辑的核苷酸序列为玉米细胞中的内源性野生型烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因。Cas内切核酸酶(阴影圆圈)为玉米优化的Cas9内切核酸酶,其使用诸如SEQ ID NO:24的向导RNA切割在epsps基因座内的moCas9靶序列。图4-A示出包括三个核苷酸修饰的多核苷酸修饰模板(当与图4-B中描绘的野生型epsps基因座比较时),其侧接有两个EPSPS基因同源性区域HR-1和HR-2。图4-B示出与epsps基因座相互作用的向导RNA/玉米优化的Cas9内切核酸酶复合物。需要被编辑的EPSPS基因的初始氨基酸密码子示为aCT和Cca(图4-B)。具有修饰的核苷酸的核苷酸密码子(以大写示出)示为aTC和Tca(图4-B)。在涉及内源性EPSPS基因的修饰的示例中使用编码功能性玉米EPSPS蛋白的非全长DNA分子。
图5示出用于玉米中的EPSPS基因编辑的Cas9表达盒的两种型式(还可参见SEQ IDNO:5和SEQ ID NO:23)。
图6示出moCas9靶序列(标有下划线)的一些示例,其位于EPSPS的DNA片段上,通过在玉米细胞中moCas9内切核酸酶的切割位点(粗箭头)处引入双链断裂来诱变。在SEQ IDNO:206中,moCas9切割位点旁边的三个核苷酸(短线)缺失。SEQ ID NO:207-208表示核苷酸缺失可扩大超出moCas9切割位点。
图7示出了EPSPS模板载体,其用于递送包含三个TIPS核苷酸修饰的EPSPS多核苷酸修饰模板。EPSP多核苷酸修饰模板包括EPSPS基因的部分片段。载体长6,475碱基对(bp),并且包含两个与epsps基因座同源的区域(epsps-HR1和epsps-HR2)。两个Gateway克隆位点(ATTL4和ATTL3)、抗生素抗性基因(KAN)和复制的pUC起点(PUC ORI)完成了EPSPS模板载体的合成。
图8示出了基于PCR的筛选策略,该策略用于鉴定玉米细胞中具有TIPS核苷酸修饰的玉米事件。两对PCR引物用于扩增epsps基因座的基因组片段(上段)。它们都包含TIPS特异性引物(带圆点的箭头指示三个TIPS修饰的位点)。较短的片段(780bp F-E2)通过扩增EPSPS多核苷酸修饰模板片段产生(模板检测)。除了4个分析事件,在其它分析事件中都发现了扩增的EPSPS多核苷酸修饰模板片段(板F-E2)。较长的片段(839bp H-T)通过扩增基因组EPSPS序列产生,前提条件是epsps基因座包含负责TIPS修饰的三个核苷酸修饰。六个事件被鉴定为含有三个核苷酸修饰(板H-T)。白色箭头指向包含扩增的EPSPS多核苷酸修饰模板和负责TIPS修饰的核苷酸修饰两者的事件。扩增了编码功能性EPSPS的非全长片段。
图9A示出了用于鉴定所选择事件中经编辑的EPSPS DNA片段的PCR方案的示意图。无论编辑产物如何,都对含有epsps基因座的外显子1、内含子1和外显子2中的一部分的部分基因组片段进行扩增(板A,1050bp F-E3。对仅代表具有一个或多个突变的部分EPSPS基因序列的扩增产物进行克隆和测序。图9B示出经测序的扩增产物的两个示例。在一些扩增产物中,EPSPS核苷酸和moCas9靶序列(标有下划线)没有变化,这表明一个EPSPS等位基因未经编辑(野生型等位基因;SEQ ID NO:40)。在其它扩增产物中,三个特异性核苷酸置换(代表TIPS修饰)被鉴定为在moCas9靶序列(标有下划线)(SEQ ID NO:39)中没有突变。
图10示出用大豆泛素启动子/5’UTR/内含子1替换EPSPS1启动子/5’UTR的实验设计。
图11示出表示EPSP复制多核苷酸修饰模板的遗传元件的示意图。
图12示出表示经设计允许epsps基因座的编辑以包含位于epsps-TIPS编码序列(TIPS)前面的玉米泛素启动子(Ubi启动子+Ubi内含子)的EPSPS多核苷酸玉米泛素启动子模板(诸如SEQ ID NO:55)的示意图。
图13A-13C.玉米EPSPS聚泛素化位点的修饰。(A)比较所选择的推测性玉米EPSPS聚泛素化位点(玉米)与其它植物物种(矮牵牛花、番茄、高粱、稻和苋属植物)的类似位点。(B)玉米EPSPS编码序列中待编辑的核苷酸(标有下划线,编码氨基酸以粗体是示出)。(C)在所选择的T0植物中鉴定编辑的EPSPS编码序列。
图14A-14C.内含子介导的增强元件(A)。EPSPS基因的第一内含子的5′区段(编辑:标有下划线的置换和点表示的缺失)(B)以及其赋予三个IME元件(标有下划线)的经编辑型式,如所选择的玉米T0植株中所存在的。编辑的核苷酸以粗体示出(C)。
图15A-15B.另选地,剪接玉米细胞中的EPSPS mRNA。(A)左板代表EPSPS cDNA的分析。图36A中的泳道I4示出了包含未剪接的第三内含子的EPSPS前mRNA的扩增(图36B所示的804bp的诊断片段表示替代性剪接事件)。泳道E3和F8显示具有剪接内含子的EPSPS PCR扩增片段。除非合成cDNA,否则不会扩增这些诊断片段(显然,泳道E3、I4和F8中不存在包含总RNA的带(在图36A的右边以总RNA板示出))。图36B中的灰色方框表示八个EPSPS外显子(在每个方框上标记出了它们的大小)。
图16示出第二EPSPS内含子和第三外显子之间的连接区处的剪接位点(粗体)。待编辑的核苷酸标有下划线。含有如所选择的玉米T0植株中存在的经编辑的第2内含子-第3外显子剪接位点的epsps-TIPS等位基因列出为SEQ ID NO:83。
图17示出用于编辑天然大豆EPSPS1基因中的氨基酸序列的实验设计。
图18示出用大豆泛素(UBQ)内含子1替换EPSPS1内含子1的实验设计。
序列
SEQ ID NO:1为来自酿脓链球菌(Streptococcus pyogenes)M1 GAS(SF370)的Cas9基因的核苷酸序列。
SEQ ID NO:2为马铃薯ST-LS1内含子的核苷酸序列。
SEQ ID NO:3为SV40氨基N末端的氨基酸序列。
SEQ ID NO:4为根瘤农杆菌(Agrobacterium tumefaciens)双分型VirD2 T-DNA边界内切核酸酶羧基末端的氨基酸序列。
SEQ ID NO:5为表达玉米优化的Cas9的表达盒的核苷酸序列。
SEQ ID NO:6为在可变靶向域中包含LIGCas-3靶序列的crRNA的核苷酸序列。
SEQ ID NO:7为来自酿脓链球菌M1 GAS(SF370)>的tracrRNA的核苷酸序列
SEQ ID NO:8为在可变靶向域中包含LIGCas-3靶序列的单链向导RNA的核苷酸序列。
SEQ ID NO:9为玉米U6聚合酶III启动子的核苷酸序列。
SEQ ID NO:10为玉米U6聚合酶III终止子的两个拷贝的核苷酸序列。
SEQ ID NO:11为包含LIGCas-3可变靶向域的玉米优化的单链长向导RNA表达盒的核苷酸序列。
SEQ ID NO:12为玉米基因组靶位点LIGCas-1的核苷酸序列加PAM序列。
SEQ ID NO:13为玉米基因组靶位点LIGCas-2的核苷酸序列加PAM序列。
SEQ ID NO:14为玉米基因组靶位点LIGCas-3的核苷酸序列加PAM序列。
SEQ ID NO:15-21、27-34和41-52为PCR引物和探针的核苷酸序列。
SEQ ID NO:22为玉米优化的moCAS9内切核酸酶的氨基酸序列。
SEQ ID NO:23为玉米优化的moCAS9内切核酸酶的核苷酸序列。
SEQ ID NO:24为向导RNA EPSPS sgRNA的DNA型式的核苷酸序列。
SEQ ID NO:25为EPSPS多核苷酸模板的核苷酸序列。
SEQ ID NO:26为包含TIPS核苷酸修饰的DNA片段的核苷酸序列。
SEQ ID NO:35为具有完整Cas靶序列的DNA片段的核苷酸序列。
SEQ ID NO:36-38为具有突变Cas靶序列的DNA片段的核苷酸序列。
SEQ ID NO:39为TIPS编辑的EPSPS核苷酸序列片段的核苷酸序列。
SEQ ID NO:40为野生型epsps核苷酸序列片段的核苷酸序列。
SEQ ID NO:53为WOL1006反向引物的核苷酸序列。
SEQ ID NO:54为EPSPS-复制多核苷酸模板的核苷酸序列。
SEQ ID NO:55为EPSPS-玉米泛素启动子多核苷酸模板的核苷酸序列。
SEQ ID NO:56为EPSPS-K90R多核苷酸模板的核苷酸序列。
SEQ ID NO:57为EPSPS-IME多核苷酸模板的核苷酸序列。
SEQ ID NO:58为EPSPS-T剪接的多核苷酸模板的核苷酸序列。
SEQ ID NO:59为EPSPS-合成多核苷酸模板的核苷酸序列。
玉米GOS2 5′-UTR1和内含子1以及5′-UTR2。
SEQ ID NO:60-61、83-84、96-97分别为大豆基因组Cas内切核酸酶靶序列大豆EPSPS-CR1、大豆EPSPS-CR2、大豆EPSPS-CR4、大豆EPSPS-CR5、大豆EPSPS-CR6、大豆EPSPS-CR7的核苷酸序列。
SEQ ID NO:62为大豆U6小核RNA启动子GM-U6-13.1的核苷酸序列。
SEQ ID NO:63和64分别为质粒QC868、QC879的核苷酸序列。
SEQ ID NO:65、66、85、86、87、98、99和100分别为RTW1013A、RTW1012A、RTW1199、RTW1200、RTW1190A、RTW1201、RTW1202、RTW1192A的核苷酸序列。
SEQ ID NO:67-81、88-95、101-104为引物和探针的核苷酸序列。
SEQ ID NO:82为大豆密码子优化的Cas9的核苷酸序列。
SEQ ID NO:105为玉米优化的moCAS9内切核酸酶的核苷酸序列。
SEQ ID NO:106为来自嗜热链球菌(S.thermophiles)的Cas9内切核酸酶(genbankCS571758.1)的核苷酸序列。
SEQ ID NO:107为来自嗜热链球菌的Cas9内切核酸酶(genbank CS571758.1)的核苷酸序列。
SEQ ID NO:108为来自无乳链球菌(S.agalactiae)的Cas9内切核酸酶(genbankCS571785.1)的核苷酸序列。
SEQ ID NO:109为来自无乳链球菌的Cas9内切核酸酶(genbank CS571790.1)
的核苷酸序列。
SEQ ID NO:110为来自变异链球菌(S.mutans)的Cas9内切核酸酶(genbankCS571790.1)的核苷酸序列。
具体实施方式
本公开包括对膦酰基甲基甘氨酸家族的除草剂,例如草甘膦具有抗性的突变植物的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别感兴趣的核苷酸序列并且向细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。另外,提供了用于细胞基因组中的靶位点的基因组修饰和用于将感兴趣的多核苷酸序列插入细胞的基因组中的组合物和方法,其采用向导多核苷酸/Cas内切核酸酶系统。
更具体地,提供了用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的组合物和方法。该方法和组合物采用向导多核苷酸/Cas内切核酸酶系统来提供用于编辑细胞基因组内的EPSPS核苷酸序列的有效系统。待编辑的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。细胞包括但不限于植物细胞。还提供了用于产生草甘膦耐受性或草甘膦抗性植物细胞、植物外植体、种子和谷粒的组合物和方法。
CRISPR基因座(Clustered Regularly Interspaced Shorr PalindromicRepeats,规律成簇间隔短回文重复序列)(也称为SPIDRs--SPacer Interspersed DirectRepeats,间隔区散在同向重复序列))构成最近描述的DNA基因座的家族。CRISPR基因座由短且高度保守的DNA重复序列(通常24至40bp,重复1至140次,也称CRISPR重复序列)组成,所述DNA重复序列是部分回文的。重复的序列(通常是物种特异性的)被恒定长度的可变序列(通常20至58bp,取决于CRISPR基因座(2007年3月1日公布的WO2007/025097))间隔。
CRISPR基因座首先在大肠杆菌(E.coli)中识别(Ishino等人,(1987)J.Bacterial.169:5429-5433;Nakata等人(1989)J.Bacterial.171:3553-3556)。类似的插入短重复序列已经在地中海富盐菌(Haloferax mediterranei)、酿脓链球菌(Streptococcus pyogenes)、项圈藻(Anabaena)和肺结核分枝杆菌(Mycobacteriumtuberculosis)中鉴定(Groenen等人,(1993)Mol.Microbiol.10:1057-1065;Hoe等人(1999)Emerg.Infect.Dis.5:254-263;Masepohl等人(1996)Biochim.Biophys.Acta1307:26-30;Mojica等人(1995)Mol.Microbiol.17:85-93)。CRISPR基因座与其它SSR的不同之处在于重复序列的结构,其被称为短规则间隔的重复序列(SRSR)(Janssen等人(2002)OMICSJ.Integ.Biol6:23-33;Mojica等人(2000)Mol.Microbiol.36:244-246)。所述重复序列是成簇出现的短元件,其通常被恒定长度的可变序列规则地间隔(Mojica等人(2000)Mol.Microbiol.36:244-246)。
“Cas基因”包括这样的基因,该基因通常与旁侧CRISPR基因座偶联、相关或接近或在邻近旁侧CRISPR基因座的位置。术语“Cas基因”、“CRISPR-相关联的(Cas)基因”在本文中可互换使用。Cas蛋白质家族的全面综述在Haft等人,(2005)Computational Biology,PLoSComput Biol 1(6):e60.doi:10.1371/journal.pcbi.0010060中提出。
如本文所述,除了四种先前已知的基因家族之外,还描述了41种CRISPR-相关联的(Cas)基因家族。其示出CRISPR体系属于不同的类,具有不同的重复图案、基因组和物种范围。在给定CRISPR基因座处的Cas基因数在物种之间可以不同。
Cas内切核酸酶与由Cas基因编码的Cas蛋白质相关,其中所述Cas蛋白质能够将双链断裂引入到DNA靶序列中。Cas内切核酸酶通过向导多核苷酸引导来识别并任选地在细胞的基因组中的特定靶位点处引入双链断裂。如本文所用,术语“向导多核苷酸/Cas内切核酸酶系统”是指能够将双链断裂引入DNA靶序列的Cas内切核酸酶和向导多核苷酸的复合物。Cas内切核酸酶接近基因组靶位点解旋DNA双链并且在识别靶序列时通过向导多核苷酸裂解两条DNA链,但唯一条件是正确的原间隔序列相邻基元(PAM)大致在靶序列的3′端处取向(图3)。
在一个实施方案中,Cas内切核酸酶为能够在DNA靶位点处引入双链断裂的Cas9内切核酸酶,其中在特定位置处的DNA裂解通过以下方式实现:a)在DNA靶位点和引导多核苷酸的可变靶向域之间碱基配对互补,以及b)存在紧邻DNA靶位点的短原间隔序列相邻基元(PAM)。
在一个实施方案中,Cas内切核酸酶基因为Cas9内切核酸酶,诸如但不限于2007年3月1日公布并且以引用方式并入本文中的WO2007/025097中以SEQ ID NO:462、474、489、494、499、505和518列出的Cas9基因。在另一个实施方案中,Cas内切核酸酶基因为植物如玉米或大豆优化的Cas9内切核酸酶(图1A)。在另一个实施方案中,Cas内切核酸酶基因可操作地连接至Cas密码子区域上游的SV40核靶向信号。
在一个实施方案中,Cas内切核酸酶基因为SEQ ID NO:105-110的Cas9内切核酸酶基因,或它们的任何功能片段或变体。
术语“功能片段”、“功能上等同的片段”和“功能等同片段”在本文中可互换使用。这些术语是指其中产生双链断裂的能力得以保持的Cas内切核酸酶序列的一部分或亚序列。
术语“功能变体”、“功能上等同的变体”和“功能等同变体”在本文中可互换使用。这些术语是指其中产生双链断裂的能力得以保持的Cas内切核酸酶的变体。片段和变体可通过诸如定点诱变和合成构建之类的方法来获得。
在一个实施方案中,Cas内切核酸酶基因为植物密码子优化的酿脓链球菌Cas9基因,其可识别N(12-30)NGG形式的任何基因组序列。
在一个实施方案中,Cas内切核酸酶通过本领域已知的任何方法直接引入到细胞中,例如但不限于转染和局部应用。
内切核酸酶是切割多核苷酸链内的磷酸二酯键的酶,并且包括在特定位点切割DNA而不损伤碱基的限制性内切核酸酶。限制性内切核酸酶包括I型、II型、III型和IV型内切核酸酶,它们进一步包括亚型。在I型和III型系统中,甲基化酶活性和限制酶活性两者都包含在单一复合物中。内切核酸酶还包括大范围核酸酶,也称为归巢内切核酸酶(HEases),其如同限制性内切核酸酶,在特定识别位点处结合和切割,然而大范围核酸酶的识别位点通常较长,约18bp或更长。(2012年3月22日提交的专利申请WO-PCT PCT/US12/30061)大范围核酸酶已基于保守序列基元分为四个家族(Belfort M和Perlman P SJ.Biol.Chem.1995(270):30237-30240)。这些基元参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的识别位点长,并且能容忍它们的DNA底物中有一定的序列多态性。大范围核酸酶的命名规范与其他限制性内切核酸酶的规范相似。对于分别由独立式ORF、内含子和内含肽编码的大范围核酸酶,它们也通过前缀F-、I-或PI-进行表征。重组过程中的一个步骤涉及在识别位点之处或附近进行多核苷酸裂解。这个裂解活性可用来产生双链断裂。有关位点特异性重组酶以及它们的识别位点的综述,参见Sauer(1994)Curr.Op.Biotechnol.5:521-7;and Sadowski(1993)FASEB 7:760-7。在一些示例中,重组酶来自整合酶或解离酶家族。
TAL效应物核酸酶是新一类序列特异性核酸酶,可用来在植物或其他生物体的基因组中的特定靶序列处产生双链断裂。(Milleret al.(2011)Nature Biotechnology 29:143-148)。锌指核酸酶(ZFN)为工程化的双链断裂诱导剂,由锌指DNA结合域和双链断裂诱导剂域构成。识别位点特异性由锌指域赋予,锌指域通常包含两个、三个或者四个例如具有C2H2结构的锌指,但是其它锌指结构也是已知的并被工程化。锌指域易于设计特异性结合选择的多核苷酸识别序列的多肽。ZFN包括与非特异性内切核酸酶域连接的工程化的DNA结合锌指域,所述非特异性内切核酸酶域例如来自IIs型内切核酸酶(诸如FokI)的核酸酶域。可将另外的功能性融合到锌指结合域,包括转录激活因子域、转录阻遏蛋白域和甲基化酶。在一些示例中,核酸酶域的二聚化为切割活性所需。每个锌指能识别靶DNA中的三个连续碱基对。例如,一个3锌指域识别9个连续核苷酸的序列,由于该核酸酶要求二聚化,使用两组锌指三联体来结合一条18个核苷酸的识别序列。
在本公开的一个实施方案中,组合物包括包含向导多核苷酸和Cas9内切核酸酶的植物或种子,其中所述Cas9内切核酸酶和向导多核苷酸能够形成复合物并且在所述植物的基因组靶位点中产生双链断裂。
细菌和古细菌已进化出适应性免疫防御机制,又称为规律成簇间隔短回文重复序列(CRISPR)/CRISPR相关联的(Cas)系统,其使用短RNA来指导外源核酸的降解(2007年3月1日公布的WO2007/025097)。来自细菌的II型CRISPR/Cas系统采用crRNA和tracrRNA将Cas内切核酸酶引导至其DNA靶标。crRNA(CRISPR RNA)包含与双链DNA靶标中的一条链互补的区域并且与tracrRNA(反式激活CRISPR RNA)碱基配对,从而形成指导Cas内切核酸酶裂解DNA靶标的RNA双链体。
如本文所用,术语“向导多核苷酸”是指如下多核苷酸序列,该多核苷酸序列可与Cas内切核酸酶形成复合物并且使Cas内切核酸酶能够识别并且任选地裂解DNA靶位点。向导多核苷酸可包括单分子或双分子。向导多核苷酸序列可为RNA序列、DNA序列、或它们的组合(RNA-DNA组合序列)。任选地,引导多核苷酸可包含至少一个核苷酸、磷酸二酯键或键修饰,诸如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2’-氟A、2’-氟U、2′-O-甲基RNA、硫代磷酸酯键(键合到胆固醇分子、键合到聚乙二醇分子、键合到间隔区18(六乙二醇链)分子)、或导致环化的5’至3’共价键。在本公开的一些实施方案中,引导多核苷酸不单独包含核糖核酸(RNA)。单独包含核糖核酸的引导多核苷酸也称为“引导DNA”。
向导多核苷酸可为双分子(也称为双链向导多核苷酸),其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸序列域(称为Cas内切核酸酶识别域或CER域)(图1A)。双分子向导多核苷酸的CER域包含沿着互补区域杂交的两个单独分子(图1A)。这两个单独分子可为RNA、DNA和/或RNA-DNA组合序列。在一些实施方案中,包含连接到CER域的VT域的双链向导多核苷酸的第一分子(在图1A中示为“cr核苷酸”)被称为“crDNA”(当由DNA核苷酸的连续片段构成时)或“crRNA”(当由RNA核苷酸的连续片段构成时),或“crDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。cr核苷酸可包括细菌和古细菌中天然存在的crRNA的片段。在一个实施方案中,细菌和古细菌中天然存在的crRNA的片段以本文所公开的cr核苷酸形式存在,其大小范围可为,但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施方案中,包含CER域的双链体向导多核苷酸的第二分子(在图1A中被示出为tracr核苷酸)被称为“tracrRNA”(当由RNA核苷酸的连续片段构成时)或“tracrDNA”(当由DNA核苷酸的连续片段构成时),或“tracrDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。在一个实施方案中,向导RNA/Cas9内切核酸酶复合物的RNA为包含双链体crRNA-tracrRNA的双工RNA。
引导多核苷酸也可为单分子,其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸域(称为Cas内切核酸酶识别域或CER域)(图1B)。所谓“域”,意指核苷酸的连续片段,该连续片段可为RNA、DNA和/或RNA-DNA组合序列。单链向导多核苷酸的VT域和/或CER域可包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施方案中,单链向导多核苷酸包括连接到tracr核苷酸(包含CER域)的cr核苷酸(包含连接到CER域的VT域),其中所述键为包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列(图1B)。由来自cr核苷酸和tracr核苷酸的序列构成的单链向导多核苷酸可被称为“单链向导RNA”(当由RNA核苷酸的连续片段构成时)或“单链向导DNA”(当由DNA核苷酸的连续片段构成时)或“单链向导RNA-DNA”(当由RNA核苷酸和DNA核苷酸的组合构成时)。在本发明的一个实施方案中,单向导RNA包括crRNA或crRNA片段以及可与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas系统的tracrRNA或tracrRNA片段,其中所述向导RNA/Cas内切核酸酶复合物可引导Cas内切核酸酶至植物基因组靶位点,使得Cas内切核酸酶将双链断裂引入到基因组靶位点中。
使用单向导多核苷酸与双链体向导多核苷酸相比的一个方面是仅需要形成一个表达盒即可表达单向导多核苷酸。
术语“可变靶向域”或“VT域”在本文中可互换使用并且指与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一核苷酸序列域(VT域)和靶序列之间的互补性%可为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可变靶域的长度可为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些实施方案中,可变靶向域包含12至30个核苷酸的连续片段。可变靶向域可由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)、或它们的任意组合构成。
术语向导多核苷酸的“Cas内切核酸酶识别域”或“CER域”在本文中可互换使用并且是指与Cas内切核酸酶多肽相互作用的核苷酸序列(诸如向导多核苷酸的第二核苷酸序列域)。CER域可由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)、或它们的任意组合构成。
连接单链向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施方案中,连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列的长度可为至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸。在一个实施方案中,连接单链向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含四环序列,诸如但不限于GAAA四环序列。
向导多核苷酸、VT域和/或CER域的核苷酸序列修饰可选自但不限于5′帽、3′聚腺苷酸化尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将向导多核苷酸靶向到亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供用于蛋白质的结合位点的修饰或序列、锁定核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟A核苷酸、2’-氟U核苷酸、2′-O-甲基RNA核苷酸、硫代磷酸酯键(键合到胆固醇分子、键合到聚乙二醇分子、键合到间隔区18分子)、5’至3’共价键、或它们的任意组合。这些修饰可产生至少一种附加的有益特征,其中所述附加的有益特征选自经修饰或调控的稳定性,亚细胞靶向,跟踪,荧光标记,蛋白或蛋白复合物的结合位点,与互补靶序列的经修饰的结合亲和力,经修饰的对细胞降解的抗性,或增加的细胞渗透性。
在本公开的一个实施方案中,组合物包含向导多核苷酸,所述向导多核苷酸包含:(i)与靶DNA中的核苷酸序列互补的第一核苷酸序列域(VT域);以及(ii)与Cas内切核酸酶相互作用的第二核苷酸序列域(CER域),其中第一核苷酸序列域和第二核苷酸序列域由脱氧核糖核酸(DNA)、核糖核酸(RNA)、或它们的组合构成。第一核苷酸序列域(可变靶向域)和靶序列之间的互补性%可为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
在本公开的一个实施方案中,引导多核苷酸的第一核苷酸序列域(VT域)和第二核苷酸序列域(CER域)位于单个分子上。在另一个实施方案中,第二核苷酸序列域(Cas内切核酸酶识别域)包含能够沿着互补区域杂交的两个单独分子。
在一个实施方案中,组合物包含向导多核苷酸,其中第一核苷酸序列域(VT域)为DNA序列,并且第二核苷酸序列域(CER域)选自DNA序列、RNA序列、以及它们的组合。
在一个实施方案中,可使用本领域技术人员已知的任何方法将向导多核苷酸直接引入植物细胞,所述方法诸如但不限于粒子轰击或局部应用。
当向导多核苷酸仅由RNA序列(也称为“向导RNA”)组成时,其可通过引入包含可操作地连接到植物特异性启动子的相应引导DNA序列的重组DNA分子而间接引入,该植物特异性启动子能够转录所述植物细胞中的向导多核苷酸。术语“相应引导DNA”是指如下DNA分子,该DNA分子与RNA分子相同但是RNA分子的每个“U”替换为“T”。
在一些实施方案中,引导多核苷酸通过粒子轰击或包含可操作地连接至植物U6聚合酶III启动子的相应引导DNA的重组DNA构建体的农杆菌(Agrobacterium)转化来引入。
术语“靶位点”、“靶序列”、”靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”和“基因组靶基因座”在本文中可互换使用并且指细胞的基因组(包括叶绿体和线粒体DNA)中的多核苷酸序列,在细胞基因组中在该多核苷酸序列处通过Cas内切核酸酶诱导双链断裂。靶位点可为细胞或生物体的基因组中的内源位点,或者另选地,靶位点可与细胞或生物体是异源的,从而不天然存在于基因组中,或靶位点与其天然出现的位置相比可存在于异源基因组位置中。如本文所用,术语“内源靶序列”和“天然靶序列”可在本文中互换使用并且是指这样的靶序列,该靶序列对细胞或生物体的基因组为内源或天然的并且位于该靶序列在细胞或生物体的基因组中的内源或天然位置处。细胞包括但不限于动物、细菌、真菌、昆虫、酵母和植物细胞以及通过本文所述的方法制备的植物和种子。
在一个实施方案中,与正在使用的具体基因编辑系统相关联的靶位点可以类似于DNA识别位点或者可以是被双链断裂诱导剂特定识别和/或结合的靶位点,所述双链断裂诱导剂诸如但不限于锌指内切核酸酶、大范围核酸酶、或TALEN内切核酸酶。
“人工靶位点”或“人工靶序列”在本文中可互换使用并且指已被引入到细胞或生物体(诸如但不限于植物或酵母)的基因组中的靶序列。这种人工靶序列可在序列上与细胞基因组中的内源或天然靶序列相同,但可位于细胞或生物体的基因组中的另一不同位置(即,非内源或非天然位置)。
“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用,并且指如本文所公开的当与未改变的靶序列相比时包含至少一个改变的靶序列。此类“改变”包括例如:(i)替换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或(iv)(i)-(iii)的任意组合。
本文中公开了用于修饰生物体(诸如但不限于植物或酵母)的基因组靶位点的方法。
在一个实施方案中,用于修饰细胞的基因组中的靶位点的方法包括将向导多核苷酸引入具有Cas内切核酸酶的细胞,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述靶位点处引入双链断裂。该方法还可鉴定至少一个在所述靶标处具有修饰的细胞,其中在所述靶位点处的修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。该方法还可进一步包括将供体DNA引入到所述细胞中,其中所述供体DNA包含感兴趣的多核苷酸。
还提供用于修饰细胞的基因组中的靶位点的方法,该方法包括向细胞引入向导多核苷酸和Cas内切核酸酶,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述靶位点处引入双链断裂。该方法可进一步包括鉴定至少一个在所述靶标处具有修饰的细胞,其中在所述靶位点处的修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。该方法还可进一步包括将供体DNA引入到所述细胞中,其中所述供体DNA包含感兴趣的多核苷酸。
还提供了用于修饰细胞基因组中的靶位点的方法,该方法包括:a)将cr核苷酸、能够表达tracrRNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA引入到细胞中,其中所述cr核苷酸为脱氧核糖核苷酸序列或脱氧核糖核苷酸与核糖核苷酸序列的组合,其中所述cr核苷酸、所述tracrRNA和所述Cas内切核酸酶能够形成使Cas内切核酸酶能够在所述靶位点处引入双链断裂的复合物;以及b)鉴定至少一个在所述靶位点处具有修饰的细胞,其中所述修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。
还提供了用于修饰细胞基因组中的靶位点的方法,该方法包括:a)将tracr核苷酸、能够表达crRNA的第一重组DNA构建体、以及能够表达Cas内切核酸酶的第二重组DNA引入到细胞中,其中所述tracr核苷酸选自脱氧核糖核苷酸序列或脱氧核糖核苷酸与核糖核苷酸序列的组合,其中所述tracr核苷酸、所述crRNA和所述Cas内切核酸酶能够形成使Cas内切核酸酶在所述靶位点处引入双链断裂的复合物;以及b)鉴定至少一个在所述靶位点处具有修饰的细胞,其中所述修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。
靶位点的长度可改变,并且包括例如长度为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸的靶位点。靶位点还有可能是回文的,即一条链上的序列在互补链上从相反方向读起来是一样的。切口/切割位点可位于靶序列内,或者切口/切割位点可位于靶序列之外。在另一个变型形式中,切割可发生在互相相对的核苷酸位置处以产生平端切口,或者在其它情况中,切口可交错以产生单链突出端,也称“粘性末端”,其可以为5′突出端或者3′突出端。
还可使用基因组靶位点的活性变体。此类活性变体可与给定靶位点具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,其中活性变体保留生物活性并且因此能够由Cas内切核酸酶识别和裂解。通过内切核酸酶测量靶位点的双链断裂的测定法是本领域中已知的,并且通常测量该试剂对含有识别位点的DNA底物的总体活性和特异性。
各种方法和组合物均可用于获得具有插入到Cas内切核酸酶的靶位点中的感兴趣的多核苷酸的细胞或生物体。此类方法可采用同源重组来提供感兴趣的多核苷酸在靶位点处的整合。在提供的一种方法中,向供体DNA构建体中的细胞提供感兴趣的多核苷酸。如本文所用,“供体DNA”是包含待插入到Cas内切核酸酶的靶位点中的感兴趣的多核苷酸的DNA构建体。任选地,供体DNA构建体还可包含感兴趣的多核苷酸旁侧的第一同源性区域和第二同源性区域。供体DNA的第一同源性区域和第二同源性区域分别与存在于植物基因组的靶位点中或旁侧的第一基因组区域和第二基因组区域共享同源性。所谓“同源性”是指类似的DNA序列。例如,存在于供体DNA上的“基因组区域的同源性区域”是与植物基因组中的给定“基因组区域”具有类似序列的DNA区域。同源性区域可具有任何长度,该长度足以促进裂解靶位点处的同源重组。例如,同源性区域的长度可为至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,使得同源性区域具有充分的同源性与相应的基因组区域发生同源重组。“充分的同源性”表明两个多核苷酸序列具有充分的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总体长度,以及多核苷酸的序列相似性。序列相似性可通过序列的总长度上的序列同一性百分比,和/或通过包含局部化相似性的保守区域(诸如具有100%序列同一性的连续的核苷酸)以及序列长度的一部分上的序列同一性百分比来描述。
靶标和供体多核苷酸共享的同源性或者序列同一性的量可变化,包括总长度和/或具有在以下范围内的单位整数值的区域:约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或者直到并包括该靶位点的总长度。这些范围包括该范围内的每个整数,例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可通过两个多核苷酸的完全比对长度上的序列同一性百分数来描述,所述序列同一性百分数包括约至少50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性百分数。充分的同源性包括多核苷酸长度、全局序列同一性百分数和连续核苷酸的任选保守区域或局部序列同一性百分数的任意组合,例如充分的同源性可描述为75-150bp的与靶基因座区域具有至少80%序列同一性的区域。充分的同源性还可通过所预测的两个多核苷酸在高严格条件下特异性杂交的能力来描述,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,NY);Current Protocols in Molecular Biology,Ausubel等人编辑,(1994)CurrentProtocols,(Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.);以及Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes,(Elsevier,New York)。
如本文所用,“基因组区域”是细胞的基因组中的染色体的区段,该区段存在于靶位点的任一侧上,或者另选地,还包含靶位点的一部分。基因组区域可包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,使得基因组区域具有充分的同源性与相应的同源性区域发生同源重组。
供体DNA上的同源性区域可与靶位点旁侧的任何序列具有同源性。虽然在一些实施方案中,同源性区域与紧邻靶位点旁侧的基因组序列共享显著的序列同源性,但应当认识到,同源性区域可被设计为与如下区域具有充分的同源性,该区域可进一步位于靶位点的5′或3′处。在另外的实施方案中,同源性区域还可与靶位点的片段连同下游基因组区域具有同源性。在一个实施方案中,第一同源性区域还包含靶位点的第一片段并且第二同源性区域包含靶位点的第二片段,其中第一片段和第二片段不相似。
如本文所用,“同源重组”是指两个DNA分子之间在同源性位点处的DNA片段交换。同源重组的频率受多个因素影响。不同的生物体在同源重组的量以及同源重组与非同源重组的相对比例方面不同。一般地讲,同源性区域的长度影响同源重组事件的频率,同源性区域越长,频率越高。为观察到同源重组而需要的同源性区域的长度也是随物种而异的。在许多情况下,至少5kb的同源性已被利用,但在少至25-50bp的同源性的情况下就已观察到同源重组。参见例如Singer等人,(1982)Cell 31:25-33;Shen和Huang,(1986)Genetics 112:441-57;Watt等人,(1985)Proc.Natl.Acad.Sci.USA 82:4768-72;Sugawara和Haber,(1992)Mol Cell Biol 12:563-75;Rubnitz和Subramani,(1984)Mol Cell Biol 4:2253-8;Ayares等人,(1986)Proc.Natl.Acad.Sci.USA 83:5199-203;Liskay等人,(1987)Genetics 115:161-7。
同源性介导的修复(HDR)是细胞内修复双链DNA断裂和单链DNA断裂的机制。同源性介导的修复包括同源重组(HR)和单链退火(SSA)(Lieber.2010 Annu.Rev.Biochem.79:181-211)。HDR的最常见形式称为同源重组(HR),其要求供体和受体DNA之间具有最长的序列同源性。HDR的其它形式包括单链退火(SSA)以及断裂诱导的复制,这些相对于HR需要较短的序列同源性。在切口(单链断裂)处同源性介导的修复可通过采用不同于在双链断裂处HDR的机制来进行(Davis和Maizels.PNAS(0027-8424),111(10),第E924-E932页)。
植物细胞的基因组改变,例如通过同源重组(HR)改变,是基因工程的强大工具。尽管高等植物中的同源重组频率低,但还是有植物内源基因同源重组的少数成功示例。植物中同源重组的参数已主要通过拯救(rescue)所引入的截短的选择性标记基因进行了研究。在这些实验中,同源DNA片段通常在0.3kb至2kb之间。观察到的同源重组频率大约为10-4至10-5。参见例如Halfter等人,(1992)Mol Gen Genet 231:186-93;Offringa等人,(1990)EMBO J 9:3077-84;Offringa等人,(1993)Proc.Natl.Acad.Sci.USA 90:7346-50;Paszkowski等人,(1988)EMBO J7:4021-6;Hourda和Paszkowski,(1994)Mol Gen Genet243:106-11;以及Risseeuw等人,(1995)Plant J 7:109-19。
同源重组在昆虫中已得到证明。Dray和Gloor在果蝇属中发现,少至3kb的总模板:靶标同源性就足够以适当的效率将大的非同源DNA区段拷贝到靶标中(Dray和Gloor,(1997)Genetics 147:689-99)。Golic等人采用在果蝇属中的靶标FRT处FLP介导的DNA整合,证实了当供体和靶标共享4.1kb的同源性时,与1.1kb的同源性时相比,整合效率为约10倍高(Golic等人,(1997)Nucleic Acids Res 25:3665)。来自果蝇属的数据表明,2-4kb的同源性对于有效靶向是充足的,但是存在一些证据证明低得多的同源性——约30bp至约100bp——可能就足够(Nassif和Engels,(1993)Proc.Natl.Acad.Sci.USA 90:1262-6;Keeler和Gloor,(1997)Mol.Cell Biol.17:627-34)。
也在其它生物体中实现了同源重组。例如,在寄生性原生动物利什曼原虫属中进行同源重组需要至少150-200bp的同源性(Papadopoulou和Dumas,(1997)Nucleic AcidsRes 25:4278-86)。在丝状真菌构巢曲霉(Aspergillus nidulans)中,用少至50bp旁侧同源性实现了基因替换(Chaveroche等人,(2000)Nucleic Acids Res 28:e97)。在纤毛虫嗜热四膜虫(Tetrahymena thermophila)中也证明了所靶向的基因替换(Gaertig等人,(1994)Nucleic Acids Res 22:5391-8)。在哺乳动物中,本领域已成功培养繁殖、转化、选择多能胚胎干细胞系(ES),再将其引入小鼠胚胎,从而在小鼠体内极其顺利地实现了同源重组。带有插入的转基因ES细胞的胚胎发育成遗传后代。通过将同胞小鼠进行杂种繁殖,可获得携带选择的基因的纯合小鼠。该方法的概述在以下文献中提供:Watson等人,(1992)Recombinant DNA,第2版,(Scientific American Books,WH Freeman&Co.出版);Capecchi,(1989)Trends Genet 5:70-6;以及Bronson,(1994)J Biol Chem 269:27155-8。由于缺乏能够移植到卵母细胞或发育的胚胎中的干细胞,在小鼠以外的哺乳动物中的同源重组曾是有限的。但是,McCreath等人,Nature 405:1066-9(2000)报道了通过在原代胚胎成纤维细胞中进行转化和选择而在绵羊中成功进行了同源重组。
一旦在DNA中诱导产生双链断裂,细胞的DNA修复机制就被激活以修复断裂。易错DNA修复机制可在双链断裂位点处产生突变。将断裂端连到一起的最常用修复机制是非同源末端连接(NHEJ)途径(Bleuyard等人,(2006)DNA Repair 5:1-12)。染色体的结构完整性通常通过修复来保持,但缺失、插入或其它重排都是可能的(Siebert和Puchta,(2002)Plant Cell 14:1121-31;Pacher等人,(2007)Genetics 175:21-9)。一个双链断裂的两个末端是NHEJ的最普遍的底物(Kirik等人,(2000)EMBO J19:5562-6),但是,如果发生两个不同的双链断裂,则来自不同断裂的游离末端可连接并导致染色体缺失(Sieberr和Puchta,(2002)Plant Cell 14:1121-31),或不同染色体之间的染色体易位(Pacher等人,(2007)Genetics 175:21-9)。
也可将附加型DNA分子连接到双链断裂中,例如将T-DNA整合到染色体双链断裂中(Chilton和Que,(2003)Plant Physiol 133:956-65;Salomon和Puchta,(1998)EMBO J 17:6086-95)。一旦双链断裂周围的序列被改变,例如被参与双链断裂成熟的外切核酸酶活性改变,如果同源序列可以,如非分裂的体细胞中的同源染色体,或者DNA复制后的姊妹染色单体(Molinier等人,(2004)Plant Cell 16:342-52),则基因转换途径可恢复初始结构。异位的和/或表成的DNA序列也可充当DNA修复模板用于同源重组(Puchta,(1999)Genetics152:1173-81)。
另选地,双链断裂可通过同源DNA序列之间的同源重组来修复。DNA双链断裂似乎是刺激同源重组途径的有效因子(Puchta等人,(1995)Plant Mol Biol 28:281-92;Tzfira和White,(2005)Trends Biotechnol 23:567-9;Puchta,(2005)J Exp Bot 56:1-14)。使用DNA断裂剂,在植物中人工构建的同源DNA重复序列之间观察到同源重组提高两倍至九倍(Puchta等人,(1995)Plant Mol Biol 28:281-92)。在玉米原生质体中,用线状DNA分子进行实验证明了质粒之间的同源重组增强(Lyznik等人,(1991)Mol Gen Genet 230:209-18)。
在一些实施方案中,本文中提供的方法包括使细胞与供体DNA和Cas内切核酸酶接触。一旦通过Cas内切核酸酶将双链断裂引入靶位点中,则供体DNA的第一同源性区域和第二同源性区域可经历与其相应的同源性基因组区域的同源重组,从而在供体和基因组之间进行DNA交换。
因此,所提供的方法使供体DNA的感兴趣的多核苷酸整合到细胞或生物体基因组的靶位点处的双链断裂中,从而改变原始靶位点并产生改变的基因组靶位点。
在本公开的一个实施方案中,方法包括用于将感兴趣的多核苷酸引入到细胞基因组的靶位点中的方法,该方法包括:a)向细胞引入向导多核苷酸、供体DNA和Cas内切核酸酶,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述靶位点处引入双链断裂;b)使(a)的细胞与包含感兴趣的多核苷酸的供体DNA接触;以及c)鉴定至少一个来自(b)的细胞,该细胞在其基因组中包含在所述靶位点处整合的感兴趣的多核苷酸。可通过本领域中已知的任何方式引入引导多核苷酸、Cas内切核酸酶和供体DNA。这些方式包括但不限于通过粒子轰击直接递送每种组分,通过一个或多个重组DNA表达盒递送,或它们的任意组合。
在本公开的一些实施方案中,该方法包括用于将感兴趣的多核苷酸引入到细胞基因组的靶位点中的方法,其中使用能够表达供体DNA和/或Cas内切核酸酶的至少一个重组DNA构建体将供体DNA和Cas内切核酸酶引入所述细胞;并且/或其中向导多核苷酸通过粒子轰击直接引入。
可通过本领域已知的任何方式引入供体DNA。例如,提供了细胞或生物体,诸如但不限于具有靶位点的植物或酵母。供体DNA可通过本领域中已知的任何转化方法来提供,所述转化方法包括例如农杆菌介导的转化或基因枪粒子轰击。供体DNA可瞬时地存在于细胞中或其可通过病毒复制子引入。在Cas内切核酸酶和靶位点的存在下,供体DNA被插入到转化的基因组中。
另一个方法采用对现有的归巢内切核酸酶进行蛋白质工程改造以改变它们的靶标特异性。归巢内切核酸酶,如I-SceI或I-CreI,能结合和裂解相对较长的DNA识别序列(分别为18bp和22bp)。这些序列据预测在基因组中很少天然发生,通常仅1或2个位点/基因组。归巢内切核酸酶的裂解特异性可通过合理设计在DNA结合域处的氨基酸置换和/或突变单体的组合装配和选择来改变(参见例如Arnould等人,(2006)J Mol Biol 355:443-58;Ashworth等人,(2006)Nature 441:656-9;Doyon等人,(2006)J Am Chem Soc 128:2477-84;Rosen等人,(2006)Nucleic Acids Res 34:4791-800;以及Smith等人,(2006)NucleicAcids Res 34:e149;Lyznik等人(2009)美国专利申请公布20090133152A1;Smith等人(2007)美国专利申请公布20070117128A1)。已证明了工程化大范围核酸酶能切割同族突变位点而不扩大它们的特异性。将对野生型酵母I-SceI归巢核酸酶具有特异性的人工识别位点引入玉米基因组,并且当转基因I-SceI通过杂交引入并且通过基因切除激活时,检测到在1%的被分析的F1植物中的识别序列的突变(Yang等人,(2009)Plant Mol Biol 70:669-79)。更具体地,使用基于I-CreI大范围核酸酶序列进行设计的工程化单链内切核酸酶靶向玉米无舌叶基因座(liguleless locus)。当设计的归巢核酸酶通过农杆菌介导转化未成熟胚芽来引入时,在3%的TO转基因植物中检测到选择的无舌叶基因座识别序列的突变(Gao等人,(2010)Plant J 61:176-87)。
感兴趣的多核苷酸在本文中进一步描述并且反映出作物开发参与者的商业市场和利益。感兴趣的作物和市场在变化,随着发展中国家开放了世界市场,也将出现新的作物和技术。另外,随着我们对农学性状和特性诸如收率和杂种优势的理解逐渐深入,对用于基因工程的基因的选择将相应地变化。
使用引导多核苷酸/Cas内切核酸酶系统进行的基因组编辑。
如本文所述,引导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸修饰模板结合使用,允许编辑感兴趣的基因组核苷酸序列。虽然存在许多双链断裂制造系统,但其实际应用于基因编辑可能由于所诱导的双链断裂(DSB)的频率相对较低而受限。迄今为止,许多基因组修饰方法依赖于同源重组系统。同源重组(HR)可提供用于找到感兴趣的基因组DNA序列并且根据实验规范修饰它们的分子方法。同源重组以低频率在植物体细胞中发生。该过程可通过在所选择的内切核酸酶靶位点处引入双链断裂(DSB)而增强到用于基因组工程化的实际水平。所面临的挑战是有效地在感兴趣的基因组位点处形成DSB,因为两个相互作用的DNA分子之间的信息传递的方向性存在偏差(断裂的分子充当遗传学信息的受体)。本文描述了向导多核苷酸/Cas系统的用途,即,提供灵活的基因组裂解特异性并且在DNA靶位点处产生高频率的双链断裂,从而实现在感兴趣的核苷酸序列中的高效基因编辑(基因修饰),其中待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别和裂解的靶位点之内或之外。
“修饰的核苷酸”或“编辑的核苷酸”是指在与其未修饰的核苷酸序列相比时包含至少一个改变的感兴趣的核苷酸序列。此类“改变”包括例如:(i)替换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或(iv)(i)-(iii)的任意组合。
本文公开了用于编辑感兴趣的核苷酸序列的方法和组合物,所述核苷酸序列诸如但不限于植物基因组中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列。
在本公开的一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种子对草甘膦具有抗性;以及b)产生不含所述向导RNA和Cas内切核酸酶的子代植物。
在一个实施方案中,组合物包含草甘膦抗性玉米植物,其中玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列并且其中玉米植物不表达草甘膦敏感性EPSPS多肽。
在一个实施方案中,组合物包含草甘膦抗性玉米植物细胞,其中玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列并且其中内源性EPSPS多核苷酸序列存在于与相应野生型对照相比相同的染色体位置。
术语“多核苷酸修饰模板”是指当与待编辑的核苷酸序列相比时包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可为至少一个核苷酸的置换、添加或缺失、或它们的任意组合。任选地,多核苷酸修饰模板还可包含至少一个核苷酸修饰旁侧的同源核苷酸序列,其中旁侧同源核苷酸序列向待编辑的所需核苷酸序列提供充分的同源性。
在一个实施方案中,本公开描述了一种用于编辑细胞的基因组中的核苷酸序列的方法,该方法包括向细胞提供向导多核苷酸、多核苷酸修饰模板和至少一种Cas内切核酸酶,其中所述Cas内切核酸酶在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。细胞包括但不限于动物、细菌、真菌、昆虫、酵母和植物细胞以及通过本文所述的方法制备的植物和种子。待编辑的核苷酸可位于由Cas内切核酸酶识别和裂解的靶位点之内或之外。在一个实施方案中,所述至少一个核苷酸修饰不是在由Cas内切核酸酶识别和裂解的靶位点处的修饰。在另一个实施方案中,待编辑的至少一个核苷酸与基因组靶位点之间存在至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、40、50、100、200、300、400、500、600、700、900或1000个核苷酸。
在一个实施方案中,本公开描述了一种用于编辑植物细胞的基因组中的核苷酸序列的方法,该方法包括向植物细胞提供向导RNA、多核苷酸修饰模板和至少一种玉米优化的Cas9内切核酸酶,其中所述玉米优化的Cas9内切核酸酶能够在所述植物基因组中的moCas9靶序列处提供双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。
在一个实施方案中,本公开描述了一种用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰。
在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含Cas内切核酸酶和EPSPS核苷酸序列的细胞中提供向导RNA和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞提供能够表达向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
在一些实施方案中,多核苷酸修饰模板(EPSPS多核苷酸修饰模板)可包括EPSPS基因的部分片段(并且因此其自身不编码全功能性的EPSPS多肽)。
在一个实施方案中,EPSPS多核苷酸修饰模板包含三个点突变,所述点突变造成T102I/P106S(TIPS)突变的形成。表达TIPS-EPSPS双突变转基因的转基因植物表现出草甘膦耐受性(Funke,T等人,J.Biol.Chem.2009,284:9854-9860)。如本文所定义,“草甘膦”是指N-膦酰甲基甘氨酸的任意除草有效形式(包括其任意盐),导致在植物中产生草甘膦阴离子的其它形式,以及膦酰甲基甘氨酸家族中的任意其它除草剂。
在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;d)选择表现出草甘膦抗性的子代植物。
在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及d)筛选不含所述向导RNA和Cas内切核酸酶的(c)的子代植物。
当表现出抗除草剂性增强的植物经受除草剂,并且与由适当的对照植物提供的剂量/响应曲线比较,其剂量/响应曲线向右偏移时,证明抗除草剂性增强。此类剂量/响应曲线具有绘制在x轴上的“剂量”和绘制在y轴上的“伤害率”、“除草效果”等等。
实质上抵抗除草剂的植物当经受农业界通常用来杀灭田地中杂草的浓度和比率的除草剂时,表现出很少的(如果有的话)脱色、枯斑、溶解性病变、失绿病斑或者其它病变并且不矮化、凋萎或者畸变。术语抗性和耐受性在本公开可互换地使用。
图4示出基因组编辑程序中所使用的组分的示意图。向植物细胞提供玉米优化的Cas内切核酸酶、向导RNA和多核苷酸修饰模板。例如,如图4所示,相比于待编辑的EPSPS基因组序列,该多核苷酸修饰模板包含三个核苷酸修饰(用箭头指出)。这三个核苷酸修饰导致以下氨基酸改变:T-102改变为I-102,P-106改变为S-106,所以被称为TIPS突变。第一点突变由密码子序列ACT中的C核苷酸被T核苷酸置换引起;第二点突变由相同密码子序列ACT中的T核苷酸被C核苷酸置换,形成异亮氨酸密码子ATC引起;第三点突变由密码子序列CCA中的第一个C核苷酸被T核苷酸置换,形成丝氨酸密码子TCA引起(图4)。
待编辑的核苷酸序列可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的序列。例如,细胞的基因组中的核苷酸序列可为稳定地掺入到细胞基因组中的天然基因、突变基因、非天然基因、外来基因、或转基因。编辑此类核苷酸可得到另外的所需表型或基因型。
使用向导多核苷酸/Cas内切核酸酶系统的调控序列修饰
在一个实施方案中,待修饰的核苷酸序列可为调控序列,诸如启动子,其中编辑启动子包括将启动子或启动子片段替换(也称为“启动子交换”或“启动子替换”)为不同的启动子(也称为替换启动子)或启动子片段(也称为替换启动子片段),其中启动子替换导致以下情况中的任一种或以下情况的任一组合:提高的启动子活性、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、同一细胞层或其他细胞层中基因表达的时机或发育进度的修饰(诸如但不限于延长玉米花药的绒毡层中基因表达的时机(1998年11月17日公布的US 5,837,850))、DNA结合元件的突变和/或DNA结合元件的缺失或添加。待修饰的启动子(或启动子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子片段)。替换启动子(或替换启动子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子片段)。
在一个实施方案中,待修饰的核苷酸序列可为启动子,其中编辑启动子包括将天然EPSPS1启动子替换为植物泛素启动子。
在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸修饰模板或供体DNA序列结合使用以允许将启动子或启动子元件插入到感兴趣的基因组核苷酸序列中,其中启动子插入(或启动子元件插入)导致以下情况中的任一种或以下情况的任一组合:提高的启动子活性(提高的启动子强度)、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、基因表达的时机或发育进度的修饰、DNA结合元件的突变和/或DNA结合元件的添加。待插入的启动子元件可为但不限于启动子核心元件(诸如但不限于CAAT盒、CCAAT盒、普里布诺盒和/或TATA盒)、用于诱导型表达的翻译调控序列和/或阻遏子系统(诸如TET操纵子阻遏子/操纵子/诱导物元件、或磺酰脲类(Su)阻遏子/操纵子/诱导物元件)。脱水响应元件(DRE)首先被识别为干旱响应基因rd29A的启动子中的顺式作用启动子元件,其包含9bp保守核心序列,TACCGACAT(Yamaguchi-Shinozaki,K.,和Shinozaki,K.(1994)Plant Cell 6,251-264)。将DRE插入到内源启动子中可赋予下游基因干旱诱导型表达。另一个示例是ABA响应元件(ABRE),其包含据发现存在于许多ABA和/或胁迫调控的基因中的(C/T)ACGTGGC共有序列(Busk P.K.,Pages M.(1998)Plant Mol.Biol.37:425-435)。将35S增强子或MMV增强子插入到内源启动子区中将提高基因表达(美国专利5196525)。待插入的启动子(或启动子元件)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子元件)。
在一个实施方案中,待修饰的核苷酸序列可为启动子,其中启动子的编辑包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统复制天然EPSPS1启动子。
在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于允许启动子或启动子元件的缺失,其中启动子缺失(或启动子元件缺失)导致以下情况中的任一种或以下情况的任一组合:永久失活的基因座、提高的启动子活性(提高的启动子强度)、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、基因表达的时机或发育进度的修饰、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的启动子元件可以是,但不限于启动子核心元件、启动子增强子元件或35S增强子元件。待缺失的启动子或启动子片段对于正在编辑的细胞可为内源、人工、预先存在、或转基因的。
使用向导多核苷酸/Cas内切核酸酶系统的终止子修饰
在一个实施方案中,待修饰的核苷酸序列可为终止子,其中编辑终止子包括将终止子或终止子片段替换(也称为“终止子交换”或“终止子替换”)为不同的终止子(也称为替换终止子)或终止子片段(也称为替换终止子片段),其中终止子替换导致以下情况中的任一种或以下情况的任一组合:增加的终止子活性、增加的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的缺失或添加。待修饰的终止子(或终止子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的终止子(或终止子片段)。替换终止子(或替换终止子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的终止子(或终止子片段)。
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸修饰模板或供体DNA序列组合使用以允许将终止子或终止子元件插入到感兴趣的基因组核苷酸序列中,其中终止子插入(或终止子元件插入)导致以下情况中的任一种或以下情况的任一组合:增加的终止子活性(增加的终止子强度)、增加的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的添加。
待插入的终止子(或终止子元件)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的终止子(或终止子元件)。
在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于允许终止子或终止子元件的缺失,其中终止子缺失(或终止子元件缺失)导致以下情况中的任一种或以下情况的任一组合:提高的终止子活性(提高的终止子强度)、提高的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的终止子或终止子片段对于正在编辑的细胞可为内源、人工、预先存在、或转基因的。
使用向导多核苷酸/Cas内切核酸酶系统的另外的调控序列修饰
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于修饰或替换细胞的基因组中的调控序列。调控序列为能够增加或降低生物体内特定基因的表达并且/或者能够改变生物体内基因的组织特异性表达的核酸分子的区段。调控序列的示例包括但不限于3’UTR(非翻译区)区、5’UTR区、转录激活因子、转录增强子、转录阻遏子、翻译阻遏子、剪接因子、miRNA、siRNA、人工miRNA、启动子元件、CAMV 35 S增强子、MMV增强子元件(2013年3月11日提交的PCT/US14/23451)、SECIS元件、聚腺苷酸化信号,以及聚泛素化位点。在一些实施方案中,编辑(修饰)或替换调控元件导致改变的蛋白质翻译、RNA切割、RNA剪接、转录终止或翻译后修饰。在一个实施方案中,可鉴定启动子内的调控元件并且可编辑或修饰这些调控元件,从而优化这些调控元件对启动子的上调或下调。
在一个实施方案中,待修饰的感兴趣的基因组序列是聚泛素化位点,其中聚泛素化位点的修饰导致蛋白质降解速度的修饰。泛素标签使蛋白质通过蛋白酶体或自体吞噬降解。已知蛋白酶体抑制剂导致蛋白质生产过剩。对编码感兴趣的蛋白质的DNA序列的修饰可产生感兴趣的蛋白质的至少一种氨基酸修饰,其中所述修饰允许蛋白质的聚泛素化(翻译后修饰),从而导致对蛋白质降解的修饰。
在一个实施方案中,待修饰的感兴趣的基因组序列为玉米EPSPS基因上的聚泛素化位点,其中聚泛素化位点使用本文所述的向导多核苷酸/Cas内切核酸酶系统修饰,由于EPSPS蛋白质降解速度减慢,所以蛋白质含量增加。
在一个实施方案中,待修饰的感兴趣的基因组序列为内含子位点,其中该修饰包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统将内含子增强基序插入到内含子中,这引起对包含所述内含子的基因的转录活性的调节。
在一个实施方案中,待修饰的感兴趣的基因组序列为内含子位点,其中该修饰包括将大豆EPSP1内含子替换为大豆泛素内含子1,如本文所述。
使用向导多核苷酸/Cas内切核酸酶系统修饰剪接位点和/或引入替代剪接位点
蛋白质合成使用由前mRNA分子经受成熟过程产生的mRNA分子。通过添加多A尾对前mRNA分子进行加帽、剪接和稳定化。真核细胞进化出复杂的剪接过程,该过程产生原始前mRNA分子的备选变体。真核细胞中的一些可能不产生用于蛋白质合成的功能模板。在玉米细胞中,剪接过程受外显子-内含子连接位点处的剪接位点影响。典型的剪接位点的示例是AGGT。基因编码序列可包含多个替代剪接位点,其可影响前mRNA成熟过程的总体效率,因而可限制细胞中的蛋白质积累。向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸修饰模板组合使用来编辑感兴趣的基因,以便在所述连接区或剪接位点的任意变型处引入典型的剪接位点,所述剪接位点改变前mRNA分子的剪接模式。
在一个实施方案中,待修饰的感兴趣的核苷酸序列为玉米EPSPS基因,其中基因的修饰包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统修饰可选的剪接位点,从而提高功能基因转录物和基因产物(蛋白质)的产量。
在一个实施方案中,待修饰的感兴趣的核苷酸序列为基因,其中基因的修饰包括编辑可选地剪接的基因的内含子边界以改变剪接变体的积累。
使用向导多核苷酸/Cas内切核酸酶系统修饰编码感兴趣的蛋白质的核苷酸序列
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于修饰或替换细胞的基因组中的编码序列,其中修饰或替换导致以下情况中的任一种或以下情况的任一组合:增加的蛋白质(酶)活性、增加的蛋白质功能性、降低的蛋白质活性、降低的蛋白质功能性、位点特异性突变、蛋白质域交换、蛋白质敲除、新的蛋白质功能性、修饰的蛋白质功能性。
在一个实施方案中,蛋白质敲除是由于将终止密码子引入到感兴趣的编码序列中造成的。
在一个实施方案中,蛋白质敲除是由于感兴趣的编码序列中的起始密码子的缺失造成的。
使用向导多核苷酸/Cas内切核酸酶系统的氨基酸和/或蛋白质融合
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸序列一起使用或不一起使用以将编码第一蛋白质的第一编码序列融合到编码细胞基因组中的第二蛋白质的第二编码序列,其中蛋白质融合导致以下情况中的任一种或以下情况的任一组合:提高的蛋白质(酶)活性、提高的蛋白质功能性、降低的蛋白质活性、降低的蛋白质功能性、新的蛋白质功能性、修饰的蛋白质功能性、新的蛋白质定位、新的蛋白质表达时机、修饰的蛋白质表达模式、嵌合蛋白质,或具有显性表型功能性的修饰蛋白质。
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸序列一起使用或不一起使用以将编码叶绿体定位信号(例如,叶绿体转运肽)的第一编码序列融合到编码感兴趣的蛋白质的第二编码序列,其中蛋白质融合导致将感兴趣的蛋白质靶向到叶绿体。
在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸序列一起使用或不一起使用以将第一编码序列融合到第二编码序列,其中蛋白质融合产生具有显性表型功能性的修饰蛋白质。
本文公开了用于编辑感兴趣的核苷酸序列的方法和组合物,所述核苷酸序列诸如但不限于植物基因组中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列。本文描述了用于产生突变EPSPS基因和/或烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞或植物的方法并且可包括编辑EPSPS密码子区域、产生变体植物EPSPS、复制天然EPSPS基因、调控序列修饰、编辑EPSPS基因聚泛素化位点、编辑内含子元件、编辑剪接位点、终止子修饰、另外的调控序列修饰、剪接位点的修饰和/或引入替代剪接位点、编码感兴趣的蛋白质的核苷酸序列的修饰、如本文所述的氨基酸和/或蛋白质融合、或它们的任一组合。例如,可组合EPSPS基因的基因修饰(通过本文所述的方法,诸如但不限于EPSPS密码子区域的编辑、剪接位点的编辑或修饰等),同时修饰驱动EPSPS基因的启动子。
用于识别在其基因组中在所述靶位点处包含整合的感兴趣的多核苷酸的至少一 个植物细胞的方法
还提供了用于鉴定在其基因组中包含在所述靶位点处整合的感兴趣的多核苷酸的至少一个植物细胞的方法。有多种方法可用于鉴定在靶位点处或附近具有对基因组的插入的那些植物细胞,而无须使用可筛选的标记表型。这种方法可认为是直接分析靶序列以检测靶序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、Southern印迹法以及它们的任意组合。参见例如,美国专利申请12/147,834以本文所述方法所需的程度以引用方式并入本文中。
该方法还包括由包含整合到其基因组中的感兴趣的多核苷酸的植物细胞再生植物。该植物可为不育的或能育的。已经认识到任何感兴趣的多核苷酸均可在靶位点处提供、整合到植物基因组中,并且在植物中表达。
感兴趣的多核苷酸/多肽包括但不限于抗除草剂性编码序列、杀虫编码序列、杀线虫编码序列、抗微生物编码序列、抗真菌编码序列、抗病毒编码序列、非生物和生物胁迫耐受性编码序列、或修饰植物性状诸如收率、谷粒质量、营养成分、淀粉质量和数量、固氮和/或氮利用、以及含油量和/或油组成的序列。更具体的感兴趣的多核苷酸包括但不限于改善作物收率的基因,改善作物合意性的多肽,编码赋予对非生物胁迫(诸如干旱、氮、温度、盐度、有毒金属或微量元素)的抗性的蛋白或者赋予对毒素(诸如杀虫剂和除草剂)的抗性的那些蛋白或者赋予对生物胁迫(诸如真菌、病毒、细菌、昆虫和线虫入侵)的抗性及对与这些生物体相关联疾病的发展的抗性的那些蛋白的基因。感兴趣的基因的大体类别包括例如涉及信息的那些基因(诸如锌指)、涉及通信的那些基因(诸如激酶)和涉及持家的那些基因(诸如热激蛋白)。转基因的更具体类别例如包括编码对农艺学、昆虫抗性、病害抗性、除草剂抗性、能育性或不育性、谷粒特性和商业产品重要的性状的基因。一般而言,感兴趣的基因包括涉及油、淀粉、碳水化合物或营养物质代谢的那些以及影响籽粒大小、蔗糖载量等的那些,所述性状可与本文所述的草甘膦抗性堆叠或者组合使用。
除了使用传统的育种方法外,还可通过遗传方式改变农学上重要的性状,诸如油含量、淀粉含量和蛋白质含量。修饰包括增加油酸、饱和油与不饱和脂的含量,提升赖氨酸和硫的水平,提供必需氨基酸,以及修饰淀粉。美国专利5,703,049、5,885,801、5,885,802和5,990,389描述了大麦硫堇(Hordothionin)蛋白质修饰法,这些专利都以引用方式并入本文。另一个示例是美国专利5,850,016中所述的由大豆2S白蛋白基因编码的富含赖氨酸和/或富含硫的种子蛋白,以及Williamson等人(1987)Eur.J.Biochem.165:99-106中描述的来自大麦的胰凝乳蛋白酶抑制剂,这些文献的公开内容都以引用方式并入本文。
商业性状也能被编码在感兴趣的多核苷酸上,其能够增加例如,用于乙醇生产的淀粉,或提供蛋白的表达。转化的植物的另一个重要商业用途是生产聚合物和生物塑料诸如美国专利5,602,321中所述。基因诸如β-酮硫酶、PHBase(聚羟基丁酸酯合酶)、以及乙酰乙酰辅酶A还原酶(参见Schubert等人(1988)J.Bacteriol.170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达。
可通过定点诱变产生编码序列的衍生物,以增加预选氨基酸在所编码的多肽中的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因源自大麦胰凝乳蛋白酶抑制剂(1996年11月1日提交的美国申请序列号08/740,682,以及WO 98/20133,这些专利的公开内容以引用方式并入本文)。其它蛋白包括富含甲硫氨酸的植物蛋白,诸如来自向日葵种子的蛋白(Lilley等人(1989)Proceedings of the World Congress on Vegetable ProteinUtilization in Human Foods and Animal Feedstuffs,Applewhite编辑(American OilChemists Society,Champaign,Illinois),第497-502页);将该文献以引用方式并入本文);来自玉米的蛋白(Pedersen等人(1986)J.Biol.Chem.261:6279);Kirihara等人(1988)Gene 71:359;这些文献都以引用方式并入本文);以及来自稻的蛋白(Musumura等人(1989)Plant Mol.Biol.12:123,该文献以引用方式并入本文)。其它农学上重要的基因编码胶乳、Floury 2、生长因子、种子贮藏因子和转录因子。
改善作物收率的多核苷酸包括矮化基因,诸如Rht1和Rht2(Peng等人(1999)Nature 400:256-261),以及增加植物生长的那些,诸如铵诱导型谷氨酸脱氢酶。改善作物合意性的多核苷酸包括例如允许植物具有减少的饱和脂肪含量的那些多核苷酸、提高植物营养价值的那些多核苷酸、以及增加谷粒蛋白的那些多核苷酸。改善耐盐性的多核苷酸是增加或允许植物在与已引入耐盐基因的该植物的天然环境相比更高盐度的环境中生长的那些多核苷酸。
影响氨基酸生物合成的多核苷酸/多肽包括例如邻氨基苯甲酸盐合酶(AS;EC4.1.3.27),该酶催化植物、真菌和细菌中从芳族氨基酸途径分支到色氨酸生物合成的第一反应。在植物中,色氨酸的生物合成的化学过程是区室化于叶绿体中的。参见例如美国公布20080050506。另外的感兴趣的序列包括分支酸丙酮酸裂解酶(CPL),其是指编码催化分支酸转化为丙酮酸和pHBA的酶的基因。表征最充分的CPL基因已从大肠杆菌中分离并具有GenBank登录号M96268。参见美国专利7,361,811,将其以引用的方式并入本文。
这些感兴趣的多核苷酸序列可编码涉及提供病害或害虫抗性的蛋白。所谓“病害抗性”或“害虫抗性”意指植物避开作为植物-病原体相互作用的后果的有害症状。害虫抗性基因可编码对严重导致收率下降的害虫诸如根虫、切根虫、欧洲玉米螟等的抗性。病害抗性基因和昆虫抗性基因,诸如用于抗细菌保护的溶菌酶或天蚕抗菌肽(cecropin),或者用于抗真菌保护的蛋白质诸如防御素、葡聚糖酶或几丁质酶,或者用于防治线虫或昆虫的苏云金芽孢杆菌(Bacillus thuringiensis)内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶,都是可用的基因产物的示例。编码病害抗性性状的基因包括解毒基因,诸如抗伏马毒素(美国专利5,792,931);无毒性(avr)和病害抗性(R)基因(Jones等人(1994)Science 266:789;Martin等人(1993)Science 262:1432;和Mindrinos等人(1994)Cell 78:1089);等等。害虫抗性基因可编码对严重导致收率下降的害虫诸如根虫、切根虫、欧洲玉米螟等的抗性。这种基因包括例如苏云金芽孢杆菌毒蛋白基因(美国专利5,366,892、5,747,450、5,736,514、5,723,756、5,593,881;和Geiser等人(1986)Gene 48:109);等等。
“抗除草剂性蛋白”或由“抗除草剂性编码核酸分子”表达生成的蛋白质包括这样的蛋白质,其赋予细胞与未表达该蛋白质的细胞相比耐受更高浓度除草剂的能力,或赋予细胞与未表达该蛋白质的细胞相比对某种浓度除草剂耐受更长时间的能力。抗除草剂性性状可通过如下基因引入到植物中:编码对乙酰乳酸合酶(ALS)起到抑制作用的除草剂(特别是磺酰脲类除草剂)的抗性的基因、编码对谷氨酰胺合酶起到抑制作用的除草剂诸如草胺膦或者basta的抗性的基因(如,bar基因)、对草甘膦的抗性的基因(如,EPSP合酶基因和GAT基因)、对HPPD抑制剂的抗性的基因(如,HPPD基因)或者本领域已知的其它此类基因。参见例如美国专利7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970、6,867,293和美国临时申请61/401,456,将所述专利中的每个以引用的方式并入本文。bar基因编码对除草剂basta的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性,并且ALS基因突变体编码对除草剂氯磺隆的抗性。
不育基因也可编码在表达盒中,并且为物理去雄提供备选方案。以此类方式使用的基因的示例包括雄性育性基因,诸如MS26(参见例如美国专利7,098,388、7,517,975、7,612,251)、MS45(参见例如美国专利5,478,369、6,265,640)或MSCA1(参见例如美国专利7,919,676)。玉米植物(玉米(Zea mays L.))可通过自花授粉和异花授粉两种技术来进行育种。在同一植株上,玉米具有位于雄穗上的雄花,以及位于雌穗上的雌花。其可自花授粉(“自交”)或异花授粉。当风将花粉从雄穗吹至从初始雌穗顶部突出的穗丝时在玉米中发生天然的授粉。授粉可通过本领域的技术人员已知的技术容易地控制。玉米杂交体的开发需要纯合近交系的开发、这些近交系的杂交和杂交的评估。谱系选择和轮回选择是用于从群体开发近交系的两种育种方法。育种程序将来自两种或更多种近交系或各种广泛来源的所需性状结合到育种库中,从育种库中通过自交并选择所需表型来开发新的近交系。杂交玉米品种是两个此类近交系的杂交,所述近交系中的每个可能具有一种或多种在另一近交系中缺乏的所需特性,或补充另一近交系的所需特性。使新的近交系与其它近交系杂交,并且对来自这些杂交的杂交体进行评估以确定哪些具有商业潜力。第一代杂交子代称为F1。F1杂交体比其自交亲本更有活力。该杂交体活力或者杂种优势可以多种方式体现,包括增加的营养生长和提高的收率。
杂交玉米种子可通过结合了人工去雄的雄性不育系统产生。为了产生杂交种子,将雄穗从生长的雌性近交亲本移除,其可以与雄性近交亲本成交替行的多种模式种植。因此,在与外来玉米花粉的来源充分隔离的前提条件下,磁性近交株的雌穗将仅通过来自雄性近交株的花粉受精。因此所得种子是杂交体(F1)并且将形成杂交植物。
影响植物发育的田地变化可导致植物在雌性亲本的人工去雄完成之后抽穗。或者,雌性近交植物雄穗可能无法在去雄过程期间被完全移除。在任何情况下,结果是雌性植物将成功地散出花粉并且一些雌性植物将自花授粉。这将导致雌性近交株的种子连同正常产生的杂交种子一起收获。雌性近交株种子不表现出杂种优势并且因此不如F1种子高产。此外,雌性近交株种子的存在对于生产杂交体的公司可能意味着种质安全风险。
另选地,雌性近交株可通过机器机械地去雄。机械去雄大致如手工去雄一样可靠,但是更快并且成本更低。然而,大多数去雄机器比手工去雄对植物产生更多损害。因此,目前没有一种去雄形式是完全令人满意的,并且仍然需要进一步降低生产成本的替代品以及消除杂交种子生产中雌性亲本的自花授粉。
造成植物中雄性不育的突变有潜力可用于作物植物(诸如玉米)的杂交种子生产的方法中,并且可通过以下方式来降低生产成本:消除耗费劳力地从用作杂交亲本的母本植物移除雄花(也称为去雄)的需要。已有多种方法可产生造成玉米中雄性不育的突变,诸如X射线或紫外线照射、化学处理或转座元件插入(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am J Bot 87:1193-1201)。通过能育性/不育性“分子开关”对能育性基因进行条件调控可增强设计用于作物改良的新雄性不育性系统的选择性(Unger等人(2002)Transgenic Res 11:455-465)。
此外,已经认识到感兴趣的多核苷酸可还包含与所靶向的感兴趣的基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与对应的mRNA杂交。可对反义序列作出修饰,只要该序列能杂交对应的mRNA并干扰其表达。以此方式,可使用与对应的反义序列具有70%、80%或85%序列同一性的反义构建体。此外,反义核苷酸的部分可用来破坏靶基因的表达。一般而言,可使用至少50个核苷酸、100个核苷酸、200个核苷酸或更多个核苷酸的序列。
另外,感兴趣的多核苷酸还可以有义取向使用来抑制植物中的内源基因的表达。用有义取向的多核苷酸抑制植物中的基因表达的方法是本领域已知的。该方法通常涉及用包含这样的启动子的DNA构建体转化植物,该启动子可操作地连接至对应于该内源基因的转录物的核苷酸序列的至少一部分,能驱动在植物中的表达。通常,这种核苷酸序列与内源基因的转录物的序列具有实质的序列同一性,通常高于约65%的序列同一性、约85%的序列同一性或高于约95%的序列同一性。参见美国专利5,283,184和5,034,323;将这些专利以引用方式并入本文。
感兴趣的多核苷酸还可以是表型标记。表型标记是可筛选或可选择的标记,其包括可视标记和选择性标记,无论它是阳性还是阴性选择性标记。可使用任何表型标记。具体地,可选择的或可筛选的标记包含这样的DNA区段,该DNA区段使得可以常常在特定条件下鉴定或选取或者不选取含有它的分子或细胞。这些标记可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可为RNA、肽、蛋白质、无机和有机化合物或组合物等提供结合位点。
选择性标记的示例包括但不限于包含限制性酶位点的DNA区段;编码提供对于有毒化合物的抗性的产物的DNA区段,所述有毒化合物包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外缺乏受体细胞的产物的DNA区段(例如,tRNA基因、营养缺陷标记);编码可易于鉴定的产物的DNA区段(例如,表型标记,诸如β-半乳糖苷酶、GUS;荧光蛋白,诸如绿色荧光蛋白(GFP),青色荧光蛋白(CFP),黄色荧光蛋白(YFP),红色荧光蛋白(RFP),以及细胞表面蛋白);产生用于PCR的新引物位点(例如,之前尚未并置的两个DNA序列的并置)的DNA区段;包含未受限制性内切核酸酶或其他DNA修饰酶、化学品等作用或受其作用的DNA序列的DNA区段;以及包含特异性修饰(例如,甲基化)所需的DNA序列的DNA区段,该特异性修饰使得可以鉴别该DNA序列。
另外的选择性标记包括能赋予对除草化合物如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)的抗性的基因。参见例如Yarranton,(1992)Curr Opin Biotech 3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA 89:6314-8;Yao等人,(1992)Cell 71:63-72;Reznikoff,(1992)Mol Microbiol 6:2419-22;Hu等人,(1987)Cell48:555-66;Brown等人,(1987)Cell 49:603-12;Figge等人,(1988)Cell 52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA 86:2549-53;Deuschle等人,(1990)Science 248:480-3;Gossen,(1993)Ph.D.Thesis,University of Heidelberg;Reines等人,(1993)Proc.Natl.Acad.Sci.USA 90:1917-21;Labow等人,(1990)Mol Cell Biol 10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA 89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA 88:5072-6;Wyborski等人,(1991)Nucleic Acids Res 19:4647-53;Hillen和Wissman,(1989)Topics Mol Struc Biol 10:143-62;Degenkolb等人,(1991)Antimicrob Agents Chemother 35:1591-5;Kleinschnidt等人,(1988)Biochemistry 27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg;Gossen等人,(1992)Proc.Natl.Acad.Sci.USA 89:5547-51;Oliva等人,(1992)AntimicrobAgents Chemother 36:913-9;Hlavka等人,(1985)Handbook of ExperimentalPharmacology,第78卷(Springer-Verlag,Berlin);Gill等人,(1988)Nature 334:721-4。也可以在一种或多种基因上编码商业性状,所述基因可提高例如用于乙醇生产的淀粉,或提供蛋白质表达。转化的植物的另一个重要商业用途是生产聚合物和生物塑料诸如美国专利5,602,321中所述。基因诸如β-酮硫酶、PHBase(聚羟基丁酸酯合酶)、以及乙酰乙酰辅酶A还原酶(参见Schubert等人(1988)J.Bacteriol.170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达。
外源产物包括植物酶和植物产物,以及来自包括原核生物和其他真核生物在内的其他来源的那些产物。这类产物包括酶、辅因子、激素等。可增加蛋白质的水平,特别是具有能够提高植物营养价值的改善氨基酸分布的经修饰蛋白质的水平。这可通过表达具有提高的氨基酸含量的这类蛋白质来实现。
感兴趣的转基因、重组DNA分子、DNA序列以及感兴趣的多核苷酸可包含一个或者多个用于基因沉默的DNA序列。涉及在植物中表达DNA序列的基因沉默方法是本领域已知的,包括但不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默以及微RNA(miRNA)干扰。
如本文所用,“核酸”是指多核苷酸,并且包括脱氧核糖核苷酸或者核糖核苷酸碱基的单链或者双链聚合物。核酸也可包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用,表示单链或者双链的RNA和/或DNA聚合物,其任选含有合成的、非天然的或者改变的核苷酸碱基。核苷酸(通常以它们的5′单磷酸形式存在)通过它们的单字母命名指代如下:“A”指代腺苷或脱氧腺苷(分别对于RNA或者DNA),“C”指代胞嘧啶或脱氧胞嘧啶,“G”指代鸟苷或脱氧鸟苷,“U”指代尿苷,“T”指代脱氧胸苷,“R”指代嘌呤(A或G),“Y”指代嘧啶(C或T),“K”指代G或T,“H”指代A或C或T,“I”指代肌苷,并且“N”指代任何核苷酸。
“开放阅读框”缩写为ORF。
术语“功能上等同的亚片段”和“功能等同亚片段”在本文中可互换使用。这些术语指代分离的核酸片段的这样的部分或者亚序列,其中改变基因表达或者产生某种表型的能力得到保持,无论该片段或者亚序列是否编码活性酶。例如,该片段或亚片段可用于设计基因以在转化的植物中产生所需的表型。可通过将核酸片段或其亚片段——无论其是否编码活性酶——相对于植物启动子序列以有义或反义方向进行连接,来设计基因用于抑制。
术语“保守域”或“基元”是指在进化上相关的蛋白质的经比对的序列上特定位置处保守的一组氨基酸。虽然其他位置处的氨基酸在同源蛋白质之间可变,但在特定位置处高度保守的氨基酸表示对于蛋白质的结构、稳定性或活性而言必需的氨基酸。由于它们在蛋白质同源物家族的经比对的序列中的高保守度而被鉴定,它们可用作鉴定物或者“识别标志(signature)”,以测定具有新确定的序列的蛋白质是否属于之前鉴定的蛋白质家族。
多核苷酸和多肽序列、其变体以及这些序列的结构关系,可用术语“同源性”、“同源的”、“实质上相同的”、“实质上相似的”和“实质上对应”描述,这些术语在本文中可互换使用。这些是指多肽或者核酸片段,其中一个或者多个氨基酸或者核苷酸碱基的变化不影响分子的功能,诸如介导基因表达或者产生某种表型的能力。这些术语还指代核酸片段的这样的修饰,相对于初始的未修饰的片段,所述修饰不实质上改变所得的核酸片段的功能性质。这些修饰包括在核酸片段中缺失、置换和/或插入一个或多个核苷酸。
所涵盖的实质上相似的核酸序列,可通过其与本文所例示的序列杂交,或与本文所公开的且与任何本文所公开的核酸序列在功能上等同的核苷酸序列的任何部分杂交(在中等严格条件下,例如0.5X SSC,0.1%SDS,60℃)的能力来定义。可调整严格条件以筛选中等相似片段,诸如来自远缘生物的同源序列,以及高度相似片段,诸如来自近缘生物的复制功能酶的基因。杂交后的洗涤决定了严格条件。
术语“选择性杂交”包括指代在严格杂交条件下核酸序列与指定的核酸靶序列杂交的程度相比于其与非靶核酸序列杂交的程度具有更高的可检测程度(例如,至少2倍于背景),并且实质上排除非靶核酸。选择性杂交的序列通常相互具有约至少80%的序列同一性,或者90%的序列同一性,最多至100%并包括100%的序列同一性(即完全互补)。
术语“严格条件”或“严格杂交条件”包括指代在体外杂交测定中探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的,并且在不同的情况中将会不同。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。另选地,可以调整严格条件以允许序列中的一些错配,从而检测到较低程度的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,任选地长度少于500个核苷酸。
通常,严格条件将为其中盐浓度低于约1.5M钠离子,通常为约0.01M至1.0M钠离子浓度(或者其它盐),pH为7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度为至少约30℃,对长探针(例如大于50个核苷酸)而言温度为至少约60℃的那些条件。严格条件还可以通过添加去稳定剂诸如甲酰胺来实现。示例性的低严格条件包括用30%-35%甲酰胺、1MNaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃下杂交并在1X至2X SSC(20X SSC=3.0MNaC1/0.3M柠檬酸三钠)中在50-55℃下洗涤。示例性的中等严格条件包括在40%-45%甲酰胺、1.0M NaCl、1%SDS中在37℃下杂交并在0.5X至1X SSC中在55-60℃下洗涤。示例性的高严格条件包括在50%甲酰胺、1M NaCl、1%SDS中在37℃下杂交并在0.1X SSC中在60-65℃下洗涤。
在核酸或多肽序列的情形中,“序列同一性”或“同一性”是指在指定的比较窗范围为获得最大对应而比对时两条序列中相同的核酸碱基或氨基酸残基。
术语“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的数值,其中多核苷酸或者多肽序列在比较窗口中的部分与参考序列(不包含添加或缺失)相比包含添加或缺失(即空位),以用于两个序列的最佳比对。通过以下方式计算这种百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分数。序列同一性百分比的可用示例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或者95%,或者50%至100%的任何整数百分数。这些同一性可用本文描述的任何程序确定。
序列比对和百分比同一性或者相似性计算可用多种被设计用于检测同源序列的比较方法来确定,包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM程序。在本申请的上下文中,应理解,在使用序列分析软件进行分析的情况中,除非另有指明,否则分析的结果将基于所提到的程序的“默认值”。如本文所用,“默认值”将意指软件第一次初始化时原始装载在该软件中的任何数值或者参数组。
“Clustal V比对方法”对应于标记为Clustal V的比对方法(通过以下文献描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci 8:189-191)并且可见于LASERGENE生物信息学计算软件包的MegAlignTM程序(DNASTAR Inc.,Madison,WI)。对于多重比对,默认值对应于GAP PENALTY=10,以及GAP LENGTH PENALTY=10。使用Clustal方法进行蛋白质序列的逐对比对和百分比同一性计算的默认参数是KTUPLE=1,GAP PENALTY=3,WINDOW=5,以及DIAGONALS SAVED=5。对于核酸,这些参数是KTUPLE=2,GAP PENALTY=5,WINDOW=4,以及DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。
“Clustal W比对方法”对应于标记为Clustal W的比对方法(通过以下文献描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci 8:189-191)并且可见于LASERGENE生物信息学计算软件包的MegAlignTM v6.1程序(DNASTARInc.,Madison,WI)。用于多重比对的默认参数(GAP PENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein WeightMatrix=Gonnet系列、以及DNA Weight Matrix=IUB)。在用Clustal W程序进行序列比对后,可以通过观察同一程序中的“序列距离”表来获得“百分比同一性”。
除非另作说明,否则本文提供的序列同一性/相似性值指使用GAP版本10(GCG,Accelrys,San Diego,CA)用以下参数获得的值:使用空位形成罚分权重50和空位长度延伸罚分权重3以及nwsgapdna.cmp计分矩阵获得的核苷酸序列的同一性%和相似性%;使用空位形成罚分权重8和空位长度延伸罚分2以及BLOSUM62计分矩阵获得的氨基酸序列的同一性%和相似性%(Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA89:10915)。GAP利用Needleman和Wunsch,(1970)J Mol Biol 48:443-53的算法来寻找两个完整序列的比对,该比对使匹配数最大而使空位数最小。GAP考虑所有可能的比对和空位位置,并使用以匹配碱基为单位的空位形生罚分和空位延伸罚分产生出具有最大数目的匹配碱基和最少的空位的比对。
“BLAST”是美国国家生物技术信息中心(NCBI)提供的用于寻找生物序列之间的相似性区域的搜索算法。该程序将核苷酸或蛋白质序列与序列数据库比较,并计算各匹配的统计学显著性以鉴定出与查询序列具有足够的相似性的序列,使得相似性不会被预测为随机发生。BLAST报告所鉴定的序列以及它们与查询序列的局部比对。
本领域的技术人员熟知,许多序列同一性水平可用于鉴定来自其它物种的或者经天然修饰或合成来源的多肽,其中这种多肽具有相同或相似的功能或活性。同一性百分比的可用示例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或者95%,或者50%至100%的任何整数百分数。实际上,50%至100%的任何整数氨基酸同一性可用于描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
“基因”是指通常表达功能性分子(诸如但不限于特定蛋白质)的核酸片段,包括位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。“天然基因”是指与其自身调控序列一起天然存在的基因。
“突变基因”是已通过人为干预被改变的基因。这种“突变基因”的序列与对应的非突变基因的序列不同之处在于至少一个核苷酸的添加、缺失或置换。在本发明的某些实施方案中,突变基因包含由本文所公开的向导多核苷酸/Cas内切核酸酶系统引起的改变。突变植物是包含突变基因的植物。
如本文所用,“靶向突变”是天然基因中的通过如下方式产生的突变:使用涉及本文所公开的或者本领域已知的能够在靶序列的DNA中诱导双链断裂的双链断裂诱导剂的方法,对天然基因内的靶序列进行改变。
在一个实施方案中,靶向突变是引导多核苷酸/Cas内切核酸酶诱导的基因编辑的结果,如本文所述。引导多核苷酸/Cas内切核酸酶诱导的靶向突变可发生于位于基因组靶位点之内或之外的核苷酸序列中,该基因组靶位点由Cas内切核酸酶识别和裂解。
术语“基因组”应用于植物细胞时,不仅涵盖细胞核内存在的染色体DNA,也涵盖细胞的亚细胞组分(例如线粒体或质体)中存在的细胞器DNA。
“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是这样的基因,其密码子用法的频率被设计成模拟宿主细胞的偏好密码子用法的频率。
“等位基因”是基因的占据染色体上特定基因座的几种另选形式之一。当染色体上特定基因座处存在的所有等位基因都相同时,该植物在该基因座处是纯合的。如果染色体上特定基因座处存在的等位基因不同,则该植物在该基因座处是杂合的。
“编码序列”指编码特定氨基酸序列的多核苷酸序列。“调控序列”指位于编码序列上游(5′非编码序列)、内部、或下游(3′非编码序列)并且影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调控序列可包括但不限于:启动子、翻译前导序列、5′非翻译序列、3′非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应物结合位点和茎环结构。
“植物优化的核苷酸序列”是已经过优化以提高在植物中的表达、特别是提高在植物中或者一种或者多种感兴趣植物中的表达的核苷酸序列。例如,可通过使用一个或多个用于改善表达的植物优选的密码子,对本文所公开的编码蛋白质诸如例如双链断裂诱导剂(例如内切核酸酶)的核苷酸序列进行修饰,来合成植物优化的核苷酸序列。对于宿主优选的密码子使用的讨论,参见例如Campbell和Gowri(1990)Plant Physiol.92:1-11。
在本领域中用于合成植物优选的基因的方法是可用的。参见例如美国专利5,380,831和5,436,391,以及Murray等人(1989)Nucleic Acids Res.17:477-498,它们以引用方式并入本文。已知有另外的序列修饰可增强在植物宿主中的基因表达。这些修饰包括例如消除以下序列:一个或多个编码假聚腺苷酸化信号、外显子-内含子剪接位点信号的序列,一个或多个转座子样重复序列,以及其他这种得到很好表征的可能对基因表达有害的序列。可将序列的G-C含量调整到给定的植物宿主的平均水平,这通过参考在宿主植物细胞中表达的已知基因计算得到。当可能时,修饰序列以避免一个或多个预测的发夹二级mRNA结构。因此,本发明的“植物优化的核苷酸序列”包含一个或者多个这种序列修饰。
“启动子”指能够控制编码序列或功能RNA的表达的DNA序列。启动子序列由近端上游元件和更远端的上游元件组成,后一类元件经常称作增强子。因此,“增强子”是这样的DNA序列,其可以刺激启动子活性,并且可以是启动子的固有元件或经插入以增强启动子的水平或组织特异性的异源元件。启动子可以整体源自天然基因,或由源自天然存在的不同启动子的不同元件构成,和/或甚至包含合成的DNA区段。本领域技术人员应当理解,不同的启动子可以指导基因在不同组织或细胞类型中或在不同的发育阶段或应答于不同的环境条件时表达。还认识到,由于在大多数情况下调控序列的确切界限仍未完全确定,因此存在一定变异的各DNA片段可以具有相同的启动子活性。造成基因在大多数时间在大多数细胞类型中表达的启动子通常称为“组成型启动子”。
已经证实,某些启动子能够以高于其他启动子的速率指导RNA合成。这些被称为“强启动子”。已经证实,某些其他启动子仅在特定类型的细胞或组织中以较高水平指导RNA合成,并且如果启动子优选地在某些组织中指导RNA合成,但在其他组织中以降低的水平指导RNA合成,则其通常被称为“组织特异性启动子”或“组织偏好启动子”。由于引入到植物中的一个或多个嵌合基因的表达模式使用启动子来控制,因此人们对下述新型启动子的分离一直有兴趣,该新型启动子能够在特定组织类型中或在特定植物发育阶段以一定水平控制一个或多个嵌合基因的表达。
不断发现可用于植物细胞中的各种类型的新启动子,在以下汇编中可以找到许多示例:Okamuro和Goldberg,(1989)The Biochemistry of Plants,第115卷,Stumpf和Conn编辑(New York,NY:Academic Press),第1-82页。
“翻译前导序列”是指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列上游的mRNA中。翻译前导序列可影响初级转录物加工成mRNA、mRNA稳定性或翻译效率。翻译前导序列的示例已有描述(例如Turner和Foster,(1995)Mol Biotechnol 3:225-236)。
“3′非编码序列”、“转录终止子”或“终止序列”是指位于编码序列下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其它序列。聚腺苷酸化信号通常以影响添加聚腺苷酸片至mRNA前体的3′端为特征。不同的3′非编码序列的用途由Ingelbrecht等人,(1989)Plant Cell 1:671-680例示。
“RNA转录物”是指由RNA聚合酶催化的DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完全互补拷贝时,它被称为初级转录物或前mRNA。当RNA转录物是由初级转录物前mRNAt的转录后加工衍生的RNA序列时,它被称为成熟RNA或mRNA。“信使RNA”或者“mRNA”是指没有内含子且可由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补且用反转录酶从mRNA模板合成的DNA。cDNA可为单链的或通过使用DNA聚合酶I的Klenow片段转化成双链形式。“有义”RNA是指包含mRNA并且可被翻译成细胞内或体外的蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或者mRNA的全部或者部分互补,并且能阻断靶基因的表达的RNA转录物(参见例如美国专利5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能RNA”是指反义RNA、核酶RNA或者其它可能不被翻译但仍对细胞过程具有作用的RNA。术语“互补序列”或“反向互补序列”在本文中可互换地用来指涉mRNA转录物,并且意在定义该信息(message)的反义RNA。
术语“可操作地连接”指各核酸序列结合在单一核酸片段上,使得一个核酸序列的功能被另一个核酸序列调节。例如,当启动子能够调节编码序列的表达时(即,该编码序列处于该启动子的转录控制下),则该启动子与该编码序列可操作地连接。编码序列可以有义或者反义方向与调控序列可操作地连接。在另一个示例中,互补的RNA区域可直接或者间接地与靶mRNA的上游(5′)可操作地连接,或者与靶mRNA的下游(3′)可操作地连接,或者在靶mRNA内部可操作地连接,或者第一互补区在靶mRNA的上游(5′),而其互补序列在靶mRNA的下游(3′)。
本文所用的标准的重组DNA和分子克隆技术是本领域熟知的,并且在以下文献中有更完全的描述:Sambrook等人,Molecular Cloning:A Laboratory Manual;Cold SpringHarbor Laboratory:Cold Spring Harbor,NY(1989)。转化方法是本领域技术人员熟知的,并在下文中描述。
“PCR”或“聚合酶链反应”是一项用于合成特定DNA区段的技术,并且由一系列的重复的变性、退火和延伸循环组成。通常,将双链DNA进行热变性,并将两条与靶区段的3′边界互补的引物与该DNA在低温下退火,然后在中等温度下延伸。一组这三个连续步骤称为一个“循环”。
术语“重组的”是指序列的两个本来分开的区段例如通过化学合成人工组合在一起,或者通过遗传工程技术对核酸的分离的区段进行操纵。
术语“质粒”、“载体”和“盒”指这样的染色体外元件,其通常携带不是细胞的中心代谢的一部分的基因,并且通常为双链DNA的形式。这种元件可以是衍自任何来源的、单链或者双链DNA或者RNA的、线状或环状形式的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已连接或者重组成能够将感兴趣多核苷酸引入细胞的独特构建体。“转化盒”是指含有一种基因并且除该基因之外还具有能促进特定宿主细胞的转化的元件的特定载体。“表达盒”是指含有一种基因并且除该基因之外还具有使该基因在宿主中表达的元件的特定载体。
术语“重组DNA分子”、“重组构建体”、“表达构建体”、“构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含在自然界中不全部在一起的核酸片段(例如调控序列和编码序列)的人工组合。例如,构建体可以包含源自不同来源的调控序列和编码序列,或源自相同来源、但是以不同于自然界中存在的方式排列的调控序列和编码序列。这种构建体可单独使用或可与载体结合使用。如果使用载体,则载体的选择取决于将被用来转化宿主细胞的方法,这是本领域技术人员熟知的。例如可使用质粒载体。技术人员熟知为了成功地转化、选择和繁殖宿主细胞而必须在载体上存在的遗传元件。技术人员还将认识到,不同的独立转化事件可导致不同的表达水平和表达模式(Jones等人,(1985)EMBO J 4:2411-2418;De Almeida等人,(1989)Mol Gen Genetics218:78-86),因此通常对多个事件进行筛选以获得显示所需表达水平和表达模式的细胞系。这种筛选可通过标准的分子生物学测定法、生物化学测定法和其它测定法完成,所述测定法包括DNA的Southern分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、反转录PCR(RT-PCR)、蛋白质表达的免疫印迹分析、酶或者活性测定和/或表型分析。
本文所用的术语“表达”指产生前体形式或成熟形式的功能性最终产物(例如mRNA、引导多核苷酸或蛋白质)。
术语“引入”意指向细胞提供核酸(例如表达构建体)或蛋白质。引入包括指代核酸掺入到真核或原核细胞中,其中该核酸可掺入到该细胞的基因组中,并且包括指代核酸或蛋白质短暂提供到细胞。引入包括指代稳定的或短暂的转化方法,以及有性杂交。因此,在将核酸片段(例如,重组DNA构建体/表达构建体)插入细胞中的情形中,“引入”意指“转染”或“转化”或“转导”,并且包括指代将核酸片段掺入到真核或原核细胞中,其中该核酸片段可掺入到细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中,转化成自主复制子或瞬时表达(例如,转染的mRNA)。
“成熟”蛋白质指翻译后加工的多肽(即,已从初级翻译产物移除了任何存在的原肽或前肽所得的多肽)。“前体”蛋白质指mRNA的翻译的初级产物(即,仍存在原肽和前肽)。原肽和前肽可以是但不限于胞内定位信号。
“稳定转化”是指将核酸片段转移至宿主生物体的基因组(包括核基因组和细胞器基因组)中,导致基因稳定遗传。相反,“瞬时转化”是指核酸片段转移到宿主生物体的细胞核或者其它含DNA的细胞器中,从而导致基因表达而不整合或不稳定遗传。
遗传改良种质的商业开发也已进展到将多种性状引入作物植物的阶段,通常称为基因堆叠方法。在该方法中,可将赋予不同感兴趣的特性的多种基因引入植物。基因堆叠可通过许多方法实现,包括但不限于共转化、再转化以及使具有不同感兴趣的基因的品系的杂交。
术语“植物”指整株植物、植物器官、植物组织、种子、植物细胞、及其种子和子代。植物细胞包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、苗、配子体、孢子体、花粉和小孢子的细胞。植物部分包括分化和未分化的组织,包括但不限于根、茎、苗、叶、花粉、种子、瘤组织和各种形式的细胞和培养物(例如,单细胞、原生质体、胚和愈伤组织)。植物组织可以在植物中或在植物器官、组织或培养物中。术语“植物器官”指构成植物的形态上和功能上不同的部分的植物组织或一组植物组织。术语“基因组”是指生物体每个细胞或病毒或细胞器中存在的全部互补遗传物质(基因和非编码序列);和/或作为(单倍体)单元从一个亲本继承的完整组的染色体。“子代”包含植物的任何后续世代。
转基因植物包括例如这样的植物,该植物在其基因组内包含通过转化步骤引入的异源多核苷酸。异源多核苷酸能被稳定地整合进基因组中,使得该多核苷酸传递至连续的世代。异源多核苷酸可单独地或作为重组DNA构建体的一部分整合到基因组中。转基因植物还可在其基因组内包含不止一个异源多核苷酸。每个异源多核苷酸可赋予转基因植物不同性状。异源多核苷酸可包括源自外来物种的序列,或者,如果源自相同物种,则可为对其天然形式进行了实质性修饰的序列。“转基因”可包括其基因型已因异源核酸的存在而改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初经如此改变的转基因植物以及通过有性杂交或无性繁殖从最初的转基因植物产生的那些。通过常规植物育种方法,通过本文所述的不导致外来多核苷酸插入的基因组编辑程序,或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变不旨在被认为是转基因的。
“厘摩”(cM)或“图距单位(map unit)”是两个连接的基因、标记、靶位点、基因座或它们的任何配对之间的距离,其中1%的减数分裂产物是重组的。因此,一厘摩与等于两个连接的基因、标记、靶位点、基因座或它们的任何配对之间的1%平均重组频率的距离相当。
蛋白质可以各种方式进行改变,包括氨基酸置换、缺失、截短和插入。用于此类操作的方法一般来讲是已知的。例如,可通过在DNA中的突变来制备蛋白质的氨基酸序列变体。用于诱变和核苷酸序列改变的方法包括例如Kunkel,(1985)Proc.Natl.Acad.Sci.USA82:488-92;Kunkel等人,(1987)Meth Enzymol 154:367-82;美国专利4,873,192;Walker和Gaastra编辑(1983)Techniques in Molecular Biology(MacMillan PublishingCompany,New York)以及其中引用的参考文献。有关不太可能影响蛋白质的生物活性的氨基酸置换的指导,见于例如Dayhoff等人,(1978)Atlas of Protein Sequence andStructure(Natl Biomed Res Found,Washington,D.C.)的模型。保守置换,诸如将一个氨基酸用另一具有相似性质的氨基酸进行交换,可以是优选的。保守缺失、插入和氨基酸置换预期不会造成蛋白质特征的根本性变化,并且任何置换、缺失、插入或它们的组合的效应可通过常规筛选测定法进行评估。测定双链断裂诱导活性的测定法是已知的,一般是测量该试剂对含有靶位点的DNA底物的总体活性和特异性。
已知有多种方法可用来将核苷酸序列和多肽引入到生物体中,包括例如转化、有性杂交在内,以及将多肽、DNA或mRNA引入细胞中。
用于接触、提供和/或引入组合物到各种生物体中的方法是已知的,包括但不限于稳定转化方法、瞬时转化方法、病毒介导的方法和有性育种。稳定转化表示所引入的多核苷酸整合到生物体的基因组中并能够被其子代遗传。瞬时转化表示所引入的组合物仅仅在生物体中暂时表达或存在。
用于将多核苷酸或多肽引入到植物中的方案可根据作为转化目标的植物或者植物细胞的类型(如单子叶植物或双子叶植物)而异。将多核苷酸和多肽引入到植物细胞中并随后插入到植物基因组中的合适方法包括显微注射(Crossway等人,(1986)Biotechniques4:320-34,以及美国专利6,300,543)、分生组织转化(美国专利5,736,369)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA 83:5602-6)、农杆菌介导的转化(美国专利5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J 3:2717-22),以及弹道粒子加速法(美国专利4,945,050;5,879,918;5,886,244;5,932,782;Tomes等人,(1995)″Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment″inPlant Cell,Tissue,and Organ Culture:Fundamental Methods,Gamborg和Phillips编辑(Springer-Verlag,Berlin);McCabe等人,(1988)Biotechnology 6:923-6;Weissinger等人,(1988)Ann Rev Genet 22:421-77;Sanford等人,(1987)Particulate Science andTechnology 5:27-37(洋葱);Christou等人,(1988)Plant Physiol 87:671-4(大豆);Finer和McMullen,(1991)In Vitro Cell Dev Biol 27P:175-82(大豆);Singh等人,(1998)Theor Appl Genet 96:319-24(大豆);Datta等人,(1990)Biotechnology 8:736-40(稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA 85:4305-9(玉米);Klein等人,(1988)Biotechnology 6:559-63(玉米);美国专利5,240,855;5,322,783和5,324,646;Klein等人,(1988)Plant Physiol 91:440-4(玉米);Fromm等人,(1990)Biotechnology 8:833-9(玉米);Hooykaas-Van Slogteren等人,(1984)Nature 311:763-4;美国专利5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA84:5345-9(百合科(Liliaceae));DeWet等人,(1985)The Experimental Manipulation of Ovule Tissues,Chapman等人编辑(Longman,New York),第197-209页(花粉);Kaeppler等人,(1990)Plant Cell Rep 9:415-8和Kaeppler等人,(1992)Theor Appl Genet 84:560-6(触须介导的转化);D′Halluin等人,(1992)Plant Cell 4:1495-505(电穿孔);Li等人,(1993)Plant Cell Rep 12:250-5;Christou和Ford(1995)Annals Botany 75:407-13(稻),以及Osjoda等人,(1996)NatBiotechnol 14:745-50(玉米,通过根瘤农杆菌(Agrobacterium tumefaciens))。
另选地,可通过使植物与病毒或者病毒核酸接触来将多核苷酸引入植物。一般地讲,这种方法涉及将多核苷酸掺入在病毒DNA或RNA分子内。在一些示例中,感兴趣的多肽可最初作为病毒聚蛋白的一部分合成,其以后可通过体内或体外蛋白水解加工而产生所需的重组蛋白。涉及病毒DNA或者RNA分子的、用于将多核苷酸引入植物并表达其中所编码的蛋白质的方法是已知的,参见例如美国专利5,889,191、5,889,190、5,866,785、5,589,367和5,316,931。瞬时转化方法包括但不限于将多肽诸如双链断裂诱导剂直接引入生物体、引入多核苷酸诸如DNA和/或RNA多核苷酸、以及将RNA转录物诸如编码双链断裂诱导剂的mRNA引入生物体。此类方法包括例如显微注射法或粒子轰击法。参见例如Crossway等人,(1986)Mol Gen Genet 202:179-85;Nomura等人,(1986)Plant Sci 44:53-8;Hepler等人,(1994)Proc.Natl.Acad.Sci.USA 91:2176-80;以及Hush等人,(1994)J Cell Sci 107:775-84。
术语“双子叶植物”是指也称为“双子叶植物纲”的被子植物的亚类并且包括提及整株植物、植物器官(例如,叶、茎、根等)、种子、植物细胞及其子代。本文所用的植物细胞包括但不限于种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、苗、配子体、孢子体、花粉和小孢子。
在本发明的上下文中的术语“杂交的”或“杂交”或“正在杂交”意指配子通过授粉而融合以产生子代(即,细胞、种子或植物)。该术语涵盖有性杂交(一株植物由另一株植物授粉)和自交(自花授粉,即,当花粉和胚珠(或者小孢子和大孢子)来自相同植物或遗传上相同的植物时)。
术语“基因掺入”是指遗传基因座的所需等位基因从一种遗传背景传递到另一种遗传背景。例如,所需等位基因在特定基因座的基因掺入能够通过两个亲本植株间的有性杂交被传递到至少一个子代植株,其中至少一个亲本植株在其基因组中具有所需等位基因。另选地,例如等位基因的传递能够通过两个供体基因组之间的重组而发生,例如在融合原生质体中,其中至少其中一个供体原生质体在其基因组中具有所需等位基因。所需等位基因可为例如转基因、经修饰(经突变或编辑)天然等位基因,或者所选择的标记或QTL的等位基因。
标准的DNA分离、纯化、分子克隆、载体构建和验证/表征方法是已建立的,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual,(Cold SpringHarbor Laboratory Press,NY)。载体和构建体包括含有感兴趣的多核苷酸和任选其它组分的环状质粒和线性多核苷酸,所述其它组分包括连接子、衔接子、调控区、内含子、限制位点、增强子、隔离子、选择性标记、感兴趣的核苷酸序列、启动子和/或其它有助于载体构建或者分析的位点。在一些示例中,识别位点和/或靶位点可包含在内含子、编码序列、5′UTR、3′UTR和/或调控区内。
本发明还提供了表达构建体,所述表达构建体用于在酵母或植物、植物细胞或植物部分中表达能够结合到靶位点并在靶位点中产生双链断裂的向导多核苷酸/Cas系统。在一个实施方案中,本发明的表达构建体包含可操作地连接至编码Cas基因的核苷酸序列的启动子以及可操作地连接至本发明的向导多核苷酸的启动子。该启动子能够驱动可操作地连接的核苷酸序列在植物细胞中的表达。
启动子是参与RNA聚合酶和其它蛋白质的识别和结合以引发转录的DNA区域。植物启动子是能够在植物细胞中引发转录的启动子,有关植物启动子的综述参见Potenza等人,(2004)In Vitro Cell Dev Biol 40:1-22。组成型启动子包括例如Rsyn7启动子的核心启动子以及WO99/43838和美国专利6,072,050中公开的其它组成型启动子;核心CaMV 35S启动子(Odell等人,(1985)Nature 313:810-2);稻肌动蛋白(McElroy等人,(1990)PlantCell 2:163-71);泛素(Christensen等人,(1989)Plant Mol Biol 12:619-32;Christensen等人,(1992)Plant Mol Biol 18:675-89);pEMU(Last等人,(1991)TheorAppl Genet 81:581-8);MAS(Velten等人,(1984)EMBO J 3:2723-30);ALS启动子(美国专利5,659,026)等。其它组成型启动子在例如美国专利5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611中有所描述。在一些示例中,可使用诱导型启动子。病原体感染后被诱导的病原体诱导型启动子包括但不限于那些调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等的表达的启动子。
可将化学调控启动子用于通过施用外源化学调控剂来调节基因在植物中的表达。该启动子可以是化学诱导启动子,其中化学剂的施加可诱导基因表达,或者是化学阻遏型启动子,其中化学剂的施加可阻遏基因表达。化学诱导型启动子包括但不限于玉米In2-2启动子,其由苯磺酰胺除草剂安全剂激活(De Veylder等人,(1997)Plant Cell Physiol 38:568-77);玉米GST启动子(GST-II-27,WO93/01294),其由用作萌前除草剂的疏水亲电子化合物激活;以及烟草PR-1a启动子(Ono等人,(2004)Biosci Biotechnol Biochem 68:803-7),其由水杨酸激活。其它化学调控的启动子包括甾类化合物响应性启动子(参见例如糖皮质激素诱导型启动子(Schena等人,(1991)Proc.Natl.Acad.Sci.USA 88:10421-5;McNellis等人,(1998)Plant J 14:247-257);四环素诱导型和四环素阻遏型启动子(Gatz等人,(1991)Mol Gen Genet 227:229-37;美国专利5,814,618和5,789,156)。
组织优选的启动子可用来靶向特定植物组织内的增强的表达。组织优选的启动子包括例如Kawamata等人,(1997)Plant Cell Physiol 38:792-803;Hansen等人,(1997)MolGen Genet 254:337-43;Russell等人,(1997)Transgenic Res 6:157-68;Rinehart等人,(1996)Plant Physiol 112:1331-41;Van Camp等人,(1996)Plant Physiol 112:525-35;Canevascini等人,(1996)Plant Physiol 112:513-524;Lam,(1994)Results Probl CellDiffer 20:181-96;以及Guevara-Garcia等人,(1993)Plant J 4:495-505。叶优选的启动子包括例如Yamamoto等人,(1997)Plant J 12:255-65;Kwon等人,(1994)Plant Physiol105:357-67;Yamamoto等人,(1994)Plant Cell Physiol 35:773-8;Gotor等人,(1993)Plant J 3:509-18;Orozco等人,(1993)Plant Mol Biol 23:1129-38;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA 90:9586-90;Simpson等人,(1958)EMBO J 4:2723-9;Timko等人,(1988)Nature 318:57-8。根偏好的启动子包括(例如)下列文献中提出的那些:Hire等人,(1992)Plant Mol Biol 20:207-18(大豆根特异性谷氨酰胺合成酶基因);Miao等人,(1991)Plant Cell 3:11-22(胞质谷氨酰胺合成酶(GS));Keller和Baumgartner,(1991)Plant Cell 3:1051-61(法国菜豆的GRP 1.8基因中的根特异性控制元件);Sanger等人,(1990)Plant Mol Biol 14:433-43(根瘤农杆菌甘露氨酸合酶(MAS)的根特异性启动子);Bogusz等人,(1990)Plant Cell 2:633-41(从榆科山黄麻(Parasponia andersonii)和鸡屎藤山麻黄(Trema tomentosa)分离的根特异性启动子);Leach和Aoyagi,(1991)Plant Sci 79:69-76(毛根农杆菌(A.rhizogenes)rolC和rolD根诱导基因);Teeri等人,(1989)EMBO J 8:343-50(农杆菌创伤诱导的TR1′和TR2’基因);VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol Biol 29:759-72);以及rolB启动子(Capana等人,(1994)Plant Mol Biol 25:681-91);菜豆素基因(Murai等人,(1983)Science 23:476-82;Sengopta-Gopalen等人,(1988)Proc.Natl.Acad.Sci.USA 82:3320-4)。还可参见美国专利5,837,876、5,750,386、5,633,363、5,459,252、5,401,836、5,110,732和5,023,179。
种子优选的启动子包括种子发育过程中活跃的种子特异性启动子和在种子萌发过程中活跃的种子萌发启动子。参见Thompson等人,(1989)BioEssays 10:108。种子优选的启动子包括但不限于Cim1(细胞分裂素诱导信息);cZ19B1(玉米19kDa玉米醇溶蛋白);以及milps(肌醇-1-磷酸合酶);(WO00/11177和美国专利6,225,529)。对于双子叶植物,种子优选的启动子包括但不限于豆类β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子优选地启动子包括但不限于玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDaγ玉米醇溶蛋白、糯性蛋白、超甜蛋白1、超甜蛋白2、球蛋白1、油质蛋白、以及nuc1。另参见WO00/12733,其中公开了来自END1和END2基因的种子偏好启动子。
表型标记是可筛选或可选择的标记,其包括可视标记和选择性标记,无论它是阳性还是阴性的选择性标记。可使用任何表型标记。具体地,可选择的或可筛选的标记包含这样的DNA区段,该DNA区段使得可以常常在特定条件下鉴定或选取或者不选取含有它的分子或细胞。这些标记可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可为RNA、肽、蛋白质、无机和有机化合物或组合物等提供结合位点。
选择性标记的示例包括但不限于包含限制性酶位点的DNA区段;编码提供对于有毒化合物的抗性的产物的DNA区段,所述有毒化合物包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外缺乏受体细胞的产物的DNA区段(例如,tRNA基因、营养缺陷标记);编码可易于鉴定的产物的DNA区段(例如,表型标记,诸如β-半乳糖苷酶、GUS;荧光蛋白,诸如绿色荧光蛋白(GFP),青色荧光蛋白(CFP),黄色荧光蛋白(YFP),红色荧光蛋白(RFP),以及细胞表面蛋白);产生用于PCR的新引物位点(例如,之前尚未并置的两个DNA序列的并置)的DNA区段;包含未受限制性内切核酸酶或其他DNA修饰酶、化学品等作用或受其作用的DNA序列的DNA区段;以及包含特异性修饰(例如,甲基化)所需的DNA序列的DNA区段,该特异性修饰使得可以鉴别该DNA序列。
另外的选择性标记包括能赋予对除草化合物如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)的抗性的基因。参见例如Yarranton,(1992)Curr Opin Biotech 3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA 89:6314-8;Yao等人,(1992)Cell 71:63-72;Reznikoff,(1992)Mol Microbiol 6:2419-22;Hu等人,(1987)Cell48:555-66;Brown等人,(1987)Cell 49:603-12;Figge等人,(1988)Cell 52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA 86:2549-53;Deuschle等人,(1990)Science 248:480-3;Gossen,(1993)Ph.D.Thesis,University of Heidelberg;Reines等人,(1993)Proc.Natl.Acad.Sci.USA 90:1917-21;Labow等人,(1990)Mol Cell Biol 10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA 89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA 88:5072-6;Wyborski等人,(1991)Nucleic Acids Res 19:4647-53;Hillen和Wissman,(1989)Topics Mol Struc Biol 10:143-62;Degenkolb等人,(1991)Antimicrob Agents Chemother 35:1591-5;Kleinschnidt等人,(1988)Biochemistry 27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg;Gossen等人,(1992)Proc.Natl.Acad.Sci.USA 89:5547-51;Oliva等人,(1992)AntimicrobAgents Chemother 36:913-9;Hlavka等人,(1985)Handbook of ExperimentalPharmacology,第78卷(Springer-Verlag,Berlin);Gill等人,(1988)Nature 334:721-4。
可采用常规条件将具有所引入的序列的细胞生长或再生成植物,参见例如McCormick等人,(1986)Plant Cell Rep 5:81-4。然后可使这些植株生长,并用相同转化株或者用不同转化株或未转化株进行授粉,并鉴定出具有所需特性和/或包含所引入的多核苷酸或者多肽的所得子代。可生长两代或更多代以确保多核苷酸得到稳定保持和遗传,并收获种子。
可使用任何植物,包括单子叶植物和双子叶植物。可使用的单子叶植物的示例包括但不限于玉米(Zea mays)、稻(Oryza sativa)、裸麦(Secale cereale)、高粱(Sorghumbicolor、Sorghum vulgare)、粟(例如珍珠粟(Pennisetum glaucum)、黄米(Panicummiliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、小麦(Triticumaestivum)、甘蔗(Saccharum spp.)、燕麦(Avena)、大麦(Hordeum)、柳枝稷(Panicumvirgatum)、菠萝(Ananas comosus)、香蕉(Musa spp.)、棕榈、观赏植物、草坪草和其它草类。可使用的双子叶植物的示例包括但不限于大豆(Glycine max)、卡诺拉(Brassicanapus和B.campestris)、苜蓿(Medicago sativa)、烟草(Mcotiana tabacum)、拟南芥(Arabidopsis thaliana)、向日葵(Helianthus annuus)、棉(Gossypium arboreum)和花生(Arachis hypogaea)、西红柿(Solanum lycopersicum)、马铃薯(Solanum tuberosum)等。
经修饰的(突变的或经编辑的)天然DNA序列诸如EPSPS可包含一个或多个感兴趣的基因。这种感兴趣的基因可编码例如为植物提供农学优势的蛋白质。
植物的标记辅助选择和育种
在作物中开发分子标记的主要动力是通过标记辅助选择(MAS)在植物育种中提高效率的潜能。遗传标记等位基因,或另选地,数量性状基因座(QTL)等位基因用于识别植物,该植物在一个或多个基因座处包含所需基因型,并且预期将所需基因型连同所需表型转移到其子代。遗传标记等位基因(或QTL等位基因)能够被用于鉴定在一个基因座或若干个不连锁或连锁基因座处包含所需基因型的植物(例如单倍型),并且该植物预期将所需基因型连同所需表型一起传递至它们的子代。应当理解,出于MAS的目的,术语标记可涵盖标记和QTL基因座两者。
在确定所需表型和多态性染色体基因座(例如,标记基因座或QTL)同时分离之后,可以使用那些多态性基因座来选择对应于所需表型的等位基因-称为标记辅助选择(MAS)的过程。简而言之,在来自待选择的植物的生物样本中检测对应于标记核酸的核酸。该检测可采取探针核酸与标记杂交的形式,例如使用等位基因特异性杂交、southern印迹分析、northern印迹分析、原位杂交、引物的杂交然后是PCR扩增标记区域等。用于检测标记的各种程序是本领域中已知的。在生物样本中的特定标记的存在(或不存在)被验证之后,选择植物,即,用于通过选择性育种形成子代植物。
植物育种需要组合感兴趣的性状与用于高收率的基因以及其它所需性状以开发改良的植物品种。筛选大量样本可能是昂贵、耗时且不可靠的。使用标记和/或遗传连锁的核酸是用于在育种程序中选择具有所需性状的植物的有效方法。例如,经过田地评价的标记辅助选择的一个优点在于,MAS可无论生长季节如何而在一年中的任何时候进行。此外,环境效应与标记辅助选择无关。
当群体对于影响一个或多个性状的多个基因座进行分离时,MAS的效率与表型筛选相比变得甚至更高,这是因为所有基因座在实验室中可从DNA的单个样本一起处理。
细胞的DNA修复机制是引入外源DNA或者在内源基因中诱导突变的基础。DNA同源重组是细胞使用同源序列修复DNA损伤的专门DNA修复方式。在植物中,DNA同源重组发生频率过低而不能按常规用于基因靶向或编辑,后来发现该过程可通过DNA双链断裂刺激(Bibikova等人,(2001)Mol.Cell Biol.21:289-297;Puchta和Baltimore,(2003)Science300:763;Wright等人,(2005)Plant J.44:693-705)。
缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔,“mM”表示毫摩尔,“M”表示摩尔,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对,并且“kb”表示千碱基对。
本文所公开的组合物和方法的非限制性示例如下:
1.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
2.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
3.根据实施方案1-2中任一项所述的方法,其中所述多核苷酸修饰模板包含EPSPS核苷酸序列的非功能片段或部分片段。
4.根据实施方案1-2中任一项所述的方法,其中所述靶位点位于所述EPSPS核苷酸序列内。
5.根据实施方案1-2中任一项所述的方法,还包括选择不含所述向导RNA和Cas内切核酸酶的子代植物。
6.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种子对草甘膦具有抗性;以及
b)产生不含所述向导RNA和Cas内切核酸酶的子代植物。
7.根据实施方案6所述的方法,还包括选择表现出草甘膦抗性的植物。
8.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含TIPS编辑的EPSPS基因。
9.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含K90R和TIPS编辑的EPSPS基因。
10.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含IME和TIPS编辑的EPSPS基因。
11.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含T剪接的且TIPS编辑的EPSPS基因。
12.根据实施方案1-11中任一项所述的方法,其中所述植物为单子叶植物或双子叶植物。
13.根据实施方案12所述的方法,其中所述单子叶植物选自玉米、稻、高粱、裸麦、大麦、小麦、粟、燕麦、甘蔗、草坪草或柳枝稷。
14.根据实施方案12所述的方法,其中所述双子叶植物选自大豆、卡诺拉、苜蓿、向日葵、棉、烟草、花生、马铃薯、烟草、拟南芥或红花。
15.根据实施方案1-12中任一项所述的方法,其中所述向导RNA通过粒子轰击直接提供。
16.根据实施方案1、3-12中任一项所述的方法,其中向所述细胞直接提供Cas内切核酸酶。
17.根据实施方案1-12中任一项所述的方法,其中所述向导RNA通过粒子轰击或包含可操作地连接至植物U6聚合酶III启动子的对应的向导DNA的重组DNA构建体的农杆菌转化来提供。
18.根据实施方案1-17中任一项所述的方法,其中所述Cas内切核酸酶基因选自Cas9内切核酸酶或植物优化的Cas9内切核酸酶。
19.根据实施方案18所述的方法,其中所述植物优化的Cas9内切核酸酶选自玉米优化的Cas9内切核酸酶和大豆优化的Cas9内切核酸酶。
20.根据前述实施方案中任一项所述的方法,其中所述Cas9内切核酸酶由SEQ IDNO:105-110中的任一个、或其任何功能片段或变体编码。
21.一种产生草甘膦抗性玉米植物的方法,所述方法包括提供玉米植物细胞,其中所述植物细胞的内源性染色体EPSPS基因已通过向导RNA/Cas内切核酸酶系统进行修饰以产生草甘膦抗性EPSPS蛋白;以及由所述玉米植物细胞培育玉米植物,其中所述植物对草甘膦具有抗性。
22.根据实施方案21所述的方法,其中所述玉米植物对1X草甘膦施用具有抗性。
23.根据实施方案22所述的方法,其中所述内源性染色体EPSPS基因为预先存在的重组DNA。
24.一种由实施方案1-23中任一项所述的方法产生的植物。
25.一种由实施方案24所述的植物产生的种子。
26.根据实施方案24所述的植物,其中所述植物对1X草甘膦施用具有抗性。
27.一种向导RNA,其中所述可变靶向域靶向于植物EPSPS核苷酸序列的片段。
28.根据实施方案27所述的向导RNA,其中所述可变靶向域靶向选自SEQ ID NO:12、13、14、60、61、83、84、96、97的植物靶位点。
29.根据实施方案27所述的向导RNA,其中与所述向导RNA对应的DNA序列为SEQ IDNO:24。
30.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)获得在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
31.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
32.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供能够表达向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS基因的非功能片段和所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
33.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含EPSPS核苷酸序列的非功能片段或部分片段。
34.根据实施方案30-32中任一项所述的方法,其中所述靶位点位于所述EPSPS核苷酸序列内。
35.一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含EPSPS基因片段的至少一个拷贝。
36.一种用于替换细胞中的第一烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)启动子序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的所述基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含不同于所述第一EPSPS启动子序列的第二启动子或第二启动子片段。
37.根据实施方案36所述的方法,其中所述第一EPSPS启动子序列的替换导致以下情况中的任一种或以下情况的任一组合:细胞层中增加的启动子活性、增加的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、或者基因表达的时机或发育进度的修饰。
38.根据实施方案36所述的方法,其中所述第二启动子或第二启动子片段是玉米泛素启动子。
39.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入调控元件的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含待插入到所述EPSPS核苷酸序列中的调控元件。
40.根据实施方案39所述的方法,其中插入所述调控元件导致下列情况中的任一种或下列情况的任一组合:启动子活性增加、启动子的组织特异性增加、启动子活性降低、启动子的组织特异性降低、新的启动子活性、诱导型启动子活性、基因表达窗延长、出现与基因表达的时机或发育进度有关的修饰、DNA结合元件突变、或添加了DNA结合元件。
41.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含至少一个内含子介导的增强子基序。
42.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含不同于天然EPSPS编码序列的至少一个剪接位点。
43.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入内含子的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含内含子序列。
44.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列选自天然EPSPS基因序列的部分片段、EPSPS启动子序列、EPSPS终止子序列、EPSPS调控序列、以及EPSPS编码序列、EPSPS剪接序列、EPSPS聚泛素化序列以及EPSPS内含子序列。
45.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列的所述至少一个核苷酸修饰位于所述Cas内切核酸酶的所述靶位点之外。
46.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列的所述至少一个核苷酸修饰位于所述Cas内切核酸酶的所述靶位点之内。
47.根据实施方案30-47中任一项所述的方法,其中所述细胞是植物细胞。
48.根据实施方案47所述的方法,其中植物细胞选自单子叶植物和双子叶植物细胞。
49.根据实施方案48所述的方法,其中植物细胞选自玉米、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥、和红花细胞。
50.一种由实施方案30-32中任一项所述的方法产生的植物细胞。
51.一种由实施方案50所述的植物细胞产生的植物或子代植物,其中所述植物或子代植物表现出草甘膦抗性。
52.一种草甘膦抗性玉米植物,其中玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中玉米植物不表达草甘膦敏感性EPSPS多肽。
53.一种草甘膦抗性玉米植物细胞,其中玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中内源性EPSPS多核苷酸序列存在于与相应野生型对照相比相同的染色体位置。
54.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)EPSPS密码子区域的编辑;或者
b)天然EPSPS基因的复制;或者
c)调控序列修饰;或者
d)EPSPS基因聚泛素化位点的编辑;或者
e)编辑内含子元件;或者
f)编辑或修饰剪接位点;或者
g)终止子修饰;或者
h)引入替代的剪接位点;或者
i)氨基酸和/或蛋白质融合;或者
j)(a)-(j)的任一组合;
其中所述方法包括向包含EPSPS核苷酸序列的植物细胞提供至少一个向导RNA、至少一个Cas内切核酸酶、以及任选地多核苷酸修饰模板或供体DNA,其中所述至少一个向导RNA和至少一个Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够识别、结合且任选地裂解所述植物细胞的基因组中的至少一个靶位点,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
55.根据实施方案54所述的方法,还包括由所述植物细胞获得植物、评估所述植物中是否存在所述至少一个核苷酸修饰、以及选择表现出草甘膦抗性的子代植物。
实施例
在以下实施例中,除非另行指出,否则份数和百分比均按重量计,并且度数的单位都是摄氏度。应该理解,尽管这些实施例说明了本发明的实施方案,但仅是以例证的方式给出的。根据上文的论述内容和下文的实施例,本领域技术人员能够对本发明做出各种变化和修改,使其适用于各种用途和条件。此类修改形式也旨在落入所附实施方案的范围内。
实施例1
以玉米植株中的基因组修饰为基础的向导RNA/Cas内切核酸酶的表达盒
本文所述的向导RNA/Cas内切核酸酶系统基于II型CRISPR/Cas系统,由Cas内切核酸酶与向导RNA(或双工crRNA和tracrRNA)组成;其中Cas内切核酸酶与向导RNA可一起形成复合物,该复合物可识别植物的基因组靶位点,然后向该靶位点引入双链断裂(2013年8月22日提交的美国专利申请61/868706)。
为了检测玉米中的向导RNA/Cas内切核酸酶系统,步骤如下:首先,将来自酿脓链球菌M1 GAS(SF370)的Cas9基因(SEQ ID NO:1)按本领域已知的标准技术进行玉米密码子优化,然后引入马铃薯ST-LS1内含子(SEQ ID NO:2),使该Cas9基因不能在大肠杆菌(E.coli)和农杆菌(Agrobacterium)中表达(参见图1A)。为有利于Cas9蛋白在玉米细胞中核定位,我们分别在Cas9开放阅读框的氨基和羧基末端引入了猿猴病毒40(Simian virus40)(SV40)单分型氨基末端核定位信号(MAPKKKRKV,SEQ ID NO:3)和根癌农杆菌(Agrobacterium tumefaciens)双分型VirD2 T-DNA边界内切核酸酶羧基末端核定位信号(KRPRDRHDGELGGRKRAR,SEQ ID NO:4)(图2A)。采用标准分子生物学技术将玉米优化Cas9基因可操作地连接至玉米组成型或调控型启动子。图2A示出了玉米优化Cas9表达盒的一个示例(SEQ ID NO:5)。图2A所示的玉米优化Cas9基因包含ST-LS1内含子、SV40氨基末端核定位信号(NLS)以及由植物泛素启动子驱动的VirD2羧基末端NLS。
针对基因组工程应用,形成功能性向导RNA/Cas内切核酸酶系统所必需的第二成分是crRNA和tracrRNA分子的双链体(图1A)、或crRNA和tracrRNA分子的融合,被称为单链向导RNA(图1B)。为赋予玉米有效表达向导RNA(或有效表达双工crRNA/tracrRNA)的能力,分离出了存在于8号染色体上的玉米U6聚合酶III启动子(SEQ ID NO:9)和玉米U6聚合酶III终止子(SEQ ID NO:10中前8个碱基),并采用标准分子生物学技术将它们可操作地融合至向导RNA的末端(图2D)。示例性表达盒在图2D中示出,其示出了驱动单链向导RNA表达的玉米U6聚合酶III启动子,该单链向导RNA的末端为U6聚合酶III终止子。
如图3A所示,向导RNA(或crRNA分子)还包含与双链DNA靶标的一条链互补的区域(称为可变靶向域),其长度为约12至30个核苷酸,位于用来识别并切割靶位点的PAM序列上游(图3A中反义链上的5’NGG3’,对应于3A中正义链上的5’CCN3’)(Gasiunas等人(2012)Proc.Natl.Acad.Sci.USA 109:E2579-86;Jinek等人(2012)Science 337:816-21;Mali等人(2013)Science 339:823-26;Cong等人(2013)Science339:819-23。为有利于向crRNA或单链向导RNA表达构建体快速引入玉米基因组DNA靶序列,以反向串联取向(切割方向朝外)引入了两个IIS型BbsI限制性内切核酸酶靶位点,具体操作参见Cong等人(2013)Science339:819-23。IIS型限制性内切核酸酶在切割时,将其靶位点从crRNA或单链向导RNA表达质粒切除,产生突出端,此时技术人员便能够把包含所需玉米基因组DNA靶位点的双工寡核苷酸框内定向克隆进可变靶向域。在本实施例中,只用以鸟嘌呤核苷酸开头的靶序列来促进单链向导RNA或crRNA的有利表达聚合酶III。
然后,Cas内切核酸酶基因和单链向导RNA两者的表达使得形成了图3A中描绘的向导RNA/Cas复合物,该复合物能够将双链断裂引入Cas内切核酸酶靶位点。
另选地,Cas内切核酸酶基因(图2A)、crRNA(图3B)、以及tracrRNA(图3C)的表达使得形成了crRNA/tracrRNA/Cas复合物,该复合物能够将双链断裂引入Cas内切核酸酶靶位点。
实施例2
向导RNA/Cas内切核酸酶系统通过非同源末端连接机制切割玉米中的染色体DNA 并引入突变
为检测实施例1描述的玉米优化的向导RNA/Cas内切核酸酶是否能够通过非同源末端连接(NHEJ)修复途径识别、切割玉米EPSPS基因并使其发生突变,使玉米epsps基因座中的三个不同的基因组靶序列为切割靶标(参见表1),并通过深度测序技术检查是否存在NHEJ突变。
表1.单链向导RNA/Cas内切核酸酶系统靶向的玉米基因组靶位点
EPSPS=烯醇式丙酮基莽草酸磷酸合酶基因
通过粒子介导递送技术(参见实施例14),在存在BBM和WUS2基因的情况下,将玉米优化的Cas9内切核酸酶和单链向导RNA表达盒(包含特定的玉米可变靶向域)共递送到60至90个Hi-II玉米未成熟胚芽中(2013年3月13日提交的美国专利申请13/800447)。
在7天之后,合并20-30个最均匀转化的胚并且提取总基因组DNA。用高保真度PCR主混合物(New England Biolabs,M0531L)对预期靶位点周围的区域进行PCR扩增,将该主混合物添加到扩增子特异性条形码所必需的序列上,然后利用“加尾”引物,在两轮PCR过程中进行Illumnia测序。一级PCR反应使用的引物示于表2;二级PCR反应使用的引物为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG(正向,SEQ ID NO:15)和CAAGCAGAAGACGGCATA(反向,SEQ ID NO:16)。
表2.PCR引物序列
用Qiagen PCR纯化离心柱纯化PCR扩增产物,等摩尔比混合,采用基于Hoechst染料的荧光测定法测量浓度,再将扩增产物于Illumina MiSeq个人型测序系统中,用PhiXcontrol v3(Illumina,FC-110-3001)以30%至40%(v/v)加标(用于抵消序列偏差),对100个核苷酸长的单个读段进行深度测序。只有那些读段长度≥1个核苷酸插入缺失(indel)(在以预期切割位点为中心、且含10个核苷酸的窗口内),而且阴性对照中未见类似含量的突变,才被归入NHEJ突变。具有相同突变的多个NHEJ突变读段被计数为单个读段,只计一次;目视确认出现频率排名前十的那些突变都出现在预期的切割位点内。然后,使用目视确认的NHEJ突变总数,基于读段总数,计算一段长度适宜读段与条形码和正向引物完全匹配的突变体读段的百分比(%)。
通过深度测序,靶向三个EPSPS靶标(SEQ ID NO:12、13、14)的向导RNA/Cas内切核酸酶系统相比于仅cas9对照,NHEJ突变的恢复频率在表3中示出。此数据表明,本文所述的向导RNA/Cas内切核酸酶系统可用于在感兴趣的基因组位点处引入双链断裂。编辑EPSPS靶标可以产生对基于草甘膦的除草剂有耐受性和/或抗性的植株。
表3.通过向导RNA/Cas系统在玉米烯醇式丙酮基莽草酸磷酸合酶靶基因座处产生 的突变读段百分比(%)
合在一起,这些数据表明:本文所述的使用单链向导RNA表达盒的玉米优化的向导RNA/Cas内切核酸酶系统切割玉米染色体DNA,并且产生NHEJ突变。
实施例3
向导RNA/Cas内切核酸酶系统将双链断裂(DBS)递送到玉米epsps基因座,从而得 到所需的点突变
开发了两种玉米优化的Cas9内切核酸酶,评估它们在基因组靶序列处引入双链断裂的能力。第一玉米优化的Cas9内切核酸酶如图2A所示(实施例1和表达盒SEQ ID NO:5)。第二玉米优化的Cas9内切核酸酶(moCas9内切核酸酶;SEQ ID NO:22(蛋白质)和23(DNA)),通过将信号添加到moCas9编码序列的5’端(图5),为该内切核酸酶补充SV40核定位信号。随后,为增强植物moCas9表达盒在玉米细胞中的表达并消除其在大肠杆菌和农杆菌中的表达,通过将ST-LS1内含子插入到moCas9编码序列中,对植物moCas9表达盒进行修饰。玉米泛素启动子序列和马铃薯蛋白酶抑制剂II基因终止子序列与moCas9内切核酸酶基因设计互补。moCas9表达盒的结构元件示于图5,其氨基酸序列和核苷酸序列作为SEQ ID No:22和23列出。
单向导RNA(sgRNA)表达盒基本上如实施例1所述并且在图2D中示出。由U6聚合酶III玉米启动子(SEQ ID NO:9)及其同族U6聚合酶III终止序列(TTTTTTTT)组成。向导RNA(SEQ ID NO:24)包含20个核苷酸长的可变靶向域(SEQ ID NO:24中第1至20位核苷酸),随后是能与诱导双链断裂的内切核酸酶相互作用的RNA序列。
EPSPS密码子序列内的玉米优化的Cas9内切核酸酶靶序列(moCas9靶序列)与向导sgRNA(确定Cas9内切核酸酶在EPSPS编码序列内切割的位点)的20个核苷酸长的可变序列互补。
合成moCAS9靶序列(SEQ ID NO:39中第25至44位核苷酸),并且将其克隆进向导RNA-Cas9表达载体,该载体被设计成通过农杆菌介导转化将向导RNA-Cas9系统的组分递送到BMS(墨西哥黑甜玉米(Black Mexican Sweet))细胞。还利用农杆菌T-DNA递送了酵母FLP位点特异性重组酶和WDV(小麦矮小病毒)复制相关蛋白(复制酶)。由于moCas9靶序列侧接有FLP重组靶点(FRT),因而被玉米细胞中的FLP切除,形成附加体(染色体样)结构。这种环状DNA片段通过WDV复制酶(复制起点嵌入WDV启动子)进行复制,这使它们能够在大肠杆菌细胞内恢复。如果玉米优化的Cas9内切核酸酶在moCas9靶序列处造成双链断裂,其修复便可能产生突变。下列文献详细讲述了该过程:Lyznik,L.A.,Djukanovic,V.,Yang,M.和Jones,S.(2012)Double-strand break-induced targeted mutagenesis in plants.发表于:Transgenic plants:Methods and Protocols(Dunwell,J.M.和Wetten,A.C.编辑).NewYork Heidelberg Dordrecht London:Springer,第399-416页。
使用本文所述玉米优化的Cas9内切核酸酶之一的向导RNA/Cas9内切核酸酶系统在moCas9靶序列中产生双链断裂(表4)。表4示出使用SEQID NO:23的moCas9内切核酸酶或SEQ ID NO:5的玉米优化的Cas9内切核酸酶在玉米BMS细胞中诱变的moCas9靶序列的百分比。两种向导RNA/Cas内切核酸酶系统都在来自玉米BMS细胞且从其恢复的附加体DNA分子上可用的67%至84%的moCas9靶序列处产生双链断裂(根据靶向诱变事件的数目判断)。经诱变的EPSPS靶序列的样本示于图6。该观察结果表明,本文所述的玉米优化的Cas9内切核酸酶在玉米细胞中起作用,并在moCas9靶序列处有效产生双链断裂。
表4.玉米BMS细胞中由玉米优化的Cas9内切核酸酶诱变的moCas9靶序列的百分比
为完成玉米染色体EPSPS基因的靶向基因组编辑,在一个方面,创建多核苷酸修饰模板(SEQ ID NO:25),用于为编辑EPSPS编码序列提供遗传信息,并将该多核苷酸修饰模板与向导RNA/Cas9系统组分共递送。
如图4所示,相比待编辑的天然EPSPS基因组序列,该多核苷酸修饰模板包含三个核苷酸修饰(用箭头指出)。这三个核苷酸修饰导致以下氨基酸改变:T-102改变为I-102,P-106改变为S-106,所以被称为TIPS突变。第一点突变由密码子序列ACT中的C核苷酸被T核苷酸置换为T核苷酸引起;第二点突变由相同密码子序列ACT中的T核苷酸被C核苷酸置换,形成异亮氨酸密码子(ATC)引起;第三点突变由密码子序列CCA中的第一C核苷酸被T核苷酸置换,形成丝氨酸密码子TCA引起(图4)。如SEQ ID NO:26:atcgcaatgcggtca所示,前述两种密码子序列彼此相距不足9个核苷酸。这三种核苷酸修饰以粗体示出。两种密码子之间的核苷酸与epsps基因座上未编辑的天然EPSPS基因是同源的。该多核苷酸修饰模板还包含玉米EPSPS基因组序列的DNA片段,这些DNA片段在EPSPS基因编辑过程中用作同源序列。同源序列的短臂(HR1-图4)为810个碱基对长,并且同源序列的长臂(HR2-图4)为2,883个碱基对长(SEQ ID NO:25)。所用的EPSPS模板序列中没有一个编码功能EPSPS蛋白。
在该实施例中,EPSPS多核苷酸修饰模板作为质粒(参见模板载体1,图7),采用粒子枪轰击法,与向导sgRNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含实施例1中所述的玉米优化的Cas9内切核酸酶表达盒(SEQ ID NO:5),并且还包含moPAT选择性标记基因。将10至11天龄未成熟胚芽的胚轴朝下置于装有N6培养基(表5)的板中,并且在28℃下温育4至6小时,再进行轰击。将这些板置于PDS-1000装置中底部起第三层搁架上,并且以200psi轰击。后轰击,在黑暗中于28℃温育胚芽过夜,然后转移至装有N6-2培养基的板中,在28℃下培养6至8天。将胚芽转移到装有N6-3培养基的板中培养3周,然后转移相应的愈伤组织至装有N6-4培养基的板中,再进行三周选择培养。经共计六周28℃选择培养后,将少量所选组织转移到MS再生培养基上,并且在黑暗中于28℃温育三周。
表5.培养基成分
通过以下步骤提取DNA:将愈伤组织细胞样本、两个不锈钢珠和450μL提取缓冲液(250mM NaCl,200mM Tris-HCl(pH 7.4),25mM EDTA,4.2M盐酸胍)放入Mega滴定架的每个管中。将架子在1650r.p.m的Genogrinder中摇动60秒并且在4℃在3000×g下离心20分钟。将300μl上清液转移到Unifilter 96孔DNA Binding GF/F Microplate(770-2810,Whatman,GE Healthcare)的孔中。将微板置于多孔板真空歧管(5017,Pall LifeSciences)的顶部。施加真空压力,直到孔完全变干。用100μL提取缓冲液重复一遍真空过滤过程,然后用250μL洗涤缓冲液(50mM Tris-HCl(pH 7.4),200mM NaCl,70%乙醇)重复两遍真空过滤过程。通过将GF/F过滤板置于空的废液收集板上,除去残余乙醇,并且以3000×g离心10min。在100μL洗脱缓冲液(10mM Tris-HCl,pH 8.3)中洗脱DNA,并且以3000×g离心1min。每个样本进行四次不同的PCR反应(F-E2、F-T、H-T和F-E3)。在20μl总体积中,包含大约40ng基因组DNA、10μl REDExtract-N-Amp PCR ReadyMix(R4775,Sigma-Aldrich Co.)和5皮摩尔每种引物。每个PCR反应的引物组合列于表6中。
表6.PCR反应的引物组合
对五个得自未转化玉米近交小植株的基因组DNA样本进行同样的PCR反应。在95℃初始变性5分钟后,使用DNA Engine Tetrad2热循环仪(BioRad Laboratories,Hercules,CA)进行每个PCR扩增,每次扩增执行35个以上循环:94℃变性30s,68℃退火30s,72℃延伸1min。将PCR产物F-E2、F-T和H-T与100bp DNA Ladder(N0467S,NewEngland Biolabs)在1%琼脂糖凝胶中以100伏特分离45分钟。为进行测序,使用TOPO TA克隆试剂盒(InvitrogenCorp,Carlsbad,CA)将来自所选择的愈伤组织的F-E3 PCR扩增片段克隆到pCR 2.1-TOPO载体中。在ABI 3700毛细管测序仪(Applied Biosystems,Foster City,CA)上,用BigDyeTerminator chemistry进行DNA测序。每个样本包含约0.5μg Topo质粒DNA和6.4皮摩尔引物E3-EPex3 Rev(ACCAAGCTGCTTCAATCCGACAAC,SEQ ID NO:34)。使用测序仪程序对序列进行分析。
筛选在包含双丙氨磷的培养基上选择的31个愈伤组织事件的样本(moPAT选择性标记基因为向导RNA-moCas9表达载体的一部分)是否存在TIPS点突变。24个事件包含已整合到基因组DNA中的TIPS点突变(图8,F-E2处理)。其中,6个事件显示染色体EPSPS基因的PCR扩增产物具有TIPS突变(图8,H-T处理)。PCR引物对(其中一个引物可与EPSPS多核苷酸修饰模板上没有的epsps基因组序列杂交,并且另一个引物结合到存在于EPSPS多核苷酸修饰模板上的经编辑的EPSPS序列)将epsps-TIPS编辑产物与野生型EPSPS等位基因或TIPS突变的随机插入区分开。如果编辑一个EPSPS等位基因以包含TIPS置换,则无论在PCR扩增过程期间是否选择TIPS置换,这种经编辑的等位基因都应被检测为源自基因组epsps基因座的DNA片段。用野生型EPSPS引物替换TIPS引物(表6,F-E3引物对),并且将PCR扩增产物克隆进TOPO克隆载体,然后测序。测序数据代表所选事件之一中基因组epsps基因座序列的随机样本(图9,愈伤组织A12 3360.92)。图9示出,在不改变任何其它epsps核苷酸的情况下,本文所公开的方法使得成功编辑了三种负责TIPS突变的核苷酸(图9中以粗体示出),同时未诱变moCas9靶序列(向导RNA的结合位点在图9中加下划线)。
另外,其它EPSPS等位基因未被编辑,表明在该特定事件中只编辑了一个EPSPS等位基因(图9B)。
实施例4
向导RNA/Cas内切核酸酶系统将双链断裂递送到玉米epsps基因座,导致玉米植株 含有经编辑的epsps-TIPS基因
如实施例3所述产生并选择EPSPS基因编辑事件。概括地说,EPSPS多核苷酸修饰模板作为质粒(参见模板载体1,图7),采用粒子枪轰击法,与向导RNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含实施例1所述的玉米优化的Cas9内切核酸酶表达盒(SEQ ID NO:5),并且还包含moPAT选择性标记基因。
在28℃下选择培养6周后,将少量所选择的组织转移到MS再生培养基上,并且在黑暗中于28℃下温育3周。3周后,将可见苗转移到包含MS-1培养基的平板上,并且在26℃下光照培养1至2周,直至苗生长至适宜送入温室,然后将其转移至平地土壤。Ms-1培养基包含:4.3g/L MS盐(Gibco 11117),5.0ml/L MS维生素原液(Sigma M3900),100mg/L肌醇,40.0g/L蔗糖,和6.0g/L细菌用琼脂(pH 5.6)。
采用上述程序,由3282个胚芽培育出了390株T0玉米植株,因此,转化总效率为12%,这进一步表明本文所用的向导RNA/Cas系统只产生较低毒性或无毒性(表7)。
表7.EPSPS编辑的转化效率
将T0小植株移至温室7至10天后,从每个T0小植株提取DNA,如实施例3所述进行PCR程序,以筛选T0植株在epsps基因座处是否有突变。
如实施例3所述的终点PCR程序测定,所分析的T0植株中的72%(270/375,表8)包含经诱变EPSPS等位基因。大多数突变(230/375或89%)是易错非同源末端连接(NHEJ)造成的,然而40株T0植株(40/375或11%)包含TIPS编辑的epsps等位基因,这表明涉及模板化双链断裂修复机制(表8)。
表8.epsps基因座处的突变
用引物对(表6,F-E3引物对)来扩增包含来自所选择的T0植株基因组DNA的moCas6靶序列和EPSPS编辑位点的epsps基因座的天然同源片段。将PCR扩增产物克隆进TOPO克隆载体,并且如实施例3所述进行测序。测序数据表示来自特定T0植株的基因组epsps基因座序列的随机样本(表9),并且还指明所选择的T0植株的基因型。转移到盆中的含epsps-TIPS等位基因的T0植株列于表9中(选自初始40个含TIPS事件的一组T0植株)。
表9.在T0植株中观察到的epsps基因座的基因型。TIPS是指包含TIPS编辑的epsps 序列的克隆。NHEJ是指存在NHEJ突变;并且WT是指存在由天然epsps基因座扩增的野生型 EPSPS序列。
如表9所示,所选择的植株E1以及E3至E9包含epsps-TIPS编辑型式的EPSPS基因,要么随附野生型EPSPS等位基因(WT),要么随附NHEJ诱变的epsps等位基因(NHEJ)。表9中TIPS、WT、NHEJ前的数字指明鉴定特定型式EPSPS等位基因的频率。如果所有克隆都包含TIPS编辑的EPSPS序列,则所分析的植株可能是epsps-TIPS等位基因纯合植株(参见例如E2)。如果仅约50%的克隆包含TIPS编辑的epsps序列,则所分析的植株可能是epsps-TIPS等位基因半合植株(参见例如E1)。其它植株(诸如E3或E4)可能是TIPS嵌合植株。在一个事件E2中,T0植株在epsps基因座处仅包含TIPS编辑的序列,这表明,本文公开的向导RNA/Cas内切核酸酶系统在玉米植株中epsps基因座处成功编辑了负责两个epsps-TIPS等位基因的三个核苷酸(图9B中以粗体示出)。
对所选择的T0植株执行qPCR分析,以估计野生型EPSPS基因和moCas9内切核酸酶序列的拷贝数。对于来自T0植株的DNA样本,进行玉米EPSPS基因和ADH持家基因的多重qPCR扩增。PCR反应所用的引物和探针示于表10。
表10.用于T0植株qPCR分析的引物
所有分析都是使用LightCycler 480实时PCR系统(Roche Diagnostics)进行的。将wtEPSPS基因型的阈值设定为1.76。将EPSPS拷贝数小于1.76,终点荧光测量值最高也不足野生型对照两倍的每种样本归类为一种等位基因EPSPS基因型(相对野生型EPSPS等位基因为半合子)。
采用qPCR方法估计TIPS序列拷贝数。qPCR反应所用的引物和探针示于表11。
表11.qPCR分析中为估计TIPS序列拷贝数而使用的引物
将具有ΔCt值的比较Ct值法归一化为双等位基因TIPS基因型的平均ΔCt值,提供了对所分析植株样本中检测到的TIPS序列的拷贝数估计。
表12:所选择的T0植株的qPCR基因分型和拷贝数。
qPCR基因分型表明,在所选择的T0植株的事件E1、E2、E7、E8和E9中未检测到野生型EPSPS等位基因(野生型EPSPS等位基因数目,表12)。所选择的T0植株中存在TIPS模板序列和moCas9编码序列两者,据推测,这是由于与转化过程相关联的随机插入所致(表12:就TIPS模板序列而言,T0植株的E1、E7和E9事件)。如果两种遗传元件(随机插入的TIPS模板和moCas9表达盒)并非都连接至编辑的epsps-TIPS基因,则可采用标准育种程序在T1子代中将这两种遗传元件分离。
T0植株在温室中生长良好,并可繁殖。使用设定为每英亩20加仑的喷雾室,用1X剂量草甘膦喷洒处于V3生长阶段的T0植株样本。1X剂量草甘膦如下制备:将2.55ml Powermax溶于300ml水(活性成分:草甘膦即N-(膦酰基甲基)甘氨酸的钾盐形式,48.7%)。施用草甘膦后第7天,一些T0植株未观察到叶组织损坏。这些小植株是epsps-TIPS等位基因半合植株,而其它小植株严重损坏。施用除草剂后第14天,观察到一棵植株的叶组织仍未出现损坏,该植株在epsps基因座的44个基因组克隆中包含21个epsps-TIPS等位基因(如实施例3所述克隆并测序)。该T0植株被称为在epsps基因座处半合的。
这些数据表明,向导RNA/Cas系统可用于在玉米中产生TIPS编辑的EPSPS等位基因。还获得在epsps基因座处纯合(两个epsps-TIPS等位基因)且未插入附加的TIPS模板的玉米植株(植株E2)。此外,一些epsps-TIPS编辑的玉米T0植株的确显示出对1X剂量草甘膦具有一定程度耐受性。
实施例5
含有epsps-TIPS编辑的基因的玉米植株的F1子代的表征
使如实施例3和4中所述产生和表征的含有一个或两个epsps-TIPS等位基因的两个T0植株(E1和E2)与野生型玉米亲本植株交叉授粉。收集种子,将其干燥并种植。针对wt-EPSPS、修饰EPSPS、Cas9和moPAT序列的存在对出苗的幼苗进行基因分型(表13)。“基因组TIPS”表示EPSPS基因的TIPS编辑的等位基因(阴性=TIPS修饰不存在,阳性=在epsps基因座处存在TIPS修饰),“Cas9 CDS”表示Cas9编码序列的诊断片段,“moPAT CDS”-选择性标记基因的诊断DNA片段,“TIPS序列”-含有TIPS编辑的序列的DNA片段的总数,“Wt EPSPS等位基因”-未经编辑或修饰的野生型EPSPS等位基因的数目。“阴性”是指未通过PCR扩增外源DNA片段。
表13.分离出用于转化的载体DNA的遗传元件的F1子代玉米植株的列表
选择、培育含有一个野生型EPSPS等位基因和一个epsps-TIPS等位基因(在epsps基因座处半合)的F1子代植株诸如表13中的植株#3并使其自花授粉。收集F2种子。F2群体包含产生野生型F2植株、在epsps基因座处半合和纯合的F2植株的分离的EPSPS等位基因。
实施例6
来自所选的F1植株的F2子代的胚拯救
在V3生长阶段,用300ml水中的2.55ml Powermax(草甘膦溶液)以20加仑/英亩的设置喷洒E1和E2亲本植株的F1植株子代的随机样本。含有epsps-TIPS编辑的等位基因的F1植株在草甘膦施用中存活下来,而不含epsps-TIPS等位基因的其它F1植株表现出严重的叶组织损伤(干枯、褐色叶子)。含有epsps-TIPS的植株的生长减慢并且随时间推移植株在新萌发的叶子上生长出叶组织的发白节段。
对于来自自交的F1植株的F2子代幼苗的胚拯救,在授粉18天后收获穗并将穗在20∶80漂白剂/水混合物中灭菌。将胚切下并放置在具有或没有0.1mM、0.5mM、1mM、3mM浓度的草甘膦的生根培养基(272V-4.3g/L Murashige和Skoog基础盐混合物,5.0ml/L MS维生素原液、100mg/L肌醇(mio-inositol)、40g/L蔗糖、6g/L Bacto琼脂)上。将它们转移至26℃的明亮房间并且使其萌发7天。含有野生型EPSPS等位基因、对于epsps-TIPS等位基因半合和纯合的胚在没有草甘膦的培养基上发芽。在培养基中的0.1mM草甘膦浓度下,只有含有epsps-TIPS等位基因的胚产生绿色幼苗。epsps-TIPS等位基因在所分析幼苗中的存在指示为“阳性”或“阴性”,而野生型EPSPS等位基因拷贝数在右侧列出示出(表14)。
表14.在含有0.1、0.3、0.5、1.0和3.0mM草甘膦的培养基上发芽的F2幼苗的基因型
在含有0.1mM草甘膦或最高3mM的任何其它浓度的草甘膦的培养基上的发芽的胚中未检测到野生型幼苗。此外,在epsps基因座处对于epsps-TIPS等位基因纯合的胚在1.0mM草甘膦浓度下产生绿色幼苗,而半合胚则不能。发芽的胚中草甘膦耐受性水平与经编辑的epsps-TIPS等位基因的存在以及它们的剂量(一个或两个等位基因)相关。
实施例7
使用向导RNA/Cas9系统编辑玉米EPSPS基因
可使用EPSPS多核苷酸修饰模板在玉米epsps基因座中引入氨基酸置换。可合成EPSPS-多核苷酸修饰模板并使用对应的SphI和SpeI限制位点将其插入图7所述的模板载体中。EPSPS多核苷酸修饰模板可作为质粒DNA使用粒子枪轰击法与向导RNA表达盒和玉米优化的Cas9内切核酸酶表达载体一起共递送。
可培育植株并分析其中是否存在氨基酸突变,如实施例3、4和5中所述。
实施例8
玉米EPSPS的变体
除实施例3中所述的TIPS突变之外的降低草甘膦敏感性的EPSPS突变是本领域中已知的(US 8,436,159)并且也可引入(与TIPS结合或不结合)到玉米EPSPS基因中,如实施例3所述。另外,可通过本领域技术人员已知的方法鉴定新型EPSPS突变。本文所述的向导多核苷酸/Cas内切核酸酶系统可用于在EPSPS基因中引入这些突变中的任一个、或这些突变的任意组合并且可针对除草剂抗性对所得的玉米EPSPS变体进行评估。
实施例9
使用向导RNA/Cas9内切核酸酶系统复制天然EPSPS基因
在玉米中存在一种天然EPSPS基因。实施例5中所述的F1子代植株在epsps-TIPS基因座处为半合的。具有EPSPS基因的两个功能拷贝的玉米植株积聚两倍于具有一个功能EPSPS基因拷贝的植株的EPSPS蛋白(表15)。野生型ETX植株的叶片样本中EPSPS肽的量与在epsps基因座处半合(一个EPSPS等位基因被敲除)的玉米植株相比增加了一倍。
表15.在野生型和突变EPSPS玉米植株的叶片样本中鉴定的特征EPSPS肽的峰面积
可使用本文所述的向导RNA/Cas9内切核酸酶基因编辑程序,例如通过使用作为SEQ ID NO:54列出的EPSPS多核苷酸复制模板来复制天然EPSPS基因。该多核苷酸修饰模板的遗传元件在图11示出。实施例3和4所述的程序将TIPS置换引入EPSPS基因的两个拷贝中并且由编辑性DNA模板(图11)拷贝天然EPSPS基因的复制片段。EPSPS-复制多核苷酸修饰模板作为质粒DNA,采用粒子枪轰击法,与向导RNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含本文所述的玉米优化的Cas9内切核酸酶表达盒并且还包含moPAT选择性标记基因。在经编辑的epsps基因座处纯合的所得F2玉米植株包含四个epsps-TIPS编码序列,可针对这些植株的植物组织中的升高的EPSPS-TIPS蛋白水平对所述植株进行评估。
实施例10
玉米EPSPS天然基因的启动子修饰
玉米细胞中的蛋白质积累随蛋白编码基因的转录活性变化。EPSPS启动子是弱转录控制遗传元件,而源自一组不同的植株的泛素启动子已知是高活性且强效的。EPSPS多核苷酸玉米泛素启动子模板诸如SEQ ID NO:55可被设计成允许epsps基因座的编辑以包含置于epsps-TIPS编码序列(epsps-ubiTIPS)前面的玉米泛素启动子(图12)。EPSPS-多核苷酸玉米泛素启动子模板作为质粒,采用粒子枪轰击法,与向导sgRNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含玉米优化的Cas9内切核酸酶表达盒并且还包含moPAT选择性标记基因。使用实施例3和4所述的程序编辑玉米植株。可与由天然EPSPS基因启动子驱动的epsps-TIPS等位基因(和蛋白质积累)相比,在T0植株和它们子代的玉米组织中评估epsps-ubiTIPS等位基因的表达水平和EPSPS-TIPS蛋白积累。
启动子修饰,诸如针对玉米描述的启动子修饰,不限于玉米并且还可通过本文所述的方法提供给任何植物。可鉴定EPSPS基因阻遏蛋白的DNA识别位点并且使用本文所述的基因编辑技术在植物基因组中引入它们的天然位置。例如,可通过消除或改变EPSPS基因的启动子内的阻遏元件(或植物基因组张的任何EPSPS阻遏蛋白序列)产生基因经编辑的植物,其中所述植物在不同的环境条件下表现出较高的EPSPS活性、产生更高的产量并且提供增强的草甘膦抗性。增加的EPSPS活性还可通过用另一启动子替代天然EPSPS启动子来实现,所述另一启动子诸如但不限于组成型启动子、组织特异性启动子、人工启动子、嵌合启动子、得到具有更高产率和增强的草甘膦抗性的植物的经编辑的启动子。可添加或修饰启动子调控元件,以提供增强启动子活性并导致增强的EPSPS活性的正调控元件。上述改变中的任一个可由其自身或彼此结合提供,诸如将阻遏元件的消除或改变与正调控元件的添加或修饰结合起来,以导致增强的启动子活性并导致增加的EPSPS活性和增强的草甘膦抗性。
实施例11
使用向导RNA/Cas9内切核酸酶系统编辑EPSPS基因泛素化位点
待降解的蛋白质上存在限定的泛素化位点,通过利用专用计算机程序(例如CKSAAP_UbSite(Ziding Zhang′s Laboratory of Protein Bioinformatics,College ofBiological Sciences,China Agricultural University,100193 Beijing,China),已在玉米EPSPS蛋白内发现了这些泛素化位点。图13A示出玉米EPSPS编码序列内的一个所选择的聚泛素化位点,并将该位点的氨基酸特征序列与来自其它植物的同等EPSPS位点进行比较(图13A)。将第90位氨基酸赖氨酸(K)(在其它种类植物中高度保守)选择为EPSPS蛋白质聚泛素化的潜在位点。用于编辑epsps基因座的多核苷酸修饰模板(称为玉米EPSPS多核苷酸K90R模板)作为SEQ ID No:56列出。该模板允许编辑epsps基因座,以使其第90位氨基酸赖氨酸(K)被置换成精氨酸(R)(K90R),还使其第102位与第106位的氨基酸出现另外两种TIPS置换(图13B和13C)。使用本文所述的向导RNA/Cas内切核酸酶系统编辑玉米基因组DNA,并如本文所述产生T0植株。通过本文所述的基因分型方法选择包含核苷酸修饰(由K90R模板上的信息(图13C)指定)的T0植株。为了升高的蛋白含量,可选择F1epsps-K90RTIPS植株,因为这种植株的EPSPS蛋白降解速率较慢。
实施例12
编辑内含子元件以引入内含子介导的增强子元件(IME)
可使用在邻近其它转录控制元件的位置处的转录增强子来调控天然EPSPS基因的转录活性。已知内含子包含增强子元件,从而影响天然启动子(包括EPSPS启动子)转录的总体速率。例如,玉米泛素5’UTR的第一内含子赋予单子叶植物高表达水平,如专利申请WO2011/156535 A1所指明。通过被授予专利的分析法(2011年12月15日公布的WO2011/156535A1中提出)鉴定了内含子增强基序CATATCTG(图14A)(也称为内含子介导的增强子元件IME),并在EPSPS第一内含子的5’端选择适当的核苷酸位点用于进行编辑,从而引入内含子介导的增强子元件(IME)(图14B-14C)。多核苷酸修饰模板(称为玉米EPSPS多核苷酸IME模板)以SEQ ID NO:57列出。该多核苷酸修饰模板允许编辑epsps基因座,使其在EPSPS第一内含子中包含三个IME(两个IME位于DNA的一条链上,另一个IME位于DNA的反向链上),并在第102位和第106位处具有TIPS置换。然后,使用本文所述的向导RNA/Cas9内切核酸酶系统来编辑玉米植株的基因组DNA。通过对T0植株进行基因分型,可选择包含IMETIPS编辑的EPSPS编码序列的玉米植株,然后可进一步评估这些玉米植株由于经编辑EPSPS基因的转录速率增大而引起的EPSPS-TIPS蛋白含量提高并评估其草甘膦抗性。
实施例13
使用向导RNA/Cas9内切核酸酶系统编辑剪接位点和/或引入替代性剪接位点
在玉米细胞中,剪接过程受外显子-内含子连接位点处的剪接位点影响,如产生EPSPS mRNA的过程所示(图1SA-15B)。图15A示出EPSPS扩增的前mRNA的分析结果(左侧cDNA板)。图15A中泳道14显示包含未剪接的第三内含子的EPSPS的前mRNA的扩增,导致产生表征替代性剪接事件的804bp诊断片段。泳道E3和F8显示由常规剪接内含子产生的EPSPS PCR扩增片段。除非合成了cDNA,否则不扩增诊断片段(诸如泳道14的804bp片段),包含总RNA的泳道E3、14和F8中未出现谱带(如图15A右侧的总RNA板所示)证实了这一点。玉米EPSPS基因中以及来自其它物种的基因中典型的剪接位点是AGGT,而其它(改变的)剪接位点变体可能导致对前mRNA分子的处理异常。EPSPS编码序列包含多个替代性剪接位点,这些替代性剪接位点可能影响前mRNA成熟过程的总效率,因而可能限制EPSPS蛋白在玉米细胞中积聚。
为限制EPSPS基因表达期间替代性剪接事件的发生率,可使用本文所述的向导RNA/Cas9内切核酸酶系统来编辑剪接位点。第二天然EPSPS内含子与第三外显子的连接处的剪接位点是AGTT,可对该剪接位点进行编辑,以便在该连接处引入典型的剪接位点AGGT(图16)。T被置换为G不影响天然EPSPS开放阅读框,也未改变EPSPS氨基酸序列。多核苷酸修饰模板(称为玉米EPSPS多核苷酸T剪接模板)以SEQ ID NO:58列出。该多核苷酸修饰模板允许编辑epsps基因座,使其在第二内含子与第三外显子的连接位点处包含典型的AGGT剪接位点,并在第102位和第106位处具有TIPS置换。使用本文所述的过程编辑玉米植株。可评估F1 epsps-T剪接玉米植株的草甘膦抗性以及由于功能性EPSPS mRNA信息产量增加而引起的蛋白含量的提高。
实施例14
通过编辑天然EPSPS基因的编码序列提高其基因活性
在玉米基因中存在若干与转录水平增强相关联的元件,同样它们可导致增强的蛋白质合成。它们不局限于编码区域的特定序列,相反它们有利于感兴趣的基因的编码序列的整体结构。其中有可减慢翻译过程的玉米稀有密码子(示例可包括S79-AGT>AGC、V106-GTA>GTT、V155-GTA>GTG、R189-CGT>CGC、L196-CTA>CTT)、可导致蛋白质合成异常终止的框外(out-of-frame)开放阅读框、可有助于mRNA模板的过早降解的mRNA去稳定位点、可影响前mRNA剪接过程的隐藏内含子、转座子插入位点以及其它。在玉米EPSPS编码序列中鉴定了多个此类元件。这些元件可使用玉米EPSPS多核苷酸模板诸如SEQ ID NO:59消除或修饰。可使用实施例3和4所述的程序编辑玉米植株。由于功能性EPSPS mRNA信息的产生增加、它们在蛋白质合成中的稳定性和利用率提高,在所选择的F1 EPSPS-合成植株中EPSPS-TIPS蛋白含量可增加。可评估经编辑植株的草甘膦抗性。
实施例15
玉米未成熟胚芽的转化
转化可通过已知在植物中有效的各种方法来实现,包括粒子介导递送、农杆菌介导转化、PEG介导递送和电穿孔。
a.粒子介导的递送
按以下步骤,利用粒子递送技术转化玉米未成熟胚芽。培养基配方如下所示。
给穗去皮,用30%Clorox漂白剂加0.5%微洗涤剂表面消毒20分钟,再用无菌水冲洗两次。分离未成熟胚芽,胚轴一侧朝下(盾片一侧朝上)放置,每板放25个胚芽,置于560Y培养基中保持4小时,随后在2.5cm靶区域内对准,准备接受轰击。另选地,将分离的胚芽置于560L(起始培养基)上,并且置于暗处,26℃至37℃温度范围内放置8小时至24小时,然后置于560Y上,在26℃下保持4小时,再如上所述进行轰击。
使用标准分子生物学技术构建包含双链断裂诱导剂和供体DNA的质粒,然后与包含发育基因ODP2(AP2域转录因子ODP2(胚珠发育蛋白2);US20090328252 A1)和Wushel(US2011/0167516)的质粒共轰击。
如下,使用水溶性阳离子脂质(Cat#E1811,Promega,Madison,WI,USA),将受关注的质粒和DNA沉淀在0.6μm(平均直径)的金粒料上。首先使用1μg质粒DNA,以及任选地其它共轰击用构建体诸如各50ng(0.5μl)、包含发育基因ODP2(AP2域转录因子ODP2(胚珠发育蛋白2);US20090328252 A1)和Wushel的质粒,在冰上制备DNA溶液。向预混的DNA中,在水中加入20μl制备的金微粒(15mg/ml)和5μl Tfx-50并小心地混合。金微粒在微量离心管中以10,000rpm粒化1分钟并且除去上清液。所得的粒料小心地用100ml 100%EtOH冲洗,而不将粒料重新悬浮,并且小心地除去EtOH冲洗剂。加入105μl 100%EtOH并且通过简单超声将颗粒重新悬浮。然后,将10μl点样到每个载体的中心,并使其轰击前干燥约2分钟。
另选地,使用氯化钙(CaCl2)沉淀程序,通过将100μl制备的钨微粒的水溶液、10μl(1μg)DNA的Tris EDTA缓冲液(1μg总DNA)、100μl 2.5M CaCl2,以及10μl 0.1M亚精胺混合,将感兴趣的质粒和DNA沉积到1.1μm(平均直径)钨粒料上。在搅拌的同时,依次将每种试剂加入钨颗粒悬浮液。短暂超声处理最终混合物,并且使其置于恒定涡旋环境中温育10分钟。沉淀期之后,将各管短暂离心,弃去液体,用500ml 100%乙醇洗涤颗粒,然后离心30秒。同样,除去液体,并且将105μl 100%乙醇加入最终的钨微粒粒料中。就颗粒枪轰击而言,将钨/DNA微粒简单超声波处理。将10μl钨/DNA颗粒点样到每个大载体的中心,在轰击之前使点样的颗粒干燥约2分钟。
用Biorad氦基因枪以第四档(level#4)轰击样本板。从具有制备好的颗粒/DNA的每管取等分试样,共计十份,以450PSI轰击所有样本各一次。
轰击之后,将胚芽置于560P(维持培养基)上,在26℃至37℃范围内的温度下培养12至48小时,然后置于26℃温度下。5至7天后,将胚芽转移到含3mg/L双丙氨磷的560R选择培养基上,并且在26℃下每两周继代一次。在选择的约10周之后,抗选择愈伤组织克隆体转移到288J培养基中,以引发植物再生。在体细胞胚成熟(2-4周)之后,将发育良好的体细胞胚转移到培养基中用于发芽并转移到光照培养室。约7-10天之后,将发育中的苗转移到管中的272V无激素培养基中7-10天,直至苗良好地构建。然后将植物转移以插入包含盆栽土的平地(相当于2.5″盆)中,并在生长室中生长1周,随后在温室中生长另外的1-2周,然后转移到Classic 600盆(1.6加仑)并生长至成熟。监测植物,并对转换效率、和/或再生能力的修饰进行评分。
起始培养基(560L)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、20.0g/l蔗糖、1.0mg/l 2,4-D和2.88g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);2.0g/l固化剂(在用D-IH2O定容之后添加);以及8.5mg/l硝酸银(在将培养基灭菌并冷却至室温之后添加)。
维持培养基(560P)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、2.0mg/l 2,4-D和0.69g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);3.0g/l固化剂(在用D-IH2O定容之后添加);以及0.85mg/l硝酸银(在将培养基灭菌并冷却至室温之后添加)。
轰击培养基(560Y)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、120.0g/l蔗糖、1.0mg/l 2,4-D和2.88g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);2.0g/l固化剂(在用D-IH2O定容之后添加);以及8.5mg/l硝酸银(在将培养基灭菌并冷却至室温之后添加)。
选择培养基(560R)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、和2.0mg/l 2,4-D(用D-I H2O定容,之后用KOH调节至pH 5.8);3.0g/l固化剂(在用D-I H2O定容之后添加);以及0.85mg/l硝酸银和3.0mg/l双丙氨磷(两者均在将培养基灭菌并冷却至室温之后添加)。
植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆醇、以及0.40g/l甘氨酸(用精制D-I H2O定容)(Murashige和Skoog(1962)Physiol.Plant.15:473),100mg/l肌醇、0.5mg/l玉米素、60g/l蔗糖、以及1.0ml/l 0.1mM脱落酸(在调节至pH 5.6之后用精制D-I H2O定容);3.0g/l固化剂(用D-I H2O定容之后添加);以及1.0mg/l吲哚乙酸和3.0mg/l双丙氨磷(将培养基灭菌并冷却至60℃之后添加)。
无激素培养基(272V)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素原液(0.100g/l烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆辛和0.40g/l甘氨酸,用精制去离子水定容)、0.1g/l肌醇和40.0g/l蔗糖(在调至pH 5.6后用精制去离子水定容)和6g/l细菌培养用琼脂(在用精制去离子水定容后加入),灭菌并冷却至60℃。
b.农杆菌介导的转化
农杆菌介导转化基本上如Djukanovic等人(2006)Plant Biotech J4:345-57中所述执行。简而言之,将10-12日龄的未成熟胚芽(尺寸为0.8-2.5mm)从灭菌内核进行解剖并且置于液体培养基中(4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.690g/L L-脯氨酸、68.5g/L蔗糖、36.0g/L葡萄糖,pH 5.2)。胚芽收集后,用浓度为0.35-0.45 OD550的1ml农杆菌替换培养基。在室温下将玉米胚芽与农杆菌温育5分钟,然后将混合物倒入培养基板中,所述培养基板包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸银、0.1nM乙酰丁香酮以及3.0g/L固化剂,pH5.8。将胚轴向下在黑暗中于20℃下温育3天,然后在黑暗中于28℃下温育4天,然后转移到新的培养基板中,所述新培养基板包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.69g/L L-脯氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸银、3.0mg/L双丙氨磷、100mg/L羧苄青霉素以及6.0g/L琼脂,pH 5.8。将胚芽每三周继代培养直至鉴定转基因事件。将少量组织转移至再生培养基(4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、0.1μM ABA、1mg/L IAA、0.5mg/L玉米素、60.0g/L蔗糖、1.5mg/L双丙氨磷、100mg/L羧苄青霉素、3.0g/L固化剂,pH 5.6),并且在黑暗中于28℃培养两周,从而诱导体细胞胚发生。随后,将所有长出芽和根的材料转移到含有4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、40.0g/L蔗糖、1.5g/L固化剂,pH为5.6的培养基上,并且在人造光下于28℃温育。一周后,将小植株移入装有相同培养基的玻璃管中,并且使其生长直至再采样和/或将其移植到土壤中。
实施例16
使用向导RNA/Cas内切核酸酶系统对大豆EPSPS1基因进行基因编辑
A.设计大豆EPSPS基因上的向导RNA/Cas9内切核酸酶靶位点
在大豆EPSPS1基因Glyma01g33660的外显子2中鉴定出了两个向导RNA/Cas9内切核酸酶靶位点(大豆EPSPS-CR1和大豆EPSPS-CR2)(表16)。
表16.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点
B.使用向导RNA表达盒、Cas9内切核酸酶表达盒和多核苷酸修饰模板将特定氨基 酸变化引入大豆EPSPS1基因
使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达向导RNA,以引导Cas9核酸酶至指定的基因组靶位点(表17)。在第一质粒中连接大豆密码子优化的Cas9内切核酸酶(SEQ ID NO:82)表达盒与向导RNA表达盒,该第一质粒与多核苷酸修饰模板共递送。该多核苷酸修饰模板包含特定的核苷酸变化,该变化用于编码EPSPS1多肽(Glyma01g33660)中的氨基酸变化,诸如外显子2中的T183I和P187S(TIPS)。也可使用本文所述的向导RNA/Cas内切核酸酶系统获得EPSPS1多肽中的其它氨基酸变化。特定氨基酸修饰可通过基因组DNA和多核苷酸修饰模板之间的同源重组,在向导RNA/Cas内切核酸酶系统的促进下实现。
表17.将向导RNA/Cas9表达盒与多核苷酸修饰模板用于稳定转化大豆,以获得 EPSPS1基因的特定氨基酸修饰。
C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性非同源末端连 接(NHEJ)
从体细胞胚芽样本中提取基因组DNA,并且采用7500实时PCR系统(AppliedBiosystems,Foster City,CA)通过使用靶位点特异性引物和FAM标记荧光探针进行定量PCR分析,以检查双链断裂靶位点的拷贝数变化。以双重反应形式执行qPCR分析,采用syringolide诱导蛋白(SIP)作为内源性对照,采用包含靶位点(带2个等位基因)的一个拷贝的野生型93B86基因组DNA样本作为单拷贝校准品(calibrator)。还使用了向导RNA/Cas9的qPCR引物/探针(SEQ ID:70-72)和PinII的qPCR引物/探针(SEQ ID:73-75),分析转基因事件中是否存在向导RNA-Cas9表达盒。qPCR引物/探针列于表18。
表18.用于转基因大豆事件的qPCR分析的引物/探针
用VIC标记内源性对照探针SIP-T,用FAM标记用于所有靶位点的基因特异性探针,以同时检测两根荧光探针(Applied Biosystems)。捕集PCR反应数据,使用7500实时PCR系统提供的序列检测软件进行分析,并使用相对定量方法(Applied Biosystems)计算基因拷贝数。
由于带双链断裂靶位点的两个等位基因的野生型93B86基因组DNA被用作单拷贝校准品,所以,靶位点没有任何变化的事件将作为一个拷贝被检测到,本文称为Wt-Homo(qPCR值>=0.7);一个等位基因变化的事件不再可被靶位点特异性qPCR检测到,将作为半个拷贝被检测到,本文称为NHEJ-Hemi(0.1<qPCR值<0.7);两个等位基因都变化的事件将作为无效事件被检测到,本文称为NHEJ-Null(qPCR值=<0.1)。如表19所示,靶向大豆EPSPS-CR1位点和EPSPS-CR2位点的向导RNA/Cas内切核酸酶系统都能在其指定的靶位点处有效引入双链断裂(DSB)。我们在93B86基因型中检测到了NHEJ-Hemi和NHEJ-Null两者。通过PCR/TOPO克隆/测序确认向导RNA/Cas9系统在特定的Cas9靶位点处介导了NHEJ(非同源末端连接)突变。
表19.向导RNA/Cas9系统在大豆EPSPS1基因上诱导靶位点双链断裂突变率。数字 表示事件的数量(括号内的数字为百分比)
D.检测大豆EPSPS基因中的TIPS突变
为在天然EPSPS基因上编辑特定氨基酸(诸如导致TIPS修饰的那些),将多核苷酸修饰模板(诸如RTW1013A或RTW1012A(表17))与向导RNA/Cas9表达盒共递送到大豆细胞中。
通过特异性PCR分析确定向导RNA/Cas9系统介导的DNA同源重组引起的天然EPSPS1基因的修饰,如图17所示。使用引物对WOL569(SEQ ID NO:79)和WOL876(SEQ ID NO:80)执行特异性PCR测定,检测天然EPSPS1基因中的完全的TIPS修饰。使用第二引物对WOL569(SEQ ID NO:79)和WOL570(SEQ ID NO:81)来扩增TIPS修饰的EPSPS1等位基因和WT(野生型)/NHEJ突变的等位基因。使用TOPO克隆/测序来验证序列。对于EPSPS-CR2,使用EPSP1基因中的TIPS编辑产生七株T0植株。对于该事件中的EPSPS1基因,将一个等位基因编辑为TIPS并且用非同源末端连接(NHEJ)将第二等位基因修复为2bp的缺失。
实施例17
使用向导RNA/Cas内切核酸酶系统进行大豆基因的内含子替换
A.设计向导RNA/Cas9内切核酸酶靶位点。
在大豆EPSPS1基因Glyma01g33660中鉴定出了四个向导RNA/Cas9内切核酸酶靶位点(表20)。经鉴定,这四个靶位点中的两个(大豆EPSPS-CR1和大豆EPSPS-CR2)靶向大豆EPSPS基因的外显子2,如实施例16所述。另两个靶位点(大豆EPSPS-CR4和大豆EPSPS-CR5)被设计成邻近大豆EPSPS基因的内含子1的5’端。
表20.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点。
B.用向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板,实现用大豆泛素 (UBQ)内含子1替换大豆EPSPS1基因的内含子1,完成大豆稳定转化
使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达两种向导RNA(大豆EPSPS-CR1和大豆EPSPS-CR4,或大豆EPSPS-CR1和大豆EPSPS-CR5),以引导Cas9内切核酸酶至指定的基因组靶位点(表21)。靶位点之一(大豆EPSPS-CR1)位于外显子2中,如实施例16所述,第二靶位点(大豆EPSPS-CR4或大豆EPSPS-CR5)位于天然EPSPS1基因的内含子1的5’端附近。在表达质粒QC878/RTW1199(SEQ ID NO:63/85)或QC878/RTW1200(SEQ ID NO:63/86)中连接大豆密码子优化的Cas9内切核酸酶表达盒与向导RNA表达盒,这些表达质粒与多核苷酸修饰模板共递送。该多核苷酸修饰模板RTW1190A(SEQ ID NO:87)包含大豆UBQ基因的532bp内含子1和TIPS修饰的外显子2。可使用向导RNA/Cas系统,通过基因组DNA与多核苷酸修饰模板之间的同源重组,实现大豆UBQ内含子1替换大豆EPSPS1内含子1,从而增强天然或经修饰的大豆EPSPS1基因表达。
表21.在大豆稳定转化过程中,为用大豆泛素(UBQ)内含子1替换大豆EPSPS1基因 的内含子1而使用的向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板
C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性NHEJ
使用表22列出的qPCR引物/探针,如实施例16C所述检测了位点特异性NHEJ。
表22.用于转基因大豆事件的qPCR分析的引物/探针
D.使用向导RNA/Cas9内切核酸酶系统检测大豆UBQ内含子1对大豆EPSPS1内含子1 的替换
为将天然EPSPS1基因处的大豆EPSPS1内含子1替换为大豆UBQ内含子1,使用表22和图18所示的两种向导RNA表达载体。QC878载体(SEQ ID NO:63)靶向外显子2,并且RTW1199(SEQ ID NO:85)或RTW1200(SEQ ID NO:86)靶向内含子1的5’端。使用两个向导RNA/Cas系统在双重切割大豆EPSPS基因,导致除去天然的EPSPS1内含子1/部分外显子2片段。同时,将多核苷酸修饰模板RTW1190A(SEQ ID NO:87)共递送到大豆细胞中,多核苷酸修饰模板与基因组DNA之间的同源重组导致EPSPS1内含子1被替换为大豆UBQ内含子1,并且由PCR分析证实外显子2中的所需氨基酸修饰。然后使用引物对WOL1001/WOL1002(SEQ ID NO:92和93)以及WOL1003/WOL1004(SEQ ID NO:94和95)进行PCR测定,以检测内含子替换事件。
实施例18
使用向导RNA/Cas内切核酸酶系统完成大豆基因的启动子替换(启动子更换)
A.设计向导RNA/Cas9内切核酸酶靶位点
在大豆EPSPS1基因Glyma01g33660中鉴定出了四个向导RNA/Cas9内切核酸酶靶位点(表23)。经鉴定,这四个靶位点中的两个(大豆EPSPS-CR1和大豆EPSPS-CR2)靶向大豆EPSPS基因的外显子2,如实施例16所述。还鉴定出,大豆EPSPS-CR6和大豆EPSPS-CR7位于-798bp天然EPSPS启动子的5’端附近。
表23.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点。
B.用向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板,实现用大豆UBQ启动 子替换-798bp大豆EPSPS1启动子,完成大豆稳定转化。
使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达两种向导RNA(大豆EPSPS-CR1和大豆EPSPS-CR6,或大豆EPSPS-CR1和大豆EPSPS-CR7),从而引导Cas9核酸酶至指定的基因组靶位点(表24)。靶位点之一(大豆EPSPS-CR1)位于外显子2中,如实施例16所述,第二靶位点(大豆EPSPS-CR6或大豆EPSPS-CR7)位于-798bp天然EPSPS1启动子的5’端附近。在表达质粒QC878/RTW1201(SEQ ID NO:63/98)或QC878/RTW1202(SEQ ID NO:63/99)中连接大豆密码子优化的Cas9内切核酸酶表达盒与向导RNA表达盒,这些表达质粒与多核苷酸修饰模板RTW1192A(SEQ ID NO:100)共递送。多核苷酸修饰模板包含1369bp大豆UBQ基因启动子、47bp 5UTR和532bp UBQ内含子1。可使用向导RNA/Cas系统,通过基因组DNA与多核苷酸修饰模板之间的同源重组,实现大豆UBQ启动子替换特定的大豆EPSPS1启动子,从而增强天然或经修饰的大豆EPSPS1基因表达。
表24.在大豆稳定转化中,为用大豆UBQ启动子替换-798bp大豆EPSPS1启动子而使 用的向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板
C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性NHEJ
使用表25列出的qPCR引物/探针,如实施例16C所述检测了位点特异性NHEJ。
表25.用于转基因大豆事件的qPCR分析的引物/探针
D.使用向导RNA/Cas9内切核酸酶系统检测大豆UBQ启动子替换大豆EPSPS1启动
为将天然EPSPS1基因处的大豆EPSPS1启动子替换为大豆UBQ启动子,在每个大豆转化实验中,使用表10所示的两种向导RNA表达载体。QC878(SEQ ID NO:63)靶向外显子2,并且RTW1201(SEQ ID NO:98)或RTW1202(SEQ ID NO:99)靶向大豆-798bp启动子的5’端。使用两个向导RNA/Cas系统双重切割大豆EPSPS1基因,导致除去天然EPSPS基因中的天然EPSPS1启动子/5’UTR-外显子1/内含子1/部分外显子2片段。同时,将多核苷酸修饰模板RTW1192A(SEQ ID NO:100)共递送到大豆细胞中。该RTW1192A DNA包含1369bp大豆UBQ启动子、其47bp 5-UTR、以及位于EPSPS1外显子1-内含子1修饰的外显子2前面的532bp UBQ内含子1。该多核苷酸修饰模板与基因组DNA之间的同源重组导致EPSPS1启动子/5’UTR被替换为大豆UBQ启动子/5’UTR/内含子1,并且通过PCR分析证实了所需的氨基酸修饰。然后使用引物对WOL1005/WOL1006(SEQ ID NO:104和105)以及WOL1003/WOL1004(SEQ ID NO:94和95)进行PCR测定,以检测启动子替换事件。
实施例19
植株EPSPS的变体
除实施例3中所述的TIPS突变之外的降低草甘膦敏感性的EPSPS突变是本领域中已知的(US 8,436,159)并且也可引入(与TIPS结合或不结合)到植株EPSPS基因中,如实施例3和实施例8所述。另外,可通过本领域技术人员已知的方法鉴定新型EPSPS突变。本文所述的向导多核苷酸/Cas内切核酸酶系统可用于在EPSPS基因中引入这些突变中的任一个、或这些突变的任意组合并且可针对除草剂抗性对所得的玉米EPSPS变体进行评估。表26列出可使用本文所述的方法提供的一些EPSPS突变。
表26可使用本文所述的方法提供的EPSPS突变
序列表
<110> E.I. DUPONT DE NEMOURS AND COMPANY and PIONEER HI-BRED
INTERNATIONAL,INC.
Djukanovic,Vesna
Lassner,Michael
Liu,Zhan-Bin
Lyznik,Alex
Jones,Spencer
<120> 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
<130> BB2366 PCT
<150> 62/023246
<151> 2014-11-07
<160> 110
<170> PatentIn 3.5版
<210> 1
<211> 4107
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)M1 GAS (SF370)
<400> 1
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 2
<211> 189
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 2
gtaagtttct gcttctacct ttgatatata tataataatt atcattaatt agtagtaata 60
taatatttca aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg 120
tagtttataa gtgtgtatat tttaatttat aacttttcta atatatgacc aaaacatggt 180
gatgtgcag 189
<210> 3
<211> 9
<212> PRT
<213> 猿猴病毒(Simian virus)40
<400> 3
Met Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 4
<211> 18
<212> PRT
<213> 根癌农杆菌(Agrobacterium tumefaciens)
<400> 4
Lys Arg Pro Arg Asp Arg His Asp Gly Glu Leu Gly Gly Arg Lys Arg
1 5 10 15
Ala Arg
<210> 5
<211> 6717
<212> DNA
<213> 人工序列
<220>
<223> 玉米优化的Cas9表达盒
<400> 5
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840
ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900
caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960
cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc taccttctct 1020
agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct gttcatgttt 1080
gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140
gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200
tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt cgttgcatag 1260
ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt gtcgggtcat 1320
cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc ggtcgttcta 1380
gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg gatctgtatg 1440
tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat atcgatctag 1500
gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc tttttgttcg 1560
cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga tcggagtaga 1620
atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg tgtgtcatac 1680
atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag gtatacatgt 1740
tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1800
taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1860
atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1920
tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1980
tacttctgca ggtcgactct agaggatcca tggcaccgaa gaagaagcgc aaggtgatgg 2040
acaagaagta cagcatcggc ctcgacatcg gcaccaactc ggtgggctgg gccgtcatca 2100
cggacgaata taaggtcccg tcgaagaagt tcaaggtcct cggcaataca gaccgccaca 2160
gcatcaagaa aaacttgatc ggcgccctcc tgttcgatag cggcgagacc gcggaggcga 2220
ccaggctcaa gaggaccgcc aggagacggt acactaggcg caagaacagg atctgctacc 2280
tgcaggagat cttcagcaac gagatggcga aggtggacga ctccttcttc caccgcctgg 2340
aggaatcatt cctggtggag gaggacaaga agcatgagcg gcacccaatc ttcggcaaca 2400
tcgtcgacga ggtaagtttc tgcttctacc tttgatatat atataataat tatcattaat 2460
tagtagtaat ataatatttc aaatattttt ttcaaaataa aagaatgtag tatatagcaa 2520
ttgcttttct gtagtttata agtgtgtata ttttaattta taacttttct aatatatgac 2580
caaaacatgg tgatgtgcag gtggcctacc acgagaagta cccgacaatc taccacctcc 2640
ggaagaaact ggtggacagc acagacaagg cggacctccg gctcatctac cttgccctcg 2700
cgcatatgat caagttccgc ggccacttcc tcatcgaggg cgacctgaac ccggacaact 2760
ccgacgtgga caagctgttc atccagctcg tgcagacgta caatcaactg ttcgaggaga 2820
accccataaa cgctagcggc gtggacgcca aggccatcct ctcggccagg ctctcgaaat 2880
caagaaggct ggagaacctt atcgcgcagt tgccaggcga aaagaagaac ggcctcttcg 2940
gcaaccttat tgcgctcagc ctcggcctga cgccgaactt caaatcaaac ttcgacctcg 3000
cggaggacgc caagctccag ctctcaaagg acacctacga cgacgacctc gacaacctcc 3060
tggcccagat aggagaccag tacgcggacc tcttcctcgc cgccaagaac ctctccgacg 3120
ctatcctgct cagcgacatc cttcgggtca acaccgaaat taccaaggca ccgctgtccg 3180
ccagcatgat taaacgctac gacgagcacc atcaggacct cacgctgctc aaggcactcg 3240
tccgccagca gctccccgag aagtacaagg agatcttctt cgaccaatca aaaaacggct 3300
acgcgggata tatcgacggc ggtgccagcc aggaagagtt ctacaagttc atcaaaccaa 3360
tcctggagaa gatggacggc accgaggagt tgctggtcaa gctcaacagg gaggacctcc 3420
tcaggaagca gaggaccttc gacaacggct ccatcccgca tcagatccac ctgggcgaac 3480
tgcatgccat cctgcggcgc caggaggact tctacccgtt cctgaaggat aaccgggaga 3540
agatcgagaa gatcttgacg ttccgcatcc catactacgt gggcccgctg gctcgcggca 3600
actcccggtt cgcctggatg acccggaagt cggaggagac catcacaccc tggaactttg 3660
aggaggtggt cgataagggc gctagcgctc agagcttcat cgagcgcatg accaacttcg 3720
ataaaaacct gcccaatgaa aaagtcctcc ccaagcactc gctgctctac gagtacttca 3780
ccgtgtacaa cgagctcacc aaggtcaaat acgtcaccga gggcatgcgg aagccggcgt 3840
tcctgagcgg cgagcagaag aaggcgatag tggacctcct cttcaagacc aacaggaagg 3900
tgaccgtgaa gcaattaaaa gaggactact tcaagaaaat agagtgcttc gactccgtgg 3960
agatctcggg cgtggaggat cggttcaacg cctcactcgg cacgtatcac gacctcctca 4020
agatcattaa agacaaggac ttcctcgaca acgaggagaa cgaggacatc ctcgaggaca 4080
tcgtcctcac cctgaccctg ttcgaggacc gcgaaatgat cgaggagagg ctgaagacct 4140
acgcgcacct gttcgacgac aaggtcatga aacagctcaa gaggcgccgc tacactggtt 4200
ggggaaggct gtcccgcaag ctcattaatg gcatcaggga caagcagagc ggcaagacca 4260
tcctggactt cctcaagtcc gacgggttcg ccaaccgcaa cttcatgcag ctcattcacg 4320
acgactcgct cacgttcaag gaagacatcc agaaggcaca ggtgagcggg cagggtgact 4380
ccctccacga acacatcgcc aacctggccg gctcgccggc cattaaaaag ggcatcctgc 4440
agacggtcaa ggtcgtcgac gagctcgtga aggtgatggg ccggcacaag cccgaaaata 4500
tcgtcataga gatggccagg gagaaccaga ccacccaaaa agggcagaag aactcgcgcg 4560
agcggatgaa acggatcgag gagggcatta aagagctcgg gtcccagatc ctgaaggagc 4620
accccgtgga aaatacccag ctccagaatg aaaagctcta cctctactac ctgcagaacg 4680
gccgcgacat gtacgtggac caggagctgg acattaatcg gctatcggac tacgacgtcg 4740
accacatcgt gccgcagtcg ttcctcaagg acgatagcat cgacaacaag gtgctcaccc 4800
ggtcggataa aaatcggggc aagagcgaca acgtgcccag cgaggaggtc gtgaagaaga 4860
tgaaaaacta ctggcgccag ctcctcaacg cgaaactgat cacccagcgc aagttcgaca 4920
acctgacgaa ggcggaacgc ggtggcttga gcgaactcga taaggcgggc ttcataaaaa 4980
ggcagctggt cgagacgcgc cagatcacga agcatgtcgc ccagatcctg gacagccgca 5040
tgaatactaa gtacgatgaa aacgacaagc tgatccggga ggtgaaggtg atcacgctga 5100
agtccaagct cgtgtcggac ttccgcaagg acttccagtt ctacaaggtc cgcgagatca 5160
acaactacca ccacgcccac gacgcctacc tgaatgcggt ggtcgggacc gccctgatca 5220
agaagtaccc gaagctggag tcggagttcg tgtacggcga ctacaaggtc tacgacgtgc 5280
gcaaaatgat cgccaagtcc gagcaggaga tcggcaaggc cacggcaaaa tacttcttct 5340
actcgaacat catgaacttc ttcaagaccg agatcaccct cgcgaacggc gagatccgca 5400
agcgcccgct catcgaaacc aacggcgaga cgggcgagat cgtctgggat aagggccggg 5460
atttcgcgac ggtccgcaag gtgctctcca tgccgcaagt caatatcgtg aaaaagacgg 5520
aggtccagac gggcgggttc agcaaggagt ccatcctccc gaagcgcaac tccgacaagc 5580
tcatcgcgag gaagaaggat tgggacccga aaaaatatgg cggcttcgac agcccgaccg 5640
tcgcatacag cgtcctcgtc gtggcgaagg tggagaaggg caagtcaaag aagctcaagt 5700
ccgtgaagga gctgctcggg atcacgatta tggagcggtc ctccttcgag aagaacccga 5760
tcgacttcct agaggccaag ggatataagg aggtcaagaa ggacctgatt attaaactgc 5820
cgaagtactc gctcttcgag ctggaaaacg gccgcaagag gatgctcgcc tccgcaggcg 5880
agttgcagaa gggcaacgag ctcgccctcc cgagcaaata cgtcaatttc ctgtacctcg 5940
ctagccacta tgaaaagctc aagggcagcc cggaggacaa cgagcagaag cagctcttcg 6000
tggagcagca caagcattac ctggacgaga tcatcgagca gatcagcgag ttctcgaagc 6060
gggtgatcct cgccgacgcg aacctggaca aggtgctgtc ggcatataac aagcaccgcg 6120
acaaaccaat acgcgagcag gccgaaaata tcatccacct cttcaccctc accaacctcg 6180
gcgctccggc agccttcaag tacttcgaca ccacgattga ccggaagcgg tacacgagca 6240
cgaaggaggt gctcgatgcg acgctgatcc accagagcat cacagggctc tatgaaacac 6300
gcatcgacct gagccagctg ggcggagaca agagaccacg ggaccgccac gatggcgagc 6360
tgggaggccg caagcgggca aggtaggtac cgttaaccta gacttgtcca tcttctggat 6420
tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 6480
ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 6540
aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 6600
gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 6660
aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa tgcggcc 6717
<210> 6
<211> 39
<212> RNA
<213> 人工序列
<220>
<223> 靶向LIGCas-3靶序列的crRNA
<400> 6
gcguacgcgu acgugugguu uuagagcuau gcuguuuug 39
<210> 7
<211> 86
<212> RNA
<213> 酿脓链球菌(Streptococcus pyogenes)M1 GAS (SF370)
<400> 7
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 8
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 靶向LIGCas-3靶序列的单链向导RNA
<400> 8
gcguacgcgu acgugugguu uuagagcuag aaauagcaag uuaaaauaag gcuaguccgu 60
uaucaacuug aaaaaguggc accgagucgg ugcu 94
<210> 9
<211> 1000
<212> DNA
<213> 玉米(Zea mays)
<400> 9
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt 1000
<210> 10
<211> 16
<212> DNA
<213> 玉米(Zea mays)
<400> 10
tttttttttt tttttt 16
<210> 11
<211> 1102
<212> DNA
<213> 人工序列
<220>
<223> 靶向LIGCas-3靶序列的玉米优化的长单链向导RNA表达盒
<400> 11
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gcgtacgcgt acgtgtggtt 1020
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 1080
accgagtcgg tgcttttttt tt 1102
<210> 12
<211> 23
<212> DNA
<213> 玉米(Zea mays)
<400> 12
ggaatgctgg aactgcaatg cgg 23
<210> 13
<211> 24
<212> DNA
<213> 玉米(Zea mays)
<400> 13
gcagctcttc ttggggaatg ctgg 24
<210> 14
<211> 23
<212> DNA
<213> 玉米(Zea mays)
<400> 14
gcagtaacag ctgctgtcaa tgg 23
<210> 15
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 二级PCR的正向引物
<400> 15
aatgatacgg cgaccaccga gatctacact ctttccctac acg 43
<210> 16
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 二级PCR的反向引物
<400> 16
caagcagaag acggcata 18
<210> 17
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 一级PCR的EPSPSCas-1正向引物
<400> 17
ctacactctt tccctacacg acgctcttcc gatctggaag aggaaacata cgttgcattt 60
cca 63
<210> 18
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 一级PCR的EPSPSCas-1和EPSPSCas-3反向引物
<400> 18
caagcagaag acggcatacg agctcttccg atctggtgga aagttcccag ttgagga 57
<210> 19
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 一级PCR的EPSPSCas-2正向引物
<400> 19
ctacactctt tccctacacg acgctcttcc gatctaagcg gtggaaagtt cccagttgag 60
ga 62
<210> 20
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 一级PCR的EPSPSCas-2反向引物
<400> 20
caagcagaag acggcatacg agctcttccg atctgaggaa acatacgttg catttcca 58
<210> 21
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 一级PCR的EPSPSCas-3正向引物
<400> 21
ctacactctt tccctacacg acgctcttcc gatctccttg aggaaacata cgttgcattt 60
cca 63
<210> 22
<211> 1377
<212> PRT
<213> 人工序列
<220>
<223> 玉米优化的moCAS9内切核酸酶
<400> 22
Met Ala Pro Lys Lys Lys Arg Lys Val Met Asp Lys Lys Tyr Ser Ile
1 5 10 15
Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp
20 25 30
Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp
35 40 45
Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser
50 55 60
Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg
65 70 75 80
Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser
85 90 95
Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu
100 105 110
Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe
115 120 125
Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile
130 135 140
Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu
145 150 155 160
Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His
165 170 175
Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys
180 185 190
Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn
195 200 205
Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg
210 215 220
Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly
225 230 235 240
Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly
245 250 255
Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
260 265 270
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu
275 280 285
Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn
290 295 300
Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu
305 310 315 320
Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu
325 330 335
His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu
340 345 350
Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr
355 360 365
Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe
370 375 380
Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val
385 390 395 400
Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn
405 410 415
Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu
420 425 430
Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
435 440 445
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu
450 455 460
Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu
465 470 475 480
Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser
485 490 495
Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
500 505 510
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr
515 520 525
Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
530 535 540
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu
545 550 555 560
Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp
565 570 575
Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val
580 585 590
Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys
595 600 605
Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile
610 615 620
Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met
625 630 635 640
Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
645 650 655
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser
660 665 670
Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
675 680 685
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln
690 695 700
Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala
705 710 715 720
Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu
725 730 735
Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
740 745 750
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile
755 760 765
Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
770 775 780
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu
785 790 795 800
Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
805 810 815
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
820 825 830
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
835 840 845
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
850 855 860
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro
865 870 875 880
Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
885 890 895
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala
900 905 910
Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
915 920 925
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
930 935 940
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
945 950 955 960
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg
965 970 975
Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
980 985 990
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
995 1000 1005
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1010 1015 1020
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1025 1030 1035
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1040 1045 1050
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1055 1060 1065
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1070 1075 1080
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1085 1090 1095
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1100 1105 1110
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1115 1120 1125
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1130 1135 1140
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1145 1150 1155
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1160 1165 1170
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1175 1180 1185
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1190 1195 1200
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1205 1210 1215
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1220 1225 1230
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1235 1240 1245
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1250 1255 1260
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1265 1270 1275
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1280 1285 1290
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1295 1300 1305
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1310 1315 1320
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1325 1330 1335
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1340 1345 1350
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1355 1360 1365
Ile Asp Leu Ser Gln Leu Gly Gly Asp
1370 1375
<210> 23
<211> 6677
<212> DNA
<213> 人工序列
<220>
<223> 玉米优化的moCAS9内切核酸酶
<400> 23
ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 660
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 720
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 780
ggcaggcggc ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg 840
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc tctctacctt 1020
ctctagatcg gcgttccggt ccatgcatgg ttagggcccg gtagttctac ttctgttcat 1080
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 1860
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980
gtgttacttc tgcaggtcga ctctagagga tccccatggc cccgaagaag aagaggaagg 2040
tgcacatgga taagaagtac agcatcggcc tcgacatcgg gaccaacagc gtcggctggg 2100
ccgtcatcac cgacgaatat aaggtgccca gcaagaagtt caaggtgctc gggaatacag 2160
accgccacag catcaagaag aacctgatcg gcgccctcct gttcgactcg ggcgagaccg 2220
ctgaggccac cagactaaag aggaccgctc gccgccgcta cacccgccgc aagaaccgca 2280
tatgctacct ccaggagatc ttcagcaacg agatggccaa ggtggacgac agcttcttcc 2340
accgccttga ggagtcgttc ctcgtggagg aggacaagaa gcatgagagg cacccgatct 2400
tcgggaacat cgtggacgag gtaagtttct gcttctacct ttgatatata tataataatt 2460
atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa agaatgtagt 2520
atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat aacttttcta 2580
atatatgacc aaaacatggt gatgtgcagg tggcgtacca cgagaagtac ccgacgatct 2640
accacctccg caagaagctg gtcgactcca cagacaaggc cgacctcaga ctgatctacc 2700
tggccctcgc gcacatgatc aagttccgcg ggcacttcct catcgagggc gacctgaacc 2760
cggacaactc cgacgtcgac aagctcttca tccagctggt ccagacctac aatcaactgt 2820
tcgaggagaa cccgatcaac gcgtccggcg tggacgcgaa ggccatcctc agcgcgaggc 2880
tcagcaaatc aagacggctg gagaacctga tcgcccagct cccaggcgag aagaaaaacg 2940
gcttgttcgg caacctgatc gcgctctcgc tcggcctcac gcccaacttc aaatcaaact 3000
tcgacctggc cgaggacgcg aaactgcagc tgtccaagga cacttacgac gacgacctcg 3060
acaacctgct ggcgcaaatc ggtgaccagt acgcagacct cttcctggcc gccaagaacc 3120
tctcggacgc catcctgctg tccgatatcc tgagagtgaa tacggagatc accaaggcgc 3180
cgctcagcgc ctccatgatt aaaaggtacg acgagcacca ccaggacctg acgctgctca 3240
aggccctggt gcgccagcag ctccccgaga agtacaagga gatcttcttc gaccaatcaa 3300
aaaacggcta cgccggctac atcgacgggg gcgcctccca ggaggagttc tacaagttca 3360
tcaaaccaat tctcgagaag atggacggca cggaggagct tctcgtgaag ctcaaccggg 3420
aggacctcct gaggaagcag aggacgttcg acaacggctc gataccgcat cagatccacc 3480
tgggcgagct ccacgccatc ctgcgccggc aggaggattt ctatccgttc ctcaaggaca 3540
acagggagaa gatcgagaaa attctgacgt tccgcatccc gtactacgtg ggccctctcg 3600
cgcgcgggaa cagccggttc gcctggatga ctcggaagtc ggaggagacg atcacgccgt 3660
ggaacttcga ggaggtggtg gacaagggcg cctccgccca gtcgttcatc gagcgcatga 3720
cgaacttcga taaaaatctg cccaatgaaa aagtgctccc gaagcacagc ctcctctacg 3780
agtacttcac ggtgtacaac gagctcacga aggtgaagta cgtgaccgag ggtatgcgga 3840
agccggcgtt cctgagcggc gagcagaaga aggccatcgt ggacctcctc ttcaagacga 3900
accggaaagt caccgtgaag caattaaagg aggactactt caagaaaata gagtgcttcg 3960
acagcgtcga gatctcgggc gtcgaggaca ggttcaacgc gtcgctgggc acataccacg 4020
acctcctcaa gatcattaaa gacaaggact tcctggacaa cgaggagaac gaggacatcc 4080
tcgaggacat cgtgctgacc ctcaccctgt ttgaggaccg ggagatgatc gaggagcgcc 4140
tcaagacgta cgctcacctt ttcgacgaca aggtgatgaa acagctgaag cggcgccgct 4200
acaccggatg gggccggctc tcccgcaagc tcattaatgg gatcagggac aagcagtccg 4260
gcaagaccat actcgatttc ctgaagagcg acggcttcgc caaccggaac ttcatgcagc 4320
tcatccacga cgactccctc actttcaagg aggacatcca gaaggcccag gtcagcggac 4380
agggcgactc gctccacgaa cacatcgcca acctggccgg gtcgcctgcg attaaaaagg 4440
gaatccttca gaccgtcaag gtcgtggacg agctggtgaa ggtgatgggc aggcacaagc 4500
ccgaaaatat cgtcattgag atggcccggg agaaccagac cacgcagaaa ggccagaaga 4560
acagccggga gcgcatgaaa cggatcgagg agggtatcaa ggagctgggc tcgcagatcc 4620
tcaaggagca ccctgtggaa aatacccagc tgcagaatga aaagctctac ctctactacc 4680
tccagaacgg ccgcgacatg tacgtggacc aggagctgga cattaatcgc ctctcggact 4740
acgacgtcga ccacatcgtc ccgcagtcct tcctgaagga cgacagcatc gacaacaagg 4800
tcttgacccg ctccgataaa aatcgcggga agtccgacaa cgtgccgtcg gaggaggtgg 4860
tcaagaagat gaaaaactac tggcgccagc tgctcaacgc caagctaatc acgcagcgca 4920
agttcgacaa cctcaccaag gccgaacgcg gcggtctctc cgagcttgat aaggctgggt 4980
tcatcaagag acagctggtg gagacccggc agatcaccaa gcatgtcgcc cagatcctgg 5040
actcgcgcat gaatactaag tacgatgaaa acgacaagct catccgcgag gtgaaggtga 5100
tcaccctgaa gagcaagctg gtctcggact tccggaagga cttccagttc tacaaggtcc 5160
gggagatcaa caactaccac cacgcgcacg acgcctacct gaacgcggtg gtgggcacag 5220
cccttataaa gaagtaccct aagctcgagt ccgagttcgt gtacggcgac tacaaggtgt 5280
acgacgtccg caagatgatc gcgaagagcg agcaggagat cgggaaggcc accgcaaaat 5340
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctg gccaacgggg 5400
agatccgcaa gcgcccgctg attgagacga acggagagac aggcgagata gtctgggaca 5460
agggcaggga cttcgccacc gtgcgcaagg ttctgtccat gccgcaggtg aacatcgtga 5520
agaagactga ggtgcagaca ggcggcttct cgaaggagtc catcctgccc aagcggaaca 5580
gcgacaagct catcgcgcgg aagaaggact gggaccctaa aaaatatggc gggttcgact 5640
cgcccaccgt ggcttactcg gtcctcgtgg tggccaaggt cgagaagggc aaaagcaaga 5700
agctgaagag cgtcaaggag ctcctcggca tcaccatcat ggagcggtcc agcttcgaga 5760
agaacccgat cgacttcctc gaggcgaagg gatataagga ggtgaagaag gacctcatca 5820
ttaaactgcc gaagtactcg ctattcgaac tggagaatgg tcgcaagagg atgctcgcga 5880
gcgctggcga gctgcagaaa gggaacgagc tggctctccc gagcaagtac gtcaacttcc 5940
tctacctggc ctcccactat gaaaagctca agggctcgcc ggaggacaac gagcagaagc 6000
agctgttcgt cgagcagcac aagcattacc tcgacgagat catcgagcag atctcggagt 6060
tcagcaagcg cgtgatcctg gccgacgcca acctcgacaa ggtgctgtcc gcatataaca 6120
agcaccgcga caaaccaata cgggagcagg ccgaaaatat catccacctg ttcaccctca 6180
cgaacctggg cgcccccgcc gcgttcaagt acttcgacac aaccatcgac cgcaagcggt 6240
acacgagcac gaaggaggtg ctggacgcca cgttgattca ccagtccatc acgggcctgt 6300
atgaaacaag gatcgatctc agccagctcg gcggcgacta ggtaccacat ggttaaccta 6360
gacttgtcca tcttctggat tggccaactt aattaatgta tgaaataaaa ggatgcacac 6420
atagtgacat gctaatcact ataatgtggg catcaaagtt gtgtgttatg tgtaattact 6480
agttatctga ataaaagaga aagagatcat ccatatttct tatcctaaat gaatgtcacg 6540
tgtctttata attctttgat gaaccagatg catttcatta accaaatcca tatacatata 6600
aatattaatc atatataatt aatatcaatt gggttagcaa aacaaatcta gtctaggtgt 6660
gttttgcgaa ttgcggc 6677
<210> 24
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 向导RNA (EPSPS sgRNA)的DNA型式
<400> 24
gcagtaacag ctgctgtcaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 25
<211> 3708
<212> DNA
<213> 人工序列
<220>
<223> EPSPS多核苷酸模板
<400> 25
ctgcagccca tcaaggagat ctccggcacc gtcaagctgc cggggtccaa gtcgctttcc 60
aacaggatcc tcctgctcgc cgccctgtcc gaggtgagcg attttggtgc ttgctgcgct 120
gccctgtctc actgctacct aaatgttttg cctgtcgaat accatggatt ctcggtgtaa 180
tccatctcac gatcagatgc accgcatgtc gcatgcctag ctctctctaa tttgtctagt 240
agtttgtata cggattaaga ttgataaatc ggtaccgcaa aagctaggtg taaataaaca 300
ctacaaaatt ggatgttccc ctatcggcct gtactcggct actcgttctt gtgatggcat 360
gttatttctt cttggtgttt ggtgaactcc cttatgaaat ttgggcgcaa agaaatcgcc 420
ctcaagggtt gatcttatgc catcgtcatg ataaacagtg aagcacggat gatcctttac 480
gttgttttta acaaactttg tcagaaaact agcaatgtta acttcttaat gatgatttca 540
caacaaaaaa ggtaaccttg ctactaacat aacaaaagac ttgttgctta ttaattatat 600
gtttttttaa tctttgatca ggggacaaca gtggttgata acctgttgaa cagtgaggat 660
gtccactaca tgctcggggc cttgaggact cttggtctct ctgtcgaagc ggacaaagct 720
gccaaaagag ctgtagttgt tggctgtggt ggaaagttcc cagttgagga tgctaaagag 780
gaagtgcagc tcttcttggg gaatgctgga atcgcaatgc ggtcattgac agcagctgtt 840
actgctgctg gtggaaatgc aacgtatgtt tcctctctct ctctacaata cttgttggag 900
ttagtatgaa acccatgtgt atgtctagtg gcttatggtg tattggtttt tgaacttcag 960
ttacgtgctt gatggagtac caagaatgag ggagagaccc attggcgact tggttgtcgg 1020
attgaagcag cttggtgcag atgttgattg tttccttggc actgactgcc cacctgttcg 1080
tgtcaatgga atcggagggc tacctggtgg caaggttagt tactaagggc cacatgttac 1140
attcttctgt aaatggtaca actattgtcg agcttttgca tttgtaagga aaacattgat 1200
tgatctgaat ttgatgctac accacaaaat atctacaaat ggtcatccct aactagcaaa 1260
ccatgtctcc attaagctca atgaagtaat acttggcatg tgtttatcaa cttaatttcc 1320
atcttctggg gtattgcctg ttttctagtc taatagcatt tgtttttaga attagctctt 1380
acaactgtta tgttctacag gtcaagctgt ctggctccat cagcagtcag tacttgagtg 1440
ccttgctgat ggctgctcct ttggctcttg gggatgtgga gattgaaatc attgataaat 1500
taatctccat tccctacgtc gaaatgacat tgagattgat ggagcgtttt ggtgtgaaag 1560
cagagcattc tgatagctgg gacagattct acattaaggg aggtcaaaaa tacaagtaag 1620
ctctgtaatg tatttcacta ctttgatgcc aatgtttcag ttttcagttt tccaaacagt 1680
cgcatcaata tttgaataga tgcactgtag aaaaaaatca ttgcagggaa aaactagtac 1740
tgagtatttt gactgtaaat tatttaacca gtcggaatat agtcagtcta ttggagtcaa 1800
gagcgtgaac cgaaatagcc agttaattat cccattatac agaggacaac catgtatact 1860
attgaaactt ggtttaagag aatctaggta gctggactcg tagctgcttg gcatggatac 1920
cttcttatct ttaggaaaag acacttgatt ttttttctgt ggccctctat gatgtgtgaa 1980
cctgcttctc tattgcttta gaaggatata tctatgtcgt tatgcaacat gcttccctta 2040
gtcatttgta ctgaaatcag tttcataagt tcgttagtgg ttccctaaac gaaaccttgt 2100
ttttctttgc aatcaacagg tcccctaaaa atgcctatgt tgaaggtgat gcctcaagcg 2160
caagctattt cttggctggt gctgcaatta ctggagggac tgtgactgtg gaaggttgtg 2220
gcaccaccag tttgcaggta aagatttctt ggctggtgct acgataactg cttttgtctt 2280
tttggtttca gcattgttct cagagtcact aaataacatt atcatctgca aacgtcaaat 2340
agacatactt aggtgaatgg atattcatgt aaccgtttcc ttacaaattt gctgaaacct 2400
cagggtgatg tgaagtttgc tgaggtactg gagatgatgg gagcgaaggt tacatggacc 2460
gagactagcg taactgttac tggcccaccg cgggagccat ttgggaggaa acacctcaag 2520
gcgattgatg tcaacatgaa caagatgcct gatgtcgcca tgactcttgc tgtggttgcc 2580
ctctttgccg atggcccgac agccatcaga gacggtaaaa cattctcagc cctacaacca 2640
tgcctcttct acatcactac ttgacaagac taaaaactat tggctcgttg gcagtggctt 2700
cctggagagt aaaggagacc gagaggatgg ttgcgatccg gacggagcta accaaggtaa 2760
ggctacatac ttcacatgtc tcacgtcgtc tttccatagc tcgctgcctc ttagcggctt 2820
gcctgcggtc gctccatcct cggttgctgt ctgtgttttc cacagctggg agcatctgtt 2880
gaggaagggc cggactactg catcatcacg ccgccggaga agctgaacgt gacggcgatc 2940
gacacgtacg acgaccacag gatggccatg gccttctccc ttgccgcctg tgccgaggtc 3000
cccgtgacca tccgggaccc tgggtgcacc cggaagacct tccccgacta cttcgatgtg 3060
ctgagcactt tcgtcaagaa ttaataaagc gtgcgatact accacgcagc ttgattgaag 3120
tgataggctt gtgctgagga aatacatttc ttttgttctg ttttttctct ttcacgggat 3180
taagttttga gtctgtaacg ttagttgttt gtagcaagtt tctatttcgg atcttaagtt 3240
tgtgcactgt aagccaaatt tcatttcaag agtggttcgt tggaataata agaataataa 3300
attacgtttc agtggctgtc aagcctgctg ctacgtttta ggagatggca ttagacattc 3360
atcatcaaca acaataaaac cttttagcct caaacaataa tagtgaagtt attttttagt 3420
cctaaacaag ttgcattagg atatagttaa aacacaaaag aagctaaagt tagggtttag 3480
acatgtggat attgttttcc atgtatagta tgttctttct ttgagtctca tttaactacc 3540
tctacacata ccaactttag ttttttttct acctcttcat gttactatgg tgccttctta 3600
tcccactgag cattggtata tttagaggtt tttgttgaac atgcctaaat catctcaatc 3660
aacgatggac aatcttttct tcgattgagc tgaggtacgt catctaga 3708
<210> 26
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> TIPS核苷酸修饰
<400> 26
atcgcaatgc ggtca 15
<210> 27
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-1 F-E2
<400> 27
ccgaggagat cgtgctgca 19
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-2 F-E2
<400> 28
caatggccgc attgcagttc 20
<210> 29
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-1 F-T
<400> 29
ccgaggagat cgtgctgca 19
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-2 F-T
<400> 30
tgaccgcatt gcgattccag 20
<210> 31
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-1 H-T
<400> 31
tccaagtcgc tttccaacag gatc 24
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-2 H-T
<400> 32
tgaccgcatt gcgattccag 20
<210> 33
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-1 F-E3
<400> 33
ccgaggagat cgtgctgca 19
<210> 34
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物序列-2 F-E3
<400> 34
accaagctgc ttcaatccga caac 24
<210> 35
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 具有完整Cas靶序列的DNA片段
<400> 35
ggggaatgct ggaactgcaa tgcggccatt gacagcagct gttactgctg ctggtggaaa 60
tgc 63
<210> 36
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 具有突变Cas靶序列的DNA片段
<400> 36
ggggaatgct ggaactgcaa tgcggccatt ggcagctgtt actgctgctg gtggaaatgc 60
<210> 37
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 具有突变Cas靶序列的DNA片段
<400> 37
ggggaatgct ggaactgcac agcagctgtt actgctgctg gtggaaatgc 50
<210> 38
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 具有突变Cas靶序列的DNA片段
<400> 38
ggggaatgct gttactgctg ctggtggaaa tgc 33
<210> 39
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> TIPS编辑的EPSPS核苷酸序列片段
<400> 39
aatgctggaa tcgcaatgcg gtcattgaca gcagctgtta ctgctgctgg t 51
<210> 40
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 野生型epsps核苷酸序列片段
<400> 40
aatgctggaa ctgcaatgcg gccattgaca gcagctgtta ctgctgctgg t 51
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> M引物qADH-F
<400> 41
caagtcgcgg ttttcaatca 20
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物qADH-R
<400> 42
tgaaggtgga agtcccaaca a 21
<210> 43
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 探针ADH-VIC
<400> 43
tgggaagcct atctaccac 19
<210> 44
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 探针wtEPSPS
<400> 44
cggccattga cagca 15
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物qEPSPS-F
<400> 45
tcttggggaa tgctggaact 20
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 反向引物qEPSPSR
<400> 46
caccagcagc agtaacagct g 21
<210> 47
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> FAM-wtEPSPS R探针
<400> 47
tgctgtcaat ggccgca 17
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物qEPSPS-F
<400> 48
tcttggggaa tgctggaact 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物q wtEPSPS RA
<400> 49
ccaccagcag cagtaacagc 20
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 正向引物q epTIPS F
<400> 50
ggaagtgcag ctcttcttgg g 21
<210> 51
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 反向引物q epTIPS
<400> 51
agctgctgtc aatgaccgc 19
<210> 52
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> TIPS探针
<400> 52
aatgctggaa tcgca 15
<210> 53
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> WOL1006,反向引物
<400> 53
attatttttc cgtacatgat gtaaccgc 28
<210> 54
<211> 6274
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(6274)
<223> EPSPS-复制模板
<400> 54
gatctccggc accgtcaagc tgccggggtc caagtcgctt tccaacagga tcctcctgct 60
cgccgccctg tccgaggtga gcgattttgg tgcttgctgc gctgccctgt ctcactgcta 120
cctaaatgtt ttgcctgtcg aataccatgg attctcggtg taatccatct cacgatcaga 180
tgcaccgcat gtcgcatgcc tagctctctc taatttgtct agtagtttgt atacggatta 240
agattgataa atcggtaccg caaaagctag gtgtaaataa acactacaaa attggatgtt 300
cccctatcgg cctgtactcg gctactcgtt cttgtgatgg catgttattt cttcttggtg 360
tttggtgaac tcccttatga aatttgggcg caaagaaatc gccctcaagg gttgatctta 420
tgccatcgtc atgataaaca gtgaagcacg gatgatcctt tacgttgttt ttaacaaact 480
ttgtcagaaa actagcaatg ttaacttctt aatgatgatt tcacaacaaa aaaggtaacc 540
ttgctactaa cataacaaaa gacttgttgc ttattaatta tatgtttttt taatctttga 600
tcaggggaca acagtggttg ataacctgtt gaacagtgag gatgtccact acatgctcgg 660
ggccttgagg actcttggtc tctctgtcga agcggacaaa gctgccaaaa gagctgtagt 720
tgttggctgt ggtggaaagt tcccagttga ggatgctaaa gaggaagtgc agctcttctt 780
ggggaatgct ggaatcgcaa tgcggtcatt gacagcagct gttactgctg ctggtggaaa 840
tgcaacgtat gtttcctctc tctctctaca atacttgttg gagttagtat gaaacccatg 900
tgtatgtcta gtggcttatg gtgtattggt ttttgaactt cagttacgtg cttgatggag 960
taccaagaat gagggagaga cccattggcg acttggttgt cggattgaag cagcttggtg 1020
cagatgttga ttgtttcctt ggcactgact gcccacctgt tcgtgtcaat ggaatcggag 1080
ggctacctgg tggcaaggtt agttactaag ggccacatgt tatattcttc tgtaaatggt 1140
acaactattg tcgagctttt gcatttgtaa ggaaaacatt gaatgatctg aatttgatgc 1200
tacaccacaa aatatctaca aatggtcatc cctaactagc aaaccatgtc tccattaagc 1260
tcaatgaagt aacacttggc atgtgtttat caacttaatt tccatcttct ggggtattgc 1320
ctgttttcta gtctaatagc atttgttttt agcatgaatt agctcttaca actgttatgt 1380
tctacaggtc aagctgtctg gctccatcag cagtcagtac ttgagtgcct tgctgatggc 1440
tgctcctttg gctcttgggg atgtggagat tgaaatcatt gataaattaa tctccattcc 1500
gtacgtcgaa atgacattga gattgatgga gcgttttggt gtgaaagcag agcattctga 1560
tagctgggac agattctaca ttaagggagg tcaaaaatac aagtaagctc tgtaatgtat 1620
ttcactactt tgatgccaat gtttcagttt tcagttttcc aaacagtcgc atcaatattt 1680
gaatagatgc actgtagaaa aaaaatcatt gcagggaaaa aaactagcac tgagtatttt 1740
gactgtaaat tatttaacca gtcggaatat agtcagtcta ttggagtcaa gagcgtgaac 1800
cgaaataacc agttaattat cccattatac agaggacaac catgtatact attgaaactt 1860
ggtttataag agaatctagg tagctggact cgtagctgct tggcatggat accttcttat 1920
cttcaggaaa agacacttga ttttttttct gtggccctct atgatgtgtg aacctgcttc 1980
tctattgctt tagaaggata tatccatgtt gttatgcaac atgcttccct tagtcatttg 2040
tactgaaatc agtttcataa gttcgttagt ggttccctaa acgaaacctt gtttttcttt 2100
gcaatcaaca ggtcccctaa aaatgcctat gttgaaggtg atgcctcaag cgcaagctat 2160
ttcttggctg gtgctgcaat tactggaggg actgtgactg tggaaggttg tggcaccacc 2220
agtttgcagg taaagatttc ttggctggtg ctacaataac tgcttttgtc tttttggttt 2280
cagcattgtt ctcagagtca ctaaataaca ttatcatctg caaatgtcaa atagacatac 2340
ttaggtgaat ggatattcat gtaaccgttt ccttacaaat ttgctgaaac ctcagggtga 2400
tgtgaagttt gctgaggtac tggagatgat gggagcgaag gttacatgga ccgagactag 2460
cgtaactgtt actggcccac cgcgggagcc atttgggagg aaacacctca aggcgattga 2520
tgtcaacatg aacaagatgc ctgatgtcgc catgactctt gctgtggttg ccctctttgc 2580
cgatggcccg acagccatca gagacggtaa aacattctca gccctacaac catgcctctt 2640
ctacatcact acttgacaag actaaaaact attggctcgt tggcagtggc ttcctggaga 2700
gtaaaggaga ccgagaggat ggttgcgatc cggacggagc taaccaaggt aaggctacat 2760
acttcacatg tctcacgtcg tctttccata gctcgctgcc tcttagcggc ttgcctgcgg 2820
tcgctccatc ctcggttgct gtctgtgttt tccacagctg ggagcatctg ttgaggaagg 2880
gccggactac tgcatcatca cgccgccgga gaagctgaac gtgacggcga tcgacacgta 2940
cgacgaccac aggatggcca tggccttctc ccttgccgcc tgtgccgagg tccccgtcac 3000
catccgggac cctgggtgca cccggaagac cttccccgac tacttcgatg tgctgagcac 3060
tttcgtcaag aatggcggcg gtagcggcgg tggctctggc ggtggctcgg atccaacaat 3120
ggcggccatg gcgaccaagg ccgccgcggg caccgtgtcg ctggacctcg ccgcgccgtc 3180
gcgccgccac caccgcccga gctcggcgcg cccgcccttc cgccccgccg tccgcgggct 3240
gcgggcgcct gggcgccgcg tgatcgccgc gccgccggcg gcggcagcgg cggcggcggt 3300
gcaggcgggt gccgaggaga tcgtgctgca gcccatcaag gagatctccg gcaccgtcaa 3360
gctgccgggg tccaagtcgc tttccaaccg gatcctccta ctcgccgccc tgtccgaggt 3420
gagcgatttt ggtgcttgct gcgctgccct gtctcactgc tacctaaatg ttttgcctgt 3480
cgaataccat gtattctcgg tgtaatccat ctcacgatca gatgcaccgc atatcgcatg 3540
ccctagctct ctctaatttg tctagtagtt tgtatacgga ttaatattga taaatcggta 3600
ccgcaaaagc tagctgtaaa taaacactag aaaattggat gttcccctat cggcctgtac 3660
tcggctactc gttcttgtga tggcatgctg tctcttcttg gtgtttggtg aactccctta 3720
tgaaatttgg gcgcaaagaa ctcgccctca agggttgatc ttatgccatc gtcatgataa 3780
acagtgaagc actgatgatc ctttacgttg tttttaacaa actttgtcag aaaactagca 3840
ttgttaactt cttaatgatg atttcacaac aaaaaaggca accttgctac taacataaca 3900
aaagacttgt tgcttattaa ttatatgttt ttttaatctt tgatcagggg acaacagtgg 3960
ttgataacct gctgaacagt gaggatgtcc actacatgct cggggccttg aggactcttg 4020
gtctctctgt cgaagcggac aaagctgcca aaagagctgt agttgttggc tgtggtggaa 4080
agttcccagt tgaggatgct aaagaggaag tgcagctctt cttggggaat gctggaatcg 4140
caatgcggtc attgacagca gctgttactg ctgctggtgg aaatgcaacg tatgtttcct 4200
ctctctctac aatacttgtt ggagttagta tgaaacccat gtgtatgtct agtggcttat 4260
ggtgtattgg tttttgaact tcagttacgt gcttgatgga gtaccaagaa tgagggagag 4320
acccattggc gacttggttg tcggattgaa gcagcttggt gcagatgttg attgtttcct 4380
tggcactgac tgcccacctg ttcgtgtcaa tggaatcgga gggctacctg gtggcaaggt 4440
tagttactaa gggccacatg ttacattctt ctgtaaatgg tacaactatt gtcgagcttt 4500
tgcatttgta aggaaaacat tgattgatct gaatttgatg ctacaccaca aaatatctac 4560
aaatggtcat ccctaactag caaaccatgt ctccattaag ctcaatgaag taatacttgg 4620
catgtgttta tcaacttaat ttccatcttc tggggtattg cctgttttct agtctaatag 4680
catttgtttt tagaattagc tcttacaact gttatgttct acaggtcaag ctgtctggct 4740
ccatcagcag tcagtacttg agtgccttgc tgatggctgc tcctttggct cttggggatg 4800
tggagattga aatcattgat aaattaatct ccattcccta cgtcgaaatg acattgagat 4860
tgatggagcg ttttggtgtg aaagcagagc attctgatag ctgggacaga ttctacatta 4920
agggaggtca aaaatacaag taagctctgt aatgtatttc actactttga tgccaatgtt 4980
tcagttttca gttttccaaa cagtcgcatc aatatttgaa tagatgcact gtagaaaaaa 5040
atcattgcag ggaaaaacta gtactgagta ttttgactgt aaattattta accagtcgga 5100
atatagtcag tctattggag tcaagagcgt gaaccgaaat agccagttaa ttatcccatt 5160
atacagagga caaccatgta tactattgaa acttggttta agagaatcta ggtagctgga 5220
ctcgtagctg cttggcatgg ataccttctt atctttagga aaagacactt gatttttttt 5280
ctgtggccct ctatgatgtg tgaacctgct tctctattgc tttagaagga tatatctatg 5340
tcgttatgca acatgcttcc cttagtcatt tgtactgaaa tcagtttcat aagttcgtta 5400
gtggttccct aaacgaaacc ttgtttttct ttgcaatcaa caggtcccct aaaaatgcct 5460
atgttgaagg tgatgcctca agcgcaagct atttcttggc tggtgctgca attactggag 5520
ggactgtgac tgtggaaggt tgtggcacca ccagtttgca ggtaaagatt tcttggctgg 5580
tgctacgata actgcttttg tctttttggt ttcagcattg ttctcagagt cactaaataa 5640
cattatcatc tgcaaacgtc aaatagacat acttaggtga atggatattc atgtaaccgt 5700
ttccttacaa atttgctgaa acctcagggt gatgtgaagt ttgctgaggt actggagatg 5760
atgggagcga aggttacatg gaccgagact agcgtaactg ttactggccc accgcgggag 5820
ccatttggga ggaaacacct caaggcgatt gatgtcaaca tgaacaagat gcctgatgtc 5880
gccatgactc ttgctgtggt tgccctcttt gccgatggcc cgacagccat cagagacggt 5940
aaaacattct cagccctaca accatgcctc ttctacatca ctacttgaca agactaaaaa 6000
ctattggctc gttggcagtg gcttcctgga gagtaaagga gaccgagagg atggttgcga 6060
tccggacgga gctaaccaag gtaaggctac atacttcaca tgtctcacgt cgtctttcca 6120
tagctcgctg cctcttagcg gcttgcctgc ggtcgctcca tcctcggttg ctgtctgtgt 6180
tttccacagc tgggagcatc tgttgaggaa gggccggact actgcatcat cacgccgccg 6240
gagaagctga acgtgacggc gatcgacacg tacc 6274
<210> 55
<211> 6038
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(6038)
<223> EPSPS-玉米泛素启动子模板
<400> 55
gatctccggc accgtcaagc tgccggggtc caagtcgctt tccaacagga tcctcctgct 60
cgccgccctg tccgaggtga gcgattttgg tgcttgctgc gctgccctgt ctcactgcta 120
cctaaatgtt ttgcctgtcg aataccatgg attctcggtg taatccatct cacgatcaga 180
tgcaccgcat gtcgcatgcc tagctctctc taatttgtct agtagtttgt atacggatta 240
agattgataa atcggtaccg caaaagctag gtgtaaataa acactacaaa attggatgtt 300
cccctatcgg cctgtactcg gctactcgtt cttgtgatgg catgttattt cttcttggtg 360
tttggtgaac tcccttatga aatttgggcg caaagaaatc gccctcaagg gttgatctta 420
tgccatcgtc atgataaaca gtgaagcacg gatgatcctt tacgttgttt ttaacaaact 480
ttgtcagaaa actagcaatg ttaacttctt aatgatgatt tcacaacaaa aaaggtaacc 540
ttgctactaa cataacaaaa gacttgttgc ttattaatta tatgtttttt taatctttga 600
tcaggggaca acagtggttg ataacctgtt gaacagtgag gatgtccact acatgctcgg 660
ggccttgagg actcttggtc tctctgtcga agcggacaaa gctgccaaaa gagctgtagt 720
tgttggctgt ggtggaaagt tcccagttga ggatgctaaa gaggaagtgc agctcttctt 780
ggggaatgct ggaatcgcaa tgcggtcatt gacagcagct gttactgctg ctggtggaaa 840
tgcaacgtat gtttcctctc tctctctctg cagtgcagcg tgacccggtc gtgcccctct 900
ctagagataa tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc 960
acacttgttt gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga 1020
ataatataat ctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca 1080
gttagacatg gtctaaagga caattgagta ttttgacaac aggactctac agttttatct 1140
ttttagtgtg catgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca 1200
tccattttat tagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt 1260
tttagtacat ctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt 1320
tagttttttt atttaataat ttagatataa aatagaataa aataaagtga ctaaaaatta 1380
aacaaatacc ctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga 1440
taatgccagc ctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca 1500
gcgtcgcgtc gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc 1560
ctctcgagag ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt 1620
ggcggagcgg cagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcacgg 1680
cagctacggg ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat 1740
aaatagacac cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac 1800
acacaaccag atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc 1860
gtcctccccc ccccccctct ctaccttctc tagatcggcg ttccggtcca tgcatggtta 1920
gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt gttagatccg 1980
tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact 2040
tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg 2100
atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca 2160
atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt 2220
gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac 2280
ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa 2340
ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta 2400
ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg 2460
cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta 2520
ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat 2580
ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat 2640
gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa 2700
acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca tatgcagcag 2760
ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc 2820
ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc aggtcgactc tagaggatcc 2880
ccatggcggc catggcgacc aaggccgccg cgggcaccgt gtcgctggac ctcgccgcgc 2940
cgtcgcgccg ccaccaccgc ccgagctcgg cgcgcccgcc cttccgcccc gccgtccgcg 3000
ggctgcgggc gcctgggcgc cgcgtgatcg ccgcgccgcc ggcggcggca gcggcggcgg 3060
cggtgcaggc gggtgccgag gagatcgtgc tgcagcccat caaggagatc tccggcaccg 3120
tcaagctgcc ggggtccaag tcgctttcca accggatcct cctactcgcc gccctgtccg 3180
aggtgagcga ttttggtgct tgctgcgctg ccctgtctca ctgctaccta aatgttttgc 3240
ctgtcgaata ccatgtattc tcggtgtaat ccatctcacg atcagatgca ccgcatatcg 3300
catgccctag ctctctctaa tttgtctagt agtttgtata cggattaata ttgataaatc 3360
ggtaccgcaa aagctagctg taaataaaca ctagaaaatt ggatgttccc ctatcggcct 3420
gtactcggct actcgttctt gtgatggcat gctgtctctt cttggtgttt ggtgaactcc 3480
cttatgaaat ttgggcgcaa agaactcgcc ctcaagggtt gatcttatgc catcgtcatg 3540
ataaacagtg aagcactgat gatcctttac gttgttttta acaaactttg tcagaaaact 3600
agcattgtta acttcttaat gatgatttca caacaaaaaa ggcaaccttg ctactaacat 3660
aacaaaagac ttgttgctta ttaattatat gtttttttaa tctttgatca ggggacaaca 3720
gtggttgata acctgctgaa cagtgaggat gtccactaca tgctcggggc cttgaggact 3780
cttggtctct ctgtcgaagc ggacaaagct gccaaaagag ctgtagttgt tggctgtggt 3840
ggaaagttcc cagttgagga tgctaaagag gaagtgcagc tcttcttggg gaatgctgga 3900
atcgcaatgc ggtcattgac agcagctgtt actgctgctg gtggaaatgc aacgtatgtt 3960
tcctctctct ctacaatact tgttggagtt agtatgaaac ccatgtgtat gtctagtggc 4020
ttatggtgta ttggtttttg aacttcagtt acgtgcttga tggagtacca agaatgaggg 4080
agagacccat tggcgacttg gttgtcggat tgaagcagct tggtgcagat gttgattgtt 4140
tccttggcac tgactgccca cctgttcgtg tcaatggaat cggagggcta cctggtggca 4200
aggttagtta ctaagggcca catgttacat tcttctgtaa atggtacaac tattgtcgag 4260
cttttgcatt tgtaaggaaa acattgattg atctgaattt gatgctacac cacaaaatat 4320
ctacaaatgg tcatccctaa ctagcaaacc atgtctccat taagctcaat gaagtaatac 4380
ttggcatgtg tttatcaact taatttccat cttctggggt attgcctgtt ttctagtcta 4440
atagcatttg tttttagaat tagctcttac aactgttatg ttctacaggt caagctgtct 4500
ggctccatca gcagtcagta cttgagtgcc ttgctgatgg ctgctccttt ggctcttggg 4560
gatgtggaga ttgaaatcat tgataaatta atctccattc cctacgtcga aatgacattg 4620
agattgatgg agcgttttgg tgtgaaagca gagcattctg atagctggga cagattctac 4680
attaagggag gtcaaaaata caagtaagct ctgtaatgta tttcactact ttgatgccaa 4740
tgtttcagtt ttcagttttc caaacagtcg catcaatatt tgaatagatg cactgtagaa 4800
aaaaatcatt gcagggaaaa actagtactg agtattttga ctgtaaatta tttaaccagt 4860
cggaatatag tcagtctatt ggagtcaaga gcgtgaaccg aaatagccag ttaattatcc 4920
cattatacag aggacaacca tgtatactat tgaaacttgg tttaagagaa tctaggtagc 4980
tggactcgta gctgcttggc atggatacct tcttatcttt aggaaaagac acttgatttt 5040
ttttctgtgg ccctctatga tgtgtgaacc tgcttctcta ttgctttaga aggatatatc 5100
tatgtcgtta tgcaacatgc ttcccttagt catttgtact gaaatcagtt tcataagttc 5160
gttagtggtt ccctaaacga aaccttgttt ttctttgcaa tcaacaggtc ccctaaaaat 5220
gcctatgttg aaggtgatgc ctcaagcgca agctatttct tggctggtgc tgcaattact 5280
ggagggactg tgactgtgga aggttgtggc accaccagtt tgcaggtaaa gatttcttgg 5340
ctggtgctac gataactgct tttgtctttt tggtttcagc attgttctca gagtcactaa 5400
ataacattat catctgcaaa cgtcaaatag acatacttag gtgaatggat attcatgtaa 5460
ccgtttcctt acaaatttgc tgaaacctca gggtgatgtg aagtttgctg aggtactgga 5520
gatgatggga gcgaaggtta catggaccga gactagcgta actgttactg gcccaccgcg 5580
ggagccattt gggaggaaac acctcaaggc gattgatgtc aacatgaaca agatgcctga 5640
tgtcgccatg actcttgctg tggttgccct ctttgccgat ggcccgacag ccatcagaga 5700
cggtaaaaca ttctcagccc tacaaccatg cctcttctac atcactactt gacaagacta 5760
aaaactattg gctcgttggc agtggcttcc tggagagtaa aggagaccga gaggatggtt 5820
gcgatccgga cggagctaac caaggtaagg ctacatactt cacatgtctc acgtcgtctt 5880
tccatagctc gctgcctctt agcggcttgc ctgcggtcgc tccatcctcg gttgctgtct 5940
gtgttttcca cagctgggag catctgttga ggaagggccg gactactgca tcatcacgcc 6000
gccggagaag ctgaacgtga cggcgatcga cacgtacc 6038
<210> 56
<211> 3708
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(3708)
<223> EPSPS-K90R模板
<400> 56
ctgcagccca tcaaggagat ctccggcacc gtcaagctgc cggggtccaa gtcgctttcc 60
aacaggatcc tcctgctcgc cgccctgtcc gaggtgagcg attttggtgc ttgctgcgct 120
gccctgtctc actgctacct aaatgttttg cctgtcgaat accatggatt ctcggtgtaa 180
tccatctcac gatcagatgc accgcatgtc gcatgcctag ctctctctaa tttgtctagt 240
agtttgtata cggattaaga ttgataaatc ggtaccgcaa aagctaggtg taaataaaca 300
ctacaaaatt ggatgttccc ctatcggcct gtactcggct actcgttctt gtgatggcat 360
gttatttctt cttggtgttt ggtgaactcc cttatgaaat ttgggcgcaa agaaatcgcc 420
ctcaagggtt gatcttatgc catcgtcatg ataaacagtg aagcacggat gatcctttac 480
gttgttttta acaaactttg tcagaaaact agcaatgtta acttcttaat gatgatttca 540
caacaaaaaa ggtaaccttg ctactaacat aacaaaagac ttgttgctta ttaattatat 600
gtttttttaa tctttgatca ggggacaaca gtggttgata acctgttgaa cagtgaggat 660
gtccactaca tgctcggggc cttgaggact cttggtctct ctgtcgaagc ggacaaagct 720
gccaaaagag ctgtagttgt tggctgtggt ggaaagttcc cagttgagga tgctagagag 780
gaagtgcagc tcttcttggg gaatgctgga atcgcaatgc ggtcattgac agcagctgtt 840
actgctgctg gtggaaatgc aacgtatgtt tcctctctct ctctacaata cttgttggag 900
ttagtatgaa acccatgtgt atgtctagtg gcttatggtg tattggtttt tgaacttcag 960
ttacgtgctt gatggagtac caagaatgag ggagagaccc attggcgact tggttgtcgg 1020
attgaagcag cttggtgcag atgttgattg tttccttggc actgactgcc cacctgttcg 1080
tgtcaatgga atcggagggc tacctggtgg caaggttagt tactaagggc cacatgttac 1140
attcttctgt aaatggtaca actattgtcg agcttttgca tttgtaagga aaacattgat 1200
tgatctgaat ttgatgctac accacaaaat atctacaaat ggtcatccct aactagcaaa 1260
ccatgtctcc attaagctca atgaagtaat acttggcatg tgtttatcaa cttaatttcc 1320
atcttctggg gtattgcctg ttttctagtc taatagcatt tgtttttaga attagctctt 1380
acaactgtta tgttctacag gtcaagctgt ctggctccat cagcagtcag tacttgagtg 1440
ccttgctgat ggctgctcct ttggctcttg gggatgtgga gattgaaatc attgataaat 1500
taatctccat tccctacgtc gaaatgacat tgagattgat ggagcgtttt ggtgtgaaag 1560
cagagcattc tgatagctgg gacagattct acattaaggg aggtcaaaaa tacaagtaag 1620
ctctgtaatg tatttcacta ctttgatgcc aatgtttcag ttttcagttt tccaaacagt 1680
cgcatcaata tttgaataga tgcactgtag aaaaaaatca ttgcagggaa aaactagtac 1740
tgagtatttt gactgtaaat tatttaacca gtcggaatat agtcagtcta ttggagtcaa 1800
gagcgtgaac cgaaatagcc agttaattat cccattatac agaggacaac catgtatact 1860
attgaaactt ggtttaagag aatctaggta gctggactcg tagctgcttg gcatggatac 1920
cttcttatct ttaggaaaag acacttgatt ttttttctgt ggccctctat gatgtgtgaa 1980
cctgcttctc tattgcttta gaaggatata tctatgtcgt tatgcaacat gcttccctta 2040
gtcatttgta ctgaaatcag tttcataagt tcgttagtgg ttccctaaac gaaaccttgt 2100
ttttctttgc aatcaacagg tcccctaaaa atgcctatgt tgaaggtgat gcctcaagcg 2160
caagctattt cttggctggt gctgcaatta ctggagggac tgtgactgtg gaaggttgtg 2220
gcaccaccag tttgcaggta aagatttctt ggctggtgct acgataactg cttttgtctt 2280
tttggtttca gcattgttct cagagtcact aaataacatt atcatctgca aacgtcaaat 2340
agacatactt aggtgaatgg atattcatgt aaccgtttcc ttacaaattt gctgaaacct 2400
cagggtgatg tgaagtttgc tgaggtactg gagatgatgg gagcgaaggt tacatggacc 2460
gagactagcg taactgttac tggcccaccg cgggagccat ttgggaggaa acacctcaag 2520
gcgattgatg tcaacatgaa caagatgcct gatgtcgcca tgactcttgc tgtggttgcc 2580
ctctttgccg atggcccgac agccatcaga gacggtaaaa cattctcagc cctacaacca 2640
tgcctcttct acatcactac ttgacaagac taaaaactat tggctcgttg gcagtggctt 2700
cctggagagt aaaggagacc gagaggatgg ttgcgatccg gacggagcta accaaggtaa 2760
ggctacatac ttcacatgtc tcacgtcgtc tttccatagc tcgctgcctc ttagcggctt 2820
gcctgcggtc gctccatcct cggttgctgt ctgtgttttc cacagctggg agcatctgtt 2880
gaggaagggc cggactactg catcatcacg ccgccggaga agctgaacgt gacggcgatc 2940
gacacgtacg acgaccacag gatggccatg gccttctccc ttgccgcctg tgccgaggtc 3000
cccgtgacca tccgggaccc tgggtgcacc cggaagacct tccccgacta cttcgatgtg 3060
ctgagcactt tcgtcaagaa ttaataaagc gtgcgatact accacgcagc ttgattgaag 3120
tgataggctt gtgctgagga aatacatttc ttttgttctg ttttttctct ttcacgggat 3180
taagttttga gtctgtaacg ttagttgttt gtagcaagtt tctatttcgg atcttaagtt 3240
tgtgcactgt aagccaaatt tcatttcaag agtggttcgt tggaataata agaataataa 3300
attacgtttc agtggctgtc aagcctgctg ctacgtttta ggagatggca ttagacattc 3360
atcatcaaca acaataaaac cttttagcct caaacaataa tagtgaagtt attttttagt 3420
cctaaacaag ttgcattagg atatagttaa aacacaaaag aagctaaagt tagggtttag 3480
acatgtggat attgttttcc atgtatagta tgttctttct ttgagtctca tttaactacc 3540
tctacacata ccaactttag ttttttttct acctcttcat gttactatgg tgccttctta 3600
tcccactgag cattggtata tttagaggtt tttgttgaac atgcctaaat catctcaatc 3660
aacgatggac aatcttttct tcgattgagc tgaggtacgt catctaga 3708
<210> 57
<211> 3714
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(3714)
<223> EPSPS-IME模板
<400> 57
ctgcagccca tcaaggagat ctccggcacc gtcaagctgc cggggtccaa gtcgctttcc 60
aacaggatcc tcctgctcgc cgccctgtcc gaggtgagcg attttggtgc ttgctgcgct 120
gccctgtctc actgctacct aaatgttttg cctgtcgaat accatggatt ctcggtgtaa 180
tccatatctg cacgatcaga tatgcaccgc atgtcgcata tctgagctct ctctaatttg 240
tctagtagtt tgtatacgga ttaagattga taaatcggta ccgcaaaagc taggtgtaaa 300
taaacactac aaaattggat gttcccctat cggcctgtac tcggctactc gttcttgtga 360
tggcatgtta tttcttcttg gtgtttggtg aactccctta tgaaatttgg gcgcaaagaa 420
atcgccctca agggttgatc ttatgccatc gtcatgataa acagtgaagc acggatgatc 480
ctttacgttg tttttaacaa actttgtcag aaaactagca atgttaactt cttaatgatg 540
atttcacaac aaaaaaggta accttgctac taacataaca aaagacttgt tgcttattaa 600
ttatatgttt ttttaatctt tgatcagggg acaacagtgg ttgataacct gttgaacagt 660
gaggatgtcc actacatgct cggggccttg aggactcttg gtctctctgt cgaagcggac 720
aaagctgcca aaagagctgt agttgttggc tgtggtggaa agttcccagt tgaggatgct 780
aaagaggaag tgcagctctt cttggggaat gctggaatcg caatgcggtc attgacagca 840
gctgttactg ctgctggtgg aaatgcaacg tatgtttcct ctctctctct acaatacttg 900
ttggagttag tatgaaaccc atgtgtatgt ctagtggctt atggtgtatt ggtttttgaa 960
cttcagttac gtgcttgatg gagtaccaag aatgagggag agacccattg gcgacttggt 1020
tgtcggattg aagcagcttg gtgcagatgt tgattgtttc cttggcactg actgcccacc 1080
tgttcgtgtc aatggaatcg gagggctacc tggtggcaag gttagttact aagggccaca 1140
tgttacattc ttctgtaaat ggtacaacta ttgtcgagct tttgcatttg taaggaaaac 1200
attgattgat ctgaatttga tgctacacca caaaatatct acaaatggtc atccctaact 1260
agcaaaccat gtctccatta agctcaatga agtaatactt ggcatgtgtt tatcaactta 1320
atttccatct tctggggtat tgcctgtttt ctagtctaat agcatttgtt tttagaatta 1380
gctcttacaa ctgttatgtt ctacaggtca agctgtctgg ctccatcagc agtcagtact 1440
tgagtgcctt gctgatggct gctcctttgg ctcttgggga tgtggagatt gaaatcattg 1500
ataaattaat ctccattccc tacgtcgaaa tgacattgag attgatggag cgttttggtg 1560
tgaaagcaga gcattctgat agctgggaca gattctacat taagggaggt caaaaataca 1620
agtaagctct gtaatgtatt tcactacttt gatgccaatg tttcagtttt cagttttcca 1680
aacagtcgca tcaatatttg aatagatgca ctgtagaaaa aaatcattgc agggaaaaac 1740
tagtactgag tattttgact gtaaattatt taaccagtcg gaatatagtc agtctattgg 1800
agtcaagagc gtgaaccgaa atagccagtt aattatccca ttatacagag gacaaccatg 1860
tatactattg aaacttggtt taagagaatc taggtagctg gactcgtagc tgcttggcat 1920
ggataccttc ttatctttag gaaaagacac ttgatttttt ttctgtggcc ctctatgatg 1980
tgtgaacctg cttctctatt gctttagaag gatatatcta tgtcgttatg caacatgctt 2040
cccttagtca tttgtactga aatcagtttc ataagttcgt tagtggttcc ctaaacgaaa 2100
ccttgttttt ctttgcaatc aacaggtccc ctaaaaatgc ctatgttgaa ggtgatgcct 2160
caagcgcaag ctatttcttg gctggtgctg caattactgg agggactgtg actgtggaag 2220
gttgtggcac caccagtttg caggtaaaga tttcttggct ggtgctacga taactgcttt 2280
tgtctttttg gtttcagcat tgttctcaga gtcactaaat aacattatca tctgcaaacg 2340
tcaaatagac atacttaggt gaatggatat tcatgtaacc gtttccttac aaatttgctg 2400
aaacctcagg gtgatgtgaa gtttgctgag gtactggaga tgatgggagc gaaggttaca 2460
tggaccgaga ctagcgtaac tgttactggc ccaccgcggg agccatttgg gaggaaacac 2520
ctcaaggcga ttgatgtcaa catgaacaag atgcctgatg tcgccatgac tcttgctgtg 2580
gttgccctct ttgccgatgg cccgacagcc atcagagacg gtaaaacatt ctcagcccta 2640
caaccatgcc tcttctacat cactacttga caagactaaa aactattggc tcgttggcag 2700
tggcttcctg gagagtaaag gagaccgaga ggatggttgc gatccggacg gagctaacca 2760
aggtaaggct acatacttca catgtctcac gtcgtctttc catagctcgc tgcctcttag 2820
cggcttgcct gcggtcgctc catcctcggt tgctgtctgt gttttccaca gctgggagca 2880
tctgttgagg aagggccgga ctactgcatc atcacgccgc cggagaagct gaacgtgacg 2940
gcgatcgaca cgtacgacga ccacaggatg gccatggcct tctcccttgc cgcctgtgcc 3000
gaggtccccg tgaccatccg ggaccctggg tgcacccgga agaccttccc cgactacttc 3060
gatgtgctga gcactttcgt caagaattaa taaagcgtgc gatactacca cgcagcttga 3120
ttgaagtgat aggcttgtgc tgaggaaata catttctttt gttctgtttt ttctctttca 3180
cgggattaag ttttgagtct gtaacgttag ttgtttgtag caagtttcta tttcggatct 3240
taagtttgtg cactgtaagc caaatttcat ttcaagagtg gttcgttgga ataataagaa 3300
taataaatta cgtttcagtg gctgtcaagc ctgctgctac gttttaggag atggcattag 3360
acattcatca tcaacaacaa taaaaccttt tagcctcaaa caataatagt gaagttattt 3420
tttagtccta aacaagttgc attaggatat agttaaaaca caaaagaagc taaagttagg 3480
gtttagacat gtggatattg ttttccatgt atagtatgtt ctttctttga gtctcattta 3540
actacctcta cacataccaa ctttagtttt ttttctacct cttcatgtta ctatggtgcc 3600
ttcttatccc actgagcatt ggtatattta gaggtttttg ttgaacatgc ctaaatcatc 3660
tcaatcaacg atggacaatc ttttcttcga ttgagctgag gtacgtcatc taga 3714
<210> 58
<211> 3708
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(3708)
<223> EPSPS-T剪接模板
<400> 58
ctgcagccca tcaaggagat ctccggcacc gtcaagctgc cggggtccaa gtcgctttcc 60
aacaggatcc tcctgctcgc cgccctgtcc gaggtgagcg attttggtgc ttgctgcgct 120
gccctgtctc actgctacct aaatgttttg cctgtcgaat accatggatt ctcggtgtaa 180
tccatctcac gatcagatgc accgcatgtc gcatgcctag ctctctctaa tttgtctagt 240
agtttgtata cggattaaga ttgataaatc ggtaccgcaa aagctaggtg taaataaaca 300
ctacaaaatt ggatgttccc ctatcggcct gtactcggct actcgttctt gtgatggcat 360
gttatttctt cttggtgttt ggtgaactcc cttatgaaat ttgggcgcaa agaaatcgcc 420
ctcaagggtt gatcttatgc catcgtcatg ataaacagtg aagcacggat gatcctttac 480
gttgttttta acaaactttg tcagaaaact agcaatgtta acttcttaat gatgatttca 540
caacaaaaaa ggtaaccttg ctactaacat aacaaaagac ttgttgctta ttaattatat 600
gtttttttaa tctttgatca ggggacaaca gtggttgata acctgttgaa cagtgaggat 660
gtccactaca tgctcggggc cttgaggact cttggtctct ctgtcgaagc ggacaaagct 720
gccaaaagag ctgtagttgt tggctgtggt ggaaagttcc cagttgagga tgctagaaag 780
gaagtgcagc tcttcttggg gaatgctgga atcgcaatgc ggtcattgac agcagctgtt 840
actgctgctg gtggaaatgc aacgtatgtt tcctctctct ctctacaata cttgttggag 900
ttagtatgaa acccatgtgt atgtctagtg gcttatggtg tattggtttt tgaacttcag 960
gtacgtgctt gatggagtac caagaatgag ggagagaccc attggcgact tggttgtcgg 1020
attgaagcag cttggtgcag atgttgattg tttccttggc actgactgcc cacctgttcg 1080
tgtcaatgga atcggagggc tacctggtgg caaggttagt tactaagggc cacatgttac 1140
attcttctgt aaatggtaca actattgtcg agcttttgca tttgtaagga aaacattgat 1200
tgatctgaat ttgatgctac accacaaaat atctacaaat ggtcatccct aactagcaaa 1260
ccatgtctcc attaagctca atgaagtaat acttggcatg tgtttatcaa cttaatttcc 1320
atcttctggg gtattgcctg ttttctagtc taatagcatt tgtttttaga attagctctt 1380
acaactgtta tgttctacag gtcaagctgt ctggctccat cagcagtcag tacttgagtg 1440
ccttgctgat ggctgctcct ttggctcttg gggatgtgga gattgaaatc attgataaat 1500
taatctccat tccctacgtc gaaatgacat tgagattgat ggagcgtttt ggtgtgaaag 1560
cagagcattc tgatagctgg gacagattct acattaaggg aggtcaaaaa tacaagtaag 1620
ctctgtaatg tatttcacta ctttgatgcc aatgtttcag ttttcagttt tccaaacagt 1680
cgcatcaata tttgaataga tgcactgtag aaaaaaatca ttgcagggaa aaactagtac 1740
tgagtatttt gactgtaaat tatttaacca gtcggaatat agtcagtcta ttggagtcaa 1800
gagcgtgaac cgaaatagcc agttaattat cccattatac agaggacaac catgtatact 1860
attgaaactt ggtttaagag aatctaggta gctggactcg tagctgcttg gcatggatac 1920
cttcttatct ttaggaaaag acacttgatt ttttttctgt ggccctctat gatgtgtgaa 1980
cctgcttctc tattgcttta gaaggatata tctatgtcgt tatgcaacat gcttccctta 2040
gtcatttgta ctgaaatcag tttcataagt tcgttagtgg ttccctaaac gaaaccttgt 2100
ttttctttgc aatcaacagg tcccctaaaa atgcctatgt tgaaggtgat gcctcaagcg 2160
caagctattt cttggctggt gctgcaatta ctggagggac tgtgactgtg gaaggttgtg 2220
gcaccaccag tttgcaggta aagatttctt ggctggtgct acgataactg cttttgtctt 2280
tttggtttca gcattgttct cagagtcact aaataacatt atcatctgca aacgtcaaat 2340
agacatactt aggtgaatgg atattcatgt aaccgtttcc ttacaaattt gctgaaacct 2400
cagggtgatg tgaagtttgc tgaggtactg gagatgatgg gagcgaaggt tacatggacc 2460
gagactagcg taactgttac tggcccaccg cgggagccat ttgggaggaa acacctcaag 2520
gcgattgatg tcaacatgaa caagatgcct gatgtcgcca tgactcttgc tgtggttgcc 2580
ctctttgccg atggcccgac agccatcaga gacggtaaaa cattctcagc cctacaacca 2640
tgcctcttct acatcactac ttgacaagac taaaaactat tggctcgttg gcagtggctt 2700
cctggagagt aaaggagacc gagaggatgg ttgcgatccg gacggagcta accaaggtaa 2760
ggctacatac ttcacatgtc tcacgtcgtc tttccatagc tcgctgcctc ttagcggctt 2820
gcctgcggtc gctccatcct cggttgctgt ctgtgttttc cacagctggg agcatctgtt 2880
gaggaagggc cggactactg catcatcacg ccgccggaga agctgaacgt gacggcgatc 2940
gacacgtacg acgaccacag gatggccatg gccttctccc ttgccgcctg tgccgaggtc 3000
cccgtgacca tccgggaccc tgggtgcacc cggaagacct tccccgacta cttcgatgtg 3060
ctgagcactt tcgtcaagaa ttaataaagc gtgcgatact accacgcagc ttgattgaag 3120
tgataggctt gtgctgagga aatacatttc ttttgttctg ttttttctct ttcacgggat 3180
taagttttga gtctgtaacg ttagttgttt gtagcaagtt tctatttcgg atcttaagtt 3240
tgtgcactgt aagccaaatt tcatttcaag agtggttcgt tggaataata agaataataa 3300
attacgtttc agtggctgtc aagcctgctg ctacgtttta ggagatggca ttagacattc 3360
atcatcaaca acaataaaac cttttagcct caaacaataa tagtgaagtt attttttagt 3420
cctaaacaag ttgcattagg atatagttaa aacacaaaag aagctaaagt tagggtttag 3480
acatgtggat attgttttcc atgtatagta tgttctttct ttgagtctca tttaactacc 3540
tctacacata ccaactttag ttttttttct acctcttcat gttactatgg tgccttctta 3600
tcccactgag cattggtata tttagaggtt tttgttgaac atgcctaaat catctcaatc 3660
aacgatggac aatcttttct tcgattgagc tgaggtacgt catctaga 3708
<210> 59
<211> 3201
<212> DNA
<213> 玉米(Zea mays,L.)
<220>
<221> 尚未归类的特性
<222> (1)..(3201)
<223> EPSPS-合成模板
<400> 59
atggcggcca tggcgaccaa ggccgccgcg ggcaccgtgt cgctggacct cgccgcgccg 60
ccggcggcgg cagcggcggc ggcggtgcag gcgggtgccg aggagatcgt gctgcagccc 120
atcaaggaga tctccggcac cgtcaagctg ccggggtcca agtcgctttc caacaggatc 180
ctcctgctcg ccgccctgtc cgaggtgagc gattttggtg cttgctgcgc tgccctgtct 240
cactgctacc taaatgtttt gcctgtcgaa taccatggat tctcggtgta atccatatct 300
gcacgatcag atatgcaccg catgtcgcat atctgagctc tctctaattt gtctagtagt 360
ttgtatacgg attaagattg ataaatcggt accgcaaaag ctaggtgtaa ataaacacta 420
caaaattgga tgttccccta tcggcctgta ctcggctact cgttcttgtg atggcatgtt 480
atttcttctt ggtgtttggt gaactccctt atgaaatttg ggcgcaaaga aatcgccctc 540
aagggttgat cttatgccat cgtcatgata aacagtgaag cacggatgat cctttacgtt 600
gtttttaaca aactttgtca gaaaactagc aatgttaact tcttaatgat gatttcacaa 660
caaaaaaggt aaccttgcta ctaacataac aaaagacttg ttgcttatta attatatgtt 720
tttttaatct ttgatcaggg gacaacagtg gttgataacc tgttgaacag cgaggatgtc 780
cactacatgc tcggggcctt gaggactctt ggtctctctg tcgaagcgga caaagctgcc 840
aaaagagctg ttgttgttgg ctgtggtgga aagttcccag ttgaggatgc taaagaggaa 900
gtgcagctct tcttggggaa tgctggaatt gcaatgcggt cattgacagc agctgttact 960
gctgctggtg gaaatgcaac gtatgtttcc tctctctctc tacaatactt gttggagtta 1020
gtatgaaacc catgtgtatg tctagtggct tatggtgtat tggtttttga acttcagtta 1080
cgtgcttgat ggagtgccaa gaatgaggga gagacccatt ggcgacttgg ttgtcggatt 1140
gaagcagctt ggtgcagatg ttgattgttt ccttggcact gactgcccac ctgttcgcgt 1200
caatggaatc ggagggcttc ctggtggcaa ggttagttac taagggccac atgttacatt 1260
cttctgtaaa tggtacaact attgtcgagc ttttgcattt gtaaggaaaa cattgattga 1320
tctgaatttg atgctacacc acaaaatatc tacaaatggt catccctaac tagcaaacca 1380
tgtctccatt aagctcaatg aagtaatact tggcatgtgt ttatcaactt aatttccatc 1440
ttctggggta ttgcctgttt tctagtctaa tagcatttgt ttttagaatt agctcttaca 1500
actgttatgt tctacaggtc aagctgtctg gctccatcag cagccagtac ttgagcgcct 1560
tgctgatggc tgctcctttg gctcttgggg atgtggagat tgaaatcatt gataaattaa 1620
tctccattcc ctacgtcgaa atgacattga gattgatgga gcgctttggt gtgaaagcag 1680
agcattctga tagctgggac agattctaca ttaagggagg tcaaaaatac aagtaagctc 1740
tgtaatgtat ttcactactt tgatgccaat gtttcagttt tcagttttcc aaacagtcgc 1800
atcaatattt gaatagatgc actgtagaaa aaaatcattg cagggaaaaa ctagtactga 1860
gtattttgac tgtaaattat ttaaccagtc ggaatatagt cagtctattg gagtcaagag 1920
cgtgaaccga aatagccagt taattatccc attatacaga ggacaaccat gtatactatt 1980
gaaacttggt ttaagagaat ctaggtagct ggactcgtag ctgcttggca tggatacctt 2040
cttatcttta ggaaaagaca cttgattttt tttctgtggc cctctatgat gtgtgaacct 2100
gcttctctat tgctttagaa ggatatatct atgtcgttat gcaacatgct tcccttagtc 2160
atttgtactg aaatcagttt cataagttcg ttagtggttc cctaaacgaa accttgtttt 2220
tctttgcaat caacaggtcc cctaaaaatg cctatgttga aggtgatgcc tcaagcgcaa 2280
gctatttctt ggctggtgct gcaattactg gagggactgt gactgtggaa ggttgtggca 2340
ccaccagctt gcaggtaaag atttcttggc tggtgctacg ataactgctt ttgtcttttt 2400
ggtttcagca ttgttctcag agtcactaaa taacattatc atctgcaaac gtcaaataga 2460
catacttagg tgaatggata ttcatgtaac cgtttcctta caaatttgct gaaacctcag 2520
ggtgatgtga agtttgctga ggttctggag atgatgggag cgaaggttac atggaccgag 2580
actagcgtta ctgttactgg cccaccgcgg gagccatttg ggaggaaaca cctcaaggcg 2640
attgatgtca acatgaacaa gatgcctgat gtcgccatga ctcttgctgt ggttgccctc 2700
tttgccgatg gcccgacagc catcagagac ggtaaaacat tctcagccct acaaccatgc 2760
ctcttctaca tcactacttg acaagactaa aaactattgg ctcgttggca gtggcttcct 2820
ggagagttaa ggagaccgag aggatggttg cgatccggac ggagctaacc aaggtaaggc 2880
tacatacttc acatgtctca cgtcgtcttt ccatagctcg ctgcctctta gcggcttgcc 2940
tgcggtcgct ccatcctcgg ttgctgtctg tgttttccac agctgggagc atctgttgag 3000
gaagggccgg actactgcat catcacgccg ccggagaagc tgaacgtgac ggcgatcgac 3060
acgtacgacg accacaggat ggccatggcc ttctcccttg ccgcctgtgc cgaggtcccc 3120
gtgaccatcc gggaccctgg gtgcacccgg aagaccttcc ccgactactt cgatgtgctg 3180
agcactttcg tcaagaatta a 3201
<210> 60
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR1,Cas9靶序列
<400> 60
gcgtcctttg acagcagctg tgg 23
<210> 61
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR2,Cas9靶序列
<400> 61
gcaaccacag ctgctgtcaa agg 23
<210> 62
<211> 434
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(434)
<223> GM-U6-13.1 PRO
<400> 62
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaa 434
<210> 63
<211> 9093
<212> DNA
<213> 人工序列
<220>
<223> QC878
<400> 63
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg cgtcctttga cagcagctgg ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggacaa aaagtactca atagggctcg acatagggac 2100
taactccgtt ggatgggccg tcatcaccga cgagtacaag gtgccctcca agaagttcaa 2160
ggtgttggga aacaccgaca ggcacagcat aaagaagaat ttgatcggtg ccctcctctt 2220
cgactccgga gagaccgctg aggctaccag gctcaagagg accgctagaa ggcgctacac 2280
cagaaggaag aacagaatct gctacctgca ggagatcttc tccaacgaga tggccaaggt 2340
ggacgactcc ttcttccacc gccttgagga atcattcctg gtggaggagg ataaaaagca 2400
cgagagacac ccaatcttcg ggaacatcgt cgacgaggtg gcctaccatg aaaagtaccc 2460
taccatctac cacctgagga agaagctggt cgactctacc gacaaggctg acttgcgctt 2520
gatttacctg gctctcgctc acatgataaa gttccgcgga cacttcctca ttgagggaga 2580
cctgaaccca gacaactccg acgtggacaa gctcttcatc cagctcgttc agacctacaa 2640
ccagcttttc gaggagaacc caatcaacgc cagtggagtt gacgccaagg ctatcctctc 2700
tgctcgtctg tcaaagtcca ggaggcttga gaacttgatt gcccagctgc ctggcgaaaa 2760
gaagaacgga ctgttcggaa acttgatcgc tctctccctg ggattgactc ccaacttcaa 2820
gtccaacttc gacctcgccg aggacgctaa gttgcagttg tctaaagaca cctacgacga 2880
tgacctcgac aacttgctgg cccagatagg cgaccaatac gccgatctct tcctcgccgc 2940
taagaacttg tccgacgcaa tcctgctgtc cgacatcctg agagtcaaca ctgagattac 3000
caaagctcct ctgtctgctt ccatgattaa gcgctacgac gagcaccacc aagatctgac 3060
cctgctcaag gccctggtga gacagcagct gcccgagaag tacaaggaga tctttttcga 3120
ccagtccaag aacggctacg ccggatacat tgacggaggc gcctcccagg aagagttcta 3180
caagttcatc aagcccatcc ttgagaagat ggacggtacc gaggagctgt tggtgaagtt 3240
gaacagagag gacctgttga ggaagcagag aaccttcgac aacggaagca tccctcacca 3300
aatccacctg ggagagctcc acgccatctt gaggaggcag gaggatttct atcccttcct 3360
gaaggacaac cgcgagaaga ttgagaagat cttgaccttc agaattcctt actacgtcgg 3420
gccactcgcc agaggaaact ctaggttcgc ctggatgacc cgcaaatctg aagagaccat 3480
tactccctgg aacttcgagg aagtcgtgga caagggcgct tccgctcagt ctttcatcga 3540
gaggatgacc aacttcgata aaaatctgcc caacgagaag gtgctgccca agcactccct 3600
gttgtacgag tatttcacag tgtacaacga gctcaccaag gtgaagtacg tcacagaggg 3660
aatgaggaag cctgccttct tgtccggaga gcagaagaag gccatcgtcg acctgctctt 3720
caagaccaac aggaaggtga ctgtcaagca gctgaaggag gactacttca agaagatcga 3780
gtgcttcgac tccgtcgaga tctctggtgt cgaggacagg ttcaacgcct cccttgggac 3840
ttaccacgat ctgctcaaga ttattaaaga caaggacttc ctggacaacg aggagaacga 3900
ggacatcctt gaggacatcg tgctcaccct gaccttgttc gaagacaggg aaatgatcga 3960
agagaggctc aagacctacg cccacctctt cgacgacaag gtgatgaaac agctgaagag 4020
acgcagatat accggctggg gaaggctctc ccgcaaattg atcaacggga tcagggacaa 4080
gcagtcaggg aagactatac tcgacttcct gaagtccgac ggattcgcca acaggaactt 4140
catgcagctc attcacgacg actccttgac cttcaaggag gacatccaga aggctcaggt 4200
gtctggacag ggtgactcct tgcatgagca cattgctaac ttggccggct ctcccgctat 4260
taagaagggc attttgcaga ccgtgaaggt cgttgacgag ctcgtgaagg tgatgggacg 4320
ccacaagcca gagaacatcg ttattgagat ggctcgcgag aaccaaacta cccagaaagg 4380
gcagaagaat tcccgcgaga ggatgaagcg cattgaggag ggcataaaag agcttggctc 4440
tcagatcctc aaggagcacc ccgtcgagaa cactcagctg cagaacgaga agctgtacct 4500
gtactacctc caaaacggaa gggacatgta cgtggaccag gagctggaca tcaacaggtt 4560
gtccgactac gacgtcgacc acatcgtgcc tcagtccttc ctgaaggatg actccatcga 4620
caataaagtg ctgacacgct ccgataaaaa tagaggcaag tccgacaacg tcccctccga 4680
ggaggtcgtg aagaagatga aaaactactg gagacagctc ttgaacgcca agctcatcac 4740
ccagcgtaag ttcgacaacc tgactaaggc tgagagagga ggattgtccg agctcgataa 4800
ggccggattc atcaagagac agctcgtcga aacccgccaa attaccaagc acgtggccca 4860
aattctggat tcccgcatga acaccaagta cgatgaaaat gacaagctga tccgcgaggt 4920
caaggtgatc accttgaagt ccaagctggt ctccgacttc cgcaaggact tccagttcta 4980
caaggtgagg gagatcaaca actaccacca cgcacacgac gcctacctca acgctgtcgt 5040
tggaaccgcc ctcatcaaaa aatatcctaa gctggagtct gagttcgtct acggcgacta 5100
caaggtgtac gacgtgagga agatgatcgc taagtctgag caggagatcg gcaaggccac 5160
cgccaagtac ttcttctact ccaacatcat gaacttcttc aagaccgaga tcactctcgc 5220
caacggtgag atcaggaagc gcccactgat cgagaccaac ggtgagactg gagagatcgt 5280
gtgggacaaa gggagggatt tcgctactgt gaggaaggtg ctctccatgc ctcaggtgaa 5340
catcgtcaag aagaccgaag ttcagaccgg aggattctcc aaggagtcca tcctccccaa 5400
gagaaactcc gacaagctga tcgctagaaa gaaagactgg gaccctaaga agtacggagg 5460
cttcgattct cctaccgtgg cctactctgt gctggtcgtg gccaaggtgg agaagggcaa 5520
gtccaagaag ctgaaatccg tcaaggagct cctcgggatt accatcatgg agaggagttc 5580
cttcgagaag aaccctatcg acttcctgga ggccaaggga tataaagagg tgaagaagga 5640
cctcatcatc aagctgccca agtactccct cttcgagttg gagaacggaa ggaagaggat 5700
gctggcttct gccggagagt tgcagaaggg aaatgagctc gcccttccct ccaagtacgt 5760
gaacttcctg tacctcgcct ctcactatga aaagttgaag ggctctcctg aggacaacga 5820
gcagaagcag ctcttcgtgg agcagcacaa gcactacctg gacgaaatta tcgagcagat 5880
ctctgagttc tccaagcgcg tgatattggc cgacgccaac ctcgacaagg tgctgtccgc 5940
ctacaacaag cacagggata agcccattcg cgagcaggct gaaaacatta tccacctgtt 6000
taccctcaca aacttgggag cccctgctgc cttcaagtac ttcgacacca ccattgacag 6060
gaagagatac acctccacca aggaggtgct cgacgcaaca ctcatccacc aatccatcac 6120
cggcctctat gaaacaagga ttgacttgtc ccagctggga ggcgactcta gagccgatcc 6180
caagaagaag agaaaggtgt aggttaacct agacttgtcc atcttctgga ttggccaact 6240
taattaatgt atgaaataaa aggatgcaca catagtgaca tgctaatcac tataatgtgg 6300
gcatcaaagt tgtgtgttat gtgtaattac tagttatctg aataaaagag aaagagatca 6360
tccatatttc ttatcctaaa tgaatgtcac gtgtctttat aattctttga tgaaccagat 6420
gcatttcatt aaccaaatcc atatacatat aaatattaat catatataat taatatcaat 6480
tgggttagca aaacaaatct agtctaggtg tgttttgcga attcgatatc aagcttatcg 6540
ataccgtcga gggggggccc ggtaccggcg cgccgttcta tagtgtcacc taaatcgtat 6600
gtgtatgata cataaggtta tgtattaatt gtagccgcgt tctaacgaca atatgtccat 6660
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc 6720
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 6780
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 6840
cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgaccaaaat 6900
cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 6960
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 7020
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 7080
cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 7140
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 7200
tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 7260
taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 7320
gacctacacc gaactgagat acctacagcg tgagcattga gaaagcgcca cgcttcccga 7380
agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 7440
ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 7500
acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 7560
caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 7620
tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 7680
tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc 7740
aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcaggt tgatcagatc 7800
tcgatcccgc gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa 7860
ataattttgt ttaactttaa gaaggagata tacccatgga aaagcctgaa ctcaccgcga 7920
cgtctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg atgcagctct 7980
cggagggcga agaatctcgt gctttcagct tcgatgtagg agggcgtgga tatgtcctgc 8040
gggtaaatag ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg cactttgcat 8100
cggccgcgct cccgattccg gaagtgcttg acattgggga attcagcgag agcctgacct 8160
attgcatctc ccgccgtgca cagggtgtca cgttgcaaga cctgcctgaa accgaactgc 8220
ccgctgttct gcagccggtc gcggaggcta tggatgcgat cgctgcggcc gatcttagcc 8280
agacgagcgg gttcggccca ttcggaccgc aaggaatcgg tcaatacact acatggcgtg 8340
atttcatatg cgcgattgct gatccccatg tgtatcactg gcaaactgtg atggacgaca 8400
ccgtcagtgc gtccgtcgcg caggctctcg atgagctgat gctttgggcc gaggactgcc 8460
ccgaagtccg gcacctcgtg cacgcggatt tcggctccaa caatgtcctg acggacaatg 8520
gccgcataac agcggtcatt gactggagcg aggcgatgtt cggggattcc caatacgagg 8580
tcgccaacat cttcttctgg aggccgtggt tggcttgtat ggagcagcag acgcgctact 8640
tcgagcggag gcatccggag cttgcaggat cgccgcggct ccgggcgtat atgctccgca 8700
ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat gcagcttggg 8760
cgcagggtcg atgcgacgca atcgtccgat ccggagccgg gactgtcggg cgtacacaaa 8820
tcgcccgcag aagcgcggcc gtctggaccg atggctgtgt agaagtactc gccgatagtg 8880
gaaaccgacg ccccagcact cgtccgaggg caaaggaata gtgaggtaca gcttggatcg 8940
atccggctgc taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat 9000
aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag 9060
gaactatatc cggatgatcg ggcgcgccgg tac 9093
<210> 64
<211> 9093
<212> DNA
<213> 人工序列
<220>
<223> QC879
<400> 64
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg caaccacagc tgctgtcaag ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggacaa aaagtactca atagggctcg acatagggac 2100
taactccgtt ggatgggccg tcatcaccga cgagtacaag gtgccctcca agaagttcaa 2160
ggtgttggga aacaccgaca ggcacagcat aaagaagaat ttgatcggtg ccctcctctt 2220
cgactccgga gagaccgctg aggctaccag gctcaagagg accgctagaa ggcgctacac 2280
cagaaggaag aacagaatct gctacctgca ggagatcttc tccaacgaga tggccaaggt 2340
ggacgactcc ttcttccacc gccttgagga atcattcctg gtggaggagg ataaaaagca 2400
cgagagacac ccaatcttcg ggaacatcgt cgacgaggtg gcctaccatg aaaagtaccc 2460
taccatctac cacctgagga agaagctggt cgactctacc gacaaggctg acttgcgctt 2520
gatttacctg gctctcgctc acatgataaa gttccgcgga cacttcctca ttgagggaga 2580
cctgaaccca gacaactccg acgtggacaa gctcttcatc cagctcgttc agacctacaa 2640
ccagcttttc gaggagaacc caatcaacgc cagtggagtt gacgccaagg ctatcctctc 2700
tgctcgtctg tcaaagtcca ggaggcttga gaacttgatt gcccagctgc ctggcgaaaa 2760
gaagaacgga ctgttcggaa acttgatcgc tctctccctg ggattgactc ccaacttcaa 2820
gtccaacttc gacctcgccg aggacgctaa gttgcagttg tctaaagaca cctacgacga 2880
tgacctcgac aacttgctgg cccagatagg cgaccaatac gccgatctct tcctcgccgc 2940
taagaacttg tccgacgcaa tcctgctgtc cgacatcctg agagtcaaca ctgagattac 3000
caaagctcct ctgtctgctt ccatgattaa gcgctacgac gagcaccacc aagatctgac 3060
cctgctcaag gccctggtga gacagcagct gcccgagaag tacaaggaga tctttttcga 3120
ccagtccaag aacggctacg ccggatacat tgacggaggc gcctcccagg aagagttcta 3180
caagttcatc aagcccatcc ttgagaagat ggacggtacc gaggagctgt tggtgaagtt 3240
gaacagagag gacctgttga ggaagcagag aaccttcgac aacggaagca tccctcacca 3300
aatccacctg ggagagctcc acgccatctt gaggaggcag gaggatttct atcccttcct 3360
gaaggacaac cgcgagaaga ttgagaagat cttgaccttc agaattcctt actacgtcgg 3420
gccactcgcc agaggaaact ctaggttcgc ctggatgacc cgcaaatctg aagagaccat 3480
tactccctgg aacttcgagg aagtcgtgga caagggcgct tccgctcagt ctttcatcga 3540
gaggatgacc aacttcgata aaaatctgcc caacgagaag gtgctgccca agcactccct 3600
gttgtacgag tatttcacag tgtacaacga gctcaccaag gtgaagtacg tcacagaggg 3660
aatgaggaag cctgccttct tgtccggaga gcagaagaag gccatcgtcg acctgctctt 3720
caagaccaac aggaaggtga ctgtcaagca gctgaaggag gactacttca agaagatcga 3780
gtgcttcgac tccgtcgaga tctctggtgt cgaggacagg ttcaacgcct cccttgggac 3840
ttaccacgat ctgctcaaga ttattaaaga caaggacttc ctggacaacg aggagaacga 3900
ggacatcctt gaggacatcg tgctcaccct gaccttgttc gaagacaggg aaatgatcga 3960
agagaggctc aagacctacg cccacctctt cgacgacaag gtgatgaaac agctgaagag 4020
acgcagatat accggctggg gaaggctctc ccgcaaattg atcaacggga tcagggacaa 4080
gcagtcaggg aagactatac tcgacttcct gaagtccgac ggattcgcca acaggaactt 4140
catgcagctc attcacgacg actccttgac cttcaaggag gacatccaga aggctcaggt 4200
gtctggacag ggtgactcct tgcatgagca cattgctaac ttggccggct ctcccgctat 4260
taagaagggc attttgcaga ccgtgaaggt cgttgacgag ctcgtgaagg tgatgggacg 4320
ccacaagcca gagaacatcg ttattgagat ggctcgcgag aaccaaacta cccagaaagg 4380
gcagaagaat tcccgcgaga ggatgaagcg cattgaggag ggcataaaag agcttggctc 4440
tcagatcctc aaggagcacc ccgtcgagaa cactcagctg cagaacgaga agctgtacct 4500
gtactacctc caaaacggaa gggacatgta cgtggaccag gagctggaca tcaacaggtt 4560
gtccgactac gacgtcgacc acatcgtgcc tcagtccttc ctgaaggatg actccatcga 4620
caataaagtg ctgacacgct ccgataaaaa tagaggcaag tccgacaacg tcccctccga 4680
ggaggtcgtg aagaagatga aaaactactg gagacagctc ttgaacgcca agctcatcac 4740
ccagcgtaag ttcgacaacc tgactaaggc tgagagagga ggattgtccg agctcgataa 4800
ggccggattc atcaagagac agctcgtcga aacccgccaa attaccaagc acgtggccca 4860
aattctggat tcccgcatga acaccaagta cgatgaaaat gacaagctga tccgcgaggt 4920
caaggtgatc accttgaagt ccaagctggt ctccgacttc cgcaaggact tccagttcta 4980
caaggtgagg gagatcaaca actaccacca cgcacacgac gcctacctca acgctgtcgt 5040
tggaaccgcc ctcatcaaaa aatatcctaa gctggagtct gagttcgtct acggcgacta 5100
caaggtgtac gacgtgagga agatgatcgc taagtctgag caggagatcg gcaaggccac 5160
cgccaagtac ttcttctact ccaacatcat gaacttcttc aagaccgaga tcactctcgc 5220
caacggtgag atcaggaagc gcccactgat cgagaccaac ggtgagactg gagagatcgt 5280
gtgggacaaa gggagggatt tcgctactgt gaggaaggtg ctctccatgc ctcaggtgaa 5340
catcgtcaag aagaccgaag ttcagaccgg aggattctcc aaggagtcca tcctccccaa 5400
gagaaactcc gacaagctga tcgctagaaa gaaagactgg gaccctaaga agtacggagg 5460
cttcgattct cctaccgtgg cctactctgt gctggtcgtg gccaaggtgg agaagggcaa 5520
gtccaagaag ctgaaatccg tcaaggagct cctcgggatt accatcatgg agaggagttc 5580
cttcgagaag aaccctatcg acttcctgga ggccaaggga tataaagagg tgaagaagga 5640
cctcatcatc aagctgccca agtactccct cttcgagttg gagaacggaa ggaagaggat 5700
gctggcttct gccggagagt tgcagaaggg aaatgagctc gcccttccct ccaagtacgt 5760
gaacttcctg tacctcgcct ctcactatga aaagttgaag ggctctcctg aggacaacga 5820
gcagaagcag ctcttcgtgg agcagcacaa gcactacctg gacgaaatta tcgagcagat 5880
ctctgagttc tccaagcgcg tgatattggc cgacgccaac ctcgacaagg tgctgtccgc 5940
ctacaacaag cacagggata agcccattcg cgagcaggct gaaaacatta tccacctgtt 6000
taccctcaca aacttgggag cccctgctgc cttcaagtac ttcgacacca ccattgacag 6060
gaagagatac acctccacca aggaggtgct cgacgcaaca ctcatccacc aatccatcac 6120
cggcctctat gaaacaagga ttgacttgtc ccagctggga ggcgactcta gagccgatcc 6180
caagaagaag agaaaggtgt aggttaacct agacttgtcc atcttctgga ttggccaact 6240
taattaatgt atgaaataaa aggatgcaca catagtgaca tgctaatcac tataatgtgg 6300
gcatcaaagt tgtgtgttat gtgtaattac tagttatctg aataaaagag aaagagatca 6360
tccatatttc ttatcctaaa tgaatgtcac gtgtctttat aattctttga tgaaccagat 6420
gcatttcatt aaccaaatcc atatacatat aaatattaat catatataat taatatcaat 6480
tgggttagca aaacaaatct agtctaggtg tgttttgcga attcgatatc aagcttatcg 6540
ataccgtcga gggggggccc ggtaccggcg cgccgttcta tagtgtcacc taaatcgtat 6600
gtgtatgata cataaggtta tgtattaatt gtagccgcgt tctaacgaca atatgtccat 6660
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc 6720
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 6780
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 6840
cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgaccaaaat 6900
cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 6960
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 7020
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 7080
cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 7140
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 7200
tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 7260
taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 7320
gacctacacc gaactgagat acctacagcg tgagcattga gaaagcgcca cgcttcccga 7380
agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 7440
ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 7500
acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 7560
caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 7620
tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 7680
tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc 7740
aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcaggt tgatcagatc 7800
tcgatcccgc gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa 7860
ataattttgt ttaactttaa gaaggagata tacccatgga aaagcctgaa ctcaccgcga 7920
cgtctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg atgcagctct 7980
cggagggcga agaatctcgt gctttcagct tcgatgtagg agggcgtgga tatgtcctgc 8040
gggtaaatag ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg cactttgcat 8100
cggccgcgct cccgattccg gaagtgcttg acattgggga attcagcgag agcctgacct 8160
attgcatctc ccgccgtgca cagggtgtca cgttgcaaga cctgcctgaa accgaactgc 8220
ccgctgttct gcagccggtc gcggaggcta tggatgcgat cgctgcggcc gatcttagcc 8280
agacgagcgg gttcggccca ttcggaccgc aaggaatcgg tcaatacact acatggcgtg 8340
atttcatatg cgcgattgct gatccccatg tgtatcactg gcaaactgtg atggacgaca 8400
ccgtcagtgc gtccgtcgcg caggctctcg atgagctgat gctttgggcc gaggactgcc 8460
ccgaagtccg gcacctcgtg cacgcggatt tcggctccaa caatgtcctg acggacaatg 8520
gccgcataac agcggtcatt gactggagcg aggcgatgtt cggggattcc caatacgagg 8580
tcgccaacat cttcttctgg aggccgtggt tggcttgtat ggagcagcag acgcgctact 8640
tcgagcggag gcatccggag cttgcaggat cgccgcggct ccgggcgtat atgctccgca 8700
ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat gcagcttggg 8760
cgcagggtcg atgcgacgca atcgtccgat ccggagccgg gactgtcggg cgtacacaaa 8820
tcgcccgcag aagcgcggcc gtctggaccg atggctgtgt agaagtactc gccgatagtg 8880
gaaaccgacg ccccagcact cgtccgaggg caaaggaata gtgaggtaca gcttggatcg 8940
atccggctgc taacaaagcc cgaaaggaag ctgagttggc tgctgccacc gctgagcaat 9000
aactagcata accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaaggag 9060
gaactatatc cggatgatcg ggcgcgccgg tac 9093
<210> 65
<211> 1357
<212> DNA
<213> 人工序列
<220>
<223> RTW1013A
<400> 65
ctagaagata aaccctcccc caaaacacaa attagaatga catttcaagt tccatgtatg 60
tcactttcat tctattattt ttacaacttt tagttactta acagatgtct tgttcagcat 120
aaattataat ttattctgtt tttttttagg gaacaactgt tgtagacaac ttgttgtata 180
gtgaggatat tcattacatg cttggtgcat taaggaccct tggactgcgt gtggaagatg 240
acaaaacaac caaacaagca attgttgaag gctgtggggg attgtttccc actagtaagg 300
aatctaaaga tgaaatcaat ttattccttg gaaatgctgg tattgcaatg agatctttga 360
cagcagctgt tgttgctgca ggtggaaatg caaggtctgt tttttttttt tttgttcagc 420
ataatctttg aattgttcct cgtataacta atcacaacag agtacgtgtt cttcttcctg 480
ttataatcta aaaatctcat ccagattagt catcctttct tcttaaaagg aacctttaat 540
tatcaatgta tttatttaat atttaaatta gcttgtcaaa gtctagcata tacatatttt 600
gattatattc tgagaaatgc acctgagggt gttcctcatg atctacttca acctctgtta 660
ttattagatt ttctatcatg attactggtt tgagtctcta agtagaccat cttgatgttc 720
aaaatatttc agctacgtac ttgatggggt gccccgaatg agagagaggc caattgggga 780
tttggttgct ggtcttaagc aacttggtgc agatgttgat tgctttcttg gcacaaactg 840
tccacctgtt cgtgtaaatg ggaagggagg acttcctggc ggaaaggtat ggtttggatt 900
tcatttagaa taaggtggag taactttcct ggatcaaaat tctaatttaa gaagcctccc 960
tgttttcctc tctttagaat aagactaagg gtaggtttag gagttgggtt ttggagagaa 1020
atggaaggga gagcaatttt tttcttcttc taataaatat tctttaattt gatacatttt 1080
ttaagtaaaa gaatataaag atagattagc ataacttaat gttttaatct tttatttatt 1140
tttataaata ttatatacct gtctatttaa aaatcaaata tttgtcctcc attccctttc 1200
ccttcaaaac ctcagttcca aatataccgt agttgaatta tattttggaa ggcctattgg 1260
ttggagactt ttccttttca gagattatcc ctcaccttta ttatagcctt tctattttta 1320
aacttcatat agacgccatt cttggggcgg ccgcgat 1357
<210> 66
<211> 1357
<212> DNA
<213> 人工序列
<220>
<223> RTW1012A
<400> 66
ctagaagata aaccctcccc caaaacacaa attagaatga catttcaagt tccatgtatg 60
tcactttcat tctattattt ttacaacttt tagttactta acagatgtct tgttcagcat 120
aaattataat ttattctgtt tttttttagg gaacaactgt tgtagacaac ttgttgtata 180
gtgaggatat tcattacatg cttggtgcat taaggaccct tggactgcgt gtggaagatg 240
acaaaacaac caaacaagca attgttgaag gctgtggggg attgtttccc actagtaagg 300
aatctaaaga tgaaatcaat ttattccttg gaaatgctgg tattgcaatg agatctttga 360
cagcagctgt ggttgctgca ggtggaaatg caaggtctgt tttttttttt tttgttcagc 420
ataatctttg aattgttcct cgtataacta atcacaacag agtacgtgtt cttcttcctg 480
ttataatcta aaaatctcat ccagattagt catcctttct tcttaaaagg aacctttaat 540
tatcaatgta tttatttaat atttaaatta gcttgtcaaa gtctagcata tacatatttt 600
gattatattc tgagaaatgc acctgagggt gttcctcatg atctacttca acctctgtta 660
ttattagatt ttctatcatg attactggtt tgagtctcta agtagaccat cttgatgttc 720
aaaatatttc agctacgtac ttgatggggt gccccgaatg agagagaggc caattgggga 780
tttggttgct ggtcttaagc aacttggtgc agatgttgat tgctttcttg gcacaaactg 840
tccacctgtt cgtgtaaatg ggaagggagg acttcctggc ggaaaggtat ggtttggatt 900
tcatttagaa taaggtggag taactttcct ggatcaaaat tctaatttaa gaagcctccc 960
tgttttcctc tctttagaat aagactaagg gtaggtttag gagttgggtt ttggagagaa 1020
atggaaggga gagcaatttt tttcttcttc taataaatat tctttaattt gatacatttt 1080
ttaagtaaaa gaatataaag atagattagc ataacttaat gttttaatct tttatttatt 1140
tttataaata ttatatacct gtctatttaa aaatcaaata tttgtcctcc attccctttc 1200
ccttcaaaac ctcagttcca aatataccgt agttgaatta tattttggaa ggcctattgg 1260
ttggagactt ttccttttca gagattatcc ctcaccttta ttatagcctt tctattttta 1320
aacttcatat agacgccatt cttggggcgg ccgcgat 1357
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-F1
<400> 67
ccactagtaa ggaatctaaa gatgaaatca 30
<210> 68
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-R2
<400> 68
cctgcagcaa ccacagctgc tgtc 24
<210> 69
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 探针,大豆1-T1(FAM-MGB)
<400> 69
ctgcaatgcg tcctt 15
<210> 70
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物,cas9-F
<400> 70
ccttcttcca ccgccttga 19
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物,cas9-R
<400> 71
tgggtgtctc tcgtgctttt t 21
<210> 72
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 探针,Cas9-T(FAM-MGB
<400> 72
aatcattcct ggtggagga 19
<210> 73
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物,pINII-99F
<400> 73
tgatgcccac attatagtga ttagc 25
<210> 74
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物,pINII-13R
<400> 74
catcttctgg attggccaac tt 22
<210> 75
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 探针,pINII-69T(FAM-MGB)
<400> 75
actatgtgtg catcctt 17
<210> 76
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物,SIP-130F
<400> 76
ttcaagttgg gctttttcag aag 23
<210> 77
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物,SIP-198R
<400> 77
tctccttggt gctctcatca ca 22
<210> 78
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 探针,SIP-170T(VIC-MGB)
<400> 78
ctgcagcaga accaa 15
<210> 79
<211> 24
<212> DNA
<213> 人工的
<220>
<223> WOL569,正向引物
<400> 79
ggacccatta ggtgagagcg tggg 24
<210> 80
<211> 19
<212> DNA
<213> 人工的
<220>
<223> WOL876,反向引物;
<400> 80
cagctgctgt caaagatct 19
<210> 81
<211> 29
<212> DNA
<213> 人工的
<220>
<223> WOL570,反向引物
<400> 81
tctaataata acagaggttg aagtagatc 29
<210> 82
<211> 4104
<212> DNA
<213> 人工序列
<220>
<223> 大豆密码子优化的Cas9
<400> 82
atggacaaaa agtactcaat agggctcgac atagggacta actccgttgg atgggccgtc 60
atcaccgacg agtacaaggt gccctccaag aagttcaagg tgttgggaaa caccgacagg 120
cacagcataa agaagaattt gatcggtgcc ctcctcttcg actccggaga gaccgctgag 180
gctaccaggc tcaagaggac cgctagaagg cgctacacca gaaggaagaa cagaatctgc 240
tacctgcagg agatcttctc caacgagatg gccaaggtgg acgactcctt cttccaccgc 300
cttgaggaat cattcctggt ggaggaggat aaaaagcacg agagacaccc aatcttcggg 360
aacatcgtcg acgaggtggc ctaccatgaa aagtacccta ccatctacca cctgaggaag 420
aagctggtcg actctaccga caaggctgac ttgcgcttga tttacctggc tctcgctcac 480
atgataaagt tccgcggaca cttcctcatt gagggagacc tgaacccaga caactccgac 540
gtggacaagc tcttcatcca gctcgttcag acctacaacc agcttttcga ggagaaccca 600
atcaacgcca gtggagttga cgccaaggct atcctctctg ctcgtctgtc aaagtccagg 660
aggcttgaga acttgattgc ccagctgcct ggcgaaaaga agaacggact gttcggaaac 720
ttgatcgctc tctccctggg attgactccc aacttcaagt ccaacttcga cctcgccgag 780
gacgctaagt tgcagttgtc taaagacacc tacgacgatg acctcgacaa cttgctggcc 840
cagataggcg accaatacgc cgatctcttc ctcgccgcta agaacttgtc cgacgcaatc 900
ctgctgtccg acatcctgag agtcaacact gagattacca aagctcctct gtctgcttcc 960
atgattaagc gctacgacga gcaccaccaa gatctgaccc tgctcaaggc cctggtgaga 1020
cagcagctgc ccgagaagta caaggagatc tttttcgacc agtccaagaa cggctacgcc 1080
ggatacattg acggaggcgc ctcccaggaa gagttctaca agttcatcaa gcccatcctt 1140
gagaagatgg acggtaccga ggagctgttg gtgaagttga acagagagga cctgttgagg 1200
aagcagagaa ccttcgacaa cggaagcatc cctcaccaaa tccacctggg agagctccac 1260
gccatcttga ggaggcagga ggatttctat cccttcctga aggacaaccg cgagaagatt 1320
gagaagatct tgaccttcag aattccttac tacgtcgggc cactcgccag aggaaactct 1380
aggttcgcct ggatgacccg caaatctgaa gagaccatta ctccctggaa cttcgaggaa 1440
gtcgtggaca agggcgcttc cgctcagtct ttcatcgaga ggatgaccaa cttcgataaa 1500
aatctgccca acgagaaggt gctgcccaag cactccctgt tgtacgagta tttcacagtg 1560
tacaacgagc tcaccaaggt gaagtacgtc acagagggaa tgaggaagcc tgccttcttg 1620
tccggagagc agaagaaggc catcgtcgac ctgctcttca agaccaacag gaaggtgact 1680
gtcaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgactc cgtcgagatc 1740
tctggtgtcg aggacaggtt caacgcctcc cttgggactt accacgatct gctcaagatt 1800
attaaagaca aggacttcct ggacaacgag gagaacgagg acatccttga ggacatcgtg 1860
ctcaccctga ccttgttcga agacagggaa atgatcgaag agaggctcaa gacctacgcc 1920
cacctcttcg acgacaaggt gatgaaacag ctgaagagac gcagatatac cggctgggga 1980
aggctctccc gcaaattgat caacgggatc agggacaagc agtcagggaa gactatactc 2040
gacttcctga agtccgacgg attcgccaac aggaacttca tgcagctcat tcacgacgac 2100
tccttgacct tcaaggagga catccagaag gctcaggtgt ctggacaggg tgactccttg 2160
catgagcaca ttgctaactt ggccggctct cccgctatta agaagggcat tttgcagacc 2220
gtgaaggtcg ttgacgagct cgtgaaggtg atgggacgcc acaagccaga gaacatcgtt 2280
attgagatgg ctcgcgagaa ccaaactacc cagaaagggc agaagaattc ccgcgagagg 2340
atgaagcgca ttgaggaggg cataaaagag cttggctctc agatcctcaa ggagcacccc 2400
gtcgagaaca ctcagctgca gaacgagaag ctgtacctgt actacctcca aaacggaagg 2460
gacatgtacg tggaccagga gctggacatc aacaggttgt ccgactacga cgtcgaccac 2520
atcgtgcctc agtccttcct gaaggatgac tccatcgaca ataaagtgct gacacgctcc 2580
gataaaaata gaggcaagtc cgacaacgtc ccctccgagg aggtcgtgaa gaagatgaaa 2640
aactactgga gacagctctt gaacgccaag ctcatcaccc agcgtaagtt cgacaacctg 2700
actaaggctg agagaggagg attgtccgag ctcgataagg ccggattcat caagagacag 2760
ctcgtcgaaa cccgccaaat taccaagcac gtggcccaaa ttctggattc ccgcatgaac 2820
accaagtacg atgaaaatga caagctgatc cgcgaggtca aggtgatcac cttgaagtcc 2880
aagctggtct ccgacttccg caaggacttc cagttctaca aggtgaggga gatcaacaac 2940
taccaccacg cacacgacgc ctacctcaac gctgtcgttg gaaccgccct catcaaaaaa 3000
tatcctaagc tggagtctga gttcgtctac ggcgactaca aggtgtacga cgtgaggaag 3060
atgatcgcta agtctgagca ggagatcggc aaggccaccg ccaagtactt cttctactcc 3120
aacatcatga acttcttcaa gaccgagatc actctcgcca acggtgagat caggaagcgc 3180
ccactgatcg agaccaacgg tgagactgga gagatcgtgt gggacaaagg gagggatttc 3240
gctactgtga ggaaggtgct ctccatgcct caggtgaaca tcgtcaagaa gaccgaagtt 3300
cagaccggag gattctccaa ggagtccatc ctccccaaga gaaactccga caagctgatc 3360
gctagaaaga aagactggga ccctaagaag tacggaggct tcgattctcc taccgtggcc 3420
tactctgtgc tggtcgtggc caaggtggag aagggcaagt ccaagaagct gaaatccgtc 3480
aaggagctcc tcgggattac catcatggag aggagttcct tcgagaagaa ccctatcgac 3540
ttcctggagg ccaagggata taaagaggtg aagaaggacc tcatcatcaa gctgcccaag 3600
tactccctct tcgagttgga gaacggaagg aagaggatgc tggcttctgc cggagagttg 3660
cagaagggaa atgagctcgc ccttccctcc aagtacgtga acttcctgta cctcgcctct 3720
cactatgaaa agttgaaggg ctctcctgag gacaacgagc agaagcagct cttcgtggag 3780
cagcacaagc actacctgga cgaaattatc gagcagatct ctgagttctc caagcgcgtg 3840
atattggccg acgccaacct cgacaaggtg ctgtccgcct acaacaagca cagggataag 3900
cccattcgcg agcaggctga aaacattatc cacctgttta ccctcacaaa cttgggagcc 3960
cctgctgcct tcaagtactt cgacaccacc attgacagga agagatacac ctccaccaag 4020
gaggtgctcg acgcaacact catccaccaa tccatcaccg gcctctatga aacaaggatt 4080
gacttgtccc agctgggagg cgac 4104
<210> 83
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR4,Cas9靶序列
<400> 83
gtttgtttgt tgttgggtgt ggg 23
<210> 84
<211> 22
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR5,Cas9靶序列
<400> 84
tgttgttggg tgtgggaata gg 22
<210> 85
<211> 9174
<212> DNA
<213> 人工序列
<220>
<223> RTW1199
<400> 85
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg tttgtttgtt gttgggtgtg ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggcacc gaagaagaag cgcaaggtga tggacaaaaa 2100
gtactcaata gggctcgaca tagggactaa ctccgttgga tgggccgtca tcaccgacga 2160
gtacaaggtg ccctccaaga agttcaaggt gttgggaaac accgacaggc acagcataaa 2220
gaagaatttg atcggtgccc tcctcttcga ctccggagag accgctgagg ctaccaggct 2280
caagaggacc gctagaaggc gctacaccag aaggaagaac agaatctgct acctgcagga 2340
gatcttctcc aacgagatgg ccaaggtgga cgactccttc ttccaccgcc ttgaggaatc 2400
attcctggtg gaggaggata aaaagcacga gagacaccca atcttcggga acatcgtcga 2460
cgaggtggcc taccatgaaa agtaccctac catctaccac ctgaggaaga agctggtcga 2520
ctctaccgac aaggctgact tgcgcttgat ttacctggct ctcgctcaca tgataaagtt 2580
ccgcggacac ttcctcattg agggagacct gaacccagac aactccgacg tggacaagct 2640
cttcatccag ctcgttcaga cctacaacca gcttttcgag gagaacccaa tcaacgccag 2700
tggagttgac gccaaggcta tcctctctgc tcgtctgtca aagtccagga ggcttgagaa 2760
cttgattgcc cagctgcctg gcgaaaagaa gaacggactg ttcggaaact tgatcgctct 2820
ctccctggga ttgactccca acttcaagtc caacttcgac ctcgccgagg acgctaagtt 2880
gcagttgtct aaagacacct acgacgatga cctcgacaac ttgctggccc agataggcga 2940
ccaatacgcc gatctcttcc tcgccgctaa gaacttgtcc gacgcaatcc tgctgtccga 3000
catcctgaga gtcaacactg agattaccaa agctcctctg tctgcttcca tgattaagcg 3060
ctacgacgag caccaccaag atctgaccct gctcaaggcc ctggtgagac agcagctgcc 3120
cgagaagtac aaggagatct ttttcgacca gtccaagaac ggctacgccg gatacattga 3180
cggaggcgcc tcccaggaag agttctacaa gttcatcaag cccatccttg agaagatgga 3240
cggtaccgag gagctgttgg tgaagttgaa cagagaggac ctgttgagga agcagagaac 3300
cttcgacaac ggaagcatcc ctcaccaaat ccacctggga gagctccacg ccatcttgag 3360
gaggcaggag gatttctatc ccttcctgaa ggacaaccgc gagaagattg agaagatctt 3420
gaccttcaga attccttact acgtcgggcc actcgccaga ggaaactcta ggttcgcctg 3480
gatgacccgc aaatctgaag agaccattac tccctggaac ttcgaggaag tcgtggacaa 3540
gggcgcttcc gctcagtctt tcatcgagag gatgaccaac ttcgataaaa atctgcccaa 3600
cgagaaggtg ctgcccaagc actccctgtt gtacgagtat ttcacagtgt acaacgagct 3660
caccaaggtg aagtacgtca cagagggaat gaggaagcct gccttcttgt ccggagagca 3720
gaagaaggcc atcgtcgacc tgctcttcaa gaccaacagg aaggtgactg tcaagcagct 3780
gaaggaggac tacttcaaga agatcgagtg cttcgactcc gtcgagatct ctggtgtcga 3840
ggacaggttc aacgcctccc ttgggactta ccacgatctg ctcaagatta ttaaagacaa 3900
ggacttcctg gacaacgagg agaacgagga catccttgag gacatcgtgc tcaccctgac 3960
cttgttcgaa gacagggaaa tgatcgaaga gaggctcaag acctacgccc acctcttcga 4020
cgacaaggtg atgaaacagc tgaagagacg cagatatacc ggctggggaa ggctctcccg 4080
caaattgatc aacgggatca gggacaagca gtcagggaag actatactcg acttcctgaa 4140
gtccgacgga ttcgccaaca ggaacttcat gcagctcatt cacgacgact ccttgacctt 4200
caaggaggac atccagaagg ctcaggtgtc tggacagggt gactccttgc atgagcacat 4260
tgctaacttg gccggctctc ccgctattaa gaagggcatt ttgcagaccg tgaaggtcgt 4320
tgacgagctc gtgaaggtga tgggacgcca caagccagag aacatcgtta ttgagatggc 4380
tcgcgagaac caaactaccc agaaagggca gaagaattcc cgcgagagga tgaagcgcat 4440
tgaggagggc ataaaagagc ttggctctca gatcctcaag gagcaccccg tcgagaacac 4500
tcagctgcag aacgagaagc tgtacctgta ctacctccaa aacggaaggg acatgtacgt 4560
ggaccaggag ctggacatca acaggttgtc cgactacgac gtcgaccaca tcgtgcctca 4620
gtccttcctg aaggatgact ccatcgacaa taaagtgctg acacgctccg ataaaaatag 4680
aggcaagtcc gacaacgtcc cctccgagga ggtcgtgaag aagatgaaaa actactggag 4740
acagctcttg aacgccaagc tcatcaccca gcgtaagttc gacaacctga ctaaggctga 4800
gagaggagga ttgtccgagc tcgataaggc cggattcatc aagagacagc tcgtcgaaac 4860
ccgccaaatt accaagcacg tggcccaaat tctggattcc cgcatgaaca ccaagtacga 4920
tgaaaatgac aagctgatcc gcgaggtcaa ggtgatcacc ttgaagtcca agctggtctc 4980
cgacttccgc aaggacttcc agttctacaa ggtgagggag atcaacaact accaccacgc 5040
acacgacgcc tacctcaacg ctgtcgttgg aaccgccctc atcaaaaaat atcctaagct 5100
ggagtctgag ttcgtctacg gcgactacaa ggtgtacgac gtgaggaaga tgatcgctaa 5160
gtctgagcag gagatcggca aggccaccgc caagtacttc ttctactcca acatcatgaa 5220
cttcttcaag accgagatca ctctcgccaa cggtgagatc aggaagcgcc cactgatcga 5280
gaccaacggt gagactggag agatcgtgtg ggacaaaggg agggatttcg ctactgtgag 5340
gaaggtgctc tccatgcctc aggtgaacat cgtcaagaag accgaagttc agaccggagg 5400
attctccaag gagtccatcc tccccaagag aaactccgac aagctgatcg ctagaaagaa 5460
agactgggac cctaagaagt acggaggctt cgattctcct accgtggcct actctgtgct 5520
ggtcgtggcc aaggtggaga agggcaagtc caagaagctg aaatccgtca aggagctcct 5580
cgggattacc atcatggaga ggagttcctt cgagaagaac cctatcgact tcctggaggc 5640
caagggatat aaagaggtga agaaggacct catcatcaag ctgcccaagt actccctctt 5700
cgagttggag aacggaagga agaggatgct ggcttctgcc ggagagttgc agaagggaaa 5760
tgagctcgcc cttccctcca agtacgtgaa cttcctgtac ctcgcctctc actatgaaaa 5820
gttgaagggc tctcctgagg acaacgagca gaagcagctc ttcgtggagc agcacaagca 5880
ctacctggac gaaattatcg agcagatctc tgagttctcc aagcgcgtga tattggccga 5940
cgccaacctc gacaaggtgc tgtccgccta caacaagcac agggataagc ccattcgcga 6000
gcaggctgaa aacattatcc acctgtttac cctcacaaac ttgggagccc ctgctgcctt 6060
caagtacttc gacaccacca ttgacaggaa gagatacacc tccaccaagg aggtgctcga 6120
cgcaacactc atccaccaat ccatcaccgg cctctatgaa acaaggattg acttgtccca 6180
gctgggaggc gactctagag ccgatcccaa gaagaagaga aaggtgaaga gaccacggga 6240
ccgccacgat ggcgagctgg gaggccgcaa gcgggcaagg taggttaacc tagacttgtc 6300
catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac 6360
atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct 6420
gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta 6480
taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa 6540
tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg 6600
aattcgatat caagcttatc gataccgtcg agggggggcc cggtaccggc gcgccgttct 6660
atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 6720
ttctaacgac aatatgtcca tatggtgcac tctcagtaca atctgctctg atgccgcata 6780
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6840
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6900
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6960
ggttaatgtc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7020
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7080
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7140
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 7200
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 7260
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 7320
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 7380
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 7440
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 7500
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 7560
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 7620
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 7680
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 7740
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 7800
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 7860
ttaatgcagg ttgatcagat ctcgatcccg cgaaattaat acgactcact atagggagac 7920
cacaacggtt tccctctaga aataattttg tttaacttta agaaggagat atacccatgg 7980
aaaagcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 8040
tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 8100
gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 8160
atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 8220
aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 8280
acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggct atggatgcga 8340
tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 8400
gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 8460
ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 8520
tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 8580
acaatgtcct gacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 8640
tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 8700
tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 8760
tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 8820
atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 8880
ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 8940
tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 9000
agtgaggtac agcttggatc gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 9060
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 9120
ggggtttttt gctgaaagga ggaactatat ccggatgctc gggcgcgccg gtac 9174
<210> 86
<211> 9174
<212> DNA
<213> 人工序列
<220>
<223> RTW1200
<400> 86
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg tgttgttggg tgtgggaatg ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggcacc gaagaagaag cgcaaggtga tggacaaaaa 2100
gtactcaata gggctcgaca tagggactaa ctccgttgga tgggccgtca tcaccgacga 2160
gtacaaggtg ccctccaaga agttcaaggt gttgggaaac accgacaggc acagcataaa 2220
gaagaatttg atcggtgccc tcctcttcga ctccggagag accgctgagg ctaccaggct 2280
caagaggacc gctagaaggc gctacaccag aaggaagaac agaatctgct acctgcagga 2340
gatcttctcc aacgagatgg ccaaggtgga cgactccttc ttccaccgcc ttgaggaatc 2400
attcctggtg gaggaggata aaaagcacga gagacaccca atcttcggga acatcgtcga 2460
cgaggtggcc taccatgaaa agtaccctac catctaccac ctgaggaaga agctggtcga 2520
ctctaccgac aaggctgact tgcgcttgat ttacctggct ctcgctcaca tgataaagtt 2580
ccgcggacac ttcctcattg agggagacct gaacccagac aactccgacg tggacaagct 2640
cttcatccag ctcgttcaga cctacaacca gcttttcgag gagaacccaa tcaacgccag 2700
tggagttgac gccaaggcta tcctctctgc tcgtctgtca aagtccagga ggcttgagaa 2760
cttgattgcc cagctgcctg gcgaaaagaa gaacggactg ttcggaaact tgatcgctct 2820
ctccctggga ttgactccca acttcaagtc caacttcgac ctcgccgagg acgctaagtt 2880
gcagttgtct aaagacacct acgacgatga cctcgacaac ttgctggccc agataggcga 2940
ccaatacgcc gatctcttcc tcgccgctaa gaacttgtcc gacgcaatcc tgctgtccga 3000
catcctgaga gtcaacactg agattaccaa agctcctctg tctgcttcca tgattaagcg 3060
ctacgacgag caccaccaag atctgaccct gctcaaggcc ctggtgagac agcagctgcc 3120
cgagaagtac aaggagatct ttttcgacca gtccaagaac ggctacgccg gatacattga 3180
cggaggcgcc tcccaggaag agttctacaa gttcatcaag cccatccttg agaagatgga 3240
cggtaccgag gagctgttgg tgaagttgaa cagagaggac ctgttgagga agcagagaac 3300
cttcgacaac ggaagcatcc ctcaccaaat ccacctggga gagctccacg ccatcttgag 3360
gaggcaggag gatttctatc ccttcctgaa ggacaaccgc gagaagattg agaagatctt 3420
gaccttcaga attccttact acgtcgggcc actcgccaga ggaaactcta ggttcgcctg 3480
gatgacccgc aaatctgaag agaccattac tccctggaac ttcgaggaag tcgtggacaa 3540
gggcgcttcc gctcagtctt tcatcgagag gatgaccaac ttcgataaaa atctgcccaa 3600
cgagaaggtg ctgcccaagc actccctgtt gtacgagtat ttcacagtgt acaacgagct 3660
caccaaggtg aagtacgtca cagagggaat gaggaagcct gccttcttgt ccggagagca 3720
gaagaaggcc atcgtcgacc tgctcttcaa gaccaacagg aaggtgactg tcaagcagct 3780
gaaggaggac tacttcaaga agatcgagtg cttcgactcc gtcgagatct ctggtgtcga 3840
ggacaggttc aacgcctccc ttgggactta ccacgatctg ctcaagatta ttaaagacaa 3900
ggacttcctg gacaacgagg agaacgagga catccttgag gacatcgtgc tcaccctgac 3960
cttgttcgaa gacagggaaa tgatcgaaga gaggctcaag acctacgccc acctcttcga 4020
cgacaaggtg atgaaacagc tgaagagacg cagatatacc ggctggggaa ggctctcccg 4080
caaattgatc aacgggatca gggacaagca gtcagggaag actatactcg acttcctgaa 4140
gtccgacgga ttcgccaaca ggaacttcat gcagctcatt cacgacgact ccttgacctt 4200
caaggaggac atccagaagg ctcaggtgtc tggacagggt gactccttgc atgagcacat 4260
tgctaacttg gccggctctc ccgctattaa gaagggcatt ttgcagaccg tgaaggtcgt 4320
tgacgagctc gtgaaggtga tgggacgcca caagccagag aacatcgtta ttgagatggc 4380
tcgcgagaac caaactaccc agaaagggca gaagaattcc cgcgagagga tgaagcgcat 4440
tgaggagggc ataaaagagc ttggctctca gatcctcaag gagcaccccg tcgagaacac 4500
tcagctgcag aacgagaagc tgtacctgta ctacctccaa aacggaaggg acatgtacgt 4560
ggaccaggag ctggacatca acaggttgtc cgactacgac gtcgaccaca tcgtgcctca 4620
gtccttcctg aaggatgact ccatcgacaa taaagtgctg acacgctccg ataaaaatag 4680
aggcaagtcc gacaacgtcc cctccgagga ggtcgtgaag aagatgaaaa actactggag 4740
acagctcttg aacgccaagc tcatcaccca gcgtaagttc gacaacctga ctaaggctga 4800
gagaggagga ttgtccgagc tcgataaggc cggattcatc aagagacagc tcgtcgaaac 4860
ccgccaaatt accaagcacg tggcccaaat tctggattcc cgcatgaaca ccaagtacga 4920
tgaaaatgac aagctgatcc gcgaggtcaa ggtgatcacc ttgaagtcca agctggtctc 4980
cgacttccgc aaggacttcc agttctacaa ggtgagggag atcaacaact accaccacgc 5040
acacgacgcc tacctcaacg ctgtcgttgg aaccgccctc atcaaaaaat atcctaagct 5100
ggagtctgag ttcgtctacg gcgactacaa ggtgtacgac gtgaggaaga tgatcgctaa 5160
gtctgagcag gagatcggca aggccaccgc caagtacttc ttctactcca acatcatgaa 5220
cttcttcaag accgagatca ctctcgccaa cggtgagatc aggaagcgcc cactgatcga 5280
gaccaacggt gagactggag agatcgtgtg ggacaaaggg agggatttcg ctactgtgag 5340
gaaggtgctc tccatgcctc aggtgaacat cgtcaagaag accgaagttc agaccggagg 5400
attctccaag gagtccatcc tccccaagag aaactccgac aagctgatcg ctagaaagaa 5460
agactgggac cctaagaagt acggaggctt cgattctcct accgtggcct actctgtgct 5520
ggtcgtggcc aaggtggaga agggcaagtc caagaagctg aaatccgtca aggagctcct 5580
cgggattacc atcatggaga ggagttcctt cgagaagaac cctatcgact tcctggaggc 5640
caagggatat aaagaggtga agaaggacct catcatcaag ctgcccaagt actccctctt 5700
cgagttggag aacggaagga agaggatgct ggcttctgcc ggagagttgc agaagggaaa 5760
tgagctcgcc cttccctcca agtacgtgaa cttcctgtac ctcgcctctc actatgaaaa 5820
gttgaagggc tctcctgagg acaacgagca gaagcagctc ttcgtggagc agcacaagca 5880
ctacctggac gaaattatcg agcagatctc tgagttctcc aagcgcgtga tattggccga 5940
cgccaacctc gacaaggtgc tgtccgccta caacaagcac agggataagc ccattcgcga 6000
gcaggctgaa aacattatcc acctgtttac cctcacaaac ttgggagccc ctgctgcctt 6060
caagtacttc gacaccacca ttgacaggaa gagatacacc tccaccaagg aggtgctcga 6120
cgcaacactc atccaccaat ccatcaccgg cctctatgaa acaaggattg acttgtccca 6180
gctgggaggc gactctagag ccgatcccaa gaagaagaga aaggtgaaga gaccacggga 6240
ccgccacgat ggcgagctgg gaggccgcaa gcgggcaagg taggttaacc tagacttgtc 6300
catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac 6360
atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct 6420
gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta 6480
taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa 6540
tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg 6600
aattcgatat caagcttatc gataccgtcg agggggggcc cggtaccggc gcgccgttct 6660
atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 6720
ttctaacgac aatatgtcca tatggtgcac tctcagtaca atctgctctg atgccgcata 6780
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6840
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6900
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6960
ggttaatgtc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7020
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7080
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7140
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 7200
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 7260
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 7320
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 7380
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 7440
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 7500
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 7560
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 7620
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 7680
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 7740
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 7800
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 7860
ttaatgcagg ttgatcagat ctcgatcccg cgaaattaat acgactcact atagggagac 7920
cacaacggtt tccctctaga aataattttg tttaacttta agaaggagat atacccatgg 7980
aaaagcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 8040
tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 8100
gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 8160
atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 8220
aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 8280
acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggct atggatgcga 8340
tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 8400
gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 8460
ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 8520
tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 8580
acaatgtcct gacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 8640
tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 8700
tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 8760
tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 8820
atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 8880
ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 8940
tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 9000
agtgaggtac agcttggatc gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 9060
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 9120
ggggtttttt gctgaaagga ggaactatat ccggatgctc gggcgcgccg gtac 9174
<210> 87
<211> 3175
<212> DNA
<213> 人工序列
<220>
<223> RTW1190A
<400> 87
cgaattctac aggtcactaa taccatctaa gtagttggtt catagtgact gcatatgtaa 60
aaattatcct tattttaagg aaattaaaaa ttatcatata tatataagtt ttaaattaat 120
tatcttatat atgtaccaaa aagttttaaa gcaattatta taaaaattaa taaatttatc 180
atataaaata atttataatt aaattttaaa ttatcaattc attaaattaa attatttaaa 240
atttttgaat gataatataa taattttatc ctctactaag tcccaacgtt tcctatttta 300
ttccactttt agcaataaat tttgtcataa acacttataa caaaaaaagt aagtaaaaaa 360
taaaaaaaag tttttcaata aagtataaac taatttgtat aaacttttag aaaaaataaa 420
gttatacatt gataatataa attttttaca taattatccg atcaactcat tatatatgat 480
aaatttattg attttttaaa ataattatct taaaataatt taaacaatga tttgcaatta 540
gatgataata taaaattatt ttacacacta catgtattaa actcaaactt ttatatatta 600
gtttttctaa aaactaattt ttaactcaaa aaaaatgtta cttataattt tcttatcttc 660
tttttttata agtatttttt aagaaattta ttgaaacatg accatgcttg ggtcaataat 720
actactctct tagacaccaa acaacccttc ccaaactata atctaatcca aaagccatca 780
ttcattttcc ttggtaggta aagttccaag accttcacca actttttcac tcaattgttt 840
tggtgtaagc aattcgacat gtgttagtgt tagttggcaa ccaaaaatcc ctttatgtga 900
ctcaatccaa caaccactca caccaccaac ccccataacc atttctcaca atacccttca 960
tttacacatt atcatcacca aaaataaata aaaaaaacct ctcatttcag agagagagag 1020
agagacttca cagaccaaag tgcagagaac aacaaagttc acaactttaa ggaaaattga 1080
aatggcccaa gtgagcagag tgcacaatct tgctcaaagc actcaaattt ttggccattc 1140
ttccaactcc aacaaactca aatcggtgaa ttcggtttca ttgaggccac gcctttgggg 1200
ggcctcaaaa tctcgcatcc cgatgcataa aaatggaagc tttatgggaa attttaatgt 1260
ggggaaggga aattccggcg tgtttaaggt ttctgcatcg gtcgccgccg cagagaagcc 1320
gtcaacgtcg ccggagatcg tgttggaacc catcaaagac ttctcgggta ccatcacatt 1380
gccagggtcc aagtctctgt ccaatcgaat tttgcttctt gctgctctct ctgaggttcg 1440
tagatttctt ccgttttttt ttcttcttct ttattgtttg ttctacatca gcatgatgtt 1500
gatttgattg tgttttctat cgtttcatcg attataaatt ttcataatca gaagattcag 1560
cttttattaa tgcaagaacg tccttaattg atgattttat aaccgtaaat taggtctaat 1620
tagagttttt ttcataaaga ttttcagatc cgtttacaac aagccttaat tgttgattct 1680
gtagtcgtag attaaggttt ttttcatgaa ctacttcaga tccgttaaac aacagcctta 1740
tttgttgata cttcagtcgt ttttcaagaa attgttcaga tccgttgata aaagccttat 1800
tcgttgattc tgtatggtat ttcaagagat attgctcagg tcctttagca actaccttat 1860
ttgttgattc tgtggccata gattaggatt ttttttcacg aaattgcttc ttgaaattac 1920
gtgatggatt ttgattctga tttatcttgt gattgttgac tctacaggga acaactgttg 1980
tagacaactt gttgtatagt gaggatattc attacatgct tggtgcatta aggacccttg 2040
gactgcgtgt ggaagatgac aaaacaacca aacaagcaat tgttgaaggc tgtgggggat 2100
tgtttcccac tagtaaggaa tctaaagatg aaatcaattt attccttgga aatgctggta 2160
ttgcaatgag atctttgaca gcagctgttg ttgctgcagg tggaaatgca aggtctgttt 2220
tttttttttt tgttcagcat aatctttgaa ttgttcctcg tataactaat cacaacagag 2280
tacgtgttct tcttcctgtt ataatctaaa aatctcatcc agattagtca tcctttcttc 2340
ttaaaaggaa cctttaatta tcaatgtatt tatttaatat ttaaattagc ttgtcaaagt 2400
ctagcatata catattttga ttatattctg agaaatgcac ctgagggtgt tcctcatgat 2460
ctacttcaac ctctgttatt attagatttt ctatcatgat tactggtttg agtctctaag 2520
tagaccatct tgatgttcaa aatatttcag ctacgtactt gatggggtgc cccgaatgag 2580
agagaggcca attggggatt tggttgctgg tcttaagcaa cttggtgcag atgttgattg 2640
ctttcttggc acaaactgtc cacctgttcg tgtaaatggg aagggaggac ttcctggcgg 2700
aaaggtatgg tttggatttc atttagaata aggtggagta actttcctgg atcaaaattc 2760
taatttaaga agcctccctg ttttcctctc tttagaataa gactaagggt aggtttagga 2820
gttgggtttt ggagagaaat ggaagggaga gcaatttttt tcttcttcta ataaatattc 2880
tttaatttga tacatttttt aagtaaaaga atataaagat agattagcat aacttaatgt 2940
tttaatcttt tatttatttt tataaatatt atatacctgt ctatttaaaa atcaaatatt 3000
tgtcctccat tccctttccc ttcaaaacct cagttccaaa tataccgtag ttgaattata 3060
ttttggaagg cctattggtt ggagactttt ccttttcaga gattatccct cacctttatt 3120
atagcctttc tatttttaaa cttcatatag acgccattct tggggcggcc gcgat 3175
<210> 88
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-F3
<400> 88
gtttgtttgt tgttgggtgt ggg 23
<210> 89
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-R3
<400> 89
gacatgatgc ttcattttca cagaa 25
<210> 90
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 探针,大豆1-T2(FAM-MGB)
<400> 90
tgtgtagagt ggattttg 18
<210> 91
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-F2
<400> 91
tgttgttggg tgtgggaata gg 22
<210> 92
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> WOL1001,正向引物
<400> 92
aggtttaatt ttatataatg ttagcataca g 31
<210> 93
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> WOL1002,反向引物
<400> 93
atcaacatca tgctgatgta gaacaaac 28
<210> 94
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> WOL1003,正向引物
<400> 94
attctgattt atcttgtgat tgttgactc 29
<210> 95
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> WOL1004,反向引物
<400> 95
atttactttg gagagaataa ggagggg 27
<210> 96
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR6,Cas9靶序列
<400> 96
gaaacgttgg gacttagtag agg 23
<210> 97
<211> 23
<212> DNA
<213> 大豆(Glycine max)
<220>
<221> 尚未归类的特性
<222> (1)..(23)
<223> 大豆EPSPS-CR7,Cas9靶序列
<400> 97
ggaataaaat aggaaacgtt ggg 23
<210> 98
<211> 9174
<212> DNA
<213> 人工序列
<220>
<223> RTW1201
<400> 98
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg aaacgttggg acttagtagg ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggcacc gaagaagaag cgcaaggtga tggacaaaaa 2100
gtactcaata gggctcgaca tagggactaa ctccgttgga tgggccgtca tcaccgacga 2160
gtacaaggtg ccctccaaga agttcaaggt gttgggaaac accgacaggc acagcataaa 2220
gaagaatttg atcggtgccc tcctcttcga ctccggagag accgctgagg ctaccaggct 2280
caagaggacc gctagaaggc gctacaccag aaggaagaac agaatctgct acctgcagga 2340
gatcttctcc aacgagatgg ccaaggtgga cgactccttc ttccaccgcc ttgaggaatc 2400
attcctggtg gaggaggata aaaagcacga gagacaccca atcttcggga acatcgtcga 2460
cgaggtggcc taccatgaaa agtaccctac catctaccac ctgaggaaga agctggtcga 2520
ctctaccgac aaggctgact tgcgcttgat ttacctggct ctcgctcaca tgataaagtt 2580
ccgcggacac ttcctcattg agggagacct gaacccagac aactccgacg tggacaagct 2640
cttcatccag ctcgttcaga cctacaacca gcttttcgag gagaacccaa tcaacgccag 2700
tggagttgac gccaaggcta tcctctctgc tcgtctgtca aagtccagga ggcttgagaa 2760
cttgattgcc cagctgcctg gcgaaaagaa gaacggactg ttcggaaact tgatcgctct 2820
ctccctggga ttgactccca acttcaagtc caacttcgac ctcgccgagg acgctaagtt 2880
gcagttgtct aaagacacct acgacgatga cctcgacaac ttgctggccc agataggcga 2940
ccaatacgcc gatctcttcc tcgccgctaa gaacttgtcc gacgcaatcc tgctgtccga 3000
catcctgaga gtcaacactg agattaccaa agctcctctg tctgcttcca tgattaagcg 3060
ctacgacgag caccaccaag atctgaccct gctcaaggcc ctggtgagac agcagctgcc 3120
cgagaagtac aaggagatct ttttcgacca gtccaagaac ggctacgccg gatacattga 3180
cggaggcgcc tcccaggaag agttctacaa gttcatcaag cccatccttg agaagatgga 3240
cggtaccgag gagctgttgg tgaagttgaa cagagaggac ctgttgagga agcagagaac 3300
cttcgacaac ggaagcatcc ctcaccaaat ccacctggga gagctccacg ccatcttgag 3360
gaggcaggag gatttctatc ccttcctgaa ggacaaccgc gagaagattg agaagatctt 3420
gaccttcaga attccttact acgtcgggcc actcgccaga ggaaactcta ggttcgcctg 3480
gatgacccgc aaatctgaag agaccattac tccctggaac ttcgaggaag tcgtggacaa 3540
gggcgcttcc gctcagtctt tcatcgagag gatgaccaac ttcgataaaa atctgcccaa 3600
cgagaaggtg ctgcccaagc actccctgtt gtacgagtat ttcacagtgt acaacgagct 3660
caccaaggtg aagtacgtca cagagggaat gaggaagcct gccttcttgt ccggagagca 3720
gaagaaggcc atcgtcgacc tgctcttcaa gaccaacagg aaggtgactg tcaagcagct 3780
gaaggaggac tacttcaaga agatcgagtg cttcgactcc gtcgagatct ctggtgtcga 3840
ggacaggttc aacgcctccc ttgggactta ccacgatctg ctcaagatta ttaaagacaa 3900
ggacttcctg gacaacgagg agaacgagga catccttgag gacatcgtgc tcaccctgac 3960
cttgttcgaa gacagggaaa tgatcgaaga gaggctcaag acctacgccc acctcttcga 4020
cgacaaggtg atgaaacagc tgaagagacg cagatatacc ggctggggaa ggctctcccg 4080
caaattgatc aacgggatca gggacaagca gtcagggaag actatactcg acttcctgaa 4140
gtccgacgga ttcgccaaca ggaacttcat gcagctcatt cacgacgact ccttgacctt 4200
caaggaggac atccagaagg ctcaggtgtc tggacagggt gactccttgc atgagcacat 4260
tgctaacttg gccggctctc ccgctattaa gaagggcatt ttgcagaccg tgaaggtcgt 4320
tgacgagctc gtgaaggtga tgggacgcca caagccagag aacatcgtta ttgagatggc 4380
tcgcgagaac caaactaccc agaaagggca gaagaattcc cgcgagagga tgaagcgcat 4440
tgaggagggc ataaaagagc ttggctctca gatcctcaag gagcaccccg tcgagaacac 4500
tcagctgcag aacgagaagc tgtacctgta ctacctccaa aacggaaggg acatgtacgt 4560
ggaccaggag ctggacatca acaggttgtc cgactacgac gtcgaccaca tcgtgcctca 4620
gtccttcctg aaggatgact ccatcgacaa taaagtgctg acacgctccg ataaaaatag 4680
aggcaagtcc gacaacgtcc cctccgagga ggtcgtgaag aagatgaaaa actactggag 4740
acagctcttg aacgccaagc tcatcaccca gcgtaagttc gacaacctga ctaaggctga 4800
gagaggagga ttgtccgagc tcgataaggc cggattcatc aagagacagc tcgtcgaaac 4860
ccgccaaatt accaagcacg tggcccaaat tctggattcc cgcatgaaca ccaagtacga 4920
tgaaaatgac aagctgatcc gcgaggtcaa ggtgatcacc ttgaagtcca agctggtctc 4980
cgacttccgc aaggacttcc agttctacaa ggtgagggag atcaacaact accaccacgc 5040
acacgacgcc tacctcaacg ctgtcgttgg aaccgccctc atcaaaaaat atcctaagct 5100
ggagtctgag ttcgtctacg gcgactacaa ggtgtacgac gtgaggaaga tgatcgctaa 5160
gtctgagcag gagatcggca aggccaccgc caagtacttc ttctactcca acatcatgaa 5220
cttcttcaag accgagatca ctctcgccaa cggtgagatc aggaagcgcc cactgatcga 5280
gaccaacggt gagactggag agatcgtgtg ggacaaaggg agggatttcg ctactgtgag 5340
gaaggtgctc tccatgcctc aggtgaacat cgtcaagaag accgaagttc agaccggagg 5400
attctccaag gagtccatcc tccccaagag aaactccgac aagctgatcg ctagaaagaa 5460
agactgggac cctaagaagt acggaggctt cgattctcct accgtggcct actctgtgct 5520
ggtcgtggcc aaggtggaga agggcaagtc caagaagctg aaatccgtca aggagctcct 5580
cgggattacc atcatggaga ggagttcctt cgagaagaac cctatcgact tcctggaggc 5640
caagggatat aaagaggtga agaaggacct catcatcaag ctgcccaagt actccctctt 5700
cgagttggag aacggaagga agaggatgct ggcttctgcc ggagagttgc agaagggaaa 5760
tgagctcgcc cttccctcca agtacgtgaa cttcctgtac ctcgcctctc actatgaaaa 5820
gttgaagggc tctcctgagg acaacgagca gaagcagctc ttcgtggagc agcacaagca 5880
ctacctggac gaaattatcg agcagatctc tgagttctcc aagcgcgtga tattggccga 5940
cgccaacctc gacaaggtgc tgtccgccta caacaagcac agggataagc ccattcgcga 6000
gcaggctgaa aacattatcc acctgtttac cctcacaaac ttgggagccc ctgctgcctt 6060
caagtacttc gacaccacca ttgacaggaa gagatacacc tccaccaagg aggtgctcga 6120
cgcaacactc atccaccaat ccatcaccgg cctctatgaa acaaggattg acttgtccca 6180
gctgggaggc gactctagag ccgatcccaa gaagaagaga aaggtgaaga gaccacggga 6240
ccgccacgat ggcgagctgg gaggccgcaa gcgggcaagg taggttaacc tagacttgtc 6300
catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac 6360
atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct 6420
gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta 6480
taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa 6540
tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg 6600
aattcgatat caagcttatc gataccgtcg agggggggcc cggtaccggc gcgccgttct 6660
atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 6720
ttctaacgac aatatgtcca tatggtgcac tctcagtaca atctgctctg atgccgcata 6780
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6840
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6900
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6960
ggttaatgtc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7020
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7080
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7140
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 7200
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 7260
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 7320
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 7380
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 7440
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 7500
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 7560
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 7620
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 7680
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 7740
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 7800
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 7860
ttaatgcagg ttgatcagat ctcgatcccg cgaaattaat acgactcact atagggagac 7920
cacaacggtt tccctctaga aataattttg tttaacttta agaaggagat atacccatgg 7980
aaaagcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 8040
tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 8100
gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 8160
atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 8220
aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 8280
acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggct atggatgcga 8340
tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 8400
gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 8460
ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 8520
tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 8580
acaatgtcct gacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 8640
tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 8700
tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 8760
tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 8820
atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 8880
ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 8940
tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 9000
agtgaggtac agcttggatc gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 9060
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 9120
ggggtttttt gctgaaagga ggaactatat ccggatgctc gggcgcgccg gtac 9174
<210> 99
<211> 9174
<212> DNA
<213> 人工序列
<220>
<223> RTW1202
<400> 99
ccgggtgtga tttagtataa agtgaagtaa tggtcaaaag aaaaagtgta aaacgaagta 60
cctagtaata agtaatattg aacaaaataa atggtaaagt gtcagatata taaaataggc 120
tttaataaaa ggaagaaaaa aaacaaacaa aaaataggtt gcaatggggc agagcagagt 180
catcatgaag ctagaaaggc taccgataga taaactatag ttaattaaat acattaaaaa 240
atacttggat ctttctctta ccctgtttat attgagacct gaaacttgag agagatacac 300
taatcttgcc ttgttgtttc attccctaac ttacaggact cagcgcatgt catgtggtct 360
cgttccccat ttaagtccca caccgtctaa acttattaaa ttattaatgt ttataactag 420
atgcacaaca acaaagcttg gaataaaata ggaaacgttg ttttagagct agaaatagca 480
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 540
tttgcggccg caattggatc gggtttactt attttgtggg tatctatact tttattagat 600
ttttaatcag gctcctgatt tctttttatt tcgattgaat tcctgaactt gtattattca 660
gtagatcgaa taaattataa aaagataaaa tcataaaata atattttatc ctatcaatca 720
tattaaagca atgaatatgt aaaattaatc ttatctttat tttaaaaaat catataggtt 780
tagtattttt ttaaaaataa agataggatt agttttacta ttcactgctt attactttta 840
aaaaaatcat aaaggtttag tattttttta aaataaatat aggaatagtt ttactattca 900
ctgctttaat agaaaaatag tttaaaattt aagatagttt taatcccagc atttgccacg 960
tttgaacgtg agccgaaacg atgtcgttac attatcttaa cctagctgaa acgatgtcgt 1020
cataatatcg ccaaatgcca actggactac gtcgaaccca caaatcccac aaagcgcgtg 1080
aaatcaaatc gctcaaacca caaaaaagaa caacgcgttt gttacacgct caatcccacg 1140
cgagtagagc acagtaacct tcaaataagc gaatggggca taatcagaaa tccgaaataa 1200
acctaggggc attatcggaa atgaaaagta gctcactcaa tataaaaatc taggaaccct 1260
agttttcgtt atcactctgt gctccctcgc tctatttctc agtctctgtg tttgcggctg 1320
aggattccga acgagtgacc ttcttcgttt ctcgcaaagg taacagcctc tgctcttgtc 1380
tcttcgattc gatctatgcc tgtctcttat ttacgatgat gtttcttcgg ttatgttttt 1440
ttatttatgc tttatgctgt tgatgttcgg ttgtttgttt cgctttgttt ttgtggttca 1500
gttttttagg attcttttgg tttttgaatc gattaatcgg aagagatttt cgagttattt 1560
ggtgtgttgg aggtgaatct tttttttgag gtcatagatc tgttgtattt gtgttataaa 1620
catgcgactt tgtatgattt tttacgaggt tatgatgttc tggttgtttt attatgaatc 1680
tgttgagaca gaaccatgat ttttgttgat gttcgtttac actattaaag gtttgtttta 1740
acaggattaa aagtttttta agcatgttga aggagtcttg tagatatgta accgtcgata 1800
gtttttttgt gggtttgttc acatgttatc aagcttaatc ttttactatg tatgcgacca 1860
tatctggatc cagcaaaggc gattttttaa ttccttgtga aacttttgta atatgaagtt 1920
gaaattttgt tattggtaaa ctataaatgt gtgaagttgg agtatacctt taccttctta 1980
tttggctttg tgatagttta atttatatgt attttgagtt ctgacttgta tttctttgaa 2040
ttgattctag tttaagtaat ccatggcacc gaagaagaag cgcaaggtga tggacaaaaa 2100
gtactcaata gggctcgaca tagggactaa ctccgttgga tgggccgtca tcaccgacga 2160
gtacaaggtg ccctccaaga agttcaaggt gttgggaaac accgacaggc acagcataaa 2220
gaagaatttg atcggtgccc tcctcttcga ctccggagag accgctgagg ctaccaggct 2280
caagaggacc gctagaaggc gctacaccag aaggaagaac agaatctgct acctgcagga 2340
gatcttctcc aacgagatgg ccaaggtgga cgactccttc ttccaccgcc ttgaggaatc 2400
attcctggtg gaggaggata aaaagcacga gagacaccca atcttcggga acatcgtcga 2460
cgaggtggcc taccatgaaa agtaccctac catctaccac ctgaggaaga agctggtcga 2520
ctctaccgac aaggctgact tgcgcttgat ttacctggct ctcgctcaca tgataaagtt 2580
ccgcggacac ttcctcattg agggagacct gaacccagac aactccgacg tggacaagct 2640
cttcatccag ctcgttcaga cctacaacca gcttttcgag gagaacccaa tcaacgccag 2700
tggagttgac gccaaggcta tcctctctgc tcgtctgtca aagtccagga ggcttgagaa 2760
cttgattgcc cagctgcctg gcgaaaagaa gaacggactg ttcggaaact tgatcgctct 2820
ctccctggga ttgactccca acttcaagtc caacttcgac ctcgccgagg acgctaagtt 2880
gcagttgtct aaagacacct acgacgatga cctcgacaac ttgctggccc agataggcga 2940
ccaatacgcc gatctcttcc tcgccgctaa gaacttgtcc gacgcaatcc tgctgtccga 3000
catcctgaga gtcaacactg agattaccaa agctcctctg tctgcttcca tgattaagcg 3060
ctacgacgag caccaccaag atctgaccct gctcaaggcc ctggtgagac agcagctgcc 3120
cgagaagtac aaggagatct ttttcgacca gtccaagaac ggctacgccg gatacattga 3180
cggaggcgcc tcccaggaag agttctacaa gttcatcaag cccatccttg agaagatgga 3240
cggtaccgag gagctgttgg tgaagttgaa cagagaggac ctgttgagga agcagagaac 3300
cttcgacaac ggaagcatcc ctcaccaaat ccacctggga gagctccacg ccatcttgag 3360
gaggcaggag gatttctatc ccttcctgaa ggacaaccgc gagaagattg agaagatctt 3420
gaccttcaga attccttact acgtcgggcc actcgccaga ggaaactcta ggttcgcctg 3480
gatgacccgc aaatctgaag agaccattac tccctggaac ttcgaggaag tcgtggacaa 3540
gggcgcttcc gctcagtctt tcatcgagag gatgaccaac ttcgataaaa atctgcccaa 3600
cgagaaggtg ctgcccaagc actccctgtt gtacgagtat ttcacagtgt acaacgagct 3660
caccaaggtg aagtacgtca cagagggaat gaggaagcct gccttcttgt ccggagagca 3720
gaagaaggcc atcgtcgacc tgctcttcaa gaccaacagg aaggtgactg tcaagcagct 3780
gaaggaggac tacttcaaga agatcgagtg cttcgactcc gtcgagatct ctggtgtcga 3840
ggacaggttc aacgcctccc ttgggactta ccacgatctg ctcaagatta ttaaagacaa 3900
ggacttcctg gacaacgagg agaacgagga catccttgag gacatcgtgc tcaccctgac 3960
cttgttcgaa gacagggaaa tgatcgaaga gaggctcaag acctacgccc acctcttcga 4020
cgacaaggtg atgaaacagc tgaagagacg cagatatacc ggctggggaa ggctctcccg 4080
caaattgatc aacgggatca gggacaagca gtcagggaag actatactcg acttcctgaa 4140
gtccgacgga ttcgccaaca ggaacttcat gcagctcatt cacgacgact ccttgacctt 4200
caaggaggac atccagaagg ctcaggtgtc tggacagggt gactccttgc atgagcacat 4260
tgctaacttg gccggctctc ccgctattaa gaagggcatt ttgcagaccg tgaaggtcgt 4320
tgacgagctc gtgaaggtga tgggacgcca caagccagag aacatcgtta ttgagatggc 4380
tcgcgagaac caaactaccc agaaagggca gaagaattcc cgcgagagga tgaagcgcat 4440
tgaggagggc ataaaagagc ttggctctca gatcctcaag gagcaccccg tcgagaacac 4500
tcagctgcag aacgagaagc tgtacctgta ctacctccaa aacggaaggg acatgtacgt 4560
ggaccaggag ctggacatca acaggttgtc cgactacgac gtcgaccaca tcgtgcctca 4620
gtccttcctg aaggatgact ccatcgacaa taaagtgctg acacgctccg ataaaaatag 4680
aggcaagtcc gacaacgtcc cctccgagga ggtcgtgaag aagatgaaaa actactggag 4740
acagctcttg aacgccaagc tcatcaccca gcgtaagttc gacaacctga ctaaggctga 4800
gagaggagga ttgtccgagc tcgataaggc cggattcatc aagagacagc tcgtcgaaac 4860
ccgccaaatt accaagcacg tggcccaaat tctggattcc cgcatgaaca ccaagtacga 4920
tgaaaatgac aagctgatcc gcgaggtcaa ggtgatcacc ttgaagtcca agctggtctc 4980
cgacttccgc aaggacttcc agttctacaa ggtgagggag atcaacaact accaccacgc 5040
acacgacgcc tacctcaacg ctgtcgttgg aaccgccctc atcaaaaaat atcctaagct 5100
ggagtctgag ttcgtctacg gcgactacaa ggtgtacgac gtgaggaaga tgatcgctaa 5160
gtctgagcag gagatcggca aggccaccgc caagtacttc ttctactcca acatcatgaa 5220
cttcttcaag accgagatca ctctcgccaa cggtgagatc aggaagcgcc cactgatcga 5280
gaccaacggt gagactggag agatcgtgtg ggacaaaggg agggatttcg ctactgtgag 5340
gaaggtgctc tccatgcctc aggtgaacat cgtcaagaag accgaagttc agaccggagg 5400
attctccaag gagtccatcc tccccaagag aaactccgac aagctgatcg ctagaaagaa 5460
agactgggac cctaagaagt acggaggctt cgattctcct accgtggcct actctgtgct 5520
ggtcgtggcc aaggtggaga agggcaagtc caagaagctg aaatccgtca aggagctcct 5580
cgggattacc atcatggaga ggagttcctt cgagaagaac cctatcgact tcctggaggc 5640
caagggatat aaagaggtga agaaggacct catcatcaag ctgcccaagt actccctctt 5700
cgagttggag aacggaagga agaggatgct ggcttctgcc ggagagttgc agaagggaaa 5760
tgagctcgcc cttccctcca agtacgtgaa cttcctgtac ctcgcctctc actatgaaaa 5820
gttgaagggc tctcctgagg acaacgagca gaagcagctc ttcgtggagc agcacaagca 5880
ctacctggac gaaattatcg agcagatctc tgagttctcc aagcgcgtga tattggccga 5940
cgccaacctc gacaaggtgc tgtccgccta caacaagcac agggataagc ccattcgcga 6000
gcaggctgaa aacattatcc acctgtttac cctcacaaac ttgggagccc ctgctgcctt 6060
caagtacttc gacaccacca ttgacaggaa gagatacacc tccaccaagg aggtgctcga 6120
cgcaacactc atccaccaat ccatcaccgg cctctatgaa acaaggattg acttgtccca 6180
gctgggaggc gactctagag ccgatcccaa gaagaagaga aaggtgaaga gaccacggga 6240
ccgccacgat ggcgagctgg gaggccgcaa gcgggcaagg taggttaacc tagacttgtc 6300
catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac 6360
atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct 6420
gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta 6480
taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa 6540
tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg 6600
aattcgatat caagcttatc gataccgtcg agggggggcc cggtaccggc gcgccgttct 6660
atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 6720
ttctaacgac aatatgtcca tatggtgcac tctcagtaca atctgctctg atgccgcata 6780
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 6840
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 6900
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 6960
ggttaatgtc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 7020
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 7080
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 7140
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 7200
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 7260
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 7320
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 7380
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 7440
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 7500
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 7560
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 7620
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 7680
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 7740
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 7800
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 7860
ttaatgcagg ttgatcagat ctcgatcccg cgaaattaat acgactcact atagggagac 7920
cacaacggtt tccctctaga aataattttg tttaacttta agaaggagat atacccatgg 7980
aaaagcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 8040
tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 8100
gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 8160
atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 8220
aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 8280
acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggct atggatgcga 8340
tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 8400
gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 8460
ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 8520
tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 8580
acaatgtcct gacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 8640
tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 8700
tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 8760
tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 8820
atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 8880
ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 8940
tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 9000
agtgaggtac agcttggatc gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 9060
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 9120
ggggtttttt gctgaaagga ggaactatat ccggatgctc gggcgcgccg gtac 9174
<210> 100
<211> 6113
<212> DNA
<213> 人工序列
<220>
<223> RTW1192A
<400> 100
caagtagttc tagtcttaat acaaatgtca aatggcacaa gtgagatttt gaatttctga 60
tgttgtaaaa atctcaggac atgaatacta ttgggaagca attattcata cttcaccaat 120
ccaaactgac ccaaaattct caaatcacat gaaagcaaaa atgcatataa cacgaagaat 180
aagaagaaga ggaactaacc tggggtttcg atgattaaag cgttgttgtt gatgatgaaa 240
acgatgatta tggagagaaa ttgttgttga atggtgaaat tgttatagaa agagaacgaa 300
gatagagaaa aagatatata gatttttcaa ggctcaaacc ctaaaatcac catgagagag 360
aacaaagatt gagaaaccta caaccactat gagagagaat gagcagaaca gaagcgtgag 420
atagagaacg agagttaagg tgcgagagga cacgaagaac aaaaggtgtg agagaaagaa 480
caaaggagcc tacggtgtga gatgagagaa tttgaaattc ttaccattta ggtggaattt 540
caattctaca attttattct attaaaatta ttttaaaaaa tgatgtcatt ttaaattctt 600
taaaatctca tatccaacaa ctgaattatg atagaggtat ttcaaattca cttaaaaaaa 660
ttatcttatt taaatacccc atccaaacat agcgaaatgt tcatgagaag gatcaagtgg 720
tttggaaaca tagtactaat ggtgtttata cagttcatgg aatccttgat agataattta 780
aaggttgctg gaaattggat gaaggtgtgg agattaaata ttcttccaaa aataaagcgt 840
tttatttgga gagtgttgtg tggttgtctc ccctgtaggc aaaagcttcg atgtaaagga 900
gttcaatgtc caataaccta tgctttctat ccctcgatta ttgaaaatga atgacacatt 960
ttatttggtt gaaatcaaga aataagcatg tggcaagcaa cgggtatttg acaattcata 1020
gaacaaaagg tgaatgcagc aaaagaatta atgaactcct tttcgatcta cttggatcac 1080
tacatggaga tattatcaac aaatttgatg ttactttatg gagcagttgg aattcttgga 1140
atgacaagat atgaaatgaa cataccaacc ctcctcttgt ttctgtttcg gtttctatgc 1200
agtattttgt tgaatggcaa agtgcaaggt aatatgctcc tcaacatcaa ttaacaaatg 1260
ttcatgacat ctcttaccag ctccaacttg gggacgtttg acaaacacca ccgtcaagtt 1320
tccttaaatg caacattaat gttgctcatt tcaaggagga gaatagtttt ggtgtcggca 1380
tgatactcca tcaaggaaga ttcgtcaaag ctcactcacg ttttcgacat gggtcgacat 1440
gggttacctg acccaaaggc tgaggcttag gcttgggttt gcttcaagta ttgatctggg 1500
cccagactat tggtttacat aatatcattt ttgaaaacct aacatctaaa actcaaggtt 1560
gtttagaggt gcgccattcc aaaataagat tatcctattt gtgcatgaat gcgaccaact 1620
atctcctgtt tcagcattat aaagtataaa caacaaactt ctttaatcaa gggactaaaa 1680
gatattggac atacaagcta aaagtgatag aatttgagaa aacaaatatt gacaacaata 1740
ttcaagagga cactaaaaca taattctcaa attttttttg tttatttaaa ataaagtggt 1800
tcattaggta gctccgggtg attgcggtta catcatgtac ggaaaaataa ttctaatcct 1860
tgatttaaat ttgaacttga ctatttattt attctttatt tcattttgta aatcatttta 1920
tgtatctcct ggcaagcaat tttatccacc ttgcaccaac accttcgggt tccataatca 1980
aaccacctta acttcacacc atgctgtaac tcacaccgcc cagcatctcc aatgtgaaag 2040
aagctaaaat ttaataaaca atcatacgaa gcagtgacaa aataccagat ggtattaatg 2100
cttcgataaa attaattgga aagtataaaa tggtagaaaa taataaatta taattaattt 2160
aagtaagata aaaaataatt aaaaactaaa atgttaaaat tttaaaaaaa ttattttaaa 2220
taatatttaa aaacattaaa aatcatttta aaaaatttat ttatagaaca attaaataaa 2280
tatttcagct aataaaaaac aaaagcttac ctagccttag aagacaactt gtccaacaat 2340
tagatgatac ccattgccct tacgttttct ttaacatcaa ttattgtttt tgtcaacaag 2400
ctatctttta gttttatttt attggtaaaa aatatgtcgc cttcaagttg catcatttaa 2460
cacatctcgt cattagaaaa ataaaactct tccctaaacg attagtagaa aaaatcattc 2520
gataataaat aagaaagaaa aattagaaaa aaataacttc attttaaaaa aatcattaag 2580
gctatatttt ttaaatgact aattttatat agactgtaac taaaagtata caatttatta 2640
tgctatgtat cttaaagaat tacttataaa aatctacgga agaatatctt acaaagtgaa 2700
aaacaaatga gaaagaattt agtgggatga ttatgatttt atttgaaaat tgaaaaaata 2760
attattaaag actttagtgg agtaagaaag ctttcctatt agtcttttct tatccataaa 2820
aaaaaaaaaa aaaatctagc gtgacagctt ttccatagat tttaataatg taaaatactg 2880
gtagcagccg accgttcagg taatggacac tgtggtccta acttgcaacg ggtgcgggcc 2940
caatttaata acgccgtggt aacggataaa gccaagcgtg aagcggtgaa ggtacatctc 3000
tgactccgtc aagattacga aaccgtcaac tacgaaggac tccccgaaat atcatctgtg 3060
tcataaacac caagtcacac catacatggg cacgcgtcac aatatgattg gagaacggtt 3120
ccaccgcata tgctataaaa tgcccccaca cccctcgacc ctaatcgcac ttcaattgca 3180
atcaaattag ttcattctct ttgcgcagtt ccctacctct cctttcaagg ttcgtagatt 3240
tcttccgttt ttttttcttc ttctttattg tttgttctac atcagcatga tgttgatttg 3300
attgtgtttt ctatcgtttc atcgattata aattttcata atcagaagat tcagctttta 3360
ttaatgcaag aacgtcctta attgatgatt ttataaccgt aaattaggtc taattagagt 3420
ttttttcata aagattttca gatccgttta caacaagcct taattgttga ttctgtagtc 3480
gtagattaag gtttttttca tgaactactt cagatccgtt aaacaacagc cttatttgtt 3540
gatacttcag tcgtttttca agaaattgtt cagatccgtt gataaaagcc ttattcgttg 3600
attctgtatg gtatttcaag agatattgct caggtccttt agcaactacc ttatttgttg 3660
attctgtggc catagattag gatttttttt cacgaaattg cttcttgaaa ttacgtgatg 3720
gattttgatt ctgatttatc ttgtgattgt tgactctaca gatggcccaa gtgagcagag 3780
tgcacaatct tgctcaaagc actcaaattt ttggccattc ttccaactcc aacaaactca 3840
aatcggtgaa ttcggtttca ttgaggccac gcctttgggg ggcctcaaaa tctcgcatcc 3900
cgatgcataa aaatggaagc tttatgggaa attttaatgt ggggaaggga aattccggcg 3960
tgtttaaggt ttctgcatcg gtcgccgccg cagagaagcc gtcaacgtcg ccggagatcg 4020
tgttggaacc catcaaagac ttctcgggta ccatcacatt gccagggtcc aagtctctgt 4080
ccaatcgaat tttgcttctt gctgctctct ctgaggtgaa gtttatttat ttatttattt 4140
gtttgtttgt tgttgggtgt gggaatagga gtttgatgtg tagagtggat tttgaatatt 4200
tgattttttt ttgtattatt ctgtgaaaat gaagcatcat gtcccatgaa agaaatggac 4260
acgaaattaa gtggcttatg atgtgaaatg aggatagaaa tgtgtgtagg gttttttaat 4320
gggtagcaat aagcatattc aatatctgga ttgatttgga cgtttctgta taaaggagta 4380
tgctagcaat gtgttaatgt atggcttgct aaaatactcc taaaaatcaa gtgggagtag 4440
tatacatatc tacagcaaat gtattaggtg aggcatttgg cttctctatt gtaaggaaca 4500
aataatatca gttaatgtga aaatcaatgg ttgatattcc aatacattca tgatgtgtta 4560
tttatatgta cctaatattg actgttgttt ttctccgcaa tgaccaagat tatttatttt 4620
atcctctaaa gtgactaatt gagttgctta ctttagagaa gttggaccca ttaggtgaga 4680
gcgtgggggg aactaatctt gaatatacaa tctgagtctt gattatccaa gtatggttgt 4740
atgaacaatg ttagctctag aagataaacc ctcccccaaa acacaaatta gaatgacatt 4800
tcaagttcca tgtatgtcac tttcattcta ttatttttac aacttttagt tacttaacag 4860
atgtcttgtt cagcataaat tataatttat tctgtttttt tttagggaac aactgttgta 4920
gacaacttgt tgtatagtga ggatattcat tacatgcttg gtgcattaag gacccttgga 4980
ctgcgtgtgg aagatgacaa aacaaccaaa caagcaattg ttgaaggctg tgggggattg 5040
tttcccacta gtaaggaatc taaagatgaa atcaatttat tccttggaaa tgctggtatt 5100
gcaatgagat ctttgacagc agctgttgtt gctgcaggtg gaaatgcaag gtctgttttt 5160
tttttttttg ttcagcataa tctttgaatt gttcctcgta taactaatca caacagagta 5220
cgtgttcttc ttcctgttat aatctaaaaa tctcatccag attagtcatc ctttcttctt 5280
aaaaggaacc tttaattatc aatgtattta tttaatattt aaattagctt gtcaaagtct 5340
agcatataca tattttgatt atattctgag aaatgcacct gagggtgttc ctcatgatct 5400
acttcaacct ctgttattat tagattttct atcatgatta ctggtttgag tctctaagta 5460
gaccatcttg atgttcaaaa tatttcagct acgtacttga tggggtgccc cgaatgagag 5520
agaggccaat tggggatttg gttgctggtc ttaagcaact tggtgcagat gttgattgct 5580
ttcttggcac aaactgtcca cctgttcgtg taaatgggaa gggaggactt cctggcggaa 5640
aggtatggtt tggatttcat ttagaataag gtggagtaac tttcctggat caaaattcta 5700
atttaagaag cctccctgtt ttcctctctt tagaataaga ctaagggtag gtttaggagt 5760
tgggttttgg agagaaatgg aagggagagc aatttttttc ttcttctaat aaatattctt 5820
taatttgata cattttttaa gtaaaagaat ataaagatag attagcataa cttaatgttt 5880
taatctttta tttattttta taaatattat atacctgtct atttaaaaat caaatatttg 5940
tcctccattc cctttccctt caaaacctca gttccaaata taccgtagtt gaattatatt 6000
ttggaaggcc tattggttgg agacttttcc ttttcagaga ttatccctca cctttattat 6060
agcctttcta tttttaaact tcatatagac gccattcttg gggcggccgc gat 6113
<210> 101
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-F4
<400> 101
tcaataatac tactctctta gacaccaaac aa 32
<210> 102
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物,大豆1-R4
<400> 102
caaggaaaat gaatgatggc ttt 23
<210> 103
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 探针,大豆1-T3(FAM-MGB)
<400> 103
ccttcccaaa ctataatc 18
<210> 104
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> WOL1005,正向引物
<400> 104
aaatgttatc agaggaacat gagctgc 27
<210> 105
<211> 6677
<212> DNA
<213> 人工序列
<220>
<223> 玉米优化的moCAS9内切核酸酶
<400> 105
ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 660
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 720
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 780
ggcaggcggc ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg 840
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc tctctacctt 1020
ctctagatcg gcgttccggt ccatgcatgg ttagggcccg gtagttctac ttctgttcat 1080
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 1860
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980
gtgttacttc tgcaggtcga ctctagagga tccccatggc cccgaagaag aagaggaagg 2040
tgcacatgga taagaagtac agcatcggcc tcgacatcgg gaccaacagc gtcggctggg 2100
ccgtcatcac cgacgaatat aaggtgccca gcaagaagtt caaggtgctc gggaatacag 2160
accgccacag catcaagaag aacctgatcg gcgccctcct gttcgactcg ggcgagaccg 2220
ctgaggccac cagactaaag aggaccgctc gccgccgcta cacccgccgc aagaaccgca 2280
tatgctacct ccaggagatc ttcagcaacg agatggccaa ggtggacgac agcttcttcc 2340
accgccttga ggagtcgttc ctcgtggagg aggacaagaa gcatgagagg cacccgatct 2400
tcgggaacat cgtggacgag gtaagtttct gcttctacct ttgatatata tataataatt 2460
atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa agaatgtagt 2520
atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat aacttttcta 2580
atatatgacc aaaacatggt gatgtgcagg tggcgtacca cgagaagtac ccgacgatct 2640
accacctccg caagaagctg gtcgactcca cagacaaggc cgacctcaga ctgatctacc 2700
tggccctcgc gcacatgatc aagttccgcg ggcacttcct catcgagggc gacctgaacc 2760
cggacaactc cgacgtcgac aagctcttca tccagctggt ccagacctac aatcaactgt 2820
tcgaggagaa cccgatcaac gcgtccggcg tggacgcgaa ggccatcctc agcgcgaggc 2880
tcagcaaatc aagacggctg gagaacctga tcgcccagct cccaggcgag aagaaaaacg 2940
gcttgttcgg caacctgatc gcgctctcgc tcggcctcac gcccaacttc aaatcaaact 3000
tcgacctggc cgaggacgcg aaactgcagc tgtccaagga cacttacgac gacgacctcg 3060
acaacctgct ggcgcaaatc ggtgaccagt acgcagacct cttcctggcc gccaagaacc 3120
tctcggacgc catcctgctg tccgatatcc tgagagtgaa tacggagatc accaaggcgc 3180
cgctcagcgc ctccatgatt aaaaggtacg acgagcacca ccaggacctg acgctgctca 3240
aggccctggt gcgccagcag ctccccgaga agtacaagga gatcttcttc gaccaatcaa 3300
aaaacggcta cgccggctac atcgacgggg gcgcctccca ggaggagttc tacaagttca 3360
tcaaaccaat tctcgagaag atggacggca cggaggagct tctcgtgaag ctcaaccggg 3420
aggacctcct gaggaagcag aggacgttcg acaacggctc gataccgcat cagatccacc 3480
tgggcgagct ccacgccatc ctgcgccggc aggaggattt ctatccgttc ctcaaggaca 3540
acagggagaa gatcgagaaa attctgacgt tccgcatccc gtactacgtg ggccctctcg 3600
cgcgcgggaa cagccggttc gcctggatga ctcggaagtc ggaggagacg atcacgccgt 3660
ggaacttcga ggaggtggtg gacaagggcg cctccgccca gtcgttcatc gagcgcatga 3720
cgaacttcga taaaaatctg cccaatgaaa aagtgctccc gaagcacagc ctcctctacg 3780
agtacttcac ggtgtacaac gagctcacga aggtgaagta cgtgaccgag ggtatgcgga 3840
agccggcgtt cctgagcggc gagcagaaga aggccatcgt ggacctcctc ttcaagacga 3900
accggaaagt caccgtgaag caattaaagg aggactactt caagaaaata gagtgcttcg 3960
acagcgtcga gatctcgggc gtcgaggaca ggttcaacgc gtcgctgggc acataccacg 4020
acctcctcaa gatcattaaa gacaaggact tcctggacaa cgaggagaac gaggacatcc 4080
tcgaggacat cgtgctgacc ctcaccctgt ttgaggaccg ggagatgatc gaggagcgcc 4140
tcaagacgta cgctcacctt ttcgacgaca aggtgatgaa acagctgaag cggcgccgct 4200
acaccggatg gggccggctc tcccgcaagc tcattaatgg gatcagggac aagcagtccg 4260
gcaagaccat actcgatttc ctgaagagcg acggcttcgc caaccggaac ttcatgcagc 4320
tcatccacga cgactccctc actttcaagg aggacatcca gaaggcccag gtcagcggac 4380
agggcgactc gctccacgaa cacatcgcca acctggccgg gtcgcctgcg attaaaaagg 4440
gaatccttca gaccgtcaag gtcgtggacg agctggtgaa ggtgatgggc aggcacaagc 4500
ccgaaaatat cgtcattgag atggcccggg agaaccagac cacgcagaaa ggccagaaga 4560
acagccggga gcgcatgaaa cggatcgagg agggtatcaa ggagctgggc tcgcagatcc 4620
tcaaggagca ccctgtggaa aatacccagc tgcagaatga aaagctctac ctctactacc 4680
tccagaacgg ccgcgacatg tacgtggacc aggagctgga cattaatcgc ctctcggact 4740
acgacgtcga ccacatcgtc ccgcagtcct tcctgaagga cgacagcatc gacaacaagg 4800
tcttgacccg ctccgataaa aatcgcggga agtccgacaa cgtgccgtcg gaggaggtgg 4860
tcaagaagat gaaaaactac tggcgccagc tgctcaacgc caagctaatc acgcagcgca 4920
agttcgacaa cctcaccaag gccgaacgcg gcggtctctc cgagcttgat aaggctgggt 4980
tcatcaagag acagctggtg gagacccggc agatcaccaa gcatgtcgcc cagatcctgg 5040
actcgcgcat gaatactaag tacgatgaaa acgacaagct catccgcgag gtgaaggtga 5100
tcaccctgaa gagcaagctg gtctcggact tccggaagga cttccagttc tacaaggtcc 5160
gggagatcaa caactaccac cacgcgcacg acgcctacct gaacgcggtg gtgggcacag 5220
cccttataaa gaagtaccct aagctcgagt ccgagttcgt gtacggcgac tacaaggtgt 5280
acgacgtccg caagatgatc gcgaagagcg agcaggagat cgggaaggcc accgcaaaat 5340
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctg gccaacgggg 5400
agatccgcaa gcgcccgctg attgagacga acggagagac aggcgagata gtctgggaca 5460
agggcaggga cttcgccacc gtgcgcaagg ttctgtccat gccgcaggtg aacatcgtga 5520
agaagactga ggtgcagaca ggcggcttct cgaaggagtc catcctgccc aagcggaaca 5580
gcgacaagct catcgcgcgg aagaaggact gggaccctaa aaaatatggc gggttcgact 5640
cgcccaccgt ggcttactcg gtcctcgtgg tggccaaggt cgagaagggc aaaagcaaga 5700
agctgaagag cgtcaaggag ctcctcggca tcaccatcat ggagcggtcc agcttcgaga 5760
agaacccgat cgacttcctc gaggcgaagg gatataagga ggtgaagaag gacctcatca 5820
ttaaactgcc gaagtactcg ctattcgaac tggagaatgg tcgcaagagg atgctcgcga 5880
gcgctggcga gctgcagaaa gggaacgagc tggctctccc gagcaagtac gtcaacttcc 5940
tctacctggc ctcccactat gaaaagctca agggctcgcc ggaggacaac gagcagaagc 6000
agctgttcgt cgagcagcac aagcattacc tcgacgagat catcgagcag atctcggagt 6060
tcagcaagcg cgtgatcctg gccgacgcca acctcgacaa ggtgctgtcc gcatataaca 6120
agcaccgcga caaaccaata cgggagcagg ccgaaaatat catccacctg ttcaccctca 6180
cgaacctggg cgcccccgcc gcgttcaagt acttcgacac aaccatcgac cgcaagcggt 6240
acacgagcac gaaggaggtg ctggacgcca cgttgattca ccagtccatc acgggcctgt 6300
atgaaacaag gatcgatctc agccagctcg gcggcgacta ggtaccacat ggttaaccta 6360
gacttgtcca tcttctggat tggccaactt aattaatgta tgaaataaaa ggatgcacac 6420
atagtgacat gctaatcact ataatgtggg catcaaagtt gtgtgttatg tgtaattact 6480
agttatctga ataaaagaga aagagatcat ccatatttct tatcctaaat gaatgtcacg 6540
tgtctttata attctttgat gaaccagatg catttcatta accaaatcca tatacatata 6600
aatattaatc atatataatt aatatcaatt gggttagcaa aacaaatcta gtctaggtgt 6660
gttttgcgaa ttgcggc 6677
<210> 106
<211> 3387
<212> DNA
<213> 嗜热链球菌(S. thermophilus)
<400> 106
atgagtgact tagttttagg acttgatatc ggtataggtt ctgttggtgt aggtatcctt 60
aacaaagtga caggagaaat tatccataaa aactcacgca tcttcccagc agctcaagca 120
gaaaataacc tagtacgtag aacgaatcgt caaggaagac gcttgacacg acgtaaaaaa 180
catcgtatag ttcgtttaaa tcgtctattt gaggaaagtg gattaatcac cgattttacg 240
aagatttcaa ttaatcttaa cccatatcaa ttacgagtta agggcttgac cgatgaattg 300
tctaatgaag aactgtttat cgctcttaaa aatatggtga aacaccgtgg gattagttac 360
ctcgatgatg ctagtgatga cggaaattca tcagtaggag actatgcaca aattgttaag 420
gaaaatagta aacaattaga aactaagaca ccgggacaga tacagttgga acgctaccaa 480
acatatggtc aattacgtgg tgattttact gttgagaaag atggcaaaaa acatcgcttg 540
attaatgtct ttccaacatc agcttatcgt tcagaagcct taaggatact gcaaactcaa 600
caagaattta atccacagat tacagatgaa tttattaatc gttatctcga aattttaact 660
ggaaaacgga aatattatca tggacccgga aatgaaaagt cacggactga ttatggtcgt 720
tacagaacga gtggagaaac tttagacaat atttttggaa ttctaattgg gaaatgtaca 780
ttttatccag aagagtttag agcagcaaaa gcttcctaca cggctcaaga attcaatttg 840
ctaaatgatt tgaacaatct aacagttcct actgaaacca aaaagttgag caaagaacag 900
aagaatcaaa tcattaatta tgtcaaaaat gaaaaggcaa tggggccagc gaaacttttt 960
aaatatatcg ctaagttact ttcttgtgat gttgcagata tcaagggata ccgtatcgac 1020
aaatcaggta aggctgagat tcatactttc gaagcctatc gaaaaatgaa aacgcttgaa 1080
accttagata ttgaacaaat ggatagagaa acgcttgata aattagccta tgtcttaaca 1140
ttaaacactg agagggaagg tattcaagaa gccttagaac atgaatttgc tgatggtagc 1200
tttagccaga agcaagttga cgaattggtt caattccgca aagcaaatag ttccattttt 1260
ggaaaaggat ggcataattt ttctgtcaaa ctgatgatgg agttaattcc agaattgtat 1320
gagacgtcag aagagcaaat gactatcctg acacgacttg gaaaacaaaa acgacttcgt 1380
cttcaaataa aacaaaatat ttcaaataaa acaaaatata tagatgagaa actattaact 1440
gaagaaatct ataatcctgt tgttgctaag tctgttcgcc aggctataaa aatcgtaaat 1500
gcggcgatta aagaatacgg agactttgac aatattgtca tcgaaatggc tcgtgaaaca 1560
aatgaagatg atgaaaagaa agctattcaa aagattcaaa aagccaacaa agatgaaaaa 1620
gatgcagcaa tgcttaaggc tgctaaccaa tataatggaa aggctgaatt accacatagt 1680
gttttccacg gtcataagca attagcgact aaaatccgcc tttggcatca gcaaggagaa 1740
cgttgccttt atactggtaa gacaatctca atccatgatt tgataaataa tcctaatcag 1800
tttgaagtag atcatatttt acctctttct atcacattcg atgatagcct tgcaaataag 1860
gttttggttt atgcaactgc taaccaagaa aaaggacaac gaacacctta tcaggcttta 1920
gatagtatgg atgatgcgtg gtctttccgt gaattaaaag cttttgtacg tgagtcaaaa 1980
acactttcaa acaagaaaaa agaatacctc cttacagaag aagatatttc aaagtttgat 2040
gttcgaaaga aatttattga acgaaatctt gtagatacaa gatacgcttc aagagttgtc 2100
ctcaatgccc ttcaagaaca ctttagagct cacaagattg atacaaaagt ttccgtggtt 2160
cgtggccaat ttacatctca attgagacgc cattggggaa ttgagaagac tcgtgatact 2220
tatcatcacc atgctgtcga tgcattgatt attgccgcct caagtcagtt gaatttgtgg 2280
aaaaaacaaa agaataccct tgtaagttat tcagaagaac aactccttga tattgaaaca 2340
ggtgaactta ttagtgatga tgagtacaag gaatctgtgt tcaaagcccc ttatcaacat 2400
tttgttgata cattgaagag taaagaattt gaagacagta tcttattctc atatcaagtg 2460
gattctaagt ttaatcgtaa aatatcagat gccactattt atgcgacaag acaggctaaa 2520
gtgggaaaag ataagaagga tgaaacttat gtcttaggga aaatcaaaga tatctatact 2580
caggatggtt atgatgcctt tatgaagatt tataagaagg ataagtcaaa attcctcatg 2640
tatcgtcacg acccacaaac ctttgagaaa gttatcgagc caattttaga gaactatcct 2700
aataagcaaa tgaatgaaaa aggaaaagag gtaccatgta atcctttcct aaaatataaa 2760
gaagaacatg gctatattcg taaatatagt aaaaaaggca atggtcctga aatcaagagt 2820
cttaaatact atgatagtaa gcttttaggt aatcctattg atattactcc agagaatagt 2880
aaaaataaag ttgtcttaca gtcattaaaa ccttggagaa cagatgtcta tttcaataag 2940
gctactggaa aatacgaaat ccttggatta aaatatgctg atctacaatt tgagaaaggg 3000
acaggaacat ataagatttc ccaggaaaaa tacaatgaca ttaagaaaaa agagggtgta 3060
gattctgatt cagaattcaa gtttacactt tataaaaatg atttgttact cgttaaagat 3120
acagaaacaa aagaacaaca gcttttccgt tttctttctc gaactttacc taaacaaaag 3180
cattatgttg aattaaaacc ttatgataaa cagaaatttg aaggaggtga ggcgttaatt 3240
aaagtgttgg gtaacgttgc taatggtggt caatgcataa aaggactagc aaaatcaaat 3300
atttctattt ataaagtaag aacagatgtc ctaggaaatc agcatatcat caaaaatgag 3360
ggtgataagc ctaagctaga tttttaa 3387
<210> 107
<211> 3369
<212> DNA
<213> 嗜热链球菌(S. thermophilus)
<400> 107
atgagtgact tagttttagg acttgatatc ggtataggtt ctgttggtgt aggtatcctt 60
aacaaagtga caggagaaat tatccataaa aactcacgca tcttcccagc agctcaagca 120
gaaaataacc tagtacgtag aacgaatcgt caaggaagac gcttgacacg acgtaaaaaa 180
catcgtatag ttcgtttaaa tcgtctattt gaggaaagtg gattaatcac cgattttacg 240
aagatttcaa ttaatcttaa cccatatcaa ttacgagtta agggcttgac cgatgaattg 300
tctaatgaag aactgtttat cgctcttaaa aatatggtga aacaccgtgg gattagttac 360
ctcgatgatg ctagtgatga cggaaattca tcagtaggag actatgcaca aattgttaag 420
gaaaatagta aacaattaga aactaagaca ccgggacaga tacagttgga acgctaccaa 480
acatatggtc aattacgtgg tgattttact gttgagaaag atggcaaaaa acatcgcttg 540
attaatgtct ttccaacatc agcttatcgt tcagaagcct taaggatact gcaaactcaa 600
caagaattta attcacagat tacagatgaa tttattaatc gttatctcga aattttaact 660
ggaaaacgga aatattatca tggacccgga aatgaaaagt cacggactga ttatggtcgt 720
tacagaacga atggagaaac tttagacaat atttttggaa ttctaattgg gaaatgtaca 780
ttttatccag acgagtttag agcagcaaaa gcttcctaca cggctcaaga attcaatttg 840
ctaaatgatt tgaacaatct aacagttcct actgaaacca aaaagttgag caaagaacag 900
aagaatcaaa tcattaatta tgtcaaaaat gaaaaggtaa tggggccagc gaaacttttt 960
aaatatatcg ctaaattact ttcttgtgat gttgcagata tcaagggaca ccgtatcgac 1020
aaatcaggta aggctgagat tcatactttc gaagcctatc gaaaaatgaa aacgcttgaa 1080
accttagata ttgagcaaat ggatagagaa acgcttgata aattagccta tgtcttaaca 1140
ttaaacactg agagggaagg tattcaagaa gctttagaac atgaatttgc tgatggtagc 1200
tttagccaga agcaagttga cgaattggtt caattccgca aagcaaatag ttccattttt 1260
ggaaaaggat ggcataattt ttctgtcaaa ctgatgatgg agttaattcc agaattgtat 1320
gagacgtcag aagagcaaat gactatcctg acacgacttg gaaaacaaaa aacaacttcg 1380
tcttcaaata aaacaaaata tatagatgag aaactattaa ctgaagaaat ctataatcct 1440
gttgttgcta agtctgttcg ccaggctata aaaatcgtaa atgcggcgat taaagaatac 1500
ggagactttg acaatattgt catcgaaatg gctcgtgaaa caaatgaaga tgatgaaaag 1560
aaagctattc aaaagattca aaaagccaac aaagatgaaa aagatgcagc aatgcttaag 1620
gctgctaacc aatataatgg aaaggctgaa ttaccacata gtgttttcca cggtcataag 1680
caattagcga ctaaaatccg cctttggcat cagcaaggag aacgttgcct ttatactggt 1740
aagacaatct caatccatga tttgataaat aatcctaatc agtttgaagt agatcatatt 1800
ttacctcttt ctatcacatt cgatgatagc cttgcaaata aggttttggt ttatgcaact 1860
gctaaccaag aaaaaggaca acgaacacct tatcaggctt tagatagtat ggatgatgcg 1920
tggtctttcc gtgaattaaa agcttttgta cgtgagtcaa aaacactttc aaacaagaaa 1980
aaagaatacc tccttacaga agaagatatt tcaaagtttg atgttcgaaa gaaatttatt 2040
gaacgaaatc ttgtagatac aagatacgct tcaagagttg tcctcaatgc ccttcaagaa 2100
cactttagag ctcacaagat tgatacaaaa gtttccgtgg ttcgtggcca atttacatct 2160
caattgagac gccattgggg aattgagaag actcgtgata cttatcatca ccatgctgtc 2220
gatgcattga ttattgccgc ctcaagtcag ttgaatttgt ggaaaaaaca aaagaatacc 2280
cttgtaagtt attcagaaga acaactcctt gatattgaaa caggtgaact tattagtgat 2340
gatgagtaca aggaatctgt gttcaaagcc ccttatcaac attttgttga tacattgaag 2400
agtaaagaat ttgaagacag tatcttattc tcatatcaag tggattctaa gtttaatcgt 2460
aaaatatcag atgccactat ttatgcgaca agacaggcta aagtgggaaa agataagaag 2520
gatgaaactt atgtcttagg gaaaatcaaa gatatctata ctcaggatgg ttatgatgcc 2580
tttatgaaga tttataagaa ggataagtca aaattcctca tgtatcgtca cgacccacaa 2640
acctttgaga aagttatcga gccaatttta gagaactatc ctaataagga aatgaatgaa 2700
aaagggaaag aagtaccatg taatcctttc ctaaaatata aagaagaaca tggctatatt 2760
cgtaaatata gtaaaaaagg caatggtcct gaaatcaaga gtcttaaata ctatgatagt 2820
aagcttttag gtaatcctat tgatattact ccagagaata gtaaaaataa agttgtctta 2880
cagtcattaa aaccttggag aacagatgtc tatttcaata aaaatactgg taaatatgaa 2940
attttaggac tgaaatatgc tgatttacaa tttgaaaaga agacaggaac atataagatt 3000
tcccaggaaa aatacaatgg cattatgaaa gaagagggtg tagattctga ttcagaattc 3060
aagtttacac tttataaaaa tgatttgtta ctcgttaaag atacagaaac aaaagaacaa 3120
cagcttttcc gttttctttc tcgaactatg cctaatgtga aatattatgt agagttaaag 3180
ccttattcaa aagataaatt tgagaagaat gagtcactta ttgaaatttt aggttctgca 3240
gataagtcag gacgatgtat aaaagggcta ggaaaatcaa atatttctat ttataaggta 3300
agaacagatg tcctaggaaa tcagcatatc atcaaaaatg agggtgataa gcctaagcta 3360
gatttttaa 3369
<210> 108
<211> 4113
<212> DNA
<213> 无乳链球菌(S. agalactiae)
<400> 108
atgaataagc catattcaat aggccttgac atcggtacta attccgtcgg atggagcatt 60
attacagatg attataaagt acctgctaag aagatgagag ttttagggaa cactgataaa 120
gaatatatta agaagaatct cataggtgct ctgctttttg atggcgggaa tactgctgca 180
gatagacgct tgaagcgaac tgctcgtcgt cgttatacac gtcgtagaaa tcgtattcta 240
tatttacaag aaatttttgc agaggaaatg agtaaagttg atgatagttt ctttcatcga 300
ttagaggatt cttttctagt tgaggaagat aagagaggga gcaagtatcc tatctttgca 360
acattgcagg aagagaaaga ttatcatgaa aaattttcga caatctatca tttgagaaaa 420
gaattagctg acaagaaaga aaaagcagac cttcgtctta tttatattgc tctagctcat 480
atcattaaat ttagagggca tttcctaatt gaggatgata gctttgatgt caggaataca 540
gacatttcaa aacaatatca agatttttta gaaatcttta atacaacttt tgaaaataat 600
gatttgttat ctcaaaacgt tgacgtagag gcaatactaa cagataagat tagcaagtct 660
gcgaagaaag atcgtatttt agcgcagtat cctaaccaaa aatctactgg catttttgca 720
gaatttttga aattgattgt cggaaatcaa gctgacttca agaaatattt caatttggag 780
gataaaacgc cgcttcaatt cgctaaggat agctacgatg aagatttaga aaatcttctt 840
ggacagattg gtgatgaatt tgcagactta ttctcagcag cgaaaaagtt atatgatagt 900
gtccttttgt ctggcattct tacagtaatc gacctcagta ccaaggcgcc actttcagct 960
tctatgattc agcgttatga tgaacataga gaggacttga aacagttaaa acaattcgta 1020
aaagcttcat tgccggaaaa atatcaagaa atatttgctg attcatcaaa agatggctac 1080
gctggttata ttgaaggtaa aactaatcaa gaagcttttt ataaatacct gtcaaaattg 1140
ttgaccaagc aagaagatag cgagaatttt cttgaaaaaa tcaagaatga agatttcttg 1200
agaaaacaaa ggacctttga taatggctca attccacacc aagtccattt gacagagctg 1260
aaagctatta tccgccgtca atcagaatac tatcccttct tgaaagagaa tcaagatagg 1320
attgaaaaaa tccttacctt tagaattcct tattatatcg ggccactagc acgtgagaag 1380
agtgattttg catggatgac tcgcaaaaca gatgacagta ttcgaccttg gaattttgaa 1440
gacttggttg ataaagaaaa atctgcggaa gcttttatcc atcgtatgac caacaatgat 1500
ttttatcttc ctgaagaaaa agttttacca aagcatagtc ttatttatga aaaatttacg 1560
gtctataatg agttgactaa ggttagatat aaaaatgagc aaggtgagac ttattttttt 1620
gatagcaata ttaaacaaga aatctttgat ggagtattca aggaacatcg taaggtatcc 1680
aagaagaagt tgctagattt tctggctaaa gaatatgagg agtttaggat agtagatgtt 1740
attggtctag ataaagaaaa taaagctttc aacgcctcat tgggaactta ccacgatctc 1800
gaaaaaatac tagacaaaga ttttctagat aatccagata atgagtctat tctggaagat 1860
atcgtccaaa ctctaacatt atttgaagac agagaaatga ttaagaagcg tcttgaaaac 1920
tataaagatc tttttacaga gtcacaacta aaaaaactct atcgtcgtca ctatactggc 1980
tggggacgat tgtctgctaa gttaatcaat ggtattcgag ataaagagag tcaaaaaaca 2040
atcttggact atcttattga tgatggtaga tctaatcgca actttatgca gttgataaat 2100
gatgatggtc tatctttcaa atcaattatc agtaaggcac aggctggtag tcattcagat 2160
aatctaaaag aagttgtagg tgagcttgca ggtagccctg ctattaaaaa gggaattcta 2220
caaagtttga aaattgttga tgagcttgtt aaagtcatgg gatacgaacc tgaacaaatt 2280
gtggttgaga tggcgcgtga gaatcaaaca acaaatcaag gtcgtcgtaa ctctcgacaa 2340
cgctataaac ttcttgatga tggcgttaag aatctagcta gtgacttgaa tggcaatatt 2400
ttgaaagaat atcctacgga taatcaagcg ttgcaaaatg aaagactttt cctttactac 2460
ttacaaaacg gaagagatat gtatacaggg gaagctctag atattgacaa tttaagtcaa 2520
tatgatattg accacattat tcctcaagct ttcataaaag atgattctat tgataatcgt 2580
gttttggtat catctgctaa aaatcgtgga aagtcagatg atgttcctag ccttgaaatt 2640
gtaaaagatt gtaaagtttt ctggaaaaaa ttacttgatg ctaagttaat gagtcagcgt 2700
aagtatgata atttgactaa ggcagagcgc ggaggcctaa cttccgatga taaggcaaga 2760
tttatccaac gtcagttggt tgagacacga caaattacca agcatgttgc ccgtatcttg 2820
gatgaacgct ttaataatga gcttgatagt aaaggtagaa ggatccgcaa agttaaaatt 2880
gtaaccttga agtcaaattt ggtttcaaat ttccgaaaag aatttggatt ctataaaatt 2940
cgtgaagtta acaattatca ccatgcacat gatgcctatc ttaatgcagt agttgctaaa 3000
gctattctaa ccaaatatcc tcagttagag ccagaatttg tctacggcga ctatccaaaa 3060
tataatagtt acaaaacgcg taaatccgct acagaaaagc tatttttcta ttcaaatatt 3120
atgaacttct ttaaaactaa ggtaacttta gcggatggaa ccgttgttgt aaaagatgat 3180
attgaagtta ataatgatac gggtgaaatt gtttgggata aaaagaaaca ctttgcgaca 3240
gttagaaaag tcttgtcata ccctcagaac aatatcgtga agaagacaga gattcagaca 3300
ggtggtttct ctaaggaatc aatcttggcg catggtaact cagataagtt gattccaaga 3360
aaaacgaagg atatttattt agatcctaag aaatatggag gttttgatag tccgatagta 3420
gcttactctg ttttagttgt agctgatatc aaaaagggta aagcacaaaa actaaaaaca 3480
gttacggaac ttttaggaat taccatcatg gagaggtcca gatttgagaa aaatccatca 3540
gctttccttg aatcaaaagg ctatttaaat attagggctg ataaactaat tattttgccc 3600
aagtatagtc tgttcgaatt agaaaatggg cgtcgtcgat tacttgctag tgctggtgaa 3660
ttacaaaaag gtaatgagct agccttacca acacaattta tgaagttctt ataccttgca 3720
agtcgttata atgagtcaaa aggtaaacca gaggagattg agaagaaaca agaatttgta 3780
aatcaacatg tctcttattt tgatgacatc cttcaattaa ttaatgattt ttcaaaacga 3840
gttattctag cagatgctaa tttagagaaa atcaataagc tttaccaaga taataaggaa 3900
aatatatcag tagatgaact tgctaataat attatcaatc tatttacttt taccagtcta 3960
ggagctccag cagcttttaa attttttgat aaaatagttg atagaaaacg ctatacatca 4020
actaaagaag tacttaattc taccctaatt catcaatcta ttactggact ttatgaaaca 4080
cgtattgatt tgggtaagtt aggagaagat tga 4113
<210> 109
<211> 4134
<212> DNA
<213> 无乳链球菌(S. agalactiae)
<400> 109
atgaataagc catattcaat aggccttgac atcggtacta attccgtcgg atggagcatt 60
attacagatg attataaagt acctgctaag aagatgagag ttttagggaa cactgataaa 120
gaatatatta agaagaatct cataggtgct ctgctttttg atggcgggaa tactgctgca 180
gatagacgct tgaagcgaac tgctcgtcgt cgttatacac gtcgtagaaa tcgtattcta 240
tatttacaag aaatttttgc agaggaaatg agtaaagttg atgatagttt ctttcatcga 300
ttagaggatt cttttctagt tgaggaagat aagagaggta gcaagtatcc tatctttgca 360
acaatgcagg aggagaaata ttatcatgaa aaatttccga caatctatca tttgagaaaa 420
gaattggctg acaagaaaga aaaagcagac cttcgtcttg tttatctggc tctagctcat 480
atcattaaat tcagagggca tttcctaatt gaggatgata gatttgatgt gaggaatacc 540
gatattcaaa aacaatatca agccttttta gaaatttttg atactacctt tgaaaataat 600
catttgttat ctcaaaatgt agatgtagaa gcaattctaa cagataagat tagcaagtct 660
gcgaagaagg atcgcatctt agcgcagtat cctaaccaaa aatctactgg tatttttgca 720
gaatttttga aattgattgt cggaaatcaa gctgacttca agaaacattt caatttggag 780
gataaaacac cgcttcaatt cgctaaggat agctacgatg aagatttaga aaatcttctt 840
ggacagattg gtgatgaatt tgcagactta ttctcagtag cgaaaaagct atatgatagt 900
gttcttttat ctggcattct tacagtaact gatctcagta ccaaggcgcc actttctgcc 960
tctatgattc agcgttatga tgaacatcat gaggacttaa agcatctaaa acaattcgta 1020
aaagcttcat tacctgaaaa ttatcgggaa gtatttgctg attcatcaaa agatggctac 1080
gctggctata ttgaaggcaa aactaatcaa gaagcttttt ataaatatct gttaaaattg 1140
ttgaccaaac aagaaggtag cgagtatttt cttgagaaaa ttaagaatga agattttttg 1200
agaaaacaga gaacctttga taatggctca atcccgcatc aagtccattt gacagaattg 1260
agggctatta ttcgacgtca atcagaatac tatccattct tgaaagagaa tcaagatagg 1320
attgaaaaaa tccttacctt tagaattcct tattatgtcg ggccactagc acgtgagaag 1380
agtgattttg catggatgac tcgcaaaaca gatgacagta ttcgaccttg gaattttgaa 1440
gacttggttg ataaagaaaa atctgcggaa gcttttatcc atcgcatgac caacaatgac 1500
ctctatcttc cagaagaaaa agttttacca aagcatagtc ttatttatga aaaatttact 1560
gtttacaatg aattaacgaa ggttagattt ttggcagaag gctttaaaga ttttcaattt 1620
ttaaatagga agcaaaaaga aactatcttt aacagcttgt ttaaggaaaa acgtaaagta 1680
actgaaaagg atattattag ttttttgaat aaagttgatg gatatgaagg aattgcaatc 1740
aaaggaattg agaaacagtt taacgctagc ctttcaacct atcatgatct taaaaaaata 1800
cttggcaagg atttccttga taatacagat aacgagctta ttttggaaga tatcgtccaa 1860
actctaacct tatttgaaga tagagaaatg attaagaagt gtcttgacat ctataaagat 1920
ttttttacag agtcacagct taaaaagctc tatcgccgtc actatactgg ctggggacga 1980
ttgtctgcta agctaataaa tggcatccga aataaagaga atcaaaaaac aatcttggac 2040
tatcttattg atgatggaag tgcaaaccga aacttcatgc agttgataaa tgatgatgat 2100
ctatcattta aaccaattat tgacaaggca cgaactggta gtcattcgga taatctgaaa 2160
gaagttgtag gtgaacttgc tggtagccct gctattaaaa aagggattct acaaagtttg 2220
aaaatagttg atgagctggt taaagtcatg ggctatgaac ctgaacaaat cgtggttgaa 2280
atggcacgtg agaaccaaac gacagcaaaa ggattaagtc gttcacgaca acgcttgaca 2340
accttgagag aatctcttgc taatttgaag agtaatattt tggaagagaa aaagcctaag 2400
tatgtgaaag atcaagttga aaatcatcat ttatctgatg accgtctttt cctttactac 2460
ttacaaaacg gaagagatat gtatacaaaa aaggctctgg atattgataa tttaagtcaa 2520
tatgatattg accacattat tcctcaagct ttcataaaag atgattctat tgataatcgt 2580
gttttggtat catctgctaa aaatcgtgga aaatcagatg atgttcctag cattgaaatt 2640
gtaaaagctc gcaaaatgtt ctggaaaaat ttactggatg ctaagttaat gagtcagcgt 2700
aagtatgata atttgactaa ggcagagcgc ggaggcctaa cttccgatga taaggcaaga 2760
tttatccaac gtcagttggt tgagactcga caaattacca agcatgtagc tcgtatcttg 2820
gatgaacgct tcaataatga agttgataat ggtaaaaaga tttgcaaggt taaaattgta 2880
accttgaagt caaatttggt ttcaaatttc cgaaaagaat ttggattcta taaaattcgt 2940
gaagttaatg attatcacca tgcacacgat gcttatctta atgcagtagt tgccaaagct 3000
attctaacca aatatccaca gttagagcca gagtttgtct acggaatgta tagacagaaa 3060
aaactttcga aaatcgttca tgaggataag gaagaaaaat atagtgaagc aaccaggaaa 3120
atgtttttct actccaactt gatgaatatg ttcaaaagag ttgtgaggtt agcagatggt 3180
tctattgttg taagaccagt aatagaaact ggtagatata tgagaaaaac tgcatgggat 3240
aaaaagaaac actttgcgac agttagaaaa gtcttgtcat accctcagaa caatatcgtg 3300
aagaagacag agattcagac aggtggtttc tctaaggaat caatcttggc gcatggtaac 3360
tcagataagt tgattccaag aaaaacgaag gatatttatt tagatcctaa gaaatatgga 3420
ggttttgata gtccgatagt agcttactct gttttagttg tagctgatat caaaaaaggt 3480
aaagcacaaa aactaaaaac agttacggaa cttttaggaa ttaccatcat ggagaggtcc 3540
agatttgaga aaaatccatc agctttcctt gaatcaaaag gttatttaaa tattagggac 3600
gataaattaa tgattttacc gaagtatagt ctgttcgaat tagaaaatgg gcgtcgtcga 3660
ttacttgcta gtgctggtga attacaaaaa ggtaacgagc tagccttacc aacacaattt 3720
atgaagttct tataccttgc aagtcgttat aatgagtcaa aaggtaaacc agaggagatt 3780
gagaagaaac aagaatttgt aaatcaacat gtctcttatt ttgatgacat ccttcaatta 3840
attaatgatt tttcaaaacg agttattcta gcagatgcta atttagagaa aatcaataag 3900
ctttaccagg ataataagga aaatatacca gtagatgaac ttgctaataa tattatcaat 3960
ctatttactt ttaccagtct aggagctcca gcagctttta aattttttga taaaatagtt 4020
gatagaaaac gctatacatc aactaaagaa gtacttaatt ctactctaat ccatcaatct 4080
attactggac tttatgaaac acgtattgat ttgggtaaat taggagaaga ttga 4134
<210> 110
<211> 4038
<212> DNA
<213> 变异链球菌(S. mutans)
<400> 110
atgaaaaaac cttactctat tggacttgat attggaacca attctgttgg ttgggctgtt 60
gtgacagatg actacaaagt tcctgctaag aagatgaagg ttctgggaaa tacagataaa 120
agtcatatcg agaaaaattt gcttggcgct ttattatttg atagcgggaa tactgcagaa 180
gacagacggt taaagagaac tgctcgccgt cgttacacac gtcgcagaaa tcgtatttta 240
tatttgcaag agattttttc agaagaaatg ggcaaggtag atgatagttt ctttcatcgt 300
ttagaggatt cttttcttgt tactgaggat aaacgaggag agcgccatcc catttttggg 360
aatcttgaag aagaagttaa gtatcatgaa aattttccaa ccatttatca tttgcggcaa 420
tatcttgcgg ataatccaga aaaagttgat ttgcgtttag tttatttggc tttggcacat 480
ataattaagt ttagaggtca ttttttaatt gaaggaaagt ttgatacacg caataatgat 540
gtacaaagac tgtttcaaga atttttagca gtctatgata atacttttga gaatagttcg 600
cttcaggagc aaaatgttca agttgaagaa attctgactg ataaaatcag taaatctgct 660
aagaaagata gagttttgaa actttttcct aatgaaaagt ctaatggccg ctttgcagaa 720
tttctaaaac taattgttgg taatcaagct gattttaaaa agcattttga attagaagag 780
aaagcaccat tgcaattttc taaagatact tatgaagaag agttagaagt actattagct 840
caaattggag ataattacgc agagctcttt ttatcagcaa agaaactgta tgatagtatc 900
cttttatcag ggattttaac agttactgat gttggtacca aagcgccttt atctgcttcg 960
atgattcagc gatataatga acatcagatg gatttagctc agcttaaaca attcattcgt 1020
cagaaattat cagataaata taacgaagtt ttttctgatg tttcaaaaga cggctatgcg 1080
ggttatattg atgggaaaac aaatcaagaa gctttttata aataccttaa aggtctatta 1140
aataagattg agggaagtgg ctatttcctt gataaaattg agcgtgaaga ttttctaaga 1200
aagcaacgta cctttgacaa tggctctatt ccacatcaga ttcatcttca agaaatgcgt 1260
gctatcattc gtagacaggc tgaattttat ccgtttttag cagacaatca agataggatt 1320
gagaaattat tgactttccg tattccctac tatgttggtc cattagcgcg cggaaaaagt 1380
gattttgctt ggttaagtcg gaaatcggct gataaaatta caccatggaa ttttgatgaa 1440
atcgttgata aagaatcctc tgcagaagct tttatcaatc gtatgacaaa ttatgatttg 1500
tacttgccaa atcaaaaagt tcttcctaaa catagtttat tatacgaaaa atttactgtt 1560
tacaatgaat taacaaaggt taaatataaa acagagcaag gaaaaacagc attttttgat 1620
gccaatatga agcaagaaat ctttgatggc gtatttaagg tttatcgaaa agtaactaaa 1680
gataaattaa tggatttcct tgaaaaagaa tttgatgaat ttcgtattgt tgatttaaca 1740
ggtctggata aagaaaataa agtatttaac gcttcttatg gaacttatca tgatttgtgt 1800
aaaattttag ataaagattt tctcgataat tcaaagaatg aaaagatttt agaagatatt 1860
gtgttgacct taacgttatt tgaagataga gaaatgatta gaaaacgtct agaaaattac 1920
agtgatttat tgaccaaaga acaagtgaaa aagctggaaa gacgtcatta tactggttgg 1980
ggaagattat cagctgagtt aattcatggt attcgcaata aagaaagcag aaaaacaatt 2040
cttgattatc tcattgatga tggcaatagc aatcggaact ttatgcaact gattaacgat 2100
gatgctcttt ctttcaaaga agagattgct aaggcacaag ttattggaga aacagacaat 2160
ctaaatcaag ttgttagtga tattgctggc agccctgcta ttaaaaaagg aattttacaa 2220
agcttgaaga ttgttgatga gcttgtcaaa attatgggac atcaacctga aaatatcgtc 2280
gtggagatgg cgcgtgaaaa ccagtttacc aatcagggac gacgaaattc acagcaacgt 2340
ttgaaaggtt tgacagattc tattaaagaa tttggaagtc aaattcttaa agaacatccg 2400
gttgagaatt cacagttaca aaatgataga ttgtttctat attatttaca aaacggcaga 2460
gatatgtata ctggagaaga attggatatt gattatctaa gccagtatga tatagaccat 2520
attatcccgc aagcttttat aaaggataat tctattgata atagagtatt gactagctca 2580
aaggaaaatc gtggaaaatc ggatgatgta ccaagtaaag atgttgttcg taaaatgaaa 2640
tcctattgga gtaagctact ttcggcaaag cttattacac aacgtaaatt tgataatttg 2700
acaaaagctg aacgaggtgg attgaccgac gatgataaag ctggattcat caagcgtcaa 2760
ttagtagaaa cacgacaaat taccaaacat gtagcacgta ttctggacga acgatttaat 2820
acagaaacag atgaaaacaa caagaaaatt cgtcaagtaa aaattgtgac cttgaaatca 2880
aatcttgttt ccaatttccg taaagagttt gaactctaca aagtgcgtga aattaatgac 2940
tatcatcatg cacatgatgc ctatctcaat gctgtaattg gaaaggcttt actaggtgtt 3000
tacccacaat tggaacctga atttgtttat ggtgattatc ctcattttca tggacataaa 3060
gaaaataaag caactgctaa gaaatttttc tattcaaata ttatgaactt ctttaaaaaa 3120
gatgatgtcc gtactgataa aaatggtgaa attatctgga aaaaagatga gcatatttct 3180
aatattaaaa aagtgctttc ttatccacaa gttaatattg ttaagaaagt agaggagcaa 3240
acgggaggat tttctaaaga atctatcttg ccgaaaggta attctgacaa gcttattcct 3300
cgaaaaacga agaaatttta ttgggatacc aagaaatatg gaggatttga tagcccgatt 3360
gttgcttatt ctattttagt tattgctgat attgaaaaag gtaaatctaa aaaattgaaa 3420
acagtcaaag ccttagttgg tgtcactatt atggaaaaga tgacttttga aagggatcca 3480
gttgcttttc ttgagcgaaa aggctatcga aatgttcaag aagaaaatat tataaagtta 3540
ccaaaatata gtttatttaa actagaaaac ggacgaaaaa ggctattggc aagtgctagg 3600
gaacttcaaa agggaaatga aatcgttttg ccaaatcatt taggaacctt gctttatcac 3660
gctaaaaata ttcataaagt tgatgaacca aagcatttgg actatgttga taaacataaa 3720
gatgaattta aggagttgct agatgttgtg tcaaactttt ctaaaaaata tactttagca 3780
gaaggaaatt tagaaaaaat caaagaatta tatgcacaaa ataatggtga agatcttaaa 3840
gaattagcaa gttcatttat caacttatta acatttactg ctataggagc accggctact 3900
tttaaattct ttgataaaaa tattgatcga aaacgatata cttcaactac tgaaattctc 3960
aacgctaccc tcatccacca atccatcacc ggtctttatg aaacgcggat tgatctcaat 4020
aagttaggag gagactaa 4038

Claims (16)

1.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
2.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
3.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种子对草甘膦具有抗性;以及
b)产生不含所述向导RNA和Cas内切核酸酶的子代植物。
4.一种产生草甘膦抗性玉米植物的方法,所述方法包括提供玉米植物细胞,其中所述玉米植物细胞的内源性染色体EPSPS基因已通过向导RNA/Cas内切核酸酶系统进行修饰以产生草甘膦抗性EPSPS蛋白;以及由所述玉米植物细胞培育玉米植物,其中所述植物对草甘膦具有抗性。
5.一种由权利要求1-4中任一项所述的方法产生的植物。
6.一种由权利要求5所述的植物产生的种子。
7.一种向导RNA,其中所述可变靶向域靶向植物EPSPS核苷酸序列的片段。
8.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)获得在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
9.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
10.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供能够表达向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、以及多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS基因的非功能片段和所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
11.一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含EPSPS基因片段的至少一个拷贝。
12.一种用于替换细胞中的第一烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)启动子序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含不同于所述第一EPSPS启动子序列的第二启动子或第二启动子片段。
13.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入调控元件的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含待插入到所述EPSPS核苷酸序列中的调控元件。
14.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入内含子的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含内含子序列。
15.一种草甘膦抗性玉米植物,其中所述玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中所述玉米植物不表达草甘膦敏感性EPSPS多肽。
16.一种草甘膦抗性玉米植物细胞,其中所述玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中所述内源性EPSPS多核苷酸序列存在于与对应野生型对照相比相同的染色体位置。
CN201580048737.3A 2014-07-11 2015-07-01 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 Pending CN106687594A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462023246P 2014-07-11 2014-07-11
US62/023246 2014-07-11
PCT/US2015/038767 WO2016007347A1 (en) 2014-07-11 2015-07-01 Compositions and methods for producing plants resistant to glyphosate herbicide

Publications (1)

Publication Number Publication Date
CN106687594A true CN106687594A (zh) 2017-05-17

Family

ID=53716563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580048737.3A Pending CN106687594A (zh) 2014-07-11 2015-07-01 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法

Country Status (8)

Country Link
US (1) US10676754B2 (zh)
EP (1) EP3166391A1 (zh)
CN (1) CN106687594A (zh)
AU (1) AU2015288157A1 (zh)
BR (1) BR112017000482A2 (zh)
CA (1) CA2954626A1 (zh)
MX (1) MX2017000422A (zh)
WO (1) WO2016007347A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108291236A (zh) * 2015-09-30 2018-07-17 先锋国际良种公司 植物epsp合酶和使用方法
CN109117835A (zh) * 2017-06-26 2019-01-01 佳能株式会社 图像处理装置和方法
CN111801417A (zh) * 2017-12-14 2020-10-20 克里斯珀医疗股份公司 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途
CN111868247A (zh) * 2018-03-12 2020-10-30 先锋国际良种公司 用于植物转化的方法
CN112522298A (zh) * 2019-09-19 2021-03-19 中国农业大学 用于植物基因编辑的成套载体及其应用
CN112779266A (zh) * 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
CN115243711A (zh) * 2020-01-09 2022-10-25 先锋国际良种公司 两步基因交换
CN115697043A (zh) * 2020-05-13 2023-02-03 纽海姆有限公司 通过靶向诱变获得突变植物的方法

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
EP3611268A1 (en) 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10450576B2 (en) 2015-03-27 2019-10-22 E I Du Pont De Nemours And Company Soybean U6 small nuclear RNA gene promoters and their use in constitutive expression of small RNA genes in plants
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
US11542515B2 (en) * 2016-02-09 2023-01-03 Cibus Us Llc Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
WO2017155715A1 (en) * 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
EP3426778A1 (en) * 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
WO2017155714A1 (en) * 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CA3037560A1 (en) 2016-10-13 2018-04-19 Pioneer Hi-Bred International, Inc. Generating northern leaf blight resistant maize
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
EP4256951A3 (en) 2016-11-04 2023-12-06 Flagship Pioneering Innovations V. Inc. Novel plant cells, plants, and seeds
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11624071B2 (en) 2017-01-28 2023-04-11 Inari Agriculture Technology, Inc. Method of creating a plurality of targeted insertions in a plant cell
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
US20200392528A1 (en) * 2017-03-30 2020-12-17 Pioneer Hi-Bred International, Inc. Improved plant epsp synthases and methods of use
AU2018243654A1 (en) 2017-03-31 2019-10-17 Pioneer Hi-Bred International, Inc. Expression modulating elements and use thereof
BR112019022201A2 (pt) 2017-04-24 2020-05-12 Dupont Nutrition Biosciences Aps Métodos para modular a atividade de uma endonuclease cas, para aumentar a especificidade de uma endonuclease cas e complexo polinucleotídico guia, para aumentar a frequência de recombinação homóloga e para ativação ou repressão gênica, célula e célula vegetal
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11603536B2 (en) 2017-09-29 2023-03-14 Inari Agriculture Technology, Inc. Methods for efficient maize genome editing
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
EP3731857A4 (en) * 2017-11-01 2022-03-09 Monsanto Technology LLC METHODS AND COMPOSITIONS FOR GLYPHOS ATTOLERANCE IN PLANTS
CN109929941B (zh) * 2017-12-19 2022-09-16 中国农业科学院生物技术研究所 一种鉴定草甘膦抗性水稻的方法
US11926835B1 (en) 2018-01-29 2024-03-12 Inari Agriculture Technology, Inc. Methods for efficient tomato genome editing
WO2019173125A1 (en) 2018-03-09 2019-09-12 Pioneer Hi-Bred International, Inc. Compositions and methods for modification of fatty acids in soybean
JP6614622B2 (ja) * 2018-04-17 2019-12-04 国立大学法人名古屋大学 植物ゲノム編集方法
CN112204156A (zh) 2018-05-25 2021-01-08 先锋国际良种公司 用于通过调节重组率来改善育种的系统和方法
US11866719B1 (en) 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
US20210324398A1 (en) 2018-06-29 2021-10-21 Pioneer Hi-Bred International, Inc. Edited nac genes in plants
WO2020081979A1 (en) * 2018-10-19 2020-04-23 Memorial Sloan-Kettering Cancer Center Low dose radiation conditioning for immunotherapy
JP2022505671A (ja) 2018-10-31 2022-01-14 パイオニア ハイ-ブレッド インターナショナル, インコーポレイテッド オクロバクトラム媒介遺伝子編集のための組成物及び方法
KR20210104068A (ko) 2018-12-14 2021-08-24 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 게놈 편집을 위한 신규한 crispr-cas 시스템
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
US11692197B2 (en) 2019-05-06 2023-07-04 Inari Agriculture Technology, Inc. Delivery of biological molecules to plant cells
CA3138663A1 (en) 2019-06-25 2020-12-30 Inari Agriculture Technology, Inc. Improved homology dependent repair genome editing
CA3177481A1 (en) 2020-05-08 2021-11-11 David R. Liu Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CA3175936A1 (en) 2020-06-12 2021-12-16 Pioneer Hi-Bred International, Inc. Alteration of seed composition in plants
CA3186862A1 (en) 2020-08-18 2022-02-24 Pioneer Hi-Bred International, Inc. Multiple disease resistance genes and genomic stacks thereof
WO2023102393A1 (en) 2021-11-30 2023-06-08 Pioneer Hi-Bred International, Inc. High efficiency large scale chromosomal genome manipulation
CN114836446B (zh) * 2022-04-26 2023-12-19 上海交通大学 一种抗草甘膦的植物及其制法
WO2024005863A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005864A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299733A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299739A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1236394A (zh) * 1996-11-07 1999-11-24 曾尼卡有限公司 除草剂抗性植物
CN1359423A (zh) * 1999-04-29 2002-07-17 辛甄塔有限公司 抗除草剂植物
CN101878307A (zh) * 2007-09-27 2010-11-03 陶氏益农公司 以5-烯醇式丙酮酰莽草酸-3-磷酸合酶基因为靶的改造锌指蛋白
CN102822350A (zh) * 2010-03-08 2012-12-12 孟山都技术公司 用于植物基因调控的多核苷酸分子
CN103409445A (zh) * 2013-08-01 2013-11-27 刘坚 抗草甘膦基因mtp-smg2-epsps及其在培育抗草甘膦玉米中的应用

Family Cites Families (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US5196525A (en) 1987-01-13 1993-03-23 University Of British Columbia DNA construct for enhancing the efficiency of transcription
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US4971908A (en) 1987-05-26 1990-11-20 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5310667A (en) 1989-07-17 1994-05-10 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
EP0452269B1 (en) 1990-04-12 2002-10-09 Syngenta Participations AG Tissue-preferential promoters
WO1991016433A1 (en) 1990-04-26 1991-10-31 Plant Genetic Systems N.V. New bacillus thuringiensis strains and their genes encoding insecticidal toxins
US5478369A (en) 1990-06-12 1995-12-26 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5277905A (en) 1991-01-16 1994-01-11 Mycogen Corporation Coleopteran-active bacillus thuringiensis isolate
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
ES2124738T3 (es) 1991-08-02 1999-02-16 Mycogen Corp Nuevo microorganismo e insecticida.
EP0600993B1 (en) 1991-08-27 1999-11-10 Novartis AG Proteins with insecticidal properties against homopteran insects and their use in plant protection
JPH06511152A (ja) 1991-10-04 1994-12-15 ノースカロライナ ステイト ユニバーシティー 病原体耐性トランスジェニック植物
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
WO1994012014A1 (en) 1992-11-20 1994-06-09 Agracetus, Inc. Transgenic cotton plants producing heterologous bioplastic
IL108241A (en) 1992-12-30 2000-08-13 Biosource Genetics Corp Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus
AU6162294A (en) 1993-01-13 1994-08-15 Pioneer Hi-Bred International, Inc. High lysine derivatives of alpha-hordothionin
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5837850A (en) 1994-04-21 1998-11-17 Pioneer Hi-Bred International, Inc. Regulatory element conferring tapetum specificity
US5593881A (en) 1994-05-06 1997-01-14 Mycogen Corporation Bacillus thuringiensis delta-endotoxin
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5792931A (en) 1994-08-12 1998-08-11 Pioneer Hi-Bred International, Inc. Fumonisin detoxification compositions and methods
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
CA2160529A1 (en) 1994-10-14 1996-04-15 Toshihiko Iizuka Bacillus strain and harmful organism controlling agents
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
CN1192239A (zh) 1995-06-02 1998-09-02 先锋高级育种国际公司 α-hordothionin的高甲硫氨酸衍生物
EP0828835A1 (en) 1995-06-02 1998-03-18 Pioneer Hi-Bred International, Inc. HIGH THREONINE DERIVATIVES OF $g(a)-HORDOTHIONIN
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
US5703049A (en) 1996-02-29 1997-12-30 Pioneer Hi-Bred Int'l, Inc. High methionine derivatives of α-hordothionin for pathogen-control
US5850016A (en) 1996-03-20 1998-12-15 Pioneer Hi-Bred International, Inc. Alteration of amino acid compositions in seeds
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
AU3495297A (en) 1996-07-08 1998-02-02 Pioneer Hi-Bred International, Inc. Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs
CA2270289C (en) 1996-11-01 2005-09-27 Pioneer Hi-Bred International, Inc. Proteins with enhanced levels of essential amino acids
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
US6040497A (en) * 1997-04-03 2000-03-21 Dekalb Genetics Corporation Glyphosate resistant maize lines
ATE336580T1 (de) 1998-02-26 2006-09-15 Pioneer Hi Bred Int Mais met-1 promoter
CA2332628C (en) 1998-08-20 2005-04-12 Pioneer Hi-Bred International, Inc. Seed-preferred promoters
IL146062A0 (en) 1999-04-29 2002-07-25 Marlow Foods Ltd Herbicide resistant plants
US6683231B2 (en) 2000-06-02 2004-01-27 E. I. Du Pont De Nemours And Company High level production of p-hydroxybenzoic acid in green plants
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
MXPA03002572A (es) 2000-09-26 2004-08-12 Pioneer Hi Bred Int Secuencias de nucleotidos que intervienen en la fertilidad de los machos y metodo de su uso.
US7517975B2 (en) 2000-09-26 2009-04-14 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
AU8786201A (en) 2000-09-29 2002-04-08 Syngenta Ltd Herbicide resistant plants
US7045684B1 (en) 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
WO2004074443A2 (en) 2003-02-18 2004-09-02 Monsanto Technology Llc Glyphosate resistant class i 5-enolpyruvylshikimate-3-phosphate synthase (epsps)
WO2005049842A2 (en) 2003-11-18 2005-06-02 Bayer Bioscience N.V. Improved targeted dna insertion in plants
US7579529B2 (en) 2004-02-02 2009-08-25 Pioneer Hi-Bred International, Inc. AP2 domain transcription factor ODP2 (ovule development protein 2) and methods of use
US20070016985A1 (en) 2005-07-18 2007-01-18 Pioneer Hi-Bred International, Inc. Particle Preparation for Direct-Delivery Transformation
EP1907553B1 (en) 2005-07-18 2012-08-22 Pioneer Hi-Bred International Inc. Modified frt recombination sites and methods of use
ES2398918T3 (es) 2005-08-26 2013-03-22 Dupont Nutrition Biosciences Aps Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes
EP2484758B1 (en) 2005-10-18 2013-10-02 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
WO2008021974A1 (en) 2006-08-11 2008-02-21 Monsanto Technology Llc Production of high tryptophan maize by chloroplast targeted expression of anthranilate synthase
NZ578090A (en) 2006-12-29 2012-03-30 Dow Agrosciences Llc In vitro methods for the induction and maintenance of plant cell lines as single suspension cells with intact cell walls, and transformation thereof
RU2485180C2 (ru) 2007-06-07 2013-06-20 Эгрикалча Энд Эгри-Фуд Кэнэда Способ трансфекции и трансдукции растительных клеток
EP2568048A1 (en) 2007-06-29 2013-03-13 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
US7919676B2 (en) 2007-08-03 2011-04-05 Pioneer Hi-Bred International, Inc. Msca1 nucleotide sequences impacting plant male fertility and method of using same
WO2009046384A1 (en) 2007-10-05 2009-04-09 Dow Agrosciences Llc Methods for transferring molecular substances into plant cells
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
BRPI0922641B1 (pt) 2008-12-17 2021-10-26 Dow Agrosciences Llc Método de integração de uma ou mais sequências de ácido nucleico exógenas no genoma de uma célula vegetal
KR101701534B1 (ko) 2009-04-07 2017-02-01 다우 아그로사이언시즈 엘엘씨 서열 특이적 뉴클레아제의 나노입자 매개 전달
EP3078748B1 (en) 2009-12-30 2021-08-11 Pioneer Hi-Bred International, Inc. Methods and compositions for the introduction and regulated expression of genes in plants
US8581036B2 (en) 2010-03-31 2013-11-12 Dow Agrosciences, Llc. Plant peptide gamma-zein for delivery of biomolecules into plant cells
MX2012013037A (es) 2010-05-10 2013-07-29 Univ California Composiciones de endorribonucleasa y metodos de uso de las mismas.
WO2011156535A1 (en) 2010-06-09 2011-12-15 E. I. Du Pont De Nemours And Company Regulatory sequences for modulating transgene expression in plants
BR112013024337A2 (pt) 2011-03-23 2017-09-26 Du Pont locus de traço transgênico complexo em uma planta, planta ou semente, método para produzir em uma planta um locus de traço transgênico complexo e construto de expressão
MX2013015174A (es) 2011-06-21 2014-09-22 Pioneer Hi Bred Int Metodos y composiciones para producir plantas esteriles masculinas.
MX346439B (es) 2011-08-22 2017-03-17 Bayer Cropscience Nv Métodos y medios para modificar un genoma vegetal.
EP2776560A2 (en) 2011-11-07 2014-09-17 The University of Western Ontario Endonuclease for genome editing
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
AR089793A1 (es) 2012-01-27 2014-09-17 Du Pont Metodos y composiciones para generar locus de rasgos transgenicos complejos
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
CN104245940A (zh) * 2012-04-23 2014-12-24 拜尔作物科学公司 植物中的靶向基因组工程
RU2014151361A (ru) 2012-05-18 2016-07-10 Пайонир Хай-Бред Интернэшнл, Инк. Последовательности индуцируемого промотора для регулируемой экспрессии и способы применения
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
CN105188767A (zh) 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
US20140096284A1 (en) 2012-10-01 2014-04-03 Iowa State University Research Foundation, Inc. Method for the delivery of molecules lyophilized onto microparticles to plant tissues
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
BR112015009812A2 (pt) 2012-10-31 2017-08-22 Cellectis Método para a inserção genética específica em um genoma de planta, célula de planta transformada e seu uso, planta resistente a herbicidas, kit, vetor, e célula hospedeira
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
MX2015007549A (es) 2012-12-12 2017-01-20 Broad Inst Inc Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias.
SG10201707569YA (en) 2012-12-12 2017-10-30 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
JP6552965B2 (ja) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化
MX2015007574A (es) 2012-12-13 2015-10-22 Dow Agrosciences Llc Gen de precision dirigido a un locus particular en el maiz.
WO2014099744A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
EP2958996B1 (en) 2013-02-25 2019-10-16 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
WO2014164775A1 (en) 2013-03-11 2014-10-09 Pioneer Hi-Bred International, Inc. Methods and compositions to improve the spread of chemical signals in plants
MX2015011985A (es) 2013-03-15 2016-04-07 Univ Minnesota Ingenieria genomica de plantas utilizando sistemas crispr/cas.
KR102210319B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
US20150067922A1 (en) 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
EP3611268A1 (en) 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1236394A (zh) * 1996-11-07 1999-11-24 曾尼卡有限公司 除草剂抗性植物
CN1359423A (zh) * 1999-04-29 2002-07-17 辛甄塔有限公司 抗除草剂植物
CN101878307A (zh) * 2007-09-27 2010-11-03 陶氏益农公司 以5-烯醇式丙酮酰莽草酸-3-磷酸合酶基因为靶的改造锌指蛋白
CN102822350A (zh) * 2010-03-08 2012-12-12 孟山都技术公司 用于植物基因调控的多核苷酸分子
CN103409445A (zh) * 2013-08-01 2013-11-27 刘坚 抗草甘膦基因mtp-smg2-epsps及其在培育抗草甘膦玉米中的应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FAUSER ET AL: "Both CRISPR/Cas-based nucleases and nickases can be used efficiently for genome engineering in Arabidopsis thaliana", 《THE PLANT JOURNAL》 *
LI ET AL: "Multiplex and homologous recombinatio-mediated genome editing in Arabidopsis and Nicotiana benthamiana using guide RNA and Cas9", 《NATURE BIOTECHNOLOGY》 *
PRIESTMAN ET AL: "5-Enolpyruvylshikimate-3-phosphate synthase from Staphylococcus aureus is insensitive to glyphosate", 《FEBS LETTERS》 *
ZHANG ET AL: "The CRISPR/Cas9 system produces specific and homozygous targeted gene editing in rice in one generation", 《PLANT BIOTECHNOLOGY JOURNAL》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108291236A (zh) * 2015-09-30 2018-07-17 先锋国际良种公司 植物epsp合酶和使用方法
CN109117835A (zh) * 2017-06-26 2019-01-01 佳能株式会社 图像处理装置和方法
CN109117835B (zh) * 2017-06-26 2022-10-14 佳能株式会社 图像处理装置和方法
CN111801417A (zh) * 2017-12-14 2020-10-20 克里斯珀医疗股份公司 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途
CN111868247A (zh) * 2018-03-12 2020-10-30 先锋国际良种公司 用于植物转化的方法
CN112522298A (zh) * 2019-09-19 2021-03-19 中国农业大学 用于植物基因编辑的成套载体及其应用
CN112522298B (zh) * 2019-09-19 2022-08-09 中国农业大学 用于植物基因编辑的成套载体及其应用
CN112779266A (zh) * 2019-11-06 2021-05-11 青岛清原化合物有限公司 在生物体内创制新基因的方法及应用
CN115243711A (zh) * 2020-01-09 2022-10-25 先锋国际良种公司 两步基因交换
CN115697043A (zh) * 2020-05-13 2023-02-03 纽海姆有限公司 通过靶向诱变获得突变植物的方法

Also Published As

Publication number Publication date
CA2954626A1 (en) 2016-01-14
MX2017000422A (es) 2017-05-01
WO2016007347A1 (en) 2016-01-14
BR112017000482A2 (pt) 2017-11-07
US20170306349A1 (en) 2017-10-26
AU2015288157A1 (en) 2017-01-19
US10676754B2 (en) 2020-06-09
EP3166391A1 (en) 2017-05-17

Similar Documents

Publication Publication Date Title
CN106687594A (zh) 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
AU2020264325A1 (en) Plant genome modification using guide rna/cas endonuclease systems and methods of use
KR20180002852A (ko) 가이드 RNA/Cas 엔도뉴클레아제 시스템
CN111263810A (zh) 使用多核苷酸指导的核酸内切酶的细胞器基因组修饰
KR101303110B1 (ko) 옥수수 이벤트 mir604
CN107406858A (zh) 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法
CN115175556B (zh) 与大豆中锈病抗性相关联的新颖的遗传基因座
KR20190016970A (ko) 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도
KR20200128129A (ko) 식물 형질전환을 위한 방법
CN106795524A (zh) 使用向导rna/cas内切核酸酶系统改变农学性状及其使用方法
CA2999347C (en) Lowering saturated fatty acid content of plant seeds
CN107567499A (zh) 大豆u6核小rna基因启动子及其在植物小rna基因的组成型表达中的用途
CN114829600A (zh) 植物mad7核酸酶及其扩大的pam识别能力
CN111542610A (zh) 精确基因组编辑的新策略
CN111511199A (zh) 改良蓝色糊粉及其他分离系统
CN111433363A (zh) 非生物胁迫耐性提高的植物和提高植物非生物胁迫耐性的多聚核苷酸及方法
CN111295447A (zh) 玉米优良事件mzir098
CN110818784B (zh) 水稻基因OsATL15在调节农药的吸收转运中的应用
CN114656546B (zh) 孤雌生殖单倍体诱导基因及其应用
KR101760932B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
CN115867565A (zh) 用于改善对大豆锈病的抗性的方法
KR101760934B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR20170008711A (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
KR101760933B1 (ko) 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법
CN117255859A (zh) 具有同源指导rna识别位点的可去除植物转基因基因座

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170517