CN113337533A - 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物 - Google Patents

用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物 Download PDF

Info

Publication number
CN113337533A
CN113337533A CN202110597118.7A CN202110597118A CN113337533A CN 113337533 A CN113337533 A CN 113337533A CN 202110597118 A CN202110597118 A CN 202110597118A CN 113337533 A CN113337533 A CN 113337533A
Authority
CN
China
Prior art keywords
nuclease
seq
nucleic acid
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110597118.7A
Other languages
English (en)
Inventor
陈钟颖
金明局
钟衡
辜唯宁
蒋亚平
阙求登
M-D·奇尔顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN113337533A publication Critical patent/CN113337533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • C12N15/8207Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated by mechanical means, e.g. microinjection, particle bombardment, silicon whiskers

Abstract

本发明涉及用于修饰植物细胞基因组中的靶位点的方法和组合物。此类修饰包括转基因的整合和突变。本发明还涉及用于鉴定和富集包括经修饰的靶位点的细胞的方法和组合物。

Description

用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和 组合物
本申请是申请日为2015年12月18日、申请号为201580070582.3、发明名称为“用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物”的发明专利申请的分案申请。
相关申请
本申请要求2014年12月23日提交的临时申请62/096,442的权益,并通过引用以其全文结合在此。
序列表
提供ASCII文本格式的序列表作为纸质副本的替代,该序列表是根据37 C.F.R.§1.821提交的,名称为“80484_ST25.txt”,大小为409千字节,于2015年12月15日生成并经由EFS-Web提交。这个序列表由此通过引用以其披露内容结合到本说明书中。
发明领域
本发明涉及用于修饰植物细胞基因组中的靶位点的方法和组合物。此类修饰包括转基因整合和突变。本发明进一步涉及以下方法和组合物,这些方法和组合物用于鉴定和富集具有整合在细胞基因组内的靶位点处的一个或多个转基因的细胞,以及用于鉴定和富集包括在细胞基因组内的靶位点处引入的、而不整合到编码核酸酶的异源核苷酸序列的基因组中的突变的细胞,该核酸酶用于在基因组内的靶位点处的位点特异性切割。
发明背景
在基因组的靶向修饰领域中已经取得的最新进展是使得常规的靶向修饰可以很快成为可能。针对开发通过位点特异性核酸酶(例如,锌指核酸酶(ZFN)、大范围核酸酶、转录激活子样效应子核酸酶(TALENS)以及具有工程化的crRNA/tracr RNA的成簇规律间隔短回文重复/CRISPR相关的核酸酶(CRISPR/Cas))靶向和切割基因组DNA的方法和组合物来诱导靶向诱变,诱导细胞DNA序列的靶向缺失,并促进外源供体DNA多核苷酸(如,转基因)在预定的基因组基因座内的靶向重组在过去几年中已经取得了显著的进展。这个预定的基因组基因座是不明显的。由于高度重复的核苷酸序列、甲基化和导致非常高或非常低水平的重组或在引入的转基因上的基因表达差的其他特征,针对例如转基因插入,基因组中的许多位点是非理想的。因此,本领域需要鉴定用于靶向修饰(如转基因插入)的基因组内的理想靶位点。
一旦靶位点已经被用于靶向修饰,就需要确定是否成功创建了所希望的靶向修饰。筛选细胞中靶向基因组修饰的现有方法主要基于聚合酶链式反应(PCR)方案、核酸测序和Southern分析。在PCR扩增的情况下,由于PCR引物设置的复杂性和PCR扩增的固有模糊性,由于基因组重排和基因组倍性造成的复杂性,处理特定位点处的基因插入或修饰的复杂性的筛选过程是低效的。PCR的一些问题包括:1)由于基因组的倍性,一个拷贝和两个拷贝插入之间没有明确的区别;2)对复杂引物设计和大批引物组合的需求,以处理在一个或多个特定位点处的基因插入或修饰的复杂性;和3)凝胶电泳的低通量和扩增带的模糊性。虽然随后的测序可以帮助鉴定PCR扩增产物的特征,但是大规模测序工作和对大样品数量的结果进行解释存在着问题。需要进一步的基因分离分析来分离纯合子代用于进一步筛选。这些步骤需要大规模的操作来筛选商业作物以便捕获小于2%的潜在候选物,并且温室中植物的库存规模需要商业规模的空间和操作成本,直到植物生长阶段足够成熟来进行Southern分析。
本发明通过提供玉蜀黍基因组的理想靶位点解决了本领域内的这些缺点。本发明还提供了一种更具战略性和有效性的方法来鉴定和富集具有靶向基因组插入或靶向基因组突变的细胞,该方法在筛选过程的非常早期阶段以高精度降低了候选植物的数量,避免了大规模测序工作并且减少了植物维护的温室操作成本。
发明概述
在一方面,本发明提供了将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法,该方法包括将以下各项引入玉蜀黍细胞中:a)包括至少约100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述连续核苷酸与SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列中的靶位点具有至少约90%一致性;和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的连续核苷酸的SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此该转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点处。本发明还提供了一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代包括整合到该玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过上述方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过所述的方法生产的、包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。
在一个另外的方面,本发明提供了一种富集细胞的方法,该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因,该方法包括:a)将以下各项引入多个细胞中:i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;和ii)编码以下核酸酶的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行;b)培养(a)的细胞以生产细胞系或组织;c)从(b)的细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G,其中测定T和G分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于靶位点的核苷酸序列,距离用于进行测定T的核酸酶切割位点至少5个碱基对,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列;e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数;以及f)富集在测定T中相对于参考具有减少的拷贝数并且对于测定G,具有大于零的拷贝数的细胞系或组织,从而富集包括插入到细胞基因组中的核酸酶切割位点的转基因的该细胞。
此外,本发明提供了一种鉴定细胞的方法,该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因,该方法包括:a)将以下各项引入多个细胞中:i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;和ii)编码以下核酸酶的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行;b)培养(a)的细胞以生产细胞系或组织;c)从(b)的细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G,其中测定T和G分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于靶位点的核苷酸序列,距离用于进行测定T的核酸酶切割位点至少五个碱基对,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列;e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数;以及f)鉴定在测定T中相对于参考具有减少的拷贝数并且对于测定G,具有大于零的拷贝数的细胞系或组织,从而鉴定包括插入到细胞基因组中的核酸酶切割位点的转基因的细胞。本发明还提供了通过所述的方法富集或鉴定的细胞系或组织,并且进一步提供了源自该细胞系或组织的植物、植物部分或其子代。
在本发明的另外方面,提供了一种富集细胞的方法,该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合,该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将一种核酸分子引入多个细胞中,该核酸分子包括编码以下核酸酶的异源序列,该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中;b)培养(a)的多个细胞以生产细胞系或组织;c)从(b)的细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2,其中这些测定分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列;e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数;以及f)富集针对测定1相对于参考具有减少的拷贝数并且对于测定2,具有等于零的拷贝数的细胞系或组织,从而富集以下细胞,该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。
作为本发明的一方面还提供了一种鉴定细胞的方法,该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合,该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将一种核酸分子引入多个细胞中,该核酸分子包括编码以下核酸酶的异源序列,该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中;b)培养(a)的多个细胞以生产细胞系或组织;c)从(b)的细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2,其中这些测定分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列;e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数;以及f)鉴定针对测定1相对于参考具有减少的拷贝数并且对于测定2,具有等于零的拷贝数的细胞系或组织,从而鉴定以下细胞,该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。本发明还提供了通过所述的方法富集或鉴定的细胞系或组织,并且进一步提供了源自该细胞系或组织的植物、植物部分或其子代。
在另外方面,本发明提供了一种生产植物、植物部分或其子代的方法,这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将核酸分子引入植物细胞中,该核酸分子包括编码以下核酸酶的异源核苷酸序列,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在植物细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中;并且b)从(a)的植物细胞再生植物、植物部分或其子代。本发明进一步提供了通过所述的方法生产的植物、植物部分或其子代。
本发明还提供了用于修饰植物细胞基因组中的靶位点的方法,该方法包括:a)向植物细胞中引入第一核酸和第二核酸分子,该第一核酸包括至少100个连续核苷酸并且进一步包括转基因,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;并且b)该第二核酸分子编码以下核酸酶,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。
本发明还提供了用于生产玉蜀黍植物、植物部分或其子代的方法,这些玉蜀黍植物、植物部分或其子代包括植物细胞基因组中的靶位点处的修饰,该方法包括:a)向植物细胞中引入第一核酸和第二核酸分子,该第一核酸包括至少100个连续核苷酸并且进一步包括转基因,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;b)该第二核酸分子编码以下核酸酶,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行;并且c)从(a)的植物细胞再生植物、植物部分或其子代。本发明进一步提供了通过所述的方法生产的植物、植物部分或其子代。
本发明还提供了将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点中的方法,该方法包括将以下各项引入事件MIR604玉蜀黍细胞中:a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90%一致性,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQID NO:139;和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90%一致性的核苷酸序列的相邻的基因组核酸酶切割位点处用于定点切割,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQ ID NO:139,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过所述方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过所述的方法生产的、包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。
附图简要说明
图1.显示MIR604插入位点侧翼序列的示意图。MIR604RBFS1和MIR604LBFS1之间的88个碱基对序列在T-DNA整合期间在MIR604事件中被删除。该MIR604插入位点不包含事件MIR604转基因。
图2.靶向插入到MIR604插入位点安全港基因座以及用两个引物对:P1(FE4706)/P2(FE4705)和P3(FE4708)/P4(FE4707)鉴定潜在的靶向整合事件的PCR反应的示意图。P1(FE4706)和P4(FE4707)仅与存在于供体和靶区域的同源臂之外的染色体区域结合,而P2(FE4705)和P3(FE4708)仅与供体分子结合。引物对P1(FE4706)和P2(FE4705)产生2.87Kbp的片段,并且引物对P3(FE4708)/和P4(FE4707)仅在靶向插入存在于安全港基因座#1(MIR604插入位点)时扩增2.0Kbp的片段。在Southern DNA印迹分析(图5)中使用的Bsu36I限制性位点和探针的近似位置在靶向插入事件中表明。
图3.PCR筛选测定的实例如图2中所概述。在左图中,用P3(FE4708)/和P4(FE4707)进行PCR,该PCR从2个事件(泳道25,MZET141320A250A,和泳道42,事件MZET141606A097A)扩增2.0Kbp的片段。在右图中,用P1(FE4706)和P2(FE4705)对进行PCR,其仅从1个事件(泳道25,MZET141320A250A)产生2.87Kbp的片段。
图4.用包含GUUS重复分子内重组底物的载体用MIR604FR1靶序列(5’-TACACGTACT AATCG TGCTT CACGC ACAGG CACAG CACGT AGTAG ACAGG A-3’,SEQ ID NO:66)连同单个TALEN载体(F1,cTNmir604Fw1-01或R2,cTNmir604Rv2-01)或一对TALEN基因(FR1,cTNmir604Fw1-01和cTNmir604Rv1-01)在玉蜀黍泛素启动子(prZmUbi1-10)的控制下或没有TALEN(ctl,空白对照)轰击玉蜀黍未成熟胚胎中的GUS斑点数。cTNmir604Rv2-01不识别MIR604FR1序列并导致GUS活性的背景水平(R2,阴性对照)。
图5.在安全港基因座#1(MIR604插入位点)处的靶向插入事件的DNA印迹分析。DNA探针1:针对侧翼天然基因组序列;探针2:针对prCMP的探针;探头3:针对cPMI的探针(针对示意图中的探针位置的参见图2)。泳道1:DIG标记的标记物;泳道2:野生型玉蜀黍转化品系NP2222;泳道3:掺有21942、用HindIII消化的NP2222(释放8553bp的片段);泳道4:MZET134207E056A;泳道5:MZET134300A679A;泳道6:MZET134505A104A;泳道7:MZET141322A015A;泳道8:MZET141322B143A;将泳道2至8中的所有玉蜀黍基因组DNA用Bsu36I限制性酶消化。注意:探针1还与基因组其他部分中的同源序列弱杂交。WT安全港基因座具有显性的17.5Kb带,而靶向插入事件具有增加到28Kb的片段大小。对于探针2和3,该28Kb Bsu36I带通过同源重组包含供体DNA序列的靶向插入。在泳道7中,该事件可能包含重排供体DNA分子的插入。
图6.示意图显示,在具有通过用定点核酸酶切割产生的靶序列(M)中的突变的植物中靶序列拷贝数的减少。
图7.MIR604插入位点中的靶序列的Taqman测定探针设计的示意图和关于靶向突变的Taqman测定结果的解释。
图8A-B.基于靶序列的拷贝数减少来富集潜在靶向插入事件的策略。(A)作为靶向插入实验中靶基因座处的靶向核酸酶切割的结果,潜在类型的突变和靶向插入的示意图。M是定点核酸酶切割位点;T是位于在靶基因座区域内距离M至少5个核苷酸的序列,并且它应该尽可能远离M但在被靶向插入替换的区域内。然而,T可以位于与针对M的测定相同的扩增子内。G是转基因序列(感兴趣的基因(GOI))的测定靶标。(B)使用实时qPCR测定,具有如(A)所示的靶位点中不同种类的突变或插入的植物中不同测定的拷贝数得分记录。
图9.MIR604转基因事件T-DNA插入和侧翼区的示意图。MIR604 RB FS:T-DNA右边界侧翼的玉蜀黍基因组区域;MIR604 LB FS:T-DNA左边界侧翼的玉蜀黍基因组区域;prUbi1:玉蜀黍泛素-1启动子;cPMI-01:PMI编码序列;tNOS:胭脂碱合酶终止子;mCry3A:来自苏云金芽孢杆菌的Cry3A基因序列(mCry3A)的合成形式。(美国专利号7,897,748)
图10.杀虫基因(IC)表达盒(Exp.Cass.)和包括选择性标记物ZmEPSPS(EPSPSExp.Cass.)的表达盒从供体载体22872靶向插入MIR604转基因基因座(图9),该靶向插入是由载体22840表达的TALEN介导的。一对TALEN由22840表达,并切割cPMI靶序列。t:tNOS-05;LBFS:T-DNA左边界侧翼的玉蜀黍基因组序列;RBFS:T-DNA右边界侧翼的玉蜀黍基因组序列;P1(FE4796):SEQ ID NO:127;P2(FE4793):SEQ ID NO:128;P3(FE35035):SEQ ID NO:132;P4(FE35034):SEQ ID NO:131。
图11.通过定点核酸酶介导的靶向插入到MIR604转基因基因座中的转基因表达盒(图9),以替换整个PMI标记基因盒。
图12.通过定点核酸酶介导的靶向插入到MIR604转基因基因座中的供体转基因表达盒(图9),以替换整个MIR604 T-DNA插入片段。
在序列表中的序列的简要说明
SEQ ID NO:1是来自玉蜀黍品系A188的MIR604插入位点序列的核苷酸序列。这个MIR604插入位点不具有事件MIR604转基因。
SEQ ID NO:2是对应于A188 MIR604插入位点及其侧翼序列的玉蜀黍良种品系NP2222基因组序列。
SEQ ID NO:3-27是以下核苷酸序列,这些核苷酸序列是邻近MIR604插入位点的用于Cas9-介导的切割的潜在靶序列。
SEQ ID NO:28是玉蜀黍基因组靶序列MIR604FR2。
SEQ ID NO:29是编码来自酿脓链球菌SF370的II型Cas9基因(用玉蜀黍优选密码子优化)的核苷酸序列。
SEQ ID NO:30是包括修饰的Cas9蛋白的氨基酸序列。
SEQ ID NO:31-34是可用于引导MIR604插入位点的Cas9切割的核苷酸序列。
SEQ ID NO:35是编码tracRNA支架和PolIII终止序列的核苷酸序列。
SEQ ID NO:36是编码单个引导RNA(sgRNA)的核苷酸序列。
SEQ ID NO:37是包括表达盒的核苷酸序列,该表达盒包括prOsU3和SEQ ID NO:36的sgRNA的编码序列。
SEQ ID NO:38是包括xJHAX-03的核苷酸序列。
SEQ ID NO:39是包括xJHAX-04的核苷酸序列。
SEQ ID NO:40-65是基于NP2222基因组序列(SEQ ID NO:2)的、选择为TALEN靶序列的核苷酸序列。
SEQ ID NO:66是包括TALEN靶序列MIR604FR1的核苷酸序列。
SEQ ID NO:67是包括TALEN靶序列MIR604FR2的核苷酸序列。
SEQ ID NO:68是识别靶序列SEQ ID NO:42的人工核酸酶cTNmir604Fw1-01的氨基酸序列。
SEQ ID NO:69是识别靶序列SEQ ID NO:42的人工核酸酶cTNmir604Fw1-02的氨基酸序列。
SEQ ID NO:70是识别靶序列SEQ ID NO:42的人工核酸酶cTNmirFw1-03的氨基酸序列。
SEQ ID NO:71是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-01的氨基酸序列。
SEQ ID NO:72是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-02的氨基酸序列。
SEQ ID NO:73是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-03的氨基酸序列。
SEQ ID NO:74是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-01的氨基酸序列。
SEQ ID NO:75是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-02的氨基酸序列。
SEQ ID NO:76是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-03的氨基酸序列。
SEQ ID NO:77是识别靶序列SEQ ID NO:54的人工核酸酶cTNmire604RV2-01的氨基酸序列。
SEQ ID NO:78是识别靶序列SEQ ID NO:54的人工核酸酶cTNmir604RV2-02的氨基酸序列。
SEQ ID NO:79是识别靶序列SEQ ID NO:54的人工核酸酶cTNmir604Rv2-03的氨基酸序列。
SEQ ID NO:80是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-05的氨基酸序列。
SEQ ID NO:81是识别靶序列SEQ ID NO:65的人工核酸酶cTNmir604Rv2-04的氨基酸序列。
SEQ ID NO:82是编码全长人工核酸酶分子cTNmir604Fw1-01(SEQ ID NO:68)的核苷酸序列。
SEQ ID NO:83是编码截短的人工核酸酶分子cTNmir604Fw1-03(SEQ ID NO:70)的核苷酸序列。
SEQ ID NO:84是编码全长人工核酸酶分子cTNmir604Rv1-01(SEQ ID NO:71)的核苷酸序列。
SEQ ID NO:85是编码截短的人工核酸酶分子cTNmir604Rv1-03(SEQ ID NO:72)的核苷酸序列。
SEQ ID NO:86是编码全长人工核酸酶分子cTNmir604Fw2-01(SEQ ID NO:72)的核苷酸序列。
SEQ ID NO:87是编码截短的人工核酸酶分子cTNmir604Fw2-03(SEQ ID NO:73)的核苷酸序列。
SEQ ID NO:88是编码截短的人工核酸酶分子cTNmir604Fw2-05(SEQ ID NO:80)的核苷酸序列。
SEQ ID NO:89是编码全长人工核酸酶分子cTNmir604Rv2-01(SEQ ID NO:77)的核苷酸序列。
SEQ ID NO:90是编码截短的人工核酸酶分子cTNmir604Rv2-03(SEQ ID NO:79)的核苷酸序列。
SEQ ID NO:91是编码截短的人工核酸酶分子cTNmir604Rv2-04(SEQ ID NO:81)的核苷酸序列。
SEQ ID NO:92-97是可用于使用qPCR用于检测SEQ ID NO:67靶序列内的突变的核苷酸序列。
SEQ ID NO:98是包括编码磷酸甘露糖异构酶的基因(cPMI-01)的核苷酸序列。
SEQ ID NO:99-101是包括由TALEN介导的基因组修饰的PMI靶序列的核苷酸序列。
SEQ ID NO:102-107是包括SEQ ID NO:98内的TALEN序列靶标的核苷酸序列。
SEQ ID NO:108是识别SEQ ID NO:102的人工核酸酶蛋白质TLN_PMIFW1a的氨基酸序列。
SEQ ID NO:109是识别SEQ ID NO:103的人工核酸酶蛋白质TLN_PMIRV1a的氨基酸序列。
SEQ ID NO:110是识别SEQ ID NO:106的人工核酸酶蛋白质TLN_PMIFW3的氨基酸序列。
SEQ ID NO:111是识别SEQ ID NO:107的人工核酸酶蛋白质TLN_PMIRV3的氨基酸序列。
SEQ ID NO:112是编码人工核酸酶蛋白质TLN_PMIFW1a的核苷酸序列。
SEQ ID NO:113是编码人工核酸酶蛋白质TLN_PMIRV1a的核苷酸序列。
SEQ ID NO:114是编码人工核酸酶蛋白质TLN_PMIFW3的核苷酸序列。
SEQ ID NO:115是编码人工核酸酶蛋白质TLN_PMIRV3的核苷酸序列。
SEQ ID NO:116-118是包括人工核酸酶靶序列的核苷酸序列。
SEQ ID NO:119是识别SEQ ID NO:117的人工核酸酶蛋白质TLN_rPMIFW1-01的氨基酸序列。
SEQ ID NO:120是识别SEQ ID NO:118的人工核酸酶蛋白质TLN_rPMIRv1-01的氨基酸序列。
SEQ ID NO:121是识别SEQ ID NO:117的人工核酸酶蛋白质TLN_rPMIFw1-02的氨基酸序列。
SEQ ID NO:122是识别SEQ ID NO:118的人工核酸酶蛋白质TLN_rPMIRv1-02的氨基酸序列。
SEQ ID NO:123是编码人工核酸酶蛋白质TLN_rPMIFW1-01的核苷酸序列。
SEQ ID NO:124是编码人工核酸酶蛋白质TLN_rPMIRv1-01的核苷酸序列。
SEQ ID NO:125是编码人工核酸酶蛋白质TLN_rPMIFW1-02的核苷酸序列。
SEQ ID NO:126是编码人工核酸酶蛋白质TLN_rPMIRv1-02的核苷酸序列。
SEQ ID NO:127-132是可用于检测靶向整合的核苷酸序列。
SEQ ID NO:133是存在于事件MIR604转基因植物的T-DNA插入片段中的PMI表达盒(prZmUbi1-cPMI-tNOS)的核苷酸序列(图9)。
SEQ ID NO:134是存在于事件MIR604中的T-DNA插入片段的以及左右边界区域的核苷酸序列(图9)。
SEQ ID NO:135是事件MIR604转基因基因座的核苷酸序列,该事件MIR604转基因基因座包括整个T-DNA插入片段和侧翼基因组DNA区域(包括RBFS和LBFS)(图9)。
SEQ ID NO:136是邻近MIR604 T-DNA插入右边界(RB)区域的B73玉蜀黍基因组区域的核苷酸序列(图9中的RBFS)。
SEQ ID NO:137是邻近MIR604 T-DNA插入左边界(LB)区域的B73玉蜀黍基因组区域的核苷酸序列(图9中的LBFS)。
SEQ ID NO:138是对应于邻近包括RBFS的RB区域的B73 MIR604插入位点基因座序列的优良玉蜀黍品系NP2222基因组序列的核苷酸序列(图9)。
SEQ ID NO:139是对应于邻近包括LBFS的LB区域的B73 MIR604 T-DNA插入位点基因座序列的优良玉蜀黍品系NP2222基因组序列的核苷酸序列(图9)。
发明详细说明
本说明不旨在是一个本发明以其而实施的所有不同方式,或可以加入本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以结合入其他实施例中,并且关于一个具体实施例所说明的特征可以从那个实施例删除。另外,鉴于本披露内容,对在此建议的不同实施例的众多变体以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些具体实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,在此所使用的全部技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的意思。在此的本发明的说明中使用的术语仅仅是出于描述具体实施例的目的并且不旨在限制本发明。在此提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全文结合在此。
提供下面的定义和方法以便更好地定义本发明并且在本发明的实践中指导本领域的普通技术人员。除非另外说明,在此使用的术语应该根据相关领域的那些一般技术人员的常规用法来理解。分子生物学中的一般术语的定义也可在Rieger等人,Glossary of Genetics:Classical and Molecular[遗传学词汇表:标准和分子],第5版,Springer-Verlag:New York[施普林格出版社:纽约],1994中找到。
扩增方法,如聚合酶链式反应(PCR)法(例如,TaqMan)的“精确度”意指测试结果与接受的参考值之间的一致的接近度。
如在此所使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核苷酸分子的多个拷贝或与该核酸分子互补的多个拷贝。参见例如Diagnostic MolecularMicrobiology:Principles and Applications[诊断分子微生物学:原理与应用],D.H.Persing等人编著,American Society for Microbiology[美国微生物学会],华盛顿哥伦比亚特区(1993)。扩增产物被称为扩增子。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。在一些实施例中,该RNA随后在生物体内被翻译以产生蛋白质。
“线性系数(R2)”是通过线性回归分析获得的标准曲线的相关系数。
如在此所使用的“动态范围”意指本发明的方法以可接受水平的准确度和精度以线性方式进行的DNA浓度的范围。
如在此所使用的“检测试剂盒”是指用于在样品中检测来自感兴趣事件的靶DNA的试剂盒,该试剂盒包括本发明的核酸探针和引物(其将在最佳条件下特异性处理至靶DNA序列)以及能够进行核酸杂交和/或扩增方法所需的其他材料。
如在此所使用的术语转基因的“事件”是指一种通过用异源DNA(例如,包括一个或多个感兴趣的基因(例如,转基因)的表达盒)转化和再生单个植物细胞而产生的重组植物。术语“事件”是指包括异源DNA的原始转化体和/或该转化体的子代。术语“事件”也是指通过该转化体和另一种品系之间进行有性远交(outcross)而产生的子代。即使在重复回交至一个轮回亲本后,来自该转化的亲本的插入DNA和侧翼DNA存在于在该杂交子代的同样的染色体位置。通常,植物组织的转化产生多个事件,每个上述事件代表DNA构建体插入至植物细胞的基因组中的不同位置中。基于转基因或其他期望的特征的表达,选择特定的事件。因而,如在此所使用的“事件MIR604”、“MIR604”或“MIR604事件”意指原始的MIR604转化体和/或MIR604转化体的子代(美国专利号7,361,813;7,897,748;8,354,519和8,884,102,通过引用结合在此)。
事件MIR604的插入位点具有许多特征,这些特征使其成为用于基因组修饰的靶位点的良好候选物。这些特征包括:该位点不会断开天然基因,该位点不在核苷酸序列的高度重复区域中,该位点的核苷酸序列不在玉蜀黍基因组的其他地方显著重复,并且已知在该位点引入的转基因在最初转化的植物中、在已经引入MIR604的其他玉蜀黍品种中以及在事件MIR604植物的子代中都具有多代的良好的表达水平。此外,事件MIR604作为商业产品和在成功的商用级育种计划(其中事件MIR604被引入到至少几十个玉蜀黍品种,并且在多种环境条件下表现出转基因的优异表达)中的成功表明该事件MIR604插入位点是靶向插入的良好候选物。
如在此所使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列表达的核酸分子,该核酸分子包括可操作地连接至感兴趣的核苷酸序列(典型地是编码区)的启动子,该核苷酸序列可操作地连接至终止信号。它还典型地包括适当翻译该核苷酸序列所需要的序列。该编码区通常对感兴趣的蛋白质进行编码,但是还可以在正义或反义方向上对感兴趣的功能性RNA(例如反义RNA或非翻译RNA)进行编码。表达盒还可以包含在引导感兴趣的核苷酸序列表达中不需要的序列,但是其因为用于将表达盒从表达载体移除的方便的限制性位点而存在。包括该感兴趣的核苷酸序列的表达盒可以是嵌合的,意味着至少一个它的组分相对于至少一个它的其他组分是异源的。该表达盒还可以是一种天然存在的表达盒,但已经是以对于异源表达有用的重组形式而获得的。然而,通常表达盒相对于宿主来说是异源的,即表达盒的特定核酸序列在宿主细胞中不是天然存在的,并且必须已经通过本领域已知的转化方法引入至宿主细胞或宿主细胞的祖先中。在该表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下,该启动子只有当该宿主细胞暴露于一些特殊的外界刺激时才引发转录。在多细胞生物体(如植物)的情况下,该启动子也可以特异于特定组织、或器官、或者发育阶段。当被转化进植物中时,表达盒或其片段也可被称为“插入的序列”或者“插入序列”。
“基因”是位于基因组内的限定区域,并且除了前述的编码核酸序列之外,它还包括其他负责控制该编码部分的表达(也就是转录和翻译)的主要调节性核酸序列。一个基因还可以包括其他5'和3'未翻译序列和终止序列。其他可能存在的元件是,例如,内含子。
“感兴趣的基因”是指当转移至植物时,在该植物上赋予所希望的特征(如抗生素抗性、病毒抗性、虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁殖能力)的任何基因。“感兴趣的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。
如在此所使用的“基因型”是由亲本植物遗传的遗传物质,并不是所有这些遗传物质都必然地表达在后代植物中。通过举例的方式,MIR604基因型是指转化入植物基因组中的异源遗传物质以及插入序列侧翼的遗传物质。
如在此所使用的,“异源的”是指与其引入的宿主细胞天然不相关的核酸分子或核苷酸序列,该序列来源于另一种物种或来自相同物种或生物体,但是从其原始形式或主要在细胞中表达的形式进行了修饰,包括天然存在的核酸序列的非天然存在的多个拷贝。。因此,源自与将其引入的细胞所属的生物体或物种不同的生物体或物种的核苷酸序列相对于那个细胞或细胞的子代而言是异源的。另外,异源核苷酸序列包括一种核苷酸序列,该核苷酸序列源自并插入相同的天然原始细胞类型,但是却以非天然状态存在,例如,以不同拷贝数目存在,和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。核酸序列还可以异源于与其相关的其他核酸序列,例如在核酸构建体中,例如像表达载体。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,所述调节元件和/或编码序列不与那个特定启动子相关地天然存在,即它们与该启动子是异源的。
“同源”核酸序列是与其被引入的宿主细胞天然相关的核酸序列。同源核酸序列还可以与其他核酸序列天然相关的核酸序列,这些其他核酸序列可以例如存在于核酸构建体中。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,所述调节元件和/或编码序列与那个特定启动子相关地天然存在,即它们与该启动子是同源的。
“可操作地连接”是指在一个单个核酸序列上核酸序列的关联,这样使得一个的功能影响另一个的功能。例如,当一个启动子能够影响编码序列或者功能RNA的表达时(即,该编码序列或功能RNA处于该启动子的转录控制之下),则该启动子与该编码序列或者功能RNA是可操作地连接的。正义方向或者反义方向的编码序列能够与调节序列可操作地连接。
如在此所使用的“引物”是分离的核酸,它们通过核酸杂交被退火为互补靶DNA链,以在该引物与该靶DNA链之间形成杂交,然后通过一种聚合酶(如DNA聚合酶)沿着该靶DNA链延长。引物对或引物组可以用于核酸分子的扩增,例如通过聚合酶链式反应(PCR)或者其他核酸扩增方法。
“探针”是互补于靶核酸分子的一部分的分离的核酸分子,并且通常用于检测和/或定量靶核酸分子。因此,在一些实施例中,探针可以是可检测部分或报道基因附接到的分离的核酸分子,如放射性同位素、配体、化学发光剂、荧光剂或酶。根据本发明的探针不仅可以包括脱氧核糖核酸或核糖核酸,还包括与靶核酸序列特异性结合并且可以用于检测该靶核酸序列的存在或定量该靶核酸序列的量的聚酰胺类以及其他探针材料。
设计TaqMan探针,使得其在由特定引物组扩增的DNA区域内退火。由于Taq聚合酶延伸引物并从互补链的3'至5'的单链模板合成新生链,所以聚合酶的5'至3'外切核酸酶通过探针延伸新生链,并且因此降解已经退火到模板的探针。探针的降解从其中释放荧光团,并打破了与淬灭剂的紧密相接,从而减轻了淬灭效应并允许荧光团的荧光。因此,在定量PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。
引物和探针的长度一般在5和100个核苷酸或更多核苷酸之间。在一些实施例中,引物和探针的长度可以为至少20个核苷酸或更多,或至少25个核苷酸或更多,或长度至少30个核苷酸或更多。这些引物和探针在本领域已知的最佳杂交条件下与靶序列特异性杂交。根据本发明的引物和探针可以具有与该靶序列互补的完整序列,虽然与该靶序列不同并保留与该靶序列杂交的能力的探针可通过根据本发明的常规方法进行设计。
用于制备和使用探针和引物的方法描述于例如Molecular Cloning:ALaboratory Manual[分子克隆:实验室手册],第二版,第1-3卷,Sambrook等人编辑,Cold SpringHarbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约州,1989中。PCR引物对可以源自已知序列,例如通过使用旨在用于该目的的计算机程序。
聚合酶链式反应(PCR)是一种用于“扩增”特定DNA片段的技术。为了进行PCR,必须知道待复制的DNA分子的核苷酸序列的至少一部分。通常,使用与待扩增的DNA的每条链的3'端处的核苷酸序列(已知序列)互补(例如,基本互补或完全互补)的引物或短寡核苷酸。将DNA样品加热以分离其链,并与这些引物混合。这些引物与其DNA样品中的互补序列杂交。使用原始DNA链作为模板开始合成(5'至3'方向)。该反应混合物必须包含全部四种脱氧核苷酸三磷酸(dATP、dCTP、dGTP、dTTP)和DNA聚合酶。聚合继续进行,直到每条新合成的链已经进行得足够远以包含被另一个引物识别的序列。一旦发生这种情况,就会产生与原始分子一致的两个DNA分子。将这两个分子加热以分离其链,并重复该过程。每个循环使DNA分子的数量加倍。使用自动化设备,每个循环的复制可以在不到5分钟内完成。30个循环后,以DNA单分子开始的扩增已经超过10亿个拷贝(230=1.02x109)。
寡核苷酸引物对的寡核苷酸互补于位于相对DNA链上和待扩增区域侧翼的DNA序列。退火引物与新合成的DNA链杂交。第一个扩增循环将导致两条新的DNA链,其5’端通过寡核苷酸引物的位置固定,但其3’端是可变的(‘不规则的’3’端)。两条新链可以依次充当用于合成所希望的长度的互补链的模板(5’端由引物定义并且3’端是固定的,因为合成不能超过相反引物的末端)。几个循环后,所希望的固定长度产品开始占主导地位。
定量聚合酶链式反应(qPCR)(也称为实时聚合酶链式反应)实时监测来自PCR反应的DNA产物的积累。qPCR是基于聚合酶链式反应(PCR)的分子生物学实验室技术,它用于扩增并且同时定量靶DNA分子。可以在PCR中扩增和检测特定序列的甚至一个拷贝。PCR反应以指数方式生成DNA模板的拷贝。这导致起始靶序列的量和在任何特定循环下累积的PCR产物的量之间的定量关系。由于与模板、试剂限制或焦磷酸盐分子的积累一起发现的聚合酶反应的抑制剂,所以PCR反应最终停止以指数速率生成模板(即平台期),使得PCR产物的终点定量不可靠。因此,重复的反应可以生成可变量的PCR产物。只有在PCR反应的指数期期间才有可能回推以便确定模板序列的起始量。PCR产物积累时的测量(即实时定量PCR)允许在反应的指数期进行定量,并且因此消除与常规PCR相关的变异性。在实时PCR测定中,通过荧光信号积累来检测阳性反应。对于DNA样品中的一个或多个特异性序列,定量PCR能够进行检测和定量两者。数量可以是拷贝的绝对数量或是当归一化到DNA输入或额外的归一化基因时的相对量。从实时PCR的第一次记录以来,它已被用于越来越多的并且不同数量的应用,包括mRNA表达研究、基因组或病毒DNA中的DNA拷贝数测量、等位基因辨别测定、基因的特异性剪接变体的表达分析和石蜡包埋组织中的基因表达以及激光捕获的显微切割细胞。
如在此所使用的,短语“Ct值”是指“循环阈值”,其被定义为“扩增靶标的量达到固定阈值的分数循环数。”在一些实施例中,其表示扩增曲线和阈值线之间的交点。扩增曲线典型地处于“S”形,这表示在给定循环(X轴)处的每个反应(Y轴)的相对荧光的变化,该变化在一些实施例中通过实时PCR仪器在PCR期间记录。在一些实施例中,阈值线是反应达到高于背景的荧光强度处的检测水平。参见Livak和Schmittgen(2001)25Methods[《方法》]402-408。它是PCR中靶标浓度的相对量度。通常,在一些实施例中,对于给定的参考基因,定量测定如qPCR的良好Ct值在10-40的范围内。Ct水平与样品中的靶核酸量成反比(即Ct水平越低,样品中的可检测的靶核酸量越高)。此外,定量测定如qPCR的良好Ct值显示出在成比例稀释靶gDNA的情况下的线性响应范围。
在一些实施例中,在其中可以实时收集Ct值进行定量分析的条件下进行qPCR。例如,在典型的qPCR实验中,在延伸期期间的PCR的每个循环处监测DNA扩增。当DNA处于扩增的对数线性期时,荧光的量通常增加到背景以上。在一些实施例中,在该时间点收集Ct值。
如在此所使用的术语“转化”是指将核酸分子转移到宿主细胞的基因组中,导致基因上稳定的遗传。在一些实施例中,引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制,或其任何组合进行的。
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下各项的转化:细菌介导的核酸递送(例如,经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制,包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人,(“Procedures for Introducing Foreign DNAinto Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology andBiotechnology[植物分子生物学和生物技术]的方法中,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司],波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带感兴趣的外源DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人,1993,Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌,一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元载体转移至农杆菌中(
Figure BDA0003091563790000201
和Willmitzer,1988,Nucleic Acids Res.[核酸研究]16:9877)。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见例如美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用包含感兴趣的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如,干燥的酵母细胞、干燥的细菌或噬菌体,各自包含一个或多个试图被引入的核酸)推进到植物组织中。
因此,在本发明的具体实施例中,植物细胞可以通过本领域内已知的任何方法或如在此描述地进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。从植物细胞、植物组织培养物和/或培养的原生质体的植物再生描述在例如Evans等人(Handbook of Plant Cell Cultures[植物细胞培养手册],第1卷,MacMilanPublishing Co.[麦克米伦出版公司]纽约(1983));和Vasil I.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],Acad.Press [学术出版社],奥兰多,第I卷(1984)和第II卷(1986))中。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。
在被引入细胞中的多核苷酸的上下文中,“稳定引入”或“稳定引入的”是指所引入的多核苷酸被稳定地合并到该细胞的基因组中,并且因此该细胞用该多核苷酸进行了稳定转化。
如在此所使用的,“稳定转化”或“被稳定地转化的”意为将核酸引入到细胞中并且整合到该细胞的基因组中。按照这样,所整合的核酸能够被其子代遗传,更具体地,被多个连续世代的子代遗传。如在此所使用的,“基因组”还包括核基因组与质粒基因组,并且因此包括该核酸到例如叶绿体基因组的整合。如在此所使用的,稳定转化也可以是指以染色体外方式(例如,作为微型染色体)维持的转基因。
细胞的稳定转化可以通过例如细胞的基因组DNA与核酸序列(这些核酸序列与引入生物体(例如,植物)中的转基因的核苷酸序列特异性杂交)的DNA印迹杂交测定来检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的RNA印迹杂交测定来检测,这些核酸序列与引入到植物或其他生物体中的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域熟知的其他扩增反应来进行检测,这些反应采用与转基因的一个或多个靶序列杂交的特异性引物序列,从而导致该转基因序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。
“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如在此所使用的,转化和再生包括选择过程,通过该过程转基因包括选择性标记,并且转化的细胞已经并入并表达转基因,使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。
如在本发明的实施例的说明和所附权利要求中所使用的,单数形式“一个/一种(a/an)”和“该(the)”旨在也包括复数形式,除非上下文清楚地另外指明。
如在此所使用的,“和/或”是指并且涵盖相关列出项目中的一个或多个的任何和所有可能的组合。
如在此所使用的术语“约”当指代可测量的值如化合物的量、剂量、时间、温度等时意指涵盖指定量的20%、10%、5%、1%、0.5%、或甚至0.1%的变化。
术语“包括(comprise、comprises和/或comprising)”当在本说明书中使用时,指明所列举特征、整体、步骤、操作、元件、和/或组分的存在,但是不排除一种或多种其他特征、整体、步骤、操作、元件、组分、和/或其组的存在或添加。
如在此所使用的,过渡短语“基本上由……组成”意指权利要求的范围将被解释为涵盖该权利要求中所提到的指定材料或步骤以及不会实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包括(comprising)”。
术语“核苷酸序列”、“核酸”、“核酸序列”、“核酸分子”“寡核苷酸”以及“多核苷酸”在此可互换地使用来指核苷酸的杂聚物并且涵盖RNA和DNA二者,包括cDNA、基因组DNA、mRNA、合成的(例如,化学合成的)DNA或RNA以及RNA和DNA的嵌合体。术语核酸分子是指一个核苷酸链,而不考虑该链的长度。这些核苷酸包含糖、磷酸和碱,该碱是嘌呤或嘧啶。核酸分子可以是双链或单链的。在单链时,核酸分子可以是正义链或反义链。可以使用寡核苷酸类似物或衍生物(例如,肌苷或硫代磷酸核苷酸)合成核酸分子。此类寡核苷酸可以例如用于制备具有改变的碱基配对能力或对核酸酶的增强的抗性的核酸分子。在此提供的核酸序列在此以5'至3'方向从左至右表示,并且使用代表核苷酸字符的标准代码表示,如美国序列规则,37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述。
“核酸片段”是给定核酸分子的一部分。在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)涉及将DNA中包含的信息到蛋白中的转移。“基因组”是在生物体的每个细胞中所包含的遗传物质的整体。除非另外表明,本发明的特定的核酸序列还暗示性地涵盖其保守地修饰的变体(例如,简并密码子取代)以及互补序列、以及连同明确地指明的序列。确切地,简并密码子取代可通过产生以下序列来实现,在这些序列中一个或多个所选(或全部)密码子的第三位置被经混合的碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核算研究]19:5081(1991);Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985);Rossolini等人,Mol.Cell.Probes[分子细胞探针]8:91-98(1994))。术语核酸分子与基因、cDNA和由基因编码的mRNA可互换使用。
如在此所使用的,术语“基因”指能够用来产生mRNA、反义RNA、miRNA等的核酸分子。基因可能或可能不能用于产生功能性蛋白质。基因可以包括编码区和非编码区(例如、内含子、调节元件、启动子、增强子、终止序列和5'和3'非翻译区)二者。在一些实施例中,基因仅指编码区。基因可以是“分离的”,分离的基因意为一种核酸分子,其实质上(substantially)或基本上(essentially)不含正常情况下发现与其天然状态时的核酸分子相关的组分。此类组分包括其他细胞材料、来自重组产物的培养基、和/或在化学合成该核酸分子中所使用的多种化学品。
如在此所使用的“序列一致性”是指两个最佳比对的多核苷酸或肽序列在组分(例如核苷酸或氨基酸)的整个比对窗口内不变的程度。“一致性”可通过已知方法简单计算,这些方法包括但不限于描述在以下文献中的那些:Computational Molecular Biology[计算分子生物学](Lesk,A.M.编辑)牛津大学出版社,纽约(1988);Biocomputing:Informaticsand Genome Projects[生物计算:信息学和基因组计划](Smith,D.W.编辑)学术出版社,纽约(1993);Computer Analysis of Sequence Data[序列数据的计算机分析],第I部分(Griffin,A.M.和Griffin,H.G.编辑)Humana Press[胡马纳出版社],新泽西(1994);Sequence Analysis in Molecular Biology[分子生物学的序列分析])(von Heinje,G.编辑)学术出版社(1987);和Sequence Analysis Primer[序列分析引物](Gribskov,M.和Devereux,J.编辑)斯托克顿出版社,纽约(1991)。
如在此所使用的,术语“序列一致性百分比”或“一致性百分比”是指在最佳比对两个序列时,与测试(“主题”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的一致核苷酸的百分比。在一些实施例中,“一致性百分比”可以是指氨基酸序列中一致氨基酸的百分比。
如在此所使用的,在两个核酸分子、核苷酸序列或蛋白质序列上下文中,短语“实质上一致”是指当比较并比对最大对应性时具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%核苷酸或氨基酸残基一致性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。在本发明的一些实施例中,在长度为至少约50个残基至约150个残基的序列区域上存在实质一致性。因此,在本发明的一些实施例中,在长度为至少约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、或更多个残基的序列区域上存在实质一致性。在一些具体实施例中,这些序列在至少约150个残基上是实质上一致的。在另一个实施例中,这些序列在编码区的整个长度上是实质上一致的。此外,在代表性实施例中,实质上一致的核苷酸或蛋白质序列执行实质相同的功能(例如,赋予对线虫植物寄生物的增加的抗性、减少线虫植物寄生物的生长、减少胞囊发育)。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(若有必要,则指定子序列坐标),并且指定序列算法程序的参数。然后,这种序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列一致性百分比。
用于比对一个比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施:如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,并且任选地由这些算法的计算机化实现方式来实施,如作为
Figure BDA0003091563790000251
Wisconsin
Figure BDA0003091563790000252
(材料科学软件公司(Accelrys Inc.),圣地亚哥(San Diego),加利福尼亚州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的已比对区段的“一致性分数”是由两个已比对序列所共有的一致组分的数目除以参考序列区段(即,完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列一致性百分比被表示为一致性分数乘以100。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其一部分,或相对于较长的多核苷酸序列。出于本发明的目的,也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN测定“一致性百分比”。
用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开地获得。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正-值阈值的得分T。T被称为邻近字码得分阈值(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现包含它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积得分。对于氨基酸序列,使用得分矩阵来计算该累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负-得分的残基比对使累积得分趋于零或零以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了该比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff,美国国家科学院院刊89:10915(1989))。
除了计算序列一致性百分数之外,BLAST算法还进行两个序列之间相似性的统计分析(参见,例如Karlin和Altschul,美国国家科学院院刊90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生一个匹配的概率的一个指示。例如,如果在一个测试核苷酸序列与一个参考核苷酸序列的比较中的最小概率总和是小于约0.1至小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。因此,在本发明的一些实施例中,在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和是小于约0.001。
当两个核苷酸序列在严格条件下彼此杂交时这两个核苷酸序列也可以被认为是实质上一致的。在一些代表性实施例中,被认为实质上一致的两个核苷酸序列在高严格条件下彼此杂交。
在核酸杂交实验(如DNA和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。对核酸杂交的广泛指导见于Tijssen的Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第I部分第2章“Overview of principles of hybridization and thestrategy of nucleic acid probe assays[杂交原理和核酸探针测定策略综述]”,Elsevier,纽约(1993)。总体上,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于具体探针的Tm。用于互补核苷酸序列(它们在DNA或RNA印迹中在滤器上具有超过100个互补残基)的杂交的严格杂交条件的一个实例是在42℃下具有1mg肝素的50%甲酰胺,其中杂交是过夜进行的。高严格洗涤条件的一个实例是0.15MNaCl,在72℃下持续约15分钟。严格洗涤条件的一个实例是在65℃下以0.2x SSC洗涤持续15分钟(参见Sambrook,以下针对SSC缓冲液的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如多于100个核苷酸的双链体的中严格洗涤的实例是在45℃下以1xSSC持续15分钟。对于例如多于100个核苷酸的双链体的低严格洗涤的实例是在40℃下以4-6x SSC持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐),并且温度典型地是至少约30℃。还可以通过加入去稳定剂(如甲酰胺)来实现严格条件。一般而言,在特定的杂交测定中相比于不相关的探针观察到的高出2倍(或更高)的信噪比表明检测到特定杂交。如果在严格条件下彼此不杂交的核苷酸序列所编码的蛋白质是实质上一致的,则这些核苷酸序列仍然是实质上一致的。例如,当使用遗传密码所允许的最大密码子简并性来生成核苷酸序列的一个拷贝时,这种情况可能发生。
以下是可以用来克隆同源核苷酸序列(这些序列是与本发明的参考核苷酸序列实质上一致的)的杂交/洗涤条件的设置的实例。在一个实施例中,参考核苷酸序列在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与该“测试”核苷酸序列杂交,同时在50℃下在2X SSC、0.1%SDS中洗涤。在另一个实施例中,该参考核苷酸序列在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与该“测试”核苷酸序列杂交,同时在50℃下在1X SSC、0.1%SDS中洗涤;或者在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中杂交,同时在50℃下在0.5X SSC、0.1%SDS中洗涤。在仍另外的实施例中,该参考核苷酸序列在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与该“测试”核苷酸序列杂交,同时在50℃下在0.1X SSC、0.1%SDS中洗涤;或者在50℃下在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA中杂交,同时在65℃下在0.1X SSC、0.1%SDS中洗涤。
“分离的”核酸分子或核苷酸序列或“分离的”多肽是借助于人的手脱离其天然环境存在的和/或当与其在其天然环境中的功能相比时具有不同的、修饰的、调节的和/或改变的功能的并且因此不是天然的产物的核酸分子、核苷酸序列或多肽。分离的核酸分子或分离的多肽能以纯化形式存在或可以存在于非天然环境(例如像重组宿主细胞)中。因此,例如,相对于多核苷酸而言,术语分离的意指将该多核苷酸从它天然存在于其中的染色体和/或细胞中分离出。如果将一种多核苷酸从它天然存在于其中的染色体和/或细胞中分离出并且然后将其插入它并不天然存在于其中的遗传背景、染色体、染色体位置、和/或细胞中,则该多核苷酸也是被分离的。本发明的重组核酸分子和核苷酸序列可以被认为是如上文所定义的“分离的”。
因此,“分离的核酸分子”或“分离的核苷酸序列”是核酸分子或核苷酸序列,该核酸分子或核苷酸序列不与在其衍生而来的生物体的天然存在的基因组中的与其邻近的核苷酸序列(位于5'端的序列或位于3’端的序列)相邻。因此,在一个实施例中,一个分离的核酸包括一些或全部的5'非编码(例如,启动子)序列,这些序列紧接编码序列。因此,该术语包括,例如,重组核酸,该重组核酸结合进入载体、进入自我复制的质粒或病毒、或进入原核生物或真核生物的基因组DNA,或者它作为独立于其他序列的一种单独分子(例如,一种cDNA或一种利用PCR或限制性内切核酸酶处理所得到的基因组DNA片段)而存在。它也包括作为编码额外多肽或肽序列的杂合核酸分子的部分的重组核酸。“分离的核酸分子”或“分离的核苷酸序列”还可以包括以下核苷酸序列,该核苷酸序列源自并插入相同的天然原始细胞类型,但是却以非天然状态存在,例如,以不同拷贝数目存在,和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。
术语“分离的”可以进一步指核酸分子、核苷酸序列、多肽、肽或片段,它们实质上不含细胞材料、病毒材料、和/或培养基(例如,当通过重组DNA技术生产时)、或化学前体或其他化学品(例如,当进行化学合成时)。另外,“分离的片段”是不作为片段天然存在并且不会在天然状态下如此存在的核酸分子、核苷酸序列或多肽的片段。“分离的”不必须意味着该制备是工业纯的(同质的),但是它是足够纯的以提供处于可以用于预期目的形式的多肽或核酸。
在本发明的代表性实施例中,“分离的”核酸分子、核苷酸序列和/或多肽具有至少约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99%纯度(w/w)或更大纯度。在其他实施例中,“分离的”核酸、核苷酸序列和/或多肽表示与起始材料相比,实现该核酸的至少约5倍、10倍、25倍、100倍、1000倍、10,000倍、100,000倍或更大富集(w/w)。
“野生型”核苷酸序列或氨基酸序列是指天然存在(“天然”)或内源核苷酸序列或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中的或对生物体来说是內源性的mRNA。“同源”核苷酸序列是与它被引入的宿主细胞天然相关的核苷酸序列。
关于多核苷酸编码序列的术语“表达(express或expression)”,意指该序列被转录,并且任选被翻译。
“感兴趣的核苷酸序列”是指,当被引入一种植物中时,赋予该植物一种所希望的特征(如抗生素抗性、病毒抗性、虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁殖能力)的任何核苷酸序列。“感兴趣的核苷酸序列”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。
如在此所使用的,短语“可操作地连接”、“操作性地连接”、“操作性相关的”或“操作性相关”等意指核酸构建体的元件(如表达盒或核酸分子)被配置以便执行其通常的功能。因此,可操作地与核苷酸序列相关的调节或控制序列(例如,启动子)能够影响核苷酸序列的表达。例如,与编码miR396c的核苷酸序列可操作地相关的启动子将能够影响该miR396c核苷酸序列的表达。
控制序列不需要与感兴趣的核苷酸序列相邻,只要它们起到指导其表达的作用。因此,例如,介入未翻译的、已转录的序列可以在启动子与编码序列之间存在,并且该启动子序列仍可以被认为“可操作地连接至”该编码序列上。
如在此所使用的,术语“转化”和“转基因”是指包含至少一种重组(例如,异源)多核苷酸的全部或部分的任何植物、植物细胞、愈伤、植物组织、或植物部分。在一些实施例中,将该重组多核苷酸的全部或部分稳定地整合到染色体或稳定的染色体外元件中,以便使得其传递到连续世代。出于本发明的目的,术语“重组多核苷酸”是指已经通过基因工程改变、重排或修饰的多核苷酸。实例包括任何克隆的多核苷酸,或与异源序列连接或接合的多核苷酸。术语“重组”不是指因天然存在的事件(如自发突变)或因非自发诱变随后选择性育种而产生的多核苷酸改变。
在植物细胞、植物和/或植物部分的上下文中,术语“引入”(introducing或introduce)意指将一个核酸分子与该植物、植物部分和/或植物细胞以这样一种方式相接触,使得该核酸分子得以进入植物细胞和/或植物和/或植物部分的细胞的内部。在引入多于一种核酸分子的情况下,这些核酸分子可以被装配成单个聚核苷酸或核酸构建体的一部分,或装配成分开的聚核苷酸或核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单个的转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分,将这些多核苷酸引入到植物细胞中。因此,如在此所使用的术语“转化”是指将异源核酸引入细胞中。细胞的转化可以是稳定或瞬时的。因此,本发明的转基因植物细胞、植物和/或植物部分可以被稳定转化或瞬时转化。
如在此所使用的术语“植物部分”包括但不限于:胚、花粉、胚珠、种子、叶、茎、芽、花、枝、果实、果仁、穗、穗轴、果壳、茎杆、根、根尖、花药、植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团等。如在此所使用的,“芽”是指包括叶和茎的地上部分。另外,如在此所使用的,“植物细胞”指植物的结构和生理单位,包括细胞壁并且也可以指原生质体。本发明的植物细胞可以处于分离的单细胞形式,或者可以是培养的细胞,或者可以是作为较高级的组织单位(例如像,植物组织或植物器官)的一部分。
在多核苷酸的上下文中,“瞬时转化”意指:将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。
如在此所使用的,在被引入细胞中的多核苷酸的上下文中,“稳定引入(stablyintroducing、stably introduced)”、“稳定转化(stable transformation或stablytransformed)”意指:引入的多核苷酸被稳定地整合到该细胞的基因组中,并且因此该细胞用该多核苷酸稳定地转化。因此,整合的多核苷酸能够由其子代继承,更具体地说,由多个连续世代的子代继承。如在此所使用的“基因组”包括核和/或质体基因组,并且因此包括多核苷酸到例如叶绿体基因组中的整合。如在此所使用的稳定转化还可以是指被保持在染色体外,例如,作为一种微染色体的多核苷酸。
瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测,这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如,植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测,该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列,导致该一个或多个靶序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。
术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(“密码子”)的一个单位,它对应地指明蛋白合成(mRNA翻译)的起始和链终止。
“启动子”是指核苷酸序列,通常在它的编码序列的上游(5'),它通过提供对适当的转录所需的RNA聚合酶以及其他因子的识别来控制该编码序列的表达。“启动子调节序列”由近端和更远端上游元件组成。启动子调节序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括自然序列以及合成序列、连同可能是合成序列与自然序列的组合的序列。“增强子”是一个DNA序列,它可以刺激启动子的活性并且可以是该启动子或插入的异源元件的一个固有元件以增强一种启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作,并且甚至当移动到该启动子的上游或下游时还能够发挥作用。术语“启动子”的含义包括“启动子调节序列”。
“初级转化体”以及“T0世代”是指与最初转化(即,自从转化起未经历减数分裂以及受精)的组织具有相同遗传世代的转基因植物。“次级转化体”以及“T1、T2、T3等世代”是指经由一个或多个减数分裂以及受精循环而源自初级转化体的转基因植物。它们可以通过初级或次级转化体的自体受精或初级或次级转化体与其他转化或未转化植物的杂交衍生的。
“基因”是指表达mRNA、功能性RNA、或特异性蛋白的核酸片段,包括调节序列。术语“天然基因”是指如在自然界中发现的基因。术语“嵌合基因”是指包含以下各项的任何基因:1)DNA序列,包括在自然界中未一起发现的调节序列和编码序列,或2)编码不天然邻接的蛋白的部分的序列,或3)不天然邻接的启动子的部分。因此,嵌合基因可以包括从不同来源得到的调节序列和编码序列,或包括从相同来源得到的、但以与在自然界中所发现的不同的方式进行安排的调节序列和编码序列。
“转基因”是指核酸分子,该核酸分子已经通过转化被引入该基因组中并且被稳定地保持。转基因可以包括至少一个表达盒,典型地包括至少两个表达盒,并且可以包括十个或更多个表达盒。转基因可以包括例如对于待转化的特定植物的基因而言是异源的或者是同源的基因。此外,转基因可以包括被插入非天然生物体中的天然基因,或嵌合基因。术语“内源基因”是指在生物体的基因组中在它的天然位置中的天然基因。“外源”基因是指正常在宿主生物体中未发现但通过基因转移被引入该生物体中的基因。
“内含子”是指几乎唯一地在真核基因中发生的DNA的内插区段,但该内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子,该剪接使外显子未被触及,从而形成mRNA。出于本发明的目的,术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰,条件是该修饰过的内含子没有显著地降低其关联的5’调节序列的活性。
“外显子”是指携带蛋白或其一部分的编码序列的DNA的区段。外显子被内插的、非编码序列(内含子)分离。出于本发明的目的,术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰,条件是该修饰过的外显子没有显著地降低它的关联的5’调节序列的活性。
因此,在一个实施例中,本发明提供了将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法,该方法包括将以下各项引入玉蜀黍细胞:a)包括至少80、至少90、至少100、至少110、至少120、至少130、至少140、或至少150个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述连续核苷酸与SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列中的靶位点具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性;和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的连续核苷酸的SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。
如在此所使用的,“靶位点”意指基因组中的核苷酸区域,其是用于将核苷酸序列(例如,一个或多个转基因、表达盒、或感兴趣的核苷酸序列)插入到基因组的选择的或优选的位点以及用于将突变(例如,取代和/或缺失、和/或插入,如INDEL)引入基因组的选择的或优选的位点。在一些实施例中,靶位点可以包括核酸酶切割位点,也称为基因组核酸酶切割位点。本发明的靶位点的非限制性实例是由以下定义并且包括以下的染色体1上的染色体区间:如由玉蜀黍基因组数据库中可获得的玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,105,000定义的。
如在此所使用的关于本发明的一个或多个核苷酸序列的术语“相邻的”或“与……相邻”意指紧邻(例如,没有插入序列)或由从约1个碱基至约10,000个碱基(例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100、200、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10,000个碱基)分隔,包括包含在该范围内但未在此明确叙述的任何值。
“核酸酶切割位点”或“基因组核酸酶切割位点”是包括核酸酶切割序列的核苷酸区域,该核酸酶区域由特异性核酸酶识别,该核酸酶用于切割一条或两条链中基因组DNA的核苷酸序列。由核酸酶的这种切割引发了细胞内的DNA修复机制,它建立了同源重组发生的环境。在此方法中,其中第一核酸分子包括例如至少约100个连续核苷酸,这些连续核苷酸与细胞基因组中的靶位点具有例如至少90%一致性,该第一核酸分子经由同源重组被整合到细胞基因组中,从而将一个或多个转基因整合到细胞基因组中。
在以上方法的一些实施例中,第一核酸分子可以包括至少约100、150、200、250、300、250、400、450、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、7500、10000、15,000或20,000个核苷酸,包括此范围内的未在此明确叙述的任何值。
在以上方法的一些实施例中,包括玉蜀黍基因组中的基因组核酸酶切割位点的核苷酸序列可以是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66或SEQ ID NO:67的核苷酸序列。
在以上方法的一些实施例中,该基因组核酸酶切割位点位于染色体1上的染色体区间内,该染色体区间由以下定义并且包括以下:如由玉蜀黍基因组数据库中可获得的玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,015,000。
在以上方法的一些实施例中,该核酸酶对选自下组的核苷酸序列中的核酸酶切割位点具有切割特异性,该组由以下各项组成:SEQ ID NO:1(HiII-MIR604)、SEQ ID NO:2(AX-MIR604)、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66、SEQ ID NO:67及其任何组合。
在一些实施例中,第一核酸分子和第二核酸分子可以通过基因枪核酸递送,经由农杆菌,通过共转化和/或用T-DNA载体以任何组合和/或顺序引入玉蜀黍细胞。
在一些实施例中,第一核酸分子和第二核酸分子可以存在于单个核酸构建体上,并且在一些实施例中,第一核酸分子和第二核酸分子可存在于分开的核酸构建体上。
在一些实施例中,第一核酸分子和/或第二核酸分子可以在玉蜀黍细胞中瞬时表达。
在一些实施例中,第一核酸分子和/或第二核酸分子可以稳定地整合到玉蜀黍细胞中的玉蜀黍基因组中。
本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代包括整合到该玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过在此所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。因此,本发明提供了通过本发明的方法生产的、包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。
在一些实施例中,本发明基于意想不到的发现和快速(例如,高通量)方法的开发来鉴定和富集细胞,这些细胞包括一个或多个整合到基因组的靶位点处的转基因,该方法采用定量聚合酶链式反应(qPCR)测定的选择性组合。
本发明进一步提供了鉴定细胞和/或富集细胞的方法,该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因,该方法包括:a)将以下各项引入多个细胞中:i)包括至少80、至少90、至少100、至少110、至少120、至少130、至少140、或至少150个连续核苷酸并且进一步包括转基因的第一核酸分子,其中这些连续核苷酸与细胞基因组中的靶位点具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性;和ii)编码以下核酸酶的第二核酸分子,该核酸酶在与对应于(i)的连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行;b)培养(a)的细胞以生产至少一种细胞系或组织;c)从(b)的每种细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G,其中测定T和G分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于靶位点的核苷酸序列,距离用于进行测定T的核酸酶切割位点至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十二个、或至少十五个碱基对,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列;e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数;以及f)鉴定和/或富集在测定T中相对于参考具有减少的拷贝数并且对于测定G,具有大于零的拷贝数的细胞系或组织,从而鉴定和/或富集包括插入到细胞基因组中的核酸酶切割位点的转基因的细胞。
在上述针对鉴定和/或富集细胞的方法中,这些细胞包括插入细胞基因组中的核酸酶切割位点的一个或多个转基因,qPCR测定可以按如本领域熟知的高通量格式进行,使得可以快速且同时地测定大量样品。这种快速和高效的筛选允许鉴定和富集在这些方法中使用的多个细胞(其典型地将是大量细胞)中的小百分比的细胞(例如,约2%)。
在上述方法中,第一探针(用于进行测定T)可以包括一种核苷酸序列、基本由其组成或由其组成,该核苷酸序列互补(例如,至少约90%、95%、98%、99%或100%互补)于距离核酸酶切割位点至少五(例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个碱基对的核苷酸序列,并且第二探针(用于进行测定G)可以包括一种核苷酸序列,该核苷酸序列互补(例如,至少约90%、95%、98%、99%或100%互补)于一种或多种转基因中的至少一种。
在上述富集和鉴定方法的一些实施例中,除了鉴定和/或富集相对于参考具有减少的测定T中的拷贝数和对于测定G大于零的拷贝数(例如,约1的拷贝数、约2的拷贝数或约3的拷贝数)的细胞系或组织的步骤以外,在一些实施例中,这些方法可以进一步包括丢弃与参考相比,测定T的DNA拷贝数没有变化的细胞系或组织的步骤,并且在一些实施例中,可以进一步包括丢弃对于测定G具有拷贝数为零(例如,小于1的拷贝数)的细胞系或组织的步骤。
如在此所使用的,对于测定(例如,测定G)呈“阳性的”或阳性结果意味着拷贝数大于零,并且对于测定(例如,测定G)呈“阴性的”意味着拷贝数是零或小于一。
又如在此所使用的,“参考”是具有固定的基因拷贝数的基因组。在一些实施例中,该参考可以是“野生型”基因组(例如,不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)
在本发明的具体实施例中,第一和第二探针是荧光探针,并且在一些实施例中,第一和第二探针是Taqman探针。
在本发明的一些实施例中,在相同的混合物中进行qPCR测定,并且在一些实施例中,在不同的混合物中以任何组合进行qPCR测定。
在该植物是玉蜀黍植物的实施例中,核酸酶切割位点是玉蜀黍MIR604转基因插入位点,即与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性。
在此所述的方法的一些实施例中,核酸酶可以是非工程化核酸酶(例如,处于没有修饰的其“天然”形式或“野生型”形式的核酸酶)。在一些实施例中,核酸酶可以是具有可编程的切割靶特异性的工程化核酸酶。本发明的核酸酶的非限制性实例包括CRISPR gRNA-Cas9核酸酶、锌指核酸酶、工程化大范围核酸酶和/或TAL效应子核酸酶,单独地或以任何组合。
本发明还提供了通过在此所述的方法鉴定和/或富集的细胞系或组织,其中该细胞系或组织源自植物或植物部分。在一些实施例中,该细胞系或组织源自单子叶植物或单子叶植物部分。在一些实施例中,该细胞系或组织源自双子叶植物或植物部分。在一些实施例中,该细胞系或组织源自谷类植物或谷类植物部分。在另外的实施例中,该细胞系或组织源自玉蜀黍植物或玉蜀黍植物部分。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。
在此进一步提供了通过在此所述的方法鉴定和/或富集的细胞系或组织,其中该细胞系或组织源自真核生物体。
在上述富集和鉴定方法的一些实施例中,除了鉴定和/或富集相对于参考具有减少的测定T中的拷贝数和对于测定G是阳性的细胞系或组织的步骤以外,在一些实施例中,这些方法可以进一步包括丢弃与参考相比,测定T的DNA拷贝数没有变化的细胞系或组织的步骤,并且在一些实施例中,可以进一步包括丢弃对于测定G是阴性的细胞系或组织的步骤。
如在此所使用的,对于测定(例如,测定G)呈“阳性的”意指拷贝数大于零,并且对于测定(例如,测定G)呈“阴性的”意指拷贝数等于零。
又如在此所使用的,“参考”是具有固定的基因拷贝数的基因组或其他核酸分子。在一些实施例中,该参考可以是“野生型”基因组(例如,不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)
在本发明的具体实施例中,第一和第二探针是荧光探针,并且在一些实施例中,第一和第二探针是Taqman探针。
在本发明的一些实施例中,在相同的混合物中进行qPCR测定,并且在一些实施例中,在不同的混合物中以任何组合进行qPCR测定。
在该生产的植物是玉蜀黍植物的实施例中,核酸酶切割位点是玉蜀黍MIR604转基因插入位点,即与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性。
在此进一步提供了一种鉴定细胞和/或富集细胞的方法,该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合,该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将一种核酸分子引入多个细胞中,该核酸分子包括编码以下核酸酶的异源序列,该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中;b)培养(a)的多个细胞以生产至少一种细胞系或组织;c)从(b)的每种细胞系或组织提取基因组DNA样品;d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2,其中这些测定分别包括以下探针:i)包括一种核苷酸序列的第一探针,该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列,和ii)包括一种核苷酸序列的第二探针,该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列;e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数;以及f)鉴定和/或富集针对测定1相对于参考具有减少的拷贝数并且对于测定2,具有等于零的拷贝数的细胞系或组织,从而鉴定和/或富集以下细胞,该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。
在此所述方法的一些实施例中,该细胞系或组织可以源自植物或植物部分,例如源自组织培养物或发芽种子的植物。在一些实施例中,该植物可以是单子叶植物,并且在一些实施例中,该植物可以是双子叶植物。在一些实施例中,该植物可以是谷类。在具体实施例中,该植物可以是玉蜀黍植物。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。在一些实施例中,通过在此所述的方法鉴定和/或富集的细胞系或组织源自真核生物体。
在上述富集和鉴定方法的一些实施例中,除了鉴定和/或富集相对于参考具有减少的测定1中的拷贝数和对于测定2等于零(例如,少于一个)的拷贝数的细胞系或组织的步骤以外,在一些实施例中,这些方法可以进一步包括丢弃相对于参考的测定1的DNA拷贝数没有变化的细胞系或组织的步骤,并且在一些实施例中,可以进一步包括丢弃对于测定2具有拷贝数大于零(例如,约1的拷贝数、约2的拷贝数、或约3的拷贝数)的细胞系或组织的步骤。
如在此所使用的,对于测定(例如,测定2)呈“阳性的”或阳性结果意指拷贝数大于零(例如,约1的拷贝数、约2的拷贝数、或约3的拷贝数),并且对于测定(例如,测定2)呈“阴性的”意指拷贝数等于零(例如,小于一)。
又如在此所使用的,“参考”是具有固定的基因拷贝数的基因组或其他核酸分子。在一些实施例中,该参考可以是“野生型”基因组(例如,不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)。
在本发明的具体实施例中,第一和第二探针是荧光探针,并且在一些实施例中,第一和第二探针是Taqman探针。
在本发明的一些实施例中,在相同的混合物中进行qPCR测定,并且在一些实施例中,在不同的混合物中以任何组合进行qPCR测定。
在此所述方法的一些实施例中,该组织可以是源自组织培养物或发芽种子的植物。在一些实施例中,该植物可以是单子叶植物,并且在一些实施例中,该植物可以是双子叶植物。在具体实施例中,该植物可以是玉蜀黍植物。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。
在此所述的方法的一些实施例中,核酸酶可以是非工程化核酸酶(例如,处于没有修饰的其“天然”形式或“野生型”形式的核酸酶)。在一些实施例中,核酸酶可以是具有可编程的切割靶特异性的工程化核酸酶。本发明的核酸酶的非限制性实例包括CRISPR gRNA-Cas9核酸酶(例如,包括SEQ ID NO:30的Cas9核酸酶)、锌指核酸酶、工程化大范围核酸酶和/或TAL效应子核酸酶,单独地或以任何组合。
在该植物是玉蜀黍植物的实施例中,核酸酶切割位点是玉蜀黍MIR604转基因插入位点,即与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性。
本发明另外提供了用于实施本发明的方法和测定的试剂盒和说明书。在一些实施例中,提供了包括用于实施本发明的方法的组合物、配制品和/或试剂的试剂盒或包装。例如,试剂盒可以包括用于获得细胞或组织的手段,以及用于获得核酸样品的手段。该试剂盒还可以包含用于实施本发明的方法的步骤的试剂。这些试剂可以包括促进本发明的核酸分子的分离和生物化学表征的位点特异性探针和/或引物。该试剂盒可以包含一个或多个单独的容器。
尽管指导性材料(当存在时)通常包括书面或印刷材料,但它们不限于此。本发明涉及能存储这样的说明书并将它们传达至终端用户的任何媒体。这样的媒体包括但不限于电子存储媒体(例如,磁盘、磁带、盒式磁带、芯片)、光学媒体(例如,CD ROM)等。这样的媒体可包括提供这类指导性材料的因特网站地址。
当该试剂盒的组分是以一种或多种液体溶液形式提供时,该液体溶液优选为一种水性溶液,其中无菌水性溶液是特别优选的。然而,该试剂盒的组分可以呈干燥粉末形式提供。当以干燥粉末形式提供试剂或组分时,该粉末可以通过添加适合溶剂来重构。预想的是,该溶剂也可以提供于另一个容器中。例如,其中试剂盒的组分是处于冻干形式,该试剂盒可以任选地包含无菌的和生理学上可接受的重构介质,如水、盐水、缓冲盐水等。
在一些实施例中,试剂盒的这些容器可以包括至少一个小瓶、试管、烧瓶、瓶、注射器或其他容器,可以向其中放入并且适合地等分本发明的组合物/配制品以及任何其他所希望的试剂。
在另外的实施例中,本发明提供了一种生产植物、植物部分或其子代的方法,这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将核酸分子引入植物细胞中,该核酸分子包括编码以下核酸酶的异源核苷酸序列,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在植物细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中;并且b)从(a)的植物细胞再生植物、植物部分或其子代。在另一个实施例中,本发明提供了通过上述方法生产的植物细胞。在另外的实施例中,本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。
在上述方法的一些实施例中,该植物是单子叶植物。在其他实施例中,该植物是双子叶植物。在一些实施例中,该植物是谷类。在另外的实施例中,该植物是玉蜀黍。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。
在上述方法的一些实施例中,该突变包括至少一个核苷酸取代、至少一个核苷酸的缺失,或取代、缺失和/或插入的组合,例如像INDEL。
在上述方法的一些实施例中,该核酸分子是基因枪核酸递送、农杆菌介导的转化或本领域已知的植物转化的任何方法。
在上述方法的一些实施例中,用于定点切割的核酸酶是非工程化核酸酶。在一些实施例中,该核酸酶是具有可编程的切割靶特异性的工程化核酸酶。在一些实施例中,该核酸酶是Cas9。在一些实施例中,该核酸酶是包括SEQ ID NO:30的Cas9。
本发明另外提供了一种生产植物、植物部分或其子代的方法,这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的转基因并且缺乏编码以下核酸酶的异源核苷酸序列的整合,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该方法包括:a)将核酸分子引入植物细胞中,该核酸分子包括编码以下核酸酶的异源核苷酸序列,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在植物细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中;并且b)从(a)的植物细胞再生植物、植物部分或其子代。在另一个实施例中,本发明提供了通过上述方法生产的植物细胞。在另外的实施例中,本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。
在上述方法的一些实施例中,该转基因可以包括至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少九个、或十个或更多个表达盒。
在上述方法的一些实施例中,该核酸酶切割位点是或相邻于以下核苷酸序列,该核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%一致性。
在上述方法的一些实施例中,该植物是单子叶植物。在其他实施例中,该植物是双子叶植物。在一些实施例中,该植物是谷类。在另外的实施例中,该植物是玉蜀黍。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。
在上述方法的一些实施例中,第一核酸分子和第二核酸分子同时被引入,例如通过共转化、基因枪核酸递送或农杆菌介导的转化。在一些实施例中,第一核酸分子和第二核酸分子是分开的分子。在一些实施例中,单个核酸分子或构建体包括上述第一核酸分子和第二核酸分子。
在上述方法的一些实施例中,用于定点切割的核酸酶是非工程化核酸酶。在一些实施例中,该核酸酶是具有可编程的切割靶特异性的工程化核酸酶。在一些实施例中,该核酸酶是Cas9。在一些实施例中,该核酸酶是包括SEQ ID NO:30的Cas9。
本发明另外提供了用于修饰植物细胞基因组中的靶位点的方法,该方法包括:a)向植物细胞中引入第一核酸和第二核酸分子,该第一核酸包括至少100个连续核苷酸并且进一步包括转基因,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;并且b)该第二核酸分子编码以下核酸酶,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。在另一个实施例中,本发明提供了通过上述方法生产的植物细胞。在另外的实施例中,本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。
在上述方法的一些实施例中,该植物是单子叶植物。在其他实施例中,该植物是双子叶植物。在一些实施例中,该植物是谷类。在另外的实施例中,该植物是玉蜀黍。在一些实施例中,该玉蜀黍是转基因的。在另外的实施例中,该转基因玉蜀黍是事件MIR604。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。
在上述方法的一些实施例中,靶位点的修饰包括至少一个核苷酸取代、至少一个核苷酸的缺失,或取代、缺失和/或插入的组合,例如像INDEL。在其他实施例中,靶位点的修饰是插入,如转基因插入。
在上述方法的一些实施例中,该核酸分子是基因枪核酸递送、农杆菌介导的转化或本领域已知的植物转化的任何方法。
本发明另外提供了将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点中的方法,该方法包括将以下各项引入事件MIR604玉蜀黍细胞:a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90%一致性,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQID NO:139;和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90%一致性的核苷酸序列的相邻的基因组核酸酶切割位点处用于定点切割,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQ ID NO:139,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。
本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过以上段落所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过上述方法生产的、包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。
现在将参考以下实例描述本发明。应了解,这些实例并不旨在将权利要求书的范围限于本发明,而是旨在成为某些实施例的示例。可以由熟练的技术人员想到的示例性方法的任何变体都旨在落入本发明的范围内。
实例
实例1.MIR604转基因插入位点周围的区域作为潜在的安全港
使用以下人为定义的标准来鉴定适合于靶向转基因整合和稳定表达的潜在的玉蜀黍基因组安全港区域:(1)包含大多数独特序列的区域,因此它适合于进行由同源重组介导的靶向整合;(2)不是已知功能基因(包括编码miRNA的那些)的一部分的区域;理想地,这些区域应该在任何已知的开放阅读框上游至少2Kb,或者距离基因的3'-非翻译区(3’-UTR)下游1Kb处;因此转基因的整合不会中断任何内源基因序列或影响相邻内源基因的功能;(3)不接近具有高度重复序列的异染色质区域的区域,如可以导致转基因的不稳定表达或插入转基因的潜在沉默的中心粒周围区;(4)不含已知的顺式作用元件如增强子或阻遏物的区域,使得插入时转基因表达模式和水平出乎意料地改变。(5)具有显示良好的转基因表达的经验数据的区域。
在玉蜀黍基因组中使用上述标准鉴定了若干个候选区域,例如在染色体1中在位置38,555,000和38,605,000之间、在位置38,640,000和38,715,000之间、以及在位置38,860,000和39,015,000之间(玉蜀黍B73RefGen_V2)。由于商业转基因事件通常具有良好的转基因表达,因此针对其作为候选安全港的潜力也检查了商业事件的插入位点。然而,几乎它们中的所有都不符合以上标准,除了根虫抗性性状事件MIR604。有趣的是,MIR604中的转基因插入片段恰好位于染色体1在位置39,014,056和39,014,148之间,接近位置39,015,000端。MIR604插入位点侧翼的区域是独特的,因为它是许多检查的区域中唯一符合所有安全港标准的区域。由于MIR604事件已经上市了若干年,所以插入位点周围的区域是作为用于插入额外转基因的安全港的理想候选。然而,之前显示,插入先前生成的转基因基因座的转基因还可以导致表达变异(Day等人,“Transgene integration into the samechromosome location can produce alleles that express at a predictable levelor alleles that are differentially silenced[整合到相同染色体位置的转基因可以生产以可预测水平表达的等位基因或差异性沉默的等位基因]”,Genes and Develop.[基因与发展]14:2869-2880(2000))。验证以下假设是重要的:MIR604插入位点区域对于新转基因等位基因的表达是良好的安全港,这些新转基因等位基因在相同基因座处经由定点转化使用不同的定点核酸酶和递送方法而产生。
实例2.在HiII中MIR604插入位点侧翼的基因组序列的克隆
使用农杆菌介导的A188玉蜀黍未成熟胚的转化,使用甘露糖作为选择,从二元载体pNOV2130产生MIR604转基因事件。包含MIR604转基因的玉蜀黍品种在美国广泛种植。MIR604事件包含玉蜀黍基因组中的pNOV2130 T-DNA的单拷贝插入。美国专利号8,354,519中描述了MIR604插入位点及其侧翼区的序列,以其整体结合在此,并且如SEQ ID NO:1所示。
实例3.对应于来自可转化的优良玉蜀黍品种NP2222的安全港基因座1(MIR604插 入位点)序列的染色体序列的克隆
原始MIR604插入位点序列(SEQ ID.NO:1)源自非优良转化品种A188。将转基因直接插入优良转化品种中是理想的。然而,来自优良转化靶品种的序列可能不同于来自A188的序列,并且因此不会被使用A188基因组序列设计的定点核酸酶识别。为了获得对应于优良玉蜀黍转化品种NP2222中的MIR604插入位点侧翼区域的基因组序列(美国专利号9,133,474,通过引用结合在此),基于A188 MIR604插入位点侧翼序列设计PCR引物,并用于从NP2222扩增对应区域。将扩增的序列测序并组装成重叠群,该重叠群用于组装插入位点周围的Hi-Seq全基因组深度测序读数。最后,获得了对应于A188 MIR604插入位点的名称为AX_MIR604的NP2222基因组序列,并且如SEQ ID NO:2所示。序列比较显示出,在NP2222和A188之间的基因组序列中存在显著差异,包括许多InDel(插入/缺失)和核苷酸取代。
实例4.由可编程的CRISPR-Cas9核酸酶介导的转基因在MIR604插入位点安全港处 的靶向插入
实例4.1.引入用于介导靶向插入的CRISPR-Cas9核酸酶
用于替换短段DNA序列(等位基因替换)或插入大DNA片段(转基因插入)的转基因序列的靶向插入可以通过DNA断裂来介导,这些DNA断裂通过CRISPR-Cas9核酸酶经由同源重组而引入(Shan等人,Nature Biotechnology[自然生物技术]31:686-688(2013);Wang等人,Cell[细胞]153:910-918(2013),Yang等人,Cell[细胞]154:1370-1379(2013);Puchta和Fauser,Plant Journal[植物杂志]78:727-741(2014);Chen和Gao,Plant Cell Rep.[植物细胞报告]33:575-583(2014))。在这个实例中,CRISPR-Cas9核酸酶用于介导大DNA分子插入玉米植物中所希望的染色体安全港靶标。选择NP2222玉米品系中的MIR604事件插入位点作为用于研究Cas9/gRNA介导的转基因插入的试验性转基因表达安全港。
实例4.2.候选安全港(MIR604)靶序列选择
通过使用两条链中的5'-G/A-(N)18-20-NGG-3’规则,针对潜在Cas9切割位点扫描在MIR604插入位点处及其周围的假定的安全港区域,使得5'-NGG-3’序列基序之前的靶模板序列A(N)18-20和G(N)18-20可以分别方便地置于DNA PolIII启动子(如水稻prOsU3和prOsU6)的控制下。许多序列可以被鉴定为在MIR604插入位点周围的潜在Cas9-gRNA切割靶标。例如,针对Cas9介导的切割鉴定了以下潜在靶序列:5'-AGTGC AGTGC AGTGC AGGAC AGG-3’(SEQ ID.NO:3)、5'-ACTAA TCGTG CTTCA CGCAC AGG-3’(SEQ ID.NO:4)、5'-AGGCA CAGCACGTAG TAGAC AGG-3’(SEQ ID.NO:5)、5'-ACATG TCGAT CCGAC GACGA CGG-3'(SEQ ID.NO:6)、5'-AGTTT TATTA TAATC CGAA ACGG-3’(SEQ ID.NO:7)、5'-AATCC GAAAC GGAGC ACGCACGG-3'(SEQ ID.NO:8)、5'-AAACG GAGCA CGCAC GGCGG TGG-3’(SEQ ID.NO:9)、5'-GGAGCACGCA CGGCG GTGG AGG-3'(SEQ ID.NO:10)、5'-ATCCA AAGCT ACATC CGTGC AGG-3'(SEQID.NO:11)、5'-GTGCA GTGCA GTGCA GTGC AGG-3’(SEQ ID.NO:12)、5'-GGACA GGACC TCCTTTGTTT AGG-3'(SEQ ID.NO:13)、5'-GCGTG CGCAG AGCGC CTGCT CGG-3'(SEQ ID.NO:14)、5'-GCGTC ATCCA TGTGT TC TGG-3’(SEQ ID.NO:15)、5'-GTCCA TCTCC ATTCA CTGGT TCGG-3’(SEQ ID.NO:16)、5'-AATGC CTGCA GAAGA GGCCG TGG-3’(SEQ ID.NO:17)。类似地,还鉴定了来自另一条链的靶序列,例如:5'-GCGGC CGGCA CGTTG CTAAC CAGG-3'(SEQID.NO:18)、5'-AGAGA AGAAA AATTC GTCCA TGG-3’(SEQ ID.NO:19)、5'-GGCCT CTTCTGCAGG CATT TGG-3’(SEQ ID.NO:20)、5'-AAGGA ACCCG AACCA GTGAA TGG-3’(SEQ ID.NO:21)、5'-ATCGG TCCTAA ACAAA GG AGG-3’(SEQ ID.NO:22)、5'-GGATG CAGCT TTGGC AACGAGG-3’(SEQ ID.NO:23)、5'-GTCGC GCAGC GCTCC TGCA CGG-3’(SEQ ID.NO:24)、5'-GCTCCTGCAC GGATG TAGCT T TGG-3’(SEQ ID.NO:25)、5'-GGATG TAGCT TTGGA TTGC TGG-3’(SEQID.NO:26)、5'-AAATA AAAAA ATCGG ATTAA AGG-3’(SEQ ID.NO:27)。
选择以上列出的序列之一,5'-AGTGC AGTGC AGTGC AGGAC AGG-3'(SEQ ID NO:3)(其位于非常接近MIR604插入位点),作为用于测试Cas9-gRNA介导的转基因插入的靶序列。使用Cas9识别PAM基序(5’-NGG-3’)之前的序列(20bp),5'-AGTGC AGTGC AGTGC AGGAC-3'(SEQ ID NO:28,又称为xMIR604FR2),使用下面实例中的水稻PolIII启动子prOsU3来构建sgRNA表达载体。
实例4.3.CRISPR-Cas9和引导RNA设计以及表达载体
实例4.3.1.用于在玉蜀黍细胞中表达的Cas9的优化
为了在玉蜀黍细胞中实现良好的表达,用玉蜀黍优选密码子来优化来自酿脓链球菌SF370的II型Cas9基因(cBCas9Nu-01,SEQ ID NO:29)。核定位信号也被并入Cas9的C-末端以改进其对核的靶向(Cas9Nuc,SEQ ID NO:30)。为了在玉蜀黍细胞中表达经修饰的Cas9蛋白(Cas9Nuc),将玉蜀黍优化的Cas9基因(cBCas9Nu-01,SEQ ID NO:29)置于玉蜀黍泛素-1启动子(prUbi1-10)随后是终止子序列(tNOS)的控制下。
实例4.3.2.用于介导MIR604插入位点安全港修饰的引导RNA(gRNA):gRNA设计及其表达
对于安全港#1(MIR604插入位点)靶序列(5'-AGTGC AGTGC AGTGC AGGAC AGG-3',SEQ ID NO:3)的靶向切割,针对5'-NGG-3’之前的玉蜀黍基因组靶序列(5'-AGTGC AGTGCAGTGC AGGAC-3',SEQ ID NO:28)设计了至少17个核苷酸(nt)长的crRNA用于Cas9介导的靶识别。例如,17-nt(5'-GC AGTGC AGTGC AGGAC-3',SEQ ID NO:31)、18-nt(5'-TGC AGTGCAGTGC AGGAC-3',SEQ ID NO:32)、19-nt(5'-GTGC AGTGC AGTGC AGGAC-3',SEQ ID NO:33)、20-nt(5'-AGTGC AGTGC AGTGC AGGAC-3’,SEQ ID NO:28)或21-nt(5'-C AGTGC AGTGCAGTGC AGGAC-3’,SEQ ID NO:34)的crRNA可用于引导安全港#1(MIR604插入位点)的Cas9切割。靶标crRNA与tracRNA和Cas9蛋白或mRNA共同递送以介导靶位点切割。优选地,将该crRNA分子与tracRNA分子共价融合成单个引导RNA(sgRNA)。sgRNA可以经化学合成或通过体外转录而生产。体外生产的sgRNA可直接用于物理递送,如用Cas9 RNA或蛋白质进行基因枪轰击来介导靶向切割和同源定向靶向修饰(如果修复供体寡核苷酸被共同递送的话)。更优选地,在植物中由包括RNA聚合酶III(PolIII)启动子(例如水稻U3或U6启动子(prOsU3和prOsU6))的DNA表达盒生产sgRNA。对于prOsU3,转录起始位点以核苷酸A开始,而对于prOsU6,转录起始位点以核苷酸G开始(Shan等人,(2013)Nature Biotechnology[自然生物技术]31:686-688;Xie和Yang,(2013)Molecular Plant[分子植物]6:1975-1983)。例如,为了生产靶向安全港#1(MIR604插入位点)序列(5'-AGTGC AGTGC AGTGC AGGAC AGG-3',SEQID NO:3)的sgRNA,将19-nt DNA寡核苷酸(5'-GTGC AGTGC AGTGC AGGAC-3',SEQ ID NO:33)或20-nt寡核苷酸(5'-AGTGC AGTGC AGTGC AGGAC-3’,SEQ ID NO:28)与编码tracRNA支架的DNA序列和PolIII终止序列(5'-GTTTT AGAGC TAGAA ATAGC AAGTT AAAAT AAGGCTAGTC CGTTA TCAAC TTGAA AAAGT GGCAC CGAGT CGGTG CTTTT TTTTT-3’,SEQ ID NO:35)融合(Mali等人(2013)Science[科学]339:823-826)以形成命名为rBsgRNA-01的单个引导RNA(sgRNA)的编码序列(Seq.ID.NO:36),该编码序列被置于水稻聚合酶III启动子U3(prOsU3)或U6(prOsU6)的控制下。对于该实例,表达盒包括prOsU3和sgRNA rBsgRNA-01的编码序列,该sgRNA rBsgRNA-01包括与tracRNA(SEQ ID NO:37)融合的20-nt xMIR604FR2(SEQ ID NO:28)靶RNA。将包括prOsU3启动子和rBsgRNA-01sgRNA的表达盒与Cas9表达盒一起克隆到基因枪转化载体中。该基因枪转化载体被称为22169。
实例4.4.在MIR604插入位点安全港处生成靶向插入事件
实例4.4.1.经由同源重组构建用于靶向插入的供体载体
通过插入2个昆虫控制基因(eCry3.1Ab和mCry3A)和两个同源臂(xJHAX-03,SEQID NO:38和xJHAX-04,SEQ ID NO:39)之间的PMI选择性标记基因的表达盒构建了基因靶向供体载体(称为21942)。从5’端,该供体核酸序列包括可操作地连接到eCry3.1Ab表达盒的xJHAX-03,该eCry3.1Ab表达盒可操作地连接到mCry3A表达盒,该mCry3A表达盒可操作地连接到cPMI表达盒,该cPMI表达盒可操作地连接到xJHAX-04(图2)。这两个同源臂(xJHAX-03和xJHAX-04)具有与安全港#1(MIR604插入位点)序列(SEQ ID NO:2)的一部分一致的序列,并且用于引导使用同源重组将供体序列靶向插入到靶基因座处的Cas9切割位点(图2)。
实例4.4.2.在基因枪轰击下,在MIR604插入位点安全港处生成靶向插入事件
对于由同源定向修复介导的靶基因序列修饰,供体DNA分子需要与Cas9和sgRNA共同递送。为了在安全港基因座#1处产生携带靶向插入事件的潜在事件,将携带Cas9Nuc和sgRNA的表达盒的载体(22169)的质粒DNA与包括供体核酸序列的载体21942的片段进行混合(图2),该供体核酸序列包括实例4.4.1中描述的表达盒和同源臂。然后将DNA(具有供体核酸序列的Cas9Nuc和sgRNA载体)沉淀在金粒子上并用于轰击未成熟的玉蜀黍胚(品系NP2222)。先前已经描述了用于玉蜀黍未成熟胚轰击的方法、愈伤组织诱导组织再生和生根方法(Wright等人,Plant Cell Reports[植物细胞报告]20:429-436(2001))。简言之,在授粉后约9-11天从收获的未成熟穗分离未成熟胚,并在渗透培养基上预培养1至3天。然后使用BioRad PDS-1000基因枪粒子递送系统,用上述DNA轰击预培养的胚。然后将轰击的胚在愈伤组织诱导培养基中孵育,并且然后移至甘露糖选择培养基上。将甘露糖抗性愈伤组织转移到再生培养基中以诱导芽形成。然后将芽进行继代培养到生根培养基上。然后从生根植物收获用于Taqman测定的样品以检测靶位点中的突变以富集潜在的靶向插入事件(在此所述),并进行连接PCR以鉴定包含靶向插入的潜在植物(图2和图3)。通过更详细的PCR、测序和Southern分析来进一步表征鉴定的假定靶向插入事件用于进行确认(图5)。表1显示了导致靶向插入事件MZET134300A679A恢复的实验(MZET134300)。在该实验中,超过80%的对供体核酸表达盒呈阳性的转基因事件(473个事件中的384个)在靶位点序列xMIR604FR2(SEQ ID NO:28)处包含修饰。在一亚组事件上进行PCR反应,并通过在两个同源臂处双交换同源重组鉴定出一个清楚的靶向插入事件。另外的DNA测序和DNA印迹分析证实,该事件是清楚的靶向插入事件,意味着该事件包括实例4.4.1中描述的供体核酸序列的单拷贝(特别地,eCry3.1Ab、mCry3A和PMI表达盒是无骨架的),显示出双交换同源重组事件的证据,并且不具有包括核酸酶的载体DNA的整合。该实例显示出,MIR604插入位点是靶向插入的良好靶位点。
表1.在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2(SEQ ID NO:28)处具有sgRNA-Cas9核酸酶的玉米中的靶向实验
Figure BDA0003091563790000491
为了确定sgRNA-Cas9介导的基因组修饰的效率,我们使用如在后续实例中所述的高通量Taqman测定来测定表1中所述的所有473个转基因植物中的突变的存在。由于通过共同递送修复供体和Cas9核酸酶构建体来进行转化,所以我们预期在不包含Cas9Nuc表达载体的转基因植物中看到供体核酸序列。实际上,在对于供体核酸序列的473个PMI阳性植物中,分别地,其中301个(63.6%)具有共同整合的Cas9核酸酶表达载体,并且其中172个(36.4%)不具有共同整合的Cas9核酸酶表达载体(表2)。不具有共同整合的Cas9Nuc核酸酶表达载体(22169)的83株植物(17.5%)在玉蜀黍基因组的一个等位基因(7株植物)或两个等位基因(76株植物)中具有经修饰的其靶位点(xMIR604FR2,SEQ ID NO:28)(表2)。
此外,我们测定了再生植物中突变的存在,这些再生植物逃避了甘露糖选择过程或逃避了不包含供体核酸序列表达盒的转录逃逸。如所预期的,在471个逃逸中,只有2株植物对于Cas9Nuc核酸酶表达载体是阳性的,并且这两株植物都在基因组靶标中具有双等位基因突变(表2)。令人惊讶的是,对任何转基因(供体核酸序列表达盒或Cas9Nuc表达载体)呈阴性的高百分比的逃逸植物(23.9%,469株植物中的112株)在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2(SEQ ID NO:28)处具有突变。这112个事件中的37个具有双等位基因突变,即玉蜀黍基因组中的xMIR604FR2序列(SEQ ID NO:28)的两个拷贝都突变了。剩余的75个事件在该序列的拷贝之一中具有突变。这个惊人的结果表明,Cas9核酸酶和sgRNA在玉蜀黍细胞中的瞬时表达足以在染色体靶标上产生突变。同时,选择是任选的以获得突变体植物。如果筛选出足够数量的再生植物,则可以通过瞬时递送和植物细胞中Cas9Nuc蛋白和一个或多个gRNA的表达来容易地鉴定靶向突变体。
表2.在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2
(SEQ ID NO:28)处具有gRNA-Cas9介导的靶向诱变的再生植物中不同类型事件的分解
Figure BDA0003091563790000501
Figure BDA0003091563790000511
1转化频率为13.1%
2逃逸频率为13.0%
实例4.4.3.在农杆菌介导的转化下,在MIR604插入位点安全港处生成靶向插入事件
还可以用DNA供体和经由农杆菌递送的Cas9核酸酶和sgRNA的表达载体来产生转基因到安全港基因座的靶向插入。农杆菌介导的转化方法已在其他地方描述(Ishida等人,Nat.Biotechnol.[自然生物技术]14:745-750(1996))。简言之,构建用于递送供体DNA以及Cas9和sgRNA的表达盒的二元载体。供体DNA可以引入到与Cas9和sgRNA的表达盒相同的二元载体中,或者可以引入到同一个二元载体中的单独的T-DNA中,或者可以引入到单独的二元载体中,所述单独的二元载体可以转化到同一个农杆菌菌株或单独的农杆菌菌株中并通过共转化一起递送。为了构建用于农杆菌介导的Cas9和sgRNA的递送的二元载体,将包含Cas9和sgRNA表达盒的DNA片段插入二元载体骨架中以形成pB-Cas9-U3-xMIR604FR2。
类似地,通过将包含同源臂(xJHAX-03和xJHAX-04)、eCry3.1Ab表达盒、mCry3A表达盒和PMI标记物表达盒的核酸片段插入二元载体中来构建二元供体载体。通过电穿孔将两种二元载体都引入包含辅助质粒的农杆菌菌株LBA4404中。将包含这些二元载体的农杆菌菌株混合,并且然后用于共感染玉蜀黍未成熟胚。将感染的胚与农杆菌细胞共培养2-4天,并且然后用于诱导愈伤组织。用包含甘露糖的培养基选择愈伤组织,并使用类似于Negrotto等人,Plant Cell Rep.[植物细胞报告]19:798-803(2000)的方法将甘露糖抗性愈伤组织再生成小植株。样品取自生根小植株用于qPCR Taqman测定以富集如在后续实例中所述的潜在靶向插入事件,并且然后进行连接PCR分析以鉴定如图2和图3所示的靶向插入事件。通过Southern分析和PCR产物测序进一步详细表征了鉴定的假定靶向插入事件。
实例5.由TALE核酸酶(TALEN)介导的转基因序列到MIR604插入位点安全港中的靶 向插入
实例5.1.针对AX-MIR604序列,选择TALEN识别靶标
从AX_MIR604(SEQ ID NO:2)选择靶序列用于TALEN设计。表3列出了所选序列、其名称和鉴别物编号。
表3.基于NP2222基因组序列(SEQ ID NO:2)所选择的TALEN靶序列
Figure BDA0003091563790000521
Figure BDA0003091563790000531
实例5.2.针对所选择的MIR604插入位点安全港序列,设计TALEN融合核酸酶
针对表3中的靶序列设计DNA结合特异性的TALEN。作为一个例子,这里是两对异二聚体TALEN的设计,以切割靶序列MIR604AXA2(又称为MIR604FR1,SEQ ID NO:66,5'-TACACGTACT AATCG TGCTT CACGC ACAGG CACAG CACGT AGTAG ACAGG A-3’)和MIR604AXA7(又称为MIR604FR2,SEQ ID NO:67,5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCCTTTGT TTAGG A-3’)。单独组装了识别MIR604AXA2序列中2个靶标,MIR604A2FW1(又称为mir604Fw1,5'-TACAC GTACT AATCG TGCT-3',SEQ ID NO:42)和MIR604A2RV1(又称为mir604Rv1,5'-TCCTG TCTAC TACGT GCT-3’,SEQ ID NO:43),的单个TALENT单体。对于针对MIR604A2FW1(又称为mir604Fw1,5'-TACAC GTACT AATCG TGCT-3’,SEQ ID NO:42)的TALEN,在RVD(重复可变双残基)重复内确定双残基的特异性如下,
Figure BDA0003091563790000541
对于针对MIR604A2RV1(又称为mir604Rv1,5'-TCCTG TCTAC TACGT GCT-3’,SEQID NO:43)的TALEN,在DVR重复内确定双残基的特异性如下,
Figure BDA0003091563790000542
我们构建了包含识别mir604Fw1(SEQ ID NO:42)的RVD的每个TALEN的三个版本:第一全长版本(cTNmir604Fw1-01,SEQ ID NO:68),其在RVD重复区之后保持大部分TAL效应子蛋白序列,如N-末端T3SS和NLS;第二较短的版本(cTNmir604Fw1-02,SEQ ID NO:69),其已经去除N-末端T3SS;以及第三短版本(cTNmir604Fw1-03,SEQ ID NO:70),其在RVD重复区之后,在N-末端T3SS中具有缺失,并且在NLS中也具有缺失。类似地,我们构建了包含识别mir604Rv1(SEQ ID NO:43)的RVD的每个TALEN的三个版本:第一全长版本(cTNmir604Rv1-01,SEQ ID NO:71),其在RVD重复区之后保持大部分TAL效应子蛋白序列,如N-末端T3SS和NLS;第二较短的版本(cTNmir604Rv1-02,SEQ ID NO:72),其已经去除N-末端T3SS;以及第三短版本(cTNmir604Rv1-03,SEQ ID NO:73),其在DVR重复区之后,在N-末端T3SS中具有缺失,并且在NLS中也具有缺失。这些工程化核酸酶的氨基酸序列示于SEQ ID NO:68(cTNmir604Fw1-01)、SEQ ID NO:69(cTNmir604Fw1-02)、SEQ ID NO:70(cTNmir604Fw1-03)、SEQ ID NO:71(cTNmir604Rv1-01)、SEQ ID NO:72(cTNmir604Rv1-02)和SEQ ID NO:73(cTNmir604Rv1-03)中。
又单独组装了识别MIR604AXA7(又称为mir604FR2,SEQ ID.NO:67)序列中另外2个靶序列,MIR604A7FW1(又称为mir604Fw2,5'-TGCAT CCGTG CAGTG CAGT-3',SEQ ID.NO:53)和MIR604A7RV1(又称为mir604Rv2,5'-TCCTA AACAA AGGAG GT-3’,SEQ ID NO:54),的单个TALENT单体。对于针对MIR604A7FW1(又称为mir604Fw2,5'-TGCAT CCGTG CAGTG CAGT-3’,SEQ ID NO:53)的TALEN,在RVD重复内确定双残基的特异性如下,
Figure BDA0003091563790000551
对于针对MIR604A7RV1(又称为mir604Rv2,5'-TCCTA AACAA AGGAG GT-3’,SEQ IDNO:54)的TALEN,在DVR重复内确定双残基的特异性如下,
Figure BDA0003091563790000552
我们构建了包含识别mir604Fw2(SEQ ID NO:53)的RVD的每个TALEN的三个版本:第一全长版本(cTNmir604Fw2-01,SEQ ID NO.74),其在RVD重复区之后保持大部分TAL效应子蛋白序列,如N-末端T3SS和NLS;第二较短的版本(cTNmir604Fw2-02,SEQ ID NO.75),其已经去除N-末端T3SS;以及第三短版本(cTNmir604Fw2-03,SEQ ID NO.76),其在RVD重复区之后,在N-末端T3SS中具有缺失,并且在NLS中也具有缺失。类似地,我们构建了包含识别MIR604Rv2(SEQ ID NO:50)的RVD的每个TALEN的三个版本:第一全长版本(cTNmir604Rv2-01,SEQ ID NO.77),其在RVD重复区之后保持大部分TAL效应子蛋白序列,如N-末端T3SS和NLS;第二较短的版本(cTNmir604Rv2-02,SEQ ID NO.78),其已经去除N-末端T3SS;以及第三短版本(cTNmir604Rv2-03,SEQ ID NO.79),其在RVD重复区之后,在N-末端T3SS中具有缺失,并且在NLS中也具有缺失。
对于MIR604AXA7(又称为mir604FR2,SEQ ID NO:67)序列切割,组装另一对具有略微不同氨基酸序列和识别特异性的TALEN:分别是包含识别mir604Fw2(SEQ ID NO:53)的RVD的cTNmir604Fw2-05(SEQ ID NO.80)和包含识别MIR604Rv2-LT(SEQ ID NO:65,5'-TCCTA AACAA AGGAG GTCC-3’)的RVD的cTNmir604Rv2-04(SEQ ID NO.81)。这些工程化核酸酶的氨基酸序列是在SEQ ID NO.74(cTNmir604Fw2-01)、SEQ ID NO.75(cTNmir604Fw2-02)、SEQ ID NO.76(cTNmir604Fw2-03)、SEQ ID NO.77(cTNmir604Rv2-01)、SEQ ID NO.78(cTNmir604Rv2-02)、SEQ ID NO.79(cTNmir604Rv2-03)、SEQ ID NO.80(cTNmir604Fw2-05)和SEQ ID NO.81(cTNmir604Rv2-04)中。
实例5.3.组装针对AX-MIR604插入基因座序列的TALEN
使用植物优选密码子,将人工TALE融合核酸酶蛋白序列(SEQ ID NO:68至SEQ IDNO:81)回译成DNA编码序列,以使玉米和其他单子叶植物中的表达最大化。这里显示了一些实例。例如,SEQ ID NO:82是cTNmir604Fw1-01蛋白质序列(SEQ ID NO:68)的DNA编码序列,并且SEQ ID NO:84是cTNmir604Rv1-01蛋白质序列(SEQ ID NO:71)的DNA编码序列。然后,从包含不同RVD重复、启动子和终止子的片段文库组装人工融合核酸酶DNA序列,以在如所述IIs型酶消化和连接之后直接形成TALEN表达盒(Cermak等人,Nucleic Acid Research[核酸研究]39(12):e82(2011);Zhang等人,Nature Biotech[自然生物技术]29:149-154(2011))。例如,组装的报道基因构建体MIRA2R1FLA-GUUS包含在玉蜀黍泛素启动子(prZmUbi1-10)的控制下编码cTNmir604Rv1-01(SEQ ID NO:71)的组装的TALEN序列TLNMIR604A2RV1(SEQ ID NO:84),并且还具有包含GUS片段的同向重复和18bp TALEN识别序列MIR604A2RV1(又称为mir604Rv1,5'-TCCTG TCTAC TACGT GCT-3’,SEQ ID NO:43)的反向重复的非功能性GUS重组测定底物盒。类似地,以类似的方式组装包含其他组装的TALEN的表达构建体。在许多情况下,将识别和切割靶序列MIR604AXA2(又称为MIR604FR1,5'-TACACGTACT AATCG TGCT T CACGC ACAGG CAC AG CACGT AGTAG ACAGG A-3’,SEQ ID NO:66,只显示上链)的一对TALEN,例如cTNmir604Fw1-01(SEQ ID NO:68)和cTNmir604Rv1-01(SEQ ID NO:71)的表达盒置于同一个转化载体中,以便协调它们在转化期间在靶组织中的同时表达。
实例5.4.针对AX_MIR604 DNA序列的TALEN活性的瞬时测定
将包含在玉蜀黍泛素启动子(prZmUbi1-10)的控制下编码cTNmir604Rv1-01(SEQID NO:71)的组装的TALEN序列(SEQ ID NO:84)和非功能性GUS重组测定底物盒的组装构建体MIRA2R1FLA-GUUS轰击到未成熟玉蜀黍胚中。GUS片段的同向重复还包含cTNmir604Rv1-01TALEN识别序列mir604Rv1(5'-TCCTG TCTAC TACGT GCT-3’,SEQ ID.NO:43)的反向重复。类似地,包含编码cTNmir604Fw1-01、cTNmir604Fw1-02、cTNmir604Fw1-03、cTNmir604Rv1-02、cTNmir604Rv1-03或其对应对的DNA序列的表达构建体与其一个或多个靶底物一起被轰击到玉蜀黍胚中。在许多情况下,将识别和切割靶序列的一对TALEN,例如针对MIR604AXA2(又称为mir604FR1,SEQ ID NO:66)的cTNmir604Fw1-01和cTNmir604Rv1-01,的表达盒置于同一个转化载体中,以便协调它们在靶组织中的同时表达。在轰击后1至4天,将转化的玉蜀黍胚置于X-Gluc溶液中过夜来经组织化学检测GUS活性。GUS活性仅在GUUS重复进行分子内重组时可见。识别MIR604FR1(SEQ ID NO:66)靶标的一对TALEN(cTNmir604Fw1-01和cTNmir604Rv1-01)的共表达大大增加了蓝斑数量(图4,处理FR1),这表明该靶序列被这对异二聚体TALEN切割来增加同源重组的频率。
实例5.5.由人工TALEN以高频率切割包含靶识别位点的玉蜀黍染色体基因座
为了测试由在玉蜀黍细胞中表达的TALEN对染色体靶序列mir604FR2(SEQ ID NO:67)的切割,使用两对不同的TALEN。第一对TALEN处于单个表达载体(21321)中,该单个表达载体(21321)包括编码用于表达cTNmir604Fw2-03和cTNmir604Rv2-03的核酸序列,并且第二对TALEN处于单个表达载体(21998)中,该单个表达载体(21998)包括编码用于表达cTNmir604Fw2-05和cTNmir604Rv2-04的核酸序列。将表达载体(21321和21998)各自与实例4.4.1中所述的供体载体21942一起通过基因枪转化共同递送到玉蜀黍胚中。在甘露糖上选择转化的胚以回收稳定的转基因植物。使用qPCR Taqman测定和/或PCR产物测序,针对靶向区域中突变的存在来分析稳定的转基因植物。表4中的结果显示,对于靶位点MIR604FR2(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGG A-3’,SEQ IDNO:67)的两对TALEN当TALEN表达载体用基因枪方法递送到植物细胞中时均导致稳定转化体中高百分比的突变。全长和截短版本的TALEN都可以有效地介导靶基因座处的靶向诱变。
有趣的是,我们还在许多再生的甘露糖选择逃逸植物中检测到MIR604插入位点基因座mir604FR2靶位点(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGG A-3’,SEQ ID NO:67)的突变。例如,在使用载体TALEN载体21321和供体21942的共转化实验中(表4),生成的植物中的14个,即MZET130501B017A、MZET130501B038A、MZET130501B027A、MZET130501B031A、MZET130501A012A、MZET130501B041A、MZET130501B096A、MZET130402A030A、MZET130501B044A、MZET130501B057A、MZET130501B084A、MZET130501B130A、MZET130501B045A、MZET130704C003A,在mir604FR2靶序列中包含突变,但是它们不携带来自供体或TALEN表达载体的任何可检测的转基因,并且因此逃避了甘露糖选择。在这些逃逸植物中,它们中的约5%在mir604FR2靶位点中具有突变,并且它们中的一些具有突变的mir604FR2靶序列的两个等位基因。因此,通过瞬时递送TALEN并且然后不经选择而直接再生未转化的植物来回收在靶位点中具有突变的植物,是一种可行的方法。可以通过用适当的测定(如PCR)筛选再生体的种群来鉴定突变体植物。
为了测试由农杆菌递送的、在玉蜀黍细胞中表达的TALEN对染色体靶基因座的切割,构建了包含不同成对的TALEN的表达盒的4种不同的二元载体(21631、21632、21633和21634)。这全部四个二元载体包括供体核酸序列,该供体核酸序列包括eCry3.1Ab、mCry3A和PMI的表达盒。21631和21633另外包括编码用于表cTNmir604Fw1-01和cTNmir604Rv1-01的核酸序列;21632和21634另外包括编码用于表cTNmir604Fw2-01和cTNmir604Rv2-01的核酸序列。21631和21632一个T-DNA中具有TALEN表达盒和靶向供体的基因,而21633和21634在两个单独的T-DNA中具有这些。预期21631和21633中的一对TALEN的表达将导致玉蜀黍基因组中染色体靶序列MIR604AXA2(又称为MIR604FR1,5'-TACAC GTACT AATCG TGCTT CACGCACAGG CACAG CACGT AGTAG ACAGG A-3’,SEQ ID NO:66)的切割。类似地,21632和21634中的一对TALEN的表达应该导致玉蜀黍基因组中染色体靶序列MIR604AXA7(又称为MIR604FR2,5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGACCTCC TTTGT TTAGG A-3’,SEQ ID NO:67)的切割。这些载体通过农杆菌介导的转化方法转化到玉蜀黍胚中。使用Taqman测定和/或PCR产物测序,针对靶向区域中突变的存在来分析稳定的转基因植物。表4中的结果显示,对于靶位点MIR604FR1(SEQ ID NO:66)和MIR604FR2(SEQ ID NO:67)的两对TALEN当经由农杆菌介导的转化而递送时均导致稳定转化体中的高百分比的突变(表4)。
表4.在源自TALEN表达载体和包含PMI选择性标记基因的供体载体的共转化的稳定转化体中,在天然染色体MIR604插入位点基因座处的mir604FR1(SEQ ID NO:66)和mir604FR2(SEQ ID NO:67)
靶序列的高比率诱变
Figure BDA0003091563790000601
实例5.6.由组装的TALEN介导的转基因序列到对应于MIR604插入位点的NP2222染色体基因座的靶向插入
使用粒子轰击,将培养的玉蜀黍良种近交品系NP2222的未成熟胚与靶向供体载体21942和TALEN表达载体21321或21998共转化(表4和表5)。靶向供体载体21942包含在MIR604插入位点处的TALEN切割位点(SEQ ID NO:67)侧翼的同源区域(xJHAX-03和xJHAX-04)为侧翼的性状基因表达盒。表5显示了在MIR604FR2切割位点(SEQ ID NO:67)处潜在靶向插入的分析结果。在519个PMI阳性稳定事件中获得了以下四个事件,这四个事件显示如对于双链同源重组所预期的PCR产物(表5)。其中,将单个事件确定为清楚的事件,这意味着它包括实例4.4.1中描述的供体核酸序列的单拷贝(特别地,eCry3.1Ab、mCry3A和PMI表达盒是无骨架的),显示出双交换同源重组事件的证据,并且不具有包括核酸酶的载体DNA的整合。
表5.由通过TALEN切割FR2序列介导的mCry3A、eCry3.1Ab和PMI表达盒到天然安全港基因座(天然MIR604插入位点基因座)的靶向插入
Figure BDA0003091563790000611
在以上实验中,使用粒子轰击培养的未成熟胚来进行转化。然而,未成熟胚或源自培养的胚的愈伤组织也可以用作靶标。还可以使用如表4所示的农杆菌介导的基因递送方法,使用靶组织,如未成熟胚、培养的胚或源自培养的胚的愈伤组织来进行转化。例如,土壤杆菌介导的转化和由TALEN介导的靶向插入至靶位点导致的事件的恢复可以使用如本领域描述的方式中的甘露糖选择(例如,美国专利号7,935,862)来进行,其中,例如,NP2222未成熟胚被用作转化靶标。
实例6.在由工程化的大范围核酸酶介导的安全港(MIR604插入位点)处的转基因 的靶向插入
实例6.1.用于设计工程化的大范围核酸酶的玉蜀黍染色体靶序列选择
用于替换短段DNA序列(等位基因替换)或插入大DNA片段(转基因插入)的转基因序列的靶向插入还可以通过使用由工程化大范围核酸酶引入的DNA断裂的同源重组来介导(Puchta和Fauser,Plant Journal[植物杂志]78:727-741(2014);Chen和Gao,Plant CellRep.[植物细胞报告]33:575-583(2014))。本实例显示,由工程化大范围核酸酶诱导的断裂是否可以用于介导将大DNA分子插入到玉米植物中所希望的染色体安全港靶标中。为了比较其对TALEN和CRISPR-Cas9的有效性,选择安全港基因座#1(MIR604事件插入位点)作为转基因插入位点。因此,虽然不受方法限制,但本申请教导了由3种核酸酶平台,即TALEN、大范围核酸酶和sgRNA-Cas9介导的转基因插入。针对最优靶标对玉蜀黍安全港基因座#1(又称为MIR604事件插入位点)序列(SEQ ID NO:1或SEQ ID NO:2)进行扫描用于使用本领域技术设计工程化大范围核酸酶,例如通过使用合理的蛋白质设计方法来设计具有改变的切割特异性的、基于LAGLIDADG家族大范围核酸酶I-CreI的工程化大范围核酸酶(美国专利号8,021,867)。选择合理设计的工程化I-CreI大范围核酸酶变体来介导转基因在安全港基因座的靶向插入,这些核酸酶变体以高效率和最小脱靶切割来切割靶序列。将编码新颖的大范围核酸酶变体的DNA序列置于玉蜀黍泛素-1启动子(prUbi1-10)随后是NOS终止子的控制下,并将表达盒亚克隆到基因枪转化载体骨架中。
为了测试工程化I-CreI大范围核酸酶变体在切割玉蜀黍染色体靶序列中的植物中活性及其通过同源重组介导靶向插入的能力,将大范围核酸酶表达载体与靶向供体载体21942共同轰击到未成熟玉蜀黍胚中。简言之,将携带工程化大范围核酸酶的表达盒的质粒DNA载体与编码供体核酸序列的载体21942的片段混合并沉淀到金粒子上。载体21942的供体核酸序列包含来自xJHAX-03至xJHAX-04的区域,这些区域包括如实例4.4.1所述的PMI标记基因和两个基因盒。在授粉后约9-11天从收获的未成熟穗分离未成熟胚,并在渗透培养基上预培养1至3天。然后使用BioRad PDS-1000基因枪粒子递送系统,用共沉淀的DNA载体(21942片段和大范围核酸酶表达质粒)用金粒子轰击预培养的胚。用于玉蜀黍未成熟胚轰击的方法、愈伤组织诱导组织再生和生根方法是本领域已知的(例如,Wright等人,2001,Plant Cell Reports[植物细胞报告]20:429-436(2001))。然后将轰击的胚在愈伤组织诱导培养基中孵育,并且然后移至甘露糖选择培养基上。将甘露糖抗性愈伤组织转移到再生培养基中以诱导芽形成。然后将芽进行继代培养到生根培养基上。然后从生根植物收获样品用于PCR和Taqman测定以鉴定包含靶向插入的潜在植物。通过更详细的PCR、测序和Southern分析来进一步表征鉴定的假定靶向插入事件用于确认。除了稳定转化的事件之外,我们还测定了在逃避甘露糖选择的再生植物中突变的存在,即不包含来自靶向插入供体或大范围核酸酶载体的任何转基因的转化逃逸。鉴定了如下逃逸植物,这些逃逸植物对于任何转基因为阴性,但在安全港基因座#1(MIR604插入位点)靶序列处具有突变。玉蜀黍细胞中大范围核酸酶的瞬时表达足以产生染色体靶标处的突变。同时,选择是任选的以获得突变体植物。如果筛选出足够数量的再生植物,则可以通过瞬时递送和植物细胞中大范围核酸酶的表达来容易地鉴定靶向突变体。
实例6.2.由工程化的大范围核酸酶介导的在MIR604插入位点安全港基因座处的靶向插入事件的产生
供体载体21942的两个同源臂,即xJHAX-03(SEQ ID NO:38)和xJHAX-04(SEQ IDNO:39)具有与安全港#1(MIR604插入位点SEQ ID NO:1和SEQ ID NO:2)一致的序列,并且用于引导使用同源重组将供体载体序列靶向插入到靶向基因座处的工程化大范围核酸酶的切割位点。还可以在基于Taqman分析的可能进行靶向插入的事件的一个亚组中进行PCR反应。通过详细的DNA测序和DNA印迹分析来分析使用跨越重组连接的PCR引物对在靶基因座处经鉴定具有靶向插入的事件,以证实靶向插入已经发生。
实例6.3.在农杆菌介导的转化下,由工程化的大范围核酸酶介导的在安全港基因座#1(MIR604插入位点)处靶向插入事件的生成
还可以用DNA供体和经由农杆菌递送的大范围核酸酶的表达载体来产生转基因到安全港基因座的靶向插入。农杆菌介导的转化方法是本领域熟知的(例如,Ishida等人,Nat.Biotechnol.[自然生物技术]14:745-750(1996))。大范围核酸酶表达盒和供体DNA可以置于单独的二元载体中或同一个二元载体中,并且然后在植物细胞中共转化。供体DNA和大范围核酸酶可以通过使用单独的二元载体共同递送。通过将来自载体21942的供体核酸序列(即,可操作地连接到xJHAX-03(SEQ ID NO:38)和xJHAX-04(SEQ ID NO:39)的三个表达盒,如实例4.4.1所述的)插入到用于农杆菌介导的转化的二元载体中来构建二元载体22445。还构建了一种二元载体,用于共同递送来自单个二元载体的供体核酸序列和大范围核酸酶表达盒,其中该供体核酸序列和大范围核酸酶表达盒各自可操作地连接到右边界序列和左边界序列,使得它们在单个二元载体中包括两个单独的T-DNA。经由电穿孔将这些二元载体转化到农杆菌菌株LBA4404(pVGW7)中,并且然后用于玉蜀黍未成熟胚的转化。对于农杆菌介导的转化,将包括包含2个T-DNA的二元载体的农杆菌菌株用于感染玉蜀黍未成熟胚。可替代地,将包含两个二元载体的农杆菌菌株混合,并且然后用于共感染玉蜀黍未成熟胚。将感染的胚与农杆菌细胞共培养2-4天,并且然后用于诱导愈伤组织。用包含甘露糖的培养基选择愈伤组织,并将甘露糖抗性愈伤组织再生成小植株。样品取自生根小植株用于Taqman和PCR分析,用于鉴定如上所述的用于基因枪转化的靶向插入事件。还可以在基于Taqman分析的可能具有靶向插入的事件的一个亚组中进行PCR反应。通过详细的DNA测序和DNA印迹分析来分析使用跨越重组连接的PCR引物对在靶基因座处经鉴定具有靶向插入的事件,以证实靶向插入已经发生。
实例7.转基因序列到基因组AX_MIR604基因座的靶向插入的分子表征
通过更详细的测序和DNA印迹分析来进一步表征通过PCR测定而鉴定的靶向插入事件,用于进行确认。例如,从筛选PMI阳性稳定事件(如表1和表5所示)获得如在一个或两个同源臂处发生的同源重组所预期的对于连接PCR呈阳性的事件(图2和图3)。使用包括AX_MIR604(SEQ ID NO:2)侧翼基因组区域(xJHAX-03和xJHAX-04)和部分转化供体载体的跨越靶向插入接点的引物进行详细重叠PCR分析。阳性PCR信号的存在表明,定点核酸酶确实介导靶向插入到MIR604FR2的DNA切割位点(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGACAGGA CCTCC TTTGT TTAGGA-3’,SEQ ID NO:67)处的MIR604安全港基因座(SEQ ID NO:2)中。详细的DNA印迹分析显示,如通过预期大小的存在所示,通过双交换同源重组,确实在MIR604插入位点安全港靶基因座处发生了基因叠加的插入(图5,泳道4、5、6和8)。泳道4、5、6和8具有约28Kb的带,如对于具有约18Kb的染色体靶片段的供体载体的双重组产物所预期的。来自泳道7(图5)中同一实验的另一个事件具有可能来自单个交叉重组的插入拷贝,并且具有额外的重排,因为重组带的大小远大于约28Kb的预期大小。
实例8.通过靶向插入技术获得的转基因事件的基因表达和昆虫抗性
通过qPCR和ELISA测定,针对转基因表达来评估靶向插入事件(MZET130403A067A、MZET134406B450A、MZET134504B010A、MZET134505A104A、MZET134711A236A、MZET140508A344A、MZET140807A856A、MZET140913A741A、MZET140913A594A、MZET130403A067A、MZET131500A128A)。作为对照,还针对性状基因表达来测定源自供体载体(21942或22445)的随机整合事件。还将表达水平与具有基因渗入的MIR604基因座的玉蜀黍品系(AX5707DW)进行比较。由于插入的转基因包含西方玉米根虫抗性基因mCry3Aa和eCry3.1Ab,因此通过在玉米根虫感染的盆中栽种它们来关于昆虫抗性的表现评估转基因事件及其子代。
实例9.用于鉴定在所希望的序列处具有靶向突变的植物的高通量测定
目前,使用以下方法之一鉴定靶向突变体。第一种方法是对靶区域进行PCR扩增,然后如果突变序列包含限制性位点,则进行限制性酶消化和凝胶电泳(Lloyd等人,2005,美国国家科学院院刊102:2232-37(2005);Zhang等人,美国国家科学院院刊107:12028-33(2010))。该方法简单,但需要存在适合的限制性位点,并且因此不能用于大多数靶标。第二种方法是靶区域进行PCR扩增,然后进行桑格测序或深度测序(Gross等人,Hum.Genet.[人类遗传学]105:72-78(1999);Shukla等人,Nature[自然]459:437-41(2009);Townsend等人,Nature[自然]459:442-45(2009))。测序方法是确定的和敏感的,但需要更长的时间,并且通量可以受到容量的限制。第三种方法是对靶区域进行PCR扩增,然后进行变性、退火和毛细管电泳(Li-Sucholeik等人,Electrophoresis[电泳]20:1224-1232(1999);Larsen等人,Hum.Mutat.[人类突变]13:318-327(1999))或变性高效液相色谱以通过异源双链分析来检测碱基对变化(McCallum等人,Nature Biotechnology[自然生物技术]18:455-457)。这些方法受到通量的限制,并且鉴定的突变需要通过测序进一步验证。第四种方法是对靶区域进行PCR扩增,然后进行变性、异源双链体形成/链退火、用错配特异性核酸酶(如CEL1和T7内切核酸酶)消化和凝胶电泳(Oleykowski等人,Nucleic Acids Res.[核酸研究]26:597-4602(1998);Colbert等人,Plant Physiol.[植物生理学]126:480-484(2001);Lombardo等人,Nat.Biotechnol.[自然生物技术]25:1298-306(2007)),例如使用可商购的SurveyerTM核酸酶测定试剂盒(转基因组学公司(Transgenomic),盖瑟斯堡(Gaithersburg),马里兰州,美国;Qiu等人,BioTechniques[生物技术]36:702-707(2004))。然而,基于凝胶的测定不如高通量DNA测序那么敏感,并且只能检测1%或更高频率的突变。因此,仍然需要用于鉴定靶序列的诱导突变的简单且高通量的方法。另外,鉴定靶位点中潜在突变体的所有以上方法都是基于处于定性形式的新信号、凝胶中的新带或不同于野生型参考序列的色谱图中的新峰的存在。
我们开发了一种用于鉴定潜在突变的替代方法。该方法测量了与如图6所示的参考样品相比较,已经以定量形式用定点核酸酶处理的细胞或组织中野生型靶位点序列的减少。在从野生型(WT)组织分离的DNA样品中,靶序列DNA拷贝数没有减少。典型地,针对二倍体生物体中单拷贝基因,WT组织中的拷贝数得分记录是2个拷贝。例如,WT玉蜀黍中的ADH基因有2个拷贝。如果拷贝中的一个突变,则只剩下野生型(WT)靶位点序列的一个拷贝。如果靶序列的两个拷贝突变,则M靶序列的拷贝数变为零(图6)。因此,通过进行定量聚合酶反应测定来测量靶序列拷贝数的变化,可以通过将结果与参考样品(如WT组织)的结果进行比较来检测DNA样品中是否存在突变。这种定量方法与先前已知的方法显著不同。
可以通过若干种定量聚合酶反应(qPCR)技术来测定靶基因拷贝数。通常,qPCR以这样的方式进行,使得随着反应进行,或以“实时”方式定量检测并测量扩增的DNA。因此,qPCR也称为实时PCR。有若干种潜在的方法在qPCR中用于实时检测产物:(1)用任何双链DNA插入的非特异性荧光染料(如
Figure BDA0003091563790000661
绿)测量PCR产物;当正在研究单个扩增子时,该检测方法是合适的,因为该染料将插入到所生成的任何双链DNA中。(2)基于寡核苷酸探针的靶序列特异性结合的PCR产物的测量,这些寡核苷酸探针用荧光报道基因标签共价标记,如在
Figure BDA0003091563790000662
探针、分子BeaconsTM、或Scorpion引物中的。寡核苷酸本身没有显著的荧光,但是它当退火到模板时(如在分子BeaconsTM中)或当延伸期间染料被从寡核苷酸剪除时(如在
Figure BDA0003091563790000663
探针中)而发荧光。荧光探针的优势是它们可以在用于检测相同反应中的若干种靶序列的多重测定中使用。用
Figure BDA0003091563790000664
探针,靶序列特异性寡核苷酸探针被构建成一端有荧光报道基因并且相反端有荧光淬灭剂。报道基因与淬灭剂的紧密靠近阻止其荧光的检测。荧光寡核苷酸探针被Taq聚合酶的5'-至3'-外切核酸酶活性分解,因此荧光标签不再与淬灭剂接近,并且从而允许荧光的不淬灭发射,这可以在激发后用激光检测到(Groves,JBiomol.Tech.[生物分子技术杂志]10:11-16(1999))。每个PCR循环中PCR产物的拷贝数增加导致由于探针分解和报道基因释放引起的荧光成比例增加。
作为一个例子,我们设计了基于
Figure BDA0003091563790000671
探针的方法来特异性检测玉蜀黍基因组MIR604插入位点序列处的靶向突变,该MIR604插入位点序列包含靶向SEQ ID NO:3(5'-AGTGC AGTGC AGTGC AGGAC AGG-3')的CRISPR-Cas9核酸酶gRNA的切割位点和切割靶序列(SEQ ID NO:67,5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGGA-3’)的成对的TALEN(cTNmir604Fw2-01/cTNmir604Rv2-01)。如图7所示,用于检测SEQ IDNO:67靶序列内的突变的实时qPCR Taqman测定由以下组成:两种引物,FW引物,5'-CACACCTCGT TGCCA AAGC-3’(SEQ ID NO:92)和RV引物,5'-CATCG CGTCC TAAAC AAAGG A-3’(SEQID NO:93),以及荧光标记的
Figure BDA0003091563790000672
探针(5'-CCTGT CCTGC ACTGC-3',SEQ ID NO:94),该探针与核酸酶切割靶位点序列(5'-GCAGT GCAGG ACAGG-3’,SEQ ID NO:95,如图6所示的靶位点M)杂交。
实例10.在所希望的没有转基因插入的序列处,具有靶向突变的植物的产生
使用如以上以及图6和图7中所概述的靶标特异性测定和用于其他靶序列的qPCRTaqman测定,针对不同靶序列的拷贝数对从用如先前实例4和实例5中所述的工程化TALE核酸酶或gRNA-Cas9处理的未成熟胚再生的玉蜀黍植物进行了测定。表6显示以下结果。
包括用于测定4(Mir604 JHAX Fw2/Rv2_MGB)的序列5'-CCTGT CCTGC ACTGC-3'(SEQ ID NO.94)的荧光标记的MGB
Figure BDA0003091563790000673
探针用于检测对应于图6中的靶序列M的完整核酸酶切割位点序列(5'-GCAGT GCAGG ACAGG-3’,SEQ ID NO:95)的拷贝数。“低”拷贝数得分记录具有1个拷贝。“中”拷贝数得分记录具有2个拷贝。“高”拷贝数得分记录具有3个或更多个拷贝。在没有靶位点突变的WT玉蜀黍植物和再生植物中,使用测定4(表6中最后一列,Mir604 JHAXFw2/Rv2_MGB)的拷贝数得分记录为“中”(2个拷贝)。在这组的20株植物中,11株植物(55%)在基因组靶序列(SEQ ID NO:95,5'-GCAGT GCAGG ACAGG-3’)处没有突变,但6株植物(30%)在这些靶序列的一个拷贝中具有突变(低拷贝得分记录),并且3株植物(15%)具有突变的两个拷贝的靶序列(拷贝得分记录为0)。由于qPCR测定可以是多重化的,所以同时进行用于检测转基因序列的其他若干种测定。在这组植物中,20株植物中的7株包含可检测的转基因插入(对于测定1至3为阳性)。在具有靶序列突变的9株植物中,它们中的5株(MZET130501B027A、MZET130501B031A、MZET130501B038A、MZET130501B044A和MZET130501B045A)不包含任何可检测的转基因插入,包括具有突变(双等位基因突变或纯合的突变)的两个拷贝的靶序列的1株植物(MZET130501B027A)。该实验清楚地表明,通过瞬时表达定点核酸酶,不需要转基因插入,可以有效地产生所希望的序列处的靶向突变。此外,可以使用高通量实时qPCR测定来有效地鉴定这些突变体,这些高通量实时qPCR测定包含至少一种与核酸酶切割位点杂交的测定探针。
表6.使用qPCR Taqman测定,在来自基因枪转化实验的再生玉蜀黍植物中的靶序列(SEQ ID NO:67)的拷贝数确定
Figure BDA0003091563790000691
1测定1(cTNmir604Fw2-03)用于检测定点TALE核酸酶表达载体(21321)的插入
2测定2用于检测存在于供体载体(21942)中的插入的可选择性标记基因cPMI-09
3测定3用于检测存在于供体载体(21942)中的插入的昆虫控制基因mCry3A
4测定4(Mir604 JHAX Fw2/Rv2_MGB)用于检测完整靶序列(5'-GCAGT GCAGGACAGG-3’,SEQ ID NO:95)的拷贝数,该完整靶序列与包括序列5'-CCTGT CCTGC ACTGC-3'(SEQ ID NO:94)的Taqman探针杂交
实例11.用于富集在所希望的基因组基因座处具有潜在靶向插入的植物的高通量 测定和策略
为了鉴定在MIR604插入位点安全港基因座处包含靶向插入的潜在转基因事件,我们开发了一种富集潜在突变的高通量方法。该方法涉及使用一种测定(图8A中的测定T)来鉴定一种植物,该植物具有减少的靶序列(靶标T)的拷贝数。测定靶标T的荧光探针位于靶基因座区域中距离测定靶标M(图8A)的荧光探针至少5个核苷酸,该测定靶标M检测定点核酸酶切割位点M(也在图6中)的拷贝数。应当注意,测定T探针可以与测定M探针位于同一个扩增子内。然而,它应该尽可能远离M,只要它仍然在由转基因序列的靶向插入替换的区域内(如图8A所示,包含感兴趣的基因的区域(GOI))。由于靶向插入通常替换核酸酶切割位点(M)以外的靶基因座处的某些序列,而通过NHEJ在核酸酶切割位点处最可能被修饰的非靶向事件通常具有较小的靶位点缺失。如果植物在核酸酶切割位点(靶标M)处具有减少的拷贝数,但在靶标区域进一步更远(靶标T)处没有减少的拷贝数得分记录(即野生型),则该植物很可能仅具有小的缺失并在靶基因座处没有靶向插入(图8A和图8B中的事件类型a、b和c),并且可以丢弃,而不管靶标M或靶标G拷贝数得分记录。通过查看测定G结果可以进一步富集事件。可以进一步丢弃对GOI(测定G)为阴性的任何植物,即无转基因的图8A中的事件类型d和e。选择剩余的这些植物,即图8B中的具有阳性GOI信号的从d到i的事件类型,作为在靶基因座具有潜在靶向插入的候选植物,并且这些事件进一步通过对于如图2所示的重组连接特异的PCR反应来表征。
实例12.高通量qPCR测定用于富集在基因组安全港基因座MIR604插入位点处具有 靶向插入的候选转基因事件的用途
使用靶标特异性测定1(表7,对应于图8中的测定T)、对于来自从用如先前在实例5中所述的工程化TALEN处理的未成熟胚再生的玉蜀黍植物的核酸酶切割位点(表7,对应于图8中的靶标M)和其他转基因序列(表7中的测定3至7,对应于图8中的测定G)的测定2,获得不同靶序列的拷贝数得分记录的结果。
表7显示出获得自共递送TALE核酸酶表达载体21321和供体载体21942的靶向实验的一些代表性的玉蜀黍植物的测定结果。在该实验中,对应于图8的测定T的测定1具有5’-CTCGT TGCCA AAGCT GCATC CGT-3’(SEQ ID NO:97)的Taqman探针序列,该Taqman探针序列位于距离核酸酶切割位点(EQ ID NO:67,5'-TGCAT CCGTG CAGTG CAGTG CAGTG CA/GGACAGGA CCTCC TTTGT TTAGG A-3’,其中“/”表示潜在的切割位置)18个碱基处。不管其他测定结果,都可以丢弃对靶标(测定1)具有“中”拷贝数得分记录的所有植物,因为没有同源重组介导的靶序列(SEQ ID NO:67)的替换。在某些事件(MZET130501A012A和MZET130501B033A)中,测定1具有比测定2更高的拷贝数得分记录,这意味着核酸酶切割位点周围的缺失在靶区域处相对较小。通过使用来自其他测定(测定3至测定7)的结果,可以通过丢弃不具有感兴趣基因(GOI)的植物来获得进一步富集。如果需要高质量的靶向插入事件,则可以丢弃对于核酸酶表达载体(测定6)和/或载体骨架(测定7)为阳性并且具有多于一个拷贝的供体载体(测定3至5)的任何植物。通过使用这种富集方法,仅来自靶向插入实验的总转基因植物的一个亚组会需要通过其他测定(如连接PCR(图2和图3)和DNA印迹分析(图5))进一步被分析,以鉴定真正靶向插入事件。例如,通过遵循以上富集方法从靶向插入实验MZET131500A中的一组334株植物来鉴定事件MZET131500A118A和MZET131500A128A(图5)。
表7.转基因事件的Taqman测定和使用qPCR Taqman测定,使用测定结果来富集源自基因枪转化实验的再生玉蜀黍植物的潜在靶向插入事件。
Figure BDA0003091563790000721
Figure BDA0003091563790000731
实例13.在MIR604转基因基因座处靶向基因叠加和转基因序列的替换
实例13.1.玉蜀黍商业事件MIR604的T-DNA插入序列
玉蜀黍事件MIR604包含玉蜀黍基因组中的pNOV2130 T-DNA的单拷贝插入。克隆T-DNA插入片段及其侧翼基因组序列并示于图9中。PMI标记基因序列(cPMI-01,Seq.IDNo.98)存在于位于紧邻侧翼玉蜀黍基因组区域MIR604LBFS1的转基因T-DNA插入片段中。
实例13.2.在MIR604事件转基因基因座中TALEN靶位点序列的选择
为了将另外的性状基因盒叠加到MIR604转基因基因座上,我们将努力集中在转基因的独特区域。该PMI基因(cPMI-01,SEQ ID No.98)是所希望的靶标,因为它是选择性标记基因,并且在完成转基因植物产生后不再需要。可以使用新的选择性标记基因盒来替换PMI盒,使用MIR604_RBFS1或mCry3A基因表达盒以及MIR604_LBFS1作为同源区域。我们已经在PMI基因中选择了3个靶序列(Seq.ID No.99至101)来设计和组装TALEN,用于证明基因插入到MIR604转基因基因座中的可行性。PMI_靶_序列#1包含以下序列,5’-TTAAC TCAGT GCAAAACTAT GCCTG GGGCA GCAAA ACGGC GTTGA CTGAA-3’(SEQ ID No.99);PMI_靶_序列#2具有以下序列,5’-TCTCC ATTCA GGTTC ATCCA AACAA ACACA ATTCT GAAAT CGGTT TTGCC AAA-3’(SEQ ID No.100);并且PMI_靶_序列#3包含以下序列,5’-TGCAC ATCCG GCGAT TGCTCACTTT TTACA ACAGC CTGAT GCCGA ACGTT TAA-3’(SEQ ID No.101)。
实例13.3.针对PMI基因序列,设计和组装TALEN融合核酸酶基因
设计TALEN用于在序列靶标#1和#3(SEQ ID No.99和101)处靶向切割PMI转基因。例如,针对TsPMIFW1(5’-TTA ACT CAG TGC AAA ACT-3’,SEQ ID No.102)和TsPMIRV1(5’-TTC ACT CAA CGC CGT TTT-3’,SEQ ID No.103)设计了一对用于切割PMI靶序列#1(SEQ IDNo.99)的TALEN。设计TALEN分子TLN_PMIFW1a(SEQ ID No.108)以结合TsPMIFW1序列靶标(5’-TTA ACT CAG TGC AAA ACT-3’,SEQ ID No.102),并且设计TALEN分子TLN_PMIRV1a(5’-TTC AGT CAA CGC CGT TTT-3’,SEQ ID No.109)以识别TsPMIRV1序列靶标(SEQ IDNo.103)。类似地,针对TsPMIFW3(5’-TGC ACA TCC GGC GAT TGC T-3’,SEQ ID No.106)和TsPMIRV3(5’-TTA AAC GTT CGG CAT CAG-3’,SEQ ID No.107)设计另一对TALEN用于切割PMI靶序列#3(SEQ ID No.101)。设计TALEN分子TLN_PMIFW3(SEQ ID No.110)以结合TsPMIFW3序列(5’-TGC ACA TCC GGC GAT TGC T-3’,SEQ ID No.106),并且设计TALEN分子TLN_PMIRV3(SEQ ID No.111)以结合TsPMIRV3序列(5’-TTA AAC GTT CGG CAT CAG-3’,SEQID No.107)。将设计的TALEN蛋白质TLN_PMIFW1a(SEQ ID No.108)、TLN_PMIRV1a(SEQ IDNo.109)、TLN_PMIFW3(SEQ ID No.110)和TLN_PMIRV3(SEQ ID No.111)的蛋白质编码序列回译成DNA序列。如先前实例中所述的组装编码这些TALEN的DNA分子。TALEN基因DNA序列cTNPMIFW1a(SEQ ID No.112)、cTNPMIRV1a(SEQ ID No.113)、cTNPMIFW3-02(SEQ IDNo.114)和cTNPMIRV3-02(SEQ ID No.115)分别编码TLN_PMIFW1a(SEQ ID No.108)、TLN_PMIRV1a(SEQ ID No.109)、TLN_PMIFW3(SEQ ID No.110)和TLN_PMIRV3(SEQ ID No.111)。
实例13.4.TALEN表达载体和靶向供体载体构建
将DNA序列cTNPMIFW3-02(SEQ ID No.114)和cTNPMIRV3-02(SEQ ID No.115)引入表达盒中,每个由组成型启动子驱动。然后将两个TALEN基因表达盒引入二元载体骨架中以形成二元载体22840。供体载体22842包括供体核酸序列,该供体核酸序列包括两个同源序列(xMIR604-01和xMIR604-02)之间的杀虫基因表达盒和草甘膦耐受基因盒。该草甘膦耐受性基因盒包括基因ZmEPSPS,其存在可用于鉴定供体核酸序列的成功插入。这两个同源序列(xMIR604-01和xMIR604-02)与TALEN靶序列侧翼的序列,即PMI_靶_序列#3(SEQ IDNo.101)一致。经由同源重组将来自载体22872的供体序列靶向插入到由TALEN切割介导的MIR604转基因基因座中,这示于图10中。
实例13.5.将另外的性状基因叠加到商业事件(MIR604)的转基因基因座中并使不需要的转基因失活
广泛培养玉米MIR604事件用于控制西方玉米根虫(WCR)(Que等人,2010,GMCrops.[转基因作物]1,220-229)。MIR604转基因包含用于产生转基因事件的PMI选择性标记基因(图9)。PMI基因不提供任何农艺益处,并且在事件产生后不再需要。然而,它可以用作将其他性状基因盒插入MIR604基因座的着陆点(landing pad)。为了证明这种效用,将MIR604转基因基因座渗入优良玉米转化品系(NP2222)中以形成新的转基因受体品系NP2222DW。将品系NP2222DW用作经由同源重组通过定点核酸酶介导的插入到PMI基因中产生靶向插入事件的转化宿主。将源自自交或同胞杂交的NP2222DW植物的未成熟胚与包含二元载体22840(包括TALEN表达盒)或22872(包括供体核酸序列,其包括两个表达盒)的重组缺失(recA-minus)的农杆菌菌株LBA4404(携带辅助质粒pVGW7)进行共同感染。产生来自感染的未成熟胚的转基因事件是如所述的,除了将草甘膦用作选择(Negrotto等人(2000),Plant Cell Rep.[植物细胞报告]19,798-803)。在2mM的草甘膦上选择源自感染的未成熟胚的愈伤组织。使植物在包含0.2mM草甘膦的培养基上再生。对草甘膦选择的植物进行取样,用Taqman测定来确定转基因拷贝数和靶位点切割。
针对用跨越重组连接的引物的靶向整合,通过PCR进一步分析具有靶序列切割的植物(图10)。例如,为了扩增涉及xMIR604-02的重组连接,使用了引物对(P1/P2),FE4796(SEQ ID NO:127)/FE4793(SEQ ID NO:128),并且如果重组发生,该反应将产生2.13Kb的PCR产物。还将另外的引物对,具有2.5kb的产物的FE35036(SEQ ID NO:129’)/FE35037(SEQID NO:130)用于鉴定涉及xMIR604-02的同源区的潜在靶向重组体。为了扩增涉及xMIR604-01的重组连接,使用了一对引物(P3/P4),FE35034(SEQ ID NO:131)/FE35035(SEQ ID NO:132),并且如果存在同源重组,预期PCR反应产生2Kb的产物。表8示出了使用草甘膦选择恢复了靶向事件(“ZmEPSPS阳性事件”)的靶向插入的若干实验。这些实验表明,包含另外的性状基因的DNA序列可以通过TALEN介导的同源重组有效插入到现有的商业事件MIR604基因座中。应该指出,包括工程化大范围核酸酶、锌指核酸酶或CRISPR-Cas9的其他定点核酸酶可以用于取代在以上提到的载体22840中的TALEN,用于切割PMI基因序列以介导靶向插入。类似地,包括基因枪粒子轰击、晶须介导的转化、电穿孔和PEG介导的原生质体转化的其他基因递送方法可以用于引入定点核酸酶表达载体和供体DNA分子。
表8.由从通过农杆菌感染递送的载体22840表达的TALEN介导的供体载体22872中同源序列为侧翼的表达盒到MIR604
转基因基因座中的靶向插入
Figure BDA0003091563790000771
*基于如通过qPCR Taqman测定而确定的靶序列(cPMI-01)拷贝数得分记录。**如通过用跨越重组连接的引物进行的PCR反应所鉴定的(图10)
实例13.6.通过替换PMI基因盒或整个转基因将另外的性状基因叠加到MIR604转基因基因座中
携带MIR604转基因的基因组区域是性状基因表达的优选位置。除了将另外的转基因插入到PMI基因中之外,整个MIR604转基因基因座可以通过替换部分转基因序列或整个T-DNA插入片段来用作插入其他性状基因盒的着陆点。类似于靶向插入到以上PMI基因(实例13.5)中,将品系NP2222DW用作经由同源重组通过定点核酸酶介导的插入到MIR604基因座中产生靶向插入事件的转化宿主。为了仅替换PMI盒,将mCry3A基因和LBFS区域用作供体载体中的同源序列(图11)。相同的TALEN表达载体(22840)可以与包含杀虫(IC)表达盒和选择性标记(如PMI、ZmEPSPS或PAT)表达盒的供体一起递送到NP2222DW玉蜀黍细胞中(图11)。此外,可以将一种或多种定点核酸酶用于在PMI盒序列中引入染色体断裂。例如,两种或更多种单个引导RNA(sgRNA)可以与Cas9蛋白结合用于切割PMI盒序列同时去除整个PMI表达盒(图11)。将未成熟胚置于愈伤组织诱导培养基上,并且然后在包含双丙氨磷的培养基上选择愈伤组织。来自感染的未成熟胚的转基因事件的产生是例如如以上对于甘露糖或草甘膦所述的,其中双丙氨磷还可以用作选择剂。针对用Taqman测定的转基因拷贝数和靶位点切割,对所选植物进行取样。针对用跨越重组连接的引物的靶向整合,通过PCR进一步分析具有靶序列切割的植物(图11)。
为了替换整个MIR604 T-DNA插入片段,将RBFS和LBFS都插入到供体分子中以作为同源序列来介导新颖性状基因盒(例如杀虫(IC)基因表达盒1、2和作为经由同源重组的第三个盒的选择性标记(例如,PAT)表达盒)的插入(图12)。将从自交或同胞杂交的NP2222DW穗分离的未成熟胚与包含二元载体22840以及包括IC表达盒1、2和PAT表达盒的供体DNA载体的重组缺失(recA-minus)的农杆菌菌株LBA4404(携带辅助质粒pVGW7)进行共同感染。类似地,可以同时使用多于一个的定点核酸酶来切割多于一个的MIR604转基因序列。例如,两个或更多个单个引导RNA(sgRNA)可以与Cas9蛋白结合用于切割MIR604转基因内的T-DNA序列(例如,LB-和RB-近端序列和/或PMI和mCry3A盒),同时去除MIR604 T-DNA插入片段的至少一个表达盒(图12)。将感染的未成熟胚置于愈伤组织诱导培养基上,并且然后在包含双丙氨磷的培养基上选择愈伤组织。来自感染的未成熟胚的转基因事件的产生是例如如以上对于甘露糖或草甘膦所述的,其中双丙氨磷还可以用作选择剂。针对用Taqman测定的转基因拷贝数和靶位点切割,对所选植物进行取样。针对用跨越重组连接的引物的靶向整合,通过PCR进一步分析具有靶序列切割的植物(图12)。对于本领域技术人员来说显而易见的是,包括基因枪粒子轰击、晶须介导的转化、电穿孔和PEG介导的原生质体转化的其他基因递送方法可以用于引入定点核酸酶表达载体和供体DNA分子。
实例14.靶向基因叠加和包含非功能性选择性标记基因的转基因基因座的替换
实例14.1.设计和组装在包含非功能性选择性标记基因的转基因基因座中用于制造染色体断裂的TALEN
本领域已知,通过使用农杆菌介导的转化并利用由天然大范围核酸酶I-CeuI的表达产生的dsDNA断裂,可将转基因序列插入到包含截短的非功能性选择性标记基因PMI的转基因玉蜀黍和水稻基因座中(美国专利号7,935,862,通过引用结合在此)。然而,由天然大范围核酸酶介导的靶向插入受到以下事实的限制:先前工程化的核酸酶切割位点必须首先插入到转基因基因座中。在这里,我们想测试是否可以针对现有转基因基因座内的随机选择的序列设计新颖的设计定点核酸酶(如TALEN),以介导另外的转基因序列的靶向插入,以克服这个限制。为了实现这一点,针对pNOV5025转基因事件的转基因基因座内的随机选择的靶序列(5’-ATAGA GATCC TCTAG AGTCG ACCAT GGTGA TCACT GCAGG CATGC AAGCT TGT-3’,SEQ ID.No.116,仅显示上链)设计了两对TALEN。选择该段DNA内的两个序列作为TALEN结合位点,5’-ATAGA GATCC TCTAG AGT-3’(又称为rPMIFw1,SEQ ID No.117,仅显示上链)和5’-ACAAG CTTGC ATGCC TGC-3’(又称为rPMIRv1,SEQ ID No.118,仅显示下链)。一对TALEN由针对靶序列rPMIFw1 5’-ATAGA GATCC TCTAG AGT-3’(SEQ ID NO:117)设计的一个全长TALEN(cTNrPMIFw1-01,SEQ ID No.119)和针对靶序列rPMIRv1 5’-ACAAG CTTGCATGCC TGC-3’(SED ID No.118)设计的另一全长TALEN(cTNrPMIRv1-01,SEQ ID No.120)组成。第二对TALEN由针对靶序列rPMIFw1,5’-ATAGA GATCC TCTAG AGT-3’(SEQ.ID.No.117)设计的一个截短的TALEN(cTNrPMIFw1-02,SEQ ID NO:121)和针对靶序列rPMIRv1,5’-ACAAG CTTGC ATGCC TGC-3’(SEQ ID No.118)设计的另一个截短的TALEN(cTNrPMIRv1-02,SEQ ID NO:122)组成。
实例14.2.对于截短的PMI靶基因座序列的TALEN的表达和转化载体
然后,从包含不同RVD重复、启动子和终止子的片段文库组装人工融合核酸酶DNA序列,以在如所述IIs型酶消化和连接之后直接形成TALEN表达盒(Cermak等人,2011,Nucleic Acid Research[核酸研究]39(12):e82;Zhang等人,2011,Nature Biotech[自然生物技术]29:149-154)。制备了针对截短的PMI靶序列的TALEN的若干个表达载体(21438、21792和21793)。载体21438包括TALEN cTNrPMIFw1-01和cTNrPMIRv1-01的表达盒。载体21792包括TALEN cTNrPMIRv1-01和cTNrPMIFw1-01的表达盒。载体21793包括TALENcTNrPMIRv1-02和cTNrPMIFw1-02的表达盒。最初,将现有的靶向供体载体pNOV5045(美国专利号7,935,862)用于测试靶向插入。之后,还构建了另外的靶向供体载体21779和22173并用于靶向插入实验(表9)。供体载体pNOV5025、21779和22713包含用于恢复PMI功能的PMI内含子盒的互补5’-区域以及还有其他感兴趣序列和同源区域。在通过TALEN切割染色体靶序列时,可以经由同源重组将供体载体序列整合到靶位点。
实例14.3.由TALEN介导的转基因到包含非功能性截短的PMI基因的转基因基因座中的靶向插入
使用PPO作为选择性标记,使用如所述的在玉蜀黍品系NP2222中的农杆菌介导的转化,从靶向载体pNOV5025(描述于美国专利号7,935,862中)产生选择性转基因基因座。为了测试TALEN介导的靶向插入到这些pNOV5025基因座中的作用,将供体载体(pNOV5045、21779或22173)与TALEN表达载体(21438、21792或21793)共同递送到未成熟的玉蜀黍胚组织中。在基因递送和组织回收之后,将转化的靶组织置于包含甘露糖选择剂的培养基上以回收具有靶向插入的事件,即具有如所述的重组功能性PMI基因的细胞(美国专利号7,935,862)。通过同源重组的靶向插入事件应该对甘露糖有抗性。为了区分真正的靶向事件与选择逃逸,首先通过使用跨越靶向插入接点的引物的PCR来分析来自假定的甘露糖抗性事件的组织(愈伤组织或叶)。阳性PCR信号的存在表明TALEN介导的到pNOV5025转基因基因座中的靶向插入。通过DNA印迹分析方法进一步分析阳性事件,以证实这些事件具有如所述的真正的靶向插入(美国专利号7,935,862)。表9显示了若干个靶向插入实验的结果。结果表明,通过使用不同的TALEN表达载体和靶向供体,以有用的频率重构选择性标记基因,可以将有用的性状基因可重复地插入到预定的转基因基因座中。全长和截短版本的TALEN都可以介导转基因基因座处的靶向插入。
表9.用由TALEN表达介导的不同供体载体进行pNOV5025转基因靶基因座的靶向插入实验
Figure BDA0003091563790000811
虽然为了清楚理解的目的已经通过说明和举例的方式在一定详细程度上描述了以上发明,显然的是在本发明的范围内可以进行某些改变和变更。
本发明的一些实施方案如下:
1.一种将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法,该方法包括将以下各项引入玉蜀黍细胞中:
a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90%一致性,该组包括:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66和SEQ ID NO:67;以及
b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割,该组包括:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66和SEQ ID NO:67,
该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此转基因被整合到玉蜀黍基因组中的基因组核酸酶靶切割位点处。
2.如实施方案1所述的方法,其中该基因组核酸酶切割位点位于染色体1上的染色体区间内,该染色体区间由以下定义并且包括以下:如由玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,015,000。
3.如实施方案1-2中任一项所述的方法,其中该第一核酸分子和该第二核酸分子通过基因枪核酸递送被引入到玉蜀黍细胞中。
4.如实施方案1-2中任一项所述的方法,其中该第一核酸分子和该第二核酸分子经由农杆菌被引入到玉蜀黍细胞中。
5.如实施方案1-2中任一项所述的方法,其中该第一核酸分子和该第二核酸分子存在于单个核酸构建体上。
6.如实施方案1-2中任一项所述的方法,其中该第一核酸分子和该第二核酸分子存在于单独的核酸构建体上。
7.如实施方案1-6中任一项所述的方法,其中该第一核酸分子和/或该第二核酸分子在玉蜀黍细胞中瞬时表达。
8.一种生产玉蜀黍植物或植物部分或其子代的方法,该玉蜀黍植物或植物部分或其子代包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过如实施方案1所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。
9.一种通过如实施方案8所述的方法生产的玉蜀黍植物或植物部分或其子代,该玉蜀黍植物或植物部分或其子代包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因。
10.一种富集细胞的方法,该细胞包括插入到细胞基因组中的核酸酶切割位点中的转基因,该方法包括:
a)将以下各项引入多个细胞中:
i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;和
ii)编码以下核酸酶的第二核酸分子,该核酸酶在与对应于(i)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,
该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行;
b)培养(a)的细胞以生产至少一种细胞系或组织;
c)从(b)的每种细胞系或组织中提取基因组DNA样品;
d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G,其中这些测定T和G分别包括以下探针:
i)包括以下核苷酸序列的第一探针,该核苷酸序列互补于靶位点的核苷酸序列,距离用于进行测定T的核酸酶切割位点至少五个碱基对,和
ii)包括以下核苷酸序列的第二探针,该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列;
e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数;并且
f)富集在测定T中相对于参考具有减少的拷贝数并且对于测定G,具有大于零的拷贝数的细胞系或组织,
从而富集包括插入到细胞基因组中的核酸酶切割位点中的转基因的该细胞。
11.如实施方案10所述的方法,该方法进一步包括以下步骤:将与参考相比,测定T的DNA拷贝数没有变化的细胞系或组织丢弃。
12.如实施方案10所述的方法,该方法进一步包括以下步骤:将对于测定G具有零拷贝数的细胞系或组织丢弃。
13.一种鉴定细胞的方法,该细胞包括插入到细胞基因组中的核酸酶切割位点中的转基因,该方法包括:
a)将以下各项引入多个细胞中:
i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;和
ii)编码以下核酸酶的第二核酸分子,该核酸酶在与对应于(i)的至少100个连续核苷酸的基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,
该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行;
b)培养(a)的细胞以生产至少一种细胞系或组织;
c)从(b)的每种细胞系或组织中提取基因组DNA样品;
d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G,其中这些测定T和G分别包括以下探针:
i)包括以下核苷酸序列的第一探针,该核苷酸序列互补于靶位点的核苷酸序列,距离用于进行测定T的核酸酶切割位点至少五个碱基对,和
ii)包括以下核苷酸序列的第二探针,该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列;
e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数;并且
f)鉴定在测定T中相对于参考具有减少的拷贝数并且对于测定G,具有大于零的拷贝数的细胞系或组织,
从而鉴定包括插入到细胞基因组中的核酸酶切割位点中的转基因的该细胞。
14.如实施方案13所述的方法,该方法进一步包括以下步骤:将与参考相比,测定T的DNA拷贝数没有变化的细胞系或组织丢弃。
15.如实施方案13所述的方法,该方法进一步包括以下步骤:将对于测定G具有零拷贝数的细胞系或组织丢弃。
16.如实施方案10-15中任一项所述的方法,其中在相同的混合物中进行这些测定。
17.如实施方案10-16中任一项所述的方法,其中该细胞系或组织源自植物或植物部分。
18.如实施方案17所述的方法,其中该植物是玉蜀黍植物。
19.如实施方案18所述的方法,其中该核酸酶切割位点是核苷酸序列内的玉蜀黍MIR604转基因插入位点,其中所述核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少90%一致性。
20.如实施方案10-19中任一项所述的方法,其中该核酸酶是具有可编程切割靶特异性的工程化核酸酶。
21.如实施方案20所述的方法,其中该核酸酶是包括SEQ ID NO:30的Cas9核酸酶。
22.一种通过如实施方案10-12中任一项所述的方法富集的或通过如实施方案13-21中任一项所述的方法鉴定的细胞系或组织,其中该细胞系或组织来自植物。
23.一种源自如实施方案22所述的细胞系或组织的植物或植物部分或其子代。
24.一种富集细胞的方法,该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合,该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列,该方法包括:
a)将核酸分子引入多个细胞中,该核酸分子包括编码以下核酸酶的异源序列,该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中;
b)培养(a)的多个细胞以生产至少一种细胞系或组织;
c)从(b)的每种细胞系或组织中提取基因组DNA样品;
d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2,其中这些测定分别包括以下探针:
i)包括以下核苷酸序列的第一探针,该核苷酸序列互补于包括进行测定1的核酸酶切割位点的核苷酸序列,和
ii)包括以下核苷酸序列的第二探针,该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列;
e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数;并且
f)富集对于测定1,相对于参考具有减少的拷贝数并且对于测定2,具有等于零的拷贝数的细胞系或组织,
从而富集以下细胞,该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。
25.如实施方案24所述的方法,该方法进一步包括将相对于参考,测定1的DNA拷贝数没有变化的细胞系或组织丢弃。
26.如实施方案24所述的方法,该方法进一步包括将对于测定2具有大于零拷贝数的细胞系或组织丢弃。
27.一种鉴定细胞的方法,该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合,该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列,该方法包括:
a)将核酸分子引入多个细胞中,该核酸分子包括编码以下核酸酶的异源序列,该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中;
b)培养(a)的多个细胞以生产至少一种细胞系或组织;
c)从(b)的每种细胞系或组织中提取基因组DNA样品;
d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2,其中这些测定分别包括以下探针:
i)包括以下核苷酸序列的第一探针,该核苷酸序列互补于包括进行测定1的核酸酶切割位点的核苷酸序列,和
ii)包括以下核苷酸序列的第二探针,该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列;
e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数;并且
f)鉴定对于测定1,相对于参考具有减少的拷贝数并且对于测定2,具有等于零的拷贝数的细胞系或组织,
从而鉴定以下细胞,该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。
28.如实施方案27所述的方法,该方法进一步包括将与参考相比,测定1的DNA拷贝数没有变化的细胞系或组织丢弃。
29.如实施方案27所述的方法,该方法进一步包括将对于测定2具有大于零拷贝数的细胞系或组织丢弃。
30.如实施方案24-29中任一项所述的方法,其中在相同的混合物中进行这些测定。
31.如实施方案24-29中任一项所述的方法,其中该细胞系或组织源自植物或植物部分。
32.如实施方案31所述的方法,其中该植物是玉蜀黍植物。
33.如实施方案32所述的方法,其中该核酸酶切割位点是核苷酸序列内的玉蜀黍MIR604转基因插入位点,其中所述核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少90%一致性。
34.如实施方案24-33中任一项所述的方法,其中该核酸酶是具有可编程切割靶特异性的工程化核酸酶。
35.如实施方案34所述的方法,其中该核酸酶是包括SEQ ID NO:30的Cas9核酸酶。
36.一种通过如实施方案24-26中任一项所述的方法富集的或通过如实施方案27-35中任一项所述的方法鉴定的细胞系或组织,其中该细胞系或组织来自植物。
37.一种源自如实施方案36所述的细胞系或组织的植物或植物部分或其子代。
38.一种用于进行如实施方案10-21或24-35中任一项所述的qPCR测定的试剂和说明书的试剂盒。
39.一种生产植物、植物部分或其子代的方法,该植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该方法包括:
a)向植物细胞中引入核酸分子,该核酸分子包括编码以下核酸酶的异源核苷酸序列,该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列,该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行,从而在植物细胞基因组中的核酸酶切割位点处引入突变,而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中;并且
b)从(a)的植物细胞再生植物、植物部分或其子代。
40.如实施方案39所述的方法,其中该植物是谷类植物。
41.如实施方案39所述的方法,其中该植物是玉蜀黍。
42.如实施方案39所述的方法,其中用于定点切割的核酸酶是Cas9核酸酶。
43.如实施方案42所述的方法,其中该Cas9核酸酶包括SEQ ID NO:30。
44.一种用于修饰植物细胞基因组中的靶位点的方法,该方法包括:
a)向植物细胞中引入第一核酸和第二核酸分子,该第一核酸包括至少100个连续核苷酸并且进一步包括转基因,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;并且
b)该第二核酸分子编码以下核酸酶,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶,
该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。
45.如实施方案44所述的方法,其中该植物细胞是玉蜀黍细胞。
46.如实施方案45所述的方法,其中该玉蜀黍细胞是转基因玉蜀黍细胞。
47.如实施方案46所述的方法,其中该转基因玉蜀黍细胞是事件MIR604转基因玉蜀黍细胞。
48.一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代在植物细胞基因组中的靶位点处包括修饰,该方法包括:
a)向植物细胞中引入第一核酸和第二核酸分子,该第一核酸包括至少100个连续核苷酸并且进一步包括转基因,其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90%一致性;
b)该第二核酸分子编码以下核酸酶,该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割,其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶,该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行;并且
c)从(a)的植物细胞再生植物、植物部分或其子代。
49.一致通过如实施方案48所述的方法生产的玉蜀黍植物、植物部分或其子代。
50.如实施方案44所述的方法,其中该第一核酸包括转基因。
51.一种将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点的方法,该方法包括将以下各项引入事件MIR604玉蜀黍细胞中:
a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子,其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90%一致性,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQID NO:138和SEQ ID NO:139;和
b)包括编码以下核酸酶的核苷酸序列的第二核酸分子,该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90%一致性的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割,该组包括:SEQ ID NO:133、SEQ ID NO:134、SEQID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138和SEQ ID NO:139,
该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行,由此转基因被整合到事件MIR604玉蜀黍基因组中的基因组核酸酶靶切割位点处。
52.一种生产玉蜀黍植物、植物部分或其子代的方法,该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因,该方法包括从通过如实施方案51所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。
53.一种通过如实施方案52所述的方法生产的玉蜀黍植物、植物部分或其子代,该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因。
序列表
<110> Syngenta Participations, AG
Chen, Zhongying
Kim, Myoung
Que, Qiudeng
Chilton, Mary-Dell
Zhong, Heng
Gu, Weining
Jiang, Yaping
<120> 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
<130> 80484-WO-REG-ORG-P-1
<150> 62/096442
<151> 2014-12-23
<160> 139
<170> PatentIn version 3.5
<210> 1
<211> 1582
<212> DNA
<213> 玉米(Zea mays)
<400> 1
cgagcagtag aaaaaaaaaa caacgccaag agatggcaga gtcaacaacc gatcacagta 60
cgtatcgcat tcacatcaag attttaagaa cgaccccccg gctggccaat ggccactttc 120
ttgcccgtgc ccgacagcgg acacggcgcc atgccctccg cgccgcacga gcgaggtgtc 180
gtgagaaccg gcaaaaaaaa aaaaaaaaat catcccaagt gcgctgaagt gaagtgcctt 240
cccccgcgtt tccttgcccc tggccggtac ccatttggcg ccgattcttt tcttgccccc 300
ccggccggcc gctcgctcgc ctttggattc ttccaaagcc gctgatggga tcgtggcgaa 360
cacacccacc acccgtcttt gcccaaagcg acccggcaca ggccgcgccg gcttcactaa 420
ccactagcgc ttgtactaat aaaatggttt ctagcgtttg ttgctctcct ttttcctttt 480
ttcgccggtt cttcggagcc gtgtggacag cgtccagtcc agcaggcata gggtggtctc 540
ggcggcggcc gtccgacgac gatcgatctc catgagattc cgcgacaggc caggacggaa 600
agctgggccc ttctcaccaa ttcgcgtcgg agccggaaca agattccctc ccccaatcat 660
ttcgacgcgc cctttcttcg ccacccctcg tggccgtgtt tcgcggccct tatctctttc 720
ccgtgacgcg ttcttttgta gcttagcggc cggcacgttg ctaaccaggc tagcttcgtt 780
cgtttttaat ctgcctatcg agaagagaag aaaaattcgt ccatggggcc acggcctctt 840
ctgcaggcat ttggcagaac cagtgaatgg agatggacgg atgctgctca gatacgcagt 900
caaacctgcc ggcgaaatta cggggggagc tggctggctg gctggacgcc agagcacaca 960
tggatgacgc ggcacggcag ctagccgagc aggcgctctg cgcacgcaag tgtcgtgccg 1020
atctcgcacc agcagcatcg cgtcctaaac aaaggaggtc ctgtcctgca ctgcactgca 1080
cggatgcagc tttggcaacg aggtgtgtcg cgcagcgctc ctgcacggat gtagctttgg 1140
attgctggat aatatctcgc gcaagcatcg tatttattta tttaatttat tatttattta 1200
tttattacga cgtccaccgc tgtgcgtgct ccgtttcgga ttataataaa actaatatta 1260
aataaaaaaa tcggattaaa ggatgtttcc gaaataaaga tctccaccac aggagcgaaa 1320
gaaaagagaa acgaaatggt gttgcgatta tacggcggct ccgtcgtcgt cggatcgaca 1380
tgtaaaaagt acgtgcacaa aaggcaaagc aaaatcacct catcaaagac caaaagcgga 1440
gcaaagaata gatactaaat ccacatattt ttttttgttc ctgtctacta tgtgctgtgc 1500
ctgtgcgtga agcacgatta gtacgtgtag tcacttgtca tattcttttt agtgtcttgt 1560
cactagtcac atggagtagc aa 1582
<210> 2
<211> 17176
<212> DNA
<213> 玉米
<400> 2
ccattaaatc gacgaaagca actagatcct gattttgatt acgattacga ttgacgagta 60
tggatcatga ttttattgca tattttatga ttttattgca tattttatta ttttattgtc 120
gatttatgta ctaacttgtt tttgttaaaa taggatgtca aagaaaatga agtctttagc 180
tcgtagtttg cttgggtcga ggaggagctc gaggagcagc tcgaggggtg aggattcagt 240
ttttcagggc acaggttcta ccatgagcag acggagagcg ctggcagaac atttgcctcc 300
acaagatgta agttagttgt taaattacat tatttgagtt acttaatatt gtatgatgta 360
agttatttgt ttcataggat gctgaaattg aggaaccagt ggtagaggat catgcaagag 420
atgatgttga agatgatggt ggagataatg tgggagatga tgctggagac gacgctggtg 480
gggattctgg ggctggggat tctggggctg gtggagattc tgcagctggg tctggaactt 540
ctcgagttaa gagaacgagg aagctgcatt ttgttggacc acctccagag cttccacccg 600
aatctcgggt tgtaataaag cctagtggaa agtgagtgac atatctttgc ttaaatgtta 660
ttgaaagtta tgttttaatt tctacattga tttctgtttg caggacttgg atcgacgact 720
cgttcacagg cacaggacac tacaggcagg tgaacatggt tcttggtaat cttgttcgtc 780
tgcactggcc tggtcttgtg actttgccta ctggcgagtc tgtccccgcc accacttggg 840
agcattatcg ctatggtgtc tgtagaacgt ttggcaacac acaggcacta gtttgggatg 900
cattctgggt atgacttgtt tatactattt tagttattcc atatatgttt gcttttatga 960
taacactatg gtttttgcag aaacggtaca agttgccgga cgatggatca tatgatatga 1020
acgctcgtta cgtgtttgag tttaacgcga acgatgtcgt tgcagatgca atgtactatg 1080
cacgaattca ggctataaag gcatggtaca gagcaaatgc tgatgatcga ccgatgccaa 1140
atacaaaggc cgagtggtca tcaatttact tgacggagga gcaataccta gaggtaaaca 1200
ggttgttgcc tctcatatcg cacaaagcca tgtatttgct tgctttattt aaaaattttg 1260
atgtaggtgt cggtgccgtg gatggccacc cgaccagacg gttatcgggc attgtgcaga 1320
tggtgggctt cccctgactt tcgtgccatt tccgaaagga acaggggaaa ccgtgggact 1380
gagtcgttcc acaactacgg cggtgatggt catgtgcgct tggctaagcg aatggtaagt 1440
cacagtttgt cgtaactttg aatcacatag caaatgtgtc attataactt ttatgtacag 1500
gaagtcaaat ccggccgtac gcccacggat gtggaggtgt atatgcaagg gcatagggcc 1560
ataggggttc tgatcctcag aatcctgatg tgttatgcac tcagacggcc accgaccgtc 1620
tagtgagttt ttgatactct attatgtgtg ttgatattgt ttgcaagggc ataggggtta 1680
tgcacttata tttgatattg tttgcctcca ggcttcgtat gggcaggaga tggttcaacg 1740
ccatggggag gagtacgatt ggaggagcca gccaatcgac cctcagacag catatgctag 1800
cgcaggagga caagctcatg gacggtgaga ttatttgatt tggttttcaa aattgtcatc 1860
atatgcttgc gattcaactg agccatgagt tactatacta agtgcatggt tcactcttgt 1920
aggttgggta tttttgattc tacgattgat tccagagagc tgagacgccg tggacgacaa 1980
tccacatcgt cgtcttcaca gtcgtcccgt tcacgatcag cagcccatga gatagagctt 2040
gcagtgttgc gtcaacaggc agagtaccat caatcagtct tgagggaaca attggagtac 2100
cagaggcaac aatctgaata ccagagacaa caagccgagt accagaagaa gagggacgag 2160
tattatgcaa gcctccaggc ccaaaatcaa gctcttctct cggtaagttg aagtaacatt 2220
ttgtagctta ttttgcaaaa cacttgatgt gtatcttgtt tgttcaacaa tgacttgtat 2280
ataatttgta gcaactagcc caacaagcgg gcgtcccgat gccgacatat gggatgccgc 2340
ctccggactt tgcactgcca atgccaatgt tggcgcctcc acctccacct ccgcctccgc 2400
ctacgtcaca attccctatg gtatgtacac atatgcgtgt gtgacatgtt catagatgtc 2460
ttatgtgttt aaatgaacaa ctgagtggtt actatttcat gtgcttgtgt tatagggatt 2520
tcagacacca cccgcttcag ttgccgcacc tggagatggg tctgggcaag acgacacaac 2580
acattcgtgg gtcaacaacc tattcaacac gcagagtcca gccggaggag gtggctactt 2640
gaaccatcca gacgatggat atgattgatg tgtcgtgatg tttatttatg aaacactttg 2700
caacacttgt ttgtgagaca caatttcagt ttgcaacaac cgtcgaacct atatgttgat 2760
gttaaatttg tgaatgttat tatttatgtg agaatatttg tgattgtgaa tacttattag 2820
aatgtgtata tttgtgattg tgaatgtgaa tgtgtatatg tgcatgaatc tgttttcgtt 2880
ttgtaaatgt cagatttttt aaaaaacaga attttgtgta aattctgtaa tttgttatgt 2940
ccgacggcct agtggtagcc gtcggacata acacatggtt atgtccgacg gcattaacta 3000
ccgtcggaca taagggatgc ttatgtccga cggcctagtg gtagccgtcg gacttaatcc 3060
tgtggggccc acattccgac cggtaaaacg gttgggattt gttatctccg acgggcacac 3120
gcagccgtcg gagatagctt atgtccgacg gctgccgtcg gacattgcac tatttccgac 3180
gagttatctc cgacggctta aagccgtcgg agataaggct ttgccgtcgg aaataatcta 3240
tttccgacgg tttattcctt atgtccgacg gttttggcca tcggacgttt ctccgtttac 3300
tgtagtggaa gggagtgcag tagaagtgca atggcctaat gtccttcacc ataaaaaaaa 3360
caaagttcaa atctttcaga tttatttact cttggagtag catagcatag gtgtacaagg 3420
gaagtgctta taataatggt aacaagatac tcatcctctc atacctgccg tctcactgac 3480
aggaaacggt aggtggcaag ttggtaagct tttcggtttt agccatgtcc gatcccatgt 3540
gtggatcctg tactgtacat cgacatgcga catcttggtt ggcctatctg atctttaatg 3600
tcgccgcgca cagagaggag atccggtctc atgaagtggc tccgcagatt cctcaagggg 3660
ccgaagcccg gcgaaccgag ccgccggcgg ccccaggtgg cggccgggga agaggaggac 3720
gcgctttggc accaacgacc agctagacca aaggtactac tactaccact gtactagtga 3780
ctgagttcct cccttcttct tctacagttc gtctctgtct ctccaaatgg ctctttgatc 3840
tatccaaaca tgccgtttca cagcttcaca tccgattcaa ctcgcatcca ttgcagtgcc 3900
atcttaaact cttagctccg aaaaaggaag ttgctaaaga ctagtacaat atctttcttc 3960
gctgtttcca gatcgatcca cctaggaacg agaatgagga actagtggac cgtgccattg 4020
ccgagcctct tgcagaggct gtcaaaccgc ccagaggtag taccgtagat ggacgaatcc 4080
agatacacat tccatgtcag catggtataa atttctctga aaccgtttca tccctgcatc 4140
ccgttgctgt aaattgctgc gccagagaaa acccataggg gagaagacag caacgacgac 4200
gaagatctgg caagagccgt acaggacagt ctgaatatga acccttacac gccttacaac 4260
ccctatccac cctctcaggc ccaacctaga gggcacaggt caaccgctat cacaatcacc 4320
atttactggc accctaagat attctctaac gcgccaaagc agctcaatgc cgtcagtgtc 4380
cgtgctgcag ggtatgcgga ggctgcaagc atgagatagg gcgtggccat tacttgagct 4440
gcatgggcat ttactggcac cctcagtgct tccgctgcag gtcctgcggt caccttatcc 4500
gtgagaccga ggtaattaag ctcttgcatt ttctttcacc gtggaagtgt gttacagtgt 4560
taccagagat gagatcatat ccgttattct tttcgtcgtg ccttccagtt caccttgctg 4620
ggtgcggatt cgtaccacaa gctgtgctac aaggagctgc atcatccaaa atgcgacgtc 4680
tgccttcagt ttgtaaggcc tcgtgtcctc ggaaaacctg agcgatctgc actacagact 4740
gataaactgc gtacgcgtta gcatttctac accgtgccgt ctcgtcagtg taatgagagg 4800
ctcattcttt gtagatgtgt ttctgcagat cccaacgaac gggagtggct tgatagagta 4860
cagagcccac ccgttctggg gccagaagta ttgcccttcg catgagcgcg acaggacgcc 4920
acgttgctgc agctgtgaga aaatggaggt acaggtacag atactagata gaaaatgtgg 4980
tcgcagtccg atcactcgtt ttcaaactag gttgtacatt gcctgatcat attcaagggc 5040
atcacttttc ggttgtgatt gtgcagccaa ggaacacgaa gtacatgtcg ctgggagacg 5100
gacgcggcct gtgcatggaa tgcctgggat ctgcagtgat ggacacgagc gagtgccagc 5160
ctctgtacca ttctatcaga gactactacg aggggatgga catgagactg gaccagcaga 5220
tacccgtgct cttggttgag cggcaagcgc tcaacgaagc catggaaggg gagagtaaag 5280
tgagtgtttc ttctggttct gccccttttt tttgtgtgtg tttctgcaaa acgtacagcc 5340
ttcggaaaca ctaacgctga ccgcatctgc gaaatccagg gcccacgcca catgcctgag 5400
actaggggcc tatgtctgtc cgaggagcgg actgtgagca gtgtaagtgt tcaacaactc 5460
aagctgtggc ggttactgct gggatgctta gcccacaatg cgacagtttc tgctcttctg 5520
actgtgtgtt acttctgcag atacttagga ggcccagaat tggtggaaac aaccggttac 5580
tagacatgag aactcggcca cagaagctga ctaggagatg tgaagttact gcaatacttg 5640
tcctgtatgg cctccccagg tctggcaatt ttttttttat ctctggagtc tggaggacat 5700
cacttttttg tacctaccgg attcaaatac tgcggttctt ctcacgttct gtgaccggtg 5760
gtgtcgtcgt ttgtgtcaca acgctattgc aggctactga caggttccat cctcgcccat 5820
gagctgatgc acgggtggct gcgtctcaaa ggtacatccg tatatggatg gatggacaaa 5880
acatttcata cacccattta tcatctttat ttatgaattt tcttggaaag ctctaccgga 5940
tcgtactttt cattcaggtt accgaaacct aaacgcggag gtggaagaag gcatatgcca 6000
ggtcatgtct tacttgtggc tggaatcaga gattcttccg tcatcctcga ggcacgcgca 6060
gccttcatca tcctatccag caacatcatc cgagaaaggt ggaatatctc ataccgggaa 6120
gaagctgggc gagttcttca tgcaccagat tgccaatgac acgtcgacgg cctatggtga 6180
cgggttcaga actgcgtacg ctgccgtcaa caagtatggc cttcgccaaa cactgagcca 6240
tatacgccta acaggaggtt tccctgtata ataagagtga aaaaaacata aaatgtccat 6300
gcatgatcat atcgatatca aaaggttata tacatattgg gatgaagttg gctatggaac 6360
actggatgca tagtgattca atttcggtga cctttgagtt ttcaaagagg taatgtcgga 6420
gtaaatcaga aagtaaaccc gtataaagca tggttgagac gattgtttac tctatagtga 6480
tgcatgctac atgcatggcc aagaagagag caacgggcca taggaccatc gttattaccc 6540
atcgttgtta atcaaattta gggctagata aatagtaaac catctatagg aacatccaga 6600
gtcaatctac tctatgtatc ataccgacca ggggcggatc taggtaaaat aaccattgat 6660
gtcatctcca ttaaattata gtatcatcaa cctatttaag tgctaacaat catacatttt 6720
aatgaagatt attaaaatcc attggtgtca catgacacca caaaaatggc ctagatccgc 6780
ccctgatacc gacaaaccta gaaaaatttg taactgagaa ctgatgacca tacacatgaa 6840
catgaattag gactttcaaa gagtccaatc aaagtaaaca attagactaa gcatgtaaga 6900
tagggtgcca gatgttgtat caggcttttg agcacatgtg caacttgtat gtcgtggaac 6960
gtgacaaccg gtcaaggaat gcgcatgtga cggtgtaaaa tcaatataac aacatgaaga 7020
acaatcataa gtataggttg aaactacaca tgataactag tatatctttc taacaacaat 7080
gattagtaca atatgtaccg tggtaaagtg gtgacaccat tagagatcgc attagaacgg 7140
catggcgctt actttaaaaa atgttagaga agcggttatg gtcaaacaga atattatgtg 7200
aatatgcggg aagatgaaca aatctataac acagaaacga aggaaccaaa taggatcagc 7260
ggagagtaca gtgccaacgc gcgacgaaac gaggaagcca gaaaggcacc gccgcatgcc 7320
cgcaccgcgt gactgtcgaa ggcggccgtg agcgctccga catcgaagga gtttatttca 7380
aaaatgggac gaccaacatt gcgcttttca catttgtttc ctaacgttgc actctttcac 7440
atatggcacc gagacacgca atcttgttga caccgctcgt agtccggtcc gggcagtgag 7500
gtcttacctg tcgtggtttc agaaaccggg gataataaga tttgtgttcg gtaaggacgc 7560
agcgcggact cactctgaat ggtcagagga ctcaatgatg gatctgagac aaggggttat 7620
actggtttag gcttgcgccc tagtccaatg ttgatcatag tattgcttag agcgtgttac 7680
agttgagtgc tcgtatctag aagatggggg ttgtcttgct cttttatagc tcaaggatag 7740
atcttacaat gagacttgta ttctgttggg gtcgagctca gcttcctact tctgggtgac 7800
gtagctcctc cggtatcgtc tgctgggtcg tgcgccatcg tatccctggt atggcgtcgc 7860
gtcttatccg ttcgccgtat gagttcttgt agctattctg atgcaaacgt agtggtgcct 7920
ggtgggtctc gcagagtcgg tttgtggtga ggtttagggg cgtctttagt acaacttcat 7980
cttccatcat tccctatgcg tcaccttcca gcatgcgtag gcgtacgctt cgtacagcgt 8040
attaccgcgt cccttctgga cttctggtat gtaggtcact gtagagaccc aatgctgggt 8100
tgattggtcc caccggtcag cgaggatgct ctctagaatg tatctggcgt cgtgattggc 8160
agaggccttc ggtactgctc ccatggttca gacgtggctt ggtggtgatc tgtctcatcg 8220
tgctgacgtg acttgatagt actaggtcgg ctcttacctc ctatagatgt gctcgctaga 8280
aagtccattg tcatcttgct gggttgctcg gcatgtaggt tgatcggtaa atccgcctcg 8340
tcgagttgct cgataatgtt gctcggcggg cgggtatgta ggtagtccga cctcaccggg 8400
ttgttcggca atcccgcctc gccgagttgc tcggtgaacg ggttggtcgg cagccccacc 8460
tcgccaggtt gtttggcaca cgtgttggtc tgttggtggg tcgtcgagag cccttttggg 8520
cttttttggg cacccggttt ctggtacccc acaatacccg agctagagtt ccacatttgc 8580
ccctaccttc cttcccggct ccggcgacaa gcccaggatc ctggtgtaat ggggcgagga 8640
gaagcagttc ttgacggagg agaccagctc catgatcccc aacaaaatga aggagacaac 8700
cgaggcctac ctcggcgtca ccatcaataa cactgttgtc accgtcccag tctatttcaa 8760
tgagtcccag cgccagacta ccaaaaacgt cgccgtcatc tccggccttc accgtcatgc 8820
gcatcatcaa cgagcccacc actgtcgcca tcacctacgg gctcgacaag aaatcgagca 8880
gcaacaacga gaataatgtc gtcatcttcg acctcgacgg cggtaccttt gacgtcgcgc 8940
tccggcggct aaggaccgca ctgccgacga gggcatgagt ggcgccgaga tggaagagaa 9000
gaggagcaca aatggcggtc gtcggcaaag acaaagagaa ctcgagcgtg agtggaggaa 9060
ggggcaaatg tgtaactcca gcttggatat gactccactg accagattac gagcgacatc 9120
aactagattg tgtgtctcag tggctcagtg ccattttttg aggtttgggt gccaatattt 9180
tttcgtagtg gaaggcaccg cgcccatcgg gttttgggag ccaaacgcca aacccgctcg 9240
cctcatattc cgcaacgtac agcggtttca tgggctggtt gaaggcccgg gccgcaaacc 9300
aaccgagtcg ggccgacgcc ctgggagatc cgcacggctg gtctggccca agcaacctgg 9360
tgggttggtg ccaggttaca gcctgggctg atctgtggac ggtggaccat gcaaggttgt 9420
actgggcttg caaggttgta ctgggcctac tggaacagtc atagcccgtg ccgtcgtggt 9480
gaccgtcgta cgcggccgat ctggcagact gggcaggtcg ctgctccgtg ctgtttgtgg 9540
atgcaatgca actatgcaag agtgatcacg gaaaacggac ggagcctgtc tgtcctgttg 9600
cgacgtagta caagcgcctg aacagtgacg ctacgctatg ccacgagcct acgagtggta 9660
ggtagtagta cactggtcag aatccagcag tgcacccacg ccgctgctga ctttgctgat 9720
gagagggagg ggtcgagcga gtctgtgtga aaccgtgaac cccgccgggg ccttcagtac 9780
gtacgatacc acgagcagta gaaaaaacaa cgccaagatg gcagagtcaa caaccgatca 9840
cagtacgtat cgcattcaca tcaagatttt aagaacgacc cccggctggc caatggcagg 9900
ccacttggtt gcccgtgccc gacagaggga cacggcgcca tgccctccgc gccgcacgga 9960
cgaggtgtcg tgagaaccgg caaaaaaaaa aatcatcgca agtgcgctga agtgaagtgc 10020
cttcccccgc gtttccttgc ccctggccgg tacccatttg gcgccgattc ttttcttgcc 10080
ccccggccgg ccgctcgctc gcctttggat tcttccaaag ccgctgatgg gatggtggcg 10140
aacacaccca ccacccgtct ttgcccaaag cgacccggca caggccgcgc cggcttcact 10200
aaccactagc gcttgtacta ataaaatggt ttctagcgtt tgttgctctc ctttttcttt 10260
tttcgccggt tcttcggagc cgtgtggaca ctggacagcg tccagtccag caggcatagg 10320
gtggtctcgg cggcggtcgt ccgacgacga tcgatctcca tgagattccg cgacaggcca 10380
ggacggaaag ctgggccctt ctcaccaatt cgcgtcggag ccggaacaag attccctccc 10440
ccaatcattt cgacgcgccc tttcttcgcc acccctcgtg gccgtgtttc gcggccggcc 10500
cttatctcct tcccgtgacg cgttcttttg tagcttagcg gccggcacgt tgctaaccag 10560
gctagcttcg ttcgttttta atctgcctat cgagaagaga agaaaaattc gtccatgggg 10620
ccacggcctc ttctgcaggc atttggcatg tgaaggaacc cgaaccagtg aatggagatg 10680
gacggatgct gctcagatac gcagtcaaac ctgccggcga aattacgggg ggagctggct 10740
ggctggctgg ctggacgcca gatcacacat ggatgacgcg gcacggcagc tagccgagca 10800
ggcgctctgc gcacgcaagt gtcgtgccga tctcgcacca gcagcatcgc gtcctaaaca 10860
aaggaggtcc tgtcctgcac tgcactgcac tgcacggatg cagctttggc aacgaggtgt 10920
gtcgcgcagc gctcctgcac ggatgtagct ttggattgct ggataatgtc tcgcgcaagc 10980
gtcgtattta tttatttatt tattacagcc tccaccgccg tgcgtgctcc gtttcggatt 11040
ataataaaac taatattaaa taaaaaaatc ggattaaagg atgtttccga aataaagatc 11100
tccaccacag gagcgaaaga aaaaaaaaga gaaacgggct atggagaaat ggtgttgcga 11160
gtatacggcg gctccgtcgt cgtcggatcg acatgtacaa agtaggtgca caaaaggcaa 11220
agcaaaatca cctcatcaaa gaccaaaagc ggagcaaaga atcgatacta aatccacatg 11280
ttttttttgt tcctgtctac tacgtgctgt gcctgtgcgt gaagcacgat tagtacgtgt 11340
actcactctt gtcatattct ttttagtgtc ttgtcactag tcacatggag tagcaaccat 11400
ggctggcgat acccgcgata aataaaaaaa agagagaggg agtaatatat tagatactca 11460
cccattataa attataaaat attttagagt ttgaataggt agttcttgta tatttattta 11520
tagaccttca agtttgtccg cctctcgaga gccgaacttt gttgcccatg cttccccggc 11580
tcaggtcatg ccacctcctt caccaagggc acacggaaga tctggtggag cttgtcatca 11640
ccccgcgccc ttcaaacatg tgaggatgcg tcgtcgctgg cactagtagc actcattgta 11700
ggcactacat tgacagtttc ctccagatat gtagtgagga aacacttgaa caacacgttt 11760
gggattacat atgatgtttt gtttgttcat caatgataat tccttcttct tgcttaatga 11820
ttggctctag aaccgataca tggcacattt catcaggaag ggcgcatgca cgaaattaaa 11880
ctgttatcga tgtttcggtt tctaagttga agaaaacaat ggctaacaac tagcccatgt 11940
gagcataacg acaaggccta caaacaaaac ccaagaaata gctaaatcat ggtctggatc 12000
cactctgcta tgatagatca ccttttctaa catagttcat cctcccattt gctctcgctc 12060
acctagtgcc tccatcgctg agatcaatga taagtaccaa gtgtacgatg aatcccattt 12120
gtcatgcgtc ttgcaagaat ggttggtccg cttgcagtgc cggtccagct atggacccag 12180
gggcctatgt cataactcaa gcaagaccat acccccatat gctaccaaga tgccttttaa 12240
gaatcctggt aaaagaaatc ggtggaagac gactcaacga ctatcaggcc ccattttttg 12300
ggaccatgct caaggatttg gctttagcaa aagtagataa cactattttg gggagcttga 12360
tctcaaggac acatgaagga ataaagctat tttagtcaag acgtccttaa ggaacacaat 12420
aagaccctag gtccctaatg actagtgtgt tatatgtttc gagacgctcc tacacctaag 12480
ttcttttagc tatttccatt cacaatgatg gtatatgacc taggtaccaa tgccccacgg 12540
agtttctaac attaagaatg atctaaaaca taaggaccct agagccaggg cactcctggt 12600
attaaaacat ttaaacccta ttgccttagt gctgattttt gttttttgtt tgtaggagga 12660
gaaacgagca cttgttgcct ctcgcgacaa tcttgatagg ctgtaccgtg atgccagtaa 12720
ctccttgacc atcctagaga ggagccaccg cttcaccatg tctgacctag atcatcacca 12780
ccatgagctg caggcgtctc aagatgaagt cttgcaactt ggacgattgt tgtcgactaa 12840
ggattccacc atcaaggatc tgcgcttcta aaaagctcgt cccgcaggag ctagaggcgg 12900
cccagcttgc tattaagact ctaaaggaca actgcaccgt cctgaagacc cagcgcgata 12960
aagctatgga taaagttgtt cgcgctggac ggatcctgat gaggaggcac ggcgttgtgg 13020
tgcctgacga tattgttgtc gatgtcaagg ccgcgcctga tgctacaagt cgtccctctt 13080
tttctgttgc tcctgcgaag gataccgtct gcaaggatgt ttcgatgcag tgatgtcctg 13140
taaaacactt tacttattga gttagtatct ccttggagga tggatgtaat atggattcaa 13200
tgtgcatgcg acaattgtgt tagaactcga atattctacg aacagggtgc cggaaaacgg 13260
ccctagcact ggcaagtaag atgttctctt ttcctgaagt gttttcaatt ttagccggtt 13320
gttatgctat tagggtatag tggtcaccct aaacagcgca aatgcaagta taccgcgttg 13380
gcttaaggtg tgttccgact taagtcagtt gccttgctgg tagggcatag tggtcaccct 13440
gagtaaagta agtcagagta tattgcaccg acctaagtcg attgcactac tagcagggta 13500
tagtgatcac cctaagtcaa gtaagcatga gcatatcgca ccgacttagg tcatcaccga 13560
cttaagccga ttgttctgtt agcagggtat aatggtcacc ctaagtcaga taagcatgag 13620
catgtcacac cggcttaagt cgttgccgac ttaagccgat tgctccgtca gcagggtata 13680
gtggtcaccc taataagtca ggtaagcatg agcatatcgc actggcttaa gtcgttgccg 13740
acttaagccg attgctccgt cagtagggta tagtggtcac cctaagtcaa gtaagcgtga 13800
gcatgtcgca ctggcttaag tcgattgctc cgtcagcagg gtataatggt cactttaagt 13860
caagtaagtg tgagcatgtc gcaccagctt aagtcatcgc cgacttaagc tgattgctcc 13920
attagcaggg tatagtggtc accctaagtt aggtaatcgt gctgatttca agtctagccc 13980
aatcaaagtc agttgtaagt caagagtatg aatgcctttg gagaatgaaa actttattga 14040
tgatgaaatt ctcggattta cagagtacaa tgttccttca agaattttga ggccttgcta 14100
aggatagaat tttctgaggt gttctatgtt ccatgagttc ccttctgtgc cgtccatttg 14160
agtaagccgg tatggtcccg gccgagtgac cgcctctaat atgatgaacg atccttccca 14220
cagtggtgat agcttgtgcc gcccttcccc cgttagaatt cggcgaagga ccaagtctcc 14280
cactgcaaag gatcggtgcc gcatagcttt atcatggtag cacctcaagg tctgctggta 14340
cctagccgac tgaattactg tgttcaatag ttcttcttcc agtacatcaa tatcttccag 14400
tctggtcgct tctgcttcag ctatgctttc gaaagttaat cttggtgccc tgaagattag 14460
gtcagcgggc agcactgcct ctaacccata aaccatgaaa aacggggtat ttctatgcag 14520
agctcgactg ggttgagttc tcaggctcta gaccacgtat ggcagctctc tgatccattt 14580
tcctgcaagc ttttcactct tgtcaaatat tttcttcctg agtgcttcta gtatcattcc 14640
gttggttctt tctacctggc cattggctct tgggtgtgct actgatgcat acttaacctg 14700
gaagctccgt tgctcgcaga aatcgagttc agagctggtg aagttggatc ccagatcggt 14760
gatgatgttg tttggtatcc caaacctgaa tattatgtct tgtataaact ccaccacttt 14820
ggctgaggtc aaggaagcaa ttggcttgta ctttatccat tttgtgaatt tgttaatggc 14880
aaccagtaca tgagtatagc ctccctgagc cttcttaaaa ggtccgatca tgtccagccc 14940
acagcatgcg aacggccatg ttacaggaat ggtctgcagc tgctgcgcgg gtaagtgttg 15000
ttgctttgat aggaattggc atgcttcaca cttctggact aactcggcaa catcgttctt 15060
tattgttggc caatagaaac cggatctaaa agccttcccg accagagtcc ttgacgctgc 15120
atgtattcca cactgcccgg cgtggatttc atccaacaat tgtttctcgg tagtcgagtg 15180
aatacatttc atgaggactc ttgctgcacc tctcctgtac agtaagcccc atatgatggt 15240
gtagtgggcc aactgcctcg cgatgcattc cactgcagcc ttgtcatctg gctcttcttc 15300
atttttatat acctgatgat aggctctctc cagtcgttgg ggtccgactc tggttggctc 15360
aaggtattgc acacttccac ctgatccaag atgatgcttg gttgtgatat ttcttggacg 15420
aagatcccag gtggagcctg ggcccgactg gatcccagct tcgacaacgc gtctgctgct 15480
gcgttgcggt ctcgttccac atgatggaac tctaatcctt caaatttgtc ctctagtttt 15540
cgcacaaccg cgcagtattt gcccatggag tcagtcgagc agtcctagtc tttgcttatc 15600
tggattatga ccactagcga atcaccatat accatcagtt tcttgatgcc gagtgataca 15660
acaatgctta aaccatggat cagttcttca tactttgctg cattatttga cgctggaaat 15720
agtagctgga gtgcataatt gtgttgctca cctccaggag caataaagag aatccctgca 15780
cccgctccct atagtttcaa cgagccatca aagtacattt tccacacctc gataacctct 15840
gggctatctg ggacctgatg ttcagtccac tctgatacga agtcaaccag cgcctgagtc 15900
ttgattgccg tgcggggcca gaactctatg ttgtgagctc caagctcaca cgcccacttg 15960
gcgatccttc caatagcttc tttgttgtgg agaatgtccc ctattgggaa tcctatgacc 16020
actatgactt tgtggtcgtc aaagtagtgt cggagtttgc gtgcggttag aagtactgca 16080
tacaacaact tctgtacttg aggatacctt atctttgagg gcccgaggac ttcactgatg 16140
aagtagactg gatgttgcac cgggtacaca tgtccttcct ccacccgctt gactactaac 16200
gtggtgctta ccacgtgagt cgtgctggag atgtataaca tcaaatcttc caccaactga 16260
ttcagcgtag ctcgtcgtgg cggcttgagc actggtggtg tagtcaaaaa attttagttc 16320
ctctagagct tcctgcgcct ctgtggtcca ctgaaacttg tccacctttt tgagcaattt 16380
gtagaaggcc atgccttgct cccctagtct tgatatgaac ctgctcaggg ctgccatgca 16440
tccagtaagc ctctgtacct ttttctatga tcgcaacact tccattctca tgatggcctt 16500
gaccttttcc gggttagctt caatcccttg gtgactgaca atgaatctga gtaacttccc 16560
tgcctgtact ctgaaaacac acttttctgg gttgagcttc caccggtaat gcctcaggct 16620
attgaagact agctgcaaat cttcaatgaa gttttctgtt ttgatcacca catcatcaac 16680
ataggcttcc acccgcttgc cccagtggtc ggctaagcat gtctgaatgg ctctctggta 16740
agttgctccc gtgttcttga ggtcgaatga catgaaggtg taatagaaag ctccaaatgg 16800
ggtgatgaaa gcattcttct cctcatcttc ttttgctaag cagatatgat ggtatctaga 16860
atagcagtct aggaaggaca acatagaaca gccagcggtc gaatcaacca cctgatctat 16920
tctagggagc ccgaagggat ctttggtgtc tcagacctgg gggaccctca accaaatcga 16980
caagtgaatt ttgtgtcgcg tgtccctgcc cagatggatt agtgcaagat gaaacacaag 17040
aggaggggtg aggtttatat tatcttgcac cagggtgctt gcagtagggg atacaatctt 17100
tgcgagagag ggaacggatc ccaggtctct tgagagatct agtgttgtga aggggagttc 17160
gatgtttgag caagcc 17176
<210> 3
<211> 23
<212> DNA
<213> 玉米
<400> 3
agtgcagtgc agtgcaggac agg 23
<210> 4
<211> 23
<212> DNA
<213> 玉米
<400> 4
actaatcgtg cttcacgcac agg 23
<210> 5
<211> 23
<212> DNA
<213> 玉米
<400> 5
aggcacagca cgtagtagac agg 23
<210> 6
<211> 23
<212> DNA
<213> 玉米
<400> 6
acatgtcgat ccgacgacga cgg 23
<210> 7
<211> 23
<212> DNA
<213> 玉米
<400> 7
agttttatta taatccgaaa cgg 23
<210> 8
<211> 23
<212> DNA
<213> 玉米
<400> 8
aatccgaaac ggagcacgca cgg 23
<210> 9
<211> 23
<212> DNA
<213> 玉米
<400> 9
aaacggagca cgcacggcgg tgg 23
<210> 10
<211> 22
<212> DNA
<213> 玉米
<400> 10
ggagcacgca cggcggtgga gg 22
<210> 11
<211> 23
<212> DNA
<213> 玉米
<400> 11
atccaaagct acatccgtgc agg 23
<210> 12
<211> 22
<212> DNA
<213> 玉米
<400> 12
gtgcagtgca gtgcagtgca gg 22
<210> 13
<211> 23
<212> DNA
<213> 玉米
<400> 13
ggacaggacc tcctttgttt agg 23
<210> 14
<211> 23
<212> DNA
<213> 玉米
<400> 14
gcgtgcgcag agcgcctgct cgg 23
<210> 15
<211> 22
<212> DNA
<213> 玉米
<400> 15
gcgtcatcca tgtgtgatct gg 22
<210> 16
<211> 24
<212> DNA
<213> 玉米
<400> 16
gtccatctcc attcactggt tcgg 24
<210> 17
<211> 23
<212> DNA
<213> 玉米
<400> 17
aatgcctgca gaagaggccg tgg 23
<210> 18
<211> 24
<212> DNA
<213> 玉米
<400> 18
gcggccggca cgttgctaac cagg 24
<210> 19
<211> 23
<212> DNA
<213> 玉米
<400> 19
agagaagaaa aattcgtcca tgg 23
<210> 20
<211> 22
<212> DNA
<213> 玉米
<400> 20
ggcctcttct gcaggcattt gg 22
<210> 21
<211> 23
<212> DNA
<213> 玉米
<400> 21
aaggaacccg aaccagtgaa tgg 23
<210> 22
<211> 21
<212> DNA
<213> 玉米
<400> 22
atcggtccta aacaaaggag g 21
<210> 23
<211> 22
<212> DNA
<213> 玉米
<400> 23
ggatgcagct ttggcaacga gg 22
<210> 24
<211> 22
<212> DNA
<213> 玉米
<400> 24
gtcgcgcagc gctcctgcac gg 22
<210> 25
<211> 24
<212> DNA
<213> 玉米
<400> 25
gctcctgcac ggatgtagct ttgg 24
<210> 26
<211> 22
<212> DNA
<213> 玉米
<400> 26
ggatgtagct ttggattgct gg 22
<210> 27
<211> 23
<212> DNA
<213> 玉米
<400> 27
aaataaaaaa atcggattaa agg 23
<210> 28
<211> 20
<212> DNA
<213> 玉米
<400> 28
agtgcagtgc agtgcaggac 20
<210> 29
<211> 4170
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌,玉米
<400> 29
atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gccgagcaag aagttcaagg tgctgggcaa caccgacagg 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccaccaggc tgaagaggac cgccaggagg aggtacacca ggaggaagaa caggatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacagg 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agaggcaccc gatcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccga ccatctacca cctgaggaag 420
aagctggtgg acagcaccga caaggccgac ctgaggctga tctacctggc cctggcccac 480
atgatcaagt tcaggggcca cttcctgatc gagggcgacc tgaacccgga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccg 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccaggctgag caagagcagg 660
aggctggaga acctgatcgc ccagctgccg ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccg aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgag ggtgaacacc gagatcacca aggccccgct gagcgccagc 960
atgatcaaga ggtacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgagg 1020
cagcagctgc cggagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gccgatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga acagggagga cctgctgagg 1200
aagcagagga ccttcgacaa cggcagcatc ccgcaccaga tccacctggg cgagctgcac 1260
gccatcctga ggaggcagga ggacttctac ccgttcctga aggacaacag ggagaagatc 1320
gagaagatcc tgaccttccg catcccgtac tacgtgggcc cgctggccag gggcaacagc 1380
aggttcgcct ggatgaccag gaagagcgag gagaccatca ccccgtggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgaga ggatgaccaa cttcgacaag 1500
aacctgccga acgagaaggt gctgccgaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgaggaagcc ggccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag gaaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggacaggtt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggacagggag atgatcgagg agaggctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagagga ggaggtacac cggctggggc 1980
aggctgagca ggaagctgat caacggcatc agggacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac aggaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc ccggccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggcaggc acaagccgga gaacatcgtg 2280
atcgagatgg ccagggagaa ccagaccacc cagaagggcc agaagaacag cagggagagg 2340
atgaagagga tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccg 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcagg 2460
gacatgtacg tggaccagga gctggacatc aacaggctga gcgactacga cgtggaccac 2520
atcgtgccgc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccaggagc 2580
gacaagaaca ggggcaagag cgacaacgtg ccgagcgagg aggtggtgaa gaagatgaaa 2640
aactactgga ggcagctgct gaacgccaag ctgatcaccc agaggaagtt cgacaacctg 2700
accaaggccg agaggggcgg cctgagcgag ctggacaagg ccggcttcat taaaaggcag 2760
ctggtggaga ccaggcagat caccaagcac gtggcccaga tcctggacag caggatgaac 2820
accaagtacg acgagaacga caagctgatc agggaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttcag gaaggacttc cagttctaca aggtgaggga gatcaataat 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gattaaaaag 3000
tacccgaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgaggaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat caggaagagg 3180
ccgctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagggacttc 3240
gccaccgtga ggaaggtgct gtccatgccg caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgccgaaga ggaacagcga caagctgatc 3360
gccaggaaga aggactggga cccgaagaag tacggcggct tcgacagccc gaccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgg tgggcatcac catcatggag aggagcagct tcgagaagaa cccagtggac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcattaa actgccgaag 3600
tacagcctgt tcgagctgga gaacggcagg aagaggatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgccgagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagcccggag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagggtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagggacaag 3900
ccgatcaggg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
ccggccgcct tcaagtactt cgacaccacc atcgacagga agaggtacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccaggatc 4080
gacctgagcc agctgggcgg cgacagcagc ccgccgaaga agaagaggaa ggtgagctgg 4140
aaggacgcca gcggctggag caggatgtga 4170
<210> 30
<211> 1389
<212> PRT
<213> 人工序列
<220>
<223> 酿脓链球菌,玉米
<400> 30
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Val Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp Ala
1370 1375 1380
Ser Gly Trp Ser Arg Met
1385
<210> 31
<211> 17
<212> DNA
<213> 玉米
<400> 31
gcagtgcagt gcaggac 17
<210> 32
<211> 18
<212> DNA
<213> 玉米
<400> 32
tgcagtgcag tgcaggac 18
<210> 33
<211> 19
<212> DNA
<213> 玉米
<400> 33
gtgcagtgca gtgcaggac 19
<210> 34
<211> 21
<212> DNA
<213> 玉米
<400> 34
cagtgcagtg cagtgcagga c 21
<210> 35
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌,水稻(Oryzae sativa)
<400> 35
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt ttttt 85
<210> 36
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌,玉米,水稻
<400> 36
agtgcagtgc agtgcaggac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttttt 105
<210> 37
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌,玉米,水稻
<400> 37
gggatcttta aacatacgaa cagatcactt aaagttcttc tgaagcaact taaagttatc 60
aggcatgcat ggatcttgga ggaatcagat gtgcagtcag ggaccatagc acaggacagg 120
cgtcttctac tggtgctacc agcaaatgct ggaagccggg aacactgggt acgttggaaa 180
ccacgtgatg tggagtaaga taaactgtag gagaaaagca tttcgtagtg ggccatgaag 240
cctttcagga catgtattgc agtatgggcc ggcccattac gcaattggac gacaacaaag 300
actagtatta gtaccacctc ggctatccac atagatcaaa gctggtttaa aagagttgtg 360
cagatgatcc gtggcagtgc agtgcagtgc aggacgtttt agagctagaa atagcaagtt 420
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttttt 480
<210> 38
<211> 1995
<212> DNA
<213> 玉米
<400> 38
aacgagaata atgtcgtcat cttcgacctc gacggcggta cctttgacgt cgcgctccgg 60
cggctaagga ccgcactgcc gacgagggca tgagtggcgc cgagatggaa gagaagagga 120
gcacaaatgg cggtcgtcgg caaagacaaa gagaactcga gcgtgagtgg aggaaggggc 180
aaatgtgtaa ctccagcttg gatatgactc cactgaccag attacgagcg acatcaacta 240
gattgtgtgt ctcagtggct cagtgccatt ttttgaggtt tgggtgccaa tattttttcg 300
tagtggaagg caccgcgccc atcgggtttt gggagccaaa cgccaaaccc gctcgcctca 360
tattccgcaa cgtacagcgg tttcatgggc tggttgaagg cccgggccgc aaaccaaccg 420
agtcgggccg acgccctggg agatccgcac ggctggtctg gcccaagcaa cctggtgggt 480
tggtgccagg ttacagcctg ggctgatctg tggacggtgg accatgcaag gttgtactgg 540
gcttgcaagg ttgtactggg cctactggaa cagtcatagc ccgtgccgtc gtggtgaccg 600
tcgtacgcgg ccgatctggc agactgggca ggtcgctgct ccgtgctgtt tgtggatgca 660
atgcaactat gcaagagtga tcacggaaaa cggacggagc ctgtctgtcc tgttgcgacg 720
tagtacaagc gcctgaacag tgacgctacg ctatgccacg agcctacgag tggtaggtag 780
tagtacactg gtcagaatcc agcagtgcac ccacgccgct gctgactttg ctgatgagag 840
ggaggggtcg agcgagtctg tgtgaaaccg tgaaccccgc cggggccttc agtacgtacg 900
ataccacgag cagtagaaaa aacaacgcca agatggcaga gtcaacaacc gatcacagta 960
cgtatcgcat tcacatcaag attttaagaa cgacccccgg ctggccaatg gcaggccact 1020
tggttgcccg tgcccgacag agggacacgg cgccatgccc tccgcgccgc acggacgagg 1080
tgtcgtgaga accggcaaaa aaaaaaatca tcgcaagtgc gctgaagtga agtgccttcc 1140
cccgcgtttc cttgcccctg gccggtaccc atttggcgcc gattcttttc ttgccccccg 1200
gccggccgct cgctcgcctt tggattcttc caaagccgct gatgggatgg tggcgaacac 1260
acccaccacc cgtctttgcc caaagcgacc cggcacaggc cgcgccggct tcactaacca 1320
ctagcgcttg tactaataaa atggtttcta gcgtttgttg ctctcctttt tcttttttcg 1380
ccggttcttc ggagccgtgt ggacactgga cagcgtccag tccagcaggc atagggtggt 1440
ctcggcggcg gtcgtccgac gacgatcgat ctccatgaga ttccgcgaca ggccaggacg 1500
gaaagctggg cccttctcac caattcgcgt cggagccgga acaagattcc ctcccccaat 1560
catttcgacg cgccctttct tcgccacccc tcgtggccgt gtttcgcggc cggcccttat 1620
ctccttcccg tgacgcgttc ttttgtagct tagcggccgg cacgttgcta accaggctag 1680
cttcgttcgt ttttaatctg cctatcgaga agagaagaaa aattcgtcca tggggccacg 1740
gcctcttctg caggcatttg gcatgtgaag gaacccgaac cagtgaatgg agatggacgg 1800
atgctgctca gatacgcagt caaacctgcc ggcgaaatta cggggggagc tggctggctg 1860
gctggctgga cgccagatca cacatggatg acgcggcacg gcagctagcc gagcaggcgc 1920
tctgcgcacg caagtgtcgt gccgatctcg caccagcagc atcgcgtcct aaacaaagga 1980
ggtcctgtcc tgcac 1995
<210> 39
<211> 942
<212> DNA
<213> 玉米
<400> 39
gcactgcact gcactgcacg gatgcagctt tggcaacgag gtgtgtcgcg cagcgctcct 60
gcacggatgt agctttggat tgctggataa tgtctcgcgc aagcgtcgta tttatttatt 120
tatttattac agcctccacc gccgtgcgtg ctccgtttcg gattataata aaactaatat 180
taaataaaaa aatcggatta aaggatgttt ccgaaataaa gatctccacc acaggagcga 240
aagaaaaaaa aagagaaacg ggctatggag aaatggtgtt gcgagtatac ggcggctccg 300
tcgtcgtcgg atcgacatgt acaaagtagg tgcacaaaag gcaaagcaaa atcacctcat 360
caaagaccaa aagcggagca aagaatcgat actaaatcca catgtttttt ttgttcctgt 420
ctactacgtg ctgtgcctgt gcgtgaagca cgattagtac gtgtactcac tcttgtcata 480
ttctttttag tgtcttgtca ctagtcacat ggagtagcaa ccatggctgg cgatacccgc 540
gataaataaa aaaaagagag agggagtaat atattagata ctcacccatt ataaattata 600
aaatatttta gagtttgaat aggtagttct tgtatattta tttatagacc ttcaagtttg 660
tccgcctctc gagagccgaa ctttgttgcc catgcttccc cggctcaggt catgccacct 720
ccttcaccaa gggcacacgg aagatctggt ggagcttgtc atcaccccgc gcccttcaaa 780
catgtgagga tgcgtcgtcg ctggcactag tagcactcat tgtaggcact acattgacag 840
tttcctccag atatgtagtg aggaaacact tgaacaacac gtttgggatt acatatgatg 900
ttttgtttgt tcatcaatga taattccttc ttcttgctta at 942
<210> 40
<211> 18
<212> DNA
<213> 玉米
<400> 40
ttgctactcc atgtgact 18
<210> 41
<211> 16
<212> DNA
<213> 玉米
<400> 41
ttgtcatatt cttttt 16
<210> 42
<211> 19
<212> DNA
<213> 玉米
<400> 42
tacacgtact aatcgtgct 19
<210> 43
<211> 18
<212> DNA
<213> 玉米
<400> 43
tcctgtctac tacgtgct 18
<210> 44
<211> 19
<212> DNA
<213> 玉米
<400> 44
ttgttcctgt ctactacgt 19
<210> 45
<211> 20
<212> DNA
<213> 玉米
<400> 45
ttggtctttg atgaggtgat 20
<210> 46
<211> 20
<212> DNA
<213> 玉米
<400> 46
tcgacatgta caaagtaggt 20
<210> 47
<211> 19
<212> DNA
<213> 玉米
<400> 47
ttcggaaaca tcctttaat 19
<210> 48
<211> 19
<212> DNA
<213> 玉米
<400> 48
ttataataaa actaatatt 19
<210> 49
<211> 20
<212> DNA
<213> 玉米
<400> 49
taataaataa ataaataaat 20
<210> 50
<211> 19
<212> DNA
<213> 玉米
<400> 50
ttggattgct ggataatgt 19
<210> 51
<211> 18
<212> DNA
<213> 玉米
<400> 51
tcgttgccaa agctgcat 18
<210> 52
<211> 19
<212> DNA
<213> 玉米
<400> 52
tcctgtcctg cactgcact 19
<210> 53
<211> 19
<212> DNA
<213> 玉米
<400> 53
tgcatccgtg cagtgcagt 19
<210> 54
<211> 17
<212> DNA
<213> 玉米
<400> 54
tcctaaacaa aggaggt 17
<210> 55
<211> 17
<212> DNA
<213> 玉米
<400> 55
taggacgcga tgctgct 17
<210> 56
<211> 18
<212> DNA
<213> 玉米
<400> 56
tgcgcacgca agtgtcgt 18
<210> 57
<211> 19
<212> DNA
<213> 玉米
<400> 57
tccatctcca ttcactggt 19
<210> 58
<211> 19
<212> DNA
<213> 玉米
<400> 58
ttctgcaggc atttggcat 19
<210> 59
<211> 18
<212> DNA
<213> 玉米
<400> 59
ttttcttctc ttctcgat 18
<210> 60
<211> 19
<212> DNA
<213> 玉米
<400> 60
taaccaggct agcttcgtt 19
<210> 61
<211> 18
<212> DNA
<213> 玉米
<400> 61
taagctacaa aagaacgc 18
<210> 62
<211> 18
<212> DNA
<213> 玉米
<400> 62
tgtttcgcgg ccggccct 18
<210> 63
<211> 18
<212> DNA
<213> 玉米
<400> 63
tttccgtcct ggcctgtc 18
<210> 64
<211> 19
<212> DNA
<213> 玉米
<400> 64
tcgtccgacg acgatcgat 19
<210> 65
<211> 19
<212> DNA
<213> 玉米
<400> 65
tcctaaacaa aggaggtcc 19
<210> 66
<211> 51
<212> DNA
<213> 玉米
<400> 66
tacacgtact aatcgtgctt cacgcacagg cacagcacgt agtagacagg a 51
<210> 67
<211> 51
<212> DNA
<213> 玉米
<400> 67
tgcatccgtg cagtgcagtg cagtgcagga caggacctcc tttgtttagg a 51
<210> 68
<211> 1343
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 68
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
785 790 795 800
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
820 825 830
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
835 840 845
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
850 855 860
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
865 870 875 880
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
885 890 895
Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val
900 905 910
Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp
915 920 925
His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala
930 935 940
Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn
945 950 955 960
Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln
965 970 975
Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr
980 985 990
Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu
995 1000 1005
Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg
1010 1015 1020
Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu
1025 1030 1035
Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala
1040 1045 1050
Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu
1055 1060 1065
Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln
1070 1075 1080
Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val
1085 1090 1095
Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu
1100 1105 1110
Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg
1115 1120 1125
Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro
1130 1135 1140
Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
1145 1150 1155
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
1160 1165 1170
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu
1175 1180 1185
Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg
1190 1195 1200
Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr
1205 1210 1215
Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
1220 1225 1230
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu
1235 1240 1245
Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
1250 1255 1260
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
1265 1270 1275
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
1280 1285 1290
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
1295 1300 1305
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys
1310 1315 1320
Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
1325 1330 1335
Gly Glu Ile Asn Phe
1340
<210> 69
<211> 1211
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 69
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
725 730 735
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
770 775 780
Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
785 790 795 800
Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly
805 810 815
Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly
820 825 830
Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val
835 840 845
Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu
850 855 860
Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe
865 870 875 880
Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro
885 890 895
Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys
900 905 910
Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser
915 920 925
Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser
930 935 940
Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser
945 950 955 960
Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu
965 970 975
Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp
980 985 990
Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro
995 1000 1005
Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu
1010 1015 1020
Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His
1025 1030 1035
Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
1040 1045 1050
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr
1055 1060 1065
Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
1070 1075 1080
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
1085 1090 1095
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
1100 1105 1110
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
1115 1120 1125
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser
1130 1135 1140
Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
1145 1150 1155
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
1160 1165 1170
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu
1175 1180 1185
Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys
1190 1195 1200
Phe Asn Asn Gly Glu Ile Asn Phe
1205 1210
<210> 70
<211> 1037
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 70
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
725 730 735
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
770 775 780
Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
785 790 795 800
Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly
805 810 815
Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly
820 825 830
Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu
835 840 845
Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His
850 855 860
Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg
865 870 875 880
Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr
885 890 895
Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr
900 905 910
Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala
915 920 925
Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln
930 935 940
Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn
945 950 955 960
Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu
965 970 975
Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg
980 985 990
Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu
995 1000 1005
Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
1010 1015 1020
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<210> 71
<211> 1309
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 71
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
785 790 795 800
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
820 825 830
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
835 840 845
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
850 855 860
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln
865 870 875 880
Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu
885 890 895
Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys
900 905 910
Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg
915 920 925
Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val
930 935 940
Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe
945 950 955 960
Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln
965 970 975
Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr
980 985 990
Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly
995 1000 1005
Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp
1010 1015 1020
Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu
1025 1030 1035
Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser
1040 1045 1050
Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser
1055 1060 1065
Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala
1070 1075 1080
Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg
1085 1090 1095
Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp
1100 1105 1110
Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
1115 1120 1125
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
1130 1135 1140
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val
1145 1150 1155
Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu
1160 1165 1170
Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
1175 1180 1185
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
1190 1195 1200
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr
1205 1210 1215
Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu
1220 1225 1230
Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu
1235 1240 1245
Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
1250 1255 1260
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val
1265 1270 1275
Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
1280 1285 1290
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
1295 1300 1305
Phe
<210> 72
<211> 1177
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 72
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
180 185 190
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
450 455 460
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
740 745 750
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
755 760 765
Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro
770 775 780
His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg
785 790 795 800
Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu
805 810 815
Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met
820 825 830
Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg
835 840 845
Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala
850 855 860
Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala
865 870 875 880
Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His
885 890 895
Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met
900 905 910
His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser
915 920 925
Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg
930 935 940
Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val
945 950 955 960
Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr
965 970 975
Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
980 985 990
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
995 1000 1005
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
1010 1015 1020
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly
1025 1030 1035
Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr
1040 1045 1050
Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala
1055 1060 1065
Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
1070 1075 1080
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn
1085 1090 1095
Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
1100 1105 1110
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala
1115 1120 1125
Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
1130 1135 1140
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
1145 1150 1155
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly
1160 1165 1170
Glu Ile Asn Phe
1175
<210> 73
<211> 1003
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 73
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
180 185 190
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
450 455 460
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
740 745 750
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
755 760 765
Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro
770 775 780
His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg
785 790 795 800
Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu Glu Glu
805 810 815
Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr
820 825 830
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu
835 840 845
Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly
850 855 860
Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val
865 870 875 880
Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser
885 890 895
Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr
900 905 910
Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp
915 920 925
Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val
930 935 940
Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
945 950 955 960
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu
965 970 975
Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val
980 985 990
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
995 1000
<210> 74
<211> 1343
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 74
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
785 790 795 800
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
820 825 830
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
835 840 845
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
850 855 860
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
865 870 875 880
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
885 890 895
Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val
900 905 910
Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp
915 920 925
His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala
930 935 940
Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn
945 950 955 960
Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln
965 970 975
Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr
980 985 990
Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu
995 1000 1005
Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg
1010 1015 1020
Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu
1025 1030 1035
Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala
1040 1045 1050
Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu
1055 1060 1065
Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln
1070 1075 1080
Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val
1085 1090 1095
Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu
1100 1105 1110
Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg
1115 1120 1125
Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro
1130 1135 1140
Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
1145 1150 1155
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
1160 1165 1170
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu
1175 1180 1185
Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg
1190 1195 1200
Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr
1205 1210 1215
Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
1220 1225 1230
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu
1235 1240 1245
Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
1250 1255 1260
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
1265 1270 1275
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
1280 1285 1290
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
1295 1300 1305
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys
1310 1315 1320
Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
1325 1330 1335
Gly Glu Ile Asn Phe
1340
<210> 75
<211> 1211
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 75
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
770 775 780
Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
785 790 795 800
Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly
805 810 815
Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly
820 825 830
Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val
835 840 845
Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu
850 855 860
Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe
865 870 875 880
Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro
885 890 895
Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys
900 905 910
Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser
915 920 925
Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser
930 935 940
Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser
945 950 955 960
Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu
965 970 975
Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp
980 985 990
Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro
995 1000 1005
Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu
1010 1015 1020
Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His
1025 1030 1035
Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
1040 1045 1050
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr
1055 1060 1065
Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
1070 1075 1080
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
1085 1090 1095
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
1100 1105 1110
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
1115 1120 1125
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser
1130 1135 1140
Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
1145 1150 1155
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
1160 1165 1170
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu
1175 1180 1185
Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys
1190 1195 1200
Phe Asn Asn Gly Glu Ile Asn Phe
1205 1210
<210> 76
<211> 1037
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 76
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
770 775 780
Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
785 790 795 800
Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly
805 810 815
Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly
820 825 830
Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu
835 840 845
Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His
850 855 860
Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg
865 870 875 880
Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr
885 890 895
Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr
900 905 910
Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala
915 920 925
Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln
930 935 940
Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn
945 950 955 960
Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu
965 970 975
Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg
980 985 990
Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu
995 1000 1005
Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
1010 1015 1020
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<210> 77
<211> 1275
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 77
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
785 790 795 800
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
820 825 830
Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
835 840 845
Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
850 855 860
Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly
865 870 875 880
Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly
885 890 895
Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val
900 905 910
Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu
915 920 925
Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe
930 935 940
Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro
945 950 955 960
Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys
965 970 975
Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser
980 985 990
Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser
995 1000 1005
Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg
1010 1015 1020
Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala
1025 1030 1035
Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro
1040 1045 1050
Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly
1055 1060 1065
Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys
1070 1075 1080
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys
1085 1090 1095
Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
1100 1105 1110
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
1115 1120 1125
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg
1130 1135 1140
Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
1145 1150 1155
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
1160 1165 1170
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn
1175 1180 1185
Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val
1190 1195 1200
Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
1205 1210 1215
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
1220 1225 1230
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu
1235 1240 1245
Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu
1250 1255 1260
Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1265 1270 1275
<210> 78
<211> 1143
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 78
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
180 185 190
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
675 680 685
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly
690 695 700
Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
705 710 715 720
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
725 730 735
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
740 745 750
Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser
755 760 765
His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu Phe Phe
770 775 780
Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met Thr Gln
785 790 795 800
Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg Val Gly
805 810 815
Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln
820 825 830
Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro
835 840 845
Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe
850 855 860
Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu
865 870 875 880
Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg
885 890 895
Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro
900 905 910
Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg
915 920 925
Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr
930 935 940
Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu
945 950 955 960
Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile
965 970 975
Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val
980 985 990
Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly
995 1000 1005
Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro
1010 1015 1020
Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
1025 1030 1035
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
1040 1045 1050
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp
1055 1060 1065
Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe
1070 1075 1080
Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg
1085 1090 1095
Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
1100 1105 1110
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr
1115 1120 1125
Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1130 1135 1140
<210> 79
<211> 969
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 79
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
180 185 190
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
675 680 685
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly
690 695 700
Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
705 710 715 720
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
725 730 735
Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala
740 745 750
Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser
755 760 765
His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
770 775 780
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
785 790 795 800
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
805 810 815
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
820 825 830
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
835 840 845
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
850 855 860
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
865 870 875 880
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
885 890 895
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
900 905 910
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
915 920 925
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
930 935 940
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
945 950 955 960
Lys Phe Asn Asn Gly Glu Ile Asn Phe
965
<210> 80
<211> 1024
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 80
Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Gly
1 5 10 15
Gly Met Ala Pro Lys Lys Lys Arg Lys Val Asp Gly Gly Val Asp Leu
20 25 30
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
35 40 45
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
50 55 60
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
65 70 75 80
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
85 90 95
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
100 105 110
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
115 120 125
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
130 135 140
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
145 150 155 160
Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
165 170 175
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
180 185 190
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
195 200 205
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
210 215 220
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
225 230 235 240
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
245 250 255
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
260 265 270
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
275 280 285
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
290 295 300
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
305 310 315 320
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
325 330 335
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
340 345 350
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
355 360 365
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
370 375 380
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
385 390 395 400
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly
405 410 415
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
420 425 430
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
435 440 445
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
450 455 460
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
465 470 475 480
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
485 490 495
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
500 505 510
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
515 520 525
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
530 535 540
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
545 550 555 560
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
565 570 575
Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
580 585 590
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
595 600 605
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
610 615 620
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
625 630 635 640
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
645 650 655
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
660 665 670
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile
675 680 685
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
690 695 700
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
705 710 715 720
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
725 730 735
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
740 745 750
Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln
755 760 765
Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu
770 775 780
Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys
785 790 795 800
Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg
805 810 815
Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys
820 825 830
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
835 840 845
Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
850 855 860
Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val
865 870 875 880
Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
885 890 895
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
900 905 910
Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
915 920 925
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
930 935 940
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
945 950 955 960
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
965 970 975
Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
980 985 990
Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
995 1000 1005
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
1010 1015 1020
Phe
<210> 81
<211> 1024
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 81
Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Gly
1 5 10 15
Gly Met Ala Pro Lys Lys Lys Arg Lys Val Asp Gly Gly Val Asp Leu
20 25 30
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
35 40 45
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
50 55 60
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
65 70 75 80
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
85 90 95
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
100 105 110
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
115 120 125
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
130 135 140
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
145 150 155 160
Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
165 170 175
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
180 185 190
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
195 200 205
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
210 215 220
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
225 230 235 240
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
245 250 255
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
260 265 270
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
275 280 285
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
290 295 300
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
305 310 315 320
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
325 330 335
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
340 345 350
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
355 360 365
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
370 375 380
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
385 390 395 400
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile
405 410 415
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
420 425 430
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
435 440 445
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
450 455 460
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
465 470 475 480
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
485 490 495
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
500 505 510
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
515 520 525
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
530 535 540
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
545 550 555 560
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
565 570 575
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
580 585 590
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
595 600 605
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
610 615 620
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
625 630 635 640
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
645 650 655
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
660 665 670
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly
675 680 685
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
690 695 700
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
705 710 715 720
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
725 730 735
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
740 745 750
Ala Ser His Asp Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln
755 760 765
Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu
770 775 780
Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys
785 790 795 800
Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg
805 810 815
Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys
820 825 830
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
835 840 845
Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
850 855 860
Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val
865 870 875 880
Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
885 890 895
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
900 905 910
Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
915 920 925
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
930 935 940
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
945 950 955 960
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
965 970 975
Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
980 985 990
Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
995 1000 1005
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
1010 1015 1020
Phe
<210> 82
<211> 4032
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 82
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttcccacga tggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380
aacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctcca acggcggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560
caggtcgtcg cgatcgctag caacatcggc ggcaagcagg ccctggagac tgtgcagagg 1620
ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680
agccacgacg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740
caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacgg cggcggcaag 1800
caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860
ccggaccagg tcgtcgccat cgcttccaac atcggcggca agcaggctct cgaaaccgtg 1920
cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980
atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040
ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacggcggc 2100
ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160
ctgaccccgg atcaggtggt cgccatcgct tcccacgatg gcggcaagca ggcgctggag 2220
actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280
gtggcgatcg cgagcaacaa cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340
ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400
ggcggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460
cacggcctca cccccgagca ggtcgtcgcg atcgctagca acaacggcgg caagcaggcc 2520
ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580
caggtggtcg cgatcgcgag ccacgacggc ggcaagcagg cgctcgaaac cgtccagagg 2640
ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700
tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2760
gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2820
gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2880
aggaggatcg gcgagaggac cagccacagg gtggccgact acgctcaggt ggtgagggtg 2940
ctggagttct tccagtgcca cagccacccg gcctacgcct tcgacgaggc tatgacccag 3000
ttcggcatga gcaggaacgg cctggtgcag ctgttcagga gggtgggcgt gaccgagctg 3060
gaggctaggg gcggcaccct gccgccagct agccagaggt gggaccgcat cctccaggcc 3120
agcggcatga aaagggctaa gccaagcccg accagcgctc agaccccaga tcaggctagc 3180
ctgcacgctt tcgccgacag cctggagagg gatctggatg ctccgagccc aatgcacgag 3240
ggcgaccaga ccagggccag cagcaggaag aggagcagga gcgacagggc tgtgaccggc 3300
ccgagcgccc agcaggctgt ggaggtgagg gtgccagagc agagggatgc cctgcacctg 3360
ccgctgagct ggagggtgaa gaggccaagg accaggatct ggggcggcct gccagatccg 3420
ggcaccccaa ccgctgctga tcagctcgtg aagagcgagc tggaggagaa gaagagcgag 3480
ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 3540
aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 3600
ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 3660
ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 3720
ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 3780
aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 3840
ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 3900
cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 3960
atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 4020
atcaacttct ga 4032
<210> 83
<211> 3114
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 83
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttccc acgatggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag caacaacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tccaacggcg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140
caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacat cggcggcaag 1200
caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260
cccgagcagg tggtcgcgat cgcgagccac gacggcggca agcaggcgct cgaaaccgtc 1320
cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380
atcgcgagca acggcggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440
ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc caacatcggc 1500
ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560
ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620
actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680
gtcgctatcg ctagcaacgg cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740
ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttcccac 1800
gatggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860
cacggcctca cccccgatca ggtcgtggcg atcgcgagca acaacggcgg caagcaggct 1920
ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980
caggtggtgg ctatcgcctc caacggcggc ggcaagcagg ccctggagac tgtgcagagg 2040
ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100
agcaacaacg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160
caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagccacga cggcggcaag 2220
caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280
cccgaccagg tcgtggctat cgcgtccaac ggcggcaagc aggctctcga gagcatcgtg 2340
gcccagctga gcaggccgga cccggccctg gccgccctga ccaacgatca cctggtggct 2400
ctggcctgcc tgggcggcag gccagccatg gacgctgtga agaagggcct gccgcacgct 2460
ccagagctga tccgcagggt gaacaggagg atcggcgaga ggaccagcca cagggtggcc 2520
ctgcagctcg tgaagagcga gctggaggag aagaagagcg agctgaggca taaactgaag 2580
tacgtgccac acgagtacat cgagctgatc gagatcgcca ggaacagcac ccaggatcgc 2640
atcctggaga tgaaggtgat ggagttcttc atgaaagtgt acggctacag gggcaagcac 2700
ctgggcggca gcaggaagcc agatggcgcc atctacaccg tgggcagccc aatcgactac 2760
ggcgtgatcg tggataccaa ggcttacagc ggcggctaca acctgccgat cggccaggct 2820
gatgagatgc agaggtacgt ggaggagaat caaaccagga acaagcacat caacccaaac 2880
gagtggtgga aggtgtaccc gagcagcgtg accgagttca agttcctgtt cgtgagcggc 2940
cacttcaagg gcaactacaa ggctcagctc accaggctga accacatcac caactgcaac 3000
ggcgccgtgc tgagcgtgga ggagctgctg atcggcggcg agatgatcaa ggctggcacc 3060
ctgaccctgg aggaggtgag gaggaagttc aacaacggcg agatcaactt ctga 3114
<210> 84
<211> 3930
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 84
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacggcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380
ggcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560
caggtcgtcg cgatcgctag caacggcggc ggcaagcagg ccctggagac tgtgcagagg 1620
ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680
agcaacatcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740
caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagccacga cggcggcaag 1800
caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860
ccggaccagg tcgtcgccat cgcttccaac ggcggcggca agcaggctct cgaaaccgtg 1920
cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980
atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040
ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag ccacgacggc 2100
ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160
ctgaccccgg atcaggtggt cgccatcgct tccaacaacg gcggcaagca ggcgctggag 2220
actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280
gtggcgatcg cgagcaacgg cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340
ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400
aacggcggca agcaggccct ggagactgtg cagaggctcc tcccagtcct gtgccaggcc 2460
cacggcctga cccccgagca ggtggtcgcg atcgcgagcc acgacggcgg caagcaggcg 2520
ctcgaaaccg tccagaggct cctccccgtg ctctgccagg atcacggcct cacccccgac 2580
caggtcgtgg ctatcgcgtc caacggcggc aagcaggctc tcgagagcat cgtggcccag 2640
ctgagcaggc cggacccggc cctggccgcc ctgaccaacg atcacctggt ggctctggcc 2700
tgcctgggcg gcaggccagc catggacgct gtgaagaagg gcctgccgca cgctccagag 2760
ctgatccgca gggtgaacag gaggatcggc gagaggacca gccacagggt ggccgactac 2820
gctcaggtgg tgagggtgct ggagttcttc cagtgccaca gccacccggc ctacgccttc 2880
gacgaggcta tgacccagtt cggcatgagc aggaacggcc tggtgcagct gttcaggagg 2940
gtgggcgtga ccgagctgga ggctaggggc ggcaccctgc cgccagctag ccagaggtgg 3000
gaccgcatcc tccaggccag cggcatgaaa agggctaagc caagcccgac cagcgctcag 3060
accccagatc aggctagcct gcacgctttc gccgacagcc tggagaggga tctggatgct 3120
ccgagcccaa tgcacgaggg cgaccagacc agggccagca gcaggaagag gagcaggagc 3180
gacagggctg tgaccggccc gagcgcccag caggctgtgg aggtgagggt gccagagcag 3240
agggatgccc tgcacctgcc gctgagctgg agggtgaaga ggccaaggac caggatctgg 3300
ggcggcctgc cagatccggg caccccaacc gctgctgatc agctcgtgaa gagcgagctg 3360
gaggagaaga agagcgagct gaggcataaa ctgaagtacg tgccacacga gtacatcgag 3420
ctgatcgaga tcgccaggaa cagcacccag gatcgcatcc tggagatgaa ggtgatggag 3480
ttcttcatga aagtgtacgg ctacaggggc aagcacctgg gcggcagcag gaagccagat 3540
ggcgccatct acaccgtggg cagcccaatc gactacggcg tgatcgtgga taccaaggct 3600
tacagcggcg gctacaacct gccgatcggc caggctgatg agatgcagag gtacgtggag 3660
gagaatcaaa ccaggaacaa gcacatcaac ccaaacgagt ggtggaaggt gtacccgagc 3720
agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggct 3780
cagctcacca ggctgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 3840
ctgctgatcg gcggcgagat gatcaaggct ggcaccctga ccctggagga ggtgaggagg 3900
aagttcaaca acggcgagat caacttctga 3930
<210> 85
<211> 3012
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 85
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agccacgacg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
ggcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttcca acaacggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag caacggcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140
caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacgg cggcggcaag 1200
caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260
cccgagcagg tggtcgcgat cgcgagcaac atcggcggca agcaggcgct cgaaaccgtc 1320
cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380
atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440
ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc caacggcggc 1500
ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560
ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620
actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680
gtcgctatcg ctagccacga cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740
ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800
aacggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860
cacggcctca cccccgatca ggtcgtggcg atcgcgagca acggcggcgg caagcaggct 1920
ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980
caggtggtgg ctatcgcctc caacaacggc ggcaagcagg ccctggagac tgtgcagagg 2040
ctcctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 2100
agccacgacg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 2160
caggatcacg gcctcacccc cgaccaggtc gtggctatcg cgtccaacgg cggcaagcag 2220
gctctcgaga gcatcgtggc ccagctgagc aggccggacc cggccctggc cgccctgacc 2280
aacgatcacc tggtggctct ggcctgcctg ggcggcaggc cagccatgga cgctgtgaag 2340
aagggcctgc cgcacgctcc agagctgatc cgcagggtga acaggaggat cggcgagagg 2400
accagccaca gggtggccct gcagctcgtg aagagcgagc tggaggagaa gaagagcgag 2460
ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 2520
aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 2580
ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 2640
ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 2700
ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 2760
aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 2820
ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 2880
cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 2940
atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 3000
atcaacttct ga 3012
<210> 86
<211> 4032
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 86
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttccaacgg cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagccac 1380
gacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560
caggtcgtcg cgatcgctag caacaacggc ggcaagcagg ccctggagac tgtgcagagg 1620
ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680
agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740
caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacaa cggcggcaag 1800
caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860
ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920
cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980
atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040
ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacaacggc 2100
ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160
ctgaccccgg atcaggtggt cgccatcgct tccaacggcg gcggcaagca ggcgctggag 2220
actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280
gtggcgatcg cgagcaacaa cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340
ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctcccac 2400
gatggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460
cacggcctca cccccgagca ggtcgtcgcg atcgctagca acatcggcgg caagcaggcc 2520
ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580
caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640
ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700
tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2760
gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2820
gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2880
aggaggatcg gcgagaggac cagccacagg gtggccgact acgctcaggt ggtgagggtg 2940
ctggagttct tccagtgcca cagccacccg gcctacgcct tcgacgaggc tatgacccag 3000
ttcggcatga gcaggaacgg cctggtgcag ctgttcagga gggtgggcgt gaccgagctg 3060
gaggctaggg gcggcaccct gccgccagct agccagaggt gggaccgcat cctccaggcc 3120
agcggcatga aaagggctaa gccaagcccg accagcgctc agaccccaga tcaggctagc 3180
ctgcacgctt tcgccgacag cctggagagg gatctggatg ctccgagccc aatgcacgag 3240
ggcgaccaga ccagggccag cagcaggaag aggagcagga gcgacagggc tgtgaccggc 3300
ccgagcgccc agcaggctgt ggaggtgagg gtgccagagc agagggatgc cctgcacctg 3360
ccgctgagct ggagggtgaa gaggccaagg accaggatct ggggcggcct gccagatccg 3420
ggcaccccaa ccgctgctga tcagctcgtg aagagcgagc tggaggagaa gaagagcgag 3480
ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 3540
aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 3600
ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 3660
ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 3720
ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 3780
aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 3840
ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 3900
cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 3960
atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 4020
atcaacttct ga 4032
<210> 87
<211> 3114
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 87
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agcaacaacg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttcca acggcggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag ccacgacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140
caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacaa cggcggcaag 1200
caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260
cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320
cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380
atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440
ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500
ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560
ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620
actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680
gtcgctatcg ctagcaacaa cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740
ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800
ggcggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860
cacggcctca cccccgatca ggtcgtggcg atcgcgagca acaacggcgg caagcaggct 1920
ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980
caggtggtgg ctatcgcctc ccacgatggc ggcaagcagg ccctggagac tgtgcagagg 2040
ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100
agcaacatcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160
caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220
caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280
cccgaccagg tcgtggctat cgcgtccaac ggcggcaagc aggctctcga gagcatcgtg 2340
gcccagctga gcaggccgga cccggccctg gccgccctga ccaacgatca cctggtggct 2400
ctggcctgcc tgggcggcag gccagccatg gacgctgtga agaagggcct gccgcacgct 2460
ccagagctga tccgcagggt gaacaggagg atcggcgaga ggaccagcca cagggtggcc 2520
ctgcagctcg tgaagagcga gctggaggag aagaagagcg agctgaggca taaactgaag 2580
tacgtgccac acgagtacat cgagctgatc gagatcgcca ggaacagcac ccaggatcgc 2640
atcctggaga tgaaggtgat ggagttcttc atgaaagtgt acggctacag gggcaagcac 2700
ctgggcggca gcaggaagcc agatggcgcc atctacaccg tgggcagccc aatcgactac 2760
ggcgtgatcg tggataccaa ggcttacagc ggcggctaca acctgccgat cggccaggct 2820
gatgagatgc agaggtacgt ggaggagaat caaaccagga acaagcacat caacccaaac 2880
gagtggtgga aggtgtaccc gagcagcgtg accgagttca agttcctgtt cgtgagcggc 2940
cacttcaagg gcaactacaa ggctcagctc accaggctga accacatcac caactgcaac 3000
ggcgccgtgc tgagcgtgga ggagctgctg atcggcggcg agatgatcaa ggctggcacc 3060
ctgaccctgg aggaggtgag gaggaagttc aacaacggcg agatcaactt ctga 3114
<210> 88
<211> 3075
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 88
atgggaaaac ctattcctaa tcctctgctg ggcctggatt ctaccggagg catggcccct 60
aagaaaaagc ggaaggtgga cggcggagtg gacctgagaa cactgggata ttctcagcag 120
cagcaggaga agatcaagcc caaggtgaga tctacagtgg cccagcacca cgaagccctg 180
gtgggacacg gatttacaca cgcccacatt gtggccctgt ctcagcaccc tgccgccctg 240
ggaacagtgg ccgtgaaata tcaggatatg attgccgccc tgcctgaggc cacacacgaa 300
gccattgtgg gagtgggaaa acagtggtct ggagccagag ccctggaagc cctgctgaca 360
gtggccggag aactgagagg acctcctctg cagctggata caggacagct gctgaagatt 420
gccaaaaggg gcggagtgac cgcggtggaa gccgtgcacg cctggagaaa tgccctgaca 480
ggagcccctc tgaacctgac ccccgaacag gtggtggcca ttgccagcaa caacggcggc 540
aagcaggccc tggaaaccgt gcagagactg ctgcccgtgc tgtgccaggc ccatggcctg 600
acacctgaac aggtggtggc tatcgcctct cacgacggag gaaaacaggc tctggaaaca 660
gtgcagcggc tgctgcctgt gctgtgtcag gctcacggct tgactccaga acaggtggtg 720
gctattgctt ccaatattgg ggggaaacag gccctggaaa ctgtgcagcg cctgctgcca 780
gtgctgtgcc aggctcacgg actgaccccc gaacaggtgg tggccattgc cagcaacggc 840
ggcggcaagc aggccctgga aaccgtgcag agactgctgc ccgtgctgtg ccaggcccat 900
ggcctgacac ctgaacaggt ggtggctatc gcctctcacg acggaggaaa acaggctctg 960
gaaacagtgc agcggctgct gcctgtgctg tgtcaggctc acggcttgac tccagaacag 1020
gtggtggcta ttgcttccca cgacgggggg aaacaggccc tggaaactgt gcagcgcctg 1080
ctgccagtgc tgtgccaggc tcacgggctg acccccgaac aggtggtggc cattgccagc 1140
aacaacggcg gcaagcaggc cctggaaacc gtgcagagac tgctgcccgt gctgtgccag 1200
gcccatggcc tgacacctga acaggtggtg gctatcgcct ctaacggcgg aggaaaacag 1260
gctctggaaa cagtgcagcg gctgctgcct gtgctgtgtc aggctcacgg cttgactcca 1320
gaacaggtgg tggctattgc ttccaacaac ggggggaaac aggccctgga aactgtgcag 1380
cgcctgctgc cagtgctgtg ccaggctcac ggcctcactc ccgaacaggt ggtggccatt 1440
gccagccacg acggcggcaa gcaggccctg gaaaccgtgc agagactgct gcccgtgctg 1500
tgccaggccc atggcctgac acctgaacag gtggtggcta tcgcctctaa tatcggagga 1560
aaacaggctc tggaaacagt gcagcggctg ctgcctgtgc tgtgtcaggc tcacggcttg 1620
actccagaac aggtggtggc tattgcttcc aacaacgggg ggaaacaggc cctggaaact 1680
gtgcagcgcc tgctgccagt gctgtgccag gctcacggac tgacccccga acaggtggtg 1740
gccattgcca gcaacggcgg cggcaagcag gccctggaaa ccgtgcagag actgctgccc 1800
gtgctgtgcc aggcccatgg cctgacacct gaacaggtgg tggctatcgc ctctaacaac 1860
ggaggaaaac aggctctgga aacagtgcag cggctgctgc ctgtgctgtg tcaggctcac 1920
ggcttgactc cagaacaggt ggtggctatt gcttcccacg acggggggaa acaggccctg 1980
gaaactgtgc agcgcctgct gccagtgctg tgccaggctc acgggctgac ccccgaacag 2040
gtggtggcca ttgccagcaa catcggcggc aagcaggccc tggaaaccgt gcagagactg 2100
ctgcccgtgc tgtgccaggc ccatggcctg acacctgaac aggtggtggc tatcgcctct 2160
aacaacggag gaaaacaggc tctggaaaca gtgcagcggc tgctgcctgt gctgtgtcag 2220
gctcacggct tgactccaca gcaggtcgtg gcaattgcta gcaacggcgg cggacggccc 2280
gccctggaga gcattgtggc ccagctgtct agacctgatc ctgccctggc cgccctgaca 2340
aatgatcacc tggtggccct ggcctgtctg ggaggcagac ctgccctgga tgccgtgaaa 2400
aaaggactgc ctcacgcccc tgccctgatt aaaagaacaa atagaagaat ccccgagcgg 2460
acctctcaca gagtggccgg atcccagctg gtgaaatctg agctggagga gaagaagtct 2520
gagctgagac acaagctgaa gtacgtgcct cacgagtaca tcgagctgat cgagatcgcc 2580
agaaatagca cccaggatag aatcctggag atgaaggtga tggagttctt catgaaagtg 2640
tacggctaca gaggaaagca tctgggagga agcagaaaac ctgacggagc catttataca 2700
gtgggcagcc ctatcgatta tggcgtgatc gtggatacaa aggcctacag cggaggctac 2760
aatctgccta ttggacaggc cgatgagatg cagagatacg tggaggagaa ccaaaccagg 2820
aacaagcata tcaaccctaa cgagtggtgg aaggtgtacc cttctagcgt gaccgagttc 2880
aagttcctgt ttgtgagcgg ccacttcaag ggcaattata aggcccagct gaccaggctg 2940
aaccacatca caaattgtaa tggcgccgtg ctgtctgtgg aggaactgct gattggagga 3000
gagatgatta aggccggaac actgacactg gaggaggtga gaagaaagtt caacaacggc 3060
gagatcaact tctga 3075
<210> 89
<211> 3828
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 89
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacggcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttccaacat cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380
atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctcca acatcggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccagtc ctgtgccagg cccacggcct gacccccgag 1560
caggtggtcg cgatcgcgag ccacgacggc ggcaagcagg cgctcgaaac cgtccagagg 1620
ctcctccccg tgctctgcca ggatcacggc ctgaccccag agcaggtggt ggctatcgcg 1680
agcaacatcg gcggcaagca ggctctcgaa accgtccaga ggctcctccc agtgctctgc 1740
caggctcacg gcctcacccc ggaccaggtc gtcgccatcg cttccaacat cggcggcaag 1800
caggctctcg aaaccgtgca gaggctgctc ccggtgctgt gccaggccca cggcctcacc 1860
ccagaccagg tcgtcgcgat cgcctccaac atcggcggca agcaggccct ggagactgtg 1920
cagcgcctgc tgcccgtcct gtgccaggac cacggcctca ccccggagca ggtcgtcgct 1980
atcgctagca acaacggcgg caagcaggcg ctcgaaaccg tccagaggct cctcccagtc 2040
ctctgccagg atcacggcct gaccccggat caggtggtcg ccatcgcttc caacaacggc 2100
ggcaagcagg cgctggagac tgtccagcgc ctcctcccag tcctctgcca ggcgcacggc 2160
ctcacccccg atcaggtcgt ggcgatcgcg agcaacatcg gcggcaagca ggctctcgaa 2220
accgtgcaga ggctgctgcc ggtgctctgc caggctcacg gcctgacccc agaccaggtg 2280
gtggctatcg cctccaacaa cggcggcaag caggccctgg agactgtgca gaggctcctc 2340
ccagtcctgt gccaggccca cggcctgacc cccgagcagg tggtcgcgat cgcgagcaac 2400
aacggcggca agcaggcgct cgaaaccgtc cagaggctcc tccccgtgct ctgccaggat 2460
cacggcctca cccccgacca ggtcgtggct atcgcgtcca acggcggcaa gcaggctctc 2520
gagagcatcg tggcccagct gagcaggccg gacccggccc tggccgccct gaccaacgat 2580
cacctggtgg ctctggcctg cctgggcggc aggccagcca tggacgctgt gaagaagggc 2640
ctgccgcacg ctccagagct gatccgcagg gtgaacagga ggatcggcga gaggaccagc 2700
cacagggtgg ccgactacgc tcaggtggtg agggtgctgg agttcttcca gtgccacagc 2760
cacccggcct acgccttcga cgaggctatg acccagttcg gcatgagcag gaacggcctg 2820
gtgcagctgt tcaggagggt gggcgtgacc gagctggagg ctaggggcgg caccctgccg 2880
ccagctagcc agaggtggga ccgcatcctc caggccagcg gcatgaaaag ggctaagcca 2940
agcccgacca gcgctcagac cccagatcag gctagcctgc acgctttcgc cgacagcctg 3000
gagagggatc tggatgctcc gagcccaatg cacgagggcg accagaccag ggccagcagc 3060
aggaagagga gcaggagcga cagggctgtg accggcccga gcgcccagca ggctgtggag 3120
gtgagggtgc cagagcagag ggatgccctg cacctgccgc tgagctggag ggtgaagagg 3180
ccaaggacca ggatctgggg cggcctgcca gatccgggca ccccaaccgc tgctgatcag 3240
ctcgtgaaga gcgagctgga ggagaagaag agcgagctga ggcataaact gaagtacgtg 3300
ccacacgagt acatcgagct gatcgagatc gccaggaaca gcacccagga tcgcatcctg 3360
gagatgaagg tgatggagtt cttcatgaaa gtgtacggct acaggggcaa gcacctgggc 3420
ggcagcagga agccagatgg cgccatctac accgtgggca gcccaatcga ctacggcgtg 3480
atcgtggata ccaaggctta cagcggcggc tacaacctgc cgatcggcca ggctgatgag 3540
atgcagaggt acgtggagga gaatcaaacc aggaacaagc acatcaaccc aaacgagtgg 3600
tggaaggtgt acccgagcag cgtgaccgag ttcaagttcc tgttcgtgag cggccacttc 3660
aagggcaact acaaggctca gctcaccagg ctgaaccaca tcaccaactg caacggcgcc 3720
gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaggctgg caccctgacc 3780
ctggaggagg tgaggaggaa gttcaacaac ggcgagatca acttctga 3828
<210> 90
<211> 2910
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 90
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agccacgacg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
ggcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttcca acatcggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag caacatcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tccaacatcg gcggcaagca ggccctggag actgtgcaga ggctcctccc agtcctgtgc 1140
caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagccacga cggcggcaag 1200
caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctgacc 1260
ccagagcagg tggtggctat cgcgagcaac atcggcggca agcaggctct cgaaaccgtc 1320
cagaggctcc tcccagtgct ctgccaggct cacggcctca ccccggacca ggtcgtcgcc 1380
atcgcttcca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1440
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc caacatcggc 1500
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1560
ctcaccccgg agcaggtcgt cgctatcgct agcaacaacg gcggcaagca ggcgctcgaa 1620
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1680
gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1740
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1800
atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1860
cacggcctga ccccagacca ggtggtggct atcgcctcca acaacggcgg caagcaggcc 1920
ctggagactg tgcagaggct cctcccagtc ctgtgccagg cccacggcct gacccccgag 1980
caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2040
ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2100
tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2160
gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2220
gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2280
aggaggatcg gcgagaggac cagccacagg gtggccctgc agctcgtgaa gagcgagctg 2340
gaggagaaga agagcgagct gaggcataaa ctgaagtacg tgccacacga gtacatcgag 2400
ctgatcgaga tcgccaggaa cagcacccag gatcgcatcc tggagatgaa ggtgatggag 2460
ttcttcatga aagtgtacgg ctacaggggc aagcacctgg gcggcagcag gaagccagat 2520
ggcgccatct acaccgtggg cagcccaatc gactacggcg tgatcgtgga taccaaggct 2580
tacagcggcg gctacaacct gccgatcggc caggctgatg agatgcagag gtacgtggag 2640
gagaatcaaa ccaggaacaa gcacatcaac ccaaacgagt ggtggaaggt gtacccgagc 2700
agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggct 2760
cagctcacca ggctgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 2820
ctgctgatcg gcggcgagat gatcaaggct ggcaccctga ccctggagga ggtgaggagg 2880
aagttcaaca acggcgagat caacttctga 2910
<210> 91
<211> 3075
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,玉米
<400> 91
atgggaaaac ctattcctaa tcctctgctg ggcctggatt ctaccggagg catggcccct 60
aagaaaaagc ggaaggtgga cggcggagtg gacctgagaa cactgggata ttctcagcag 120
cagcaggaga agatcaagcc caaggtgaga tctacagtgg cccagcacca cgaagccctg 180
gtgggacacg gatttacaca cgcccacatt gtggccctgt ctcagcaccc tgccgccctg 240
ggaacagtgg ccgtgaaata tcaggatatg attgccgccc tgcctgaggc cacacacgaa 300
gccattgtgg gagtgggaaa acagtggtct ggagccagag ccctggaagc cctgctgaca 360
gtggccggag aactgagagg acctcctctg cagctggata caggacagct gctgaagatt 420
gccaaaaggg gcggagtgac cgcggtggaa gccgtgcacg cctggagaaa tgccctgaca 480
ggagcccctc tgaacctgac ccccgaacag gtggtggcca ttgccagcca cgacggcggc 540
aagcaggccc tggaaaccgt gcagagactg ctgcccgtgc tgtgccaggc ccatggcctg 600
acacctgaac aggtggtggc tatcgcctct cacgacggag gaaaacaggc tctggaaaca 660
gtgcagcggc tgctgcctgt gctgtgtcag gctcacggct tgactccaga acaggtggtg 720
gctattgctt ccaacggcgg ggggaaacag gccctggaaa ctgtgcagcg cctgctgcca 780
gtgctgtgcc aggctcacgg actgaccccc gaacaggtgg tggccattgc cagcaacatc 840
ggcggcaagc aggccctgga aaccgtgcag agactgctgc ccgtgctgtg ccaggcccat 900
ggcctgacac ctgaacaggt ggtggctatc gcctctaata tcggaggaaa acaggctctg 960
gaaacagtgc agcggctgct gcctgtgctg tgtcaggctc acggcttgac tccagaacag 1020
gtggtggcta ttgcttccaa tattgggggg aaacaggccc tggaaactgt gcagcgcctg 1080
ctgccagtgc tgtgccaggc tcacgggctg acccccgaac aggtggtggc cattgccagc 1140
cacgacggcg gcaagcaggc cctggaaacc gtgcagagac tgctgcccgt gctgtgccag 1200
gcccatggcc tgacacctga acaggtggtg gctatcgcct ctaatatcgg aggaaaacag 1260
gctctggaaa cagtgcagcg gctgctgcct gtgctgtgtc aggctcacgg cttgactcca 1320
gaacaggtgg tggctattgc ttccaatatt ggggggaaac aggccctgga aactgtgcag 1380
cgcctgctgc cagtgctgtg ccaggctcac ggcctcactc ccgaacaggt ggtggccatt 1440
gccagcaaca tcggcggcaa gcaggccctg gaaaccgtgc agagactgct gcccgtgctg 1500
tgccaggccc atggcctgac acctgaacag gtggtggcta tcgcctctaa caacggagga 1560
aaacaggctc tggaaacagt gcagcggctg ctgcctgtgc tgtgtcaggc tcacggcttg 1620
actccagaac aggtggtggc tattgcttcc aacaacgggg ggaaacaggc cctggaaact 1680
gtgcagcgcc tgctgccagt gctgtgccag gctcacggac tgacccccga acaggtggtg 1740
gccattgcca gcaacatcgg cggcaagcag gccctggaaa ccgtgcagag actgctgccc 1800
gtgctgtgcc aggcccatgg cctgacacct gaacaggtgg tggctatcgc ctctaacaac 1860
ggaggaaaac aggctctgga aacagtgcag cggctgctgc ctgtgctgtg tcaggctcac 1920
ggcttgactc cagaacaggt ggtggctatt gcttccaaca acggggggaa acaggccctg 1980
gaaactgtgc agcgcctgct gccagtgctg tgccaggctc acgggctgac ccccgaacag 2040
gtggtggcca ttgccagcaa cggcggcggc aagcaggccc tggaaaccgt gcagagactg 2100
ctgcccgtgc tgtgccaggc ccatggcctg acacctgaac aggtggtggc tatcgcctct 2160
cacgacggag gaaaacaggc tctggaaaca gtgcagcggc tgctgcctgt gctgtgtcag 2220
gctcacggct tgactccaca gcaggtcgtg gcaattgcta gccacgacgg cggacggccc 2280
gccctggaga gcattgtggc ccagctgtct agacctgatc ctgccctggc cgccctgaca 2340
aatgatcacc tggtggccct ggcctgtctg ggaggcagac ctgccctgga tgccgtgaaa 2400
aaaggactgc ctcacgcccc tgccctgatt aaaagaacaa atagaagaat ccccgagcgg 2460
acctctcaca gagtggccgg atcccagctg gtgaaatctg agctggagga gaagaagtct 2520
gagctgagac acaagctgaa gtacgtgcct cacgagtaca tcgagctgat cgagatcgcc 2580
agaaatagca cccaggatag aatcctggag atgaaggtga tggagttctt catgaaagtg 2640
tacggctaca gaggaaagca tctgggagga agcagaaaac ctgacggagc catttataca 2700
gtgggcagcc ctatcgatta tggcgtgatc gtggatacaa aggcctacag cggaggctac 2760
aatctgccta ttggacaggc cgatgagatg cagagatacg tggaggagaa ccaaaccagg 2820
aacaagcata tcaaccctaa cgagtggtgg aaggtgtacc cttctagcgt gaccgagttc 2880
aagttcctgt ttgtgagcgg ccacttcaag ggcaattata aggcccagct gaccaggctg 2940
aaccacatca caaattgtaa tggcgccgtg ctgtctgtgg aggaactgct gattggagga 3000
gagatgatta aggccggaac actgacactg gaggaggtga gaagaaagtt caacaacggc 3060
gagatcaact tctga 3075
<210> 92
<211> 19
<212> DNA
<213> 玉米
<400> 92
cacacctcgt tgccaaagc 19
<210> 93
<211> 21
<212> DNA
<213> 玉米
<400> 93
catcgcgtcc taaacaaagg a 21
<210> 94
<211> 15
<212> DNA
<213> 玉米
<400> 94
cctgtcctgc actgc 15
<210> 95
<211> 15
<212> DNA
<213> 玉米
<400> 95
gcagtgcagg acagg 15
<210> 96
<211> 22
<212> DNA
<213> 玉米
<400> 96
tgcagtgcag tgcaggacag ga 22
<210> 97
<211> 23
<212> DNA
<213> 玉米
<400> 97
ctcgttgcca aagctgcatc cgt 23
<210> 98
<211> 1176
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 98
atgcaaaaac tcattaactc agtgcaaaac tatgcctggg gcagcaaaac ggcgttgact 60
gaactttatg gtatggaaaa tccgtccagc cagccgatgg ccgagctgtg gatgggcgca 120
catccgaaaa gcagttcacg agtgcagaat gccgccggag atatcgtttc actgcgtgat 180
gtgattgaga gtgataaatc gactctgctc ggagaggccg ttgccaaacg ctttggcgaa 240
ctgcctttcc tgttcaaagt attatgcgca gcacagccac tctccattca ggttcatcca 300
aacaaacaca attctgaaat cggttttgcc aaagaaaatg ccgcaggtat cccgatggat 360
gccgccgagc gtaactataa agatcctaac cacaagccgg agctggtttt tgcgctgacg 420
cctttccttg cgatgaacgc gtttcgtgaa ttttccgaga ttgtctccct actccagccg 480
gtcgcaggtg cacatccggc gattgctcac tttttacaac agcctgatgc cgaacgttta 540
agcgaactgt tcgccagcct gttgaatatg cagggtgaag aaaaatcccg cgcgctggcg 600
attttaaaat cggccctcga tagccagcag ggtgaaccgt ggcaaacgat tcgtttaatt 660
tctgaatttt acccggaaga cagcggtctg ttctccccgc tattgctgaa tgtggtgaaa 720
ttgaaccctg gcgaagcgat gttcctgttc gctgaaacac cgcacgctta cctgcaaggc 780
gtggcgctgg aagtgatggc aaactccgat aacgtgctgc gtgcgggtct gacgcctaaa 840
tacattgata ttccggaact ggttgccaat gtgaaattcg aagccaaacc ggctaaccag 900
ttgttgaccc agccggtgaa acaaggtgca gaactggact tcccgattcc agtggatgat 960
tttgccttct cgctgcatga ccttagtgat aaagaaacca ccattagcca gcagagtgcc 1020
gccattttgt tctgcgtcga aggcgatgca acgttgtgga aaggttctca gcagttacag 1080
cttaaaccgg gtgaatcagc gtttattgcc gccaacgaat caccggtgac tgtcaaaggc 1140
cacggccgtt tagcgcgtgt ttacaacaag ctgtaa 1176
<210> 99
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 99
ttaactcagt gcaaaactat gcctggggca gcaaaacggc gttgactgaa 50
<210> 100
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 100
tctccattca ggttcatcca aacaaacaca attctgaaat cggttttgcc aaa 53
<210> 101
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 101
tgcacatccg gcgattgctc actttttaca acagcctgat gccgaacgtt taa 53
<210> 102
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 102
ttaactcagt gcaaaact 18
<210> 103
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 103
ttcagtcaac gccgtttt 18
<210> 104
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 104
tctccattca ggttcatcc 19
<210> 105
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 105
tttggcaaaa ccgatttca 19
<210> 106
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 106
tgcacatccg gcgattgct 19
<210> 107
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 107
ttaaacgttc ggcatcag 18
<210> 108
<211> 1000
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 108
Met Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Val Asp Leu Arg Thr
1 5 10 15
Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg
20 25 30
Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr
35 40 45
His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr
50 55 60
Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala Thr
65 70 75 80
His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala
85 90 95
Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu
100 105 110
Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val
115 120 125
Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala
130 135 140
Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly
145 150 155 160
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
165 170 175
Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
180 185 190
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
195 200 205
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
210 215 220
Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
225 230 235 240
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val
245 250 255
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
260 265 270
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
275 280 285
Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
290 295 300
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
305 310 315 320
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
325 330 335
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
340 345 350
Thr Pro Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln
355 360 365
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His
370 375 380
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly
385 390 395 400
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
405 410 415
Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly
420 425 430
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
435 440 445
Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
450 455 460
Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
465 470 475 480
Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile
485 490 495
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
500 505 510
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val
515 520 525
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
530 535 540
Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln
545 550 555 560
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
565 570 575
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
580 585 590
Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu
595 600 605
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
610 615 620
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
625 630 635 640
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
645 650 655
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Arg His Asp Gly Gly
660 665 670
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
675 680 685
Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly
690 695 700
Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
705 710 715 720
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
725 730 735
Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro
740 745 750
His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg
755 760 765
Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu
770 775 780
Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met
785 790 795 800
Thr Gln Phe Gly Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser
805 810 815
Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu
820 825 830
Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys
835 840 845
Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu
850 855 860
Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro
865 870 875 880
Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr
885 890 895
Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu
900 905 910
Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val
915 920 925
Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His
930 935 940
Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr
945 950 955 960
Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly
965 970 975
Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys
980 985 990
Phe Asn Asn Gly Glu Ile Asn Phe
995 1000
<210> 109
<211> 1000
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 109
Met Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Val Asp Leu Arg Thr
1 5 10 15
Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg
20 25 30
Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr
35 40 45
His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr
50 55 60
Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala Thr
65 70 75 80
His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala
85 90 95
Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu
100 105 110
Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val
115 120 125
Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala
130 135 140
Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly
145 150 155 160
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
165 170 175
Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
180 185 190
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
195 200 205
Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
210 215 220
Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
225 230 235 240
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val
245 250 255
Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
260 265 270
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
275 280 285
Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
290 295 300
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
305 310 315 320
Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
325 330 335
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
340 345 350
Thr Pro Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln
355 360 365
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His
370 375 380
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly
385 390 395 400
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
405 410 415
Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
420 425 430
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
435 440 445
Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
450 455 460
Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
465 470 475 480
Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile
485 490 495
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
500 505 510
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val
515 520 525
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
530 535 540
Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln
545 550 555 560
Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr
565 570 575
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
580 585 590
Glu Gln Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu
595 600 605
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
610 615 620
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
625 630 635 640
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
645 650 655
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Arg Asn Gly Gly Gly
660 665 670
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
675 680 685
Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly
690 695 700
Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
705 710 715 720
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
725 730 735
Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro
740 745 750
His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg
755 760 765
Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu
770 775 780
Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met
785 790 795 800
Thr Gln Phe Gly Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser
805 810 815
Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu
820 825 830
Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys
835 840 845
Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu
850 855 860
Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro
865 870 875 880
Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr
885 890 895
Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu
900 905 910
Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val
915 920 925
Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His
930 935 940
Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr
945 950 955 960
Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly
965 970 975
Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys
980 985 990
Phe Asn Asn Gly Glu Ile Asn Phe
995 1000
<210> 110
<211> 1001
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 110
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Tyr Pro Tyr Asp
1 5 10 15
Val Pro Asp Tyr Ala Ile Asp Ile Ala Asp Leu Arg Thr Leu Gly Tyr
20 25 30
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
35 40 45
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
50 55 60
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
65 70 75 80
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
85 90 95
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
100 105 110
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
115 120 125
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
130 135 140
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
145 150 155 160
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
165 170 175
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
180 185 190
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
195 200 205
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
210 215 220
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
225 230 235 240
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val
245 250 255
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
260 265 270
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
275 280 285
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
290 295 300
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala
305 310 315 320
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val
325 330 335
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
340 345 350
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
355 360 365
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
370 375 380
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
385 390 395 400
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
405 410 415
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
420 425 430
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
435 440 445
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
450 455 460
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly
465 470 475 480
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
485 490 495
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
500 505 510
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
515 520 525
Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala
530 535 540
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
545 550 555 560
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
565 570 575
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala
580 585 590
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val
595 600 605
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
610 615 620
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln
625 630 635 640
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
645 650 655
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
660 665 670
Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
675 680 685
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
690 695 700
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
705 710 715 720
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
725 730 735
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly
740 745 750
Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp
755 760 765
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys
770 775 780
Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly Asp
785 790 795 800
Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe
995 1000
<210> 111
<211> 1007
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 111
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Lys Glu Thr Ala
1 5 10 15
Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ile Asp Ile Ala Asp
20 25 30
Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro
35 40 45
Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His
50 55 60
Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala
65 70 75 80
Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro
85 90 95
Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly
100 105 110
Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly
115 120 125
Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg
130 135 140
Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu
145 150 155 160
Thr Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala Ile Ala
165 170 175
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
180 185 190
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
195 200 205
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala
210 215 220
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
225 230 235 240
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
245 250 255
Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
260 265 270
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
275 280 285
Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
290 295 300
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
305 310 315 320
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
325 330 335
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
340 345 350
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
355 360 365
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly
370 375 380
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
385 390 395 400
Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn
405 410 415
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
420 425 430
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
435 440 445
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
450 455 460
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala
465 470 475 480
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
485 490 495
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val
500 505 510
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
515 520 525
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
530 535 540
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
545 550 555 560
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
565 570 575
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
580 585 590
Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly
595 600 605
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
610 615 620
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
625 630 635 640
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
645 650 655
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
660 665 670
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
675 680 685
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val
690 695 700
Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala
705 710 715 720
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
725 730 735
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala
740 745 750
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
755 760 765
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
770 775 780
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val
785 790 795 800
Lys Lys Gly Leu Gly Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser
805 810 815
Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val
820 825 830
Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln
835 840 845
Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr
850 855 860
Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala
865 870 875 880
Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr
885 890 895
Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu
900 905 910
Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn
915 920 925
Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys
930 935 940
Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu
945 950 955 960
Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val
965 970 975
Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr
980 985 990
Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
995 1000 1005
<210> 112
<211> 3003
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 112
atggagcaga agctgatcag cgaggaggac ctcgtcgacc tcaggaccct gggctacagc 60
cagcagcagc aggagaagat caagccgaag gtgaggagca ccgtggccca gcaccacgag 120
gctctggtgg gccacggctt cacccacgct cacatcgtgg ccctgagcca gcacccagct 180
gctctgggca ccgtggctgt gacctaccag cacatcatca ccgccctgcc agaggctacc 240
cacgaggaca tcgtgggcgt gggcaagcag tggagcggcg ctagggccct ggaggctctg 300
ctgaccgatg ctggcgagct gaggggccca ccgctccagc tggataccgg ccagctggtg 360
aagatcgcca agaggggcgg cgtgaccgct atggaggctg tgcacgccag caggaacgct 420
ctgaccggcg ctccactgaa cctgaccccc gaccaggtgg tggccatcgc gagcaacggc 480
ggcggcaagc aggctctcga aaccgtgcag aggctgctcc cggtgctgtg ccaggcccac 540
ggcctcaccc cagaccaggt cgtcgcgatc gcctccaaca tcggcggcaa gcaggccctg 600
gagactgtgc agcgcctgct gcccgtcctg tgccaggacc acggcctcac cccggagcag 660
gtcgtcgcta tcgctagaaa catcggcggc aagcaggcgc tcgaaaccgt ccagaggctc 720
ctcccagtcc tctgccagga tcacggcctg accccggatc aggtggtcgc catcgcttca 780
cacgacggcg gcaagcaggc gctggagact gtccagcgcc tcctcccagt cctctgccag 840
gcgcacggcc tcacccccga tcaggtcgtg gcgatcgcga gaaacggcgg cggcaagcag 900
gctctcgaaa ccgtgcagag gctgctgccg gtgctctgcc aggctcacgg cctgacccca 960
gaccaggtgg tggctatcgc ctcccacgac ggcggcaagc aggccctgga gactgtgcag 1020
aggctgctgc cggtcctgtg ccaggcccac ggcctcaccc ccgagcaggt cgtcgcgatc 1080
gctagaaaca tcggcggcaa gcaggccctg gagactgtcc agaggctcct cccggtcctg 1140
tgccaggacc acggcctgac cccggaccag gtggtcgcca tcgcctccaa caagggcggc 1200
aagcaggcgc tcgaaaccgt gcagaggctc ctgccggtgc tctgccagga tcacggcctg 1260
accccagagc aggtggtggc tatcgcgagc aacggcggcg gcaagcaggc tctcgaaacc 1320
gtccagaggc tcctcccagt gctctgccag gctcacggcc tcaccccgga ccaggtcgtc 1380
gccatcgctt caaacaaggg cggcaagcag gccctggaga ctgtgcagag gctgctgccc 1440
gtgctgtgcc aggaccacgg cctgacccca gatcaggtgg tggctatcgc tagccacgac 1500
ggcggcaagc aggcgctgga gactgtccag aggctcctcc cagtcctgtg ccaggatcac 1560
ggcctcaccc cggaccaggt cgtcgccatc gcttcaaaca tcggcggcaa gcaggccctg 1620
gagactgtgc agaggctgct gcccgtgctg tgccaggacc acggcctcac cccggatcag 1680
gtcgtggcca tcgcgtccaa catcggcggc aagcaggcgc tggagactgt ccagaggctg 1740
ctgcccgtcc tgtgccaggc gcacggcctc accccagagc aggtcgtcgc catcgccaga 1800
aacatcggcg gcaagcaggc tctcgaaacc gtgcagaggc tgctgcccgt gctctgccag 1860
gcccacggcc tgaccccgga gcaggtggtg gcgatcgcct ccaacatcgg cggcaagcag 1920
gctctcgaaa ccgtgcagag gctcctcccc gtgctctgcc aggctcacgg cctgaccccc 1980
gatcaggtgg tcgcgatcgc tagacacgac ggcggcaagc aggccctgga gactgtccag 2040
cgcctgctgc cagtcctgtg ccaggaccac ggcctcaccc ccgaccaggt cgtggctatc 2100
gcgtccaacg gcggcggcaa gcaggctctc gagagcatcg tggcccagct gagcaggccg 2160
gacccggccc tggccgccct gaccaacgat cacctggtgg ctctggcctg cctgggcggc 2220
aggccagcca tggacgctgt gaagaagggc ctgccgcacg ctccagagct gatccgcagg 2280
gtgaacagga ggatcggcga gaggaccagc cacagggtgg ccgactacgc tcaggtggtg 2340
agggtgctgg agttcttcca gtgccacagc cacccggcct acgccttcga cgaggctatg 2400
acccagttcg gccagctcgt gaagagcgag ctggaggaga agaagagcga gctgaggcac 2460
aagctgaagt acgtgccaca cgagtacatc gagctgatcg agatcgccag gaacagcacc 2520
caggatcgca tcctggagat gaaggtgatg gagttcttca tgaaggtgta cggctacagg 2580
ggcaagcacc tgggcggcag caggaagcca gatggcgcca tctacaccgt gggcagccca 2640
atcgactacg gcgtgatcgt ggataccaag gcttacagcg gcggctacaa cctgccgatc 2700
ggccaggctg atgagatgca gaggtacgtg gaggagaacc agaccaggaa caagcacatc 2760
aacccaaacg agtggtggaa ggtgtacccg agcagcgtga ccgagttcaa gttcctgttc 2820
gtgagcggcc acttcaaggg caactacaag gctcagctca ccaggctgaa ccacatcacc 2880
aactgcaacg gcgccgtgct gagcgtggag gagctgctga tcggcggcga gatgatcaag 2940
gctggcaccc tgaccctgga ggaggtgagg aggaagttca acaacggcga gatcaacttc 3000
tga 3003
<210> 113
<211> 3003
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 113
atggagcaga agctgatcag cgaggaggac ctcgtcgacc tcaggaccct gggctacagc 60
cagcagcagc aggagaagat caagccgaag gtgaggagca ccgtggccca gcaccacgag 120
gctctggtgg gccacggctt cacccacgct cacatcgtgg ccctgagcca gcacccagct 180
gctctgggca ccgtggctgt gacctaccag cacatcatca ccgccctgcc agaggctacc 240
cacgaggaca tcgtgggcgt gggcaagcag tggagcggcg ctagggccct ggaggctctg 300
ctgaccgatg ctggcgagct gaggggccca ccgctccagc tggataccgg ccagctggtg 360
aagatcgcca agaggggcgg cgtgaccgct atggaggctg tgcacgccag caggaacgct 420
ctgaccggcg ctccactgaa cctgaccccc gaccaggtgg tggccatcgc gagcaacggc 480
ggcggcaagc aggctctcga aaccgtgcag aggctgctcc cggtgctgtg ccaggcccac 540
ggcctcaccc cagaccaggt cgtcgcgatc gcctcccacg acggcggcaa gcaggccctg 600
gagactgtgc agcgcctgct gcccgtcctg tgccaggacc acggcctcac cccggagcag 660
gtcgtcgcta tcgctagaaa catcggcggc aagcaggcgc tcgaaaccgt ccagaggctc 720
ctcccagtcc tctgccagga tcacggcctg accccggatc aggtggtcgc catcgcttca 780
aacaagggcg gcaagcaggc gctggagact gtccagcgcc tcctcccagt cctctgccag 840
gcgcacggcc tcacccccga tcaggtcgtg gcgatcgcga gaaacggcgg cggcaagcag 900
gctctcgaaa ccgtgcagag gctgctgccg gtgctctgcc aggctcacgg cctgacccca 960
gaccaggtgg tggctatcgc ctcccacgac ggcggcaagc aggccctgga gactgtgcag 1020
aggctgctgc cggtcctgtg ccaggcccac ggcctcaccc ccgagcaggt cgtcgcgatc 1080
gctagaaaca tcggcggcaa gcaggccctg gagactgtcc agaggctcct cccggtcctg 1140
tgccaggacc acggcctgac cccggaccag gtggtcgcca tcgcctccaa catcggcggc 1200
aagcaggcgc tcgaaaccgt gcagaggctc ctgccggtgc tctgccagga tcacggcctg 1260
accccagagc aggtggtggc tatcgcgagc cacgacggcg gcaagcaggc tctcgaaacc 1320
gtccagaggc tcctcccagt gctctgccag gctcacggcc tcaccccgga ccaggtcgtc 1380
gccatcgctt caaacaaggg cggcaagcag gccctggaga ctgtgcagag gctgctgccc 1440
gtgctgtgcc aggaccacgg cctgacccca gatcaggtgg tggctatcgc tagccacgac 1500
ggcggcaagc aggcgctgga gactgtccag aggctcctcc cagtcctgtg ccaggatcac 1560
ggcctcaccc cggaccaggt cgtcgccatc gcttcacacg acggcggcaa gcaggccctg 1620
gagactgtgc agaggctgct gcccgtgctg tgccaggacc acggcctcac cccggatcag 1680
gtcgtggcca tcgcgtccaa caagggcggc aagcaggcgc tggagactgt ccagaggctg 1740
ctgcccgtcc tgtgccaggc gcacggcctc accccagagc aggtcgtcgc catcgccaga 1800
aacggcggcg gcaagcaggc tctcgaaacc gtgcagaggc tgctgcccgt gctctgccag 1860
gcccacggcc tgaccccgga gcaggtggtg gcgatcgcct ccaacggcgg cggcaagcag 1920
gctctcgaaa ccgtgcagag gctcctcccc gtgctctgcc aggctcacgg cctgaccccc 1980
gatcaggtgg tcgcgatcgc tagaaacggc ggcggcaagc aggccctgga gactgtccag 2040
cgcctgctgc cagtcctgtg ccaggaccac ggcctcaccc ccgaccaggt cgtggctatc 2100
gcgtccaacg gcggcggcaa gcaggctctc gagagcatcg tggcccagct gagcaggccg 2160
gacccggccc tggccgccct gaccaacgat cacctggtgg ctctggcctg cctgggcggc 2220
aggccagcca tggacgctgt gaagaagggc ctgccgcacg ctccagagct gatccgcagg 2280
gtgaacagga ggatcggcga gaggaccagc cacagggtgg ccgactacgc tcaggtggtg 2340
agggtgctgg agttcttcca gtgccacagc cacccggcct acgccttcga cgaggctatg 2400
acccagttcg gccagctcgt gaagagcgag ctggaggaga agaagagcga gctgaggcac 2460
aagctgaagt acgtgccaca cgagtacatc gagctgatcg agatcgccag gaacagcacc 2520
caggatcgca tcctggagat gaaggtgatg gagttcttca tgaaggtgta cggctacagg 2580
ggcaagcacc tgggcggcag caggaagcca gatggcgcca tctacaccgt gggcagccca 2640
atcgactacg gcgtgatcgt ggataccaag gcttacagcg gcggctacaa cctgccgatc 2700
ggccaggctg atgagatgca gaggtacgtg gaggagaacc agaccaggaa caagcacatc 2760
aacccaaacg agtggtggaa ggtgtacccg agcagcgtga ccgagttcaa gttcctgttc 2820
gtgagcggcc acttcaaggg caactacaag gctcagctca ccaggctgaa ccacatcacc 2880
aactgcaacg gcgccgtgct gagcgtggag gagctgctga tcggcggcga gatgatcaag 2940
gctggcaccc tgaccctgga ggaggtgagg aggaagttca acaacggcga gatcaacttc 3000
tga 3003
<210> 114
<211> 3006
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 114
atgggcgatc ctaaaaagaa acgtaaggtc atcgattacc catacgatgt tccagattac 60
gctatcgata tcgccgatct acgcacgctc ggctacagcc agcagcaaca ggagaagatc 120
aaaccgaagg ttcgttcgac agtggcgcag caccacgagg cactggtcgg ccacgggttt 180
acacacgcgc acatcgttgc gttaagccaa cacccggcag cgttagggac cgtcgctgtc 240
aagtatcagg acatgatcgc agcgttgcca gaggcgacac acgaagcgat cgttggcgtc 300
ggcaaacagt ggtccggcgc acgcgctctg gaggccttgc tcacggtggc gggagagttg 360
agaggtccac cgttacagtt ggacacaggc caacttctca agattgcaaa acgtggcggc 420
gtgaccgcag tggaggcagt gcatgcatgg cgcaatgcac tgacgggtgc cccgctcaac 480
ttgacccccc agcaggtggt ggccatcgcc agcaataatg gtggcaagca ggcgctggag 540
acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 600
gtggccatcg ccagccacga tggcggcaag caggcgctgg agacggtcca gcggctgttg 660
ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 720
attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 780
cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 840
ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccggag 900
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcaggcg 960
ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 1020
agcaatggcg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 1080
caggcccacg gcttgacccc ggagcaggtg gtggccatcg ccagccacga tggcggcaag 1140
caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 1200
ccggagcagg tggtggccat cgccagccac gatggcggca agcaggcgct ggagacggtc 1260
cagcggctgt tgccggtgct gtgccaggcc cacggcttga ccccccagca ggtggtggcc 1320
atcgccagca ataatggtgg caagcaggcg ctggagacgg tccagcggct gttgccggtg 1380
ctgtgccagg cccacggctt gaccccccag caggtggtgg ccatcgccag caataatggt 1440
ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 1500
ttgaccccgg agcaggtggt ggccatcgcc agccacgatg gcggcaagca ggcgctggag 1560
acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ccagcaggtg 1620
gtggccatcg ccagcaataa tggtggcaag caggcgctgg agacggtcca gcggctgttg 1680
ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 1740
attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 1800
cacggcttga ccccccagca ggtggtggcc atcgccagca atggcggtgg caagcaggcg 1860
ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccccag 1920
caggtggtgg ccatcgccag caatggcggt ggcaagcagg cgctggagac ggtccagcgg 1980
ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 2040
agcaataatg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 2100
caggcccacg gcttgacccc ggagcaggtg gtggccatcg ccagccacga tggcggcaag 2160
caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 2220
cctcagcagg tggtggccat cgccagcaat ggcggcggca ggccggcgct ggagagcatt 2280
gttgcccagt tatctcgccc tgatccggcg ttggccgcgt tgaccaacga ccacctcgtc 2340
gccttggcct gcctcggcgg gcgtcctgcg ctggatgcag tgaaaaaggg attgggggat 2400
cctatcagcc gttcccagct ggtgaaatct gagctggagg agaagaagtc tgagctgaga 2460
cacaagctga agtacgtgcc tcacgagtac atcgagctga tcgagatcgc cagaaatagc 2520
acccaggata gaatcctgga gatgaaggtg atggagttct tcatgaaagt gtacggctac 2580
agaggaaagc atctgggagg aagcagaaaa cctgacggag ccatttatac agtgggcagc 2640
cctatcgatt atggcgtgat cgtggataca aaggcctaca gcggaggcta caatctgcct 2700
attggacagg ccgatgagat gcagagatac gtggaggaga accaaaccag gaacaagcat 2760
atcaacccta acgagtggtg gaaggtgtac ccttctagcg tgaccgagtt caagttcctg 2820
tttgtgagcg gccacttcaa gggcaattat aaggcccagc tgaccaggct gaaccacatc 2880
acaaattgta atggcgccgt gctgtctgtg gaggaactgc tgattggagg agagatgatt 2940
aaggccggaa cactgacact ggaggaggtg agaagaaagt tcaacaacgg cgagatcaac 3000
ttctga 3006
<210> 115
<211> 3024
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 115
atgggcgatc ctaaaaagaa acgtaaggtc atcgataagg agaccgccgc tgccaagttc 60
gagagacagc acatggacag catcgatatc gccgatctac gcacgctcgg ctacagccag 120
cagcaacagg agaagatcaa accgaaggtt cgttcgacag tggcgcagca ccacgaggca 180
ctggtcggcc acgggtttac acacgcgcac atcgttgcgt taagccaaca cccggcagcg 240
ttagggaccg tcgctgtcaa gtatcaggac atgatcgcag cgttgccaga ggcgacacac 300
gaagcgatcg ttggcgtcgg caaacagtgg tccggcgcac gcgctctgga ggccttgctc 360
acggtggcgg gagagttgag aggtccaccg ttacagttgg acacaggcca acttctcaag 420
attgcaaaac gtggcggcgt gaccgcagtg gaggcagtgc atgcatggcg caatgcactg 480
acgggtgccc cgctcaactt gaccccccag caggtggtgg ccatcgccag caatggcggt 540
ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 600
ttgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 660
acggtgcagg cgctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 720
gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca ggcgctgttg 780
ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 840
attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 900
cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 960
ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccccag 1020
caggtggtgg ccatcgccag caataatggt ggcaagcagg cgctggagac ggtccagcgg 1080
ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 1140
agcaatggcg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 1200
caggcccacg gcttgacccc ccagcaggtg gtggccatcg ccagcaatgg cggtggcaag 1260
caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 1320
ccggagcagg tggtggccat cgccagccac gatggcggca agcaggcgct ggagacggtc 1380
cagcggctgt tgccggtgct gtgccaggcc cacggcttga ccccccagca ggtggtggcc 1440
atcgccagca ataatggtgg caagcaggcg ctggagacgg tccagcggct gttgccggtg 1500
ctgtgccagg cccacggctt gaccccccag caggtggtgg ccatcgccag caataatggt 1560
ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 1620
ttgaccccgg agcaggtggt ggccatcgcc agccacgatg gcggcaagca ggcgctggag 1680
acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 1740
gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca ggcgctgttg 1800
ccggtgctgt gccaggccca cggcttgacc ccccagcagg tggtggccat cgccagcaat 1860
ggcggtggca agcaggcgct ggagacggtc cagcggctgt tgccggtgct gtgccaggcc 1920
cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 1980
ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccggag 2040
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcaggcg 2100
ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 2160
agcaataatg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 2220
caggcccacg gcttgacccc tcagcaggtg gtggccatcg ccagcaatgg cggcggcagg 2280
ccggcgctgg agagcattgt tgcccagtta tctcgccctg atccggcgtt ggccgcgttg 2340
accaacgacc acctcgtcgc cttggcctgc ctcggcgggc gtcctgcgct ggatgcagtg 2400
aaaaagggat tgggggatcc tatcagccgt tcccagctgg tgaaatctga gctggaggag 2460
aagaagtctg agctgagaca caagctgaag tacgtgcctc acgagtacat cgagctgatc 2520
gagatcgcca gaaatagcac ccaggataga atcctggaga tgaaggtgat ggagttcttc 2580
atgaaagtgt acggctacag aggaaagcat ctgggaggaa gcagaaaacc tgacggagcc 2640
atttatacag tgggcagccc tatcgattat ggcgtgatcg tggatacaaa ggcctacagc 2700
ggaggctaca atctgcctat tggacaggcc gatgagatgc agagatacgt ggaggagaac 2760
caaaccagga acaagcatat caaccctaac gagtggtgga aggtgtaccc ttctagcgtg 2820
accgagttca agttcctgtt tgtgagcggc cacttcaagg gcaattataa ggcccagctg 2880
accaggctga accacatcac aaattgtaat ggcgccgtgc tgtctgtgga ggaactgctg 2940
attggaggag agatgattaa ggccggaaca ctgacactgg aggaggtgag aagaaagttc 3000
aacaacggcg agatcaactt ctga 3024
<210> 116
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 116
atagagatcc tctagagtcg accatggtga tcactgcagg catgcaagct tgt 53
<210> 117
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 117
atagagatcc tctagagt 18
<210> 118
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 118
acaagcttgc atgcctgc 18
<210> 119
<211> 1344
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 119
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
785 790 795 800
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
820 825 830
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
835 840 845
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
850 855 860
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
865 870 875 880
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
885 890 895
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile
900 905 910
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
915 920 925
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp
930 935 940
Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val
945 950 955 960
Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala
965 970 975
Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala
980 985 990
Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly
995 1000 1005
Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala
1010 1015 1020
Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile
1025 1030 1035
Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser
1040 1045 1050
Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser
1055 1060 1065
Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp
1070 1075 1080
Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala
1085 1090 1095
Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro
1100 1105 1110
Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys
1115 1120 1125
Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr
1130 1135 1140
Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
1145 1150 1155
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr
1160 1165 1170
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile
1175 1180 1185
Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr
1190 1195 1200
Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
1205 1210 1215
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr
1220 1225 1230
Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
1235 1240 1245
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
1250 1255 1260
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
1265 1270 1275
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
1280 1285 1290
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly
1295 1300 1305
Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
1310 1315 1320
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
1325 1330 1335
Asn Gly Glu Ile Asn Phe
1340
<210> 120
<211> 1344
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 120
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg
20 25 30
Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val
35 40 45
Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu
50 55 60
Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser
65 70 75 80
Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu
85 90 95
Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser
100 105 110
Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp
115 120 125
Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr
130 135 140
Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala
145 150 155 160
Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln
165 170 175
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
180 185 190
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
195 200 205
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
210 215 220
Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala
225 230 235 240
Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp
245 250 255
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu
260 265 270
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala
275 280 285
Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn
290 295 300
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
405 410 415
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly
755 760 765
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
785 790 795 800
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
805 810 815
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
820 825 830
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
835 840 845
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
850 855 860
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
865 870 875 880
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
885 890 895
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile
900 905 910
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
915 920 925
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp
930 935 940
Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val
945 950 955 960
Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala
965 970 975
Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala
980 985 990
Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly
995 1000 1005
Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala
1010 1015 1020
Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile
1025 1030 1035
Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser
1040 1045 1050
Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser
1055 1060 1065
Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp
1070 1075 1080
Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala
1085 1090 1095
Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro
1100 1105 1110
Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys
1115 1120 1125
Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr
1130 1135 1140
Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
1145 1150 1155
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr
1160 1165 1170
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile
1175 1180 1185
Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr
1190 1195 1200
Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
1205 1210 1215
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr
1220 1225 1230
Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
1235 1240 1245
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
1250 1255 1260
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
1265 1270 1275
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
1280 1285 1290
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly
1295 1300 1305
Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
1310 1315 1320
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
1325 1330 1335
Asn Gly Glu Ile Asn Phe
1340
<210> 121
<211> 1038
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 121
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
450 455 460
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu
770 775 780
Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val
785 790 795 800
Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys
805 810 815
Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile
820 825 830
Gly Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu
835 840 845
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
850 855 860
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
865 870 875 880
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
885 890 895
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
900 905 910
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
915 920 925
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
930 935 940
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
945 950 955 960
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
965 970 975
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
980 985 990
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
995 1000 1005
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr
1010 1015 1020
Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<210> 122
<211> 1038
<212> PRT
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 122
Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp
1 5 10 15
Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg
20 25 30
Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg
35 40 45
Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val
50 55 60
Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe
65 70 75 80
Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly
85 90 95
Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala
100 105 110
Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg
115 120 125
Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro
130 135 140
Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly
145 150 155 160
Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly
165 170 175
Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
180 185 190
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
195 200 205
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
210 215 220
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
225 230 235 240
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
245 250 255
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
260 265 270
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
275 280 285
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
290 295 300
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
305 310 315 320
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
325 330 335
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
340 345 350
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
355 360 365
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
370 375 380
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
385 390 395 400
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
405 410 415
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
420 425 430
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
435 440 445
Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
450 455 460
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
465 470 475 480
Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
485 490 495
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
500 505 510
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
515 520 525
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
530 535 540
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
545 550 555 560
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
565 570 575
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp
580 585 590
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
595 600 605
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
610 615 620
Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
625 630 635 640
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
645 650 655
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
660 665 670
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
675 680 685
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
690 695 700
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
705 710 715 720
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
725 730 735
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
740 745 750
Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala
755 760 765
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu
770 775 780
Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val
785 790 795 800
Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys
805 810 815
Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile
820 825 830
Gly Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu
835 840 845
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
850 855 860
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
865 870 875 880
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
885 890 895
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
900 905 910
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
915 920 925
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
930 935 940
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
945 950 955 960
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
965 970 975
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
980 985 990
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
995 1000 1005
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr
1010 1015 1020
Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<210> 123
<211> 4035
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 123
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc caacggcggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380
atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctcca acaacggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560
caggtcgtcg cgatcgctag caacatcggc ggcaagcagg ccctggagac tgtgcagagg 1620
ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680
agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740
caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagccacga cggcggcaag 1800
caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860
ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920
cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980
atcgcctcca acggcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040
ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag ccacgacggc 2100
ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160
ctgaccccgg atcaggtggt cgccatcgct tccaacggcg gcggcaagca ggcgctggag 2220
actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280
gtggcgatcg cgagcaacat cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340
ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400
aacggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460
cacggcctca cccccgagca ggtcgtcgcg atcgctagca acatcggcgg caagcaggcc 2520
ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580
caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640
ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700
tccaacggcg gcggcaagca ggctctcgag agcatcgtgg cccagctgag caggccggac 2760
ccggccctgg ccgccctgac caacgatcac ctggtggctc tggcctgcct gggcggcagg 2820
ccagccatgg acgctgtgaa gaagggcctg ccgcacgctc cagagctgat ccgcagggtg 2880
aacaggagga tcggcgagag gaccagccac agggtggccg actacgctca ggtggtgagg 2940
gtgctggagt tcttccagtg ccacagccac ccggcctacg ccttcgacga ggctatgacc 3000
cagttcggca tgagcaggaa cggcctggtg cagctgttca ggagggtggg cgtgaccgag 3060
ctggaggcta ggggcggcac cctgccgcca gctagccaga ggtgggaccg catcctccag 3120
gccagcggca tgaaaagggc taagccaagc ccgaccagcg ctcagacccc agatcaggct 3180
agcctgcacg ctttcgccga cagcctggag agggatctgg atgctccgag cccaatgcac 3240
gagggcgacc agaccagggc cagcagcagg aagaggagca ggagcgacag ggctgtgacc 3300
ggcccgagcg cccagcaggc tgtggaggtg agggtgccag agcagaggga tgccctgcac 3360
ctgccgctga gctggagggt gaagaggcca aggaccagga tctggggcgg cctgccagat 3420
ccgggcaccc caaccgctgc tgatcagctc gtgaagagcg agctggagga gaagaagagc 3480
gagctgaggc ataaactgaa gtacgtgcca cacgagtaca tcgagctgat cgagatcgcc 3540
aggaacagca cccaggatcg catcctggag atgaaggtga tggagttctt catgaaagtg 3600
tacggctaca ggggcaagca cctgggcggc agcaggaagc cagatggcgc catctacacc 3660
gtgggcagcc caatcgacta cggcgtgatc gtggatacca aggcttacag cggcggctac 3720
aacctgccga tcggccaggc tgatgagatg cagaggtacg tggaggagaa tcaaaccagg 3780
aacaagcaca tcaacccaaa cgagtggtgg aaggtgtacc cgagcagcgt gaccgagttc 3840
aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggctcagct caccaggctg 3900
aaccacatca ccaactgcaa cggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 3960
gagatgatca aggctggcac cctgaccctg gaggaggtga ggaggaagtt caacaacggc 4020
gagatcaact tctga 4035
<210> 124
<211> 4035
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 124
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120
ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180
ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240
ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300
gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360
accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420
ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480
ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540
accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600
gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660
agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720
ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780
gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840
accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900
gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960
atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020
ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080
ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140
ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200
accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260
gtcgccatcg cttccaacat cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320
ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380
aacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440
cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500
ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560
caggtcgtcg cgatcgctag caacggcggc ggcaagcagg ccctggagac tgtgcagagg 1620
ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680
agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740
caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacaa cggcggcaag 1800
caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860
ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920
cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980
atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040
ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacggcggc 2100
ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160
ctgaccccgg atcaggtggt cgccatcgct tccaacaacg gcggcaagca ggcgctggag 2220
actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280
gtggcgatcg cgagccacga cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340
ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctcccac 2400
gatggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460
cacggcctca cccccgagca ggtcgtcgcg atcgctagca acggcggcgg caagcaggcc 2520
ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580
caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640
ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700
tcccacgatg gcggcaagca ggctctcgag agcatcgtgg cccagctgag caggccggac 2760
ccggccctgg ccgccctgac caacgatcac ctggtggctc tggcctgcct gggcggcagg 2820
ccagccatgg acgctgtgaa gaagggcctg ccgcacgctc cagagctgat ccgcagggtg 2880
aacaggagga tcggcgagag gaccagccac agggtggccg actacgctca ggtggtgagg 2940
gtgctggagt tcttccagtg ccacagccac ccggcctacg ccttcgacga ggctatgacc 3000
cagttcggca tgagcaggaa cggcctggtg cagctgttca ggagggtggg cgtgaccgag 3060
ctggaggcta ggggcggcac cctgccgcca gctagccaga ggtgggaccg catcctccag 3120
gccagcggca tgaaaagggc taagccaagc ccgaccagcg ctcagacccc agatcaggct 3180
agcctgcacg ctttcgccga cagcctggag agggatctgg atgctccgag cccaatgcac 3240
gagggcgacc agaccagggc cagcagcagg aagaggagca ggagcgacag ggctgtgacc 3300
ggcccgagcg cccagcaggc tgtggaggtg agggtgccag agcagaggga tgccctgcac 3360
ctgccgctga gctggagggt gaagaggcca aggaccagga tctggggcgg cctgccagat 3420
ccgggcaccc caaccgctgc tgatcagctc gtgaagagcg agctggagga gaagaagagc 3480
gagctgaggc ataaactgaa gtacgtgcca cacgagtaca tcgagctgat cgagatcgcc 3540
aggaacagca cccaggatcg catcctggag atgaaggtga tggagttctt catgaaagtg 3600
tacggctaca ggggcaagca cctgggcggc agcaggaagc cagatggcgc catctacacc 3660
gtgggcagcc caatcgacta cggcgtgatc gtggatacca aggcttacag cggcggctac 3720
aacctgccga tcggccaggc tgatgagatg cagaggtacg tggaggagaa tcaaaccagg 3780
aacaagcaca tcaacccaaa cgagtggtgg aaggtgtacc cgagcagcgt gaccgagttc 3840
aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggctcagct caccaggctg 3900
aaccacatca ccaactgcaa cggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 3960
gagatgatca aggctggcac cctgaccctg gaggaggtga ggaggaagtt caacaacggc 4020
gagatcaact tctga 4035
<210> 125
<211> 3114
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 125
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctccaacgg cggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttcca acaacggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag caacatcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tccaacaacg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140
caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacat cggcggcaag 1200
caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260
cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320
cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380
atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440
ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500
ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560
ctcaccccag accaggtcgt cgcgatcgcc tccaacggcg gcggcaagca ggccctggag 1620
actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680
gtcgctatcg ctagccacga cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740
ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800
ggcggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860
cacggcctca cccccgatca ggtcgtggcg atcgcgagca acatcggcgg caagcaggct 1920
ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980
caggtggtgg ctatcgcctc caacaacggc ggcaagcagg ccctggagac tgtgcagagg 2040
ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100
agcaacatcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160
caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220
caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280
cccgaccagg tcgtggctat cgcgtccaac ggcggcggca agcaggctct cgagagcatc 2340
gtggcccagc tgagcaggcc ggacccggcc ctggccgccc tgaccaacga tcacctggtg 2400
gctctggcct gcctgggcgg caggccagcc atggacgctg tgaagaaggg cctgccgcac 2460
gctccagagc tgatccgcag ggtgaacagg aggatcggcg agaggaccag ccacagggtg 2520
gccctgcagc tcgtgaagag cgagctggag gagaagaaga gcgagctgag gcataaactg 2580
aagtacgtgc cacacgagta catcgagctg atcgagatcg ccaggaacag cacccaggat 2640
cgcatcctgg agatgaaggt gatggagttc ttcatgaaag tgtacggcta caggggcaag 2700
cacctgggcg gcagcaggaa gccagatggc gccatctaca ccgtgggcag cccaatcgac 2760
tacggcgtga tcgtggatac caaggcttac agcggcggct acaacctgcc gatcggccag 2820
gctgatgaga tgcagaggta cgtggaggag aatcaaacca ggaacaagca catcaaccca 2880
aacgagtggt ggaaggtgta cccgagcagc gtgaccgagt tcaagttcct gttcgtgagc 2940
ggccacttca agggcaacta caaggctcag ctcaccaggc tgaaccacat caccaactgc 3000
aacggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaggctggc 3060
accctgaccc tggaggaggt gaggaggaag ttcaacaacg gcgagatcaa cttc 3114
<210> 126
<211> 3114
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞菌属,大肠杆菌
<400> 126
atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60
agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120
cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180
aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240
acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300
acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360
ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420
aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480
gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540
ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600
accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660
gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720
cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780
atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840
cacggcctga ccccggatca ggtggtcgcc atcgcttcca acatcggcgg caagcaggcg 900
ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960
caggtcgtgg cgatcgcgag caacaacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020
ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080
tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140
caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacgg cggcggcaag 1200
caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260
cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320
cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380
atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440
ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500
ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560
ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620
actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680
gtcgctatcg ctagcaacgg cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740
ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800
aacggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860
cacggcctca cccccgatca ggtcgtggcg atcgcgagcc acgacggcgg caagcaggct 1920
ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980
caggtggtgg ctatcgcctc ccacgatggc ggcaagcagg ccctggagac tgtgcagagg 2040
ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100
agcaacggcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160
caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220
caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280
cccgaccagg tcgtggctat cgcgtcccac gatggcggca agcaggctct cgagagcatc 2340
gtggcccagc tgagcaggcc ggacccggcc ctggccgccc tgaccaacga tcacctggtg 2400
gctctggcct gcctgggcgg caggccagcc atggacgctg tgaagaaggg cctgccgcac 2460
gctccagagc tgatccgcag ggtgaacagg aggatcggcg agaggaccag ccacagggtg 2520
gccctgcagc tcgtgaagag cgagctggag gagaagaaga gcgagctgag gcataaactg 2580
aagtacgtgc cacacgagta catcgagctg atcgagatcg ccaggaacag cacccaggat 2640
cgcatcctgg agatgaaggt gatggagttc ttcatgaaag tgtacggcta caggggcaag 2700
cacctgggcg gcagcaggaa gccagatggc gccatctaca ccgtgggcag cccaatcgac 2760
tacggcgtga tcgtggatac caaggcttac agcggcggct acaacctgcc gatcggccag 2820
gctgatgaga tgcagaggta cgtggaggag aatcaaacca ggaacaagca catcaaccca 2880
aacgagtggt ggaaggtgta cccgagcagc gtgaccgagt tcaagttcct gttcgtgagc 2940
ggccacttca agggcaacta caaggctcag ctcaccaggc tgaaccacat caccaactgc 3000
aacggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaggctggc 3060
accctgaccc tggaggaggt gaggaggaag ttcaacaacg gcgagatcaa cttc 3114
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 127
aaccagcgaa ccagcagcgt 20
<210> 128
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 128
tttgctacct gcggtaggtg g 21
<210> 129
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 129
cggccaattc ctgcattcgt ac 22
<210> 130
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 130
gaattgggta ccagcttgca tgc 23
<210> 131
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 131
gtgccatgta tcggttctag agc 23
<210> 132
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 玉米
<400> 132
cattaaatta cggacccaaa agcttac 27
<210> 133
<211> 3494
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌,玉米,根癌农杆菌
<400> 133
ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 660
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 720
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 780
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 840
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 900
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 960
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cctctctacc 1020
ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt ctgttcatgt 1080
ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca cggatgcgac 1140
ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg ggaatcctgg 1200
gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt ttcgttgcat 1260
agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc 1320
atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc 1380
tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt tggatctgta 1440
tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa atatcgatct 1500
aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat gctttttgtt 1560
cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta gatcggagta 1620
gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg tgtgtgtcat 1680
acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat aggtatacat 1740
gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct attcatatgc 1800
tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt attttgatct 1860
tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta gccctgcctt 1920
catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct gttgtttggt 1980
gttacttctg cagggatccc cgatcatgca aaaactcatt aactcagtgc aaaactatgc 2040
ctggggcagc aaaacggcgt tgactgaact ttatggtatg gaaaatccgt ccagccagcc 2100
gatggccgag ctgtggatgg gcgcacatcc gaaaagcagt tcacgagtgc agaatgccgc 2160
cggagatatc gtttcactgc gtgatgcgat tgagagtgat aaatcgactc tgctcggaga 2220
ggccgttgcc aaacgctttg gcgaactgcc tttcctgttc aaagtattat gcgcagcaca 2280
gccactctcc attcaggttc atccaaacaa acacaattct gaaatcggtt ttgccaaaga 2340
aaatgccgca ggtatcccga tggatgccgc cgagcgtaac tataaagatc ctaaccacaa 2400
gccggagctg gtttttgcgc tgacgccttt ccttgcgatg aacgcgtttc gtgaattttc 2460
cgagattgtc tccctactcc agccggtcgc aggtgcacat ccggcgattg ctcacttttt 2520
acaacagcct gatgccgaac gtttaagcga actgttcgcc agcctgttga atatgcaggg 2580
tgaagaaaaa tcccgcgcgc tggcgatttt aaaatcggcc ctcgatagcc agcatggtga 2640
accgtggcaa acgattcgtt taatttctga attttacccg gaagacagcg gtctgttctc 2700
cccgctattg ctgaatgtgg tgaaattgaa ccctggcgaa gcgatgttcc tgttcgctga 2760
aacaccgcac gcttacctgc aaggcgtggc gctggaagtg atggcaaact ccgataacgt 2820
gctgcgtgcg ggtctgacgc ctaaatacat tgatattccg gaactggttg ccaatgtgaa 2880
attcgaagcc aaaccggcta accagttgtt gacccagccg gtgaaacaag gtgcagaact 2940
ggacttcccg attccagtgg atgattttgc cttctcgctg catgacctta gtgataaaga 3000
aaccaccatt agccagcaga gtgccgccat tttgttctgc gtcgaaggcg atgcaacgtt 3060
gtggaaaggt tctcagcagt tacagcttaa accgggtgaa tcagcgttta ttgccgccaa 3120
cgaatcaccg gtgactgtca aaggccacgg ccgtttagcg cgtgtttaca acaagctgta 3180
agagcttact gaaaaaatta acatctcttg ctaagctggg agctcgatcc gtcgacctgc 3240
agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 3300
gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 3360
catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 3420
cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 3480
tatgttacta gatc 3494
<210> 134
<211> 8415
<212> DNA
<213> 人工序列
<220>
<223> 玉米,大肠杆菌,苏云金芽孢杆菌,根癌农杆菌
<400> 134
gaaggcggga aacgacaatc tgatcatgag cggagaatta agggagtcac gttatgaccc 60
ccgccgatga cgcgggacaa gccgttttac gtttggaact gacagaaccg caacgctgca 120
ggaattggcc gcagcggcca tttaaatcaa ttgggcgcgc cgaattcgag ctcggtacaa 180
gcttgcacat gacaacaatt gtaagaggat ggagaccaca acgatccaac aatacttctg 240
cgacgggctg tgaagtatag agaagttaaa cgcccaaaag ccattgtgtt tggaattttt 300
agttattcta tttttcatga tgtatcttcc tctaacatgc cttaatttgc aaatttggta 360
taactactga ttgaaaatat atgtatgtaa aaaaatacta agcatatttt tgaagctaaa 420
catgatgtta tttaagaaaa tatgttgtta acagaataag attaatatcg aaatggaaac 480
atctgtaaat tagaatcatc ttacaagcta agagatgttc acgctttgag aaacttcttc 540
agatcatgac cgtagaagta gctctccaag actcaacgaa ggctgctgca attccacaaa 600
tgcatgacat gcatccttgt aaccgtcgtc gccgctataa acacggataa ctcaattccc 660
tgctccatca atttagaaat gagcaagcaa gcacccgatc gctcacccca tatgcaccaa 720
tctgactccc aagctctgtt tcgcattagt accgccagca ctccacctat agctaccaat 780
tgagaccttt ccagcctaag cagatcgatt gatcgttaga gtcaaagagt tggtggtacg 840
ggtactttaa ctaccatgga atgatggggc gtgatgtaga gcggaaagcg cctccctacg 900
cggaacaaca ccctcgccat gccgctcgac tacagcctcc tcctcgtcgg cgccacaacg 960
agggagcccg tggtcgcagc caccgaccag catgtctctg tgtcctcgtc cgacctcgac 1020
atgtcatggc aaacagtcgg acgccagcac cagactgacg acatgagtct ctgaagagcc 1080
cgccacctag aaagatccga gccctgctgc tggtagtggt aaccattttc gtcgcgctga 1140
cgcggagagc gagaggccag aaatttatag cgactgacgc tgtggcaggc acgctatcgg 1200
aggttacgac gtggcgggtc actcgacgcg gagttcacag gtcctatcct tgcatcgctc 1260
ggcgcggagt ttacggggac ttatccttac gacgtgctct aaggttgcga taacgggcgg 1320
aggaaggcgt gtggcgtgcg gagacggttt atacacgtag tgtgcgggag tgtgtttcgt 1380
agacgcggga aagcacgacg acttacgaag gttagtggag gaggaggaca cactaaaatc 1440
aggacgcaag aaactcttct attatagtag tagagaagag attataggag tgtgggttga 1500
ttctaaagaa aatcgacgca ggacaaccgt caaaacgggt gctttaatat agtagatata 1560
tatatataga gagagagaga aagtacaaag gatgcatttg tgtctgcata tgatcggagt 1620
attactaacg gccgtcgtaa gaaggtccat catgcgtgga gcgagcccat ttggttggtt 1680
gtcaggccgc agttaaggcc tccatatatg attgtcgtcg ggcccataac agcatctcct 1740
ccaccagttt attgtaagaa taaattaagt agagatattt gtcgtcgggc agaagaaact 1800
tggacaagaa gaagaagcaa gctaggccaa tttcttgccg gcaagaggaa gatagtggcc 1860
tctagtttat atatcggcgt gatgatgatg ctcctagcta gaaatgagag aagaaaaacg 1920
gacgcgtgtt tggtgtgtgt caatggcgtc catccttcca tcagatcaga acgatgaaaa 1980
agtcaagcac ggcatgcata gtatatgtat agcttgtttt agtgtggctt tgctgagacg 2040
aatgaaagca acggcgggca tatttttcag tggctgtagc tttcaggctg aaagagacgt 2100
ggcatgcaat aattcaggga attcgtcagc caattgaggt agctagtcaa cttgtacatt 2160
ggtgcgagca attttccgca ctcaggaggg ctagtttgag agtccaaaaa ctataggaga 2220
ttaaagaggc taaaatcctc tccttattta attttaaata agtagtgtat ttgtatttta 2280
actcctccaa cccttccgat tttatggctc tcaaactagc attcagtcta atgcatgcat 2340
gcttggctag aggtcgtatg gggttgttaa tagcatagct agctacaagt taaccgggtc 2400
ttttatattt aataaggaca ggcaaagtat tacttacaaa taaagaataa agctaggacg 2460
aactgctgga ttattactaa atcgaaatgg acgtaatatt ccaggcaaga ataattgttc 2520
gatcaggaga caagtggggc attggaccgg ttcttgcaag caagagccta tggcgtggtg 2580
acacggcgcg ttgcccatac atcatgcctc catcgatgat ccatcctcac ttgctataaa 2640
aagaggtgtc catggtgctc aagctcagcc aagcaaataa gacgacttgt ttcattgatt 2700
cttcaagaga tcgagcttct tttgcaccac aaggtcgagg atccaccatg acggccgaca 2760
acaacaccga ggccctggac agcagcacca ccaaggacgt gatccagaag ggcatcagcg 2820
tggtgggcga cctgctgggc gtggtgggct tccccttcgg cggcgccctg gtgagcttct 2880
acaccaactt cctgaacacc atctggccca gcgaggaccc ctggaaggcc ttcatggagc 2940
aggtggaggc cctgatggac cagaagatcg ccgactacgc caagaacaag gcactggccg 3000
agctacaggg cctccagaac aacgtggagg actatgtgag cgccctgagc agctggcaga 3060
agaaccccgc tgcaccgttc cgcaaccccc acagccaggg ccgcatccgc gagctgttca 3120
gccaggccga gagccacttc cgcaacagca tgcccagctt cgccatcagc ggctacgagg 3180
tgctgttcct gaccacctac gcccaggccg ccaacaccca cctgttcctg ctgaaggacg 3240
cccaaatcta cggagaggag tggggctacg agaaggagga catcgccgag ttctacaagc 3300
gccagctgaa gctgacccag gagtacaccg accactgcgt gaagtggtac aacgtgggtc 3360
tagacaagct ccgcggcagc agctacgaga gctgggtgaa cttcaaccgc taccgccgcg 3420
agatgaccct gaccgtgctg gacctgatcg ccctgttccc cctgtacgac gtgcgcctgt 3480
accccaagga ggtgaagacc gagctgaccc gcgacgtgct gaccgacccc atcgtgggcg 3540
tgaacaacct gcgcggctac ggcaccacct tcagcaacat cgagaactac atccgcaagc 3600
cccacctgtt cgactacctg caccgcatcc agttccacac gcgtttccag cccggctact 3660
acggcaacga cagcttcaac tactggagcg gcaactacgt gagcacccgc cccagcatcg 3720
gcagcaacga catcatcacc agccccttct acggcaacaa gagcagcgag cccgtgcaga 3780
accttgagtt caacggcgag aaggtgtacc gcgccgtggc taacaccaac ctggccgtgt 3840
ggccctctgc agtgtacagc ggcgtgacca aggtggagtt cagccagtac aacgaccaga 3900
ccgacgaggc cagcacccag acctacgaca gcaagcgcaa cgtgggcgcc gtgagctggg 3960
acagcatcga ccagctgccc cccgagacca ccgacgagcc cctggagaag ggctacagcc 4020
accagctgaa ctacgtgatg tgcttcctga tgcagggcag ccgcggcacc atccccgtgc 4080
tgacctggac ccacaagagc gtcgacttct tcaacatgat cgacagcaag aagatcaccc 4140
agctgcccct ggtgaaggcc tacaagctcc agagcggcgc cagcgtggtg gcaggccccc 4200
gcttcaccgg cggcgacatc atccagtgca ccgagaacgg cagcgccgcc accatctacg 4260
tgacccccga cgtgagctac agccagaagt accgcgcccg catccactac gccagcacca 4320
gccagatcac cttcaccctg agcctggacg gggccccctt caaccaatac tacttcgaca 4380
agaccatcaa caagggcgac accctgacct acaacagctt caacctggcc agcttcagca 4440
cccctttcga gctgagcggc aacaacctcc agatcggcgt gaccggcctg agcgccggcg 4500
acaaggtgta catcgacaag atcgagttca tccccgtgaa ctagatctga gctctagatc 4560
cccgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 4620
tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 4680
taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 4740
atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 4800
cgcggtgtca tctatgttac tagatcggga attgggtacc agcttgcatg cctgcagtgc 4860
agcgtgaccc ggtcgtgccc ctctctagag ataatgagca ttgcatgtct aagttataaa 4920
aaattaccac atattttttt tgtcacactt gtttgaagtg cagtttatct atctttatac 4980
atatatttaa actttactct acgaataata taatctatag tactacaata atatcagtgt 5040
tttagagaat catataaatg aacagttaga catggtctaa aggacaattg agtattttga 5100
caacaggact ctacagtttt atctttttag tgtgcatgtg ttctcctttt tttttgcaaa 5160
tagcttcacc tatataatac ttcatccatt ttattagtac atccatttag ggtttagggt 5220
taatggtttt tatagactaa tttttttagt acatctattt tattctattt tagcctctaa 5280
attaagaaaa ctaaaactct attttagttt ttttatttaa taatttagat ataaaataga 5340
ataaaataaa gtgactaaaa attaaacaaa taccctttaa gaaattaaaa aaactaagga 5400
aacatttttc ttgtttcgag tagataatgc cagcctgtta aacgccgtcg acgagtctaa 5460
cggacaccaa ccagcgaacc agcagcgtcg cgtcgggcca agcgaagcag acggcacggc 5520
atctctgtcg ctgcctctgg acccctctcg agagttccgc tccaccgttg gacttgctcc 5580
gctgtcggca tccagaaatt gcgtggcgga gcggcagacg tgagccggca cggcaggcgg 5640
cctcctcctc ctctcacggc accggcagct acgggggatt cctttcccac cgctccttcg 5700
ctttcccttc ctcgcccgcc gtaataaata gacaccccct ccacaccctc tttccccaac 5760
ctcgtgttgt tcggagcgca cacacacaca accagatctc ccccaaatcc acccgtcggc 5820
acctccgctt caaggtacgc cgctcgtcct cccccccccc ccctctctac cttctctaga 5880
tcggcgttcc ggtccatggt tagggcccgg tagttctact tctgttcatg tttgtgttag 5940
atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc 6000
agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg ggatggctct 6060
agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca tagggtttgg 6120
tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt catcttttca 6180
tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga 6240
gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt atgtgtgtgc 6300
catacatatt catagttacg aattgaagat gatggatgga aatatcgatc taggataggt 6360
atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt tcgcttggtt 6420
gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt agaatactgt 6480
ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca tacatcttca 6540
tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca tgttgatgtg 6600
ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg ctctaacctt 6660
gagtacctat ctattataat aaacaagtat gttttataat tattttgatc ttgatatact 6720
tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct tcatacgcta 6780
tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg tgttacttct 6840
gcagggatcc ccgatcatgc aaaaactcat taactcagtg caaaactatg cctggggcag 6900
caaaacggcg ttgactgaac tttatggtat ggaaaatccg tccagccagc cgatggccga 6960
gctgtggatg ggcgcacatc cgaaaagcag ttcacgagtg cagaatgccg ccggagatat 7020
cgtttcactg cgtgatgcga ttgagagtga taaatcgact ctgctcggag aggccgttgc 7080
caaacgcttt ggcgaactgc ctttcctgtt caaagtatta tgcgcagcac agccactctc 7140
cattcaggtt catccaaaca aacacaattc tgaaatcggt tttgccaaag aaaatgccgc 7200
aggtatcccg atggatgccg ccgagcgtaa ctataaagat cctaaccaca agccggagct 7260
ggtttttgcg ctgacgcctt tccttgcgat gaacgcgttt cgtgaatttt ccgagattgt 7320
ctccctactc cagccggtcg caggtgcaca tccggcgatt gctcactttt tacaacagcc 7380
tgatgccgaa cgtttaagcg aactgttcgc cagcctgttg aatatgcagg gtgaagaaaa 7440
atcccgcgcg ctggcgattt taaaatcggc cctcgatagc cagcatggtg aaccgtggca 7500
aacgattcgt ttaatttctg aattttaccc ggaagacagc ggtctgttct ccccgctatt 7560
gctgaatgtg gtgaaattga accctggcga agcgatgttc ctgttcgctg aaacaccgca 7620
cgcttacctg caaggcgtgg cgctggaagt gatggcaaac tccgataacg tgctgcgtgc 7680
gggtctgacg cctaaataca ttgatattcc ggaactggtt gccaatgtga aattcgaagc 7740
caaaccggct aaccagttgt tgacccagcc ggtgaaacaa ggtgcagaac tggacttccc 7800
gattccagtg gatgattttg ccttctcgct gcatgacctt agtgataaag aaaccaccat 7860
tagccagcag agtgccgcca ttttgttctg cgtcgaaggc gatgcaacgt tgtggaaagg 7920
ttctcagcag ttacagctta aaccgggtga atcagcgttt attgccgcca acgaatcacc 7980
ggtgactgtc aaaggccacg gccgtttagc gcgtgtttac aacaagctgt aagagcttac 8040
tgaaaaaatt aacatctctt gctaagctgg gagctcgatc cgtcgacctg cagatcgttc 8100
aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat 8160
catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt 8220
atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga 8280
aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact 8340
agatctgcta gccctgcagg aaatttaccg gtgcccgggc ggccagcatg gccgtatccg 8400
caatgtgtta ttaag 8415
<210> 135
<211> 11632
<212> DNA
<213> 人工序列
<220>
<223> 玉米,大肠杆菌,苏云金芽孢杆菌,根癌农杆菌
<400> 135
ggttacagcc tgggctgatc tgtggacggt ggaccatgca aggttgtact gggcttgcaa 60
ggttgtactg ggcctactgg aacagtcata gcccgtgccg tcgtggtgac cgtcgtacgc 120
ggccgatctg gcagactggg caggtcgctg ctccgtgctg tttgtggatg caatgcaact 180
atgcaagagt gatcacggaa aacggacgga gcctgtctgt cctgttgcga cgtagtacaa 240
gcgcctgaac agtgacgcta cgctatgcca cgagcctacg agtggtaggt agtagtacac 300
tggtcagaat ccagcagtgc acccacgccg ctgctgactt tgctgatgag agggaggggt 360
cgagcgagtc tgtgtgaaac cgtgaacccc gccggggcct tcagtacgta cgataccacg 420
agcagtagaa aaaacaacgc caagatggca gagtcaacaa ccgatcacag tacgtatcgc 480
attcacatca agattttaag aacgaccccc ggctggccaa tggcaggcca cttggttgcc 540
cgtgcccgac agagggacac ggcgccatgc cctccgcgcc gcacggacga ggtgtcgtga 600
gaaccggcaa aaaaaaaatc atcgcaagtg cgctgaagtg aagtgccttc ccccgcgttt 660
ccttgcccct ggccggtacc catttggcgc cgattctttt cttgcccccc ggccggccgc 720
tcgctcgcct ttggattctt ccaaagccgc tgatgggatg gtggcgaaca cacccaccac 780
ccgtctttgc ccaaagcgac ccggcacagg ccgcgccggc ttcactaacc actagcgctt 840
gtactaataa aatggtttct agcgtttgtt gctctccttt ttcttttttc gccggttctt 900
cggagccgtg tggacactgg acagcgtcca gtccagcagg catagggtgg tctcggcggc 960
ggtcgtccga cgacgatcga tctccatgag attccgcgac aggccaggac ggaaagctgg 1020
gcccttctca ccaattcgcg tcggagccgg aacaagattc cctcccccaa tcatttcgac 1080
gcgccctttc ttcgccaccc ctcgtggccg tgtttcgcgg ccggccctta tctccttccc 1140
gtgacgcgtt cttttgtagc ttagcggccg gcacgttgct aaccaggcta gcttcgttcg 1200
tttttaatct gcctatcgag aagagaagaa aaattcgtcc atggggccac ggcctcttct 1260
gcaggcattt ggcatgtgaa ggaacccgaa ccagtgaatg gagatggacg gatgctgctc 1320
agatacgcag tcaaacctgc cggcgaaatt acggggggag ctggctggct ggctggctgg 1380
acgccagatc acacatggat gacgcggcac ggcagctagc cgagcaggcg ctctgcgcac 1440
gcaattcaac agaaggcggg aaacgacaat ctgatcatga gcggagaatt aagggagtca 1500
cgttatgacc cccgccgatg acgcgggaca agccgtttta cgtttggaac tgacagaacc 1560
gcaacgctgc aggaattggc cgcagcggcc atttaaatca attgggcgcg ccgaattcga 1620
gctcggtaca agcttgcaca tgacaacaat tgtaagagga tggagaccac aacgatccaa 1680
caatacttct gcgacgggct gtgaagtata gagaagttaa acgcccaaaa gccattgtgt 1740
ttggaatttt tagttattct atttttcatg atgtatcttc ctctaacatg ccttaatttg 1800
caaatttggt ataactactg attgaaaata tatgtatgta aaaaaatact aagcatattt 1860
ttgaagctaa acatgatgtt atttaagaaa atatgttgtt aacagaataa gattaatatc 1920
gaaatggaaa catctgtaaa ttagaatcat cttacaagct aagagatgtt cacgctttga 1980
gaaacttctt cagatcatga ccgtagaagt agctctccaa gactcaacga aggctgctgc 2040
aattccacaa atgcatgaca tgcatccttg taaccgtcgt cgccgctata aacacggata 2100
actcaattcc ctgctccatc aatttagaaa tgagcaagca agcacccgat cgctcacccc 2160
atatgcacca atctgactcc caagctctgt ttcgcattag taccgccagc actccaccta 2220
tagctaccaa ttgagacctt tccagcctaa gcagatcgat tgatcgttag agtcaaagag 2280
ttggtggtac gggtacttta actaccatgg aatgatgggg cgtgatgtag agcggaaagc 2340
gcctccctac gcggaacaac accctcgcca tgccgctcga ctacagcctc ctcctcgtcg 2400
gcgccacaac gagggagccc gtggtcgcag ccaccgacca gcatgtctct gtgtcctcgt 2460
ccgacctcga catgtcatgg caaacagtcg gacgccagca ccagactgac gacatgagtc 2520
tctgaagagc ccgccaccta gaaagatccg agccctgctg ctggtagtgg taaccatttt 2580
cgtcgcgctg acgcggagag cgagaggcca gaaatttata gcgactgacg ctgtggcagg 2640
cacgctatcg gaggttacga cgtggcgggt cactcgacgc ggagttcaca ggtcctatcc 2700
ttgcatcgct cggcgcggag tttacgggga cttatcctta cgacgtgctc taaggttgcg 2760
ataacgggcg gaggaaggcg tgtggcgtgc ggagacggtt tatacacgta gtgtgcggga 2820
gtgtgtttcg tagacgcggg aaagcacgac gacttacgaa ggttagtgga ggaggaggac 2880
acactaaaat caggacgcaa gaaactcttc tattatagta gtagagaaga gattatagga 2940
gtgtgggttg attctaaaga aaatcgacgc aggacaaccg tcaaaacggg tgctttaata 3000
tagtagatat atatatatag agagagagag aaagtacaaa ggatgcattt gtgtctgcat 3060
atgatcggag tattactaac ggccgtcgta agaaggtcca tcatgcgtgg agcgagccca 3120
tttggttggt tgtcaggccg cagttaaggc ctccatatat gattgtcgtc gggcccataa 3180
cagcatctcc tccaccagtt tattgtaaga ataaattaag tagagatatt tgtcgtcggg 3240
cagaagaaac ttggacaaga agaagaagca agctaggcca atttcttgcc ggcaagagga 3300
agatagtggc ctctagttta tatatcggcg tgatgatgat gctcctagct agaaatgaga 3360
gaagaaaaac ggacgcgtgt ttggtgtgtg tcaatggcgt ccatccttcc atcagatcag 3420
aacgatgaaa aagtcaagca cggcatgcat agtatatgta tagcttgttt tagtgtggct 3480
ttgctgagac gaatgaaagc aacggcgggc atatttttca gtggctgtag ctttcaggct 3540
gaaagagacg tggcatgcaa taattcaggg aattcgtcag ccaattgagg tagctagtca 3600
acttgtacat tggtgcgagc aattttccgc actcaggagg gctagtttga gagtccaaaa 3660
actataggag attaaagagg ctaaaatcct ctccttattt aattttaaat aagtagtgta 3720
tttgtatttt aactcctcca acccttccga ttttatggct ctcaaactag cattcagtct 3780
aatgcatgca tgcttggcta gaggtcgtat ggggttgtta atagcatagc tagctacaag 3840
ttaaccgggt cttttatatt taataaggac aggcaaagta ttacttacaa ataaagaata 3900
aagctaggac gaactgctgg attattacta aatcgaaatg gacgtaatat tccaggcaag 3960
aataattgtt cgatcaggag acaagtgggg cattggaccg gttcttgcaa gcaagagcct 4020
atggcgtggt gacacggcgc gttgcccata catcatgcct ccatcgatga tccatcctca 4080
cttgctataa aaagaggtgt ccatggtgct caagctcagc caagcaaata agacgacttg 4140
tttcattgat tcttcaagag atcgagcttc ttttgcacca caaggtcgag gatccaccat 4200
gacggccgac aacaacaccg aggccctgga cagcagcacc accaaggacg tgatccagaa 4260
gggcatcagc gtggtgggcg acctgctggg cgtggtgggc ttccccttcg gcggcgccct 4320
ggtgagcttc tacaccaact tcctgaacac catctggccc agcgaggacc cctggaaggc 4380
cttcatggag caggtggagg ccctgatgga ccagaagatc gccgactacg ccaagaacaa 4440
ggcactggcc gagctacagg gcctccagaa caacgtggag gactatgtga gcgccctgag 4500
cagctggcag aagaaccccg ctgcaccgtt ccgcaacccc cacagccagg gccgcatccg 4560
cgagctgttc agccaggccg agagccactt ccgcaacagc atgcccagct tcgccatcag 4620
cggctacgag gtgctgttcc tgaccaccta cgcccaggcc gccaacaccc acctgttcct 4680
gctgaaggac gcccaaatct acggagagga gtggggctac gagaaggagg acatcgccga 4740
gttctacaag cgccagctga agctgaccca ggagtacacc gaccactgcg tgaagtggta 4800
caacgtgggt ctagacaagc tccgcggcag cagctacgag agctgggtga acttcaaccg 4860
ctaccgccgc gagatgaccc tgaccgtgct ggacctgatc gccctgttcc ccctgtacga 4920
cgtgcgcctg taccccaagg aggtgaagac cgagctgacc cgcgacgtgc tgaccgaccc 4980
catcgtgggc gtgaacaacc tgcgcggcta cggcaccacc ttcagcaaca tcgagaacta 5040
catccgcaag ccccacctgt tcgactacct gcaccgcatc cagttccaca cgcgtttcca 5100
gcccggctac tacggcaacg acagcttcaa ctactggagc ggcaactacg tgagcacccg 5160
ccccagcatc ggcagcaacg acatcatcac cagccccttc tacggcaaca agagcagcga 5220
gcccgtgcag aaccttgagt tcaacggcga gaaggtgtac cgcgccgtgg ctaacaccaa 5280
cctggccgtg tggccctctg cagtgtacag cggcgtgacc aaggtggagt tcagccagta 5340
caacgaccag accgacgagg ccagcaccca gacctacgac agcaagcgca acgtgggcgc 5400
cgtgagctgg gacagcatcg accagctgcc ccccgagacc accgacgagc ccctggagaa 5460
gggctacagc caccagctga actacgtgat gtgcttcctg atgcagggca gccgcggcac 5520
catccccgtg ctgacctgga cccacaagag cgtcgacttc ttcaacatga tcgacagcaa 5580
gaagatcacc cagctgcccc tggtgaaggc ctacaagctc cagagcggcg ccagcgtggt 5640
ggcaggcccc cgcttcaccg gcggcgacat catccagtgc accgagaacg gcagcgccgc 5700
caccatctac gtgacccccg acgtgagcta cagccagaag taccgcgccc gcatccacta 5760
cgccagcacc agccagatca ccttcaccct gagcctggac ggggccccct tcaaccaata 5820
ctacttcgac aagaccatca acaagggcga caccctgacc tacaacagct tcaacctggc 5880
cagcttcagc acccctttcg agctgagcgg caacaacctc cagatcggcg tgaccggcct 5940
gagcgccggc gacaaggtgt acatcgacaa gatcgagttc atccccgtga actagatctg 6000
agctctagat ccccgaattt ccccgatcgt tcaaacattt ggcaataaag tttcttaaga 6060
ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag 6120
catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga 6180
gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat 6240
aaattatcgc gcgcggtgtc atctatgtta ctagatcggg aattgggtac cagcttgcat 6300
gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc 6360
taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc 6420
tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat 6480
aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt 6540
gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt 6600
ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta 6660
gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt 6720
ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga 6780
tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa 6840
aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc 6900
gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca 6960
gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt 7020
ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc 7080
acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca 7140
ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct 7200
ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc 7260
cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta 7320
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 7380
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 7440
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 7500
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 7560
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 7620
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 7680
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 7740
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 7800
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 7860
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 7920
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 7980
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 8040
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 8100
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 8160
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 8220
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 8280
gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt gcaaaactat 8340
gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc gtccagccag 8400
ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt gcagaatgcc 8460
gccggagata tcgtttcact gcgtgatgcg attgagagtg ataaatcgac tctgctcgga 8520
gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt atgcgcagca 8580
cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg ttttgccaaa 8640
gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga tcctaaccac 8700
aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt tcgtgaattt 8760
tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat tgctcacttt 8820
ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt gaatatgcag 8880
ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag ccagcatggt 8940
gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag cggtctgttc 9000
tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt cctgttcgct 9060
gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa ctccgataac 9120
gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt tgccaatgtg 9180
aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca aggtgcagaa 9240
ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct tagtgataaa 9300
gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg cgatgcaacg 9360
ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt tattgccgcc 9420
aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta caacaagctg 9480
taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgat ccgtcgacct 9540
gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 9600
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 9660
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 9720
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 9780
tctatgttac tagatctgct agccctgcag gaaatttacc ggtgcccggg cggccagcat 9840
ggccgtatcc gcaatgtgtt attaagagtt ggtggtacgg gtactttaac taacgaggtg 9900
tgtcgcgcag cgctcctgca cggatgtagc tttggattgc tggataatgt ctcgcgcaag 9960
cgtcgtattt atttatttat ttattacagc ctccaccgcc gtgcgtgctc cgtttcggat 10020
tataataaaa ctaatattaa ataaaaaaat cggattaaag gatgtttccg aaataaagat 10080
ctccaccaca ggagcgaaag aaaaaaaaag agaaacgggc tatggagaaa tggtgttgcg 10140
agtatacggc ggctccgtcg tcgtcggatc gacatgtaca aagtaggtgc acaaaaggca 10200
aagcaaaatc acctcatcaa agaccaaaag cggagcaaag aatcgatact aaatccacat 10260
gttttttttg ttcctgtcta ctacgtgctg tgcctgtgcg tgaagcacga ttagtacgtg 10320
tactcactct tgtcatattc tttttagtgt cttgtcacta gtcacatgga gtagcaacca 10380
tggctggcga tacccgcgat aaataaaaaa aagagagagg gagtaatata ttagatactc 10440
acccattata aattataaaa tattttagag tttgaatagg tagttcttgt atatttattt 10500
atagaccttc aagtttgtcc gcctctcgag agccgaactt tgttgcccat gcttccccgg 10560
ctcaggtcat gccacctcct tcaccaaggg cacacggaag atctggtgga gcttgtcatc 10620
accccgcgcc cttcaaacat gtgaggatgc gtcgtcgctg gcactagtag cactcattgt 10680
aggcactaca ttgacagttt cctccagata tgtagtgagg aaacacttga acaacacgtt 10740
tgggattaca tatgatgttt tgtttgttca tcaatgataa ttccttcttc ttgcttaatg 10800
attggctcta gaaccgatac atggcacatt tcatcaggaa gggcgcatgc acgaaattaa 10860
actgttatcg atgtttcggt ttctaagttg aagaaaacaa tggctaacaa ctagcccatg 10920
tgagcataac gacaaggcct acaaacaaaa cccaagaaat agctaaatca tggtctggat 10980
ccactctgct atgatagatc accttttcta acatagttca tcctcccatt tgctctcgct 11040
cacctagtgc ctccatcgct gagatcaatg ataagtacca agtgtacgat gaatcccatt 11100
tgtcatgcgt cttgcaagaa tggttggtcc gcttgcagtg ccggtccagc tatggaccca 11160
ggggcctatg tcataactca agcaagacca tacccccata tgctaccaag atgcctttta 11220
agaatcctgg taaaagaaat cggtggaaga cgactcaacg actatcaggc cccatttttt 11280
gggaccatgc tcaaggattt ggctttagca aaagtagata acactatttt ggggagcttg 11340
atctcaagga cacatgaagg aataaagcta ttttagtcaa gacgtcctta aggaacacaa 11400
taagacccta ggtccctaat gactagtgtg ttatatgttt cgagacgctc ctacacctaa 11460
gttcttttag ctatttccat tcacaatgat ggtatatgac ctaggtacca atgccccacg 11520
gagtttctaa cattaagaat gatctaaaac ataaggaccc tagagccagg gcactcctgg 11580
tattaaaaca tttaccagcc cgggccgtcg accacgcgtg ccctatagta ag 11632
<210> 136
<211> 1451
<212> DNA
<213> 玉米
<400> 136
ggttacagcc tgggctgatc tgtggacggt ggaccatgca aggttgtact gggcttgcaa 60
ggttgtactg ggcctactgg aacagtcata gcccgtgccg tcgtggtgac cgtcgtacgc 120
ggccgatctg gcagactggg caggtcgctg ctccgtgctg tttgtggatg caatgcaact 180
atgcaagagt gatcacggaa aacggacgga gcctgtctgt cctgttgcga cgtagtacaa 240
gcgcctgaac agtgacgcta cgctatgcca cgagcctacg agtggtaggt agtagtacac 300
tggtcagaat ccagcagtgc acccacgccg ctgctgactt tgctgatgag agggaggggt 360
cgagcgagtc tgtgtgaaac cgtgaacccc gccggggcct tcagtacgta cgataccacg 420
agcagtagaa aaaacaacgc caagatggca gagtcaacaa ccgatcacag tacgtatcgc 480
attcacatca agattttaag aacgaccccc ggctggccaa tggcaggcca cttggttgcc 540
cgtgcccgac agagggacac ggcgccatgc cctccgcgcc gcacggacga ggtgtcgtga 600
gaaccggcaa aaaaaaaatc atcgcaagtg cgctgaagtg aagtgccttc ccccgcgttt 660
ccttgcccct ggccggtacc catttggcgc cgattctttt cttgcccccc ggccggccgc 720
tcgctcgcct ttggattctt ccaaagccgc tgatgggatg gtggcgaaca cacccaccac 780
ccgtctttgc ccaaagcgac ccggcacagg ccgcgccggc ttcactaacc actagcgctt 840
gtactaataa aatggtttct agcgtttgtt gctctccttt ttcttttttc gccggttctt 900
cggagccgtg tggacactgg acagcgtcca gtccagcagg catagggtgg tctcggcggc 960
ggtcgtccga cgacgatcga tctccatgag attccgcgac aggccaggac ggaaagctgg 1020
gcccttctca ccaattcgcg tcggagccgg aacaagattc cctcccccaa tcatttcgac 1080
gcgccctttc ttcgccaccc ctcgtggccg tgtttcgcgg ccggccctta tctccttccc 1140
gtgacgcgtt cttttgtagc ttagcggccg gcacgttgct aaccaggcta gcttcgttcg 1200
tttttaatct gcctatcgag aagagaagaa aaattcgtcc atggggccac ggcctcttct 1260
gcaggcattt ggcatgtgaa ggaacccgaa ccagtgaatg gagatggacg gatgctgctc 1320
agatacgcag tcaaacctgc cggcgaaatt acggggggag ctggctggct ggctggctgg 1380
acgccagatc acacatggat gacgcggcac ggcagctagc cgagcaggcg ctctgcgcac 1440
gcaattcaac a 1451
<210> 137
<211> 1766
<212> DNA
<213> 玉米
<400> 137
agttggtggt acgggtactt taactaacga ggtgtgtcgc gcagcgctcc tgcacggatg 60
tagctttgga ttgctggata atgtctcgcg caagcgtcgt atttatttat ttatttatta 120
cagcctccac cgccgtgcgt gctccgtttc ggattataat aaaactaata ttaaataaaa 180
aaatcggatt aaaggatgtt tccgaaataa agatctccac cacaggagcg aaagaaaaaa 240
aaagagaaac gggctatgga gaaatggtgt tgcgagtata cggcggctcc gtcgtcgtcg 300
gatcgacatg tacaaagtag gtgcacaaaa ggcaaagcaa aatcacctca tcaaagacca 360
aaagcggagc aaagaatcga tactaaatcc acatgttttt tttgttcctg tctactacgt 420
gctgtgcctg tgcgtgaagc acgattagta cgtgtactca ctcttgtcat attcttttta 480
gtgtcttgtc actagtcaca tggagtagca accatggctg gcgatacccg cgataaataa 540
aaaaaagaga gagggagtaa tatattagat actcacccat tataaattat aaaatatttt 600
agagtttgaa taggtagttc ttgtatattt atttatagac cttcaagttt gtccgcctct 660
cgagagccga actttgttgc ccatgcttcc ccggctcagg tcatgccacc tccttcacca 720
agggcacacg gaagatctgg tggagcttgt catcaccccg cgcccttcaa acatgtgagg 780
atgcgtcgtc gctggcacta gtagcactca ttgtaggcac tacattgaca gtttcctcca 840
gatatgtagt gaggaaacac ttgaacaaca cgtttgggat tacatatgat gttttgtttg 900
ttcatcaatg ataattcctt cttcttgctt aatgattggc tctagaaccg atacatggca 960
catttcatca ggaagggcgc atgcacgaaa ttaaactgtt atcgatgttt cggtttctaa 1020
gttgaagaaa acaatggcta acaactagcc catgtgagca taacgacaag gcctacaaac 1080
aaaacccaag aaatagctaa atcatggtct ggatccactc tgctatgata gatcaccttt 1140
tctaacatag ttcatcctcc catttgctct cgctcaccta gtgcctccat cgctgagatc 1200
aatgataagt accaagtgta cgatgaatcc catttgtcat gcgtcttgca agaatggttg 1260
gtccgcttgc agtgccggtc cagctatgga cccaggggcc tatgtcataa ctcaagcaag 1320
accatacccc catatgctac caagatgcct tttaagaatc ctggtaaaag aaatcggtgg 1380
aagacgactc aacgactatc aggccccatt ttttgggacc atgctcaagg atttggcttt 1440
agcaaaagta gataacacta ttttggggag cttgatctca aggacacatg aaggaataaa 1500
gctattttag tcaagacgtc cttaaggaac acaataagac cctaggtccc taatgactag 1560
tgtgttatat gtttcgagac gctcctacac ctaagttctt ttagctattt ccattcacaa 1620
tgatggtata tgacctaggt accaatgccc cacggagttt ctaacattaa gaatgatcta 1680
aaacataagg accctagagc cagggcactc ctggtattaa aacatttacc agcccgggcc 1740
gtcgaccacg cgtgccctat agtaag 1766
<210> 138
<211> 10818
<212> DNA
<213> 玉米
<400> 138
ccattaaatc gacgaaagca actagatcct gattttgatt acgattacga ttgacgagta 60
tggatcatga ttttattgca tattttatga ttttattgca tattttatta ttttattgtc 120
gatttatgta ctaacttgtt tttgttaaaa taggatgtca aagaaaatga agtctttagc 180
tcgtagtttg cttgggtcga ggaggagctc gaggagcagc tcgaggggtg aggattcagt 240
ttttcagggc acaggttcta ccatgagcag acggagagcg ctggcagaac atttgcctcc 300
acaagatgta agttagttgt taaattacat tatttgagtt acttaatatt gtatgatgta 360
agttatttgt ttcataggat gctgaaattg aggaaccagt ggtagaggat catgcaagag 420
atgatgttga agatgatggt ggagataatg tgggagatga tgctggagac gacgctggtg 480
gggattctgg ggctggggat tctggggctg gtggagattc tgcagctggg tctggaactt 540
ctcgagttaa gagaacgagg aagctgcatt ttgttggacc acctccagag cttccacccg 600
aatctcgggt tgtaataaag cctagtggaa agtgagtgac atatctttgc ttaaatgtta 660
ttgaaagtta tgttttaatt tctacattga tttctgtttg caggacttgg atcgacgact 720
cgttcacagg cacaggacac tacaggcagg tgaacatggt tcttggtaat cttgttcgtc 780
tgcactggcc tggtcttgtg actttgccta ctggcgagtc tgtccccgcc accacttggg 840
agcattatcg ctatggtgtc tgtagaacgt ttggcaacac acaggcacta gtttgggatg 900
cattctgggt atgacttgtt tatactattt tagttattcc atatatgttt gcttttatga 960
taacactatg gtttttgcag aaacggtaca agttgccgga cgatggatca tatgatatga 1020
acgctcgtta cgtgtttgag tttaacgcga acgatgtcgt tgcagatgca atgtactatg 1080
cacgaattca ggctataaag gcatggtaca gagcaaatgc tgatgatcga ccgatgccaa 1140
atacaaaggc cgagtggtca tcaatttact tgacggagga gcaataccta gaggtaaaca 1200
ggttgttgcc tctcatatcg cacaaagcca tgtatttgct tgctttattt aaaaattttg 1260
atgtaggtgt cggtgccgtg gatggccacc cgaccagacg gttatcgggc attgtgcaga 1320
tggtgggctt cccctgactt tcgtgccatt tccgaaagga acaggggaaa ccgtgggact 1380
gagtcgttcc acaactacgg cggtgatggt catgtgcgct tggctaagcg aatggtaagt 1440
cacagtttgt cgtaactttg aatcacatag caaatgtgtc attataactt ttatgtacag 1500
gaagtcaaat ccggccgtac gcccacggat gtggaggtgt atatgcaagg gcatagggcc 1560
ataggggttc tgatcctcag aatcctgatg tgttatgcac tcagacggcc accgaccgtc 1620
tagtgagttt ttgatactct attatgtgtg ttgatattgt ttgcaagggc ataggggtta 1680
tgcacttata tttgatattg tttgcctcca ggcttcgtat gggcaggaga tggttcaacg 1740
ccatggggag gagtacgatt ggaggagcca gccaatcgac cctcagacag catatgctag 1800
cgcaggagga caagctcatg gacggtgaga ttatttgatt tggttttcaa aattgtcatc 1860
atatgcttgc gattcaactg agccatgagt tactatacta agtgcatggt tcactcttgt 1920
aggttgggta tttttgattc tacgattgat tccagagagc tgagacgccg tggacgacaa 1980
tccacatcgt cgtcttcaca gtcgtcccgt tcacgatcag cagcccatga gatagagctt 2040
gcagtgttgc gtcaacaggc agagtaccat caatcagtct tgagggaaca attggagtac 2100
cagaggcaac aatctgaata ccagagacaa caagccgagt accagaagaa gagggacgag 2160
tattatgcaa gcctccaggc ccaaaatcaa gctcttctct cggtaagttg aagtaacatt 2220
ttgtagctta ttttgcaaaa cacttgatgt gtatcttgtt tgttcaacaa tgacttgtat 2280
ataatttgta gcaactagcc caacaagcgg gcgtcccgat gccgacatat gggatgccgc 2340
ctccggactt tgcactgcca atgccaatgt tggcgcctcc acctccacct ccgcctccgc 2400
ctacgtcaca attccctatg gtatgtacac atatgcgtgt gtgacatgtt catagatgtc 2460
ttatgtgttt aaatgaacaa ctgagtggtt actatttcat gtgcttgtgt tatagggatt 2520
tcagacacca cccgcttcag ttgccgcacc tggagatggg tctgggcaag acgacacaac 2580
acattcgtgg gtcaacaacc tattcaacac gcagagtcca gccggaggag gtggctactt 2640
gaaccatcca gacgatggat atgattgatg tgtcgtgatg tttatttatg aaacactttg 2700
caacacttgt ttgtgagaca caatttcagt ttgcaacaac cgtcgaacct atatgttgat 2760
gttaaatttg tgaatgttat tatttatgtg agaatatttg tgattgtgaa tacttattag 2820
aatgtgtata tttgtgattg tgaatgtgaa tgtgtatatg tgcatgaatc tgttttcgtt 2880
ttgtaaatgt cagatttttt aaaaaacaga attttgtgta aattctgtaa tttgttatgt 2940
ccgacggcct agtggtagcc gtcggacata acacatggtt atgtccgacg gcattaacta 3000
ccgtcggaca taagggatgc ttatgtccga cggcctagtg gtagccgtcg gacttaatcc 3060
tgtggggccc acattccgac cggtaaaacg gttgggattt gttatctccg acgggcacac 3120
gcagccgtcg gagatagctt atgtccgacg gctgccgtcg gacattgcac tatttccgac 3180
gagttatctc cgacggctta aagccgtcgg agataaggct ttgccgtcgg aaataatcta 3240
tttccgacgg tttattcctt atgtccgacg gttttggcca tcggacgttt ctccgtttac 3300
tgtagtggaa gggagtgcag tagaagtgca atggcctaat gtccttcacc ataaaaaaaa 3360
caaagttcaa atctttcaga tttatttact cttggagtag catagcatag gtgtacaagg 3420
gaagtgctta taataatggt aacaagatac tcatcctctc atacctgccg tctcactgac 3480
aggaaacggt aggtggcaag ttggtaagct tttcggtttt agccatgtcc gatcccatgt 3540
gtggatcctg tactgtacat cgacatgcga catcttggtt ggcctatctg atctttaatg 3600
tcgccgcgca cagagaggag atccggtctc atgaagtggc tccgcagatt cctcaagggg 3660
ccgaagcccg gcgaaccgag ccgccggcgg ccccaggtgg cggccgggga agaggaggac 3720
gcgctttggc accaacgacc agctagacca aaggtactac tactaccact gtactagtga 3780
ctgagttcct cccttcttct tctacagttc gtctctgtct ctccaaatgg ctctttgatc 3840
tatccaaaca tgccgtttca cagcttcaca tccgattcaa ctcgcatcca ttgcagtgcc 3900
atcttaaact cttagctccg aaaaaggaag ttgctaaaga ctagtacaat atctttcttc 3960
gctgtttcca gatcgatcca cctaggaacg agaatgagga actagtggac cgtgccattg 4020
ccgagcctct tgcagaggct gtcaaaccgc ccagaggtag taccgtagat ggacgaatcc 4080
agatacacat tccatgtcag catggtataa atttctctga aaccgtttca tccctgcatc 4140
ccgttgctgt aaattgctgc gccagagaaa acccataggg gagaagacag caacgacgac 4200
gaagatctgg caagagccgt acaggacagt ctgaatatga acccttacac gccttacaac 4260
ccctatccac cctctcaggc ccaacctaga gggcacaggt caaccgctat cacaatcacc 4320
atttactggc accctaagat attctctaac gcgccaaagc agctcaatgc cgtcagtgtc 4380
cgtgctgcag ggtatgcgga ggctgcaagc atgagatagg gcgtggccat tacttgagct 4440
gcatgggcat ttactggcac cctcagtgct tccgctgcag gtcctgcggt caccttatcc 4500
gtgagaccga ggtaattaag ctcttgcatt ttctttcacc gtggaagtgt gttacagtgt 4560
taccagagat gagatcatat ccgttattct tttcgtcgtg ccttccagtt caccttgctg 4620
ggtgcggatt cgtaccacaa gctgtgctac aaggagctgc atcatccaaa atgcgacgtc 4680
tgccttcagt ttgtaaggcc tcgtgtcctc ggaaaacctg agcgatctgc actacagact 4740
gataaactgc gtacgcgtta gcatttctac accgtgccgt ctcgtcagtg taatgagagg 4800
ctcattcttt gtagatgtgt ttctgcagat cccaacgaac gggagtggct tgatagagta 4860
cagagcccac ccgttctggg gccagaagta ttgcccttcg catgagcgcg acaggacgcc 4920
acgttgctgc agctgtgaga aaatggaggt acaggtacag atactagata gaaaatgtgg 4980
tcgcagtccg atcactcgtt ttcaaactag gttgtacatt gcctgatcat attcaagggc 5040
atcacttttc ggttgtgatt gtgcagccaa ggaacacgaa gtacatgtcg ctgggagacg 5100
gacgcggcct gtgcatggaa tgcctgggat ctgcagtgat ggacacgagc gagtgccagc 5160
ctctgtacca ttctatcaga gactactacg aggggatgga catgagactg gaccagcaga 5220
tacccgtgct cttggttgag cggcaagcgc tcaacgaagc catggaaggg gagagtaaag 5280
tgagtgtttc ttctggttct gccccttttt tttgtgtgtg tttctgcaaa acgtacagcc 5340
ttcggaaaca ctaacgctga ccgcatctgc gaaatccagg gcccacgcca catgcctgag 5400
actaggggcc tatgtctgtc cgaggagcgg actgtgagca gtgtaagtgt tcaacaactc 5460
aagctgtggc ggttactgct gggatgctta gcccacaatg cgacagtttc tgctcttctg 5520
actgtgtgtt acttctgcag atacttagga ggcccagaat tggtggaaac aaccggttac 5580
tagacatgag aactcggcca cagaagctga ctaggagatg tgaagttact gcaatacttg 5640
tcctgtatgg cctccccagg tctggcaatt ttttttttat ctctggagtc tggaggacat 5700
cacttttttg tacctaccgg attcaaatac tgcggttctt ctcacgttct gtgaccggtg 5760
gtgtcgtcgt ttgtgtcaca acgctattgc aggctactga caggttccat cctcgcccat 5820
gagctgatgc acgggtggct gcgtctcaaa ggtacatccg tatatggatg gatggacaaa 5880
acatttcata cacccattta tcatctttat ttatgaattt tcttggaaag ctctaccgga 5940
tcgtactttt cattcaggtt accgaaacct aaacgcggag gtggaagaag gcatatgcca 6000
ggtcatgtct tacttgtggc tggaatcaga gattcttccg tcatcctcga ggcacgcgca 6060
gccttcatca tcctatccag caacatcatc cgagaaaggt ggaatatctc ataccgggaa 6120
gaagctgggc gagttcttca tgcaccagat tgccaatgac acgtcgacgg cctatggtga 6180
cgggttcaga actgcgtacg ctgccgtcaa caagtatggc cttcgccaaa cactgagcca 6240
tatacgccta acaggaggtt tccctgtata ataagagtga aaaaaacata aaatgtccat 6300
gcatgatcat atcgatatca aaaggttata tacatattgg gatgaagttg gctatggaac 6360
actggatgca tagtgattca atttcggtga cctttgagtt ttcaaagagg taatgtcgga 6420
gtaaatcaga aagtaaaccc gtataaagca tggttgagac gattgtttac tctatagtga 6480
tgcatgctac atgcatggcc aagaagagag caacgggcca taggaccatc gttattaccc 6540
atcgttgtta atcaaattta gggctagata aatagtaaac catctatagg aacatccaga 6600
gtcaatctac tctatgtatc ataccgacca ggggcggatc taggtaaaat aaccattgat 6660
gtcatctcca ttaaattata gtatcatcaa cctatttaag tgctaacaat catacatttt 6720
aatgaagatt attaaaatcc attggtgtca catgacacca caaaaatggc ctagatccgc 6780
ccctgatacc gacaaaccta gaaaaatttg taactgagaa ctgatgacca tacacatgaa 6840
catgaattag gactttcaaa gagtccaatc aaagtaaaca attagactaa gcatgtaaga 6900
tagggtgcca gatgttgtat caggcttttg agcacatgtg caacttgtat gtcgtggaac 6960
gtgacaaccg gtcaaggaat gcgcatgtga cggtgtaaaa tcaatataac aacatgaaga 7020
acaatcataa gtataggttg aaactacaca tgataactag tatatctttc taacaacaat 7080
gattagtaca atatgtaccg tggtaaagtg gtgacaccat tagagatcgc attagaacgg 7140
catggcgctt actttaaaaa atgttagaga agcggttatg gtcaaacaga atattatgtg 7200
aatatgcggg aagatgaaca aatctataac acagaaacga aggaaccaaa taggatcagc 7260
ggagagtaca gtgccaacgc gcgacgaaac gaggaagcca gaaaggcacc gccgcatgcc 7320
cgcaccgcgt gactgtcgaa ggcggccgtg agcgctccga catcgaagga gtttatttca 7380
aaaatgggac gaccaacatt gcgcttttca catttgtttc ctaacgttgc actctttcac 7440
atatggcacc gagacacgca atcttgttga caccgctcgt agtccggtcc gggcagtgag 7500
gtcttacctg tcgtggtttc agaaaccggg gataataaga tttgtgttcg gtaaggacgc 7560
agcgcggact cactctgaat ggtcagagga ctcaatgatg gatctgagac aaggggttat 7620
actggtttag gcttgcgccc tagtccaatg ttgatcatag tattgcttag agcgtgttac 7680
agttgagtgc tcgtatctag aagatggggg ttgtcttgct cttttatagc tcaaggatag 7740
atcttacaat gagacttgta ttctgttggg gtcgagctca gcttcctact tctgggtgac 7800
gtagctcctc cggtatcgtc tgctgggtcg tgcgccatcg tatccctggt atggcgtcgc 7860
gtcttatccg ttcgccgtat gagttcttgt agctattctg atgcaaacgt agtggtgcct 7920
ggtgggtctc gcagagtcgg tttgtggtga ggtttagggg cgtctttagt acaacttcat 7980
cttccatcat tccctatgcg tcaccttcca gcatgcgtag gcgtacgctt cgtacagcgt 8040
attaccgcgt cccttctgga cttctggtat gtaggtcact gtagagaccc aatgctgggt 8100
tgattggtcc caccggtcag cgaggatgct ctctagaatg tatctggcgt cgtgattggc 8160
agaggccttc ggtactgctc ccatggttca gacgtggctt ggtggtgatc tgtctcatcg 8220
tgctgacgtg acttgatagt actaggtcgg ctcttacctc ctatagatgt gctcgctaga 8280
aagtccattg tcatcttgct gggttgctcg gcatgtaggt tgatcggtaa atccgcctcg 8340
tcgagttgct cgataatgtt gctcggcggg cgggtatgta ggtagtccga cctcaccggg 8400
ttgttcggca atcccgcctc gccgagttgc tcggtgaacg ggttggtcgg cagccccacc 8460
tcgccaggtt gtttggcaca cgtgttggtc tgttggtggg tcgtcgagag cccttttggg 8520
cttttttggg cacccggttt ctggtacccc acaatacccg agctagagtt ccacatttgc 8580
ccctaccttc cttcccggct ccggcgacaa gcccaggatc ctggtgtaat ggggcgagga 8640
gaagcagttc ttgacggagg agaccagctc catgatcccc aacaaaatga aggagacaac 8700
cgaggcctac ctcggcgtca ccatcaataa cactgttgtc accgtcccag tctatttcaa 8760
tgagtcccag cgccagacta ccaaaaacgt cgccgtcatc tccggccttc accgtcatgc 8820
gcatcatcaa cgagcccacc actgtcgcca tcacctacgg gctcgacaag aaatcgagca 8880
gcaacaacga gaataatgtc gtcatcttcg acctcgacgg cggtaccttt gacgtcgcgc 8940
tccggcggct aaggaccgca ctgccgacga gggcatgagt ggcgccgaga tggaagagaa 9000
gaggagcaca aatggcggtc gtcggcaaag acaaagagaa ctcgagcgtg agtggaggaa 9060
ggggcaaatg tgtaactcca gcttggatat gactccactg accagattac gagcgacatc 9120
aactagattg tgtgtctcag tggctcagtg ccattttttg aggtttgggt gccaatattt 9180
tttcgtagtg gaaggcaccg cgcccatcgg gttttgggag ccaaacgcca aacccgctcg 9240
cctcatattc cgcaacgtac agcggtttca tgggctggtt gaaggcccgg gccgcaaacc 9300
aaccgagtcg ggccgacgcc ctgggagatc cgcacggctg gtctggccca agcaacctgg 9360
tgggttggtg ccaggttaca gcctgggctg atctgtggac ggtggaccat gcaaggttgt 9420
actgggcttg caaggttgta ctgggcctac tggaacagtc atagcccgtg ccgtcgtggt 9480
gaccgtcgta cgcggccgat ctggcagact gggcaggtcg ctgctccgtg ctgtttgtgg 9540
atgcaatgca actatgcaag agtgatcacg gaaaacggac ggagcctgtc tgtcctgttg 9600
cgacgtagta caagcgcctg aacagtgacg ctacgctatg ccacgagcct acgagtggta 9660
ggtagtagta cactggtcag aatccagcag tgcacccacg ccgctgctga ctttgctgat 9720
gagagggagg ggtcgagcga gtctgtgtga aaccgtgaac cccgccgggg ccttcagtac 9780
gtacgatacc acgagcagta gaaaaaacaa cgccaagatg gcagagtcaa caaccgatca 9840
cagtacgtat cgcattcaca tcaagatttt aagaacgacc cccggctggc caatggcagg 9900
ccacttggtt gcccgtgccc gacagaggga cacggcgcca tgccctccgc gccgcacgga 9960
cgaggtgtcg tgagaaccgg caaaaaaaaa aatcatcgca agtgcgctga agtgaagtgc 10020
cttcccccgc gtttccttgc ccctggccgg tacccatttg gcgccgattc ttttcttgcc 10080
ccccggccgg ccgctcgctc gcctttggat tcttccaaag ccgctgatgg gatggtggcg 10140
aacacaccca ccacccgtct ttgcccaaag cgacccggca caggccgcgc cggcttcact 10200
aaccactagc gcttgtacta ataaaatggt ttctagcgtt tgttgctctc ctttttcttt 10260
tttcgccggt tcttcggagc cgtgtggaca ctggacagcg tccagtccag caggcatagg 10320
gtggtctcgg cggcggtcgt ccgacgacga tcgatctcca tgagattccg cgacaggcca 10380
ggacggaaag ctgggccctt ctcaccaatt cgcgtcggag ccggaacaag attccctccc 10440
ccaatcattt cgacgcgccc tttcttcgcc acccctcgtg gccgtgtttc gcggccggcc 10500
cttatctcct tcccgtgacg cgttcttttg tagcttagcg gccggcacgt tgctaaccag 10560
gctagcttcg ttcgttttta atctgcctat cgagaagaga agaaaaattc gtccatgggg 10620
ccacggcctc ttctgcaggc atttggcatg tgaaggaacc cgaaccagtg aatggagatg 10680
gacggatgct gctcagatac gcagtcaaac ctgccggcga aattacgggg ggagctggct 10740
ggctggctgg ctggacgcca gatcacacat ggatgacgcg gcacggcagc tagccgagca 10800
ggcgctctgc gcacgcaa 10818
<210> 139
<211> 6300
<212> DNA
<213> 玉米
<400> 139
gcactgcact gcactgcacg gatgcagctt tggcaacgag gtgtgtcgcg cagcgctcct 60
gcacggatgt agctttggat tgctggataa tgtctcgcgc aagcgtcgta tttatttatt 120
tatttattac agcctccacc gccgtgcgtg ctccgtttcg gattataata aaactaatat 180
taaataaaaa aatcggatta aaggatgttt ccgaaataaa gatctccacc acaggagcga 240
aagaaaaaaa aagagaaacg ggctatggag aaatggtgtt gcgagtatac ggcggctccg 300
tcgtcgtcgg atcgacatgt acaaagtagg tgcacaaaag gcaaagcaaa atcacctcat 360
caaagaccaa aagcggagca aagaatcgat actaaatcca catgtttttt ttgttcctgt 420
ctactacgtg ctgtgcctgt gcgtgaagca cgattagtac gtgtactcac tcttgtcata 480
ttctttttag tgtcttgtca ctagtcacat ggagtagcaa ccatggctgg cgatacccgc 540
gataaataaa aaaaagagag agggagtaat atattagata ctcacccatt ataaattata 600
aaatatttta gagtttgaat aggtagttct tgtatattta tttatagacc ttcaagtttg 660
tccgcctctc gagagccgaa ctttgttgcc catgcttccc cggctcaggt catgccacct 720
ccttcaccaa gggcacacgg aagatctggt ggagcttgtc atcaccccgc gcccttcaaa 780
catgtgagga tgcgtcgtcg ctggcactag tagcactcat tgtaggcact acattgacag 840
tttcctccag atatgtagtg aggaaacact tgaacaacac gtttgggatt acatatgatg 900
ttttgtttgt tcatcaatga taattccttc ttcttgctta atgattggct ctagaaccga 960
tacatggcac atttcatcag gaagggcgca tgcacgaaat taaactgtta tcgatgtttc 1020
ggtttctaag ttgaagaaaa caatggctaa caactagccc atgtgagcat aacgacaagg 1080
cctacaaaca aaacccaaga aatagctaaa tcatggtctg gatccactct gctatgatag 1140
atcacctttt ctaacatagt tcatcctccc atttgctctc gctcacctag tgcctccatc 1200
gctgagatca atgataagta ccaagtgtac gatgaatccc atttgtcatg cgtcttgcaa 1260
gaatggttgg tccgcttgca gtgccggtcc agctatggac ccaggggcct atgtcataac 1320
tcaagcaaga ccataccccc atatgctacc aagatgcctt ttaagaatcc tggtaaaaga 1380
aatcggtgga agacgactca acgactatca ggccccattt tttgggacca tgctcaagga 1440
tttggcttta gcaaaagtag ataacactat tttggggagc ttgatctcaa ggacacatga 1500
aggaataaag ctattttagt caagacgtcc ttaaggaaca caataagacc ctaggtccct 1560
aatgactagt gtgttatatg tttcgagacg ctcctacacc taagttcttt tagctatttc 1620
cattcacaat gatggtatat gacctaggta ccaatgcccc acggagtttc taacattaag 1680
aatgatctaa aacataagga ccctagagcc agggcactcc tggtattaaa acatttaaac 1740
cctattgcct tagtgctgat ttttgttttt tgtttgtagg aggagaaacg agcacttgtt 1800
gcctctcgcg acaatcttga taggctgtac cgtgatgcca gtaactcctt gaccatccta 1860
gagaggagcc accgcttcac catgtctgac ctagatcatc accaccatga gctgcaggcg 1920
tctcaagatg aagtcttgca acttggacga ttgttgtcga ctaaggattc caccatcaag 1980
gatctgcgct tctaaaaagc tcgtcccgca ggagctagag gcggcccagc ttgctattaa 2040
gactctaaag gacaactgca ccgtcctgaa gacccagcgc gataaagcta tggataaagt 2100
tgttcgcgct ggacggatcc tgatgaggag gcacggcgtt gtggtgcctg acgatattgt 2160
tgtcgatgtc aaggccgcgc ctgatgctac aagtcgtccc tctttttctg ttgctcctgc 2220
gaaggatacc gtctgcaagg atgtttcgat gcagtgatgt cctgtaaaac actttactta 2280
ttgagttagt atctccttgg aggatggatg taatatggat tcaatgtgca tgcgacaatt 2340
gtgttagaac tcgaatattc tacgaacagg gtgccggaaa acggccctag cactggcaag 2400
taagatgttc tcttttcctg aagtgttttc aattttagcc ggttgttatg ctattagggt 2460
atagtggtca ccctaaacag cgcaaatgca agtataccgc gttggcttaa ggtgtgttcc 2520
gacttaagtc agttgccttg ctggtagggc atagtggtca ccctgagtaa agtaagtcag 2580
agtatattgc accgacctaa gtcgattgca ctactagcag ggtatagtga tcaccctaag 2640
tcaagtaagc atgagcatat cgcaccgact taggtcatca ccgacttaag ccgattgttc 2700
tgttagcagg gtataatggt caccctaagt cagataagca tgagcatgtc acaccggctt 2760
aagtcgttgc cgacttaagc cgattgctcc gtcagcaggg tatagtggtc accctaataa 2820
gtcaggtaag catgagcata tcgcactggc ttaagtcgtt gccgacttaa gccgattgct 2880
ccgtcagtag ggtatagtgg tcaccctaag tcaagtaagc gtgagcatgt cgcactggct 2940
taagtcgatt gctccgtcag cagggtataa tggtcacttt aagtcaagta agtgtgagca 3000
tgtcgcacca gcttaagtca tcgccgactt aagctgattg ctccattagc agggtatagt 3060
ggtcacccta agttaggtaa tcgtgctgat ttcaagtcta gcccaatcaa agtcagttgt 3120
aagtcaagag tatgaatgcc tttggagaat gaaaacttta ttgatgatga aattctcgga 3180
tttacagagt acaatgttcc ttcaagaatt ttgaggcctt gctaaggata gaattttctg 3240
aggtgttcta tgttccatga gttcccttct gtgccgtcca tttgagtaag ccggtatggt 3300
cccggccgag tgaccgcctc taatatgatg aacgatcctt cccacagtgg tgatagcttg 3360
tgccgccctt cccccgttag aattcggcga aggaccaagt ctcccactgc aaaggatcgg 3420
tgccgcatag ctttatcatg gtagcacctc aaggtctgct ggtacctagc cgactgaatt 3480
actgtgttca atagttcttc ttccagtaca tcaatatctt ccagtctggt cgcttctgct 3540
tcagctatgc tttcgaaagt taatcttggt gccctgaaga ttaggtcagc gggcagcact 3600
gcctctaacc cataaaccat gaaaaacggg gtatttctat gcagagctcg actgggttga 3660
gttctcaggc tctagaccac gtatggcagc tctctgatcc attttcctgc aagcttttca 3720
ctcttgtcaa atattttctt cctgagtgct tctagtatca ttccgttggt tctttctacc 3780
tggccattgg ctcttgggtg tgctactgat gcatacttaa cctggaagct ccgttgctcg 3840
cagaaatcga gttcagagct ggtgaagttg gatcccagat cggtgatgat gttgtttggt 3900
atcccaaacc tgaatattat gtcttgtata aactccacca ctttggctga ggtcaaggaa 3960
gcaattggct tgtactttat ccattttgtg aatttgttaa tggcaaccag tacatgagta 4020
tagcctccct gagccttctt aaaaggtccg atcatgtcca gcccacagca tgcgaacggc 4080
catgttacag gaatggtctg cagctgctgc gcgggtaagt gttgttgctt tgataggaat 4140
tggcatgctt cacacttctg gactaactcg gcaacatcgt tctttattgt tggccaatag 4200
aaaccggatc taaaagcctt cccgaccaga gtccttgacg ctgcatgtat tccacactgc 4260
ccggcgtgga tttcatccaa caattgtttc tcggtagtcg agtgaataca tttcatgagg 4320
actcttgctg cacctctcct gtacagtaag ccccatatga tggtgtagtg ggccaactgc 4380
ctcgcgatgc attccactgc agccttgtca tctggctctt cttcattttt atatacctga 4440
tgataggctc tctccagtcg ttggggtccg actctggttg gctcaaggta ttgcacactt 4500
ccacctgatc caagatgatg cttggttgtg atatttcttg gacgaagatc ccaggtggag 4560
cctgggcccg actggatccc agcttcgaca acgcgtctgc tgctgcgttg cggtctcgtt 4620
ccacatgatg gaactctaat ccttcaaatt tgtcctctag ttttcgcaca accgcgcagt 4680
atttgcccat ggagtcagtc gagcagtcct agtctttgct tatctggatt atgaccacta 4740
gcgaatcacc atataccatc agtttcttga tgccgagtga tacaacaatg cttaaaccat 4800
ggatcagttc ttcatacttt gctgcattat ttgacgctgg aaatagtagc tggagtgcat 4860
aattgtgttg ctcacctcca ggagcaataa agagaatccc tgcacccgct ccctatagtt 4920
tcaacgagcc atcaaagtac attttccaca cctcgataac ctctgggcta tctgggacct 4980
gatgttcagt ccactctgat acgaagtcaa ccagcgcctg agtcttgatt gccgtgcggg 5040
gccagaactc tatgttgtga gctccaagct cacacgccca cttggcgatc cttccaatag 5100
cttctttgtt gtggagaatg tcccctattg ggaatcctat gaccactatg actttgtggt 5160
cgtcaaagta gtgtcggagt ttgcgtgcgg ttagaagtac tgcatacaac aacttctgta 5220
cttgaggata ccttatcttt gagggcccga ggacttcact gatgaagtag actggatgtt 5280
gcaccgggta cacatgtcct tcctccaccc gcttgactac taacgtggtg cttaccacgt 5340
gagtcgtgct ggagatgtat aacatcaaat cttccaccaa ctgattcagc gtagctcgtc 5400
gtggcggctt gagcactggt ggtgtagtca aaaaatttta gttcctctag agcttcctgc 5460
gcctctgtgg tccactgaaa cttgtccacc tttttgagca atttgtagaa ggccatgcct 5520
tgctccccta gtcttgatat gaacctgctc agggctgcca tgcatccagt aagcctctgt 5580
acctttttct atgatcgcaa cacttccatt ctcatgatgg ccttgacctt ttccgggtta 5640
gcttcaatcc cttggtgact gacaatgaat ctgagtaact tccctgcctg tactctgaaa 5700
acacactttt ctgggttgag cttccaccgg taatgcctca ggctattgaa gactagctgc 5760
aaatcttcaa tgaagttttc tgttttgatc accacatcat caacataggc ttccacccgc 5820
ttgccccagt ggtcggctaa gcatgtctga atggctctct ggtaagttgc tcccgtgttc 5880
ttgaggtcga atgacatgaa ggtgtaatag aaagctccaa atggggtgat gaaagcattc 5940
ttctcctcat cttcttttgc taagcagata tgatggtatc tagaatagca gtctaggaag 6000
gacaacatag aacagccagc ggtcgaatca accacctgat ctattctagg gagcccgaag 6060
ggatctttgg tgtctcagac ctgggggacc ctcaaccaaa tcgacaagtg aattttgtgt 6120
cgcgtgtccc tgcccagatg gattagtgca agatgaaaca caagaggagg ggtgaggttt 6180
atattatctt gcaccagggt gcttgcagta ggggatacaa tctttgcgag agagggaacg 6240
gatcccaggt ctcttgagag atctagtgtt gtgaagggga gttcgatgtt tgagcaagcc 6300

Claims (4)

1.一种用于修饰植物细胞基因组中的靶位点的方法,该方法包括:
a)向该植物细胞中引入第一核酸和第二核酸分子,该第一核酸包含至少100个连续核苷酸并且进一步包含转基因,其中该至少100个连续核苷酸与该细胞基因组中的靶位点具有至少90%一致性;并且
b)该第二核酸分子编码以下核酸酶,该核酸酶用于在与对应于(a)的至少100个连续核苷酸的该细胞基因组中的核苷酸序列相邻的该细胞基因组中的核酸酶切割位点处进行定点切割,其中该核酸酶是包含SEQ ID NO:30的经修饰的Cas9核酸酶,
该引入在该第二核酸分子的表达可以发生以产生该核酸酶并且该核酸酶可以在该细胞基因组中的该核酸酶切割位点处切割并且修饰该植物细胞基因组中的靶位点的条件下进行。
2.如权利要求1所述的方法,其中该植物细胞是玉蜀黍细胞。
3.如权利要求2所述的方法,其中该玉蜀黍细胞是转基因玉蜀黍细胞。
4.如权利要求3所述的方法,其中该转基因玉蜀黍细胞是事件MIR604转基因玉蜀黍细胞。
CN202110597118.7A 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物 Pending CN113337533A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462096442P 2014-12-23 2014-12-23
US62/096,442 2014-12-23
CN201580070582.3A CN107109427B (zh) 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580070582.3A Division CN107109427B (zh) 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

Publications (1)

Publication Number Publication Date
CN113337533A true CN113337533A (zh) 2021-09-03

Family

ID=55135530

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110597118.7A Pending CN113337533A (zh) 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
CN201580070582.3A Active CN107109427B (zh) 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580070582.3A Active CN107109427B (zh) 2014-12-23 2015-12-18 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

Country Status (6)

Country Link
US (4) US9963710B2 (zh)
EP (1) EP3237624B1 (zh)
CN (2) CN113337533A (zh)
CA (1) CA2969151A1 (zh)
ES (1) ES2785329T3 (zh)
WO (1) WO2016106121A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3316676A4 (en) 2015-06-30 2018-12-12 Regents of the University of Minnesota Haploid inducer line for accelerated genome editing
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
KR102630763B1 (ko) * 2016-12-02 2024-01-26 신젠타 파티서페이션즈 아게 동시 유전자 편집 및 반수체 유도
US10519456B2 (en) 2016-12-02 2019-12-31 Syngenta Participations Ag Simultaneous gene editing and haploid induction
JP2021500863A (ja) * 2017-09-29 2021-01-14 インテリア セラピューティクス,インコーポレイテッド ゲノム編集用のポリヌクレオチド、組成物および方法
EP3728587A4 (en) * 2017-12-18 2022-01-26 Syngenta Participations Ag SITES FOR TARGETED INSERTION IN THE MAIZE GENOME
CN112105732A (zh) * 2018-05-10 2020-12-18 先正达参股股份有限公司 用于多核苷酸的靶向编辑的方法和组合物
CN109837295A (zh) * 2018-07-06 2019-06-04 先正达参股股份有限公司 一种用基因编辑创制的水稻单倍体诱导系及其创制方法和应用
CN113195721A (zh) 2018-10-18 2021-07-30 英特利亚治疗股份有限公司 治疗α-1抗胰蛋白酶缺乏症的组合物和方法
MX2021004277A (es) 2018-10-18 2021-09-08 Intellia Therapeutics Inc Composiciones y metodos para expresar el factor ix.
CN114207130A (zh) 2018-10-18 2022-03-18 英特利亚治疗股份有限公司 用于从白蛋白基因座进行转基因表达的组合物和方法
SG11202103732RA (en) 2018-10-18 2021-05-28 Intellia Therapeutics Inc Nucleic acid constructs and methods of use
JP2022548031A (ja) 2019-09-13 2022-11-16 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 脂質ナノ粒子によって送達されるcrispr/casシステムを使用する動物における転写調節
WO2021092513A1 (en) 2019-11-08 2021-05-14 Regeneron Pharmaceuticals, Inc. Crispr and aav strategies for x-linked juvenile retinoschisis therapy
US20240002839A1 (en) 2020-12-02 2024-01-04 Decibel Therapeutics, Inc. Crispr sam biosensor cell lines and methods of use thereof
WO2022147133A1 (en) 2020-12-30 2022-07-07 Intellia Therapeutics, Inc. Engineered t cells
WO2023077053A2 (en) 2021-10-28 2023-05-04 Regeneron Pharmaceuticals, Inc. Crispr/cas-related methods and compositions for knocking out c5
WO2023129998A2 (en) * 2022-01-03 2023-07-06 Inari Agriculture Technology, Inc. Pollen-mediated feed trait delivery in hybrid f2 progeny seed
WO2023150623A2 (en) 2022-02-02 2023-08-10 Regeneron Pharmaceuticals, Inc. Anti-tfr:gaa and anti-cd63:gaa insertion for treatment of pompe disease
WO2023212677A2 (en) 2022-04-29 2023-11-02 Regeneron Pharmaceuticals, Inc. Identification of tissue-specific extragenic safe harbors for gene therapy approaches
WO2023235726A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr interference therapeutics for c9orf72 repeat expansion disease
WO2023235725A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr-based therapeutics for c9orf72 repeat expansion disease
WO2024006955A1 (en) 2022-06-29 2024-01-04 Intellia Therapeutics, Inc. Engineered t cells
WO2024026474A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024073606A1 (en) 2022-09-28 2024-04-04 Regeneron Pharmaceuticals, Inc. Antibody resistant modified receptors to enhance cell-based therapies

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013160230A1 (en) * 2012-04-23 2013-10-31 Bayer Cropscience Nv Targeted genome engineering in plants
WO2014161821A1 (en) * 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
DE69831265T2 (de) 1997-11-18 2006-06-08 Pioneer Hi-Bred International, Inc. Zusammensetzungen und verfahren für die genetische modifikation von pflanzen
US7935862B2 (en) 2003-12-02 2011-05-03 Syngenta Participations Ag Targeted integration and stacking of DNA through homologous recombination
US7361813B2 (en) 2004-03-25 2008-04-22 Syngenta Participations Ag Corn event MIR604
CA2626262C (en) 2005-10-18 2015-09-08 Homme W. Hellinga Rationally-designed meganucleases with altered sequence specificity and dna-binding affinity
CN101548011B (zh) * 2006-06-03 2018-04-27 先正达参股股份有限公司 玉米事件mir162
CA2691440A1 (en) 2007-06-29 2009-01-08 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
CA2746953C (en) 2008-12-16 2021-10-26 Syngenta Participations Ag Corn event 5307
JP2012511926A (ja) 2008-12-17 2012-05-31 ダウ・アグロサイエンス・エル・エル・シー Zp15遺伝子座内への標的組込み
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
US20100218278A1 (en) * 2009-02-24 2010-08-26 Syngenta Participations Ag Method for improved stress tolerance
PL2510096T5 (pl) 2009-12-10 2018-06-29 Regents Of The University Of Minnesota Modyfikacja DNA zależna od efektora TAL
US8704041B2 (en) * 2009-12-30 2014-04-22 Pioneer Hi Bred International Inc Methods and compositions for targeted polynucleotide modification
KR101948941B1 (ko) 2010-01-22 2019-04-22 다우 아그로사이언시즈 엘엘씨 식물에서 유전자 표적화를 위한 조작된 랜딩 패드
EP2615106B1 (en) 2010-02-08 2018-04-25 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
AU2011264074B2 (en) 2010-06-09 2015-01-22 Bayer Cropscience Nv Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
CN109504700A (zh) 2010-06-09 2019-03-22 拜尔作物科学公司 植物基因组改造中常用的在核苷酸序列上修饰植物基因组的方法和工具
WO2011159369A1 (en) 2010-06-14 2011-12-22 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
MX2013010911A (es) 2011-03-23 2015-03-03 Pioneer Hi Bred Int Metodos para producir un locus de rasgo transgenico complejo.
MX2013015174A (es) 2011-06-21 2014-09-22 Pioneer Hi Bred Int Metodos y composiciones para producir plantas esteriles masculinas.
WO2013019411A1 (en) 2011-08-03 2013-02-07 E. I. Du Pont De Nemours And Company Methods and compositions for targeted integration in a plant
BR122014004140B8 (pt) * 2011-08-22 2023-03-28 Bayer Cropscience Ag Vetor recombinante ou construção recombinante, bem como métodos para obter e produzir uma planta de algodão ou célula vegetal tolerante a um inibidor de hppd, e para cultivar um campo de plantas de algodão
AR089793A1 (es) 2012-01-27 2014-09-17 Du Pont Metodos y composiciones para generar locus de rasgos transgenicos complejos
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
RU2650819C2 (ru) 2012-05-07 2018-04-17 Сангамо Терапьютикс, Инк. Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов
EA038924B1 (ru) 2012-05-25 2021-11-10 Те Риджентс Оф Те Юниверсити Оф Калифорния Способы и композиции рнк-специфической модификации днк-мишени и рнк-специфической модуляции транскрипции
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
WO2014061821A1 (en) * 2012-10-16 2014-04-24 Tokyo University Of Science Foundation Grb10 interacting gyf protein 2 modulator
EP4234696A3 (en) 2012-12-12 2023-09-06 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
JP6552965B2 (ja) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化
AU2013359146B2 (en) 2012-12-13 2017-12-07 Corteva Agriscience Llc DNA detection methods for site specific nuclease activity
MX2015011985A (es) * 2013-03-15 2016-04-07 Univ Minnesota Ingenieria genomica de plantas utilizando sistemas crispr/cas.
EP3008186B1 (en) 2013-06-14 2018-11-28 Cellectis Methods for non-transgenic genome editing in plants
CN107223156A (zh) * 2013-11-04 2017-09-29 美国陶氏益农公司 最优玉米座位

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013160230A1 (en) * 2012-04-23 2013-10-31 Bayer Cropscience Nv Targeted genome engineering in plants
WO2014161821A1 (en) * 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BIN SHEN,等: "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", CELL RESEARCH, vol. 23, no. 5, pages 720 - 723, XP055141533, DOI: 10.1038/cr.2013.46 *
KHAOULA BELHAJ 等: "lant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system", PLANT METHODS, vol. 9, no. 39, pages 3 *
KHAOULA BELHAJ 等: "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system", PLANT METHODS, vol. 9, no. 39, pages 3 *
WENZHI JIANG 等: "Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis, tobacco, sorghum and rice", NUCLEIC ACIDS RESEARCH, vol. 4, pages 1 - 12 *

Also Published As

Publication number Publication date
EP3237624B1 (en) 2020-01-29
US11898149B2 (en) 2024-02-13
US20170016010A1 (en) 2017-01-19
US11643664B2 (en) 2023-05-09
US20210214736A1 (en) 2021-07-15
US20230265446A1 (en) 2023-08-24
ES2785329T3 (es) 2020-10-06
US20180291386A1 (en) 2018-10-11
EP3237624A1 (en) 2017-11-01
CN107109427B (zh) 2021-06-18
CN107109427A (zh) 2017-08-29
CA2969151A1 (en) 2016-06-30
US9963710B2 (en) 2018-05-08
WO2016106121A1 (en) 2016-06-30

Similar Documents

Publication Publication Date Title
CN107109427B (zh) 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
CN113473845A (zh) 经由基因组编辑进行基因沉默
KR20220066111A (ko) Dna 염기 편집을 위한 방법 및 조성물
CN115867565A (zh) 用于改善对大豆锈病的抗性的方法
CA2362552A1 (en) Maize adenosine deaminase cdna and uses thereof
CA2354433A1 (en) Maize rad2/fen-1 orthologues and uses thereof
CN110129359B (zh) 检测基因编辑事件以及测定基因编辑效率的方法以及其应用
US11459577B2 (en) Targeted insertion sites in the maize genome
US6403860B1 (en) Ku80 homologue and uses thereof
US6657107B1 (en) Polynucleotides encoding polypeptides having 8-oxoguanine DNA glycosylase activity and uses thereof
AU780662B2 (en) Orthologues of bacterial RuvB:cDNAs and uses thereof
US20230114951A1 (en) Targeted insertion sites in the maize genome
CN117255859A (zh) 具有同源指导rna识别位点的可去除植物转基因基因座
CN117425402A (zh) 通过基因组编辑加快转基因作物的育种
CA2391209A1 (en) Root transcriptional factors and methods of use
CA2357018A1 (en) Ribonucleotide reductase large subunit (r1) cdna and uses thereof
EP1196599A2 (en) Maize dna ligase ii orthologue and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination