CN113337533A

CN113337533A - 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

Info

Publication number: CN113337533A
Application number: CN202110597118.7A
Authority: CN
Inventors: 陈钟颖; 金明局; 钟衡; 辜唯宁; 蒋亚平; 阙求登; M-D·奇尔顿
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 2014-12-23
Filing date: 2015-12-18
Publication date: 2021-09-03
Also published as: EP3237624B1; US11898149B2; US20170016010A1; US11643664B2; US20210214736A1; US20230265446A1; ES2785329T3; US20180291386A1; EP3237624A1; CN107109427B; CN107109427A; CA2969151A1; US9963710B2; WO2016106121A1

Abstract

本发明涉及用于修饰植物细胞基因组中的靶位点的方法和组合物。此类修饰包括转基因的整合和突变。本发明还涉及用于鉴定和富集包括经修饰的靶位点的细胞的方法和组合物。

Description

用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

本申请是申请日为2015年12月18日、申请号为201580070582.3、发明名称为“用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物”的发明专利申请的分案申请。

相关申请

本申请要求2014年12月23日提交的临时申请62/096,442的权益，并通过引用以其全文结合在此。

序列表

提供ASCII文本格式的序列表作为纸质副本的替代，该序列表是根据37 C.F.R.§1.821提交的，名称为“80484_ST25.txt”，大小为409千字节，于2015年12月15日生成并经由EFS-Web提交。这个序列表由此通过引用以其披露内容结合到本说明书中。

发明领域

本发明涉及用于修饰植物细胞基因组中的靶位点的方法和组合物。此类修饰包括转基因整合和突变。本发明进一步涉及以下方法和组合物，这些方法和组合物用于鉴定和富集具有整合在细胞基因组内的靶位点处的一个或多个转基因的细胞，以及用于鉴定和富集包括在细胞基因组内的靶位点处引入的、而不整合到编码核酸酶的异源核苷酸序列的基因组中的突变的细胞，该核酸酶用于在基因组内的靶位点处的位点特异性切割。

发明背景

在基因组的靶向修饰领域中已经取得的最新进展是使得常规的靶向修饰可以很快成为可能。针对开发通过位点特异性核酸酶(例如，锌指核酸酶(ZFN)、大范围核酸酶、转录激活子样效应子核酸酶(TALENS)以及具有工程化的crRNA/tracr RNA的成簇规律间隔短回文重复/CRISPR相关的核酸酶(CRISPR/Cas))靶向和切割基因组DNA的方法和组合物来诱导靶向诱变，诱导细胞DNA序列的靶向缺失，并促进外源供体DNA多核苷酸(如，转基因)在预定的基因组基因座内的靶向重组在过去几年中已经取得了显著的进展。这个预定的基因组基因座是不明显的。由于高度重复的核苷酸序列、甲基化和导致非常高或非常低水平的重组或在引入的转基因上的基因表达差的其他特征，针对例如转基因插入，基因组中的许多位点是非理想的。因此，本领域需要鉴定用于靶向修饰(如转基因插入)的基因组内的理想靶位点。

一旦靶位点已经被用于靶向修饰，就需要确定是否成功创建了所希望的靶向修饰。筛选细胞中靶向基因组修饰的现有方法主要基于聚合酶链式反应(PCR)方案、核酸测序和Southern分析。在PCR扩增的情况下，由于PCR引物设置的复杂性和PCR扩增的固有模糊性，由于基因组重排和基因组倍性造成的复杂性，处理特定位点处的基因插入或修饰的复杂性的筛选过程是低效的。PCR的一些问题包括：1)由于基因组的倍性，一个拷贝和两个拷贝插入之间没有明确的区别；2)对复杂引物设计和大批引物组合的需求，以处理在一个或多个特定位点处的基因插入或修饰的复杂性；和3)凝胶电泳的低通量和扩增带的模糊性。虽然随后的测序可以帮助鉴定PCR扩增产物的特征，但是大规模测序工作和对大样品数量的结果进行解释存在着问题。需要进一步的基因分离分析来分离纯合子代用于进一步筛选。这些步骤需要大规模的操作来筛选商业作物以便捕获小于2％的潜在候选物，并且温室中植物的库存规模需要商业规模的空间和操作成本，直到植物生长阶段足够成熟来进行Southern分析。

本发明通过提供玉蜀黍基因组的理想靶位点解决了本领域内的这些缺点。本发明还提供了一种更具战略性和有效性的方法来鉴定和富集具有靶向基因组插入或靶向基因组突变的细胞，该方法在筛选过程的非常早期阶段以高精度降低了候选植物的数量，避免了大规模测序工作并且减少了植物维护的温室操作成本。

发明概述

在一方面，本发明提供了将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法，该方法包括将以下各项引入玉蜀黍细胞中：a)包括至少约100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述连续核苷酸与SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列中的靶位点具有至少约90％一致性；和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的连续核苷酸的SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此该转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点处。本发明还提供了一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代包括整合到该玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过上述方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过所述的方法生产的、包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。

在一个另外的方面，本发明提供了一种富集细胞的方法，该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因，该方法包括：a)将以下各项引入多个细胞中：i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；和ii)编码以下核酸酶的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行；b)培养(a)的细胞以生产细胞系或组织；c)从(b)的细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G，其中测定T和G分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于靶位点的核苷酸序列，距离用于进行测定T的核酸酶切割位点至少5个碱基对，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列；e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数；以及f)富集在测定T中相对于参考具有减少的拷贝数并且对于测定G，具有大于零的拷贝数的细胞系或组织，从而富集包括插入到细胞基因组中的核酸酶切割位点的转基因的该细胞。

此外，本发明提供了一种鉴定细胞的方法，该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因，该方法包括：a)将以下各项引入多个细胞中：i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；和ii)编码以下核酸酶的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行；b)培养(a)的细胞以生产细胞系或组织；c)从(b)的细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G，其中测定T和G分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于靶位点的核苷酸序列，距离用于进行测定T的核酸酶切割位点至少五个碱基对，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列；e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数；以及f)鉴定在测定T中相对于参考具有减少的拷贝数并且对于测定G，具有大于零的拷贝数的细胞系或组织，从而鉴定包括插入到细胞基因组中的核酸酶切割位点的转基因的细胞。本发明还提供了通过所述的方法富集或鉴定的细胞系或组织，并且进一步提供了源自该细胞系或组织的植物、植物部分或其子代。

在本发明的另外方面，提供了一种富集细胞的方法，该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合，该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将一种核酸分子引入多个细胞中，该核酸分子包括编码以下核酸酶的异源序列，该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中；b)培养(a)的多个细胞以生产细胞系或组织；c)从(b)的细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2，其中这些测定分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列；e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数；以及f)富集针对测定1相对于参考具有减少的拷贝数并且对于测定2，具有等于零的拷贝数的细胞系或组织，从而富集以下细胞，该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。

作为本发明的一方面还提供了一种鉴定细胞的方法，该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合，该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将一种核酸分子引入多个细胞中，该核酸分子包括编码以下核酸酶的异源序列，该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中；b)培养(a)的多个细胞以生产细胞系或组织；c)从(b)的细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2，其中这些测定分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列；e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数；以及f)鉴定针对测定1相对于参考具有减少的拷贝数并且对于测定2，具有等于零的拷贝数的细胞系或组织，从而鉴定以下细胞，该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。本发明还提供了通过所述的方法富集或鉴定的细胞系或组织，并且进一步提供了源自该细胞系或组织的植物、植物部分或其子代。

在另外方面，本发明提供了一种生产植物、植物部分或其子代的方法，这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将核酸分子引入植物细胞中，该核酸分子包括编码以下核酸酶的异源核苷酸序列，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在植物细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中；并且b)从(a)的植物细胞再生植物、植物部分或其子代。本发明进一步提供了通过所述的方法生产的植物、植物部分或其子代。

本发明还提供了用于修饰植物细胞基因组中的靶位点的方法，该方法包括：a)向植物细胞中引入第一核酸和第二核酸分子，该第一核酸包括至少100个连续核苷酸并且进一步包括转基因，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；并且b)该第二核酸分子编码以下核酸酶，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。

本发明还提供了用于生产玉蜀黍植物、植物部分或其子代的方法，这些玉蜀黍植物、植物部分或其子代包括植物细胞基因组中的靶位点处的修饰，该方法包括：a)向植物细胞中引入第一核酸和第二核酸分子，该第一核酸包括至少100个连续核苷酸并且进一步包括转基因，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；b)该第二核酸分子编码以下核酸酶，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行；并且c)从(a)的植物细胞再生植物、植物部分或其子代。本发明进一步提供了通过所述的方法生产的植物、植物部分或其子代。

本发明还提供了将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点中的方法，该方法包括将以下各项引入事件MIR604玉蜀黍细胞中：a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90％一致性，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQID NO:139；和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90％一致性的核苷酸序列的相邻的基因组核酸酶切割位点处用于定点切割，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQ ID NO:139，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过所述方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过所述的方法生产的、包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。

附图简要说明

图1.显示MIR604插入位点侧翼序列的示意图。MIR604RBFS1和MIR604LBFS1之间的88个碱基对序列在T-DNA整合期间在MIR604事件中被删除。该MIR604插入位点不包含事件MIR604转基因。

图2.靶向插入到MIR604插入位点安全港基因座以及用两个引物对：P1(FE4706)/P2(FE4705)和P3(FE4708)/P4(FE4707)鉴定潜在的靶向整合事件的PCR反应的示意图。P1(FE4706)和P4(FE4707)仅与存在于供体和靶区域的同源臂之外的染色体区域结合，而P2(FE4705)和P3(FE4708)仅与供体分子结合。引物对P1(FE4706)和P2(FE4705)产生2.87Kbp的片段，并且引物对P3(FE4708)/和P4(FE4707)仅在靶向插入存在于安全港基因座#1(MIR604插入位点)时扩增2.0Kbp的片段。在Southern DNA印迹分析(图5)中使用的Bsu36I限制性位点和探针的近似位置在靶向插入事件中表明。

图3.PCR筛选测定的实例如图2中所概述。在左图中，用P3(FE4708)/和P4(FE4707)进行PCR，该PCR从2个事件(泳道25，MZET141320A250A，和泳道42，事件MZET141606A097A)扩增2.0Kbp的片段。在右图中，用P1(FE4706)和P2(FE4705)对进行PCR，其仅从1个事件(泳道25，MZET141320A250A)产生2.87Kbp的片段。

图4.用包含GUUS重复分子内重组底物的载体用MIR604FR1靶序列(5’-TACACGTACT AATCG TGCTT CACGC ACAGG CACAG CACGT AGTAG ACAGG A-3’，SEQ ID NO:66)连同单个TALEN载体(F1，cTNmir604Fw1-01或R2，cTNmir604Rv2-01)或一对TALEN基因(FR1，cTNmir604Fw1-01和cTNmir604Rv1-01)在玉蜀黍泛素启动子(prZmUbi1-10)的控制下或没有TALEN(ctl，空白对照)轰击玉蜀黍未成熟胚胎中的GUS斑点数。cTNmir604Rv2-01不识别MIR604FR1序列并导致GUS活性的背景水平(R2，阴性对照)。

图5.在安全港基因座#1(MIR604插入位点)处的靶向插入事件的DNA印迹分析。DNA探针1：针对侧翼天然基因组序列；探针2：针对prCMP的探针；探头3：针对cPMI的探针(针对示意图中的探针位置的参见图2)。泳道1：DIG标记的标记物；泳道2：野生型玉蜀黍转化品系NP2222；泳道3：掺有21942、用HindIII消化的NP2222(释放8553bp的片段)；泳道4：MZET134207E056A；泳道5：MZET134300A679A；泳道6：MZET134505A104A；泳道7：MZET141322A015A；泳道8：MZET141322B143A；将泳道2至8中的所有玉蜀黍基因组DNA用Bsu36I限制性酶消化。注意：探针1还与基因组其他部分中的同源序列弱杂交。WT安全港基因座具有显性的17.5Kb带，而靶向插入事件具有增加到28Kb的片段大小。对于探针2和3，该28Kb Bsu36I带通过同源重组包含供体DNA序列的靶向插入。在泳道7中，该事件可能包含重排供体DNA分子的插入。

图6.示意图显示，在具有通过用定点核酸酶切割产生的靶序列(M)中的突变的植物中靶序列拷贝数的减少。

图7.MIR604插入位点中的靶序列的Taqman测定探针设计的示意图和关于靶向突变的Taqman测定结果的解释。

图8A-B.基于靶序列的拷贝数减少来富集潜在靶向插入事件的策略。(A)作为靶向插入实验中靶基因座处的靶向核酸酶切割的结果，潜在类型的突变和靶向插入的示意图。M是定点核酸酶切割位点；T是位于在靶基因座区域内距离M至少5个核苷酸的序列，并且它应该尽可能远离M但在被靶向插入替换的区域内。然而，T可以位于与针对M的测定相同的扩增子内。G是转基因序列(感兴趣的基因(GOI))的测定靶标。(B)使用实时qPCR测定，具有如(A)所示的靶位点中不同种类的突变或插入的植物中不同测定的拷贝数得分记录。

图9.MIR604转基因事件T-DNA插入和侧翼区的示意图。MIR604 RB FS：T-DNA右边界侧翼的玉蜀黍基因组区域；MIR604 LB FS：T-DNA左边界侧翼的玉蜀黍基因组区域；prUbi1：玉蜀黍泛素-1启动子；cPMI-01：PMI编码序列；tNOS：胭脂碱合酶终止子；mCry3A：来自苏云金芽孢杆菌的Cry3A基因序列(mCry3A)的合成形式。(美国专利号7,897,748)

图10.杀虫基因(IC)表达盒(Exp.Cass.)和包括选择性标记物ZmEPSPS(EPSPSExp.Cass.)的表达盒从供体载体22872靶向插入MIR604转基因基因座(图9)，该靶向插入是由载体22840表达的TALEN介导的。一对TALEN由22840表达，并切割cPMI靶序列。t：tNOS-05；LBFS：T-DNA左边界侧翼的玉蜀黍基因组序列；RBFS：T-DNA右边界侧翼的玉蜀黍基因组序列；P1(FE4796)：SEQ ID NO:127；P2(FE4793)：SEQ ID NO:128；P3(FE35035)：SEQ ID NO:132；P4(FE35034)：SEQ ID NO:131。

图11.通过定点核酸酶介导的靶向插入到MIR604转基因基因座中的转基因表达盒(图9)，以替换整个PMI标记基因盒。

图12.通过定点核酸酶介导的靶向插入到MIR604转基因基因座中的供体转基因表达盒(图9)，以替换整个MIR604 T-DNA插入片段。

在序列表中的序列的简要说明

SEQ ID NO:1是来自玉蜀黍品系A188的MIR604插入位点序列的核苷酸序列。这个MIR604插入位点不具有事件MIR604转基因。

SEQ ID NO:2是对应于A188 MIR604插入位点及其侧翼序列的玉蜀黍良种品系NP2222基因组序列。

SEQ ID NO:3-27是以下核苷酸序列，这些核苷酸序列是邻近MIR604插入位点的用于Cas9-介导的切割的潜在靶序列。

SEQ ID NO:28是玉蜀黍基因组靶序列MIR604FR2。

SEQ ID NO:29是编码来自酿脓链球菌SF370的II型Cas9基因(用玉蜀黍优选密码子优化)的核苷酸序列。

SEQ ID NO:30是包括修饰的Cas9蛋白的氨基酸序列。

SEQ ID NO:31-34是可用于引导MIR604插入位点的Cas9切割的核苷酸序列。

SEQ ID NO:35是编码tracRNA支架和PolIII终止序列的核苷酸序列。

SEQ ID NO:36是编码单个引导RNA(sgRNA)的核苷酸序列。

SEQ ID NO:37是包括表达盒的核苷酸序列，该表达盒包括prOsU3和SEQ ID NO:36的sgRNA的编码序列。

SEQ ID NO:38是包括xJHAX-03的核苷酸序列。

SEQ ID NO:39是包括xJHAX-04的核苷酸序列。

SEQ ID NO:40-65是基于NP2222基因组序列(SEQ ID NO:2)的、选择为TALEN靶序列的核苷酸序列。

SEQ ID NO:66是包括TALEN靶序列MIR604FR1的核苷酸序列。

SEQ ID NO:67是包括TALEN靶序列MIR604FR2的核苷酸序列。

SEQ ID NO:68是识别靶序列SEQ ID NO:42的人工核酸酶cTNmir604Fw1-01的氨基酸序列。

SEQ ID NO:69是识别靶序列SEQ ID NO:42的人工核酸酶cTNmir604Fw1-02的氨基酸序列。

SEQ ID NO:70是识别靶序列SEQ ID NO:42的人工核酸酶cTNmirFw1-03的氨基酸序列。

SEQ ID NO:71是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-01的氨基酸序列。

SEQ ID NO:72是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-02的氨基酸序列。

SEQ ID NO:73是识别靶序列SEQ ID NO:43的人工核酸酶cTNmir604Rv1-03的氨基酸序列。

SEQ ID NO:74是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-01的氨基酸序列。

SEQ ID NO:75是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-02的氨基酸序列。

SEQ ID NO:76是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-03的氨基酸序列。

SEQ ID NO:77是识别靶序列SEQ ID NO:54的人工核酸酶cTNmire604RV2-01的氨基酸序列。

SEQ ID NO:78是识别靶序列SEQ ID NO:54的人工核酸酶cTNmir604RV2-02的氨基酸序列。

SEQ ID NO:79是识别靶序列SEQ ID NO:54的人工核酸酶cTNmir604Rv2-03的氨基酸序列。

SEQ ID NO:80是识别靶序列SEQ ID NO:53的人工核酸酶cTNmir604Fw2-05的氨基酸序列。

SEQ ID NO:81是识别靶序列SEQ ID NO:65的人工核酸酶cTNmir604Rv2-04的氨基酸序列。

SEQ ID NO:82是编码全长人工核酸酶分子cTNmir604Fw1-01(SEQ ID NO:68)的核苷酸序列。

SEQ ID NO:83是编码截短的人工核酸酶分子cTNmir604Fw1-03(SEQ ID NO:70)的核苷酸序列。

SEQ ID NO:84是编码全长人工核酸酶分子cTNmir604Rv1-01(SEQ ID NO:71)的核苷酸序列。

SEQ ID NO:85是编码截短的人工核酸酶分子cTNmir604Rv1-03(SEQ ID NO:72)的核苷酸序列。

SEQ ID NO:86是编码全长人工核酸酶分子cTNmir604Fw2-01(SEQ ID NO:72)的核苷酸序列。

SEQ ID NO:87是编码截短的人工核酸酶分子cTNmir604Fw2-03(SEQ ID NO:73)的核苷酸序列。

SEQ ID NO:88是编码截短的人工核酸酶分子cTNmir604Fw2-05(SEQ ID NO:80)的核苷酸序列。

SEQ ID NO:89是编码全长人工核酸酶分子cTNmir604Rv2-01(SEQ ID NO:77)的核苷酸序列。

SEQ ID NO:90是编码截短的人工核酸酶分子cTNmir604Rv2-03(SEQ ID NO:79)的核苷酸序列。

SEQ ID NO:91是编码截短的人工核酸酶分子cTNmir604Rv2-04(SEQ ID NO:81)的核苷酸序列。

SEQ ID NO:92-97是可用于使用qPCR用于检测SEQ ID NO:67靶序列内的突变的核苷酸序列。

SEQ ID NO:98是包括编码磷酸甘露糖异构酶的基因(cPMI-01)的核苷酸序列。

SEQ ID NO:99-101是包括由TALEN介导的基因组修饰的PMI靶序列的核苷酸序列。

SEQ ID NO:102-107是包括SEQ ID NO:98内的TALEN序列靶标的核苷酸序列。

SEQ ID NO:108是识别SEQ ID NO:102的人工核酸酶蛋白质TLN_PMIFW1a的氨基酸序列。

SEQ ID NO:109是识别SEQ ID NO:103的人工核酸酶蛋白质TLN_PMIRV1a的氨基酸序列。

SEQ ID NO:110是识别SEQ ID NO:106的人工核酸酶蛋白质TLN_PMIFW3的氨基酸序列。

SEQ ID NO:111是识别SEQ ID NO:107的人工核酸酶蛋白质TLN_PMIRV3的氨基酸序列。

SEQ ID NO:112是编码人工核酸酶蛋白质TLN_PMIFW1a的核苷酸序列。

SEQ ID NO:113是编码人工核酸酶蛋白质TLN_PMIRV1a的核苷酸序列。

SEQ ID NO:114是编码人工核酸酶蛋白质TLN_PMIFW3的核苷酸序列。

SEQ ID NO:115是编码人工核酸酶蛋白质TLN_PMIRV3的核苷酸序列。

SEQ ID NO:116-118是包括人工核酸酶靶序列的核苷酸序列。

SEQ ID NO:119是识别SEQ ID NO:117的人工核酸酶蛋白质TLN_rPMIFW1-01的氨基酸序列。

SEQ ID NO:120是识别SEQ ID NO:118的人工核酸酶蛋白质TLN_rPMIRv1-01的氨基酸序列。

SEQ ID NO:121是识别SEQ ID NO:117的人工核酸酶蛋白质TLN_rPMIFw1-02的氨基酸序列。

SEQ ID NO:122是识别SEQ ID NO:118的人工核酸酶蛋白质TLN_rPMIRv1-02的氨基酸序列。

SEQ ID NO:123是编码人工核酸酶蛋白质TLN_rPMIFW1-01的核苷酸序列。

SEQ ID NO:124是编码人工核酸酶蛋白质TLN_rPMIRv1-01的核苷酸序列。

SEQ ID NO:125是编码人工核酸酶蛋白质TLN_rPMIFW1-02的核苷酸序列。

SEQ ID NO:126是编码人工核酸酶蛋白质TLN_rPMIRv1-02的核苷酸序列。

SEQ ID NO:127-132是可用于检测靶向整合的核苷酸序列。

SEQ ID NO:133是存在于事件MIR604转基因植物的T-DNA插入片段中的PMI表达盒(prZmUbi1-cPMI-tNOS)的核苷酸序列(图9)。

SEQ ID NO:134是存在于事件MIR604中的T-DNA插入片段的以及左右边界区域的核苷酸序列(图9)。

SEQ ID NO:135是事件MIR604转基因基因座的核苷酸序列，该事件MIR604转基因基因座包括整个T-DNA插入片段和侧翼基因组DNA区域(包括RBFS和LBFS)(图9)。

SEQ ID NO:136是邻近MIR604 T-DNA插入右边界(RB)区域的B73玉蜀黍基因组区域的核苷酸序列(图9中的RBFS)。

SEQ ID NO:137是邻近MIR604 T-DNA插入左边界(LB)区域的B73玉蜀黍基因组区域的核苷酸序列(图9中的LBFS)。

SEQ ID NO:138是对应于邻近包括RBFS的RB区域的B73 MIR604插入位点基因座序列的优良玉蜀黍品系NP2222基因组序列的核苷酸序列(图9)。

SEQ ID NO:139是对应于邻近包括LBFS的LB区域的B73 MIR604 T-DNA插入位点基因座序列的优良玉蜀黍品系NP2222基因组序列的核苷酸序列(图9)。

发明详细说明

本说明不旨在是一个本发明以其而实施的所有不同方式，或可以加入本发明中的所有特征的详细目录。例如，关于一个实施例所说明的特征可以结合入其他实施例中，并且关于一个具体实施例所说明的特征可以从那个实施例删除。另外，鉴于本披露内容，对在此建议的不同实施例的众多变体以及附加对于本领域技术人员是显而易见的，这不脱离本发明。因此，以下说明旨在阐述本发明的一些具体实施例，并且并没有穷尽地叙述其所有排列、组合和变化。

除非另外定义，在此所使用的全部技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的意思。在此的本发明的说明中使用的术语仅仅是出于描述具体实施例的目的并且不旨在限制本发明。在此提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全文结合在此。

提供下面的定义和方法以便更好地定义本发明并且在本发明的实践中指导本领域的普通技术人员。除非另外说明，在此使用的术语应该根据相关领域的那些一般技术人员的常规用法来理解。分子生物学中的一般术语的定义也可在Rieger等人，Glossary of Genetics:Classical and Molecular[遗传学词汇表：标准和分子]，第5版，Springer-Verlag:New York[施普林格出版社：纽约]，1994中找到。

扩增方法，如聚合酶链式反应(PCR)法(例如，TaqMan)的“精确度”意指测试结果与接受的参考值之间的一致的接近度。

如在此所使用的，术语“扩增的”意指使用至少一种核酸分子作为模板，构建核苷酸分子的多个拷贝或与该核酸分子互补的多个拷贝。参见例如Diagnostic MolecularMicrobiology:Principles and Applications[诊断分子微生物学：原理与应用]，D.H.Persing等人编著，American Society for Microbiology[美国微生物学会]，华盛顿哥伦比亚特区(1993)。扩增产物被称为扩增子。

“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。在一些实施例中，该RNA随后在生物体内被翻译以产生蛋白质。

“线性系数(R²)”是通过线性回归分析获得的标准曲线的相关系数。

如在此所使用的“动态范围”意指本发明的方法以可接受水平的准确度和精度以线性方式进行的DNA浓度的范围。

如在此所使用的“检测试剂盒”是指用于在样品中检测来自感兴趣事件的靶DNA的试剂盒，该试剂盒包括本发明的核酸探针和引物(其将在最佳条件下特异性处理至靶DNA序列)以及能够进行核酸杂交和/或扩增方法所需的其他材料。

如在此所使用的术语转基因的“事件”是指一种通过用异源DNA(例如，包括一个或多个感兴趣的基因(例如，转基因)的表达盒)转化和再生单个植物细胞而产生的重组植物。术语“事件”是指包括异源DNA的原始转化体和/或该转化体的子代。术语“事件”也是指通过该转化体和另一种品系之间进行有性远交(outcross)而产生的子代。即使在重复回交至一个轮回亲本后，来自该转化的亲本的插入DNA和侧翼DNA存在于在该杂交子代的同样的染色体位置。通常，植物组织的转化产生多个事件，每个上述事件代表DNA构建体插入至植物细胞的基因组中的不同位置中。基于转基因或其他期望的特征的表达，选择特定的事件。因而，如在此所使用的“事件MIR604”、“MIR604”或“MIR604事件”意指原始的MIR604转化体和/或MIR604转化体的子代(美国专利号7,361,813；7,897,748；8,354,519和8,884,102，通过引用结合在此)。

事件MIR604的插入位点具有许多特征，这些特征使其成为用于基因组修饰的靶位点的良好候选物。这些特征包括：该位点不会断开天然基因，该位点不在核苷酸序列的高度重复区域中，该位点的核苷酸序列不在玉蜀黍基因组的其他地方显著重复，并且已知在该位点引入的转基因在最初转化的植物中、在已经引入MIR604的其他玉蜀黍品种中以及在事件MIR604植物的子代中都具有多代的良好的表达水平。此外，事件MIR604作为商业产品和在成功的商用级育种计划(其中事件MIR604被引入到至少几十个玉蜀黍品种，并且在多种环境条件下表现出转基因的优异表达)中的成功表明该事件MIR604插入位点是靶向插入的良好候选物。

如在此所使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列表达的核酸分子，该核酸分子包括可操作地连接至感兴趣的核苷酸序列(典型地是编码区)的启动子，该核苷酸序列可操作地连接至终止信号。它还典型地包括适当翻译该核苷酸序列所需要的序列。该编码区通常对感兴趣的蛋白质进行编码，但是还可以在正义或反义方向上对感兴趣的功能性RNA(例如反义RNA或非翻译RNA)进行编码。表达盒还可以包含在引导感兴趣的核苷酸序列表达中不需要的序列，但是其因为用于将表达盒从表达载体移除的方便的限制性位点而存在。包括该感兴趣的核苷酸序列的表达盒可以是嵌合的，意味着至少一个它的组分相对于至少一个它的其他组分是异源的。该表达盒还可以是一种天然存在的表达盒，但已经是以对于异源表达有用的重组形式而获得的。然而，通常表达盒相对于宿主来说是异源的，即表达盒的特定核酸序列在宿主细胞中不是天然存在的，并且必须已经通过本领域已知的转化方法引入至宿主细胞或宿主细胞的祖先中。在该表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下，该启动子只有当该宿主细胞暴露于一些特殊的外界刺激时才引发转录。在多细胞生物体(如植物)的情况下，该启动子也可以特异于特定组织、或器官、或者发育阶段。当被转化进植物中时，表达盒或其片段也可被称为“插入的序列”或者“插入序列”。

“基因”是位于基因组内的限定区域，并且除了前述的编码核酸序列之外，它还包括其他负责控制该编码部分的表达(也就是转录和翻译)的主要调节性核酸序列。一个基因还可以包括其他5'和3'未翻译序列和终止序列。其他可能存在的元件是，例如，内含子。

“感兴趣的基因”是指当转移至植物时，在该植物上赋予所希望的特征(如抗生素抗性、病毒抗性、虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁殖能力)的任何基因。“感兴趣的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。

如在此所使用的“基因型”是由亲本植物遗传的遗传物质，并不是所有这些遗传物质都必然地表达在后代植物中。通过举例的方式，MIR604基因型是指转化入植物基因组中的异源遗传物质以及插入序列侧翼的遗传物质。

如在此所使用的，“异源的”是指与其引入的宿主细胞天然不相关的核酸分子或核苷酸序列，该序列来源于另一种物种或来自相同物种或生物体，但是从其原始形式或主要在细胞中表达的形式进行了修饰，包括天然存在的核酸序列的非天然存在的多个拷贝。。因此，源自与将其引入的细胞所属的生物体或物种不同的生物体或物种的核苷酸序列相对于那个细胞或细胞的子代而言是异源的。另外，异源核苷酸序列包括一种核苷酸序列，该核苷酸序列源自并插入相同的天然原始细胞类型，但是却以非天然状态存在，例如，以不同拷贝数目存在，和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。核酸序列还可以异源于与其相关的其他核酸序列，例如在核酸构建体中，例如像表达载体。作为一个非限制性实例，启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中，所述调节元件和/或编码序列不与那个特定启动子相关地天然存在，即它们与该启动子是异源的。

“同源”核酸序列是与其被引入的宿主细胞天然相关的核酸序列。同源核酸序列还可以与其他核酸序列天然相关的核酸序列，这些其他核酸序列可以例如存在于核酸构建体中。作为一个非限制性实例，启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中，所述调节元件和/或编码序列与那个特定启动子相关地天然存在，即它们与该启动子是同源的。

“可操作地连接”是指在一个单个核酸序列上核酸序列的关联，这样使得一个的功能影响另一个的功能。例如，当一个启动子能够影响编码序列或者功能RNA的表达时(即，该编码序列或功能RNA处于该启动子的转录控制之下)，则该启动子与该编码序列或者功能RNA是可操作地连接的。正义方向或者反义方向的编码序列能够与调节序列可操作地连接。

如在此所使用的“引物”是分离的核酸，它们通过核酸杂交被退火为互补靶DNA链，以在该引物与该靶DNA链之间形成杂交，然后通过一种聚合酶(如DNA聚合酶)沿着该靶DNA链延长。引物对或引物组可以用于核酸分子的扩增，例如通过聚合酶链式反应(PCR)或者其他核酸扩增方法。

“探针”是互补于靶核酸分子的一部分的分离的核酸分子，并且通常用于检测和/或定量靶核酸分子。因此，在一些实施例中，探针可以是可检测部分或报道基因附接到的分离的核酸分子，如放射性同位素、配体、化学发光剂、荧光剂或酶。根据本发明的探针不仅可以包括脱氧核糖核酸或核糖核酸，还包括与靶核酸序列特异性结合并且可以用于检测该靶核酸序列的存在或定量该靶核酸序列的量的聚酰胺类以及其他探针材料。

设计TaqMan探针，使得其在由特定引物组扩增的DNA区域内退火。由于Taq聚合酶延伸引物并从互补链的3'至5'的单链模板合成新生链，所以聚合酶的5'至3'外切核酸酶通过探针延伸新生链，并且因此降解已经退火到模板的探针。探针的降解从其中释放荧光团，并打破了与淬灭剂的紧密相接，从而减轻了淬灭效应并允许荧光团的荧光。因此，在定量PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。

引物和探针的长度一般在5和100个核苷酸或更多核苷酸之间。在一些实施例中，引物和探针的长度可以为至少20个核苷酸或更多，或至少25个核苷酸或更多，或长度至少30个核苷酸或更多。这些引物和探针在本领域已知的最佳杂交条件下与靶序列特异性杂交。根据本发明的引物和探针可以具有与该靶序列互补的完整序列，虽然与该靶序列不同并保留与该靶序列杂交的能力的探针可通过根据本发明的常规方法进行设计。

用于制备和使用探针和引物的方法描述于例如Molecular Cloning:ALaboratory Manual[分子克隆：实验室手册]，第二版，第1-3卷，Sambrook等人编辑，Cold SpringHarbor Laboratory Press[冷泉港实验室出版社]，Cold Spring Harbor[冷泉港]，纽约州，1989中。PCR引物对可以源自已知序列，例如通过使用旨在用于该目的的计算机程序。

聚合酶链式反应(PCR)是一种用于“扩增”特定DNA片段的技术。为了进行PCR，必须知道待复制的DNA分子的核苷酸序列的至少一部分。通常，使用与待扩增的DNA的每条链的3'端处的核苷酸序列(已知序列)互补(例如，基本互补或完全互补)的引物或短寡核苷酸。将DNA样品加热以分离其链，并与这些引物混合。这些引物与其DNA样品中的互补序列杂交。使用原始DNA链作为模板开始合成(5'至3'方向)。该反应混合物必须包含全部四种脱氧核苷酸三磷酸(dATP、dCTP、dGTP、dTTP)和DNA聚合酶。聚合继续进行，直到每条新合成的链已经进行得足够远以包含被另一个引物识别的序列。一旦发生这种情况，就会产生与原始分子一致的两个DNA分子。将这两个分子加热以分离其链，并重复该过程。每个循环使DNA分子的数量加倍。使用自动化设备，每个循环的复制可以在不到5分钟内完成。30个循环后，以DNA单分子开始的扩增已经超过10亿个拷贝(2³⁰＝1.02x10⁹)。

寡核苷酸引物对的寡核苷酸互补于位于相对DNA链上和待扩增区域侧翼的DNA序列。退火引物与新合成的DNA链杂交。第一个扩增循环将导致两条新的DNA链，其5’端通过寡核苷酸引物的位置固定，但其3’端是可变的(‘不规则的’3’端)。两条新链可以依次充当用于合成所希望的长度的互补链的模板(5’端由引物定义并且3’端是固定的，因为合成不能超过相反引物的末端)。几个循环后，所希望的固定长度产品开始占主导地位。

定量聚合酶链式反应(qPCR)(也称为实时聚合酶链式反应)实时监测来自PCR反应的DNA产物的积累。qPCR是基于聚合酶链式反应(PCR)的分子生物学实验室技术，它用于扩增并且同时定量靶DNA分子。可以在PCR中扩增和检测特定序列的甚至一个拷贝。PCR反应以指数方式生成DNA模板的拷贝。这导致起始靶序列的量和在任何特定循环下累积的PCR产物的量之间的定量关系。由于与模板、试剂限制或焦磷酸盐分子的积累一起发现的聚合酶反应的抑制剂，所以PCR反应最终停止以指数速率生成模板(即平台期)，使得PCR产物的终点定量不可靠。因此，重复的反应可以生成可变量的PCR产物。只有在PCR反应的指数期期间才有可能回推以便确定模板序列的起始量。PCR产物积累时的测量(即实时定量PCR)允许在反应的指数期进行定量，并且因此消除与常规PCR相关的变异性。在实时PCR测定中，通过荧光信号积累来检测阳性反应。对于DNA样品中的一个或多个特异性序列，定量PCR能够进行检测和定量两者。数量可以是拷贝的绝对数量或是当归一化到DNA输入或额外的归一化基因时的相对量。从实时PCR的第一次记录以来，它已被用于越来越多的并且不同数量的应用，包括mRNA表达研究、基因组或病毒DNA中的DNA拷贝数测量、等位基因辨别测定、基因的特异性剪接变体的表达分析和石蜡包埋组织中的基因表达以及激光捕获的显微切割细胞。

如在此所使用的，短语“Ct值”是指“循环阈值”，其被定义为“扩增靶标的量达到固定阈值的分数循环数。”在一些实施例中，其表示扩增曲线和阈值线之间的交点。扩增曲线典型地处于“S”形，这表示在给定循环(X轴)处的每个反应(Y轴)的相对荧光的变化，该变化在一些实施例中通过实时PCR仪器在PCR期间记录。在一些实施例中，阈值线是反应达到高于背景的荧光强度处的检测水平。参见Livak和Schmittgen(2001)25Methods[《方法》]402-408。它是PCR中靶标浓度的相对量度。通常，在一些实施例中，对于给定的参考基因，定量测定如qPCR的良好Ct值在10-40的范围内。Ct水平与样品中的靶核酸量成反比(即Ct水平越低，样品中的可检测的靶核酸量越高)。此外，定量测定如qPCR的良好Ct值显示出在成比例稀释靶gDNA的情况下的线性响应范围。

在一些实施例中，在其中可以实时收集Ct值进行定量分析的条件下进行qPCR。例如，在典型的qPCR实验中，在延伸期期间的PCR的每个循环处监测DNA扩增。当DNA处于扩增的对数线性期时，荧光的量通常增加到背景以上。在一些实施例中，在该时间点收集Ct值。

如在此所使用的术语“转化”是指将核酸分子转移到宿主细胞的基因组中，导致基因上稳定的遗传。在一些实施例中，引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制，或其任何组合进行的。

用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下各项的转化：细菌介导的核酸递送(例如，经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制，包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人，(“Procedures for Introducing Foreign DNAinto Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology andBiotechnology[植物分子生物学和生物技术]的方法中，Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司]，波卡拉顿，1993)，第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。

农杆菌介导的转化是用于转化植物的常用方法，因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带感兴趣的外源DNA的二元载体转移至适当的农杆菌菌株，这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人，1993，Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌，一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地，可以通过核酸转化将该重组二元载体转移至农杆菌中(

和Willmitzer，1988，Nucleic Acids Res.[核酸研究]16:9877)。

通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养，并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。

另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见例如美国专利号4,945,050；5,036,006和5,100,792。通常，这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时，可以通过用包含感兴趣的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地，一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如，干燥的酵母细胞、干燥的细菌或噬菌体，各自包含一个或多个试图被引入的核酸)推进到植物组织中。

因此，在本发明的具体实施例中，植物细胞可以通过本领域内已知的任何方法或如在此描述地进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。从植物细胞、植物组织培养物和/或培养的原生质体的植物再生描述在例如Evans等人(Handbook of Plant Cell Cultures[植物细胞培养手册]，第1卷，MacMilanPublishing Co.[麦克米伦出版公司]纽约(1983))；和Vasil I.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学]，Acad.Press [学术出版社]，奥兰多，第I卷(1984)和第II卷(1986))中。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的，并且可以用于在此提供的本发明的方法中。

在被引入细胞中的多核苷酸的上下文中，“稳定引入”或“稳定引入的”是指所引入的多核苷酸被稳定地合并到该细胞的基因组中，并且因此该细胞用该多核苷酸进行了稳定转化。

如在此所使用的，“稳定转化”或“被稳定地转化的”意为将核酸引入到细胞中并且整合到该细胞的基因组中。按照这样，所整合的核酸能够被其子代遗传，更具体地，被多个连续世代的子代遗传。如在此所使用的，“基因组”还包括核基因组与质粒基因组，并且因此包括该核酸到例如叶绿体基因组的整合。如在此所使用的，稳定转化也可以是指以染色体外方式(例如，作为微型染色体)维持的转基因。

细胞的稳定转化可以通过例如细胞的基因组DNA与核酸序列(这些核酸序列与引入生物体(例如，植物)中的转基因的核苷酸序列特异性杂交)的DNA印迹杂交测定来检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的RNA印迹杂交测定来检测，这些核酸序列与引入到植物或其他生物体中的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域熟知的其他扩增反应来进行检测，这些反应采用与转基因的一个或多个靶序列杂交的特异性引物序列，从而导致该转基因序列的扩增，这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。

“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如在此所使用的，转化和再生包括选择过程，通过该过程转基因包括选择性标记，并且转化的细胞已经并入并表达转基因，使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。

如在本发明的实施例的说明和所附权利要求中所使用的，单数形式“一个/一种(a/an)”和“该(the)”旨在也包括复数形式，除非上下文清楚地另外指明。

如在此所使用的，“和/或”是指并且涵盖相关列出项目中的一个或多个的任何和所有可能的组合。

如在此所使用的术语“约”当指代可测量的值如化合物的量、剂量、时间、温度等时意指涵盖指定量的20％、10％、5％、1％、0.5％、或甚至0.1％的变化。

术语“包括(comprise、comprises和/或comprising)”当在本说明书中使用时，指明所列举特征、整体、步骤、操作、元件、和/或组分的存在，但是不排除一种或多种其他特征、整体、步骤、操作、元件、组分、和/或其组的存在或添加。

如在此所使用的，过渡短语“基本上由……组成”意指权利要求的范围将被解释为涵盖该权利要求中所提到的指定材料或步骤以及不会实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此，当用于本发明的权利要求中时，术语“基本上由……组成”并不旨在被解释为等同于“包括(comprising)”。

术语“核苷酸序列”、“核酸”、“核酸序列”、“核酸分子”“寡核苷酸”以及“多核苷酸”在此可互换地使用来指核苷酸的杂聚物并且涵盖RNA和DNA二者，包括cDNA、基因组DNA、mRNA、合成的(例如，化学合成的)DNA或RNA以及RNA和DNA的嵌合体。术语核酸分子是指一个核苷酸链，而不考虑该链的长度。这些核苷酸包含糖、磷酸和碱，该碱是嘌呤或嘧啶。核酸分子可以是双链或单链的。在单链时，核酸分子可以是正义链或反义链。可以使用寡核苷酸类似物或衍生物(例如，肌苷或硫代磷酸核苷酸)合成核酸分子。此类寡核苷酸可以例如用于制备具有改变的碱基配对能力或对核酸酶的增强的抗性的核酸分子。在此提供的核酸序列在此以5'至3'方向从左至右表示，并且使用代表核苷酸字符的标准代码表示，如美国序列规则，37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述。

“核酸片段”是给定核酸分子的一部分。在高等植物中，脱氧核糖核酸(DNA)是遗传物质，而核糖核酸(RNA)涉及将DNA中包含的信息到蛋白中的转移。“基因组”是在生物体的每个细胞中所包含的遗传物质的整体。除非另外表明，本发明的特定的核酸序列还暗示性地涵盖其保守地修饰的变体(例如，简并密码子取代)以及互补序列、以及连同明确地指明的序列。确切地，简并密码子取代可通过产生以下序列来实现，在这些序列中一个或多个所选(或全部)密码子的第三位置被经混合的碱基和/或脱氧肌苷残基取代(Batzer等人，Nucleic Acid Res.[核算研究]19:5081(1991)；Ohtsuka等人，J.Biol.Chem.[生物化学杂志]260:2605-2608(1985)；Rossolini等人，Mol.Cell.Probes[分子细胞探针]8:91-98(1994))。术语核酸分子与基因、cDNA和由基因编码的mRNA可互换使用。

如在此所使用的，术语“基因”指能够用来产生mRNA、反义RNA、miRNA等的核酸分子。基因可能或可能不能用于产生功能性蛋白质。基因可以包括编码区和非编码区(例如、内含子、调节元件、启动子、增强子、终止序列和5'和3'非翻译区)二者。在一些实施例中，基因仅指编码区。基因可以是“分离的”，分离的基因意为一种核酸分子，其实质上(substantially)或基本上(essentially)不含正常情况下发现与其天然状态时的核酸分子相关的组分。此类组分包括其他细胞材料、来自重组产物的培养基、和/或在化学合成该核酸分子中所使用的多种化学品。

如在此所使用的“序列一致性”是指两个最佳比对的多核苷酸或肽序列在组分(例如核苷酸或氨基酸)的整个比对窗口内不变的程度。“一致性”可通过已知方法简单计算，这些方法包括但不限于描述在以下文献中的那些：Computational Molecular Biology[计算分子生物学](Lesk,A.M.编辑)牛津大学出版社，纽约(1988)；Biocomputing:Informaticsand Genome Projects[生物计算：信息学和基因组计划](Smith,D.W.编辑)学术出版社，纽约(1993)；Computer Analysis of Sequence Data[序列数据的计算机分析]，第I部分(Griffin,A.M.和Griffin,H.G.编辑)Humana Press[胡马纳出版社]，新泽西(1994)；Sequence Analysis in Molecular Biology[分子生物学的序列分析])(von Heinje,G.编辑)学术出版社(1987)；和Sequence Analysis Primer[序列分析引物](Gribskov,M.和Devereux,J.编辑)斯托克顿出版社，纽约(1991)。

如在此所使用的，术语“序列一致性百分比”或“一致性百分比”是指在最佳比对两个序列时，与测试(“主题”)多核苷酸分子(或其互补链)相比，参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的一致核苷酸的百分比。在一些实施例中，“一致性百分比”可以是指氨基酸序列中一致氨基酸的百分比。

如在此所使用的，在两个核酸分子、核苷酸序列或蛋白质序列上下文中，短语“实质上一致”是指当比较并比对最大对应性时具有至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％核苷酸或氨基酸残基一致性的两个或更多个序列或子序列，如使用以下序列比较算法之一或通过目测检查所测量的。在本发明的一些实施例中，在长度为至少约50个残基至约150个残基的序列区域上存在实质一致性。因此，在本发明的一些实施例中，在长度为至少约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、或更多个残基的序列区域上存在实质一致性。在一些具体实施例中，这些序列在至少约150个残基上是实质上一致的。在另一个实施例中，这些序列在编码区的整个长度上是实质上一致的。此外，在代表性实施例中，实质上一致的核苷酸或蛋白质序列执行实质相同的功能(例如，赋予对线虫植物寄生物的增加的抗性、减少线虫植物寄生物的生长、减少胞囊发育)。

对于序列比较，典型地，一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时，将测试序列和参考序列输入到计算机中(若有必要，则指定子序列坐标)，并且指定序列算法程序的参数。然后，这种序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列一致性百分比。

用于比对一个比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施：如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法，并且任选地由这些算法的计算机化实现方式来实施，如作为

Wisconsin

(材料科学软件公司(Accelrys Inc.)，圣地亚哥(San Diego)，加利福尼亚州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的已比对区段的“一致性分数”是由两个已比对序列所共有的一致组分的数目除以参考序列区段(即，完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列一致性百分比被表示为一致性分数乘以100。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其一部分，或相对于较长的多核苷酸序列。出于本发明的目的，也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN测定“一致性百分比”。

用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开地获得。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP)，这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正-值阈值的得分T。T被称为邻近字码得分阈值(Altschul等人，1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现包含它们的较长的HSP。然后，将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列，使用参数M(对于一对匹配残基的奖赏得分；总是>0)和N(对于错配残基的罚分；总是<0)来计算累积得分。对于氨基酸序列，使用得分矩阵来计算该累积得分。当累积的比对得分从它的最大达到值降低了数量X；由于累积一个或多个负-得分的残基比对使累积得分趋于零或零以下；或者到达任一序列的末端时，停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了该比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M＝5、N＝-4、以及两条链的比较作为默认值。对于氨基酸序列，BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff，美国国家科学院院刊89:10915(1989))。

除了计算序列一致性百分数之外，BLAST算法还进行两个序列之间相似性的统计分析(参见，例如Karlin和Altschul，美国国家科学院院刊90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N))，它提供了在两个核苷酸或氨基酸序列之间会偶然发生一个匹配的概率的一个指示。例如，如果在一个测试核苷酸序列与一个参考核苷酸序列的比较中的最小概率总和是小于约0.1至小于约0.001，则该测试核酸序列被认为是与该参考序列相似的。因此，在本发明的一些实施例中，在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和是小于约0.001。

当两个核苷酸序列在严格条件下彼此杂交时这两个核苷酸序列也可以被认为是实质上一致的。在一些代表性实施例中，被认为实质上一致的两个核苷酸序列在高严格条件下彼此杂交。

在核酸杂交实验(如DNA和RNA杂交)的上下文中，“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。对核酸杂交的广泛指导见于Tijssen的Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第I部分第2章“Overview of principles of hybridization and thestrategy of nucleic acid probe assays[杂交原理和核酸探针测定策略综述]”，Elsevier，纽约(1993)。总体上，高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(T_m)低约5℃。

T_m是50％的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于具体探针的T_m。用于互补核苷酸序列(它们在DNA或RNA印迹中在滤器上具有超过100个互补残基)的杂交的严格杂交条件的一个实例是在42℃下具有1mg肝素的50％甲酰胺，其中杂交是过夜进行的。高严格洗涤条件的一个实例是0.15MNaCl，在72℃下持续约15分钟。严格洗涤条件的一个实例是在65℃下以0.2x SSC洗涤持续15分钟(参见Sambrook，以下针对SSC缓冲液的说明)。通常，高严格洗涤之前会先进行低严格洗涤，以去除背景探针信号。对于例如多于100个核苷酸的双链体的中严格洗涤的实例是在45℃下以1xSSC持续15分钟。对于例如多于100个核苷酸的双链体的低严格洗涤的实例是在40℃下以4-6x SSC持续15分钟。对于短探针(例如，约10至50个核苷酸)，严格条件典型地涉及小于约1.0M的Na离子的盐浓度，典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐)，并且温度典型地是至少约30℃。还可以通过加入去稳定剂(如甲酰胺)来实现严格条件。一般而言，在特定的杂交测定中相比于不相关的探针观察到的高出2倍(或更高)的信噪比表明检测到特定杂交。如果在严格条件下彼此不杂交的核苷酸序列所编码的蛋白质是实质上一致的，则这些核苷酸序列仍然是实质上一致的。例如，当使用遗传密码所允许的最大密码子简并性来生成核苷酸序列的一个拷贝时，这种情况可能发生。

以下是可以用来克隆同源核苷酸序列(这些序列是与本发明的参考核苷酸序列实质上一致的)的杂交/洗涤条件的设置的实例。在一个实施例中，参考核苷酸序列在50℃下在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与该“测试”核苷酸序列杂交，同时在50℃下在2X SSC、0.1％SDS中洗涤。在另一个实施例中，该参考核苷酸序列在50℃下在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与该“测试”核苷酸序列杂交，同时在50℃下在1X SSC、0.1％SDS中洗涤；或者在50℃下在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mMEDTA中杂交，同时在50℃下在0.5X SSC、0.1％SDS中洗涤。在仍另外的实施例中，该参考核苷酸序列在50℃下在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与该“测试”核苷酸序列杂交，同时在50℃下在0.1X SSC、0.1％SDS中洗涤；或者在50℃下在7％十二烷基硫酸钠(SDS)、0.5MNaPO₄、1mM EDTA中杂交，同时在65℃下在0.1X SSC、0.1％SDS中洗涤。

“分离的”核酸分子或核苷酸序列或“分离的”多肽是借助于人的手脱离其天然环境存在的和/或当与其在其天然环境中的功能相比时具有不同的、修饰的、调节的和/或改变的功能的并且因此不是天然的产物的核酸分子、核苷酸序列或多肽。分离的核酸分子或分离的多肽能以纯化形式存在或可以存在于非天然环境(例如像重组宿主细胞)中。因此，例如，相对于多核苷酸而言，术语分离的意指将该多核苷酸从它天然存在于其中的染色体和/或细胞中分离出。如果将一种多核苷酸从它天然存在于其中的染色体和/或细胞中分离出并且然后将其插入它并不天然存在于其中的遗传背景、染色体、染色体位置、和/或细胞中，则该多核苷酸也是被分离的。本发明的重组核酸分子和核苷酸序列可以被认为是如上文所定义的“分离的”。

因此，“分离的核酸分子”或“分离的核苷酸序列”是核酸分子或核苷酸序列，该核酸分子或核苷酸序列不与在其衍生而来的生物体的天然存在的基因组中的与其邻近的核苷酸序列(位于5'端的序列或位于3’端的序列)相邻。因此，在一个实施例中，一个分离的核酸包括一些或全部的5'非编码(例如，启动子)序列，这些序列紧接编码序列。因此，该术语包括，例如，重组核酸，该重组核酸结合进入载体、进入自我复制的质粒或病毒、或进入原核生物或真核生物的基因组DNA，或者它作为独立于其他序列的一种单独分子(例如，一种cDNA或一种利用PCR或限制性内切核酸酶处理所得到的基因组DNA片段)而存在。它也包括作为编码额外多肽或肽序列的杂合核酸分子的部分的重组核酸。“分离的核酸分子”或“分离的核苷酸序列”还可以包括以下核苷酸序列，该核苷酸序列源自并插入相同的天然原始细胞类型，但是却以非天然状态存在，例如，以不同拷贝数目存在，和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。

术语“分离的”可以进一步指核酸分子、核苷酸序列、多肽、肽或片段，它们实质上不含细胞材料、病毒材料、和/或培养基(例如，当通过重组DNA技术生产时)、或化学前体或其他化学品(例如，当进行化学合成时)。另外，“分离的片段”是不作为片段天然存在并且不会在天然状态下如此存在的核酸分子、核苷酸序列或多肽的片段。“分离的”不必须意味着该制备是工业纯的(同质的)，但是它是足够纯的以提供处于可以用于预期目的形式的多肽或核酸。

在本发明的代表性实施例中，“分离的”核酸分子、核苷酸序列和/或多肽具有至少约5％、10％、15％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、97％、98％、99％纯度(w/w)或更大纯度。在其他实施例中，“分离的”核酸、核苷酸序列和/或多肽表示与起始材料相比，实现该核酸的至少约5倍、10倍、25倍、100倍、1000倍、10,000倍、100,000倍或更大富集(w/w)。

“野生型”核苷酸序列或氨基酸序列是指天然存在(“天然”)或内源核苷酸序列或氨基酸序列。因此，例如，“野生型mRNA”是天然存在于生物体中的或对生物体来说是內源性的mRNA。“同源”核苷酸序列是与它被引入的宿主细胞天然相关的核苷酸序列。

关于多核苷酸编码序列的术语“表达(express或expression)”，意指该序列被转录，并且任选被翻译。

“感兴趣的核苷酸序列”是指，当被引入一种植物中时，赋予该植物一种所希望的特征(如抗生素抗性、病毒抗性、虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁殖能力)的任何核苷酸序列。“感兴趣的核苷酸序列”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。

如在此所使用的，短语“可操作地连接”、“操作性地连接”、“操作性相关的”或“操作性相关”等意指核酸构建体的元件(如表达盒或核酸分子)被配置以便执行其通常的功能。因此，可操作地与核苷酸序列相关的调节或控制序列(例如，启动子)能够影响核苷酸序列的表达。例如，与编码miR396c的核苷酸序列可操作地相关的启动子将能够影响该miR396c核苷酸序列的表达。

控制序列不需要与感兴趣的核苷酸序列相邻，只要它们起到指导其表达的作用。因此，例如，介入未翻译的、已转录的序列可以在启动子与编码序列之间存在，并且该启动子序列仍可以被认为“可操作地连接至”该编码序列上。

如在此所使用的，术语“转化”和“转基因”是指包含至少一种重组(例如，异源)多核苷酸的全部或部分的任何植物、植物细胞、愈伤、植物组织、或植物部分。在一些实施例中，将该重组多核苷酸的全部或部分稳定地整合到染色体或稳定的染色体外元件中，以便使得其传递到连续世代。出于本发明的目的，术语“重组多核苷酸”是指已经通过基因工程改变、重排或修饰的多核苷酸。实例包括任何克隆的多核苷酸，或与异源序列连接或接合的多核苷酸。术语“重组”不是指因天然存在的事件(如自发突变)或因非自发诱变随后选择性育种而产生的多核苷酸改变。

在植物细胞、植物和/或植物部分的上下文中，术语“引入”(introducing或introduce)意指将一个核酸分子与该植物、植物部分和/或植物细胞以这样一种方式相接触，使得该核酸分子得以进入植物细胞和/或植物和/或植物部分的细胞的内部。在引入多于一种核酸分子的情况下，这些核酸分子可以被装配成单个聚核苷酸或核酸构建体的一部分，或装配成分开的聚核苷酸或核酸构建体，并且可以位于相同或不同的核酸构建体上。因此，可以在单个的转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分，将这些多核苷酸引入到植物细胞中。因此，如在此所使用的术语“转化”是指将异源核酸引入细胞中。细胞的转化可以是稳定或瞬时的。因此，本发明的转基因植物细胞、植物和/或植物部分可以被稳定转化或瞬时转化。

如在此所使用的术语“植物部分”包括但不限于：胚、花粉、胚珠、种子、叶、茎、芽、花、枝、果实、果仁、穗、穗轴、果壳、茎杆、根、根尖、花药、植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团等。如在此所使用的，“芽”是指包括叶和茎的地上部分。另外，如在此所使用的，“植物细胞”指植物的结构和生理单位，包括细胞壁并且也可以指原生质体。本发明的植物细胞可以处于分离的单细胞形式，或者可以是培养的细胞，或者可以是作为较高级的组织单位(例如像，植物组织或植物器官)的一部分。

在多核苷酸的上下文中，“瞬时转化”意指：将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。

如在此所使用的，在被引入细胞中的多核苷酸的上下文中，“稳定引入(stablyintroducing、stably introduced)”、“稳定转化(stable transformation或stablytransformed)”意指：引入的多核苷酸被稳定地整合到该细胞的基因组中，并且因此该细胞用该多核苷酸稳定地转化。因此，整合的多核苷酸能够由其子代继承，更具体地说，由多个连续世代的子代继承。如在此所使用的“基因组”包括核和/或质体基因组，并且因此包括多核苷酸到例如叶绿体基因组中的整合。如在此所使用的稳定转化还可以是指被保持在染色体外，例如，作为一种微染色体的多核苷酸。

瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测，这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如，植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测，该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列，导致该一个或多个靶序列的扩增，这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。

术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(“密码子”)的一个单位，它对应地指明蛋白合成(mRNA翻译)的起始和链终止。

“启动子”是指核苷酸序列，通常在它的编码序列的上游(5')，它通过提供对适当的转录所需的RNA聚合酶以及其他因子的识别来控制该编码序列的表达。“启动子调节序列”由近端和更远端上游元件组成。启动子调节序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括自然序列以及合成序列、连同可能是合成序列与自然序列的组合的序列。“增强子”是一个DNA序列，它可以刺激启动子的活性并且可以是该启动子或插入的异源元件的一个固有元件以增强一种启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作，并且甚至当移动到该启动子的上游或下游时还能够发挥作用。术语“启动子”的含义包括“启动子调节序列”。

“初级转化体”以及“T0世代”是指与最初转化(即，自从转化起未经历减数分裂以及受精)的组织具有相同遗传世代的转基因植物。“次级转化体”以及“T1、T2、T3等世代”是指经由一个或多个减数分裂以及受精循环而源自初级转化体的转基因植物。它们可以通过初级或次级转化体的自体受精或初级或次级转化体与其他转化或未转化植物的杂交衍生的。

“基因”是指表达mRNA、功能性RNA、或特异性蛋白的核酸片段，包括调节序列。术语“天然基因”是指如在自然界中发现的基因。术语“嵌合基因”是指包含以下各项的任何基因：1)DNA序列，包括在自然界中未一起发现的调节序列和编码序列，或2)编码不天然邻接的蛋白的部分的序列，或3)不天然邻接的启动子的部分。因此，嵌合基因可以包括从不同来源得到的调节序列和编码序列，或包括从相同来源得到的、但以与在自然界中所发现的不同的方式进行安排的调节序列和编码序列。

“转基因”是指核酸分子，该核酸分子已经通过转化被引入该基因组中并且被稳定地保持。转基因可以包括至少一个表达盒，典型地包括至少两个表达盒，并且可以包括十个或更多个表达盒。转基因可以包括例如对于待转化的特定植物的基因而言是异源的或者是同源的基因。此外，转基因可以包括被插入非天然生物体中的天然基因，或嵌合基因。术语“内源基因”是指在生物体的基因组中在它的天然位置中的天然基因。“外源”基因是指正常在宿主生物体中未发现但通过基因转移被引入该生物体中的基因。

“内含子”是指几乎唯一地在真核基因中发生的DNA的内插区段，但该内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子，该剪接使外显子未被触及，从而形成mRNA。出于本发明的目的，术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰，条件是该修饰过的内含子没有显著地降低其关联的5’调节序列的活性。

“外显子”是指携带蛋白或其一部分的编码序列的DNA的区段。外显子被内插的、非编码序列(内含子)分离。出于本发明的目的，术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰，条件是该修饰过的外显子没有显著地降低它的关联的5’调节序列的活性。

因此，在一个实施例中，本发明提供了将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法，该方法包括将以下各项引入玉蜀黍细胞：a)包括至少80、至少90、至少100、至少110、至少120、至少130、至少140、或至少150个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述连续核苷酸与SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列中的靶位点具有至少80％、至少85％、至少90％、至少93％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致性；和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的连续核苷酸的SEQ ID NO:1的核苷酸序列或SEQ ID NO:2的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。

如在此所使用的，“靶位点”意指基因组中的核苷酸区域，其是用于将核苷酸序列(例如，一个或多个转基因、表达盒、或感兴趣的核苷酸序列)插入到基因组的选择的或优选的位点以及用于将突变(例如，取代和/或缺失、和/或插入，如INDEL)引入基因组的选择的或优选的位点。在一些实施例中，靶位点可以包括核酸酶切割位点，也称为基因组核酸酶切割位点。本发明的靶位点的非限制性实例是由以下定义并且包括以下的染色体1上的染色体区间：如由玉蜀黍基因组数据库中可获得的玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,105,000定义的。

如在此所使用的关于本发明的一个或多个核苷酸序列的术语“相邻的”或“与……相邻”意指紧邻(例如，没有插入序列)或由从约1个碱基至约10,000个碱基(例如，1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100、200、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10,000个碱基)分隔，包括包含在该范围内但未在此明确叙述的任何值。

“核酸酶切割位点”或“基因组核酸酶切割位点”是包括核酸酶切割序列的核苷酸区域，该核酸酶区域由特异性核酸酶识别，该核酸酶用于切割一条或两条链中基因组DNA的核苷酸序列。由核酸酶的这种切割引发了细胞内的DNA修复机制，它建立了同源重组发生的环境。在此方法中，其中第一核酸分子包括例如至少约100个连续核苷酸，这些连续核苷酸与细胞基因组中的靶位点具有例如至少90％一致性，该第一核酸分子经由同源重组被整合到细胞基因组中，从而将一个或多个转基因整合到细胞基因组中。

在以上方法的一些实施例中，第一核酸分子可以包括至少约100、150、200、250、300、250、400、450、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、7500、10000、15,000或20,000个核苷酸，包括此范围内的未在此明确叙述的任何值。

在以上方法的一些实施例中，包括玉蜀黍基因组中的基因组核酸酶切割位点的核苷酸序列可以是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66或SEQ ID NO:67的核苷酸序列。

在以上方法的一些实施例中，该基因组核酸酶切割位点位于染色体1上的染色体区间内，该染色体区间由以下定义并且包括以下：如由玉蜀黍基因组数据库中可获得的玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,015,000。

在以上方法的一些实施例中，该核酸酶对选自下组的核苷酸序列中的核酸酶切割位点具有切割特异性，该组由以下各项组成：SEQ ID NO:1(HiII-MIR604)、SEQ ID NO:2(AX-MIR604)、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66、SEQ ID NO:67及其任何组合。

在一些实施例中，第一核酸分子和第二核酸分子可以通过基因枪核酸递送，经由农杆菌，通过共转化和/或用T-DNA载体以任何组合和/或顺序引入玉蜀黍细胞。

在一些实施例中，第一核酸分子和第二核酸分子可以存在于单个核酸构建体上，并且在一些实施例中，第一核酸分子和第二核酸分子可存在于分开的核酸构建体上。

在一些实施例中，第一核酸分子和/或第二核酸分子可以在玉蜀黍细胞中瞬时表达。

在一些实施例中，第一核酸分子和/或第二核酸分子可以稳定地整合到玉蜀黍细胞中的玉蜀黍基因组中。

本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代包括整合到该玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过在此所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。因此，本发明提供了通过本发明的方法生产的、包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。

在一些实施例中，本发明基于意想不到的发现和快速(例如，高通量)方法的开发来鉴定和富集细胞，这些细胞包括一个或多个整合到基因组的靶位点处的转基因，该方法采用定量聚合酶链式反应(qPCR)测定的选择性组合。

本发明进一步提供了鉴定细胞和/或富集细胞的方法，该细胞包括插入到细胞基因组中的核酸酶切割位点的转基因，该方法包括：a)将以下各项引入多个细胞中：i)包括至少80、至少90、至少100、至少110、至少120、至少130、至少140、或至少150个连续核苷酸并且进一步包括转基因的第一核酸分子，其中这些连续核苷酸与细胞基因组中的靶位点具有至少80％、至少85％、至少90％、至少93％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致性；和ii)编码以下核酸酶的第二核酸分子，该核酸酶在与对应于(i)的连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行；b)培养(a)的细胞以生产至少一种细胞系或组织；c)从(b)的每种细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G，其中测定T和G分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于靶位点的核苷酸序列，距离用于进行测定T的核酸酶切割位点至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十二个、或至少十五个碱基对，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列；e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数；以及f)鉴定和/或富集在测定T中相对于参考具有减少的拷贝数并且对于测定G，具有大于零的拷贝数的细胞系或组织，从而鉴定和/或富集包括插入到细胞基因组中的核酸酶切割位点的转基因的细胞。

在上述针对鉴定和/或富集细胞的方法中，这些细胞包括插入细胞基因组中的核酸酶切割位点的一个或多个转基因，qPCR测定可以按如本领域熟知的高通量格式进行，使得可以快速且同时地测定大量样品。这种快速和高效的筛选允许鉴定和富集在这些方法中使用的多个细胞(其典型地将是大量细胞)中的小百分比的细胞(例如，约2％)。

在上述方法中，第一探针(用于进行测定T)可以包括一种核苷酸序列、基本由其组成或由其组成，该核苷酸序列互补(例如，至少约90％、95％、98％、99％或100％互补)于距离核酸酶切割位点至少五(例如，4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20)个碱基对的核苷酸序列，并且第二探针(用于进行测定G)可以包括一种核苷酸序列，该核苷酸序列互补(例如，至少约90％、95％、98％、99％或100％互补)于一种或多种转基因中的至少一种。

在上述富集和鉴定方法的一些实施例中，除了鉴定和/或富集相对于参考具有减少的测定T中的拷贝数和对于测定G大于零的拷贝数(例如，约1的拷贝数、约2的拷贝数或约3的拷贝数)的细胞系或组织的步骤以外，在一些实施例中，这些方法可以进一步包括丢弃与参考相比，测定T的DNA拷贝数没有变化的细胞系或组织的步骤，并且在一些实施例中，可以进一步包括丢弃对于测定G具有拷贝数为零(例如，小于1的拷贝数)的细胞系或组织的步骤。

如在此所使用的，对于测定(例如，测定G)呈“阳性的”或阳性结果意味着拷贝数大于零，并且对于测定(例如，测定G)呈“阴性的”意味着拷贝数是零或小于一。

又如在此所使用的，“参考”是具有固定的基因拷贝数的基因组。在一些实施例中，该参考可以是“野生型”基因组(例如，不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)

在本发明的具体实施例中，第一和第二探针是荧光探针，并且在一些实施例中，第一和第二探针是Taqman探针。

在本发明的一些实施例中，在相同的混合物中进行qPCR测定，并且在一些实施例中，在不同的混合物中以任何组合进行qPCR测定。

在该植物是玉蜀黍植物的实施例中，核酸酶切割位点是玉蜀黍MIR604转基因插入位点，即与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80％、至少85％、至少90％、至少93％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致性。

在此所述的方法的一些实施例中，核酸酶可以是非工程化核酸酶(例如，处于没有修饰的其“天然”形式或“野生型”形式的核酸酶)。在一些实施例中，核酸酶可以是具有可编程的切割靶特异性的工程化核酸酶。本发明的核酸酶的非限制性实例包括CRISPR gRNA-Cas9核酸酶、锌指核酸酶、工程化大范围核酸酶和/或TAL效应子核酸酶，单独地或以任何组合。

本发明还提供了通过在此所述的方法鉴定和/或富集的细胞系或组织，其中该细胞系或组织源自植物或植物部分。在一些实施例中，该细胞系或组织源自单子叶植物或单子叶植物部分。在一些实施例中，该细胞系或组织源自双子叶植物或植物部分。在一些实施例中，该细胞系或组织源自谷类植物或谷类植物部分。在另外的实施例中，该细胞系或组织源自玉蜀黍植物或玉蜀黍植物部分。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。

在此进一步提供了通过在此所述的方法鉴定和/或富集的细胞系或组织，其中该细胞系或组织源自真核生物体。

在上述富集和鉴定方法的一些实施例中，除了鉴定和/或富集相对于参考具有减少的测定T中的拷贝数和对于测定G是阳性的细胞系或组织的步骤以外，在一些实施例中，这些方法可以进一步包括丢弃与参考相比，测定T的DNA拷贝数没有变化的细胞系或组织的步骤，并且在一些实施例中，可以进一步包括丢弃对于测定G是阴性的细胞系或组织的步骤。

如在此所使用的，对于测定(例如，测定G)呈“阳性的”意指拷贝数大于零，并且对于测定(例如，测定G)呈“阴性的”意指拷贝数等于零。

又如在此所使用的，“参考”是具有固定的基因拷贝数的基因组或其他核酸分子。在一些实施例中，该参考可以是“野生型”基因组(例如，不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)

在该生产的植物是玉蜀黍植物的实施例中，核酸酶切割位点是玉蜀黍MIR604转基因插入位点，即与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80％、至少85％、至少90％、至少93％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致性。

在此进一步提供了一种鉴定细胞和/或富集细胞的方法，该细胞包括引入细胞基因组中的核酸酶切割位点的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合，该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将一种核酸分子引入多个细胞中，该核酸分子包括编码以下核酸酶的异源序列，该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中；b)培养(a)的多个细胞以生产至少一种细胞系或组织；c)从(b)的每种细胞系或组织提取基因组DNA样品；d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2，其中这些测定分别包括以下探针：i)包括一种核苷酸序列的第一探针，该核苷酸序列互补于进行测定1的核酸酶切割位点的核苷酸序列，和ii)包括一种核苷酸序列的第二探针，该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列；e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数；以及f)鉴定和/或富集针对测定1相对于参考具有减少的拷贝数并且对于测定2，具有等于零的拷贝数的细胞系或组织，从而鉴定和/或富集以下细胞，该细胞包括引入到细胞基因组中的核酸酶切割位点的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。

在此所述方法的一些实施例中，该细胞系或组织可以源自植物或植物部分，例如源自组织培养物或发芽种子的植物。在一些实施例中，该植物可以是单子叶植物，并且在一些实施例中，该植物可以是双子叶植物。在一些实施例中，该植物可以是谷类。在具体实施例中，该植物可以是玉蜀黍植物。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。在一些实施例中，通过在此所述的方法鉴定和/或富集的细胞系或组织源自真核生物体。

在上述富集和鉴定方法的一些实施例中，除了鉴定和/或富集相对于参考具有减少的测定1中的拷贝数和对于测定2等于零(例如，少于一个)的拷贝数的细胞系或组织的步骤以外，在一些实施例中，这些方法可以进一步包括丢弃相对于参考的测定1的DNA拷贝数没有变化的细胞系或组织的步骤，并且在一些实施例中，可以进一步包括丢弃对于测定2具有拷贝数大于零(例如，约1的拷贝数、约2的拷贝数、或约3的拷贝数)的细胞系或组织的步骤。

如在此所使用的，对于测定(例如，测定2)呈“阳性的”或阳性结果意指拷贝数大于零(例如，约1的拷贝数、约2的拷贝数、或约3的拷贝数)，并且对于测定(例如，测定2)呈“阴性的”意指拷贝数等于零(例如，小于一)。

又如在此所使用的，“参考”是具有固定的基因拷贝数的基因组或其他核酸分子。在一些实施例中，该参考可以是“野生型”基因组(例如，不具有根据本发明的方法引入其中的本发明的第一和第二核酸分子的细胞基因组)。

在此所述方法的一些实施例中，该组织可以是源自组织培养物或发芽种子的植物。在一些实施例中，该植物可以是单子叶植物，并且在一些实施例中，该植物可以是双子叶植物。在具体实施例中，该植物可以是玉蜀黍植物。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。

在此所述的方法的一些实施例中，核酸酶可以是非工程化核酸酶(例如，处于没有修饰的其“天然”形式或“野生型”形式的核酸酶)。在一些实施例中，核酸酶可以是具有可编程的切割靶特异性的工程化核酸酶。本发明的核酸酶的非限制性实例包括CRISPR gRNA-Cas9核酸酶(例如，包括SEQ ID NO:30的Cas9核酸酶)、锌指核酸酶、工程化大范围核酸酶和/或TAL效应子核酸酶，单独地或以任何组合。

本发明另外提供了用于实施本发明的方法和测定的试剂盒和说明书。在一些实施例中，提供了包括用于实施本发明的方法的组合物、配制品和/或试剂的试剂盒或包装。例如，试剂盒可以包括用于获得细胞或组织的手段，以及用于获得核酸样品的手段。该试剂盒还可以包含用于实施本发明的方法的步骤的试剂。这些试剂可以包括促进本发明的核酸分子的分离和生物化学表征的位点特异性探针和/或引物。该试剂盒可以包含一个或多个单独的容器。

尽管指导性材料(当存在时)通常包括书面或印刷材料，但它们不限于此。本发明涉及能存储这样的说明书并将它们传达至终端用户的任何媒体。这样的媒体包括但不限于电子存储媒体(例如，磁盘、磁带、盒式磁带、芯片)、光学媒体(例如，CD ROM)等。这样的媒体可包括提供这类指导性材料的因特网站地址。

当该试剂盒的组分是以一种或多种液体溶液形式提供时，该液体溶液优选为一种水性溶液，其中无菌水性溶液是特别优选的。然而，该试剂盒的组分可以呈干燥粉末形式提供。当以干燥粉末形式提供试剂或组分时，该粉末可以通过添加适合溶剂来重构。预想的是，该溶剂也可以提供于另一个容器中。例如，其中试剂盒的组分是处于冻干形式，该试剂盒可以任选地包含无菌的和生理学上可接受的重构介质，如水、盐水、缓冲盐水等。

在一些实施例中，试剂盒的这些容器可以包括至少一个小瓶、试管、烧瓶、瓶、注射器或其他容器，可以向其中放入并且适合地等分本发明的组合物/配制品以及任何其他所希望的试剂。

在另外的实施例中，本发明提供了一种生产植物、植物部分或其子代的方法，这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将核酸分子引入植物细胞中，该核酸分子包括编码以下核酸酶的异源核苷酸序列，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在植物细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中；并且b)从(a)的植物细胞再生植物、植物部分或其子代。在另一个实施例中，本发明提供了通过上述方法生产的植物细胞。在另外的实施例中，本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。

在上述方法的一些实施例中，该植物是单子叶植物。在其他实施例中，该植物是双子叶植物。在一些实施例中，该植物是谷类。在另外的实施例中，该植物是玉蜀黍。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。

在上述方法的一些实施例中，该突变包括至少一个核苷酸取代、至少一个核苷酸的缺失，或取代、缺失和/或插入的组合，例如像INDEL。

在上述方法的一些实施例中，该核酸分子是基因枪核酸递送、农杆菌介导的转化或本领域已知的植物转化的任何方法。

在上述方法的一些实施例中，用于定点切割的核酸酶是非工程化核酸酶。在一些实施例中，该核酸酶是具有可编程的切割靶特异性的工程化核酸酶。在一些实施例中，该核酸酶是Cas9。在一些实施例中，该核酸酶是包括SEQ ID NO:30的Cas9。

本发明另外提供了一种生产植物、植物部分或其子代的方法，这些植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的转基因并且缺乏编码以下核酸酶的异源核苷酸序列的整合，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该方法包括：a)将核酸分子引入植物细胞中，该核酸分子包括编码以下核酸酶的异源核苷酸序列，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在植物细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中；并且b)从(a)的植物细胞再生植物、植物部分或其子代。在另一个实施例中，本发明提供了通过上述方法生产的植物细胞。在另外的实施例中，本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。

在上述方法的一些实施例中，该转基因可以包括至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少九个、或十个或更多个表达盒。

在上述方法的一些实施例中，该核酸酶切割位点是或相邻于以下核苷酸序列，该核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少80％、至少85％、至少90％、至少93％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％一致性。

在上述方法的一些实施例中，第一核酸分子和第二核酸分子同时被引入，例如通过共转化、基因枪核酸递送或农杆菌介导的转化。在一些实施例中，第一核酸分子和第二核酸分子是分开的分子。在一些实施例中，单个核酸分子或构建体包括上述第一核酸分子和第二核酸分子。

本发明另外提供了用于修饰植物细胞基因组中的靶位点的方法，该方法包括：a)向植物细胞中引入第一核酸和第二核酸分子，该第一核酸包括至少100个连续核苷酸并且进一步包括转基因，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；并且b)该第二核酸分子编码以下核酸酶，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。在另一个实施例中，本发明提供了通过上述方法生产的植物细胞。在另外的实施例中，本发明提供了从通过上述方法生产的植物细胞再生或衍生的植物或植物部分。

在上述方法的一些实施例中，该植物是单子叶植物。在其他实施例中，该植物是双子叶植物。在一些实施例中，该植物是谷类。在另外的实施例中，该植物是玉蜀黍。在一些实施例中，该玉蜀黍是转基因的。在另外的实施例中，该转基因玉蜀黍是事件MIR604。本发明的植物的其他非限制性实例包括水稻、甘蔗、大麦、甜菜、马铃薯、烟草、大豆、番茄、小麦和向日葵。

在上述方法的一些实施例中，靶位点的修饰包括至少一个核苷酸取代、至少一个核苷酸的缺失，或取代、缺失和/或插入的组合，例如像INDEL。在其他实施例中，靶位点的修饰是插入，如转基因插入。

本发明另外提供了将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点中的方法，该方法包括将以下各项引入事件MIR604玉蜀黍细胞：a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90％一致性，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQID NO:139；和b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90％一致性的核苷酸序列的相邻的基因组核酸酶切割位点处用于定点切割，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138、和SEQ ID NO:139，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此转基因整合在玉蜀黍基因组中的基因组核酸酶靶切割位点。

本发明进一步提供了一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过以上段落所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。本发明进一步提供了通过上述方法生产的、包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因的玉蜀黍植物、植物部分或其子代。

现在将参考以下实例描述本发明。应了解，这些实例并不旨在将权利要求书的范围限于本发明，而是旨在成为某些实施例的示例。可以由熟练的技术人员想到的示例性方法的任何变体都旨在落入本发明的范围内。

实例

实例1.MIR604转基因插入位点周围的区域作为潜在的安全港

使用以下人为定义的标准来鉴定适合于靶向转基因整合和稳定表达的潜在的玉蜀黍基因组安全港区域：(1)包含大多数独特序列的区域，因此它适合于进行由同源重组介导的靶向整合；(2)不是已知功能基因(包括编码miRNA的那些)的一部分的区域；理想地，这些区域应该在任何已知的开放阅读框上游至少2Kb，或者距离基因的3'-非翻译区(3’-UTR)下游1Kb处；因此转基因的整合不会中断任何内源基因序列或影响相邻内源基因的功能；(3)不接近具有高度重复序列的异染色质区域的区域，如可以导致转基因的不稳定表达或插入转基因的潜在沉默的中心粒周围区；(4)不含已知的顺式作用元件如增强子或阻遏物的区域，使得插入时转基因表达模式和水平出乎意料地改变。(5)具有显示良好的转基因表达的经验数据的区域。

在玉蜀黍基因组中使用上述标准鉴定了若干个候选区域，例如在染色体1中在位置38,555,000和38,605,000之间、在位置38,640,000和38,715,000之间、以及在位置38,860,000和39,015,000之间(玉蜀黍B73RefGen_V2)。由于商业转基因事件通常具有良好的转基因表达，因此针对其作为候选安全港的潜力也检查了商业事件的插入位点。然而，几乎它们中的所有都不符合以上标准，除了根虫抗性性状事件MIR604。有趣的是，MIR604中的转基因插入片段恰好位于染色体1在位置39,014,056和39,014,148之间，接近位置39,015,000端。MIR604插入位点侧翼的区域是独特的，因为它是许多检查的区域中唯一符合所有安全港标准的区域。由于MIR604事件已经上市了若干年，所以插入位点周围的区域是作为用于插入额外转基因的安全港的理想候选。然而，之前显示，插入先前生成的转基因基因座的转基因还可以导致表达变异(Day等人，“Transgene integration into the samechromosome location can produce alleles that express at a predictable levelor alleles that are differentially silenced[整合到相同染色体位置的转基因可以生产以可预测水平表达的等位基因或差异性沉默的等位基因]”，Genes and Develop.[基因与发展]14:2869-2880(2000))。验证以下假设是重要的：MIR604插入位点区域对于新转基因等位基因的表达是良好的安全港，这些新转基因等位基因在相同基因座处经由定点转化使用不同的定点核酸酶和递送方法而产生。

实例2.在HiII中MIR604插入位点侧翼的基因组序列的克隆

使用农杆菌介导的A188玉蜀黍未成熟胚的转化，使用甘露糖作为选择，从二元载体pNOV2130产生MIR604转基因事件。包含MIR604转基因的玉蜀黍品种在美国广泛种植。MIR604事件包含玉蜀黍基因组中的pNOV2130 T-DNA的单拷贝插入。美国专利号8,354,519中描述了MIR604插入位点及其侧翼区的序列，以其整体结合在此，并且如SEQ ID NO:1所示。

实例3.对应于来自可转化的优良玉蜀黍品种NP2222的安全港基因座1(MIR604插入位点)序列的染色体序列的克隆

原始MIR604插入位点序列(SEQ ID.NO:1)源自非优良转化品种A188。将转基因直接插入优良转化品种中是理想的。然而，来自优良转化靶品种的序列可能不同于来自A188的序列，并且因此不会被使用A188基因组序列设计的定点核酸酶识别。为了获得对应于优良玉蜀黍转化品种NP2222中的MIR604插入位点侧翼区域的基因组序列(美国专利号9,133,474，通过引用结合在此)，基于A188 MIR604插入位点侧翼序列设计PCR引物，并用于从NP2222扩增对应区域。将扩增的序列测序并组装成重叠群，该重叠群用于组装插入位点周围的Hi-Seq全基因组深度测序读数。最后，获得了对应于A188 MIR604插入位点的名称为AX_MIR604的NP2222基因组序列，并且如SEQ ID NO:2所示。序列比较显示出，在NP2222和A188之间的基因组序列中存在显著差异，包括许多InDel(插入/缺失)和核苷酸取代。

实例4.由可编程的CRISPR-Cas9核酸酶介导的转基因在MIR604插入位点安全港处的靶向插入

实例4.1.引入用于介导靶向插入的CRISPR-Cas9核酸酶

用于替换短段DNA序列(等位基因替换)或插入大DNA片段(转基因插入)的转基因序列的靶向插入可以通过DNA断裂来介导，这些DNA断裂通过CRISPR-Cas9核酸酶经由同源重组而引入(Shan等人，Nature Biotechnology[自然生物技术]31:686-688(2013)；Wang等人，Cell[细胞]153:910-918(2013)，Yang等人，Cell[细胞]154:1370-1379(2013)；Puchta和Fauser，Plant Journal[植物杂志]78:727-741(2014)；Chen和Gao，Plant Cell Rep.[植物细胞报告]33:575-583(2014))。在这个实例中，CRISPR-Cas9核酸酶用于介导大DNA分子插入玉米植物中所希望的染色体安全港靶标。选择NP2222玉米品系中的MIR604事件插入位点作为用于研究Cas9/gRNA介导的转基因插入的试验性转基因表达安全港。

实例4.2.候选安全港(MIR604)靶序列选择

通过使用两条链中的5'-G/A-(N)_18-20-NGG-3’规则，针对潜在Cas9切割位点扫描在MIR604插入位点处及其周围的假定的安全港区域，使得5'-NGG-3’序列基序之前的靶模板序列A(N)_18-20和G(N)_18-20可以分别方便地置于DNA PolIII启动子(如水稻prOsU3和prOsU6)的控制下。许多序列可以被鉴定为在MIR604插入位点周围的潜在Cas9-gRNA切割靶标。例如，针对Cas9介导的切割鉴定了以下潜在靶序列：5'-AGTGC AGTGC AGTGC AGGAC AGG-3’(SEQ ID.NO:3)、5'-ACTAA TCGTG CTTCA CGCAC AGG-3’(SEQ ID.NO:4)、5'-AGGCA CAGCACGTAG TAGAC AGG-3’(SEQ ID.NO:5)、5'-ACATG TCGAT CCGAC GACGA CGG-3'(SEQ ID.NO:6)、5'-AGTTT TATTA TAATC CGAA ACGG-3’(SEQ ID.NO:7)、5'-AATCC GAAAC GGAGC ACGCACGG-3'(SEQ ID.NO:8)、5'-AAACG GAGCA CGCAC GGCGG TGG-3’(SEQ ID.NO:9)、5'-GGAGCACGCA CGGCG GTGG AGG-3'(SEQ ID.NO:10)、5'-ATCCA AAGCT ACATC CGTGC AGG-3'(SEQID.NO:11)、5'-GTGCA GTGCA GTGCA GTGC AGG-3’(SEQ ID.NO:12)、5'-GGACA GGACC TCCTTTGTTT AGG-3'(SEQ ID.NO:13)、5'-GCGTG CGCAG AGCGC CTGCT CGG-3'(SEQ ID.NO:14)、5'-GCGTC ATCCA TGTGT TC TGG-3’(SEQ ID.NO:15)、5'-GTCCA TCTCC ATTCA CTGGT TCGG-3’(SEQ ID.NO:16)、5'-AATGC CTGCA GAAGA GGCCG TGG-3’(SEQ ID.NO:17)。类似地，还鉴定了来自另一条链的靶序列，例如：5'-GCGGC CGGCA CGTTG CTAAC CAGG-3'(SEQID.NO:18)、5'-AGAGA AGAAA AATTC GTCCA TGG-3’(SEQ ID.NO:19)、5'-GGCCT CTTCTGCAGG CATT TGG-3’(SEQ ID.NO:20)、5'-AAGGA ACCCG AACCA GTGAA TGG-3’(SEQ ID.NO:21)、5'-ATCGG TCCTAA ACAAA GG AGG-3’(SEQ ID.NO:22)、5'-GGATG CAGCT TTGGC AACGAGG-3’(SEQ ID.NO:23)、5'-GTCGC GCAGC GCTCC TGCA CGG-3’(SEQ ID.NO:24)、5'-GCTCCTGCAC GGATG TAGCT T TGG-3’(SEQ ID.NO:25)、5'-GGATG TAGCT TTGGA TTGC TGG-3’(SEQID.NO:26)、5'-AAATA AAAAA ATCGG ATTAA AGG-3’(SEQ ID.NO:27)。

选择以上列出的序列之一，5'-AGTGC AGTGC AGTGC AGGAC AGG-3'(SEQ ID NO:3)(其位于非常接近MIR604插入位点)，作为用于测试Cas9-gRNA介导的转基因插入的靶序列。使用Cas9识别PAM基序(5’-NGG-3’)之前的序列(20bp)，5'-AGTGC AGTGC AGTGC AGGAC-3'(SEQ ID NO:28，又称为xMIR604FR2)，使用下面实例中的水稻PolIII启动子prOsU3来构建sgRNA表达载体。

实例4.3.CRISPR-Cas9和引导RNA设计以及表达载体

实例4.3.1.用于在玉蜀黍细胞中表达的Cas9的优化

为了在玉蜀黍细胞中实现良好的表达，用玉蜀黍优选密码子来优化来自酿脓链球菌SF370的II型Cas9基因(cBCas9Nu-01，SEQ ID NO:29)。核定位信号也被并入Cas9的C-末端以改进其对核的靶向(Cas9Nuc，SEQ ID NO:30)。为了在玉蜀黍细胞中表达经修饰的Cas9蛋白(Cas9Nuc)，将玉蜀黍优化的Cas9基因(cBCas9Nu-01，SEQ ID NO:29)置于玉蜀黍泛素-1启动子(prUbi1-10)随后是终止子序列(tNOS)的控制下。

实例4.3.2.用于介导MIR604插入位点安全港修饰的引导RNA(gRNA)：gRNA设计及其表达

对于安全港#1(MIR604插入位点)靶序列(5'-AGTGC AGTGC AGTGC AGGAC AGG-3'，SEQ ID NO:3)的靶向切割，针对5'-NGG-3’之前的玉蜀黍基因组靶序列(5'-AGTGC AGTGCAGTGC AGGAC-3'，SEQ ID NO:28)设计了至少17个核苷酸(nt)长的crRNA用于Cas9介导的靶识别。例如，17-nt(5'-GC AGTGC AGTGC AGGAC-3'，SEQ ID NO:31)、18-nt(5'-TGC AGTGCAGTGC AGGAC-3'，SEQ ID NO:32)、19-nt(5'-GTGC AGTGC AGTGC AGGAC-3'，SEQ ID NO:33)、20-nt(5'-AGTGC AGTGC AGTGC AGGAC-3’，SEQ ID NO:28)或21-nt(5'-C AGTGC AGTGCAGTGC AGGAC-3’，SEQ ID NO:34)的crRNA可用于引导安全港#1(MIR604插入位点)的Cas9切割。靶标crRNA与tracRNA和Cas9蛋白或mRNA共同递送以介导靶位点切割。优选地，将该crRNA分子与tracRNA分子共价融合成单个引导RNA(sgRNA)。sgRNA可以经化学合成或通过体外转录而生产。体外生产的sgRNA可直接用于物理递送，如用Cas9 RNA或蛋白质进行基因枪轰击来介导靶向切割和同源定向靶向修饰(如果修复供体寡核苷酸被共同递送的话)。更优选地，在植物中由包括RNA聚合酶III(PolIII)启动子(例如水稻U3或U6启动子(prOsU3和prOsU6))的DNA表达盒生产sgRNA。对于prOsU3，转录起始位点以核苷酸A开始，而对于prOsU6，转录起始位点以核苷酸G开始(Shan等人，(2013)Nature Biotechnology[自然生物技术]31:686-688；Xie和Yang，(2013)Molecular Plant[分子植物]6:1975-1983)。例如，为了生产靶向安全港#1(MIR604插入位点)序列(5'-AGTGC AGTGC AGTGC AGGAC AGG-3'，SEQID NO:3)的sgRNA，将19-nt DNA寡核苷酸(5'-GTGC AGTGC AGTGC AGGAC-3'，SEQ ID NO:33)或20-nt寡核苷酸(5'-AGTGC AGTGC AGTGC AGGAC-3’，SEQ ID NO:28)与编码tracRNA支架的DNA序列和PolIII终止序列(5'-GTTTT AGAGC TAGAA ATAGC AAGTT AAAAT AAGGCTAGTC CGTTA TCAAC TTGAA AAAGT GGCAC CGAGT CGGTG CTTTT TTTTT-3’，SEQ ID NO:35)融合(Mali等人(2013)Science[科学]339:823-826)以形成命名为rBsgRNA-01的单个引导RNA(sgRNA)的编码序列(Seq.ID.NO:36)，该编码序列被置于水稻聚合酶III启动子U3(prOsU3)或U6(prOsU6)的控制下。对于该实例，表达盒包括prOsU3和sgRNA rBsgRNA-01的编码序列，该sgRNA rBsgRNA-01包括与tracRNA(SEQ ID NO:37)融合的20-nt xMIR604FR2(SEQ ID NO:28)靶RNA。将包括prOsU3启动子和rBsgRNA-01sgRNA的表达盒与Cas9表达盒一起克隆到基因枪转化载体中。该基因枪转化载体被称为22169。

实例4.4.在MIR604插入位点安全港处生成靶向插入事件

实例4.4.1.经由同源重组构建用于靶向插入的供体载体

通过插入2个昆虫控制基因(eCry3.1Ab和mCry3A)和两个同源臂(xJHAX-03，SEQID NO:38和xJHAX-04，SEQ ID NO:39)之间的PMI选择性标记基因的表达盒构建了基因靶向供体载体(称为21942)。从5’端，该供体核酸序列包括可操作地连接到eCry3.1Ab表达盒的xJHAX-03，该eCry3.1Ab表达盒可操作地连接到mCry3A表达盒，该mCry3A表达盒可操作地连接到cPMI表达盒，该cPMI表达盒可操作地连接到xJHAX-04(图2)。这两个同源臂(xJHAX-03和xJHAX-04)具有与安全港#1(MIR604插入位点)序列(SEQ ID NO:2)的一部分一致的序列，并且用于引导使用同源重组将供体序列靶向插入到靶基因座处的Cas9切割位点(图2)。

实例4.4.2.在基因枪轰击下，在MIR604插入位点安全港处生成靶向插入事件

对于由同源定向修复介导的靶基因序列修饰，供体DNA分子需要与Cas9和sgRNA共同递送。为了在安全港基因座#1处产生携带靶向插入事件的潜在事件，将携带Cas9Nuc和sgRNA的表达盒的载体(22169)的质粒DNA与包括供体核酸序列的载体21942的片段进行混合(图2)，该供体核酸序列包括实例4.4.1中描述的表达盒和同源臂。然后将DNA(具有供体核酸序列的Cas9Nuc和sgRNA载体)沉淀在金粒子上并用于轰击未成熟的玉蜀黍胚(品系NP2222)。先前已经描述了用于玉蜀黍未成熟胚轰击的方法、愈伤组织诱导组织再生和生根方法(Wright等人，Plant Cell Reports[植物细胞报告]20:429-436(2001))。简言之，在授粉后约9-11天从收获的未成熟穗分离未成熟胚，并在渗透培养基上预培养1至3天。然后使用BioRad PDS-1000基因枪粒子递送系统，用上述DNA轰击预培养的胚。然后将轰击的胚在愈伤组织诱导培养基中孵育，并且然后移至甘露糖选择培养基上。将甘露糖抗性愈伤组织转移到再生培养基中以诱导芽形成。然后将芽进行继代培养到生根培养基上。然后从生根植物收获用于Taqman测定的样品以检测靶位点中的突变以富集潜在的靶向插入事件(在此所述)，并进行连接PCR以鉴定包含靶向插入的潜在植物(图2和图3)。通过更详细的PCR、测序和Southern分析来进一步表征鉴定的假定靶向插入事件用于进行确认(图5)。表1显示了导致靶向插入事件MZET134300A679A恢复的实验(MZET134300)。在该实验中，超过80％的对供体核酸表达盒呈阳性的转基因事件(473个事件中的384个)在靶位点序列xMIR604FR2(SEQ ID NO:28)处包含修饰。在一亚组事件上进行PCR反应，并通过在两个同源臂处双交换同源重组鉴定出一个清楚的靶向插入事件。另外的DNA测序和DNA印迹分析证实，该事件是清楚的靶向插入事件，意味着该事件包括实例4.4.1中描述的供体核酸序列的单拷贝(特别地，eCry3.1Ab、mCry3A和PMI表达盒是无骨架的)，显示出双交换同源重组事件的证据，并且不具有包括核酸酶的载体DNA的整合。该实例显示出，MIR604插入位点是靶向插入的良好靶位点。

表1.在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2(SEQ ID NO:28)处具有sgRNA-Cas9核酸酶的玉米中的靶向实验

为了确定sgRNA-Cas9介导的基因组修饰的效率，我们使用如在后续实例中所述的高通量Taqman测定来测定表1中所述的所有473个转基因植物中的突变的存在。由于通过共同递送修复供体和Cas9核酸酶构建体来进行转化，所以我们预期在不包含Cas9Nuc表达载体的转基因植物中看到供体核酸序列。实际上，在对于供体核酸序列的473个PMI阳性植物中，分别地，其中301个(63.6％)具有共同整合的Cas9核酸酶表达载体，并且其中172个(36.4％)不具有共同整合的Cas9核酸酶表达载体(表2)。不具有共同整合的Cas9Nuc核酸酶表达载体(22169)的83株植物(17.5％)在玉蜀黍基因组的一个等位基因(7株植物)或两个等位基因(76株植物)中具有经修饰的其靶位点(xMIR604FR2，SEQ ID NO:28)(表2)。

此外，我们测定了再生植物中突变的存在，这些再生植物逃避了甘露糖选择过程或逃避了不包含供体核酸序列表达盒的转录逃逸。如所预期的，在471个逃逸中，只有2株植物对于Cas9Nuc核酸酶表达载体是阳性的，并且这两株植物都在基因组靶标中具有双等位基因突变(表2)。令人惊讶的是，对任何转基因(供体核酸序列表达盒或Cas9Nuc表达载体)呈阴性的高百分比的逃逸植物(23.9％，469株植物中的112株)在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2(SEQ ID NO:28)处具有突变。这112个事件中的37个具有双等位基因突变，即玉蜀黍基因组中的xMIR604FR2序列(SEQ ID NO:28)的两个拷贝都突变了。剩余的75个事件在该序列的拷贝之一中具有突变。这个惊人的结果表明，Cas9核酸酶和sgRNA在玉蜀黍细胞中的瞬时表达足以在染色体靶标上产生突变。同时，选择是任选的以获得突变体植物。如果筛选出足够数量的再生植物，则可以通过瞬时递送和植物细胞中Cas9Nuc蛋白和一个或多个gRNA的表达来容易地鉴定靶向突变体。

表2.在安全港基因座#1(MIR604插入位点)靶序列xMIR604FR2

(SEQ ID NO:28)处具有gRNA-Cas9介导的靶向诱变的再生植物中不同类型事件的分解

¹转化频率为13.1％

²逃逸频率为13.0％

实例4.4.3.在农杆菌介导的转化下，在MIR604插入位点安全港处生成靶向插入事件

还可以用DNA供体和经由农杆菌递送的Cas9核酸酶和sgRNA的表达载体来产生转基因到安全港基因座的靶向插入。农杆菌介导的转化方法已在其他地方描述(Ishida等人，Nat.Biotechnol.[自然生物技术]14:745-750(1996))。简言之，构建用于递送供体DNA以及Cas9和sgRNA的表达盒的二元载体。供体DNA可以引入到与Cas9和sgRNA的表达盒相同的二元载体中，或者可以引入到同一个二元载体中的单独的T-DNA中，或者可以引入到单独的二元载体中，所述单独的二元载体可以转化到同一个农杆菌菌株或单独的农杆菌菌株中并通过共转化一起递送。为了构建用于农杆菌介导的Cas9和sgRNA的递送的二元载体，将包含Cas9和sgRNA表达盒的DNA片段插入二元载体骨架中以形成pB-Cas9-U3-xMIR604FR2。

类似地，通过将包含同源臂(xJHAX-03和xJHAX-04)、eCry3.1Ab表达盒、mCry3A表达盒和PMI标记物表达盒的核酸片段插入二元载体中来构建二元供体载体。通过电穿孔将两种二元载体都引入包含辅助质粒的农杆菌菌株LBA4404中。将包含这些二元载体的农杆菌菌株混合，并且然后用于共感染玉蜀黍未成熟胚。将感染的胚与农杆菌细胞共培养2-4天，并且然后用于诱导愈伤组织。用包含甘露糖的培养基选择愈伤组织，并使用类似于Negrotto等人，Plant Cell Rep.[植物细胞报告]19:798-803(2000)的方法将甘露糖抗性愈伤组织再生成小植株。样品取自生根小植株用于qPCR Taqman测定以富集如在后续实例中所述的潜在靶向插入事件，并且然后进行连接PCR分析以鉴定如图2和图3所示的靶向插入事件。通过Southern分析和PCR产物测序进一步详细表征了鉴定的假定靶向插入事件。

实例5.由TALE核酸酶(TALEN)介导的转基因序列到MIR604插入位点安全港中的靶向插入

实例5.1.针对AX-MIR604序列，选择TALEN识别靶标

从AX_MIR604(SEQ ID NO:2)选择靶序列用于TALEN设计。表3列出了所选序列、其名称和鉴别物编号。

表3.基于NP2222基因组序列(SEQ ID NO:2)所选择的TALEN靶序列

实例5.2.针对所选择的MIR604插入位点安全港序列，设计TALEN融合核酸酶

针对表3中的靶序列设计DNA结合特异性的TALEN。作为一个例子，这里是两对异二聚体TALEN的设计，以切割靶序列MIR604AXA2(又称为MIR604FR1，SEQ ID NO:66，5'-TACACGTACT AATCG TGCTT CACGC ACAGG CACAG CACGT AGTAG ACAGG A-3’)和MIR604AXA7(又称为MIR604FR2，SEQ ID NO:67，5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCCTTTGT TTAGG A-3’)。单独组装了识别MIR604AXA2序列中2个靶标，MIR604A2FW1(又称为mir604Fw1，5'-TACAC GTACT AATCG TGCT-3'，SEQ ID NO:42)和MIR604A2RV1(又称为mir604Rv1，5'-TCCTG TCTAC TACGT GCT-3’，SEQ ID NO:43)，的单个TALENT单体。对于针对MIR604A2FW1(又称为mir604Fw1，5'-TACAC GTACT AATCG TGCT-3’，SEQ ID NO:42)的TALEN，在RVD(重复可变双残基)重复内确定双残基的特异性如下，

对于针对MIR604A2RV1(又称为mir604Rv1，5'-TCCTG TCTAC TACGT GCT-3’，SEQID NO:43)的TALEN，在DVR重复内确定双残基的特异性如下，

我们构建了包含识别mir604Fw1(SEQ ID NO:42)的RVD的每个TALEN的三个版本：第一全长版本(cTNmir604Fw1-01，SEQ ID NO:68)，其在RVD重复区之后保持大部分TAL效应子蛋白序列，如N-末端T3SS和NLS；第二较短的版本(cTNmir604Fw1-02，SEQ ID NO:69)，其已经去除N-末端T3SS；以及第三短版本(cTNmir604Fw1-03，SEQ ID NO:70)，其在RVD重复区之后，在N-末端T3SS中具有缺失，并且在NLS中也具有缺失。类似地，我们构建了包含识别mir604Rv1(SEQ ID NO:43)的RVD的每个TALEN的三个版本：第一全长版本(cTNmir604Rv1-01，SEQ ID NO:71)，其在RVD重复区之后保持大部分TAL效应子蛋白序列，如N-末端T3SS和NLS；第二较短的版本(cTNmir604Rv1-02，SEQ ID NO:72)，其已经去除N-末端T3SS；以及第三短版本(cTNmir604Rv1-03，SEQ ID NO:73)，其在DVR重复区之后，在N-末端T3SS中具有缺失，并且在NLS中也具有缺失。这些工程化核酸酶的氨基酸序列示于SEQ ID NO:68(cTNmir604Fw1-01)、SEQ ID NO:69(cTNmir604Fw1-02)、SEQ ID NO:70(cTNmir604Fw1-03)、SEQ ID NO:71(cTNmir604Rv1-01)、SEQ ID NO:72(cTNmir604Rv1-02)和SEQ ID NO:73(cTNmir604Rv1-03)中。

又单独组装了识别MIR604AXA7(又称为mir604FR2，SEQ ID.NO:67)序列中另外2个靶序列，MIR604A7FW1(又称为mir604Fw2,5'-TGCAT CCGTG CAGTG CAGT-3'，SEQ ID.NO:53)和MIR604A7RV1(又称为mir604Rv2，5'-TCCTA AACAA AGGAG GT-3’，SEQ ID NO:54)，的单个TALENT单体。对于针对MIR604A7FW1(又称为mir604Fw2，5'-TGCAT CCGTG CAGTG CAGT-3’，SEQ ID NO:53)的TALEN，在RVD重复内确定双残基的特异性如下，

对于针对MIR604A7RV1(又称为mir604Rv2，5'-TCCTA AACAA AGGAG GT-3’，SEQ IDNO:54)的TALEN，在DVR重复内确定双残基的特异性如下，

我们构建了包含识别mir604Fw2(SEQ ID NO:53)的RVD的每个TALEN的三个版本：第一全长版本(cTNmir604Fw2-01，SEQ ID NO.74)，其在RVD重复区之后保持大部分TAL效应子蛋白序列，如N-末端T3SS和NLS；第二较短的版本(cTNmir604Fw2-02，SEQ ID NO.75)，其已经去除N-末端T3SS；以及第三短版本(cTNmir604Fw2-03，SEQ ID NO.76)，其在RVD重复区之后，在N-末端T3SS中具有缺失，并且在NLS中也具有缺失。类似地，我们构建了包含识别MIR604Rv2(SEQ ID NO:50)的RVD的每个TALEN的三个版本：第一全长版本(cTNmir604Rv2-01，SEQ ID NO.77)，其在RVD重复区之后保持大部分TAL效应子蛋白序列，如N-末端T3SS和NLS；第二较短的版本(cTNmir604Rv2-02，SEQ ID NO.78)，其已经去除N-末端T3SS；以及第三短版本(cTNmir604Rv2-03，SEQ ID NO.79)，其在RVD重复区之后，在N-末端T3SS中具有缺失，并且在NLS中也具有缺失。

对于MIR604AXA7(又称为mir604FR2，SEQ ID NO:67)序列切割，组装另一对具有略微不同氨基酸序列和识别特异性的TALEN：分别是包含识别mir604Fw2(SEQ ID NO:53)的RVD的cTNmir604Fw2-05(SEQ ID NO.80)和包含识别MIR604Rv2-LT(SEQ ID NO:65，5'-TCCTA AACAA AGGAG GTCC-3’)的RVD的cTNmir604Rv2-04(SEQ ID NO.81)。这些工程化核酸酶的氨基酸序列是在SEQ ID NO.74(cTNmir604Fw2-01)、SEQ ID NO.75(cTNmir604Fw2-02)、SEQ ID NO.76(cTNmir604Fw2-03)、SEQ ID NO.77(cTNmir604Rv2-01)、SEQ ID NO.78(cTNmir604Rv2-02)、SEQ ID NO.79(cTNmir604Rv2-03)、SEQ ID NO.80(cTNmir604Fw2-05)和SEQ ID NO.81(cTNmir604Rv2-04)中。

实例5.3.组装针对AX-MIR604插入基因座序列的TALEN

使用植物优选密码子，将人工TALE融合核酸酶蛋白序列(SEQ ID NO:68至SEQ IDNO:81)回译成DNA编码序列，以使玉米和其他单子叶植物中的表达最大化。这里显示了一些实例。例如，SEQ ID NO:82是cTNmir604Fw1-01蛋白质序列(SEQ ID NO:68)的DNA编码序列，并且SEQ ID NO:84是cTNmir604Rv1-01蛋白质序列(SEQ ID NO:71)的DNA编码序列。然后，从包含不同RVD重复、启动子和终止子的片段文库组装人工融合核酸酶DNA序列，以在如所述IIs型酶消化和连接之后直接形成TALEN表达盒(Cermak等人，Nucleic Acid Research[核酸研究]39(12):e82(2011)；Zhang等人，Nature Biotech[自然生物技术]29:149-154(2011))。例如，组装的报道基因构建体MIRA2R1FLA-GUUS包含在玉蜀黍泛素启动子(prZmUbi1-10)的控制下编码cTNmir604Rv1-01(SEQ ID NO:71)的组装的TALEN序列TLNMIR604A2RV1(SEQ ID NO:84)，并且还具有包含GUS片段的同向重复和18bp TALEN识别序列MIR604A2RV1(又称为mir604Rv1，5'-TCCTG TCTAC TACGT GCT-3’，SEQ ID NO:43)的反向重复的非功能性GUS重组测定底物盒。类似地，以类似的方式组装包含其他组装的TALEN的表达构建体。在许多情况下，将识别和切割靶序列MIR604AXA2(又称为MIR604FR1，5'-TACACGTACT AATCG TGCT T CACGC ACAGG CAC AG CACGT AGTAG ACAGG A-3’，SEQ ID NO:66，只显示上链)的一对TALEN，例如cTNmir604Fw1-01(SEQ ID NO:68)和cTNmir604Rv1-01(SEQ ID NO:71)的表达盒置于同一个转化载体中，以便协调它们在转化期间在靶组织中的同时表达。

实例5.4.针对AX_MIR604 DNA序列的TALEN活性的瞬时测定

将包含在玉蜀黍泛素启动子(prZmUbi1-10)的控制下编码cTNmir604Rv1-01(SEQID NO:71)的组装的TALEN序列(SEQ ID NO:84)和非功能性GUS重组测定底物盒的组装构建体MIRA2R1FLA-GUUS轰击到未成熟玉蜀黍胚中。GUS片段的同向重复还包含cTNmir604Rv1-01TALEN识别序列mir604Rv1(5'-TCCTG TCTAC TACGT GCT-3’，SEQ ID.NO:43)的反向重复。类似地，包含编码cTNmir604Fw1-01、cTNmir604Fw1-02、cTNmir604Fw1-03、cTNmir604Rv1-02、cTNmir604Rv1-03或其对应对的DNA序列的表达构建体与其一个或多个靶底物一起被轰击到玉蜀黍胚中。在许多情况下，将识别和切割靶序列的一对TALEN，例如针对MIR604AXA2(又称为mir604FR1，SEQ ID NO:66)的cTNmir604Fw1-01和cTNmir604Rv1-01，的表达盒置于同一个转化载体中，以便协调它们在靶组织中的同时表达。在轰击后1至4天，将转化的玉蜀黍胚置于X-Gluc溶液中过夜来经组织化学检测GUS活性。GUS活性仅在GUUS重复进行分子内重组时可见。识别MIR604FR1(SEQ ID NO:66)靶标的一对TALEN(cTNmir604Fw1-01和cTNmir604Rv1-01)的共表达大大增加了蓝斑数量(图4，处理FR1)，这表明该靶序列被这对异二聚体TALEN切割来增加同源重组的频率。

实例5.5.由人工TALEN以高频率切割包含靶识别位点的玉蜀黍染色体基因座

为了测试由在玉蜀黍细胞中表达的TALEN对染色体靶序列mir604FR2(SEQ ID NO:67)的切割，使用两对不同的TALEN。第一对TALEN处于单个表达载体(21321)中，该单个表达载体(21321)包括编码用于表达cTNmir604Fw2-03和cTNmir604Rv2-03的核酸序列，并且第二对TALEN处于单个表达载体(21998)中，该单个表达载体(21998)包括编码用于表达cTNmir604Fw2-05和cTNmir604Rv2-04的核酸序列。将表达载体(21321和21998)各自与实例4.4.1中所述的供体载体21942一起通过基因枪转化共同递送到玉蜀黍胚中。在甘露糖上选择转化的胚以回收稳定的转基因植物。使用qPCR Taqman测定和/或PCR产物测序，针对靶向区域中突变的存在来分析稳定的转基因植物。表4中的结果显示，对于靶位点MIR604FR2(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGG A-3’，SEQ IDNO:67)的两对TALEN当TALEN表达载体用基因枪方法递送到植物细胞中时均导致稳定转化体中高百分比的突变。全长和截短版本的TALEN都可以有效地介导靶基因座处的靶向诱变。

有趣的是，我们还在许多再生的甘露糖选择逃逸植物中检测到MIR604插入位点基因座mir604FR2靶位点(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGG A-3’，SEQ ID NO:67)的突变。例如，在使用载体TALEN载体21321和供体21942的共转化实验中(表4)，生成的植物中的14个，即MZET130501B017A、MZET130501B038A、MZET130501B027A、MZET130501B031A、MZET130501A012A、MZET130501B041A、MZET130501B096A、MZET130402A030A、MZET130501B044A、MZET130501B057A、MZET130501B084A、MZET130501B130A、MZET130501B045A、MZET130704C003A，在mir604FR2靶序列中包含突变，但是它们不携带来自供体或TALEN表达载体的任何可检测的转基因，并且因此逃避了甘露糖选择。在这些逃逸植物中，它们中的约5％在mir604FR2靶位点中具有突变，并且它们中的一些具有突变的mir604FR2靶序列的两个等位基因。因此，通过瞬时递送TALEN并且然后不经选择而直接再生未转化的植物来回收在靶位点中具有突变的植物，是一种可行的方法。可以通过用适当的测定(如PCR)筛选再生体的种群来鉴定突变体植物。

为了测试由农杆菌递送的、在玉蜀黍细胞中表达的TALEN对染色体靶基因座的切割，构建了包含不同成对的TALEN的表达盒的4种不同的二元载体(21631、21632、21633和21634)。这全部四个二元载体包括供体核酸序列，该供体核酸序列包括eCry3.1Ab、mCry3A和PMI的表达盒。21631和21633另外包括编码用于表cTNmir604Fw1-01和cTNmir604Rv1-01的核酸序列；21632和21634另外包括编码用于表cTNmir604Fw2-01和cTNmir604Rv2-01的核酸序列。21631和21632一个T-DNA中具有TALEN表达盒和靶向供体的基因，而21633和21634在两个单独的T-DNA中具有这些。预期21631和21633中的一对TALEN的表达将导致玉蜀黍基因组中染色体靶序列MIR604AXA2(又称为MIR604FR1，5'-TACAC GTACT AATCG TGCTT CACGCACAGG CACAG CACGT AGTAG ACAGG A-3’，SEQ ID NO:66)的切割。类似地，21632和21634中的一对TALEN的表达应该导致玉蜀黍基因组中染色体靶序列MIR604AXA7(又称为MIR604FR2，5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGACCTCC TTTGT TTAGG A-3’，SEQ ID NO:67)的切割。这些载体通过农杆菌介导的转化方法转化到玉蜀黍胚中。使用Taqman测定和/或PCR产物测序，针对靶向区域中突变的存在来分析稳定的转基因植物。表4中的结果显示，对于靶位点MIR604FR1(SEQ ID NO:66)和MIR604FR2(SEQ ID NO:67)的两对TALEN当经由农杆菌介导的转化而递送时均导致稳定转化体中的高百分比的突变(表4)。

表4.在源自TALEN表达载体和包含PMI选择性标记基因的供体载体的共转化的稳定转化体中，在天然染色体MIR604插入位点基因座处的mir604FR1(SEQ ID NO:66)和mir604FR2(SEQ ID NO:67)

靶序列的高比率诱变

实例5.6.由组装的TALEN介导的转基因序列到对应于MIR604插入位点的NP2222染色体基因座的靶向插入

使用粒子轰击，将培养的玉蜀黍良种近交品系NP2222的未成熟胚与靶向供体载体21942和TALEN表达载体21321或21998共转化(表4和表5)。靶向供体载体21942包含在MIR604插入位点处的TALEN切割位点(SEQ ID NO:67)侧翼的同源区域(xJHAX-03和xJHAX-04)为侧翼的性状基因表达盒。表5显示了在MIR604FR2切割位点(SEQ ID NO:67)处潜在靶向插入的分析结果。在519个PMI阳性稳定事件中获得了以下四个事件，这四个事件显示如对于双链同源重组所预期的PCR产物(表5)。其中，将单个事件确定为清楚的事件，这意味着它包括实例4.4.1中描述的供体核酸序列的单拷贝(特别地，eCry3.1Ab、mCry3A和PMI表达盒是无骨架的)，显示出双交换同源重组事件的证据，并且不具有包括核酸酶的载体DNA的整合。

表5.由通过TALEN切割FR2序列介导的mCry3A、eCry3.1Ab和PMI表达盒到天然安全港基因座(天然MIR604插入位点基因座)的靶向插入

在以上实验中，使用粒子轰击培养的未成熟胚来进行转化。然而，未成熟胚或源自培养的胚的愈伤组织也可以用作靶标。还可以使用如表4所示的农杆菌介导的基因递送方法，使用靶组织，如未成熟胚、培养的胚或源自培养的胚的愈伤组织来进行转化。例如，土壤杆菌介导的转化和由TALEN介导的靶向插入至靶位点导致的事件的恢复可以使用如本领域描述的方式中的甘露糖选择(例如，美国专利号7,935,862)来进行，其中，例如，NP2222未成熟胚被用作转化靶标。

实例6.在由工程化的大范围核酸酶介导的安全港(MIR604插入位点)处的转基因的靶向插入

实例6.1.用于设计工程化的大范围核酸酶的玉蜀黍染色体靶序列选择

用于替换短段DNA序列(等位基因替换)或插入大DNA片段(转基因插入)的转基因序列的靶向插入还可以通过使用由工程化大范围核酸酶引入的DNA断裂的同源重组来介导(Puchta和Fauser，Plant Journal[植物杂志]78:727-741(2014)；Chen和Gao，Plant CellRep.[植物细胞报告]33:575-583(2014))。本实例显示，由工程化大范围核酸酶诱导的断裂是否可以用于介导将大DNA分子插入到玉米植物中所希望的染色体安全港靶标中。为了比较其对TALEN和CRISPR-Cas9的有效性，选择安全港基因座#1(MIR604事件插入位点)作为转基因插入位点。因此，虽然不受方法限制，但本申请教导了由3种核酸酶平台，即TALEN、大范围核酸酶和sgRNA-Cas9介导的转基因插入。针对最优靶标对玉蜀黍安全港基因座#1(又称为MIR604事件插入位点)序列(SEQ ID NO:1或SEQ ID NO:2)进行扫描用于使用本领域技术设计工程化大范围核酸酶，例如通过使用合理的蛋白质设计方法来设计具有改变的切割特异性的、基于LAGLIDADG家族大范围核酸酶I-CreI的工程化大范围核酸酶(美国专利号8,021,867)。选择合理设计的工程化I-CreI大范围核酸酶变体来介导转基因在安全港基因座的靶向插入，这些核酸酶变体以高效率和最小脱靶切割来切割靶序列。将编码新颖的大范围核酸酶变体的DNA序列置于玉蜀黍泛素-1启动子(prUbi1-10)随后是NOS终止子的控制下，并将表达盒亚克隆到基因枪转化载体骨架中。

为了测试工程化I-CreI大范围核酸酶变体在切割玉蜀黍染色体靶序列中的植物中活性及其通过同源重组介导靶向插入的能力，将大范围核酸酶表达载体与靶向供体载体21942共同轰击到未成熟玉蜀黍胚中。简言之，将携带工程化大范围核酸酶的表达盒的质粒DNA载体与编码供体核酸序列的载体21942的片段混合并沉淀到金粒子上。载体21942的供体核酸序列包含来自xJHAX-03至xJHAX-04的区域，这些区域包括如实例4.4.1所述的PMI标记基因和两个基因盒。在授粉后约9-11天从收获的未成熟穗分离未成熟胚，并在渗透培养基上预培养1至3天。然后使用BioRad PDS-1000基因枪粒子递送系统，用共沉淀的DNA载体(21942片段和大范围核酸酶表达质粒)用金粒子轰击预培养的胚。用于玉蜀黍未成熟胚轰击的方法、愈伤组织诱导组织再生和生根方法是本领域已知的(例如，Wright等人，2001，Plant Cell Reports[植物细胞报告]20:429-436(2001))。然后将轰击的胚在愈伤组织诱导培养基中孵育，并且然后移至甘露糖选择培养基上。将甘露糖抗性愈伤组织转移到再生培养基中以诱导芽形成。然后将芽进行继代培养到生根培养基上。然后从生根植物收获样品用于PCR和Taqman测定以鉴定包含靶向插入的潜在植物。通过更详细的PCR、测序和Southern分析来进一步表征鉴定的假定靶向插入事件用于确认。除了稳定转化的事件之外，我们还测定了在逃避甘露糖选择的再生植物中突变的存在，即不包含来自靶向插入供体或大范围核酸酶载体的任何转基因的转化逃逸。鉴定了如下逃逸植物，这些逃逸植物对于任何转基因为阴性，但在安全港基因座#1(MIR604插入位点)靶序列处具有突变。玉蜀黍细胞中大范围核酸酶的瞬时表达足以产生染色体靶标处的突变。同时，选择是任选的以获得突变体植物。如果筛选出足够数量的再生植物，则可以通过瞬时递送和植物细胞中大范围核酸酶的表达来容易地鉴定靶向突变体。

实例6.2.由工程化的大范围核酸酶介导的在MIR604插入位点安全港基因座处的靶向插入事件的产生

供体载体21942的两个同源臂，即xJHAX-03(SEQ ID NO:38)和xJHAX-04(SEQ IDNO:39)具有与安全港#1(MIR604插入位点SEQ ID NO:1和SEQ ID NO:2)一致的序列，并且用于引导使用同源重组将供体载体序列靶向插入到靶向基因座处的工程化大范围核酸酶的切割位点。还可以在基于Taqman分析的可能进行靶向插入的事件的一个亚组中进行PCR反应。通过详细的DNA测序和DNA印迹分析来分析使用跨越重组连接的PCR引物对在靶基因座处经鉴定具有靶向插入的事件，以证实靶向插入已经发生。

实例6.3.在农杆菌介导的转化下，由工程化的大范围核酸酶介导的在安全港基因座#1(MIR604插入位点)处靶向插入事件的生成

还可以用DNA供体和经由农杆菌递送的大范围核酸酶的表达载体来产生转基因到安全港基因座的靶向插入。农杆菌介导的转化方法是本领域熟知的(例如，Ishida等人，Nat.Biotechnol.[自然生物技术]14:745-750(1996))。大范围核酸酶表达盒和供体DNA可以置于单独的二元载体中或同一个二元载体中，并且然后在植物细胞中共转化。供体DNA和大范围核酸酶可以通过使用单独的二元载体共同递送。通过将来自载体21942的供体核酸序列(即，可操作地连接到xJHAX-03(SEQ ID NO:38)和xJHAX-04(SEQ ID NO:39)的三个表达盒，如实例4.4.1所述的)插入到用于农杆菌介导的转化的二元载体中来构建二元载体22445。还构建了一种二元载体，用于共同递送来自单个二元载体的供体核酸序列和大范围核酸酶表达盒，其中该供体核酸序列和大范围核酸酶表达盒各自可操作地连接到右边界序列和左边界序列，使得它们在单个二元载体中包括两个单独的T-DNA。经由电穿孔将这些二元载体转化到农杆菌菌株LBA4404(pVGW7)中，并且然后用于玉蜀黍未成熟胚的转化。对于农杆菌介导的转化，将包括包含2个T-DNA的二元载体的农杆菌菌株用于感染玉蜀黍未成熟胚。可替代地，将包含两个二元载体的农杆菌菌株混合，并且然后用于共感染玉蜀黍未成熟胚。将感染的胚与农杆菌细胞共培养2-4天，并且然后用于诱导愈伤组织。用包含甘露糖的培养基选择愈伤组织，并将甘露糖抗性愈伤组织再生成小植株。样品取自生根小植株用于Taqman和PCR分析，用于鉴定如上所述的用于基因枪转化的靶向插入事件。还可以在基于Taqman分析的可能具有靶向插入的事件的一个亚组中进行PCR反应。通过详细的DNA测序和DNA印迹分析来分析使用跨越重组连接的PCR引物对在靶基因座处经鉴定具有靶向插入的事件，以证实靶向插入已经发生。

实例7.转基因序列到基因组AX_MIR604基因座的靶向插入的分子表征

通过更详细的测序和DNA印迹分析来进一步表征通过PCR测定而鉴定的靶向插入事件，用于进行确认。例如，从筛选PMI阳性稳定事件(如表1和表5所示)获得如在一个或两个同源臂处发生的同源重组所预期的对于连接PCR呈阳性的事件(图2和图3)。使用包括AX_MIR604(SEQ ID NO:2)侧翼基因组区域(xJHAX-03和xJHAX-04)和部分转化供体载体的跨越靶向插入接点的引物进行详细重叠PCR分析。阳性PCR信号的存在表明，定点核酸酶确实介导靶向插入到MIR604FR2的DNA切割位点(5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGACAGGA CCTCC TTTGT TTAGGA-3’，SEQ ID NO:67)处的MIR604安全港基因座(SEQ ID NO:2)中。详细的DNA印迹分析显示，如通过预期大小的存在所示，通过双交换同源重组，确实在MIR604插入位点安全港靶基因座处发生了基因叠加的插入(图5，泳道4、5、6和8)。泳道4、5、6和8具有约28Kb的带，如对于具有约18Kb的染色体靶片段的供体载体的双重组产物所预期的。来自泳道7(图5)中同一实验的另一个事件具有可能来自单个交叉重组的插入拷贝，并且具有额外的重排，因为重组带的大小远大于约28Kb的预期大小。

实例8.通过靶向插入技术获得的转基因事件的基因表达和昆虫抗性

通过qPCR和ELISA测定，针对转基因表达来评估靶向插入事件(MZET130403A067A、MZET134406B450A、MZET134504B010A、MZET134505A104A、MZET134711A236A、MZET140508A344A、MZET140807A856A、MZET140913A741A、MZET140913A594A、MZET130403A067A、MZET131500A128A)。作为对照，还针对性状基因表达来测定源自供体载体(21942或22445)的随机整合事件。还将表达水平与具有基因渗入的MIR604基因座的玉蜀黍品系(AX5707DW)进行比较。由于插入的转基因包含西方玉米根虫抗性基因mCry3Aa和eCry3.1Ab，因此通过在玉米根虫感染的盆中栽种它们来关于昆虫抗性的表现评估转基因事件及其子代。

实例9.用于鉴定在所希望的序列处具有靶向突变的植物的高通量测定

目前，使用以下方法之一鉴定靶向突变体。第一种方法是对靶区域进行PCR扩增，然后如果突变序列包含限制性位点，则进行限制性酶消化和凝胶电泳(Lloyd等人，2005，美国国家科学院院刊102:2232-37(2005)；Zhang等人，美国国家科学院院刊107:12028-33(2010))。该方法简单，但需要存在适合的限制性位点，并且因此不能用于大多数靶标。第二种方法是靶区域进行PCR扩增，然后进行桑格测序或深度测序(Gross等人，Hum.Genet.[人类遗传学]105:72-78(1999)；Shukla等人，Nature[自然]459:437-41(2009)；Townsend等人，Nature[自然]459:442-45(2009))。测序方法是确定的和敏感的，但需要更长的时间，并且通量可以受到容量的限制。第三种方法是对靶区域进行PCR扩增，然后进行变性、退火和毛细管电泳(Li-Sucholeik等人，Electrophoresis[电泳]20:1224-1232(1999)；Larsen等人，Hum.Mutat.[人类突变]13:318-327(1999))或变性高效液相色谱以通过异源双链分析来检测碱基对变化(McCallum等人，Nature Biotechnology[自然生物技术]18:455-457)。这些方法受到通量的限制，并且鉴定的突变需要通过测序进一步验证。第四种方法是对靶区域进行PCR扩增，然后进行变性、异源双链体形成/链退火、用错配特异性核酸酶(如CEL1和T7内切核酸酶)消化和凝胶电泳(Oleykowski等人，Nucleic Acids Res.[核酸研究]26:597-4602(1998)；Colbert等人，Plant Physiol.[植物生理学]126:480-484(2001)；Lombardo等人，Nat.Biotechnol.[自然生物技术]25:1298-306(2007))，例如使用可商购的Surveyer^TM核酸酶测定试剂盒(转基因组学公司(Transgenomic)，盖瑟斯堡(Gaithersburg)，马里兰州，美国；Qiu等人，BioTechniques[生物技术]36:702-707(2004))。然而，基于凝胶的测定不如高通量DNA测序那么敏感，并且只能检测1％或更高频率的突变。因此，仍然需要用于鉴定靶序列的诱导突变的简单且高通量的方法。另外，鉴定靶位点中潜在突变体的所有以上方法都是基于处于定性形式的新信号、凝胶中的新带或不同于野生型参考序列的色谱图中的新峰的存在。

我们开发了一种用于鉴定潜在突变的替代方法。该方法测量了与如图6所示的参考样品相比较，已经以定量形式用定点核酸酶处理的细胞或组织中野生型靶位点序列的减少。在从野生型(WT)组织分离的DNA样品中，靶序列DNA拷贝数没有减少。典型地，针对二倍体生物体中单拷贝基因，WT组织中的拷贝数得分记录是2个拷贝。例如，WT玉蜀黍中的ADH基因有2个拷贝。如果拷贝中的一个突变，则只剩下野生型(WT)靶位点序列的一个拷贝。如果靶序列的两个拷贝突变，则M靶序列的拷贝数变为零(图6)。因此，通过进行定量聚合酶反应测定来测量靶序列拷贝数的变化，可以通过将结果与参考样品(如WT组织)的结果进行比较来检测DNA样品中是否存在突变。这种定量方法与先前已知的方法显著不同。

可以通过若干种定量聚合酶反应(qPCR)技术来测定靶基因拷贝数。通常，qPCR以这样的方式进行，使得随着反应进行，或以“实时”方式定量检测并测量扩增的DNA。因此，qPCR也称为实时PCR。有若干种潜在的方法在qPCR中用于实时检测产物：(1)用任何双链DNA插入的非特异性荧光染料(如

绿)测量PCR产物；当正在研究单个扩增子时，该检测方法是合适的，因为该染料将插入到所生成的任何双链DNA中。(2)基于寡核苷酸探针的靶序列特异性结合的PCR产物的测量，这些寡核苷酸探针用荧光报道基因标签共价标记，如在

探针、分子Beacons^TM、或Scorpion引物中的。寡核苷酸本身没有显著的荧光，但是它当退火到模板时(如在分子Beacons^TM中)或当延伸期间染料被从寡核苷酸剪除时(如在

探针中)而发荧光。荧光探针的优势是它们可以在用于检测相同反应中的若干种靶序列的多重测定中使用。用

探针，靶序列特异性寡核苷酸探针被构建成一端有荧光报道基因并且相反端有荧光淬灭剂。报道基因与淬灭剂的紧密靠近阻止其荧光的检测。荧光寡核苷酸探针被Taq聚合酶的5'-至3'-外切核酸酶活性分解，因此荧光标签不再与淬灭剂接近，并且从而允许荧光的不淬灭发射，这可以在激发后用激光检测到(Groves，JBiomol.Tech.[生物分子技术杂志]10:11-16(1999))。每个PCR循环中PCR产物的拷贝数增加导致由于探针分解和报道基因释放引起的荧光成比例增加。

作为一个例子，我们设计了基于

探针的方法来特异性检测玉蜀黍基因组MIR604插入位点序列处的靶向突变，该MIR604插入位点序列包含靶向SEQ ID NO:3(5'-AGTGC AGTGC AGTGC AGGAC AGG-3')的CRISPR-Cas9核酸酶gRNA的切割位点和切割靶序列(SEQ ID NO:67，5'-TGCAT CCGTG CAGTG CAGTG CAGTG CAGGA CAGGA CCTCC TTTGT TTAGGA-3’)的成对的TALEN(cTNmir604Fw2-01/cTNmir604Rv2-01)。如图7所示，用于检测SEQ IDNO:67靶序列内的突变的实时qPCR Taqman测定由以下组成：两种引物，FW引物，5'-CACACCTCGT TGCCA AAGC-3’(SEQ ID NO:92)和RV引物，5'-CATCG CGTCC TAAAC AAAGG A-3’(SEQID NO:93)，以及荧光标记的

探针(5'-CCTGT CCTGC ACTGC-3'，SEQ ID NO:94)，该探针与核酸酶切割靶位点序列(5'-GCAGT GCAGG ACAGG-3’，SEQ ID NO:95，如图6所示的靶位点M)杂交。

实例10.在所希望的没有转基因插入的序列处，具有靶向突变的植物的产生

使用如以上以及图6和图7中所概述的靶标特异性测定和用于其他靶序列的qPCRTaqman测定，针对不同靶序列的拷贝数对从用如先前实例4和实例5中所述的工程化TALE核酸酶或gRNA-Cas9处理的未成熟胚再生的玉蜀黍植物进行了测定。表6显示以下结果。

包括用于测定4(Mir604 JHAX Fw2/Rv2_MGB)的序列5'-CCTGT CCTGC ACTGC-3'(SEQ ID NO.94)的荧光标记的MGB

探针用于检测对应于图6中的靶序列M的完整核酸酶切割位点序列(5'-GCAGT GCAGG ACAGG-3’，SEQ ID NO:95)的拷贝数。“低”拷贝数得分记录具有1个拷贝。“中”拷贝数得分记录具有2个拷贝。“高”拷贝数得分记录具有3个或更多个拷贝。在没有靶位点突变的WT玉蜀黍植物和再生植物中，使用测定4(表6中最后一列，Mir604 JHAXFw2/Rv2_MGB)的拷贝数得分记录为“中”(2个拷贝)。在这组的20株植物中，11株植物(55％)在基因组靶序列(SEQ ID NO:95，5'-GCAGT GCAGG ACAGG-3’)处没有突变，但6株植物(30％)在这些靶序列的一个拷贝中具有突变(低拷贝得分记录)，并且3株植物(15％)具有突变的两个拷贝的靶序列(拷贝得分记录为0)。由于qPCR测定可以是多重化的，所以同时进行用于检测转基因序列的其他若干种测定。在这组植物中，20株植物中的7株包含可检测的转基因插入(对于测定1至3为阳性)。在具有靶序列突变的9株植物中，它们中的5株(MZET130501B027A、MZET130501B031A、MZET130501B038A、MZET130501B044A和MZET130501B045A)不包含任何可检测的转基因插入，包括具有突变(双等位基因突变或纯合的突变)的两个拷贝的靶序列的1株植物(MZET130501B027A)。该实验清楚地表明，通过瞬时表达定点核酸酶，不需要转基因插入，可以有效地产生所希望的序列处的靶向突变。此外，可以使用高通量实时qPCR测定来有效地鉴定这些突变体，这些高通量实时qPCR测定包含至少一种与核酸酶切割位点杂交的测定探针。

表6.使用qPCR Taqman测定，在来自基因枪转化实验的再生玉蜀黍植物中的靶序列(SEQ ID NO:67)的拷贝数确定

¹测定1(cTNmir604Fw2-03)用于检测定点TALE核酸酶表达载体(21321)的插入

²测定2用于检测存在于供体载体(21942)中的插入的可选择性标记基因cPMI-09

³测定3用于检测存在于供体载体(21942)中的插入的昆虫控制基因mCry3A

⁴测定4(Mir604 JHAX Fw2/Rv2_MGB)用于检测完整靶序列(5'-GCAGT GCAGGACAGG-3’，SEQ ID NO:95)的拷贝数，该完整靶序列与包括序列5'-CCTGT CCTGC ACTGC-3'(SEQ ID NO:94)的Taqman探针杂交

实例11.用于富集在所希望的基因组基因座处具有潜在靶向插入的植物的高通量测定和策略

为了鉴定在MIR604插入位点安全港基因座处包含靶向插入的潜在转基因事件，我们开发了一种富集潜在突变的高通量方法。该方法涉及使用一种测定(图8A中的测定T)来鉴定一种植物，该植物具有减少的靶序列(靶标T)的拷贝数。测定靶标T的荧光探针位于靶基因座区域中距离测定靶标M(图8A)的荧光探针至少5个核苷酸，该测定靶标M检测定点核酸酶切割位点M(也在图6中)的拷贝数。应当注意，测定T探针可以与测定M探针位于同一个扩增子内。然而，它应该尽可能远离M，只要它仍然在由转基因序列的靶向插入替换的区域内(如图8A所示，包含感兴趣的基因的区域(GOI))。由于靶向插入通常替换核酸酶切割位点(M)以外的靶基因座处的某些序列，而通过NHEJ在核酸酶切割位点处最可能被修饰的非靶向事件通常具有较小的靶位点缺失。如果植物在核酸酶切割位点(靶标M)处具有减少的拷贝数，但在靶标区域进一步更远(靶标T)处没有减少的拷贝数得分记录(即野生型)，则该植物很可能仅具有小的缺失并在靶基因座处没有靶向插入(图8A和图8B中的事件类型a、b和c)，并且可以丢弃，而不管靶标M或靶标G拷贝数得分记录。通过查看测定G结果可以进一步富集事件。可以进一步丢弃对GOI(测定G)为阴性的任何植物，即无转基因的图8A中的事件类型d和e。选择剩余的这些植物，即图8B中的具有阳性GOI信号的从d到i的事件类型，作为在靶基因座具有潜在靶向插入的候选植物，并且这些事件进一步通过对于如图2所示的重组连接特异的PCR反应来表征。

实例12.高通量qPCR测定用于富集在基因组安全港基因座MIR604插入位点处具有靶向插入的候选转基因事件的用途

使用靶标特异性测定1(表7，对应于图8中的测定T)、对于来自从用如先前在实例5中所述的工程化TALEN处理的未成熟胚再生的玉蜀黍植物的核酸酶切割位点(表7，对应于图8中的靶标M)和其他转基因序列(表7中的测定3至7，对应于图8中的测定G)的测定2，获得不同靶序列的拷贝数得分记录的结果。

表7显示出获得自共递送TALE核酸酶表达载体21321和供体载体21942的靶向实验的一些代表性的玉蜀黍植物的测定结果。在该实验中，对应于图8的测定T的测定1具有5’-CTCGT TGCCA AAGCT GCATC CGT-3’(SEQ ID NO:97)的Taqman探针序列，该Taqman探针序列位于距离核酸酶切割位点(EQ ID NO:67，5'-TGCAT CCGTG CAGTG CAGTG CAGTG CA/GGACAGGA CCTCC TTTGT TTAGG A-3’，其中“/”表示潜在的切割位置)18个碱基处。不管其他测定结果，都可以丢弃对靶标(测定1)具有“中”拷贝数得分记录的所有植物，因为没有同源重组介导的靶序列(SEQ ID NO:67)的替换。在某些事件(MZET130501A012A和MZET130501B033A)中，测定1具有比测定2更高的拷贝数得分记录，这意味着核酸酶切割位点周围的缺失在靶区域处相对较小。通过使用来自其他测定(测定3至测定7)的结果，可以通过丢弃不具有感兴趣基因(GOI)的植物来获得进一步富集。如果需要高质量的靶向插入事件，则可以丢弃对于核酸酶表达载体(测定6)和/或载体骨架(测定7)为阳性并且具有多于一个拷贝的供体载体(测定3至5)的任何植物。通过使用这种富集方法，仅来自靶向插入实验的总转基因植物的一个亚组会需要通过其他测定(如连接PCR(图2和图3)和DNA印迹分析(图5))进一步被分析，以鉴定真正靶向插入事件。例如，通过遵循以上富集方法从靶向插入实验MZET131500A中的一组334株植物来鉴定事件MZET131500A118A和MZET131500A128A(图5)。

表7.转基因事件的Taqman测定和使用qPCR Taqman测定，使用测定结果来富集源自基因枪转化实验的再生玉蜀黍植物的潜在靶向插入事件。

实例13.在MIR604转基因基因座处靶向基因叠加和转基因序列的替换

实例13.1.玉蜀黍商业事件MIR604的T-DNA插入序列

玉蜀黍事件MIR604包含玉蜀黍基因组中的pNOV2130 T-DNA的单拷贝插入。克隆T-DNA插入片段及其侧翼基因组序列并示于图9中。PMI标记基因序列(cPMI-01，Seq.IDNo.98)存在于位于紧邻侧翼玉蜀黍基因组区域MIR604LBFS1的转基因T-DNA插入片段中。

实例13.2.在MIR604事件转基因基因座中TALEN靶位点序列的选择

为了将另外的性状基因盒叠加到MIR604转基因基因座上，我们将努力集中在转基因的独特区域。该PMI基因(cPMI-01，SEQ ID No.98)是所希望的靶标，因为它是选择性标记基因，并且在完成转基因植物产生后不再需要。可以使用新的选择性标记基因盒来替换PMI盒，使用MIR604_RBFS1或mCry3A基因表达盒以及MIR604_LBFS1作为同源区域。我们已经在PMI基因中选择了3个靶序列(Seq.ID No.99至101)来设计和组装TALEN，用于证明基因插入到MIR604转基因基因座中的可行性。PMI_靶_序列#1包含以下序列，5’-TTAAC TCAGT GCAAAACTAT GCCTG GGGCA GCAAA ACGGC GTTGA CTGAA-3’(SEQ ID No.99)；PMI_靶_序列#2具有以下序列，5’-TCTCC ATTCA GGTTC ATCCA AACAA ACACA ATTCT GAAAT CGGTT TTGCC AAA-3’(SEQ ID No.100)；并且PMI_靶_序列#3包含以下序列，5’-TGCAC ATCCG GCGAT TGCTCACTTT TTACA ACAGC CTGAT GCCGA ACGTT TAA-3’(SEQ ID No.101)。

实例13.3.针对PMI基因序列，设计和组装TALEN融合核酸酶基因

设计TALEN用于在序列靶标#1和#3(SEQ ID No.99和101)处靶向切割PMI转基因。例如，针对TsPMIFW1(5’-TTA ACT CAG TGC AAA ACT-3’，SEQ ID No.102)和TsPMIRV1(5’-TTC ACT CAA CGC CGT TTT-3’，SEQ ID No.103)设计了一对用于切割PMI靶序列#1(SEQ IDNo.99)的TALEN。设计TALEN分子TLN_PMIFW1a(SEQ ID No.108)以结合TsPMIFW1序列靶标(5’-TTA ACT CAG TGC AAA ACT-3’，SEQ ID No.102)，并且设计TALEN分子TLN_PMIRV1a(5’-TTC AGT CAA CGC CGT TTT-3’，SEQ ID No.109)以识别TsPMIRV1序列靶标(SEQ IDNo.103)。类似地，针对TsPMIFW3(5’-TGC ACA TCC GGC GAT TGC T-3’，SEQ ID No.106)和TsPMIRV3(5’-TTA AAC GTT CGG CAT CAG-3’，SEQ ID No.107)设计另一对TALEN用于切割PMI靶序列#3(SEQ ID No.101)。设计TALEN分子TLN_PMIFW3(SEQ ID No.110)以结合TsPMIFW3序列(5’-TGC ACA TCC GGC GAT TGC T-3’，SEQ ID No.106)，并且设计TALEN分子TLN_PMIRV3(SEQ ID No.111)以结合TsPMIRV3序列(5’-TTA AAC GTT CGG CAT CAG-3’，SEQID No.107)。将设计的TALEN蛋白质TLN_PMIFW1a(SEQ ID No.108)、TLN_PMIRV1a(SEQ IDNo.109)、TLN_PMIFW3(SEQ ID No.110)和TLN_PMIRV3(SEQ ID No.111)的蛋白质编码序列回译成DNA序列。如先前实例中所述的组装编码这些TALEN的DNA分子。TALEN基因DNA序列cTNPMIFW1a(SEQ ID No.112)、cTNPMIRV1a(SEQ ID No.113)、cTNPMIFW3-02(SEQ IDNo.114)和cTNPMIRV3-02(SEQ ID No.115)分别编码TLN_PMIFW1a(SEQ ID No.108)、TLN_PMIRV1a(SEQ ID No.109)、TLN_PMIFW3(SEQ ID No.110)和TLN_PMIRV3(SEQ ID No.111)。

实例13.4.TALEN表达载体和靶向供体载体构建

将DNA序列cTNPMIFW3-02(SEQ ID No.114)和cTNPMIRV3-02(SEQ ID No.115)引入表达盒中，每个由组成型启动子驱动。然后将两个TALEN基因表达盒引入二元载体骨架中以形成二元载体22840。供体载体22842包括供体核酸序列，该供体核酸序列包括两个同源序列(xMIR604-01和xMIR604-02)之间的杀虫基因表达盒和草甘膦耐受基因盒。该草甘膦耐受性基因盒包括基因ZmEPSPS，其存在可用于鉴定供体核酸序列的成功插入。这两个同源序列(xMIR604-01和xMIR604-02)与TALEN靶序列侧翼的序列，即PMI_靶_序列#3(SEQ IDNo.101)一致。经由同源重组将来自载体22872的供体序列靶向插入到由TALEN切割介导的MIR604转基因基因座中，这示于图10中。

实例13.5.将另外的性状基因叠加到商业事件(MIR604)的转基因基因座中并使不需要的转基因失活

广泛培养玉米MIR604事件用于控制西方玉米根虫(WCR)(Que等人，2010，GMCrops.[转基因作物]1,220-229)。MIR604转基因包含用于产生转基因事件的PMI选择性标记基因(图9)。PMI基因不提供任何农艺益处，并且在事件产生后不再需要。然而，它可以用作将其他性状基因盒插入MIR604基因座的着陆点(landing pad)。为了证明这种效用，将MIR604转基因基因座渗入优良玉米转化品系(NP2222)中以形成新的转基因受体品系NP2222DW。将品系NP2222DW用作经由同源重组通过定点核酸酶介导的插入到PMI基因中产生靶向插入事件的转化宿主。将源自自交或同胞杂交的NP2222DW植物的未成熟胚与包含二元载体22840(包括TALEN表达盒)或22872(包括供体核酸序列，其包括两个表达盒)的重组缺失(recA-minus)的农杆菌菌株LBA4404(携带辅助质粒pVGW7)进行共同感染。产生来自感染的未成熟胚的转基因事件是如所述的，除了将草甘膦用作选择(Negrotto等人(2000)，Plant Cell Rep.[植物细胞报告]19,798-803)。在2mM的草甘膦上选择源自感染的未成熟胚的愈伤组织。使植物在包含0.2mM草甘膦的培养基上再生。对草甘膦选择的植物进行取样，用Taqman测定来确定转基因拷贝数和靶位点切割。

针对用跨越重组连接的引物的靶向整合，通过PCR进一步分析具有靶序列切割的植物(图10)。例如，为了扩增涉及xMIR604-02的重组连接，使用了引物对(P1/P2)，FE4796(SEQ ID NO:127)/FE4793(SEQ ID NO:128)，并且如果重组发生，该反应将产生2.13Kb的PCR产物。还将另外的引物对，具有2.5kb的产物的FE35036(SEQ ID NO:129’)/FE35037(SEQID NO:130)用于鉴定涉及xMIR604-02的同源区的潜在靶向重组体。为了扩增涉及xMIR604-01的重组连接，使用了一对引物(P3/P4)，FE35034(SEQ ID NO:131)/FE35035(SEQ ID NO:132)，并且如果存在同源重组，预期PCR反应产生2Kb的产物。表8示出了使用草甘膦选择恢复了靶向事件(“ZmEPSPS阳性事件”)的靶向插入的若干实验。这些实验表明，包含另外的性状基因的DNA序列可以通过TALEN介导的同源重组有效插入到现有的商业事件MIR604基因座中。应该指出，包括工程化大范围核酸酶、锌指核酸酶或CRISPR-Cas9的其他定点核酸酶可以用于取代在以上提到的载体22840中的TALEN，用于切割PMI基因序列以介导靶向插入。类似地，包括基因枪粒子轰击、晶须介导的转化、电穿孔和PEG介导的原生质体转化的其他基因递送方法可以用于引入定点核酸酶表达载体和供体DNA分子。

表8.由从通过农杆菌感染递送的载体22840表达的TALEN介导的供体载体22872中同源序列为侧翼的表达盒到MIR604

转基因基因座中的靶向插入

^*基于如通过qPCR Taqman测定而确定的靶序列(cPMI-01)拷贝数得分记录。^**如通过用跨越重组连接的引物进行的PCR反应所鉴定的(图10)

实例13.6.通过替换PMI基因盒或整个转基因将另外的性状基因叠加到MIR604转基因基因座中

携带MIR604转基因的基因组区域是性状基因表达的优选位置。除了将另外的转基因插入到PMI基因中之外，整个MIR604转基因基因座可以通过替换部分转基因序列或整个T-DNA插入片段来用作插入其他性状基因盒的着陆点。类似于靶向插入到以上PMI基因(实例13.5)中，将品系NP2222DW用作经由同源重组通过定点核酸酶介导的插入到MIR604基因座中产生靶向插入事件的转化宿主。为了仅替换PMI盒，将mCry3A基因和LBFS区域用作供体载体中的同源序列(图11)。相同的TALEN表达载体(22840)可以与包含杀虫(IC)表达盒和选择性标记(如PMI、ZmEPSPS或PAT)表达盒的供体一起递送到NP2222DW玉蜀黍细胞中(图11)。此外，可以将一种或多种定点核酸酶用于在PMI盒序列中引入染色体断裂。例如，两种或更多种单个引导RNA(sgRNA)可以与Cas9蛋白结合用于切割PMI盒序列同时去除整个PMI表达盒(图11)。将未成熟胚置于愈伤组织诱导培养基上，并且然后在包含双丙氨磷的培养基上选择愈伤组织。来自感染的未成熟胚的转基因事件的产生是例如如以上对于甘露糖或草甘膦所述的，其中双丙氨磷还可以用作选择剂。针对用Taqman测定的转基因拷贝数和靶位点切割，对所选植物进行取样。针对用跨越重组连接的引物的靶向整合，通过PCR进一步分析具有靶序列切割的植物(图11)。

为了替换整个MIR604 T-DNA插入片段，将RBFS和LBFS都插入到供体分子中以作为同源序列来介导新颖性状基因盒(例如杀虫(IC)基因表达盒1、2和作为经由同源重组的第三个盒的选择性标记(例如，PAT)表达盒)的插入(图12)。将从自交或同胞杂交的NP2222DW穗分离的未成熟胚与包含二元载体22840以及包括IC表达盒1、2和PAT表达盒的供体DNA载体的重组缺失(recA-minus)的农杆菌菌株LBA4404(携带辅助质粒pVGW7)进行共同感染。类似地，可以同时使用多于一个的定点核酸酶来切割多于一个的MIR604转基因序列。例如，两个或更多个单个引导RNA(sgRNA)可以与Cas9蛋白结合用于切割MIR604转基因内的T-DNA序列(例如，LB-和RB-近端序列和/或PMI和mCry3A盒)，同时去除MIR604 T-DNA插入片段的至少一个表达盒(图12)。将感染的未成熟胚置于愈伤组织诱导培养基上，并且然后在包含双丙氨磷的培养基上选择愈伤组织。来自感染的未成熟胚的转基因事件的产生是例如如以上对于甘露糖或草甘膦所述的，其中双丙氨磷还可以用作选择剂。针对用Taqman测定的转基因拷贝数和靶位点切割，对所选植物进行取样。针对用跨越重组连接的引物的靶向整合，通过PCR进一步分析具有靶序列切割的植物(图12)。对于本领域技术人员来说显而易见的是，包括基因枪粒子轰击、晶须介导的转化、电穿孔和PEG介导的原生质体转化的其他基因递送方法可以用于引入定点核酸酶表达载体和供体DNA分子。

实例14.靶向基因叠加和包含非功能性选择性标记基因的转基因基因座的替换

实例14.1.设计和组装在包含非功能性选择性标记基因的转基因基因座中用于制造染色体断裂的TALEN

本领域已知，通过使用农杆菌介导的转化并利用由天然大范围核酸酶I-CeuI的表达产生的dsDNA断裂，可将转基因序列插入到包含截短的非功能性选择性标记基因PMI的转基因玉蜀黍和水稻基因座中(美国专利号7,935,862，通过引用结合在此)。然而，由天然大范围核酸酶介导的靶向插入受到以下事实的限制：先前工程化的核酸酶切割位点必须首先插入到转基因基因座中。在这里，我们想测试是否可以针对现有转基因基因座内的随机选择的序列设计新颖的设计定点核酸酶(如TALEN)，以介导另外的转基因序列的靶向插入，以克服这个限制。为了实现这一点，针对pNOV5025转基因事件的转基因基因座内的随机选择的靶序列(5’-ATAGA GATCC TCTAG AGTCG ACCAT GGTGA TCACT GCAGG CATGC AAGCT TGT-3’，SEQ ID.No.116，仅显示上链)设计了两对TALEN。选择该段DNA内的两个序列作为TALEN结合位点，5’-ATAGA GATCC TCTAG AGT-3’(又称为rPMIFw1，SEQ ID No.117，仅显示上链)和5’-ACAAG CTTGC ATGCC TGC-3’(又称为rPMIRv1，SEQ ID No.118，仅显示下链)。一对TALEN由针对靶序列rPMIFw1 5’-ATAGA GATCC TCTAG AGT-3’(SEQ ID NO:117)设计的一个全长TALEN(cTNrPMIFw1-01，SEQ ID No.119)和针对靶序列rPMIRv1 5’-ACAAG CTTGCATGCC TGC-3’(SED ID No.118)设计的另一全长TALEN(cTNrPMIRv1-01，SEQ ID No.120)组成。第二对TALEN由针对靶序列rPMIFw1，5’-ATAGA GATCC TCTAG AGT-3’(SEQ.ID.No.117)设计的一个截短的TALEN(cTNrPMIFw1-02，SEQ ID NO:121)和针对靶序列rPMIRv1，5’-ACAAG CTTGC ATGCC TGC-3’(SEQ ID No.118)设计的另一个截短的TALEN(cTNrPMIRv1-02，SEQ ID NO:122)组成。

实例14.2.对于截短的PMI靶基因座序列的TALEN的表达和转化载体

然后，从包含不同RVD重复、启动子和终止子的片段文库组装人工融合核酸酶DNA序列，以在如所述IIs型酶消化和连接之后直接形成TALEN表达盒(Cermak等人，2011，Nucleic Acid Research[核酸研究]39(12):e82；Zhang等人，2011，Nature Biotech[自然生物技术]29:149-154)。制备了针对截短的PMI靶序列的TALEN的若干个表达载体(21438、21792和21793)。载体21438包括TALEN cTNrPMIFw1-01和cTNrPMIRv1-01的表达盒。载体21792包括TALEN cTNrPMIRv1-01和cTNrPMIFw1-01的表达盒。载体21793包括TALENcTNrPMIRv1-02和cTNrPMIFw1-02的表达盒。最初，将现有的靶向供体载体pNOV5045(美国专利号7,935,862)用于测试靶向插入。之后，还构建了另外的靶向供体载体21779和22173并用于靶向插入实验(表9)。供体载体pNOV5025、21779和22713包含用于恢复PMI功能的PMI内含子盒的互补5’-区域以及还有其他感兴趣序列和同源区域。在通过TALEN切割染色体靶序列时，可以经由同源重组将供体载体序列整合到靶位点。

实例14.3.由TALEN介导的转基因到包含非功能性截短的PMI基因的转基因基因座中的靶向插入

使用PPO作为选择性标记，使用如所述的在玉蜀黍品系NP2222中的农杆菌介导的转化，从靶向载体pNOV5025(描述于美国专利号7,935,862中)产生选择性转基因基因座。为了测试TALEN介导的靶向插入到这些pNOV5025基因座中的作用，将供体载体(pNOV5045、21779或22173)与TALEN表达载体(21438、21792或21793)共同递送到未成熟的玉蜀黍胚组织中。在基因递送和组织回收之后，将转化的靶组织置于包含甘露糖选择剂的培养基上以回收具有靶向插入的事件，即具有如所述的重组功能性PMI基因的细胞(美国专利号7,935,862)。通过同源重组的靶向插入事件应该对甘露糖有抗性。为了区分真正的靶向事件与选择逃逸，首先通过使用跨越靶向插入接点的引物的PCR来分析来自假定的甘露糖抗性事件的组织(愈伤组织或叶)。阳性PCR信号的存在表明TALEN介导的到pNOV5025转基因基因座中的靶向插入。通过DNA印迹分析方法进一步分析阳性事件，以证实这些事件具有如所述的真正的靶向插入(美国专利号7,935,862)。表9显示了若干个靶向插入实验的结果。结果表明，通过使用不同的TALEN表达载体和靶向供体，以有用的频率重构选择性标记基因，可以将有用的性状基因可重复地插入到预定的转基因基因座中。全长和截短版本的TALEN都可以介导转基因基因座处的靶向插入。

表9.用由TALEN表达介导的不同供体载体进行pNOV5025转基因靶基因座的靶向插入实验

虽然为了清楚理解的目的已经通过说明和举例的方式在一定详细程度上描述了以上发明，显然的是在本发明的范围内可以进行某些改变和变更。

本发明的一些实施方案如下：

1.一种将转基因整合到玉蜀黍基因组中的基因组核酸酶切割位点的方法，该方法包括将以下各项引入玉蜀黍细胞中：

a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90％一致性，该组包括：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66和SEQ ID NO:67；以及

b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割，该组包括：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:28、SEQ ID NO:66和SEQ ID NO:67，

该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此转基因被整合到玉蜀黍基因组中的基因组核酸酶靶切割位点处。

2.如实施方案1所述的方法，其中该基因组核酸酶切割位点位于染色体1上的染色体区间内，该染色体区间由以下定义并且包括以下：如由玉蜀黍B73 RefGen_V2定义的碱基对(bp)位置38,860,000至碱基对(bp)位置39,015,000。

3.如实施方案1-2中任一项所述的方法，其中该第一核酸分子和该第二核酸分子通过基因枪核酸递送被引入到玉蜀黍细胞中。

4.如实施方案1-2中任一项所述的方法，其中该第一核酸分子和该第二核酸分子经由农杆菌被引入到玉蜀黍细胞中。

5.如实施方案1-2中任一项所述的方法，其中该第一核酸分子和该第二核酸分子存在于单个核酸构建体上。

6.如实施方案1-2中任一项所述的方法，其中该第一核酸分子和该第二核酸分子存在于单独的核酸构建体上。

7.如实施方案1-6中任一项所述的方法，其中该第一核酸分子和/或该第二核酸分子在玉蜀黍细胞中瞬时表达。

8.一种生产玉蜀黍植物或植物部分或其子代的方法，该玉蜀黍植物或植物部分或其子代包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过如实施方案1所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。

9.一种通过如实施方案8所述的方法生产的玉蜀黍植物或植物部分或其子代，该玉蜀黍植物或植物部分或其子代包括整合到玉蜀黍基因组中的基因组核酸酶切割位点中的转基因。

10.一种富集细胞的方法，该细胞包括插入到细胞基因组中的核酸酶切割位点中的转基因，该方法包括：

a)将以下各项引入多个细胞中：

i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；和

ii)编码以下核酸酶的第二核酸分子，该核酸酶在与对应于(i)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，

该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且将转基因整合到细胞基因组中的核酸酶切割位点中的条件下进行；

b)培养(a)的细胞以生产至少一种细胞系或组织；

c)从(b)的每种细胞系或组织中提取基因组DNA样品；

d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定T和G，其中这些测定T和G分别包括以下探针：

i)包括以下核苷酸序列的第一探针，该核苷酸序列互补于靶位点的核苷酸序列，距离用于进行测定T的核酸酶切割位点至少五个碱基对，和

ii)包括以下核苷酸序列的第二探针，该核苷酸序列互补于用于进行测定G的转基因的核苷酸序列；

e)从测定T的结果获得靶位点的DNA拷贝数并且从测定G的结果获得转基因的DNA拷贝数；并且

f)富集在测定T中相对于参考具有减少的拷贝数并且对于测定G，具有大于零的拷贝数的细胞系或组织，

从而富集包括插入到细胞基因组中的核酸酶切割位点中的转基因的该细胞。

11.如实施方案10所述的方法，该方法进一步包括以下步骤：将与参考相比，测定T的DNA拷贝数没有变化的细胞系或组织丢弃。

12.如实施方案10所述的方法，该方法进一步包括以下步骤：将对于测定G具有零拷贝数的细胞系或组织丢弃。

13.一种鉴定细胞的方法，该细胞包括插入到细胞基因组中的核酸酶切割位点中的转基因，该方法包括：

a)将以下各项引入多个细胞中：

i)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；和

ii)编码以下核酸酶的第二核酸分子，该核酸酶在与对应于(i)的至少100个连续核苷酸的基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，

b)培养(a)的细胞以生产至少一种细胞系或组织；

c)从(b)的每种细胞系或组织中提取基因组DNA样品；

f)鉴定在测定T中相对于参考具有减少的拷贝数并且对于测定G，具有大于零的拷贝数的细胞系或组织，

从而鉴定包括插入到细胞基因组中的核酸酶切割位点中的转基因的该细胞。

14.如实施方案13所述的方法，该方法进一步包括以下步骤：将与参考相比，测定T的DNA拷贝数没有变化的细胞系或组织丢弃。

15.如实施方案13所述的方法，该方法进一步包括以下步骤：将对于测定G具有零拷贝数的细胞系或组织丢弃。

16.如实施方案10-15中任一项所述的方法，其中在相同的混合物中进行这些测定。

17.如实施方案10-16中任一项所述的方法，其中该细胞系或组织源自植物或植物部分。

18.如实施方案17所述的方法，其中该植物是玉蜀黍植物。

19.如实施方案18所述的方法，其中该核酸酶切割位点是核苷酸序列内的玉蜀黍MIR604转基因插入位点，其中所述核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少90％一致性。

20.如实施方案10-19中任一项所述的方法，其中该核酸酶是具有可编程切割靶特异性的工程化核酸酶。

21.如实施方案20所述的方法，其中该核酸酶是包括SEQ ID NO:30的Cas9核酸酶。

22.一种通过如实施方案10-12中任一项所述的方法富集的或通过如实施方案13-21中任一项所述的方法鉴定的细胞系或组织，其中该细胞系或组织来自植物。

23.一种源自如实施方案22所述的细胞系或组织的植物或植物部分或其子代。

24.一种富集细胞的方法，该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合，该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列，该方法包括：

a)将核酸分子引入多个细胞中，该核酸分子包括编码以下核酸酶的异源序列，该核酸酶用于在细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到细胞基因组中；

b)培养(a)的多个细胞以生产至少一种细胞系或组织；

c)从(b)的每种细胞系或组织中提取基因组DNA样品；

d)对(c)的样品进行实时定量聚合酶链式反应(qPCR)测定1和2，其中这些测定分别包括以下探针：

i)包括以下核苷酸序列的第一探针，该核苷酸序列互补于包括进行测定1的核酸酶切割位点的核苷酸序列，和

ii)包括以下核苷酸序列的第二探针，该核苷酸序列互补于编码进行测定2的核酸酶的异源核苷酸序列；

e)从测定1的结果获得核酸酶切割位点的DNA拷贝数并且从测定2的结果获得编码该核酸酶的异源核苷酸序列的DNA拷贝数；并且

f)富集对于测定1，相对于参考具有减少的拷贝数并且对于测定2，具有等于零的拷贝数的细胞系或组织，

从而富集以下细胞，该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。

25.如实施方案24所述的方法，该方法进一步包括将相对于参考，测定1的DNA拷贝数没有变化的细胞系或组织丢弃。

26.如实施方案24所述的方法，该方法进一步包括将对于测定2具有大于零拷贝数的细胞系或组织丢弃。

27.一种鉴定细胞的方法，该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码以下核酸酶的异源核苷酸序列到细胞基因组的整合，该核酸酶用于在核酸酶切割位点处定点切割核苷酸序列，该方法包括：

b)培养(a)的多个细胞以生产至少一种细胞系或组织；

c)从(b)的每种细胞系或组织中提取基因组DNA样品；

f)鉴定对于测定1，相对于参考具有减少的拷贝数并且对于测定2，具有等于零的拷贝数的细胞系或组织，

从而鉴定以下细胞，该细胞包括引入到细胞基因组中的核酸酶切割位点中的突变并且缺乏编码该核酸酶的异源核苷酸序列到细胞基因组的整合。

28.如实施方案27所述的方法，该方法进一步包括将与参考相比，测定1的DNA拷贝数没有变化的细胞系或组织丢弃。

29.如实施方案27所述的方法，该方法进一步包括将对于测定2具有大于零拷贝数的细胞系或组织丢弃。

30.如实施方案24-29中任一项所述的方法，其中在相同的混合物中进行这些测定。

31.如实施方案24-29中任一项所述的方法，其中该细胞系或组织源自植物或植物部分。

32.如实施方案31所述的方法，其中该植物是玉蜀黍植物。

33.如实施方案32所述的方法，其中该核酸酶切割位点是核苷酸序列内的玉蜀黍MIR604转基因插入位点，其中所述核苷酸序列与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少90％一致性。

34.如实施方案24-33中任一项所述的方法，其中该核酸酶是具有可编程切割靶特异性的工程化核酸酶。

35.如实施方案34所述的方法，其中该核酸酶是包括SEQ ID NO:30的Cas9核酸酶。

36.一种通过如实施方案24-26中任一项所述的方法富集的或通过如实施方案27-35中任一项所述的方法鉴定的细胞系或组织，其中该细胞系或组织来自植物。

37.一种源自如实施方案36所述的细胞系或组织的植物或植物部分或其子代。

38.一种用于进行如实施方案10-21或24-35中任一项所述的qPCR测定的试剂和说明书的试剂盒。

39.一种生产植物、植物部分或其子代的方法，该植物、植物部分或其子代包括引入植物细胞基因组中的核酸酶切割位点处的突变并且缺乏编码以下核酸酶的异源核苷酸序列的整合，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该方法包括：

a)向植物细胞中引入核酸分子，该核酸分子包括编码以下核酸酶的异源核苷酸序列，该核酸酶用于在植物细胞基因组中的核酸酶切割位点处定点切割核苷酸序列，该引入在该核酸分子的表达瞬时发生以产生核酸酶并且该核酸酶可以在植物细胞基因组中的核酸酶切割位点处切割核苷酸序列的条件下进行，从而在植物细胞基因组中的核酸酶切割位点处引入突变，而不将编码该核酸酶的异源核苷酸序列整合到植物细胞基因组中；并且

b)从(a)的植物细胞再生植物、植物部分或其子代。

40.如实施方案39所述的方法，其中该植物是谷类植物。

41.如实施方案39所述的方法，其中该植物是玉蜀黍。

42.如实施方案39所述的方法，其中用于定点切割的核酸酶是Cas9核酸酶。

43.如实施方案42所述的方法，其中该Cas9核酸酶包括SEQ ID NO:30。

44.一种用于修饰植物细胞基因组中的靶位点的方法，该方法包括：

a)向植物细胞中引入第一核酸和第二核酸分子，该第一核酸包括至少100个连续核苷酸并且进一步包括转基因，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；并且

b)该第二核酸分子编码以下核酸酶，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶，

该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行。

45.如实施方案44所述的方法，其中该植物细胞是玉蜀黍细胞。

46.如实施方案45所述的方法，其中该玉蜀黍细胞是转基因玉蜀黍细胞。

47.如实施方案46所述的方法，其中该转基因玉蜀黍细胞是事件MIR604转基因玉蜀黍细胞。

48.一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代在植物细胞基因组中的靶位点处包括修饰，该方法包括：

a)向植物细胞中引入第一核酸和第二核酸分子，该第一核酸包括至少100个连续核苷酸并且进一步包括转基因，其中该至少100个连续核苷酸与细胞基因组中的靶位点具有至少90％一致性；

b)该第二核酸分子编码以下核酸酶，该核酸酶在与对应于(a)的至少100个连续核苷酸的细胞基因组中的核苷酸序列相邻的细胞基因组中的核酸酶切割位点处用于定点切割，其中该核酸酶是经修饰的包括SEQ ID NO:30的Cas9核酸酶，该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在细胞基因组中的核酸酶切割位点处切割并且修饰植物细胞基因组中的靶位点的条件下进行；并且

c)从(a)的植物细胞再生植物、植物部分或其子代。

49.一致通过如实施方案48所述的方法生产的玉蜀黍植物、植物部分或其子代。

50.如实施方案44所述的方法，其中该第一核酸包括转基因。

51.一种将转基因整合到事件MIR604转基因玉蜀黍基因组中的基因组核酸酶切割位点的方法，该方法包括将以下各项引入事件MIR604玉蜀黍细胞中：

a)包括至少100个连续核苷酸并且进一步包括转基因的第一核酸分子，其中所述至少100个连续核苷酸与选自下组的核苷酸序列中的靶位点具有至少90％一致性，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQ ID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQID NO:138和SEQ ID NO:139；和

b)包括编码以下核酸酶的核苷酸序列的第二核酸分子，该核酸酶在与对应于(a)的至少100个连续核苷酸的选自下组的核苷酸序列具有至少90％一致性的核苷酸序列相邻的基因组核酸酶切割位点处用于定点切割，该组包括：SEQ ID NO:133、SEQ ID NO:134、SEQID NO:135、SEQ ID NO:136、SEQ ID NO:137、SEQ ID NO:138和SEQ ID NO:139，

该引入在该第二核酸分子的表达可以发生以产生核酸酶并且该核酸酶可以在基因组核酸酶切割位点处切割核苷酸序列的条件下进行，由此转基因被整合到事件MIR604玉蜀黍基因组中的基因组核酸酶靶切割位点处。

52.一种生产玉蜀黍植物、植物部分或其子代的方法，该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因，该方法包括从通过如实施方案51所述的方法生产的玉蜀黍细胞再生玉蜀黍植物。

53.一种通过如实施方案52所述的方法生产的玉蜀黍植物、植物部分或其子代，该玉蜀黍植物、植物部分或其子代包括整合到事件MIR604玉蜀黍基因组中的基因组核酸酶切割位点中的转基因。

序列表

<110> Syngenta Participations, AG

Chen, Zhongying

Kim, Myoung

Que, Qiudeng

Chilton, Mary-Dell

Zhong, Heng

Gu, Weining

Jiang, Yaping

<120> 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物

<130> 80484-WO-REG-ORG-P-1

<150> 62/096442

<151> 2014-12-23

<160> 139

<170> PatentIn version 3.5

<210> 1

<211> 1582

<212> DNA

<213> 玉米（Zea mays）

<400> 1

cgagcagtag aaaaaaaaaa caacgccaag agatggcaga gtcaacaacc gatcacagta 60

cgtatcgcat tcacatcaag attttaagaa cgaccccccg gctggccaat ggccactttc 120

ttgcccgtgc ccgacagcgg acacggcgcc atgccctccg cgccgcacga gcgaggtgtc 180

gtgagaaccg gcaaaaaaaa aaaaaaaaat catcccaagt gcgctgaagt gaagtgcctt 240

cccccgcgtt tccttgcccc tggccggtac ccatttggcg ccgattcttt tcttgccccc 300

ccggccggcc gctcgctcgc ctttggattc ttccaaagcc gctgatggga tcgtggcgaa 360

cacacccacc acccgtcttt gcccaaagcg acccggcaca ggccgcgccg gcttcactaa 420

ccactagcgc ttgtactaat aaaatggttt ctagcgtttg ttgctctcct ttttcctttt 480

ttcgccggtt cttcggagcc gtgtggacag cgtccagtcc agcaggcata gggtggtctc 540

ggcggcggcc gtccgacgac gatcgatctc catgagattc cgcgacaggc caggacggaa 600

agctgggccc ttctcaccaa ttcgcgtcgg agccggaaca agattccctc ccccaatcat 660

ttcgacgcgc cctttcttcg ccacccctcg tggccgtgtt tcgcggccct tatctctttc 720

ccgtgacgcg ttcttttgta gcttagcggc cggcacgttg ctaaccaggc tagcttcgtt 780

cgtttttaat ctgcctatcg agaagagaag aaaaattcgt ccatggggcc acggcctctt 840

ctgcaggcat ttggcagaac cagtgaatgg agatggacgg atgctgctca gatacgcagt 900

caaacctgcc ggcgaaatta cggggggagc tggctggctg gctggacgcc agagcacaca 960

tggatgacgc ggcacggcag ctagccgagc aggcgctctg cgcacgcaag tgtcgtgccg 1020

atctcgcacc agcagcatcg cgtcctaaac aaaggaggtc ctgtcctgca ctgcactgca 1080

cggatgcagc tttggcaacg aggtgtgtcg cgcagcgctc ctgcacggat gtagctttgg 1140

attgctggat aatatctcgc gcaagcatcg tatttattta tttaatttat tatttattta 1200

tttattacga cgtccaccgc tgtgcgtgct ccgtttcgga ttataataaa actaatatta 1260

aataaaaaaa tcggattaaa ggatgtttcc gaaataaaga tctccaccac aggagcgaaa 1320

gaaaagagaa acgaaatggt gttgcgatta tacggcggct ccgtcgtcgt cggatcgaca 1380

tgtaaaaagt acgtgcacaa aaggcaaagc aaaatcacct catcaaagac caaaagcgga 1440

gcaaagaata gatactaaat ccacatattt ttttttgttc ctgtctacta tgtgctgtgc 1500

ctgtgcgtga agcacgatta gtacgtgtag tcacttgtca tattcttttt agtgtcttgt 1560

cactagtcac atggagtagc aa 1582

<210> 2

<211> 17176

<212> DNA

<213> 玉米

<400> 2

ccattaaatc gacgaaagca actagatcct gattttgatt acgattacga ttgacgagta 60

tggatcatga ttttattgca tattttatga ttttattgca tattttatta ttttattgtc 120

gatttatgta ctaacttgtt tttgttaaaa taggatgtca aagaaaatga agtctttagc 180

tcgtagtttg cttgggtcga ggaggagctc gaggagcagc tcgaggggtg aggattcagt 240

ttttcagggc acaggttcta ccatgagcag acggagagcg ctggcagaac atttgcctcc 300

acaagatgta agttagttgt taaattacat tatttgagtt acttaatatt gtatgatgta 360

agttatttgt ttcataggat gctgaaattg aggaaccagt ggtagaggat catgcaagag 420

atgatgttga agatgatggt ggagataatg tgggagatga tgctggagac gacgctggtg 480

gggattctgg ggctggggat tctggggctg gtggagattc tgcagctggg tctggaactt 540

ctcgagttaa gagaacgagg aagctgcatt ttgttggacc acctccagag cttccacccg 600

aatctcgggt tgtaataaag cctagtggaa agtgagtgac atatctttgc ttaaatgtta 660

ttgaaagtta tgttttaatt tctacattga tttctgtttg caggacttgg atcgacgact 720

cgttcacagg cacaggacac tacaggcagg tgaacatggt tcttggtaat cttgttcgtc 780

tgcactggcc tggtcttgtg actttgccta ctggcgagtc tgtccccgcc accacttggg 840

agcattatcg ctatggtgtc tgtagaacgt ttggcaacac acaggcacta gtttgggatg 900

cattctgggt atgacttgtt tatactattt tagttattcc atatatgttt gcttttatga 960

taacactatg gtttttgcag aaacggtaca agttgccgga cgatggatca tatgatatga 1020

acgctcgtta cgtgtttgag tttaacgcga acgatgtcgt tgcagatgca atgtactatg 1080

cacgaattca ggctataaag gcatggtaca gagcaaatgc tgatgatcga ccgatgccaa 1140

atacaaaggc cgagtggtca tcaatttact tgacggagga gcaataccta gaggtaaaca 1200

ggttgttgcc tctcatatcg cacaaagcca tgtatttgct tgctttattt aaaaattttg 1260

atgtaggtgt cggtgccgtg gatggccacc cgaccagacg gttatcgggc attgtgcaga 1320

tggtgggctt cccctgactt tcgtgccatt tccgaaagga acaggggaaa ccgtgggact 1380

gagtcgttcc acaactacgg cggtgatggt catgtgcgct tggctaagcg aatggtaagt 1440

cacagtttgt cgtaactttg aatcacatag caaatgtgtc attataactt ttatgtacag 1500

gaagtcaaat ccggccgtac gcccacggat gtggaggtgt atatgcaagg gcatagggcc 1560

ataggggttc tgatcctcag aatcctgatg tgttatgcac tcagacggcc accgaccgtc 1620

tagtgagttt ttgatactct attatgtgtg ttgatattgt ttgcaagggc ataggggtta 1680

tgcacttata tttgatattg tttgcctcca ggcttcgtat gggcaggaga tggttcaacg 1740

ccatggggag gagtacgatt ggaggagcca gccaatcgac cctcagacag catatgctag 1800

cgcaggagga caagctcatg gacggtgaga ttatttgatt tggttttcaa aattgtcatc 1860

atatgcttgc gattcaactg agccatgagt tactatacta agtgcatggt tcactcttgt 1920

aggttgggta tttttgattc tacgattgat tccagagagc tgagacgccg tggacgacaa 1980

tccacatcgt cgtcttcaca gtcgtcccgt tcacgatcag cagcccatga gatagagctt 2040

gcagtgttgc gtcaacaggc agagtaccat caatcagtct tgagggaaca attggagtac 2100

cagaggcaac aatctgaata ccagagacaa caagccgagt accagaagaa gagggacgag 2160

tattatgcaa gcctccaggc ccaaaatcaa gctcttctct cggtaagttg aagtaacatt 2220

ttgtagctta ttttgcaaaa cacttgatgt gtatcttgtt tgttcaacaa tgacttgtat 2280

ataatttgta gcaactagcc caacaagcgg gcgtcccgat gccgacatat gggatgccgc 2340

ctccggactt tgcactgcca atgccaatgt tggcgcctcc acctccacct ccgcctccgc 2400

ctacgtcaca attccctatg gtatgtacac atatgcgtgt gtgacatgtt catagatgtc 2460

ttatgtgttt aaatgaacaa ctgagtggtt actatttcat gtgcttgtgt tatagggatt 2520

tcagacacca cccgcttcag ttgccgcacc tggagatggg tctgggcaag acgacacaac 2580

acattcgtgg gtcaacaacc tattcaacac gcagagtcca gccggaggag gtggctactt 2640

gaaccatcca gacgatggat atgattgatg tgtcgtgatg tttatttatg aaacactttg 2700

caacacttgt ttgtgagaca caatttcagt ttgcaacaac cgtcgaacct atatgttgat 2760

gttaaatttg tgaatgttat tatttatgtg agaatatttg tgattgtgaa tacttattag 2820

aatgtgtata tttgtgattg tgaatgtgaa tgtgtatatg tgcatgaatc tgttttcgtt 2880

ttgtaaatgt cagatttttt aaaaaacaga attttgtgta aattctgtaa tttgttatgt 2940

ccgacggcct agtggtagcc gtcggacata acacatggtt atgtccgacg gcattaacta 3000

ccgtcggaca taagggatgc ttatgtccga cggcctagtg gtagccgtcg gacttaatcc 3060

tgtggggccc acattccgac cggtaaaacg gttgggattt gttatctccg acgggcacac 3120

gcagccgtcg gagatagctt atgtccgacg gctgccgtcg gacattgcac tatttccgac 3180

gagttatctc cgacggctta aagccgtcgg agataaggct ttgccgtcgg aaataatcta 3240

tttccgacgg tttattcctt atgtccgacg gttttggcca tcggacgttt ctccgtttac 3300

tgtagtggaa gggagtgcag tagaagtgca atggcctaat gtccttcacc ataaaaaaaa 3360

caaagttcaa atctttcaga tttatttact cttggagtag catagcatag gtgtacaagg 3420

gaagtgctta taataatggt aacaagatac tcatcctctc atacctgccg tctcactgac 3480

aggaaacggt aggtggcaag ttggtaagct tttcggtttt agccatgtcc gatcccatgt 3540

gtggatcctg tactgtacat cgacatgcga catcttggtt ggcctatctg atctttaatg 3600

tcgccgcgca cagagaggag atccggtctc atgaagtggc tccgcagatt cctcaagggg 3660

ccgaagcccg gcgaaccgag ccgccggcgg ccccaggtgg cggccgggga agaggaggac 3720

gcgctttggc accaacgacc agctagacca aaggtactac tactaccact gtactagtga 3780

ctgagttcct cccttcttct tctacagttc gtctctgtct ctccaaatgg ctctttgatc 3840

tatccaaaca tgccgtttca cagcttcaca tccgattcaa ctcgcatcca ttgcagtgcc 3900

atcttaaact cttagctccg aaaaaggaag ttgctaaaga ctagtacaat atctttcttc 3960

gctgtttcca gatcgatcca cctaggaacg agaatgagga actagtggac cgtgccattg 4020

ccgagcctct tgcagaggct gtcaaaccgc ccagaggtag taccgtagat ggacgaatcc 4080

agatacacat tccatgtcag catggtataa atttctctga aaccgtttca tccctgcatc 4140

ccgttgctgt aaattgctgc gccagagaaa acccataggg gagaagacag caacgacgac 4200

gaagatctgg caagagccgt acaggacagt ctgaatatga acccttacac gccttacaac 4260

ccctatccac cctctcaggc ccaacctaga gggcacaggt caaccgctat cacaatcacc 4320

atttactggc accctaagat attctctaac gcgccaaagc agctcaatgc cgtcagtgtc 4380

cgtgctgcag ggtatgcgga ggctgcaagc atgagatagg gcgtggccat tacttgagct 4440

gcatgggcat ttactggcac cctcagtgct tccgctgcag gtcctgcggt caccttatcc 4500

gtgagaccga ggtaattaag ctcttgcatt ttctttcacc gtggaagtgt gttacagtgt 4560

taccagagat gagatcatat ccgttattct tttcgtcgtg ccttccagtt caccttgctg 4620

ggtgcggatt cgtaccacaa gctgtgctac aaggagctgc atcatccaaa atgcgacgtc 4680

tgccttcagt ttgtaaggcc tcgtgtcctc ggaaaacctg agcgatctgc actacagact 4740

gataaactgc gtacgcgtta gcatttctac accgtgccgt ctcgtcagtg taatgagagg 4800

ctcattcttt gtagatgtgt ttctgcagat cccaacgaac gggagtggct tgatagagta 4860

cagagcccac ccgttctggg gccagaagta ttgcccttcg catgagcgcg acaggacgcc 4920

acgttgctgc agctgtgaga aaatggaggt acaggtacag atactagata gaaaatgtgg 4980

tcgcagtccg atcactcgtt ttcaaactag gttgtacatt gcctgatcat attcaagggc 5040

atcacttttc ggttgtgatt gtgcagccaa ggaacacgaa gtacatgtcg ctgggagacg 5100

gacgcggcct gtgcatggaa tgcctgggat ctgcagtgat ggacacgagc gagtgccagc 5160

ctctgtacca ttctatcaga gactactacg aggggatgga catgagactg gaccagcaga 5220

tacccgtgct cttggttgag cggcaagcgc tcaacgaagc catggaaggg gagagtaaag 5280

tgagtgtttc ttctggttct gccccttttt tttgtgtgtg tttctgcaaa acgtacagcc 5340

ttcggaaaca ctaacgctga ccgcatctgc gaaatccagg gcccacgcca catgcctgag 5400

actaggggcc tatgtctgtc cgaggagcgg actgtgagca gtgtaagtgt tcaacaactc 5460

aagctgtggc ggttactgct gggatgctta gcccacaatg cgacagtttc tgctcttctg 5520

actgtgtgtt acttctgcag atacttagga ggcccagaat tggtggaaac aaccggttac 5580

tagacatgag aactcggcca cagaagctga ctaggagatg tgaagttact gcaatacttg 5640

tcctgtatgg cctccccagg tctggcaatt ttttttttat ctctggagtc tggaggacat 5700

cacttttttg tacctaccgg attcaaatac tgcggttctt ctcacgttct gtgaccggtg 5760

gtgtcgtcgt ttgtgtcaca acgctattgc aggctactga caggttccat cctcgcccat 5820

gagctgatgc acgggtggct gcgtctcaaa ggtacatccg tatatggatg gatggacaaa 5880

acatttcata cacccattta tcatctttat ttatgaattt tcttggaaag ctctaccgga 5940

tcgtactttt cattcaggtt accgaaacct aaacgcggag gtggaagaag gcatatgcca 6000

ggtcatgtct tacttgtggc tggaatcaga gattcttccg tcatcctcga ggcacgcgca 6060

gccttcatca tcctatccag caacatcatc cgagaaaggt ggaatatctc ataccgggaa 6120

gaagctgggc gagttcttca tgcaccagat tgccaatgac acgtcgacgg cctatggtga 6180

cgggttcaga actgcgtacg ctgccgtcaa caagtatggc cttcgccaaa cactgagcca 6240

tatacgccta acaggaggtt tccctgtata ataagagtga aaaaaacata aaatgtccat 6300

gcatgatcat atcgatatca aaaggttata tacatattgg gatgaagttg gctatggaac 6360

actggatgca tagtgattca atttcggtga cctttgagtt ttcaaagagg taatgtcgga 6420

gtaaatcaga aagtaaaccc gtataaagca tggttgagac gattgtttac tctatagtga 6480

tgcatgctac atgcatggcc aagaagagag caacgggcca taggaccatc gttattaccc 6540

atcgttgtta atcaaattta gggctagata aatagtaaac catctatagg aacatccaga 6600

gtcaatctac tctatgtatc ataccgacca ggggcggatc taggtaaaat aaccattgat 6660

gtcatctcca ttaaattata gtatcatcaa cctatttaag tgctaacaat catacatttt 6720

aatgaagatt attaaaatcc attggtgtca catgacacca caaaaatggc ctagatccgc 6780

ccctgatacc gacaaaccta gaaaaatttg taactgagaa ctgatgacca tacacatgaa 6840

catgaattag gactttcaaa gagtccaatc aaagtaaaca attagactaa gcatgtaaga 6900

tagggtgcca gatgttgtat caggcttttg agcacatgtg caacttgtat gtcgtggaac 6960

gtgacaaccg gtcaaggaat gcgcatgtga cggtgtaaaa tcaatataac aacatgaaga 7020

acaatcataa gtataggttg aaactacaca tgataactag tatatctttc taacaacaat 7080

gattagtaca atatgtaccg tggtaaagtg gtgacaccat tagagatcgc attagaacgg 7140

catggcgctt actttaaaaa atgttagaga agcggttatg gtcaaacaga atattatgtg 7200

aatatgcggg aagatgaaca aatctataac acagaaacga aggaaccaaa taggatcagc 7260

ggagagtaca gtgccaacgc gcgacgaaac gaggaagcca gaaaggcacc gccgcatgcc 7320

cgcaccgcgt gactgtcgaa ggcggccgtg agcgctccga catcgaagga gtttatttca 7380

aaaatgggac gaccaacatt gcgcttttca catttgtttc ctaacgttgc actctttcac 7440

atatggcacc gagacacgca atcttgttga caccgctcgt agtccggtcc gggcagtgag 7500

gtcttacctg tcgtggtttc agaaaccggg gataataaga tttgtgttcg gtaaggacgc 7560

agcgcggact cactctgaat ggtcagagga ctcaatgatg gatctgagac aaggggttat 7620

actggtttag gcttgcgccc tagtccaatg ttgatcatag tattgcttag agcgtgttac 7680

agttgagtgc tcgtatctag aagatggggg ttgtcttgct cttttatagc tcaaggatag 7740

atcttacaat gagacttgta ttctgttggg gtcgagctca gcttcctact tctgggtgac 7800

gtagctcctc cggtatcgtc tgctgggtcg tgcgccatcg tatccctggt atggcgtcgc 7860

gtcttatccg ttcgccgtat gagttcttgt agctattctg atgcaaacgt agtggtgcct 7920

ggtgggtctc gcagagtcgg tttgtggtga ggtttagggg cgtctttagt acaacttcat 7980

cttccatcat tccctatgcg tcaccttcca gcatgcgtag gcgtacgctt cgtacagcgt 8040

attaccgcgt cccttctgga cttctggtat gtaggtcact gtagagaccc aatgctgggt 8100

tgattggtcc caccggtcag cgaggatgct ctctagaatg tatctggcgt cgtgattggc 8160

agaggccttc ggtactgctc ccatggttca gacgtggctt ggtggtgatc tgtctcatcg 8220

tgctgacgtg acttgatagt actaggtcgg ctcttacctc ctatagatgt gctcgctaga 8280

aagtccattg tcatcttgct gggttgctcg gcatgtaggt tgatcggtaa atccgcctcg 8340

tcgagttgct cgataatgtt gctcggcggg cgggtatgta ggtagtccga cctcaccggg 8400

ttgttcggca atcccgcctc gccgagttgc tcggtgaacg ggttggtcgg cagccccacc 8460

tcgccaggtt gtttggcaca cgtgttggtc tgttggtggg tcgtcgagag cccttttggg 8520

cttttttggg cacccggttt ctggtacccc acaatacccg agctagagtt ccacatttgc 8580

ccctaccttc cttcccggct ccggcgacaa gcccaggatc ctggtgtaat ggggcgagga 8640

gaagcagttc ttgacggagg agaccagctc catgatcccc aacaaaatga aggagacaac 8700

cgaggcctac ctcggcgtca ccatcaataa cactgttgtc accgtcccag tctatttcaa 8760

tgagtcccag cgccagacta ccaaaaacgt cgccgtcatc tccggccttc accgtcatgc 8820

gcatcatcaa cgagcccacc actgtcgcca tcacctacgg gctcgacaag aaatcgagca 8880

gcaacaacga gaataatgtc gtcatcttcg acctcgacgg cggtaccttt gacgtcgcgc 8940

tccggcggct aaggaccgca ctgccgacga gggcatgagt ggcgccgaga tggaagagaa 9000

gaggagcaca aatggcggtc gtcggcaaag acaaagagaa ctcgagcgtg agtggaggaa 9060

ggggcaaatg tgtaactcca gcttggatat gactccactg accagattac gagcgacatc 9120

aactagattg tgtgtctcag tggctcagtg ccattttttg aggtttgggt gccaatattt 9180

tttcgtagtg gaaggcaccg cgcccatcgg gttttgggag ccaaacgcca aacccgctcg 9240

cctcatattc cgcaacgtac agcggtttca tgggctggtt gaaggcccgg gccgcaaacc 9300

aaccgagtcg ggccgacgcc ctgggagatc cgcacggctg gtctggccca agcaacctgg 9360

tgggttggtg ccaggttaca gcctgggctg atctgtggac ggtggaccat gcaaggttgt 9420

actgggcttg caaggttgta ctgggcctac tggaacagtc atagcccgtg ccgtcgtggt 9480

gaccgtcgta cgcggccgat ctggcagact gggcaggtcg ctgctccgtg ctgtttgtgg 9540

atgcaatgca actatgcaag agtgatcacg gaaaacggac ggagcctgtc tgtcctgttg 9600

cgacgtagta caagcgcctg aacagtgacg ctacgctatg ccacgagcct acgagtggta 9660

ggtagtagta cactggtcag aatccagcag tgcacccacg ccgctgctga ctttgctgat 9720

gagagggagg ggtcgagcga gtctgtgtga aaccgtgaac cccgccgggg ccttcagtac 9780

gtacgatacc acgagcagta gaaaaaacaa cgccaagatg gcagagtcaa caaccgatca 9840

cagtacgtat cgcattcaca tcaagatttt aagaacgacc cccggctggc caatggcagg 9900

ccacttggtt gcccgtgccc gacagaggga cacggcgcca tgccctccgc gccgcacgga 9960

cgaggtgtcg tgagaaccgg caaaaaaaaa aatcatcgca agtgcgctga agtgaagtgc 10020

cttcccccgc gtttccttgc ccctggccgg tacccatttg gcgccgattc ttttcttgcc 10080

ccccggccgg ccgctcgctc gcctttggat tcttccaaag ccgctgatgg gatggtggcg 10140

aacacaccca ccacccgtct ttgcccaaag cgacccggca caggccgcgc cggcttcact 10200

aaccactagc gcttgtacta ataaaatggt ttctagcgtt tgttgctctc ctttttcttt 10260

tttcgccggt tcttcggagc cgtgtggaca ctggacagcg tccagtccag caggcatagg 10320

gtggtctcgg cggcggtcgt ccgacgacga tcgatctcca tgagattccg cgacaggcca 10380

ggacggaaag ctgggccctt ctcaccaatt cgcgtcggag ccggaacaag attccctccc 10440

ccaatcattt cgacgcgccc tttcttcgcc acccctcgtg gccgtgtttc gcggccggcc 10500

cttatctcct tcccgtgacg cgttcttttg tagcttagcg gccggcacgt tgctaaccag 10560

gctagcttcg ttcgttttta atctgcctat cgagaagaga agaaaaattc gtccatgggg 10620

ccacggcctc ttctgcaggc atttggcatg tgaaggaacc cgaaccagtg aatggagatg 10680

gacggatgct gctcagatac gcagtcaaac ctgccggcga aattacgggg ggagctggct 10740

ggctggctgg ctggacgcca gatcacacat ggatgacgcg gcacggcagc tagccgagca 10800

ggcgctctgc gcacgcaagt gtcgtgccga tctcgcacca gcagcatcgc gtcctaaaca 10860

aaggaggtcc tgtcctgcac tgcactgcac tgcacggatg cagctttggc aacgaggtgt 10920

gtcgcgcagc gctcctgcac ggatgtagct ttggattgct ggataatgtc tcgcgcaagc 10980

gtcgtattta tttatttatt tattacagcc tccaccgccg tgcgtgctcc gtttcggatt 11040

ataataaaac taatattaaa taaaaaaatc ggattaaagg atgtttccga aataaagatc 11100

tccaccacag gagcgaaaga aaaaaaaaga gaaacgggct atggagaaat ggtgttgcga 11160

gtatacggcg gctccgtcgt cgtcggatcg acatgtacaa agtaggtgca caaaaggcaa 11220

agcaaaatca cctcatcaaa gaccaaaagc ggagcaaaga atcgatacta aatccacatg 11280

ttttttttgt tcctgtctac tacgtgctgt gcctgtgcgt gaagcacgat tagtacgtgt 11340

actcactctt gtcatattct ttttagtgtc ttgtcactag tcacatggag tagcaaccat 11400

ggctggcgat acccgcgata aataaaaaaa agagagaggg agtaatatat tagatactca 11460

cccattataa attataaaat attttagagt ttgaataggt agttcttgta tatttattta 11520

tagaccttca agtttgtccg cctctcgaga gccgaacttt gttgcccatg cttccccggc 11580

tcaggtcatg ccacctcctt caccaagggc acacggaaga tctggtggag cttgtcatca 11640

ccccgcgccc ttcaaacatg tgaggatgcg tcgtcgctgg cactagtagc actcattgta 11700

ggcactacat tgacagtttc ctccagatat gtagtgagga aacacttgaa caacacgttt 11760

gggattacat atgatgtttt gtttgttcat caatgataat tccttcttct tgcttaatga 11820

ttggctctag aaccgataca tggcacattt catcaggaag ggcgcatgca cgaaattaaa 11880

ctgttatcga tgtttcggtt tctaagttga agaaaacaat ggctaacaac tagcccatgt 11940

gagcataacg acaaggccta caaacaaaac ccaagaaata gctaaatcat ggtctggatc 12000

cactctgcta tgatagatca ccttttctaa catagttcat cctcccattt gctctcgctc 12060

acctagtgcc tccatcgctg agatcaatga taagtaccaa gtgtacgatg aatcccattt 12120

gtcatgcgtc ttgcaagaat ggttggtccg cttgcagtgc cggtccagct atggacccag 12180

gggcctatgt cataactcaa gcaagaccat acccccatat gctaccaaga tgccttttaa 12240

gaatcctggt aaaagaaatc ggtggaagac gactcaacga ctatcaggcc ccattttttg 12300

ggaccatgct caaggatttg gctttagcaa aagtagataa cactattttg gggagcttga 12360

tctcaaggac acatgaagga ataaagctat tttagtcaag acgtccttaa ggaacacaat 12420

aagaccctag gtccctaatg actagtgtgt tatatgtttc gagacgctcc tacacctaag 12480

ttcttttagc tatttccatt cacaatgatg gtatatgacc taggtaccaa tgccccacgg 12540

agtttctaac attaagaatg atctaaaaca taaggaccct agagccaggg cactcctggt 12600

attaaaacat ttaaacccta ttgccttagt gctgattttt gttttttgtt tgtaggagga 12660

gaaacgagca cttgttgcct ctcgcgacaa tcttgatagg ctgtaccgtg atgccagtaa 12720

ctccttgacc atcctagaga ggagccaccg cttcaccatg tctgacctag atcatcacca 12780

ccatgagctg caggcgtctc aagatgaagt cttgcaactt ggacgattgt tgtcgactaa 12840

ggattccacc atcaaggatc tgcgcttcta aaaagctcgt cccgcaggag ctagaggcgg 12900

cccagcttgc tattaagact ctaaaggaca actgcaccgt cctgaagacc cagcgcgata 12960

aagctatgga taaagttgtt cgcgctggac ggatcctgat gaggaggcac ggcgttgtgg 13020

tgcctgacga tattgttgtc gatgtcaagg ccgcgcctga tgctacaagt cgtccctctt 13080

tttctgttgc tcctgcgaag gataccgtct gcaaggatgt ttcgatgcag tgatgtcctg 13140

taaaacactt tacttattga gttagtatct ccttggagga tggatgtaat atggattcaa 13200

tgtgcatgcg acaattgtgt tagaactcga atattctacg aacagggtgc cggaaaacgg 13260

ccctagcact ggcaagtaag atgttctctt ttcctgaagt gttttcaatt ttagccggtt 13320

gttatgctat tagggtatag tggtcaccct aaacagcgca aatgcaagta taccgcgttg 13380

gcttaaggtg tgttccgact taagtcagtt gccttgctgg tagggcatag tggtcaccct 13440

gagtaaagta agtcagagta tattgcaccg acctaagtcg attgcactac tagcagggta 13500

tagtgatcac cctaagtcaa gtaagcatga gcatatcgca ccgacttagg tcatcaccga 13560

cttaagccga ttgttctgtt agcagggtat aatggtcacc ctaagtcaga taagcatgag 13620

catgtcacac cggcttaagt cgttgccgac ttaagccgat tgctccgtca gcagggtata 13680

gtggtcaccc taataagtca ggtaagcatg agcatatcgc actggcttaa gtcgttgccg 13740

acttaagccg attgctccgt cagtagggta tagtggtcac cctaagtcaa gtaagcgtga 13800

gcatgtcgca ctggcttaag tcgattgctc cgtcagcagg gtataatggt cactttaagt 13860

caagtaagtg tgagcatgtc gcaccagctt aagtcatcgc cgacttaagc tgattgctcc 13920

attagcaggg tatagtggtc accctaagtt aggtaatcgt gctgatttca agtctagccc 13980

aatcaaagtc agttgtaagt caagagtatg aatgcctttg gagaatgaaa actttattga 14040

tgatgaaatt ctcggattta cagagtacaa tgttccttca agaattttga ggccttgcta 14100

aggatagaat tttctgaggt gttctatgtt ccatgagttc ccttctgtgc cgtccatttg 14160

agtaagccgg tatggtcccg gccgagtgac cgcctctaat atgatgaacg atccttccca 14220

cagtggtgat agcttgtgcc gcccttcccc cgttagaatt cggcgaagga ccaagtctcc 14280

cactgcaaag gatcggtgcc gcatagcttt atcatggtag cacctcaagg tctgctggta 14340

cctagccgac tgaattactg tgttcaatag ttcttcttcc agtacatcaa tatcttccag 14400

tctggtcgct tctgcttcag ctatgctttc gaaagttaat cttggtgccc tgaagattag 14460

gtcagcgggc agcactgcct ctaacccata aaccatgaaa aacggggtat ttctatgcag 14520

agctcgactg ggttgagttc tcaggctcta gaccacgtat ggcagctctc tgatccattt 14580

tcctgcaagc ttttcactct tgtcaaatat tttcttcctg agtgcttcta gtatcattcc 14640

gttggttctt tctacctggc cattggctct tgggtgtgct actgatgcat acttaacctg 14700

gaagctccgt tgctcgcaga aatcgagttc agagctggtg aagttggatc ccagatcggt 14760

gatgatgttg tttggtatcc caaacctgaa tattatgtct tgtataaact ccaccacttt 14820

ggctgaggtc aaggaagcaa ttggcttgta ctttatccat tttgtgaatt tgttaatggc 14880

aaccagtaca tgagtatagc ctccctgagc cttcttaaaa ggtccgatca tgtccagccc 14940

acagcatgcg aacggccatg ttacaggaat ggtctgcagc tgctgcgcgg gtaagtgttg 15000

ttgctttgat aggaattggc atgcttcaca cttctggact aactcggcaa catcgttctt 15060

tattgttggc caatagaaac cggatctaaa agccttcccg accagagtcc ttgacgctgc 15120

atgtattcca cactgcccgg cgtggatttc atccaacaat tgtttctcgg tagtcgagtg 15180

aatacatttc atgaggactc ttgctgcacc tctcctgtac agtaagcccc atatgatggt 15240

gtagtgggcc aactgcctcg cgatgcattc cactgcagcc ttgtcatctg gctcttcttc 15300

atttttatat acctgatgat aggctctctc cagtcgttgg ggtccgactc tggttggctc 15360

aaggtattgc acacttccac ctgatccaag atgatgcttg gttgtgatat ttcttggacg 15420

aagatcccag gtggagcctg ggcccgactg gatcccagct tcgacaacgc gtctgctgct 15480

gcgttgcggt ctcgttccac atgatggaac tctaatcctt caaatttgtc ctctagtttt 15540

cgcacaaccg cgcagtattt gcccatggag tcagtcgagc agtcctagtc tttgcttatc 15600

tggattatga ccactagcga atcaccatat accatcagtt tcttgatgcc gagtgataca 15660

acaatgctta aaccatggat cagttcttca tactttgctg cattatttga cgctggaaat 15720

agtagctgga gtgcataatt gtgttgctca cctccaggag caataaagag aatccctgca 15780

cccgctccct atagtttcaa cgagccatca aagtacattt tccacacctc gataacctct 15840

gggctatctg ggacctgatg ttcagtccac tctgatacga agtcaaccag cgcctgagtc 15900

ttgattgccg tgcggggcca gaactctatg ttgtgagctc caagctcaca cgcccacttg 15960

gcgatccttc caatagcttc tttgttgtgg agaatgtccc ctattgggaa tcctatgacc 16020

actatgactt tgtggtcgtc aaagtagtgt cggagtttgc gtgcggttag aagtactgca 16080

tacaacaact tctgtacttg aggatacctt atctttgagg gcccgaggac ttcactgatg 16140

aagtagactg gatgttgcac cgggtacaca tgtccttcct ccacccgctt gactactaac 16200

gtggtgctta ccacgtgagt cgtgctggag atgtataaca tcaaatcttc caccaactga 16260

ttcagcgtag ctcgtcgtgg cggcttgagc actggtggtg tagtcaaaaa attttagttc 16320

ctctagagct tcctgcgcct ctgtggtcca ctgaaacttg tccacctttt tgagcaattt 16380

gtagaaggcc atgccttgct cccctagtct tgatatgaac ctgctcaggg ctgccatgca 16440

tccagtaagc ctctgtacct ttttctatga tcgcaacact tccattctca tgatggcctt 16500

gaccttttcc gggttagctt caatcccttg gtgactgaca atgaatctga gtaacttccc 16560

tgcctgtact ctgaaaacac acttttctgg gttgagcttc caccggtaat gcctcaggct 16620

attgaagact agctgcaaat cttcaatgaa gttttctgtt ttgatcacca catcatcaac 16680

ataggcttcc acccgcttgc cccagtggtc ggctaagcat gtctgaatgg ctctctggta 16740

agttgctccc gtgttcttga ggtcgaatga catgaaggtg taatagaaag ctccaaatgg 16800

ggtgatgaaa gcattcttct cctcatcttc ttttgctaag cagatatgat ggtatctaga 16860

atagcagtct aggaaggaca acatagaaca gccagcggtc gaatcaacca cctgatctat 16920

tctagggagc ccgaagggat ctttggtgtc tcagacctgg gggaccctca accaaatcga 16980

caagtgaatt ttgtgtcgcg tgtccctgcc cagatggatt agtgcaagat gaaacacaag 17040

aggaggggtg aggtttatat tatcttgcac cagggtgctt gcagtagggg atacaatctt 17100

tgcgagagag ggaacggatc ccaggtctct tgagagatct agtgttgtga aggggagttc 17160

gatgtttgag caagcc 17176

<210> 3

<211> 23

<212> DNA

<213> 玉米

<400> 3

agtgcagtgc agtgcaggac agg 23

<210> 4

<211> 23

<212> DNA

<213> 玉米

<400> 4

actaatcgtg cttcacgcac agg 23

<210> 5

<211> 23

<212> DNA

<213> 玉米

<400> 5

aggcacagca cgtagtagac agg 23

<210> 6

<211> 23

<212> DNA

<213> 玉米

<400> 6

acatgtcgat ccgacgacga cgg 23

<210> 7

<211> 23

<212> DNA

<213> 玉米

<400> 7

agttttatta taatccgaaa cgg 23

<210> 8

<211> 23

<212> DNA

<213> 玉米

<400> 8

aatccgaaac ggagcacgca cgg 23

<210> 9

<211> 23

<212> DNA

<213> 玉米

<400> 9

aaacggagca cgcacggcgg tgg 23

<210> 10

<211> 22

<212> DNA

<213> 玉米

<400> 10

ggagcacgca cggcggtgga gg 22

<210> 11

<211> 23

<212> DNA

<213> 玉米

<400> 11

atccaaagct acatccgtgc agg 23

<210> 12

<211> 22

<212> DNA

<213> 玉米

<400> 12

gtgcagtgca gtgcagtgca gg 22

<210> 13

<211> 23

<212> DNA

<213> 玉米

<400> 13

ggacaggacc tcctttgttt agg 23

<210> 14

<211> 23

<212> DNA

<213> 玉米

<400> 14

gcgtgcgcag agcgcctgct cgg 23

<210> 15

<211> 22

<212> DNA

<213> 玉米

<400> 15

gcgtcatcca tgtgtgatct gg 22

<210> 16

<211> 24

<212> DNA

<213> 玉米

<400> 16

gtccatctcc attcactggt tcgg 24

<210> 17

<211> 23

<212> DNA

<213> 玉米

<400> 17

aatgcctgca gaagaggccg tgg 23

<210> 18

<211> 24

<212> DNA

<213> 玉米

<400> 18

gcggccggca cgttgctaac cagg 24

<210> 19

<211> 23

<212> DNA

<213> 玉米

<400> 19

agagaagaaa aattcgtcca tgg 23

<210> 20

<211> 22

<212> DNA

<213> 玉米

<400> 20

ggcctcttct gcaggcattt gg 22

<210> 21

<211> 23

<212> DNA

<213> 玉米

<400> 21

aaggaacccg aaccagtgaa tgg 23

<210> 22

<211> 21

<212> DNA

<213> 玉米

<400> 22

atcggtccta aacaaaggag g 21

<210> 23

<211> 22

<212> DNA

<213> 玉米

<400> 23

ggatgcagct ttggcaacga gg 22

<210> 24

<211> 22

<212> DNA

<213> 玉米

<400> 24

gtcgcgcagc gctcctgcac gg 22

<210> 25

<211> 24

<212> DNA

<213> 玉米

<400> 25

gctcctgcac ggatgtagct ttgg 24

<210> 26

<211> 22

<212> DNA

<213> 玉米

<400> 26

ggatgtagct ttggattgct gg 22

<210> 27

<211> 23

<212> DNA

<213> 玉米

<400> 27

aaataaaaaa atcggattaa agg 23

<210> 28

<211> 20

<212> DNA

<213> 玉米

<400> 28

agtgcagtgc agtgcaggac 20

<210> 29

<211> 4170

<212> DNA

<213> 人工序列

<220>

<223> 酿脓链球菌，玉米

<400> 29

atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60

atcaccgacg agtacaaggt gccgagcaag aagttcaagg tgctgggcaa caccgacagg 120

cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180

gccaccaggc tgaagaggac cgccaggagg aggtacacca ggaggaagaa caggatctgc 240

tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacagg 300

ctggaggaga gcttcctggt ggaggaggac aagaagcacg agaggcaccc gatcttcggc 360

aacatcgtgg acgaggtggc ctaccacgag aagtacccga ccatctacca cctgaggaag 420

aagctggtgg acagcaccga caaggccgac ctgaggctga tctacctggc cctggcccac 480

atgatcaagt tcaggggcca cttcctgatc gagggcgacc tgaacccgga caacagcgac 540

gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccg 600

atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccaggctgag caagagcagg 660

aggctggaga acctgatcgc ccagctgccg ggcgagaaga agaacggcct gttcggcaac 720

ctgatcgccc tgagcctggg cctgaccccg aacttcaaga gcaacttcga cctggccgag 780

gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840

cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900

ctgctgagcg acatcctgag ggtgaacacc gagatcacca aggccccgct gagcgccagc 960

atgatcaaga ggtacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgagg 1020

cagcagctgc cggagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080

ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gccgatcctg 1140

gagaagatgg acggcaccga ggagctgctg gtgaagctga acagggagga cctgctgagg 1200

aagcagagga ccttcgacaa cggcagcatc ccgcaccaga tccacctggg cgagctgcac 1260

gccatcctga ggaggcagga ggacttctac ccgttcctga aggacaacag ggagaagatc 1320

gagaagatcc tgaccttccg catcccgtac tacgtgggcc cgctggccag gggcaacagc 1380

aggttcgcct ggatgaccag gaagagcgag gagaccatca ccccgtggaa cttcgaggag 1440

gtggtggaca agggcgccag cgcccagagc ttcatcgaga ggatgaccaa cttcgacaag 1500

aacctgccga acgagaaggt gctgccgaag cacagcctgc tgtacgagta cttcaccgtg 1560

tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgaggaagcc ggccttcctg 1620

agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag gaaggtgacc 1680

gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740

agcggcgtgg aggacaggtt caacgccagc ctgggcacct accacgacct gctgaagatc 1800

atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860

ctgaccctga ccctgttcga ggacagggag atgatcgagg agaggctgaa gacctacgcc 1920

cacctgttcg acgacaaggt gatgaagcag ctgaagagga ggaggtacac cggctggggc 1980

aggctgagca ggaagctgat caacggcatc agggacaagc agagcggcaa gaccatcctg 2040

gacttcctga agagcgacgg cttcgccaac aggaacttca tgcagctgat ccacgacgac 2100

agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160

cacgagcaca tcgccaacct ggccggcagc ccggccatca agaagggcat cctgcagacc 2220

gtgaaggtgg tggacgagct ggtgaaggtg atgggcaggc acaagccgga gaacatcgtg 2280

atcgagatgg ccagggagaa ccagaccacc cagaagggcc agaagaacag cagggagagg 2340

atgaagagga tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccg 2400

gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcagg 2460

gacatgtacg tggaccagga gctggacatc aacaggctga gcgactacga cgtggaccac 2520

atcgtgccgc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccaggagc 2580

gacaagaaca ggggcaagag cgacaacgtg ccgagcgagg aggtggtgaa gaagatgaaa 2640

aactactgga ggcagctgct gaacgccaag ctgatcaccc agaggaagtt cgacaacctg 2700

accaaggccg agaggggcgg cctgagcgag ctggacaagg ccggcttcat taaaaggcag 2760

ctggtggaga ccaggcagat caccaagcac gtggcccaga tcctggacag caggatgaac 2820

accaagtacg acgagaacga caagctgatc agggaggtga aggtgatcac cctgaagagc 2880

aagctggtga gcgacttcag gaaggacttc cagttctaca aggtgaggga gatcaataat 2940

taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gattaaaaag 3000

tacccgaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgaggaag 3060

atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120

aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat caggaagagg 3180

ccgctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagggacttc 3240

gccaccgtga ggaaggtgct gtccatgccg caggtgaaca tcgtgaagaa gaccgaggtg 3300

cagaccggcg gcttcagcaa ggagagcatc ctgccgaaga ggaacagcga caagctgatc 3360

gccaggaaga aggactggga cccgaagaag tacggcggct tcgacagccc gaccgtggcc 3420

tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480

aaggagctgg tgggcatcac catcatggag aggagcagct tcgagaagaa cccagtggac 3540

ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcattaa actgccgaag 3600

tacagcctgt tcgagctgga gaacggcagg aagaggatgc tggccagcgc cggcgagctg 3660

cagaagggca acgagctggc cctgccgagc aagtacgtga acttcctgta cctggccagc 3720

cactacgaga agctgaaggg cagcccggag gacaacgagc agaagcagct gttcgtggag 3780

cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagggtg 3840

atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagggacaag 3900

ccgatcaggg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960

ccggccgcct tcaagtactt cgacaccacc atcgacagga agaggtacac cagcaccaag 4020

gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccaggatc 4080

gacctgagcc agctgggcgg cgacagcagc ccgccgaaga agaagaggaa ggtgagctgg 4140

aaggacgcca gcggctggag caggatgtga 4170

<210> 30

<211> 1389

<212> PRT

<213> 人工序列

<220>

<223> 酿脓链球菌，玉米

<400> 30

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Val Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp Ala

1370 1375 1380

Ser Gly Trp Ser Arg Met

1385

<210> 31

<211> 17

<212> DNA

<213> 玉米

<400> 31

gcagtgcagt gcaggac 17

<210> 32

<211> 18

<212> DNA

<213> 玉米

<400> 32

tgcagtgcag tgcaggac 18

<210> 33

<211> 19

<212> DNA

<213> 玉米

<400> 33

gtgcagtgca gtgcaggac 19

<210> 34

<211> 21

<212> DNA

<213> 玉米

<400> 34

cagtgcagtg cagtgcagga c 21

<210> 35

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 酿脓链球菌，水稻（Oryzae sativa）

<400> 35

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgctttt ttttt 85

<210> 36

<211> 105

<212> DNA

<213> 人工序列

<220>

<223> 酿脓链球菌，玉米，水稻

<400> 36

agtgcagtgc agtgcaggac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttttt 105

<210> 37

<211> 480

<212> DNA

<213> 人工序列

<220>

<223> 酿脓链球菌，玉米，水稻

<400> 37

gggatcttta aacatacgaa cagatcactt aaagttcttc tgaagcaact taaagttatc 60

aggcatgcat ggatcttgga ggaatcagat gtgcagtcag ggaccatagc acaggacagg 120

cgtcttctac tggtgctacc agcaaatgct ggaagccggg aacactgggt acgttggaaa 180

ccacgtgatg tggagtaaga taaactgtag gagaaaagca tttcgtagtg ggccatgaag 240

cctttcagga catgtattgc agtatgggcc ggcccattac gcaattggac gacaacaaag 300

actagtatta gtaccacctc ggctatccac atagatcaaa gctggtttaa aagagttgtg 360

cagatgatcc gtggcagtgc agtgcagtgc aggacgtttt agagctagaa atagcaagtt 420

aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttttt 480

<210> 38

<211> 1995

<212> DNA

<213> 玉米

<400> 38

aacgagaata atgtcgtcat cttcgacctc gacggcggta cctttgacgt cgcgctccgg 60

cggctaagga ccgcactgcc gacgagggca tgagtggcgc cgagatggaa gagaagagga 120

gcacaaatgg cggtcgtcgg caaagacaaa gagaactcga gcgtgagtgg aggaaggggc 180

aaatgtgtaa ctccagcttg gatatgactc cactgaccag attacgagcg acatcaacta 240

gattgtgtgt ctcagtggct cagtgccatt ttttgaggtt tgggtgccaa tattttttcg 300

tagtggaagg caccgcgccc atcgggtttt gggagccaaa cgccaaaccc gctcgcctca 360

tattccgcaa cgtacagcgg tttcatgggc tggttgaagg cccgggccgc aaaccaaccg 420

agtcgggccg acgccctggg agatccgcac ggctggtctg gcccaagcaa cctggtgggt 480

tggtgccagg ttacagcctg ggctgatctg tggacggtgg accatgcaag gttgtactgg 540

gcttgcaagg ttgtactggg cctactggaa cagtcatagc ccgtgccgtc gtggtgaccg 600

tcgtacgcgg ccgatctggc agactgggca ggtcgctgct ccgtgctgtt tgtggatgca 660

atgcaactat gcaagagtga tcacggaaaa cggacggagc ctgtctgtcc tgttgcgacg 720

tagtacaagc gcctgaacag tgacgctacg ctatgccacg agcctacgag tggtaggtag 780

tagtacactg gtcagaatcc agcagtgcac ccacgccgct gctgactttg ctgatgagag 840

ggaggggtcg agcgagtctg tgtgaaaccg tgaaccccgc cggggccttc agtacgtacg 900

ataccacgag cagtagaaaa aacaacgcca agatggcaga gtcaacaacc gatcacagta 960

cgtatcgcat tcacatcaag attttaagaa cgacccccgg ctggccaatg gcaggccact 1020

tggttgcccg tgcccgacag agggacacgg cgccatgccc tccgcgccgc acggacgagg 1080

tgtcgtgaga accggcaaaa aaaaaaatca tcgcaagtgc gctgaagtga agtgccttcc 1140

cccgcgtttc cttgcccctg gccggtaccc atttggcgcc gattcttttc ttgccccccg 1200

gccggccgct cgctcgcctt tggattcttc caaagccgct gatgggatgg tggcgaacac 1260

acccaccacc cgtctttgcc caaagcgacc cggcacaggc cgcgccggct tcactaacca 1320

ctagcgcttg tactaataaa atggtttcta gcgtttgttg ctctcctttt tcttttttcg 1380

ccggttcttc ggagccgtgt ggacactgga cagcgtccag tccagcaggc atagggtggt 1440

ctcggcggcg gtcgtccgac gacgatcgat ctccatgaga ttccgcgaca ggccaggacg 1500

gaaagctggg cccttctcac caattcgcgt cggagccgga acaagattcc ctcccccaat 1560

catttcgacg cgccctttct tcgccacccc tcgtggccgt gtttcgcggc cggcccttat 1620

ctccttcccg tgacgcgttc ttttgtagct tagcggccgg cacgttgcta accaggctag 1680

cttcgttcgt ttttaatctg cctatcgaga agagaagaaa aattcgtcca tggggccacg 1740

gcctcttctg caggcatttg gcatgtgaag gaacccgaac cagtgaatgg agatggacgg 1800

atgctgctca gatacgcagt caaacctgcc ggcgaaatta cggggggagc tggctggctg 1860

gctggctgga cgccagatca cacatggatg acgcggcacg gcagctagcc gagcaggcgc 1920

tctgcgcacg caagtgtcgt gccgatctcg caccagcagc atcgcgtcct aaacaaagga 1980

ggtcctgtcc tgcac 1995

<210> 39

<211> 942

<212> DNA

<213> 玉米

<400> 39

gcactgcact gcactgcacg gatgcagctt tggcaacgag gtgtgtcgcg cagcgctcct 60

gcacggatgt agctttggat tgctggataa tgtctcgcgc aagcgtcgta tttatttatt 120

tatttattac agcctccacc gccgtgcgtg ctccgtttcg gattataata aaactaatat 180

taaataaaaa aatcggatta aaggatgttt ccgaaataaa gatctccacc acaggagcga 240

aagaaaaaaa aagagaaacg ggctatggag aaatggtgtt gcgagtatac ggcggctccg 300

tcgtcgtcgg atcgacatgt acaaagtagg tgcacaaaag gcaaagcaaa atcacctcat 360

caaagaccaa aagcggagca aagaatcgat actaaatcca catgtttttt ttgttcctgt 420

ctactacgtg ctgtgcctgt gcgtgaagca cgattagtac gtgtactcac tcttgtcata 480

ttctttttag tgtcttgtca ctagtcacat ggagtagcaa ccatggctgg cgatacccgc 540

gataaataaa aaaaagagag agggagtaat atattagata ctcacccatt ataaattata 600

aaatatttta gagtttgaat aggtagttct tgtatattta tttatagacc ttcaagtttg 660

tccgcctctc gagagccgaa ctttgttgcc catgcttccc cggctcaggt catgccacct 720

ccttcaccaa gggcacacgg aagatctggt ggagcttgtc atcaccccgc gcccttcaaa 780

catgtgagga tgcgtcgtcg ctggcactag tagcactcat tgtaggcact acattgacag 840

tttcctccag atatgtagtg aggaaacact tgaacaacac gtttgggatt acatatgatg 900

ttttgtttgt tcatcaatga taattccttc ttcttgctta at 942

<210> 40

<211> 18

<212> DNA

<213> 玉米

<400> 40

ttgctactcc atgtgact 18

<210> 41

<211> 16

<212> DNA

<213> 玉米

<400> 41

ttgtcatatt cttttt 16

<210> 42

<211> 19

<212> DNA

<213> 玉米

<400> 42

tacacgtact aatcgtgct 19

<210> 43

<211> 18

<212> DNA

<213> 玉米

<400> 43

tcctgtctac tacgtgct 18

<210> 44

<211> 19

<212> DNA

<213> 玉米

<400> 44

ttgttcctgt ctactacgt 19

<210> 45

<211> 20

<212> DNA

<213> 玉米

<400> 45

ttggtctttg atgaggtgat 20

<210> 46

<211> 20

<212> DNA

<213> 玉米

<400> 46

tcgacatgta caaagtaggt 20

<210> 47

<211> 19

<212> DNA

<213> 玉米

<400> 47

ttcggaaaca tcctttaat 19

<210> 48

<211> 19

<212> DNA

<213> 玉米

<400> 48

ttataataaa actaatatt 19

<210> 49

<211> 20

<212> DNA

<213> 玉米

<400> 49

taataaataa ataaataaat 20

<210> 50

<211> 19

<212> DNA

<213> 玉米

<400> 50

ttggattgct ggataatgt 19

<210> 51

<211> 18

<212> DNA

<213> 玉米

<400> 51

tcgttgccaa agctgcat 18

<210> 52

<211> 19

<212> DNA

<213> 玉米

<400> 52

tcctgtcctg cactgcact 19

<210> 53

<211> 19

<212> DNA

<213> 玉米

<400> 53

tgcatccgtg cagtgcagt 19

<210> 54

<211> 17

<212> DNA

<213> 玉米

<400> 54

tcctaaacaa aggaggt 17

<210> 55

<211> 17

<212> DNA

<213> 玉米

<400> 55

taggacgcga tgctgct 17

<210> 56

<211> 18

<212> DNA

<213> 玉米

<400> 56

tgcgcacgca agtgtcgt 18

<210> 57

<211> 19

<212> DNA

<213> 玉米

<400> 57

tccatctcca ttcactggt 19

<210> 58

<211> 19

<212> DNA

<213> 玉米

<400> 58

ttctgcaggc atttggcat 19

<210> 59

<211> 18

<212> DNA

<213> 玉米

<400> 59

ttttcttctc ttctcgat 18

<210> 60

<211> 19

<212> DNA

<213> 玉米

<400> 60

taaccaggct agcttcgtt 19

<210> 61

<211> 18

<212> DNA

<213> 玉米

<400> 61

taagctacaa aagaacgc 18

<210> 62

<211> 18

<212> DNA

<213> 玉米

<400> 62

tgtttcgcgg ccggccct 18

<210> 63

<211> 18

<212> DNA

<213> 玉米

<400> 63

tttccgtcct ggcctgtc 18

<210> 64

<211> 19

<212> DNA

<213> 玉米

<400> 64

tcgtccgacg acgatcgat 19

<210> 65

<211> 19

<212> DNA

<213> 玉米

<400> 65

tcctaaacaa aggaggtcc 19

<210> 66

<211> 51

<212> DNA

<213> 玉米

<400> 66

tacacgtact aatcgtgctt cacgcacagg cacagcacgt agtagacagg a 51

<210> 67

<211> 51

<212> DNA

<213> 玉米

<400> 67

tgcatccgtg cagtgcagtg cagtgcagga caggacctcc tttgtttagg a 51

<210> 68

<211> 1343

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 68

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

515 520 525

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

820 825 830

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

835 840 845

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

850 855 860

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

865 870 875 880

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

885 890 895

Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val

900 905 910

Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp

915 920 925

His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala

930 935 940

Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn

945 950 955 960

Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln

965 970 975

Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr

980 985 990

Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu

995 1000 1005

Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg

1010 1015 1020

Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu

1025 1030 1035

Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala

1040 1045 1050

Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu

1055 1060 1065

Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln

1070 1075 1080

Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val

1085 1090 1095

Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu

1100 1105 1110

Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg

1115 1120 1125

Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro

1130 1135 1140

Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

1145 1150 1155

Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

1160 1165 1170

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu

1175 1180 1185

Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg

1190 1195 1200

Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr

1205 1210 1215

Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys

1220 1225 1230

Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu

1235 1240 1245

Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile

1250 1255 1260

Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu

1265 1270 1275

Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys

1280 1285 1290

Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala

1295 1300 1305

Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys

1310 1315 1320

Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn

1325 1330 1335

Gly Glu Ile Asn Phe

1340

<210> 69

<211> 1211

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 69

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

725 730 735

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser

770 775 780

Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala

785 790 795 800

Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly

805 810 815

Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly

820 825 830

Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val

835 840 845

Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu

850 855 860

Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe

865 870 875 880

Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro

885 890 895

Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys

900 905 910

Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser

915 920 925

Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser

930 935 940

Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser

945 950 955 960

Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu

965 970 975

Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp

980 985 990

Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro

995 1000 1005

Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu

1010 1015 1020

Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His

1025 1030 1035

Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp

1040 1045 1050

Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr

1055 1060 1065

Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly

1070 1075 1080

Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val

1085 1090 1095

Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln

1100 1105 1110

Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn

1115 1120 1125

Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser

1130 1135 1140

Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly

1145 1150 1155

Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys

1160 1165 1170

Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu

1175 1180 1185

Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys

1190 1195 1200

Phe Asn Asn Gly Glu Ile Asn Phe

1205 1210

<210> 70

<211> 1037

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 70

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

725 730 735

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser

770 775 780

Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala

785 790 795 800

Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly

805 810 815

Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly

820 825 830

Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu

835 840 845

Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His

850 855 860

Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg

865 870 875 880

Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr

885 890 895

Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr

900 905 910

Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala

915 920 925

Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln

930 935 940

Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn

945 950 955 960

Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu

965 970 975

Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg

980 985 990

Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu

995 1000 1005

Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu

1010 1015 1020

Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1025 1030 1035

<210> 71

<211> 1309

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 71

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

515 520 525

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

820 825 830

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

835 840 845

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

850 855 860

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

865 870 875 880

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

885 890 895

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

900 905 910

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

915 920 925

Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val

930 935 940

Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe

945 950 955 960

Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln

965 970 975

Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr

980 985 990

Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly

995 1000 1005

Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp

1010 1015 1020

Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu

1025 1030 1035

Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser

1040 1045 1050

Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser

1055 1060 1065

Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala

1070 1075 1080

Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg

1085 1090 1095

Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp

1100 1105 1110

Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg

1115 1120 1125

His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu

1130 1135 1140

Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val

1145 1150 1155

Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu

1160 1165 1170

Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser

1175 1180 1185

Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly

1190 1195 1200

Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr

1205 1210 1215

Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu

1220 1225 1230

Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu

1235 1240 1245

Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr

1250 1255 1260

Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val

1265 1270 1275

Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu

1280 1285 1290

Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn

1295 1300 1305

Phe

<210> 72

<211> 1177

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 72

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

180 185 190

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

450 455 460

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

740 745 750

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

755 760 765

Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro

770 775 780

His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg

785 790 795 800

Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu

805 810 815

Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met

820 825 830

Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg

835 840 845

Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala

850 855 860

Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala

865 870 875 880

Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His

885 890 895

Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met

900 905 910

His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser

915 920 925

Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg

930 935 940

Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val

945 950 955 960

Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr

965 970 975

Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

980 985 990

Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu

995 1000 1005

Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu

1010 1015 1020

Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly

1025 1030 1035

Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr

1040 1045 1050

Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala

1055 1060 1065

Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met

1070 1075 1080

Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn

1085 1090 1095

Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe

1100 1105 1110

Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala

1115 1120 1125

Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val

1130 1135 1140

Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala

1145 1150 1155

Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly

1160 1165 1170

Glu Ile Asn Phe

1175

<210> 73

<211> 1003

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 73

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

180 185 190

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

450 455 460

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

740 745 750

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

755 760 765

Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro

770 775 780

His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg

785 790 795 800

Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu Glu Glu

805 810 815

Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr

820 825 830

Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu

835 840 845

Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly

850 855 860

Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val

865 870 875 880

Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser

885 890 895

Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr

900 905 910

Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp

915 920 925

Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val

930 935 940

Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn

945 950 955 960

His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu

965 970 975

Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val

980 985 990

Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

995 1000

<210> 74

<211> 1343

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 74

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

515 520 525

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

785 790 795 800

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

820 825 830

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

835 840 845

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

850 855 860

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

865 870 875 880

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

885 890 895

Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val

900 905 910

Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp

915 920 925

His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala

930 935 940

Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn

945 950 955 960

Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln

965 970 975

Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr

980 985 990

Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu

995 1000 1005

Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg

1010 1015 1020

Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu

1025 1030 1035

Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Ala

1040 1045 1050

Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu

1055 1060 1065

Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln

1070 1075 1080

Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val

1085 1090 1095

Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro Glu

1100 1105 1110

Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg

1115 1120 1125

Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro

1130 1135 1140

Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

1145 1150 1155

Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

1160 1165 1170

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu

1175 1180 1185

Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg

1190 1195 1200

Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr

1205 1210 1215

Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys

1220 1225 1230

Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu

1235 1240 1245

Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile

1250 1255 1260

Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu

1265 1270 1275

Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys

1280 1285 1290

Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala

1295 1300 1305

Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys

1310 1315 1320

Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn

1325 1330 1335

Gly Glu Ile Asn Phe

1340

<210> 75

<211> 1211

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 75

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser

770 775 780

Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala

785 790 795 800

Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly

805 810 815

Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly

820 825 830

Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val

835 840 845

Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu

850 855 860

Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe

865 870 875 880

Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro

885 890 895

Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys

900 905 910

Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser

915 920 925

Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser

930 935 940

Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser

945 950 955 960

Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu

965 970 975

Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp

980 985 990

Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro

995 1000 1005

Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu

1010 1015 1020

Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His

1025 1030 1035

Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp

1040 1045 1050

Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr

1055 1060 1065

Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly

1070 1075 1080

Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val

1085 1090 1095

Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln

1100 1105 1110

Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn

1115 1120 1125

Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser

1130 1135 1140

Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly

1145 1150 1155

Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys

1160 1165 1170

Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu

1175 1180 1185

Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys

1190 1195 1200

Phe Asn Asn Gly Glu Ile Asn Phe

1205 1210

<210> 76

<211> 1037

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 76

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser

770 775 780

Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala

785 790 795 800

Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly

805 810 815

Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly

820 825 830

Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu

835 840 845

Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His

850 855 860

Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg

865 870 875 880

Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr

885 890 895

Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr

900 905 910

Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala

915 920 925

Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln

930 935 940

Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn

945 950 955 960

Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu

965 970 975

Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg

980 985 990

Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu

995 1000 1005

Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu

1010 1015 1020

Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1025 1030 1035

<210> 77

<211> 1275

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 77

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

515 520 525

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

820 825 830

Ser Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser

835 840 845

Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala

850 855 860

Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly

865 870 875 880

Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly

885 890 895

Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val

900 905 910

Leu Glu Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu

915 920 925

Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe

930 935 940

Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro

945 950 955 960

Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys

965 970 975

Arg Ala Lys Pro Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser

980 985 990

Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser

995 1000 1005

Pro Met His Glu Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg

1010 1015 1020

Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ala

1025 1030 1035

Val Glu Val Arg Val Pro Glu Gln Arg Asp Ala Leu His Leu Pro

1040 1045 1050

Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Arg Ile Trp Gly Gly

1055 1060 1065

Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp Gln Leu Val Lys

1070 1075 1080

Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys

1085 1090 1095

Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn

1100 1105 1110

Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe

1115 1120 1125

Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg

1130 1135 1140

Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr

1145 1150 1155

Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu

1160 1165 1170

Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn

1175 1180 1185

Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val

1190 1195 1200

Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly

1205 1210 1215

His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His

1220 1225 1230

Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu

1235 1240 1245

Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu

1250 1255 1260

Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1265 1270 1275

<210> 78

<211> 1143

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 78

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

180 185 190

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

675 680 685

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly

690 695 700

Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro

705 710 715 720

Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu

725 730 735

Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala

740 745 750

Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser

755 760 765

His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu Phe Phe

770 775 780

Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met Thr Gln

785 790 795 800

Phe Gly Met Ser Arg Asn Gly Leu Val Gln Leu Phe Arg Arg Val Gly

805 810 815

Val Thr Glu Leu Glu Ala Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln

820 825 830

Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro

835 840 845

Ser Pro Thr Ser Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe

850 855 860

Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu

865 870 875 880

Gly Asp Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg

885 890 895

Ala Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro

900 905 910

Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg

915 920 925

Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr

930 935 940

Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu

945 950 955 960

Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile

965 970 975

Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val

980 985 990

Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly

995 1000 1005

Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro

1010 1015 1020

Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly

1025 1030 1035

Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val

1040 1045 1050

Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp

1055 1060 1065

Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe

1070 1075 1080

Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg

1085 1090 1095

Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu

1100 1105 1110

Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr

1115 1120 1125

Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1130 1135 1140

<210> 79

<211> 969

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 79

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

180 185 190

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

675 680 685

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly

690 695 700

Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro

705 710 715 720

Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu

725 730 735

Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro His Ala

740 745 750

Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser

755 760 765

His Arg Val Ala Leu Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

770 775 780

Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu

785 790 795 800

Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met

805 810 815

Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His

820 825 830

Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser

835 840 845

Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly

850 855 860

Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu

865 870 875 880

Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys

885 890 895

Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly

900 905 910

His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile

915 920 925

Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly

930 935 940

Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg

945 950 955 960

Lys Phe Asn Asn Gly Glu Ile Asn Phe

965

<210> 80

<211> 1024

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 80

Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Gly

1 5 10 15

Gly Met Ala Pro Lys Lys Lys Arg Lys Val Asp Gly Gly Val Asp Leu

20 25 30

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

35 40 45

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

50 55 60

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

65 70 75 80

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

85 90 95

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

100 105 110

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

115 120 125

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

130 135 140

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

145 150 155 160

Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

165 170 175

Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

180 185 190

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

195 200 205

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

210 215 220

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

225 230 235 240

Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

245 250 255

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

260 265 270

Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr

275 280 285

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

290 295 300

Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

305 310 315 320

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

325 330 335

Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln

340 345 350

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

355 360 365

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

370 375 380

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

385 390 395 400

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly

405 410 415

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

420 425 430

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

435 440 445

Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

450 455 460

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

465 470 475 480

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

485 490 495

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

500 505 510

Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

515 520 525

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

530 535 540

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

545 550 555 560

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

565 570 575

Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

580 585 590

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

595 600 605

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln

610 615 620

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

625 630 635 640

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly

645 650 655

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

660 665 670

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile

675 680 685

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

690 695 700

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

705 710 715 720

Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

725 730 735

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

740 745 750

Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln

755 760 765

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

770 775 780

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys

785 790 795 800

Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg

805 810 815

Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys

820 825 830

Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr

835 840 845

Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr

850 855 860

Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val

865 870 875 880

Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly

885 890 895

Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp

900 905 910

Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp

915 920 925

Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile

930 935 940

Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe

945 950 955 960

Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln

965 970 975

Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser

980 985 990

Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu

995 1000 1005

Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn

1010 1015 1020

Phe

<210> 81

<211> 1024

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 81

Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Gly

1 5 10 15

Gly Met Ala Pro Lys Lys Lys Arg Lys Val Asp Gly Gly Val Asp Leu

20 25 30

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

35 40 45

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

50 55 60

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

65 70 75 80

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

85 90 95

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

100 105 110

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

115 120 125

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

130 135 140

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

145 150 155 160

Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

165 170 175

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

180 185 190

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

195 200 205

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

210 215 220

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

225 230 235 240

Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

245 250 255

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

260 265 270

Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr

275 280 285

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

290 295 300

Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu

305 310 315 320

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

325 330 335

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

340 345 350

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

355 360 365

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly

370 375 380

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

385 390 395 400

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile

405 410 415

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

420 425 430

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

435 440 445

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

450 455 460

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

465 470 475 480

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

485 490 495

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

500 505 510

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

515 520 525

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

530 535 540

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

545 550 555 560

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

565 570 575

Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu

580 585 590

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

595 600 605

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln

610 615 620

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

625 630 635 640

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

645 650 655

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

660 665 670

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly

675 680 685

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

690 695 700

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

705 710 715 720

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

725 730 735

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

740 745 750

Ala Ser His Asp Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln

755 760 765

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

770 775 780

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys

785 790 795 800

Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg

805 810 815

Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys

820 825 830

Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr

835 840 845

Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr

850 855 860

Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val

865 870 875 880

Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly

885 890 895

Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp

900 905 910

Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp

915 920 925

Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile

930 935 940

Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe

945 950 955 960

Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln

965 970 975

Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser

980 985 990

Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu

995 1000 1005

Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn

1010 1015 1020

Phe

<210> 82

<211> 4032

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 82

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttcccacga tggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380

aacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctcca acggcggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560

caggtcgtcg cgatcgctag caacatcggc ggcaagcagg ccctggagac tgtgcagagg 1620

ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680

agccacgacg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740

caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacgg cggcggcaag 1800

caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860

ccggaccagg tcgtcgccat cgcttccaac atcggcggca agcaggctct cgaaaccgtg 1920

cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980

atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040

ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacggcggc 2100

ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160

ctgaccccgg atcaggtggt cgccatcgct tcccacgatg gcggcaagca ggcgctggag 2220

actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280

gtggcgatcg cgagcaacaa cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340

ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400

ggcggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460

cacggcctca cccccgagca ggtcgtcgcg atcgctagca acaacggcgg caagcaggcc 2520

ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580

caggtggtcg cgatcgcgag ccacgacggc ggcaagcagg cgctcgaaac cgtccagagg 2640

ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700

tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2760

gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2820

gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2880

aggaggatcg gcgagaggac cagccacagg gtggccgact acgctcaggt ggtgagggtg 2940

ctggagttct tccagtgcca cagccacccg gcctacgcct tcgacgaggc tatgacccag 3000

ttcggcatga gcaggaacgg cctggtgcag ctgttcagga gggtgggcgt gaccgagctg 3060

gaggctaggg gcggcaccct gccgccagct agccagaggt gggaccgcat cctccaggcc 3120

agcggcatga aaagggctaa gccaagcccg accagcgctc agaccccaga tcaggctagc 3180

ctgcacgctt tcgccgacag cctggagagg gatctggatg ctccgagccc aatgcacgag 3240

ggcgaccaga ccagggccag cagcaggaag aggagcagga gcgacagggc tgtgaccggc 3300

ccgagcgccc agcaggctgt ggaggtgagg gtgccagagc agagggatgc cctgcacctg 3360

ccgctgagct ggagggtgaa gaggccaagg accaggatct ggggcggcct gccagatccg 3420

ggcaccccaa ccgctgctga tcagctcgtg aagagcgagc tggaggagaa gaagagcgag 3480

ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 3540

aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 3600

ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 3660

ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 3720

ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 3780

aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 3840

ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 3900

cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 3960

atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 4020

atcaacttct ga 4032

<210> 83

<211> 3114

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 83

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttccc acgatggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag caacaacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tccaacggcg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140

caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacat cggcggcaag 1200

caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260

cccgagcagg tggtcgcgat cgcgagccac gacggcggca agcaggcgct cgaaaccgtc 1320

cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380

atcgcgagca acggcggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440

ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc caacatcggc 1500

ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560

ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620

actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680

gtcgctatcg ctagcaacgg cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740

ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttcccac 1800

gatggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860

cacggcctca cccccgatca ggtcgtggcg atcgcgagca acaacggcgg caagcaggct 1920

ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980

caggtggtgg ctatcgcctc caacggcggc ggcaagcagg ccctggagac tgtgcagagg 2040

ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100

agcaacaacg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160

caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagccacga cggcggcaag 2220

caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280

cccgaccagg tcgtggctat cgcgtccaac ggcggcaagc aggctctcga gagcatcgtg 2340

gcccagctga gcaggccgga cccggccctg gccgccctga ccaacgatca cctggtggct 2400

ctggcctgcc tgggcggcag gccagccatg gacgctgtga agaagggcct gccgcacgct 2460

ccagagctga tccgcagggt gaacaggagg atcggcgaga ggaccagcca cagggtggcc 2520

ctgcagctcg tgaagagcga gctggaggag aagaagagcg agctgaggca taaactgaag 2580

tacgtgccac acgagtacat cgagctgatc gagatcgcca ggaacagcac ccaggatcgc 2640

atcctggaga tgaaggtgat ggagttcttc atgaaagtgt acggctacag gggcaagcac 2700

ctgggcggca gcaggaagcc agatggcgcc atctacaccg tgggcagccc aatcgactac 2760

ggcgtgatcg tggataccaa ggcttacagc ggcggctaca acctgccgat cggccaggct 2820

gatgagatgc agaggtacgt ggaggagaat caaaccagga acaagcacat caacccaaac 2880

gagtggtgga aggtgtaccc gagcagcgtg accgagttca agttcctgtt cgtgagcggc 2940

cacttcaagg gcaactacaa ggctcagctc accaggctga accacatcac caactgcaac 3000

ggcgccgtgc tgagcgtgga ggagctgctg atcggcggcg agatgatcaa ggctggcacc 3060

ctgaccctgg aggaggtgag gaggaagttc aacaacggcg agatcaactt ctga 3114

<210> 84

<211> 3930

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 84

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacggcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380

ggcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560

caggtcgtcg cgatcgctag caacggcggc ggcaagcagg ccctggagac tgtgcagagg 1620

ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680

agcaacatcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740

caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagccacga cggcggcaag 1800

caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860

ccggaccagg tcgtcgccat cgcttccaac ggcggcggca agcaggctct cgaaaccgtg 1920

cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980

atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040

ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag ccacgacggc 2100

ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160

ctgaccccgg atcaggtggt cgccatcgct tccaacaacg gcggcaagca ggcgctggag 2220

actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280

gtggcgatcg cgagcaacgg cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340

ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400

aacggcggca agcaggccct ggagactgtg cagaggctcc tcccagtcct gtgccaggcc 2460

cacggcctga cccccgagca ggtggtcgcg atcgcgagcc acgacggcgg caagcaggcg 2520

ctcgaaaccg tccagaggct cctccccgtg ctctgccagg atcacggcct cacccccgac 2580

caggtcgtgg ctatcgcgtc caacggcggc aagcaggctc tcgagagcat cgtggcccag 2640

ctgagcaggc cggacccggc cctggccgcc ctgaccaacg atcacctggt ggctctggcc 2700

tgcctgggcg gcaggccagc catggacgct gtgaagaagg gcctgccgca cgctccagag 2760

ctgatccgca gggtgaacag gaggatcggc gagaggacca gccacagggt ggccgactac 2820

gctcaggtgg tgagggtgct ggagttcttc cagtgccaca gccacccggc ctacgccttc 2880

gacgaggcta tgacccagtt cggcatgagc aggaacggcc tggtgcagct gttcaggagg 2940

gtgggcgtga ccgagctgga ggctaggggc ggcaccctgc cgccagctag ccagaggtgg 3000

gaccgcatcc tccaggccag cggcatgaaa agggctaagc caagcccgac cagcgctcag 3060

accccagatc aggctagcct gcacgctttc gccgacagcc tggagaggga tctggatgct 3120

ccgagcccaa tgcacgaggg cgaccagacc agggccagca gcaggaagag gagcaggagc 3180

gacagggctg tgaccggccc gagcgcccag caggctgtgg aggtgagggt gccagagcag 3240

agggatgccc tgcacctgcc gctgagctgg agggtgaaga ggccaaggac caggatctgg 3300

ggcggcctgc cagatccggg caccccaacc gctgctgatc agctcgtgaa gagcgagctg 3360

gaggagaaga agagcgagct gaggcataaa ctgaagtacg tgccacacga gtacatcgag 3420

ctgatcgaga tcgccaggaa cagcacccag gatcgcatcc tggagatgaa ggtgatggag 3480

ttcttcatga aagtgtacgg ctacaggggc aagcacctgg gcggcagcag gaagccagat 3540

ggcgccatct acaccgtggg cagcccaatc gactacggcg tgatcgtgga taccaaggct 3600

tacagcggcg gctacaacct gccgatcggc caggctgatg agatgcagag gtacgtggag 3660

gagaatcaaa ccaggaacaa gcacatcaac ccaaacgagt ggtggaaggt gtacccgagc 3720

agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggct 3780

cagctcacca ggctgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 3840

ctgctgatcg gcggcgagat gatcaaggct ggcaccctga ccctggagga ggtgaggagg 3900

aagttcaaca acggcgagat caacttctga 3930

<210> 85

<211> 3012

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 85

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agccacgacg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

ggcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttcca acaacggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag caacggcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140

caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacgg cggcggcaag 1200

caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260

cccgagcagg tggtcgcgat cgcgagcaac atcggcggca agcaggcgct cgaaaccgtc 1320

cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380

atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440

ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc caacggcggc 1500

ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560

ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620

actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680

gtcgctatcg ctagccacga cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740

ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800

aacggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860

cacggcctca cccccgatca ggtcgtggcg atcgcgagca acggcggcgg caagcaggct 1920

ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980

caggtggtgg ctatcgcctc caacaacggc ggcaagcagg ccctggagac tgtgcagagg 2040

ctcctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 2100

agccacgacg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 2160

caggatcacg gcctcacccc cgaccaggtc gtggctatcg cgtccaacgg cggcaagcag 2220

gctctcgaga gcatcgtggc ccagctgagc aggccggacc cggccctggc cgccctgacc 2280

aacgatcacc tggtggctct ggcctgcctg ggcggcaggc cagccatgga cgctgtgaag 2340

aagggcctgc cgcacgctcc agagctgatc cgcagggtga acaggaggat cggcgagagg 2400

accagccaca gggtggccct gcagctcgtg aagagcgagc tggaggagaa gaagagcgag 2460

ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 2520

aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 2580

ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 2640

ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 2700

ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 2760

aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 2820

ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 2880

cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 2940

atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 3000

atcaacttct ga 3012

<210> 86

<211> 4032

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 86

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttccaacgg cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagccac 1380

gacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560

caggtcgtcg cgatcgctag caacaacggc ggcaagcagg ccctggagac tgtgcagagg 1620

ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680

agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740

caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacaa cggcggcaag 1800

caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860

ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920

cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980

atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040

ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacaacggc 2100

ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160

ctgaccccgg atcaggtggt cgccatcgct tccaacggcg gcggcaagca ggcgctggag 2220

actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280

gtggcgatcg cgagcaacaa cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340

ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctcccac 2400

gatggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460

cacggcctca cccccgagca ggtcgtcgcg atcgctagca acatcggcgg caagcaggcc 2520

ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580

caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640

ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700

tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2760

gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2820

gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2880

aggaggatcg gcgagaggac cagccacagg gtggccgact acgctcaggt ggtgagggtg 2940

ctggagttct tccagtgcca cagccacccg gcctacgcct tcgacgaggc tatgacccag 3000

ttcggcatga gcaggaacgg cctggtgcag ctgttcagga gggtgggcgt gaccgagctg 3060

gaggctaggg gcggcaccct gccgccagct agccagaggt gggaccgcat cctccaggcc 3120

agcggcatga aaagggctaa gccaagcccg accagcgctc agaccccaga tcaggctagc 3180

ctgcacgctt tcgccgacag cctggagagg gatctggatg ctccgagccc aatgcacgag 3240

ggcgaccaga ccagggccag cagcaggaag aggagcagga gcgacagggc tgtgaccggc 3300

ccgagcgccc agcaggctgt ggaggtgagg gtgccagagc agagggatgc cctgcacctg 3360

ccgctgagct ggagggtgaa gaggccaagg accaggatct ggggcggcct gccagatccg 3420

ggcaccccaa ccgctgctga tcagctcgtg aagagcgagc tggaggagaa gaagagcgag 3480

ctgaggcata aactgaagta cgtgccacac gagtacatcg agctgatcga gatcgccagg 3540

aacagcaccc aggatcgcat cctggagatg aaggtgatgg agttcttcat gaaagtgtac 3600

ggctacaggg gcaagcacct gggcggcagc aggaagccag atggcgccat ctacaccgtg 3660

ggcagcccaa tcgactacgg cgtgatcgtg gataccaagg cttacagcgg cggctacaac 3720

ctgccgatcg gccaggctga tgagatgcag aggtacgtgg aggagaatca aaccaggaac 3780

aagcacatca acccaaacga gtggtggaag gtgtacccga gcagcgtgac cgagttcaag 3840

ttcctgttcg tgagcggcca cttcaagggc aactacaagg ctcagctcac caggctgaac 3900

cacatcacca actgcaacgg cgccgtgctg agcgtggagg agctgctgat cggcggcgag 3960

atgatcaagg ctggcaccct gaccctggag gaggtgagga ggaagttcaa caacggcgag 4020

atcaacttct ga 4032

<210> 87

<211> 3114

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 87

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agcaacaacg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttcca acggcggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag ccacgacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140

caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacaa cggcggcaag 1200

caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260

cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320

cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380

atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440

ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500

ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560

ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620

actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680

gtcgctatcg ctagcaacaa cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740

ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800

ggcggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860

cacggcctca cccccgatca ggtcgtggcg atcgcgagca acaacggcgg caagcaggct 1920

ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980

caggtggtgg ctatcgcctc ccacgatggc ggcaagcagg ccctggagac tgtgcagagg 2040

ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100

agcaacatcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160

caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220

caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280

cccgaccagg tcgtggctat cgcgtccaac ggcggcaagc aggctctcga gagcatcgtg 2340

gcccagctga gcaggccgga cccggccctg gccgccctga ccaacgatca cctggtggct 2400

ctggcctgcc tgggcggcag gccagccatg gacgctgtga agaagggcct gccgcacgct 2460

ccagagctga tccgcagggt gaacaggagg atcggcgaga ggaccagcca cagggtggcc 2520

ctgcagctcg tgaagagcga gctggaggag aagaagagcg agctgaggca taaactgaag 2580

tacgtgccac acgagtacat cgagctgatc gagatcgcca ggaacagcac ccaggatcgc 2640

atcctggaga tgaaggtgat ggagttcttc atgaaagtgt acggctacag gggcaagcac 2700

ctgggcggca gcaggaagcc agatggcgcc atctacaccg tgggcagccc aatcgactac 2760

ggcgtgatcg tggataccaa ggcttacagc ggcggctaca acctgccgat cggccaggct 2820

gatgagatgc agaggtacgt ggaggagaat caaaccagga acaagcacat caacccaaac 2880

gagtggtgga aggtgtaccc gagcagcgtg accgagttca agttcctgtt cgtgagcggc 2940

cacttcaagg gcaactacaa ggctcagctc accaggctga accacatcac caactgcaac 3000

ggcgccgtgc tgagcgtgga ggagctgctg atcggcggcg agatgatcaa ggctggcacc 3060

ctgaccctgg aggaggtgag gaggaagttc aacaacggcg agatcaactt ctga 3114

<210> 88

<211> 3075

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 88

atgggaaaac ctattcctaa tcctctgctg ggcctggatt ctaccggagg catggcccct 60

aagaaaaagc ggaaggtgga cggcggagtg gacctgagaa cactgggata ttctcagcag 120

cagcaggaga agatcaagcc caaggtgaga tctacagtgg cccagcacca cgaagccctg 180

gtgggacacg gatttacaca cgcccacatt gtggccctgt ctcagcaccc tgccgccctg 240

ggaacagtgg ccgtgaaata tcaggatatg attgccgccc tgcctgaggc cacacacgaa 300

gccattgtgg gagtgggaaa acagtggtct ggagccagag ccctggaagc cctgctgaca 360

gtggccggag aactgagagg acctcctctg cagctggata caggacagct gctgaagatt 420

gccaaaaggg gcggagtgac cgcggtggaa gccgtgcacg cctggagaaa tgccctgaca 480

ggagcccctc tgaacctgac ccccgaacag gtggtggcca ttgccagcaa caacggcggc 540

aagcaggccc tggaaaccgt gcagagactg ctgcccgtgc tgtgccaggc ccatggcctg 600

acacctgaac aggtggtggc tatcgcctct cacgacggag gaaaacaggc tctggaaaca 660

gtgcagcggc tgctgcctgt gctgtgtcag gctcacggct tgactccaga acaggtggtg 720

gctattgctt ccaatattgg ggggaaacag gccctggaaa ctgtgcagcg cctgctgcca 780

gtgctgtgcc aggctcacgg actgaccccc gaacaggtgg tggccattgc cagcaacggc 840

ggcggcaagc aggccctgga aaccgtgcag agactgctgc ccgtgctgtg ccaggcccat 900

ggcctgacac ctgaacaggt ggtggctatc gcctctcacg acggaggaaa acaggctctg 960

gaaacagtgc agcggctgct gcctgtgctg tgtcaggctc acggcttgac tccagaacag 1020

gtggtggcta ttgcttccca cgacgggggg aaacaggccc tggaaactgt gcagcgcctg 1080

ctgccagtgc tgtgccaggc tcacgggctg acccccgaac aggtggtggc cattgccagc 1140

aacaacggcg gcaagcaggc cctggaaacc gtgcagagac tgctgcccgt gctgtgccag 1200

gcccatggcc tgacacctga acaggtggtg gctatcgcct ctaacggcgg aggaaaacag 1260

gctctggaaa cagtgcagcg gctgctgcct gtgctgtgtc aggctcacgg cttgactcca 1320

gaacaggtgg tggctattgc ttccaacaac ggggggaaac aggccctgga aactgtgcag 1380

cgcctgctgc cagtgctgtg ccaggctcac ggcctcactc ccgaacaggt ggtggccatt 1440

gccagccacg acggcggcaa gcaggccctg gaaaccgtgc agagactgct gcccgtgctg 1500

tgccaggccc atggcctgac acctgaacag gtggtggcta tcgcctctaa tatcggagga 1560

aaacaggctc tggaaacagt gcagcggctg ctgcctgtgc tgtgtcaggc tcacggcttg 1620

actccagaac aggtggtggc tattgcttcc aacaacgggg ggaaacaggc cctggaaact 1680

gtgcagcgcc tgctgccagt gctgtgccag gctcacggac tgacccccga acaggtggtg 1740

gccattgcca gcaacggcgg cggcaagcag gccctggaaa ccgtgcagag actgctgccc 1800

gtgctgtgcc aggcccatgg cctgacacct gaacaggtgg tggctatcgc ctctaacaac 1860

ggaggaaaac aggctctgga aacagtgcag cggctgctgc ctgtgctgtg tcaggctcac 1920

ggcttgactc cagaacaggt ggtggctatt gcttcccacg acggggggaa acaggccctg 1980

gaaactgtgc agcgcctgct gccagtgctg tgccaggctc acgggctgac ccccgaacag 2040

gtggtggcca ttgccagcaa catcggcggc aagcaggccc tggaaaccgt gcagagactg 2100

ctgcccgtgc tgtgccaggc ccatggcctg acacctgaac aggtggtggc tatcgcctct 2160

aacaacggag gaaaacaggc tctggaaaca gtgcagcggc tgctgcctgt gctgtgtcag 2220

gctcacggct tgactccaca gcaggtcgtg gcaattgcta gcaacggcgg cggacggccc 2280

gccctggaga gcattgtggc ccagctgtct agacctgatc ctgccctggc cgccctgaca 2340

aatgatcacc tggtggccct ggcctgtctg ggaggcagac ctgccctgga tgccgtgaaa 2400

aaaggactgc ctcacgcccc tgccctgatt aaaagaacaa atagaagaat ccccgagcgg 2460

acctctcaca gagtggccgg atcccagctg gtgaaatctg agctggagga gaagaagtct 2520

gagctgagac acaagctgaa gtacgtgcct cacgagtaca tcgagctgat cgagatcgcc 2580

agaaatagca cccaggatag aatcctggag atgaaggtga tggagttctt catgaaagtg 2640

tacggctaca gaggaaagca tctgggagga agcagaaaac ctgacggagc catttataca 2700

gtgggcagcc ctatcgatta tggcgtgatc gtggatacaa aggcctacag cggaggctac 2760

aatctgccta ttggacaggc cgatgagatg cagagatacg tggaggagaa ccaaaccagg 2820

aacaagcata tcaaccctaa cgagtggtgg aaggtgtacc cttctagcgt gaccgagttc 2880

aagttcctgt ttgtgagcgg ccacttcaag ggcaattata aggcccagct gaccaggctg 2940

aaccacatca caaattgtaa tggcgccgtg ctgtctgtgg aggaactgct gattggagga 3000

gagatgatta aggccggaac actgacactg gaggaggtga gaagaaagtt caacaacggc 3060

gagatcaact tctga 3075

<210> 89

<211> 3828

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 89

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacggcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttccaacat cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380

atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctcca acatcggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccagtc ctgtgccagg cccacggcct gacccccgag 1560

caggtggtcg cgatcgcgag ccacgacggc ggcaagcagg cgctcgaaac cgtccagagg 1620

ctcctccccg tgctctgcca ggatcacggc ctgaccccag agcaggtggt ggctatcgcg 1680

agcaacatcg gcggcaagca ggctctcgaa accgtccaga ggctcctccc agtgctctgc 1740

caggctcacg gcctcacccc ggaccaggtc gtcgccatcg cttccaacat cggcggcaag 1800

caggctctcg aaaccgtgca gaggctgctc ccggtgctgt gccaggccca cggcctcacc 1860

ccagaccagg tcgtcgcgat cgcctccaac atcggcggca agcaggccct ggagactgtg 1920

cagcgcctgc tgcccgtcct gtgccaggac cacggcctca ccccggagca ggtcgtcgct 1980

atcgctagca acaacggcgg caagcaggcg ctcgaaaccg tccagaggct cctcccagtc 2040

ctctgccagg atcacggcct gaccccggat caggtggtcg ccatcgcttc caacaacggc 2100

ggcaagcagg cgctggagac tgtccagcgc ctcctcccag tcctctgcca ggcgcacggc 2160

ctcacccccg atcaggtcgt ggcgatcgcg agcaacatcg gcggcaagca ggctctcgaa 2220

accgtgcaga ggctgctgcc ggtgctctgc caggctcacg gcctgacccc agaccaggtg 2280

gtggctatcg cctccaacaa cggcggcaag caggccctgg agactgtgca gaggctcctc 2340

ccagtcctgt gccaggccca cggcctgacc cccgagcagg tggtcgcgat cgcgagcaac 2400

aacggcggca agcaggcgct cgaaaccgtc cagaggctcc tccccgtgct ctgccaggat 2460

cacggcctca cccccgacca ggtcgtggct atcgcgtcca acggcggcaa gcaggctctc 2520

gagagcatcg tggcccagct gagcaggccg gacccggccc tggccgccct gaccaacgat 2580

cacctggtgg ctctggcctg cctgggcggc aggccagcca tggacgctgt gaagaagggc 2640

ctgccgcacg ctccagagct gatccgcagg gtgaacagga ggatcggcga gaggaccagc 2700

cacagggtgg ccgactacgc tcaggtggtg agggtgctgg agttcttcca gtgccacagc 2760

cacccggcct acgccttcga cgaggctatg acccagttcg gcatgagcag gaacggcctg 2820

gtgcagctgt tcaggagggt gggcgtgacc gagctggagg ctaggggcgg caccctgccg 2880

ccagctagcc agaggtggga ccgcatcctc caggccagcg gcatgaaaag ggctaagcca 2940

agcccgacca gcgctcagac cccagatcag gctagcctgc acgctttcgc cgacagcctg 3000

gagagggatc tggatgctcc gagcccaatg cacgagggcg accagaccag ggccagcagc 3060

aggaagagga gcaggagcga cagggctgtg accggcccga gcgcccagca ggctgtggag 3120

gtgagggtgc cagagcagag ggatgccctg cacctgccgc tgagctggag ggtgaagagg 3180

ccaaggacca ggatctgggg cggcctgcca gatccgggca ccccaaccgc tgctgatcag 3240

ctcgtgaaga gcgagctgga ggagaagaag agcgagctga ggcataaact gaagtacgtg 3300

ccacacgagt acatcgagct gatcgagatc gccaggaaca gcacccagga tcgcatcctg 3360

gagatgaagg tgatggagtt cttcatgaaa gtgtacggct acaggggcaa gcacctgggc 3420

ggcagcagga agccagatgg cgccatctac accgtgggca gcccaatcga ctacggcgtg 3480

atcgtggata ccaaggctta cagcggcggc tacaacctgc cgatcggcca ggctgatgag 3540

atgcagaggt acgtggagga gaatcaaacc aggaacaagc acatcaaccc aaacgagtgg 3600

tggaaggtgt acccgagcag cgtgaccgag ttcaagttcc tgttcgtgag cggccacttc 3660

aagggcaact acaaggctca gctcaccagg ctgaaccaca tcaccaactg caacggcgcc 3720

gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaggctgg caccctgacc 3780

ctggaggagg tgaggaggaa gttcaacaac ggcgagatca acttctga 3828

<210> 90

<211> 2910

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 90

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agccacgacg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

ggcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttcca acatcggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag caacatcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tccaacatcg gcggcaagca ggccctggag actgtgcaga ggctcctccc agtcctgtgc 1140

caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagccacga cggcggcaag 1200

caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctgacc 1260

ccagagcagg tggtggctat cgcgagcaac atcggcggca agcaggctct cgaaaccgtc 1320

cagaggctcc tcccagtgct ctgccaggct cacggcctca ccccggacca ggtcgtcgcc 1380

atcgcttcca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1440

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc caacatcggc 1500

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1560

ctcaccccgg agcaggtcgt cgctatcgct agcaacaacg gcggcaagca ggcgctcgaa 1620

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1680

gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1740

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1800

atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1860

cacggcctga ccccagacca ggtggtggct atcgcctcca acaacggcgg caagcaggcc 1920

ctggagactg tgcagaggct cctcccagtc ctgtgccagg cccacggcct gacccccgag 1980

caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2040

ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2100

tccaacggcg gcaagcaggc tctcgagagc atcgtggccc agctgagcag gccggacccg 2160

gccctggccg ccctgaccaa cgatcacctg gtggctctgg cctgcctggg cggcaggcca 2220

gccatggacg ctgtgaagaa gggcctgccg cacgctccag agctgatccg cagggtgaac 2280

aggaggatcg gcgagaggac cagccacagg gtggccctgc agctcgtgaa gagcgagctg 2340

gaggagaaga agagcgagct gaggcataaa ctgaagtacg tgccacacga gtacatcgag 2400

ctgatcgaga tcgccaggaa cagcacccag gatcgcatcc tggagatgaa ggtgatggag 2460

ttcttcatga aagtgtacgg ctacaggggc aagcacctgg gcggcagcag gaagccagat 2520

ggcgccatct acaccgtggg cagcccaatc gactacggcg tgatcgtgga taccaaggct 2580

tacagcggcg gctacaacct gccgatcggc caggctgatg agatgcagag gtacgtggag 2640

gagaatcaaa ccaggaacaa gcacatcaac ccaaacgagt ggtggaaggt gtacccgagc 2700

agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggct 2760

cagctcacca ggctgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 2820

ctgctgatcg gcggcgagat gatcaaggct ggcaccctga ccctggagga ggtgaggagg 2880

aagttcaaca acggcgagat caacttctga 2910

<210> 91

<211> 3075

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，玉米

<400> 91

atgggaaaac ctattcctaa tcctctgctg ggcctggatt ctaccggagg catggcccct 60

aagaaaaagc ggaaggtgga cggcggagtg gacctgagaa cactgggata ttctcagcag 120

cagcaggaga agatcaagcc caaggtgaga tctacagtgg cccagcacca cgaagccctg 180

gtgggacacg gatttacaca cgcccacatt gtggccctgt ctcagcaccc tgccgccctg 240

ggaacagtgg ccgtgaaata tcaggatatg attgccgccc tgcctgaggc cacacacgaa 300

gccattgtgg gagtgggaaa acagtggtct ggagccagag ccctggaagc cctgctgaca 360

gtggccggag aactgagagg acctcctctg cagctggata caggacagct gctgaagatt 420

gccaaaaggg gcggagtgac cgcggtggaa gccgtgcacg cctggagaaa tgccctgaca 480

ggagcccctc tgaacctgac ccccgaacag gtggtggcca ttgccagcca cgacggcggc 540

aagcaggccc tggaaaccgt gcagagactg ctgcccgtgc tgtgccaggc ccatggcctg 600

acacctgaac aggtggtggc tatcgcctct cacgacggag gaaaacaggc tctggaaaca 660

gtgcagcggc tgctgcctgt gctgtgtcag gctcacggct tgactccaga acaggtggtg 720

gctattgctt ccaacggcgg ggggaaacag gccctggaaa ctgtgcagcg cctgctgcca 780

gtgctgtgcc aggctcacgg actgaccccc gaacaggtgg tggccattgc cagcaacatc 840

ggcggcaagc aggccctgga aaccgtgcag agactgctgc ccgtgctgtg ccaggcccat 900

ggcctgacac ctgaacaggt ggtggctatc gcctctaata tcggaggaaa acaggctctg 960

gaaacagtgc agcggctgct gcctgtgctg tgtcaggctc acggcttgac tccagaacag 1020

gtggtggcta ttgcttccaa tattgggggg aaacaggccc tggaaactgt gcagcgcctg 1080

ctgccagtgc tgtgccaggc tcacgggctg acccccgaac aggtggtggc cattgccagc 1140

cacgacggcg gcaagcaggc cctggaaacc gtgcagagac tgctgcccgt gctgtgccag 1200

gcccatggcc tgacacctga acaggtggtg gctatcgcct ctaatatcgg aggaaaacag 1260

gctctggaaa cagtgcagcg gctgctgcct gtgctgtgtc aggctcacgg cttgactcca 1320

gaacaggtgg tggctattgc ttccaatatt ggggggaaac aggccctgga aactgtgcag 1380

cgcctgctgc cagtgctgtg ccaggctcac ggcctcactc ccgaacaggt ggtggccatt 1440

gccagcaaca tcggcggcaa gcaggccctg gaaaccgtgc agagactgct gcccgtgctg 1500

tgccaggccc atggcctgac acctgaacag gtggtggcta tcgcctctaa caacggagga 1560

aaacaggctc tggaaacagt gcagcggctg ctgcctgtgc tgtgtcaggc tcacggcttg 1620

actccagaac aggtggtggc tattgcttcc aacaacgggg ggaaacaggc cctggaaact 1680

gtgcagcgcc tgctgccagt gctgtgccag gctcacggac tgacccccga acaggtggtg 1740

gccattgcca gcaacatcgg cggcaagcag gccctggaaa ccgtgcagag actgctgccc 1800

gtgctgtgcc aggcccatgg cctgacacct gaacaggtgg tggctatcgc ctctaacaac 1860

ggaggaaaac aggctctgga aacagtgcag cggctgctgc ctgtgctgtg tcaggctcac 1920

ggcttgactc cagaacaggt ggtggctatt gcttccaaca acggggggaa acaggccctg 1980

gaaactgtgc agcgcctgct gccagtgctg tgccaggctc acgggctgac ccccgaacag 2040

gtggtggcca ttgccagcaa cggcggcggc aagcaggccc tggaaaccgt gcagagactg 2100

ctgcccgtgc tgtgccaggc ccatggcctg acacctgaac aggtggtggc tatcgcctct 2160

cacgacggag gaaaacaggc tctggaaaca gtgcagcggc tgctgcctgt gctgtgtcag 2220

gctcacggct tgactccaca gcaggtcgtg gcaattgcta gccacgacgg cggacggccc 2280

gccctggaga gcattgtggc ccagctgtct agacctgatc ctgccctggc cgccctgaca 2340

aatgatcacc tggtggccct ggcctgtctg ggaggcagac ctgccctgga tgccgtgaaa 2400

aaaggactgc ctcacgcccc tgccctgatt aaaagaacaa atagaagaat ccccgagcgg 2460

acctctcaca gagtggccgg atcccagctg gtgaaatctg agctggagga gaagaagtct 2520

gagctgagac acaagctgaa gtacgtgcct cacgagtaca tcgagctgat cgagatcgcc 2580

agaaatagca cccaggatag aatcctggag atgaaggtga tggagttctt catgaaagtg 2640

tacggctaca gaggaaagca tctgggagga agcagaaaac ctgacggagc catttataca 2700

gtgggcagcc ctatcgatta tggcgtgatc gtggatacaa aggcctacag cggaggctac 2760

aatctgccta ttggacaggc cgatgagatg cagagatacg tggaggagaa ccaaaccagg 2820

aacaagcata tcaaccctaa cgagtggtgg aaggtgtacc cttctagcgt gaccgagttc 2880

aagttcctgt ttgtgagcgg ccacttcaag ggcaattata aggcccagct gaccaggctg 2940

aaccacatca caaattgtaa tggcgccgtg ctgtctgtgg aggaactgct gattggagga 3000

gagatgatta aggccggaac actgacactg gaggaggtga gaagaaagtt caacaacggc 3060

gagatcaact tctga 3075

<210> 92

<211> 19

<212> DNA

<213> 玉米

<400> 92

cacacctcgt tgccaaagc 19

<210> 93

<211> 21

<212> DNA

<213> 玉米

<400> 93

catcgcgtcc taaacaaagg a 21

<210> 94

<211> 15

<212> DNA

<213> 玉米

<400> 94

cctgtcctgc actgc 15

<210> 95

<211> 15

<212> DNA

<213> 玉米

<400> 95

gcagtgcagg acagg 15

<210> 96

<211> 22

<212> DNA

<213> 玉米

<400> 96

tgcagtgcag tgcaggacag ga 22

<210> 97

<211> 23

<212> DNA

<213> 玉米

<400> 97

ctcgttgcca aagctgcatc cgt 23

<210> 98

<211> 1176

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 98

atgcaaaaac tcattaactc agtgcaaaac tatgcctggg gcagcaaaac ggcgttgact 60

gaactttatg gtatggaaaa tccgtccagc cagccgatgg ccgagctgtg gatgggcgca 120

catccgaaaa gcagttcacg agtgcagaat gccgccggag atatcgtttc actgcgtgat 180

gtgattgaga gtgataaatc gactctgctc ggagaggccg ttgccaaacg ctttggcgaa 240

ctgcctttcc tgttcaaagt attatgcgca gcacagccac tctccattca ggttcatcca 300

aacaaacaca attctgaaat cggttttgcc aaagaaaatg ccgcaggtat cccgatggat 360

gccgccgagc gtaactataa agatcctaac cacaagccgg agctggtttt tgcgctgacg 420

cctttccttg cgatgaacgc gtttcgtgaa ttttccgaga ttgtctccct actccagccg 480

gtcgcaggtg cacatccggc gattgctcac tttttacaac agcctgatgc cgaacgttta 540

agcgaactgt tcgccagcct gttgaatatg cagggtgaag aaaaatcccg cgcgctggcg 600

attttaaaat cggccctcga tagccagcag ggtgaaccgt ggcaaacgat tcgtttaatt 660

tctgaatttt acccggaaga cagcggtctg ttctccccgc tattgctgaa tgtggtgaaa 720

ttgaaccctg gcgaagcgat gttcctgttc gctgaaacac cgcacgctta cctgcaaggc 780

gtggcgctgg aagtgatggc aaactccgat aacgtgctgc gtgcgggtct gacgcctaaa 840

tacattgata ttccggaact ggttgccaat gtgaaattcg aagccaaacc ggctaaccag 900

ttgttgaccc agccggtgaa acaaggtgca gaactggact tcccgattcc agtggatgat 960

tttgccttct cgctgcatga ccttagtgat aaagaaacca ccattagcca gcagagtgcc 1020

gccattttgt tctgcgtcga aggcgatgca acgttgtgga aaggttctca gcagttacag 1080

cttaaaccgg gtgaatcagc gtttattgcc gccaacgaat caccggtgac tgtcaaaggc 1140

cacggccgtt tagcgcgtgt ttacaacaag ctgtaa 1176

<210> 99

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 99

ttaactcagt gcaaaactat gcctggggca gcaaaacggc gttgactgaa 50

<210> 100

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 100

tctccattca ggttcatcca aacaaacaca attctgaaat cggttttgcc aaa 53

<210> 101

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 101

tgcacatccg gcgattgctc actttttaca acagcctgat gccgaacgtt taa 53

<210> 102

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 102

ttaactcagt gcaaaact 18

<210> 103

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 103

ttcagtcaac gccgtttt 18

<210> 104

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 104

tctccattca ggttcatcc 19

<210> 105

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 105

tttggcaaaa ccgatttca 19

<210> 106

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 106

tgcacatccg gcgattgct 19

<210> 107

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 107

ttaaacgttc ggcatcag 18

<210> 108

<211> 1000

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 108

Met Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Val Asp Leu Arg Thr

1 5 10 15

Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg

20 25 30

Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr

35 40 45

His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr

50 55 60

Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala Thr

65 70 75 80

His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala

85 90 95

Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu

100 105 110

Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val

115 120 125

Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala

130 135 140

Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly

145 150 155 160

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

165 170 175

Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

180 185 190

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

195 200 205

Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

210 215 220

Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255

Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln

275 280 285

Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

340 345 350

Thr Pro Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln

355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly

385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415

Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly

420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445

Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460

Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

500 505 510

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

515 520 525

Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

530 535 540

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

545 550 555 560

Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr

565 570 575

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

580 585 590

Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu

595 600 605

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

610 615 620

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

625 630 635 640

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

645 650 655

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Arg His Asp Gly Gly

660 665 670

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

675 680 685

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly

690 695 700

Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

705 710 715 720

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

725 730 735

Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro

740 745 750

His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg

755 760 765

Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu

770 775 780

Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met

785 790 795 800

Thr Gln Phe Gly Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser

805 810 815

Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu

820 825 830

Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys

835 840 845

Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu

850 855 860

Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro

865 870 875 880

Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr

885 890 895

Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu

900 905 910

Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val

915 920 925

Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His

930 935 940

Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr

945 950 955 960

Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly

965 970 975

Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys

980 985 990

Phe Asn Asn Gly Glu Ile Asn Phe

995 1000

<210> 109

<211> 1000

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 109

Met Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Val Asp Leu Arg Thr

1 5 10 15

Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg

20 25 30

Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr

35 40 45

His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr

50 55 60

Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala Thr

65 70 75 80

His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala

85 90 95

Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro Leu

100 105 110

Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly Val

115 120 125

Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly Ala

130 135 140

Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly

145 150 155 160

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

165 170 175

Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

180 185 190

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

195 200 205

Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

210 215 220

Ala Arg Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255

Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln

275 280 285

Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

340 345 350

Thr Pro Glu Gln Val Val Ala Ile Ala Arg Asn Ile Gly Gly Lys Gln

355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly

385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415

Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp

420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445

Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460

Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

500 505 510

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

515 520 525

Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

530 535 540

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

545 550 555 560

Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr

565 570 575

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

580 585 590

Glu Gln Val Val Ala Ile Ala Arg Asn Gly Gly Gly Lys Gln Ala Leu

595 600 605

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

610 615 620

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln

625 630 635 640

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

645 650 655

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Arg Asn Gly Gly Gly

660 665 670

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

675 680 685

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly

690 695 700

Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

705 710 715 720

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

725 730 735

Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys Gly Leu Pro

740 745 750

His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile Gly Glu Arg

755 760 765

Thr Ser His Arg Val Ala Asp Tyr Ala Gln Val Val Arg Val Leu Glu

770 775 780

Phe Phe Gln Cys His Ser His Pro Ala Tyr Ala Phe Asp Glu Ala Met

785 790 795 800

Thr Gln Phe Gly Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser

805 810 815

Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu

820 825 830

Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys

835 840 845

Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu

850 855 860

Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro

865 870 875 880

Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr

885 890 895

Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu

900 905 910

Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val

915 920 925

Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His

930 935 940

Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr

945 950 955 960

Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly

965 970 975

Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys

980 985 990

Phe Asn Asn Gly Glu Ile Asn Phe

995 1000

<210> 110

<211> 1001

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 110

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Tyr Pro Tyr Asp

1 5 10 15

Val Pro Asp Tyr Ala Ile Asp Ile Ala Asp Leu Arg Thr Leu Gly Tyr

20 25 30

Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val

35 40 45

Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His

50 55 60

Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val

65 70 75 80

Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala

85 90 95

Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala

100 105 110

Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp

115 120 125

Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val

130 135 140

Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn

145 150 155 160

Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

165 170 175

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

180 185 190

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

195 200 205

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

210 215 220

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

225 230 235 240

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val

245 250 255

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

260 265 270

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

275 280 285

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

290 295 300

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala

305 310 315 320

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val

325 330 335

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

340 345 350

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

355 360 365

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

370 375 380

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

385 390 395 400

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

405 410 415

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

420 425 430

Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

435 440 445

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

450 455 460

His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly

465 470 475 480

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

485 490 495

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

500 505 510

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

515 520 525

Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala

530 535 540

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

545 550 555 560

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

565 570 575

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala

580 585 590

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val

595 600 605

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

610 615 620

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln

625 630 635 640

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

645 650 655

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

660 665 670

Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

675 680 685

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

690 695 700

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

705 710 715 720

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

725 730 735

His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly

740 745 750

Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp

755 760 765

Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys

770 775 780

Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly Asp

785 790 795 800

Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

805 810 815

Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu

820 825 830

Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met

835 840 845

Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His

850 855 860

Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser

865 870 875 880

Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly

885 890 895

Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu

900 905 910

Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys

915 920 925

Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly

930 935 940

His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile

945 950 955 960

Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly

965 970 975

Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg

980 985 990

Lys Phe Asn Asn Gly Glu Ile Asn Phe

995 1000

<210> 111

<211> 1007

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 111

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Lys Glu Thr Ala

1 5 10 15

Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ile Asp Ile Ala Asp

20 25 30

Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro

35 40 45

Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His

50 55 60

Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala

65 70 75 80

Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro

85 90 95

Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly

100 105 110

Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly

115 120 125

Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg

130 135 140

Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu

145 150 155 160

Thr Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala Ile Ala

165 170 175

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

180 185 190

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

195 200 205

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala

210 215 220

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

225 230 235 240

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

245 250 255

Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

260 265 270

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

275 280 285

Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

290 295 300

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

305 310 315 320

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

325 330 335

Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

340 345 350

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

355 360 365

His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly

370 375 380

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

385 390 395 400

Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn

405 410 415

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

420 425 430

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

435 440 445

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

450 455 460

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala

465 470 475 480

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

485 490 495

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val

500 505 510

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

515 520 525

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

530 535 540

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

545 550 555 560

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

565 570 575

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

580 585 590

Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly

595 600 605

Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

610 615 620

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

625 630 635 640

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

645 650 655

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

660 665 670

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

675 680 685

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val

690 695 700

Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala

705 710 715 720

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

725 730 735

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala

740 745 750

Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala

755 760 765

Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His

770 775 780

Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val

785 790 795 800

Lys Lys Gly Leu Gly Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser

805 810 815

Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val

820 825 830

Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln

835 840 845

Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr

850 855 860

Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala

865 870 875 880

Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr

885 890 895

Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu

900 905 910

Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn

915 920 925

Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys

930 935 940

Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu

945 950 955 960

Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val

965 970 975

Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr

980 985 990

Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

995 1000 1005

<210> 112

<211> 3003

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 112

atggagcaga agctgatcag cgaggaggac ctcgtcgacc tcaggaccct gggctacagc 60

cagcagcagc aggagaagat caagccgaag gtgaggagca ccgtggccca gcaccacgag 120

gctctggtgg gccacggctt cacccacgct cacatcgtgg ccctgagcca gcacccagct 180

gctctgggca ccgtggctgt gacctaccag cacatcatca ccgccctgcc agaggctacc 240

cacgaggaca tcgtgggcgt gggcaagcag tggagcggcg ctagggccct ggaggctctg 300

ctgaccgatg ctggcgagct gaggggccca ccgctccagc tggataccgg ccagctggtg 360

aagatcgcca agaggggcgg cgtgaccgct atggaggctg tgcacgccag caggaacgct 420

ctgaccggcg ctccactgaa cctgaccccc gaccaggtgg tggccatcgc gagcaacggc 480

ggcggcaagc aggctctcga aaccgtgcag aggctgctcc cggtgctgtg ccaggcccac 540

ggcctcaccc cagaccaggt cgtcgcgatc gcctccaaca tcggcggcaa gcaggccctg 600

gagactgtgc agcgcctgct gcccgtcctg tgccaggacc acggcctcac cccggagcag 660

gtcgtcgcta tcgctagaaa catcggcggc aagcaggcgc tcgaaaccgt ccagaggctc 720

ctcccagtcc tctgccagga tcacggcctg accccggatc aggtggtcgc catcgcttca 780

cacgacggcg gcaagcaggc gctggagact gtccagcgcc tcctcccagt cctctgccag 840

gcgcacggcc tcacccccga tcaggtcgtg gcgatcgcga gaaacggcgg cggcaagcag 900

gctctcgaaa ccgtgcagag gctgctgccg gtgctctgcc aggctcacgg cctgacccca 960

gaccaggtgg tggctatcgc ctcccacgac ggcggcaagc aggccctgga gactgtgcag 1020

aggctgctgc cggtcctgtg ccaggcccac ggcctcaccc ccgagcaggt cgtcgcgatc 1080

gctagaaaca tcggcggcaa gcaggccctg gagactgtcc agaggctcct cccggtcctg 1140

tgccaggacc acggcctgac cccggaccag gtggtcgcca tcgcctccaa caagggcggc 1200

aagcaggcgc tcgaaaccgt gcagaggctc ctgccggtgc tctgccagga tcacggcctg 1260

accccagagc aggtggtggc tatcgcgagc aacggcggcg gcaagcaggc tctcgaaacc 1320

gtccagaggc tcctcccagt gctctgccag gctcacggcc tcaccccgga ccaggtcgtc 1380

gccatcgctt caaacaaggg cggcaagcag gccctggaga ctgtgcagag gctgctgccc 1440

gtgctgtgcc aggaccacgg cctgacccca gatcaggtgg tggctatcgc tagccacgac 1500

ggcggcaagc aggcgctgga gactgtccag aggctcctcc cagtcctgtg ccaggatcac 1560

ggcctcaccc cggaccaggt cgtcgccatc gcttcaaaca tcggcggcaa gcaggccctg 1620

gagactgtgc agaggctgct gcccgtgctg tgccaggacc acggcctcac cccggatcag 1680

gtcgtggcca tcgcgtccaa catcggcggc aagcaggcgc tggagactgt ccagaggctg 1740

ctgcccgtcc tgtgccaggc gcacggcctc accccagagc aggtcgtcgc catcgccaga 1800

aacatcggcg gcaagcaggc tctcgaaacc gtgcagaggc tgctgcccgt gctctgccag 1860

gcccacggcc tgaccccgga gcaggtggtg gcgatcgcct ccaacatcgg cggcaagcag 1920

gctctcgaaa ccgtgcagag gctcctcccc gtgctctgcc aggctcacgg cctgaccccc 1980

gatcaggtgg tcgcgatcgc tagacacgac ggcggcaagc aggccctgga gactgtccag 2040

cgcctgctgc cagtcctgtg ccaggaccac ggcctcaccc ccgaccaggt cgtggctatc 2100

gcgtccaacg gcggcggcaa gcaggctctc gagagcatcg tggcccagct gagcaggccg 2160

gacccggccc tggccgccct gaccaacgat cacctggtgg ctctggcctg cctgggcggc 2220

aggccagcca tggacgctgt gaagaagggc ctgccgcacg ctccagagct gatccgcagg 2280

gtgaacagga ggatcggcga gaggaccagc cacagggtgg ccgactacgc tcaggtggtg 2340

agggtgctgg agttcttcca gtgccacagc cacccggcct acgccttcga cgaggctatg 2400

acccagttcg gccagctcgt gaagagcgag ctggaggaga agaagagcga gctgaggcac 2460

aagctgaagt acgtgccaca cgagtacatc gagctgatcg agatcgccag gaacagcacc 2520

caggatcgca tcctggagat gaaggtgatg gagttcttca tgaaggtgta cggctacagg 2580

ggcaagcacc tgggcggcag caggaagcca gatggcgcca tctacaccgt gggcagccca 2640

atcgactacg gcgtgatcgt ggataccaag gcttacagcg gcggctacaa cctgccgatc 2700

ggccaggctg atgagatgca gaggtacgtg gaggagaacc agaccaggaa caagcacatc 2760

aacccaaacg agtggtggaa ggtgtacccg agcagcgtga ccgagttcaa gttcctgttc 2820

gtgagcggcc acttcaaggg caactacaag gctcagctca ccaggctgaa ccacatcacc 2880

aactgcaacg gcgccgtgct gagcgtggag gagctgctga tcggcggcga gatgatcaag 2940

gctggcaccc tgaccctgga ggaggtgagg aggaagttca acaacggcga gatcaacttc 3000

tga 3003

<210> 113

<211> 3003

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 113

atggagcaga agctgatcag cgaggaggac ctcgtcgacc tcaggaccct gggctacagc 60

cagcagcagc aggagaagat caagccgaag gtgaggagca ccgtggccca gcaccacgag 120

gctctggtgg gccacggctt cacccacgct cacatcgtgg ccctgagcca gcacccagct 180

gctctgggca ccgtggctgt gacctaccag cacatcatca ccgccctgcc agaggctacc 240

cacgaggaca tcgtgggcgt gggcaagcag tggagcggcg ctagggccct ggaggctctg 300

ctgaccgatg ctggcgagct gaggggccca ccgctccagc tggataccgg ccagctggtg 360

aagatcgcca agaggggcgg cgtgaccgct atggaggctg tgcacgccag caggaacgct 420

ctgaccggcg ctccactgaa cctgaccccc gaccaggtgg tggccatcgc gagcaacggc 480

ggcggcaagc aggctctcga aaccgtgcag aggctgctcc cggtgctgtg ccaggcccac 540

ggcctcaccc cagaccaggt cgtcgcgatc gcctcccacg acggcggcaa gcaggccctg 600

gagactgtgc agcgcctgct gcccgtcctg tgccaggacc acggcctcac cccggagcag 660

gtcgtcgcta tcgctagaaa catcggcggc aagcaggcgc tcgaaaccgt ccagaggctc 720

ctcccagtcc tctgccagga tcacggcctg accccggatc aggtggtcgc catcgcttca 780

aacaagggcg gcaagcaggc gctggagact gtccagcgcc tcctcccagt cctctgccag 840

gcgcacggcc tcacccccga tcaggtcgtg gcgatcgcga gaaacggcgg cggcaagcag 900

gctctcgaaa ccgtgcagag gctgctgccg gtgctctgcc aggctcacgg cctgacccca 960

gaccaggtgg tggctatcgc ctcccacgac ggcggcaagc aggccctgga gactgtgcag 1020

aggctgctgc cggtcctgtg ccaggcccac ggcctcaccc ccgagcaggt cgtcgcgatc 1080

gctagaaaca tcggcggcaa gcaggccctg gagactgtcc agaggctcct cccggtcctg 1140

tgccaggacc acggcctgac cccggaccag gtggtcgcca tcgcctccaa catcggcggc 1200

aagcaggcgc tcgaaaccgt gcagaggctc ctgccggtgc tctgccagga tcacggcctg 1260

accccagagc aggtggtggc tatcgcgagc cacgacggcg gcaagcaggc tctcgaaacc 1320

gtccagaggc tcctcccagt gctctgccag gctcacggcc tcaccccgga ccaggtcgtc 1380

gccatcgctt caaacaaggg cggcaagcag gccctggaga ctgtgcagag gctgctgccc 1440

gtgctgtgcc aggaccacgg cctgacccca gatcaggtgg tggctatcgc tagccacgac 1500

ggcggcaagc aggcgctgga gactgtccag aggctcctcc cagtcctgtg ccaggatcac 1560

ggcctcaccc cggaccaggt cgtcgccatc gcttcacacg acggcggcaa gcaggccctg 1620

gagactgtgc agaggctgct gcccgtgctg tgccaggacc acggcctcac cccggatcag 1680

gtcgtggcca tcgcgtccaa caagggcggc aagcaggcgc tggagactgt ccagaggctg 1740

ctgcccgtcc tgtgccaggc gcacggcctc accccagagc aggtcgtcgc catcgccaga 1800

aacggcggcg gcaagcaggc tctcgaaacc gtgcagaggc tgctgcccgt gctctgccag 1860

gcccacggcc tgaccccgga gcaggtggtg gcgatcgcct ccaacggcgg cggcaagcag 1920

gctctcgaaa ccgtgcagag gctcctcccc gtgctctgcc aggctcacgg cctgaccccc 1980

gatcaggtgg tcgcgatcgc tagaaacggc ggcggcaagc aggccctgga gactgtccag 2040

cgcctgctgc cagtcctgtg ccaggaccac ggcctcaccc ccgaccaggt cgtggctatc 2100

gcgtccaacg gcggcggcaa gcaggctctc gagagcatcg tggcccagct gagcaggccg 2160

gacccggccc tggccgccct gaccaacgat cacctggtgg ctctggcctg cctgggcggc 2220

aggccagcca tggacgctgt gaagaagggc ctgccgcacg ctccagagct gatccgcagg 2280

gtgaacagga ggatcggcga gaggaccagc cacagggtgg ccgactacgc tcaggtggtg 2340

agggtgctgg agttcttcca gtgccacagc cacccggcct acgccttcga cgaggctatg 2400

acccagttcg gccagctcgt gaagagcgag ctggaggaga agaagagcga gctgaggcac 2460

aagctgaagt acgtgccaca cgagtacatc gagctgatcg agatcgccag gaacagcacc 2520

caggatcgca tcctggagat gaaggtgatg gagttcttca tgaaggtgta cggctacagg 2580

ggcaagcacc tgggcggcag caggaagcca gatggcgcca tctacaccgt gggcagccca 2640

atcgactacg gcgtgatcgt ggataccaag gcttacagcg gcggctacaa cctgccgatc 2700

ggccaggctg atgagatgca gaggtacgtg gaggagaacc agaccaggaa caagcacatc 2760

aacccaaacg agtggtggaa ggtgtacccg agcagcgtga ccgagttcaa gttcctgttc 2820

gtgagcggcc acttcaaggg caactacaag gctcagctca ccaggctgaa ccacatcacc 2880

aactgcaacg gcgccgtgct gagcgtggag gagctgctga tcggcggcga gatgatcaag 2940

gctggcaccc tgaccctgga ggaggtgagg aggaagttca acaacggcga gatcaacttc 3000

tga 3003

<210> 114

<211> 3006

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 114

atgggcgatc ctaaaaagaa acgtaaggtc atcgattacc catacgatgt tccagattac 60

gctatcgata tcgccgatct acgcacgctc ggctacagcc agcagcaaca ggagaagatc 120

aaaccgaagg ttcgttcgac agtggcgcag caccacgagg cactggtcgg ccacgggttt 180

acacacgcgc acatcgttgc gttaagccaa cacccggcag cgttagggac cgtcgctgtc 240

aagtatcagg acatgatcgc agcgttgcca gaggcgacac acgaagcgat cgttggcgtc 300

ggcaaacagt ggtccggcgc acgcgctctg gaggccttgc tcacggtggc gggagagttg 360

agaggtccac cgttacagtt ggacacaggc caacttctca agattgcaaa acgtggcggc 420

gtgaccgcag tggaggcagt gcatgcatgg cgcaatgcac tgacgggtgc cccgctcaac 480

ttgacccccc agcaggtggt ggccatcgcc agcaataatg gtggcaagca ggcgctggag 540

acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 600

gtggccatcg ccagccacga tggcggcaag caggcgctgg agacggtcca gcggctgttg 660

ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 720

attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 780

cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 840

ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccggag 900

caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcaggcg 960

ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 1020

agcaatggcg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 1080

caggcccacg gcttgacccc ggagcaggtg gtggccatcg ccagccacga tggcggcaag 1140

caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 1200

ccggagcagg tggtggccat cgccagccac gatggcggca agcaggcgct ggagacggtc 1260

cagcggctgt tgccggtgct gtgccaggcc cacggcttga ccccccagca ggtggtggcc 1320

atcgccagca ataatggtgg caagcaggcg ctggagacgg tccagcggct gttgccggtg 1380

ctgtgccagg cccacggctt gaccccccag caggtggtgg ccatcgccag caataatggt 1440

ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 1500

ttgaccccgg agcaggtggt ggccatcgcc agccacgatg gcggcaagca ggcgctggag 1560

acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ccagcaggtg 1620

gtggccatcg ccagcaataa tggtggcaag caggcgctgg agacggtcca gcggctgttg 1680

ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 1740

attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 1800

cacggcttga ccccccagca ggtggtggcc atcgccagca atggcggtgg caagcaggcg 1860

ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccccag 1920

caggtggtgg ccatcgccag caatggcggt ggcaagcagg cgctggagac ggtccagcgg 1980

ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 2040

agcaataatg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 2100

caggcccacg gcttgacccc ggagcaggtg gtggccatcg ccagccacga tggcggcaag 2160

caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 2220

cctcagcagg tggtggccat cgccagcaat ggcggcggca ggccggcgct ggagagcatt 2280

gttgcccagt tatctcgccc tgatccggcg ttggccgcgt tgaccaacga ccacctcgtc 2340

gccttggcct gcctcggcgg gcgtcctgcg ctggatgcag tgaaaaaggg attgggggat 2400

cctatcagcc gttcccagct ggtgaaatct gagctggagg agaagaagtc tgagctgaga 2460

cacaagctga agtacgtgcc tcacgagtac atcgagctga tcgagatcgc cagaaatagc 2520

acccaggata gaatcctgga gatgaaggtg atggagttct tcatgaaagt gtacggctac 2580

agaggaaagc atctgggagg aagcagaaaa cctgacggag ccatttatac agtgggcagc 2640

cctatcgatt atggcgtgat cgtggataca aaggcctaca gcggaggcta caatctgcct 2700

attggacagg ccgatgagat gcagagatac gtggaggaga accaaaccag gaacaagcat 2760

atcaacccta acgagtggtg gaaggtgtac ccttctagcg tgaccgagtt caagttcctg 2820

tttgtgagcg gccacttcaa gggcaattat aaggcccagc tgaccaggct gaaccacatc 2880

acaaattgta atggcgccgt gctgtctgtg gaggaactgc tgattggagg agagatgatt 2940

aaggccggaa cactgacact ggaggaggtg agaagaaagt tcaacaacgg cgagatcaac 3000

ttctga 3006

<210> 115

<211> 3024

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 115

atgggcgatc ctaaaaagaa acgtaaggtc atcgataagg agaccgccgc tgccaagttc 60

gagagacagc acatggacag catcgatatc gccgatctac gcacgctcgg ctacagccag 120

cagcaacagg agaagatcaa accgaaggtt cgttcgacag tggcgcagca ccacgaggca 180

ctggtcggcc acgggtttac acacgcgcac atcgttgcgt taagccaaca cccggcagcg 240

ttagggaccg tcgctgtcaa gtatcaggac atgatcgcag cgttgccaga ggcgacacac 300

gaagcgatcg ttggcgtcgg caaacagtgg tccggcgcac gcgctctgga ggccttgctc 360

acggtggcgg gagagttgag aggtccaccg ttacagttgg acacaggcca acttctcaag 420

attgcaaaac gtggcggcgt gaccgcagtg gaggcagtgc atgcatggcg caatgcactg 480

acgggtgccc cgctcaactt gaccccccag caggtggtgg ccatcgccag caatggcggt 540

ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 600

ttgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 660

acggtgcagg cgctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 720

gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca ggcgctgttg 780

ccggtgctgt gccaggccca cggcttgacc ccggagcagg tggtggccat cgccagcaat 840

attggtggca agcaggcgct ggagacggtg caggcgctgt tgccggtgct gtgccaggcc 900

cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 960

ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccccag 1020

caggtggtgg ccatcgccag caataatggt ggcaagcagg cgctggagac ggtccagcgg 1080

ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 1140

agcaatggcg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 1200

caggcccacg gcttgacccc ccagcaggtg gtggccatcg ccagcaatgg cggtggcaag 1260

caggcgctgg agacggtcca gcggctgttg ccggtgctgt gccaggccca cggcttgacc 1320

ccggagcagg tggtggccat cgccagccac gatggcggca agcaggcgct ggagacggtc 1380

cagcggctgt tgccggtgct gtgccaggcc cacggcttga ccccccagca ggtggtggcc 1440

atcgccagca ataatggtgg caagcaggcg ctggagacgg tccagcggct gttgccggtg 1500

ctgtgccagg cccacggctt gaccccccag caggtggtgg ccatcgccag caataatggt 1560

ggcaagcagg cgctggagac ggtccagcgg ctgttgccgg tgctgtgcca ggcccacggc 1620

ttgaccccgg agcaggtggt ggccatcgcc agccacgatg gcggcaagca ggcgctggag 1680

acggtccagc ggctgttgcc ggtgctgtgc caggcccacg gcttgacccc ggagcaggtg 1740

gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca ggcgctgttg 1800

ccggtgctgt gccaggccca cggcttgacc ccccagcagg tggtggccat cgccagcaat 1860

ggcggtggca agcaggcgct ggagacggtc cagcggctgt tgccggtgct gtgccaggcc 1920

cacggcttga ccccggagca ggtggtggcc atcgccagcc acgatggcgg caagcaggcg 1980

ctggagacgg tccagcggct gttgccggtg ctgtgccagg cccacggctt gaccccggag 2040

caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcaggcg 2100

ctgttgccgg tgctgtgcca ggcccacggc ttgacccccc agcaggtggt ggccatcgcc 2160

agcaataatg gtggcaagca ggcgctggag acggtccagc ggctgttgcc ggtgctgtgc 2220

caggcccacg gcttgacccc tcagcaggtg gtggccatcg ccagcaatgg cggcggcagg 2280

ccggcgctgg agagcattgt tgcccagtta tctcgccctg atccggcgtt ggccgcgttg 2340

accaacgacc acctcgtcgc cttggcctgc ctcggcgggc gtcctgcgct ggatgcagtg 2400

aaaaagggat tgggggatcc tatcagccgt tcccagctgg tgaaatctga gctggaggag 2460

aagaagtctg agctgagaca caagctgaag tacgtgcctc acgagtacat cgagctgatc 2520

gagatcgcca gaaatagcac ccaggataga atcctggaga tgaaggtgat ggagttcttc 2580

atgaaagtgt acggctacag aggaaagcat ctgggaggaa gcagaaaacc tgacggagcc 2640

atttatacag tgggcagccc tatcgattat ggcgtgatcg tggatacaaa ggcctacagc 2700

ggaggctaca atctgcctat tggacaggcc gatgagatgc agagatacgt ggaggagaac 2760

caaaccagga acaagcatat caaccctaac gagtggtgga aggtgtaccc ttctagcgtg 2820

accgagttca agttcctgtt tgtgagcggc cacttcaagg gcaattataa ggcccagctg 2880

accaggctga accacatcac aaattgtaat ggcgccgtgc tgtctgtgga ggaactgctg 2940

attggaggag agatgattaa ggccggaaca ctgacactgg aggaggtgag aagaaagttc 3000

aacaacggcg agatcaactt ctga 3024

<210> 116

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 116

atagagatcc tctagagtcg accatggtga tcactgcagg catgcaagct tgt 53

<210> 117

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 117

atagagatcc tctagagt 18

<210> 118

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌

<400> 118

acaagcttgc atgcctgc 18

<210> 119

<211> 1344

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 119

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

515 520 525

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

820 825 830

Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

835 840 845

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

850 855 860

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

865 870 875 880

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

885 890 895

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile

900 905 910

Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn

915 920 925

Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp

930 935 940

Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val

945 950 955 960

Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala

965 970 975

Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala

980 985 990

Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly

995 1000 1005

Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala

1010 1015 1020

Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile

1025 1030 1035

Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser

1040 1045 1050

Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser

1055 1060 1065

Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp

1070 1075 1080

Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala

1085 1090 1095

Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro

1100 1105 1110

Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys

1115 1120 1125

Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr

1130 1135 1140

Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

1145 1150 1155

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr

1160 1165 1170

Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile

1175 1180 1185

Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr

1190 1195 1200

Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile

1205 1210 1215

Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr

1220 1225 1230

Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp

1235 1240 1245

Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His

1250 1255 1260

Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr

1265 1270 1275

Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr

1280 1285 1290

Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly

1295 1300 1305

Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile

1310 1315 1320

Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn

1325 1330 1335

Asn Gly Glu Ile Asn Phe

1340

<210> 120

<211> 1344

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 120

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Ile Arg Pro Arg Arg

20 25 30

Pro Ser Pro Ala Arg Glu Leu Leu Pro Gly Pro Gln Pro Asp Arg Val

35 40 45

Gln Pro Thr Ala Asp Arg Gly Val Ser Ala Pro Ala Gly Ser Pro Leu

50 55 60

Asp Gly Leu Pro Ala Arg Arg Thr Val Ser Arg Thr Arg Leu Pro Ser

65 70 75 80

Pro Pro Ala Pro Ser Pro Ala Phe Ser Ala Gly Ser Phe Ser Asp Leu

85 90 95

Leu Arg Pro Phe Asp Pro Ser Leu Leu Asp Thr Ser Leu Leu Asp Ser

100 105 110

Met Pro Ala Val Gly Thr Pro His Thr Ala Ala Ala Pro Ala Glu Trp

115 120 125

Asp Glu Met Gln Ser Ala Leu Arg Ala Ala Asp Asp Pro Pro Pro Thr

130 135 140

Val Arg Val Ala Val Thr Ala Ala Arg Pro Pro Arg Ala Lys Pro Ala

145 150 155 160

Pro Arg Arg Arg Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln

165 170 175

Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile

180 185 190

Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val

195 200 205

Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro

210 215 220

Ala Ala Leu Gly Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala

225 230 235 240

Leu Pro Glu Ala Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp

245 250 255

Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu

260 265 270

Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala

275 280 285

Lys Arg Gly Gly Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn

290 295 300

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

405 410 415

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

515 520 525

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val

610 615 620

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

705 710 715 720

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His

785 790 795 800

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

805 810 815

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

820 825 830

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

835 840 845

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

850 855 860

Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

865 870 875 880

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

885 890 895

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile

900 905 910

Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn

915 920 925

Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp

930 935 940

Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val

945 950 955 960

Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Asp Tyr Ala

965 970 975

Gln Val Val Arg Val Leu Glu Phe Phe Gln Cys His Ser His Pro Ala

980 985 990

Tyr Ala Phe Asp Glu Ala Met Thr Gln Phe Gly Met Ser Arg Asn Gly

995 1000 1005

Leu Val Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala

1010 1015 1020

Arg Gly Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile

1025 1030 1035

Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser

1040 1045 1050

Ala Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser

1055 1060 1065

Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp

1070 1075 1080

Gln Thr Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala

1085 1090 1095

Val Thr Gly Pro Ser Ala Gln Gln Ala Val Glu Val Arg Val Pro

1100 1105 1110

Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys

1115 1120 1125

Arg Pro Arg Thr Arg Ile Trp Gly Gly Leu Pro Asp Pro Gly Thr

1130 1135 1140

Pro Thr Ala Ala Asp Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

1145 1150 1155

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr

1160 1165 1170

Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile

1175 1180 1185

Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr

1190 1195 1200

Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile

1205 1210 1215

Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr

1220 1225 1230

Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp

1235 1240 1245

Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His

1250 1255 1260

Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr

1265 1270 1275

Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr

1280 1285 1290

Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly

1295 1300 1305

Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile

1310 1315 1320

Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn

1325 1330 1335

Asn Gly Glu Ile Asn Phe

1340

<210> 121

<211> 1038

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 121

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

450 455 460

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu

770 775 780

Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val

785 790 795 800

Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys

805 810 815

Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile

820 825 830

Gly Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu

835 840 845

Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro

850 855 860

His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp

865 870 875 880

Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly

885 890 895

Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile

900 905 910

Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys

915 920 925

Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met

930 935 940

Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro

945 950 955 960

Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe

965 970 975

Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr

980 985 990

Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu

995 1000 1005

Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr

1010 1015 1020

Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1025 1030 1035

<210> 122

<211> 1038

<212> PRT

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 122

Met Ala Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp

1 5 10 15

Ala Ser Gly Trp Ser Arg Met His Ala Asp Pro Trp Pro Arg Arg Arg

20 25 30

Ala Ala Gln Pro Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg

35 40 45

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

50 55 60

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

65 70 75 80

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

85 90 95

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

100 105 110

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

115 120 125

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

130 135 140

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

145 150 155 160

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

165 170 175

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

180 185 190

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

195 200 205

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

210 215 220

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

225 230 235 240

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala

245 250 255

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

260 265 270

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

275 280 285

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

290 295 300

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp

305 310 315 320

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

325 330 335

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

340 345 350

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

355 360 365

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

370 375 380

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

385 390 395 400

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

405 410 415

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

420 425 430

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

435 440 445

Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

450 455 460

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

465 470 475 480

Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

485 490 495

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

500 505 510

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala

515 520 525

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

530 535 540

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val

545 550 555 560

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

565 570 575

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

580 585 590

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

595 600 605

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

610 615 620

Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

625 630 635 640

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

645 650 655

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

660 665 670

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

675 680 685

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

690 695 700

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

705 710 715 720

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

725 730 735

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

740 745 750

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

755 760 765

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu

770 775 780

Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val

785 790 795 800

Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys

805 810 815

Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile

820 825 830

Gly Glu Arg Thr Ser His Arg Val Ala Leu Gln Leu Val Lys Ser Glu

835 840 845

Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro

850 855 860

His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp

865 870 875 880

Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly

885 890 895

Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile

900 905 910

Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys

915 920 925

Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met

930 935 940

Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro

945 950 955 960

Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe

965 970 975

Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr

980 985 990

Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu

995 1000 1005

Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr

1010 1015 1020

Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe

1025 1030 1035

<210> 123

<211> 4035

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 123

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc caacggcggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttccaacaa cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380

atcggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctcca acaacggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560

caggtcgtcg cgatcgctag caacatcggc ggcaagcagg ccctggagac tgtgcagagg 1620

ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680

agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740

caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagccacga cggcggcaag 1800

caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860

ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920

cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980

atcgcctcca acggcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040

ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag ccacgacggc 2100

ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160

ctgaccccgg atcaggtggt cgccatcgct tccaacggcg gcggcaagca ggcgctggag 2220

actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280

gtggcgatcg cgagcaacat cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340

ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctccaac 2400

aacggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460

cacggcctca cccccgagca ggtcgtcgcg atcgctagca acatcggcgg caagcaggcc 2520

ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580

caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640

ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700

tccaacggcg gcggcaagca ggctctcgag agcatcgtgg cccagctgag caggccggac 2760

ccggccctgg ccgccctgac caacgatcac ctggtggctc tggcctgcct gggcggcagg 2820

ccagccatgg acgctgtgaa gaagggcctg ccgcacgctc cagagctgat ccgcagggtg 2880

aacaggagga tcggcgagag gaccagccac agggtggccg actacgctca ggtggtgagg 2940

gtgctggagt tcttccagtg ccacagccac ccggcctacg ccttcgacga ggctatgacc 3000

cagttcggca tgagcaggaa cggcctggtg cagctgttca ggagggtggg cgtgaccgag 3060

ctggaggcta ggggcggcac cctgccgcca gctagccaga ggtgggaccg catcctccag 3120

gccagcggca tgaaaagggc taagccaagc ccgaccagcg ctcagacccc agatcaggct 3180

agcctgcacg ctttcgccga cagcctggag agggatctgg atgctccgag cccaatgcac 3240

gagggcgacc agaccagggc cagcagcagg aagaggagca ggagcgacag ggctgtgacc 3300

ggcccgagcg cccagcaggc tgtggaggtg agggtgccag agcagaggga tgccctgcac 3360

ctgccgctga gctggagggt gaagaggcca aggaccagga tctggggcgg cctgccagat 3420

ccgggcaccc caaccgctgc tgatcagctc gtgaagagcg agctggagga gaagaagagc 3480

gagctgaggc ataaactgaa gtacgtgcca cacgagtaca tcgagctgat cgagatcgcc 3540

aggaacagca cccaggatcg catcctggag atgaaggtga tggagttctt catgaaagtg 3600

tacggctaca ggggcaagca cctgggcggc agcaggaagc cagatggcgc catctacacc 3660

gtgggcagcc caatcgacta cggcgtgatc gtggatacca aggcttacag cggcggctac 3720

aacctgccga tcggccaggc tgatgagatg cagaggtacg tggaggagaa tcaaaccagg 3780

aacaagcaca tcaacccaaa cgagtggtgg aaggtgtacc cgagcagcgt gaccgagttc 3840

aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggctcagct caccaggctg 3900

aaccacatca ccaactgcaa cggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 3960

gagatgatca aggctggcac cctgaccctg gaggaggtga ggaggaagtt caacaacggc 4020

gagatcaact tctga 4035

<210> 124

<211> 4035

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 124

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc aatcaggccg aggaggccaa gcccagcaag ggagctgctg 120

ccaggcccac agccagatag ggtgcagcca accgccgata ggggcgtgag cgctccagct 180

ggcagcccgc tggatggcct gccagctagg aggaccgtga gcaggaccag gctgccgagc 240

ccaccagctc cgagcccagc cttcagcgct ggcagcttca gcgatctgct gaggccattc 300

gatccgagcc tgctggatac atcgctgctg gatagcatgc cagctgtggg caccccacac 360

accgctgctg ctccagctga gtgggatgag atgcagtccg ccctccgcgc cgccgacgac 420

ccgccgccaa ccgtgagggt ggccgtgacc gctgctaggc cgccaagggc taagccagct 480

ccaaggagga gggccgctca gccaagcgat gctagccccg ccgcgcaggt cgacctcagg 540

accctgggct acagccagca gcagcaggag aagatcaagc cgaaggtgag gagcaccgtg 600

gcccagcacc acgaggctct ggtgggccac ggcttcaccc acgctcacat cgtggccctg 660

agccagcacc cagctgctct gggcaccgtg gctgtgacct accagcacat catcaccgcc 720

ctgccagagg ctacccacga ggacatcgtg ggcgtgggca agcagtggag cggcgctagg 780

gccctggagg ctctgctgac cgatgctggc gagctgaggg gcccaccgct ccagctggat 840

accggccagc tggtgaagat cgccaagagg ggcggcgtga ccgctatgga ggctgtgcac 900

gccagcagga acgctctgac cggcgctcca ctgaacctga cccccgacca ggtggtggcc 960

atcgcgagca acatcggcgg caagcaggct ctcgaaaccg tgcagaggct gctcccggtg 1020

ctgtgccagg cccacggcct caccccagac caggtcgtcg cgatcgcctc ccacgatggc 1080

ggcaagcagg ccctggagac tgtgcagcgc ctgctgcccg tcctgtgcca ggaccacggc 1140

ctcaccccgg agcaggtcgt cgctatcgct agcaacatcg gcggcaagca ggcgctcgaa 1200

accgtccaga ggctcctccc agtcctctgc caggatcacg gcctgacccc ggatcaggtg 1260

gtcgccatcg cttccaacat cggcggcaag caggcgctgg agactgtcca gcgcctcctc 1320

ccagtcctct gccaggcgca cggcctcacc cccgatcagg tcgtggcgat cgcgagcaac 1380

aacggcggca agcaggctct cgaaaccgtg cagaggctgc tgccggtgct ctgccaggct 1440

cacggcctga ccccagacca ggtggtggct atcgcctccc acgatggcgg caagcaggcc 1500

ctggagactg tgcagaggct cctcccggtc ctgtgccagg cccacggcct cacccccgag 1560

caggtcgtcg cgatcgctag caacggcggc ggcaagcagg ccctggagac tgtgcagagg 1620

ctgctcccag tcctgtgcca ggcccacggc ctgacccccg agcaggtggt cgcgatcgcg 1680

agcaacggcg gcggcaagca ggcgctcgaa accgtccaga ggctcctccc cgtgctctgc 1740

caggatcacg gcctgacccc agagcaggtg gtggctatcg cgagcaacaa cggcggcaag 1800

caggctctcg aaaccgtcca gaggctcctc ccagtgctct gccaggctca cggcctcacc 1860

ccggaccagg tcgtcgccat cgcttcccac gatggcggca agcaggctct cgaaaccgtg 1920

cagaggctgc tcccggtgct gtgccaggcc cacggcctca ccccagacca ggtcgtcgcg 1980

atcgcctcca acatcggcgg caagcaggcc ctggagactg tgcagcgcct gctgcccgtc 2040

ctgtgccagg accacggcct caccccggag caggtcgtcg ctatcgctag caacggcggc 2100

ggcaagcagg cgctcgaaac cgtccagagg ctcctcccag tcctctgcca ggatcacggc 2160

ctgaccccgg atcaggtggt cgccatcgct tccaacaacg gcggcaagca ggcgctggag 2220

actgtccagc gcctcctccc agtcctctgc caggcgcacg gcctcacccc cgatcaggtc 2280

gtggcgatcg cgagccacga cggcggcaag caggctctcg aaaccgtgca gaggctgctg 2340

ccggtgctct gccaggctca cggcctgacc ccagaccagg tggtggctat cgcctcccac 2400

gatggcggca agcaggccct ggagactgtg cagaggctcc tcccggtcct gtgccaggcc 2460

cacggcctca cccccgagca ggtcgtcgcg atcgctagca acggcggcgg caagcaggcc 2520

ctggagactg tgcagaggct gctcccagtc ctgtgccagg cccacggcct gacccccgag 2580

caggtggtcg cgatcgcgag caacaacggc ggcaagcagg cgctcgaaac cgtccagagg 2640

ctcctccccg tgctctgcca ggatcacggc ctcacccccg accaggtcgt ggctatcgcg 2700

tcccacgatg gcggcaagca ggctctcgag agcatcgtgg cccagctgag caggccggac 2760

ccggccctgg ccgccctgac caacgatcac ctggtggctc tggcctgcct gggcggcagg 2820

ccagccatgg acgctgtgaa gaagggcctg ccgcacgctc cagagctgat ccgcagggtg 2880

aacaggagga tcggcgagag gaccagccac agggtggccg actacgctca ggtggtgagg 2940

gtgctggagt tcttccagtg ccacagccac ccggcctacg ccttcgacga ggctatgacc 3000

cagttcggca tgagcaggaa cggcctggtg cagctgttca ggagggtggg cgtgaccgag 3060

ctggaggcta ggggcggcac cctgccgcca gctagccaga ggtgggaccg catcctccag 3120

gccagcggca tgaaaagggc taagccaagc ccgaccagcg ctcagacccc agatcaggct 3180

agcctgcacg ctttcgccga cagcctggag agggatctgg atgctccgag cccaatgcac 3240

gagggcgacc agaccagggc cagcagcagg aagaggagca ggagcgacag ggctgtgacc 3300

ggcccgagcg cccagcaggc tgtggaggtg agggtgccag agcagaggga tgccctgcac 3360

ctgccgctga gctggagggt gaagaggcca aggaccagga tctggggcgg cctgccagat 3420

ccgggcaccc caaccgctgc tgatcagctc gtgaagagcg agctggagga gaagaagagc 3480

gagctgaggc ataaactgaa gtacgtgcca cacgagtaca tcgagctgat cgagatcgcc 3540

aggaacagca cccaggatcg catcctggag atgaaggtga tggagttctt catgaaagtg 3600

tacggctaca ggggcaagca cctgggcggc agcaggaagc cagatggcgc catctacacc 3660

gtgggcagcc caatcgacta cggcgtgatc gtggatacca aggcttacag cggcggctac 3720

aacctgccga tcggccaggc tgatgagatg cagaggtacg tggaggagaa tcaaaccagg 3780

aacaagcaca tcaacccaaa cgagtggtgg aaggtgtacc cgagcagcgt gaccgagttc 3840

aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggctcagct caccaggctg 3900

aaccacatca ccaactgcaa cggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 3960

gagatgatca aggctggcac cctgaccctg gaggaggtga ggaggaagtt caacaacggc 4020

gagatcaact tctga 4035

<210> 125

<211> 3114

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 125

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctccaacgg cggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttcca acaacggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag caacatcggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tccaacaacg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140

caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacat cggcggcaag 1200

caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260

cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320

cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380

atcgcgagcc acgacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440

ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500

ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560

ctcaccccag accaggtcgt cgcgatcgcc tccaacggcg gcggcaagca ggccctggag 1620

actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680

gtcgctatcg ctagccacga cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740

ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800

ggcggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860

cacggcctca cccccgatca ggtcgtggcg atcgcgagca acatcggcgg caagcaggct 1920

ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980

caggtggtgg ctatcgcctc caacaacggc ggcaagcagg ccctggagac tgtgcagagg 2040

ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100

agcaacatcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160

caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220

caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280

cccgaccagg tcgtggctat cgcgtccaac ggcggcggca agcaggctct cgagagcatc 2340

gtggcccagc tgagcaggcc ggacccggcc ctggccgccc tgaccaacga tcacctggtg 2400

gctctggcct gcctgggcgg caggccagcc atggacgctg tgaagaaggg cctgccgcac 2460

gctccagagc tgatccgcag ggtgaacagg aggatcggcg agaggaccag ccacagggtg 2520

gccctgcagc tcgtgaagag cgagctggag gagaagaaga gcgagctgag gcataaactg 2580

aagtacgtgc cacacgagta catcgagctg atcgagatcg ccaggaacag cacccaggat 2640

cgcatcctgg agatgaaggt gatggagttc ttcatgaaag tgtacggcta caggggcaag 2700

cacctgggcg gcagcaggaa gccagatggc gccatctaca ccgtgggcag cccaatcgac 2760

tacggcgtga tcgtggatac caaggcttac agcggcggct acaacctgcc gatcggccag 2820

gctgatgaga tgcagaggta cgtggaggag aatcaaacca ggaacaagca catcaaccca 2880

aacgagtggt ggaaggtgta cccgagcagc gtgaccgagt tcaagttcct gttcgtgagc 2940

ggccacttca agggcaacta caaggctcag ctcaccaggc tgaaccacat caccaactgc 3000

aacggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaggctggc 3060

accctgaccc tggaggaggt gaggaggaag ttcaacaacg gcgagatcaa cttc 3114

<210> 126

<211> 3114

<212> DNA

<213> 人工序列

<220>

<223> 黄单胞菌属，大肠杆菌

<400> 126

atggctagct cccccccgaa gaagaagagg aaggtcagct ggaaggatgc tagcggctgg 60

agcaggatgc acgctgatcc atggccaagg aggagggccg ctcagccaag cgatgctagc 120

cccgccgcgc aggtcgacct caggaccctg ggctacagcc agcagcagca ggagaagatc 180

aagccgaagg tgaggagcac cgtggcccag caccacgagg ctctggtggg ccacggcttc 240

acccacgctc acatcgtggc cctgagccag cacccagctg ctctgggcac cgtggctgtg 300

acctaccagc acatcatcac cgccctgcca gaggctaccc acgaggacat cgtgggcgtg 360

ggcaagcagt ggagcggcgc tagggccctg gaggctctgc tgaccgatgc tggcgagctg 420

aggggcccac cgctccagct ggataccggc cagctggtga agatcgccaa gaggggcggc 480

gtgaccgcta tggaggctgt gcacgccagc aggaacgctc tgaccggcgc tccactgaac 540

ctgacccccg accaggtggt ggccatcgcg agcaacatcg gcggcaagca ggctctcgaa 600

accgtgcaga ggctgctccc ggtgctgtgc caggcccacg gcctcacccc agaccaggtc 660

gtcgcgatcg cctcccacga tggcggcaag caggccctgg agactgtgca gcgcctgctg 720

cccgtcctgt gccaggacca cggcctcacc ccggagcagg tcgtcgctat cgctagcaac 780

atcggcggca agcaggcgct cgaaaccgtc cagaggctcc tcccagtcct ctgccaggat 840

cacggcctga ccccggatca ggtggtcgcc atcgcttcca acatcggcgg caagcaggcg 900

ctggagactg tccagcgcct cctcccagtc ctctgccagg cgcacggcct cacccccgat 960

caggtcgtgg cgatcgcgag caacaacggc ggcaagcagg ctctcgaaac cgtgcagagg 1020

ctgctgccgg tgctctgcca ggctcacggc ctgaccccag accaggtggt ggctatcgcc 1080

tcccacgatg gcggcaagca ggccctggag actgtgcaga ggctcctccc ggtcctgtgc 1140

caggcccacg gcctcacccc cgagcaggtc gtcgcgatcg ctagcaacgg cggcggcaag 1200

caggccctgg agactgtgca gaggctgctc ccagtcctgt gccaggccca cggcctgacc 1260

cccgagcagg tggtcgcgat cgcgagcaac ggcggcggca agcaggcgct cgaaaccgtc 1320

cagaggctcc tccccgtgct ctgccaggat cacggcctga ccccagagca ggtggtggct 1380

atcgcgagca acaacggcgg caagcaggct ctcgaaaccg tccagaggct cctcccagtg 1440

ctctgccagg ctcacggcct caccccggac caggtcgtcg ccatcgcttc ccacgatggc 1500

ggcaagcagg ctctcgaaac cgtgcagagg ctgctcccgg tgctgtgcca ggcccacggc 1560

ctcaccccag accaggtcgt cgcgatcgcc tccaacatcg gcggcaagca ggccctggag 1620

actgtgcagc gcctgctgcc cgtcctgtgc caggaccacg gcctcacccc ggagcaggtc 1680

gtcgctatcg ctagcaacgg cggcggcaag caggcgctcg aaaccgtcca gaggctcctc 1740

ccagtcctct gccaggatca cggcctgacc ccggatcagg tggtcgccat cgcttccaac 1800

aacggcggca agcaggcgct ggagactgtc cagcgcctcc tcccagtcct ctgccaggcg 1860

cacggcctca cccccgatca ggtcgtggcg atcgcgagcc acgacggcgg caagcaggct 1920

ctcgaaaccg tgcagaggct gctgccggtg ctctgccagg ctcacggcct gaccccagac 1980

caggtggtgg ctatcgcctc ccacgatggc ggcaagcagg ccctggagac tgtgcagagg 2040

ctcctcccgg tcctgtgcca ggcccacggc ctcacccccg agcaggtcgt cgcgatcgct 2100

agcaacggcg gcggcaagca ggccctggag actgtgcaga ggctgctccc agtcctgtgc 2160

caggcccacg gcctgacccc cgagcaggtg gtcgcgatcg cgagcaacaa cggcggcaag 2220

caggcgctcg aaaccgtcca gaggctcctc cccgtgctct gccaggatca cggcctcacc 2280

cccgaccagg tcgtggctat cgcgtcccac gatggcggca agcaggctct cgagagcatc 2340

gtggcccagc tgagcaggcc ggacccggcc ctggccgccc tgaccaacga tcacctggtg 2400

gctctggcct gcctgggcgg caggccagcc atggacgctg tgaagaaggg cctgccgcac 2460

gctccagagc tgatccgcag ggtgaacagg aggatcggcg agaggaccag ccacagggtg 2520

gccctgcagc tcgtgaagag cgagctggag gagaagaaga gcgagctgag gcataaactg 2580

aagtacgtgc cacacgagta catcgagctg atcgagatcg ccaggaacag cacccaggat 2640

cgcatcctgg agatgaaggt gatggagttc ttcatgaaag tgtacggcta caggggcaag 2700

cacctgggcg gcagcaggaa gccagatggc gccatctaca ccgtgggcag cccaatcgac 2760

tacggcgtga tcgtggatac caaggcttac agcggcggct acaacctgcc gatcggccag 2820

gctgatgaga tgcagaggta cgtggaggag aatcaaacca ggaacaagca catcaaccca 2880

aacgagtggt ggaaggtgta cccgagcagc gtgaccgagt tcaagttcct gttcgtgagc 2940

ggccacttca agggcaacta caaggctcag ctcaccaggc tgaaccacat caccaactgc 3000

aacggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaggctggc 3060

accctgaccc tggaggaggt gaggaggaag ttcaacaacg gcgagatcaa cttc 3114

<210> 127

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 127

aaccagcgaa ccagcagcgt 20

<210> 128

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 128

tttgctacct gcggtaggtg g 21

<210> 129

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 129

cggccaattc ctgcattcgt ac 22

<210> 130

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 130

gaattgggta ccagcttgca tgc 23

<210> 131

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 131

gtgccatgta tcggttctag agc 23

<210> 132

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 玉米

<400> 132

cattaaatta cggacccaaa agcttac 27

<210> 133

<211> 3494

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌，玉米，根癌农杆菌

<400> 133

ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60

agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120

tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180

tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240

gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600

cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 660

cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 720

acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 780

ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 840

gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 900

ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 960

cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cctctctacc 1020

ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt ctgttcatgt 1080

ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca cggatgcgac 1140

ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg ggaatcctgg 1200

gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt ttcgttgcat 1260

agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc 1320

atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc 1380

tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt tggatctgta 1440

tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa atatcgatct 1500

aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat gctttttgtt 1560

cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta gatcggagta 1620

gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg tgtgtgtcat 1680

acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat aggtatacat 1740

gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct attcatatgc 1800

tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt attttgatct 1860

tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta gccctgcctt 1920

catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct gttgtttggt 1980

gttacttctg cagggatccc cgatcatgca aaaactcatt aactcagtgc aaaactatgc 2040

ctggggcagc aaaacggcgt tgactgaact ttatggtatg gaaaatccgt ccagccagcc 2100

gatggccgag ctgtggatgg gcgcacatcc gaaaagcagt tcacgagtgc agaatgccgc 2160

cggagatatc gtttcactgc gtgatgcgat tgagagtgat aaatcgactc tgctcggaga 2220

ggccgttgcc aaacgctttg gcgaactgcc tttcctgttc aaagtattat gcgcagcaca 2280

gccactctcc attcaggttc atccaaacaa acacaattct gaaatcggtt ttgccaaaga 2340

aaatgccgca ggtatcccga tggatgccgc cgagcgtaac tataaagatc ctaaccacaa 2400

gccggagctg gtttttgcgc tgacgccttt ccttgcgatg aacgcgtttc gtgaattttc 2460

cgagattgtc tccctactcc agccggtcgc aggtgcacat ccggcgattg ctcacttttt 2520

acaacagcct gatgccgaac gtttaagcga actgttcgcc agcctgttga atatgcaggg 2580

tgaagaaaaa tcccgcgcgc tggcgatttt aaaatcggcc ctcgatagcc agcatggtga 2640

accgtggcaa acgattcgtt taatttctga attttacccg gaagacagcg gtctgttctc 2700

cccgctattg ctgaatgtgg tgaaattgaa ccctggcgaa gcgatgttcc tgttcgctga 2760

aacaccgcac gcttacctgc aaggcgtggc gctggaagtg atggcaaact ccgataacgt 2820

gctgcgtgcg ggtctgacgc ctaaatacat tgatattccg gaactggttg ccaatgtgaa 2880

attcgaagcc aaaccggcta accagttgtt gacccagccg gtgaaacaag gtgcagaact 2940

ggacttcccg attccagtgg atgattttgc cttctcgctg catgacctta gtgataaaga 3000

aaccaccatt agccagcaga gtgccgccat tttgttctgc gtcgaaggcg atgcaacgtt 3060

gtggaaaggt tctcagcagt tacagcttaa accgggtgaa tcagcgttta ttgccgccaa 3120

cgaatcaccg gtgactgtca aaggccacgg ccgtttagcg cgtgtttaca acaagctgta 3180

agagcttact gaaaaaatta acatctcttg ctaagctggg agctcgatcc gtcgacctgc 3240

agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc 3300

gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg 3360

catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata 3420

cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc 3480

tatgttacta gatc 3494

<210> 134

<211> 8415

<212> DNA

<213> 人工序列

<220>

<223> 玉米，大肠杆菌，苏云金芽孢杆菌，根癌农杆菌

<400> 134

gaaggcggga aacgacaatc tgatcatgag cggagaatta agggagtcac gttatgaccc 60

ccgccgatga cgcgggacaa gccgttttac gtttggaact gacagaaccg caacgctgca 120

ggaattggcc gcagcggcca tttaaatcaa ttgggcgcgc cgaattcgag ctcggtacaa 180

gcttgcacat gacaacaatt gtaagaggat ggagaccaca acgatccaac aatacttctg 240

cgacgggctg tgaagtatag agaagttaaa cgcccaaaag ccattgtgtt tggaattttt 300

agttattcta tttttcatga tgtatcttcc tctaacatgc cttaatttgc aaatttggta 360

taactactga ttgaaaatat atgtatgtaa aaaaatacta agcatatttt tgaagctaaa 420

catgatgtta tttaagaaaa tatgttgtta acagaataag attaatatcg aaatggaaac 480

atctgtaaat tagaatcatc ttacaagcta agagatgttc acgctttgag aaacttcttc 540

agatcatgac cgtagaagta gctctccaag actcaacgaa ggctgctgca attccacaaa 600

tgcatgacat gcatccttgt aaccgtcgtc gccgctataa acacggataa ctcaattccc 660

tgctccatca atttagaaat gagcaagcaa gcacccgatc gctcacccca tatgcaccaa 720

tctgactccc aagctctgtt tcgcattagt accgccagca ctccacctat agctaccaat 780

tgagaccttt ccagcctaag cagatcgatt gatcgttaga gtcaaagagt tggtggtacg 840

ggtactttaa ctaccatgga atgatggggc gtgatgtaga gcggaaagcg cctccctacg 900

cggaacaaca ccctcgccat gccgctcgac tacagcctcc tcctcgtcgg cgccacaacg 960

agggagcccg tggtcgcagc caccgaccag catgtctctg tgtcctcgtc cgacctcgac 1020

atgtcatggc aaacagtcgg acgccagcac cagactgacg acatgagtct ctgaagagcc 1080

cgccacctag aaagatccga gccctgctgc tggtagtggt aaccattttc gtcgcgctga 1140

cgcggagagc gagaggccag aaatttatag cgactgacgc tgtggcaggc acgctatcgg 1200

aggttacgac gtggcgggtc actcgacgcg gagttcacag gtcctatcct tgcatcgctc 1260

ggcgcggagt ttacggggac ttatccttac gacgtgctct aaggttgcga taacgggcgg 1320

aggaaggcgt gtggcgtgcg gagacggttt atacacgtag tgtgcgggag tgtgtttcgt 1380

agacgcggga aagcacgacg acttacgaag gttagtggag gaggaggaca cactaaaatc 1440

aggacgcaag aaactcttct attatagtag tagagaagag attataggag tgtgggttga 1500

ttctaaagaa aatcgacgca ggacaaccgt caaaacgggt gctttaatat agtagatata 1560

tatatataga gagagagaga aagtacaaag gatgcatttg tgtctgcata tgatcggagt 1620

attactaacg gccgtcgtaa gaaggtccat catgcgtgga gcgagcccat ttggttggtt 1680

gtcaggccgc agttaaggcc tccatatatg attgtcgtcg ggcccataac agcatctcct 1740

ccaccagttt attgtaagaa taaattaagt agagatattt gtcgtcgggc agaagaaact 1800

tggacaagaa gaagaagcaa gctaggccaa tttcttgccg gcaagaggaa gatagtggcc 1860

tctagtttat atatcggcgt gatgatgatg ctcctagcta gaaatgagag aagaaaaacg 1920

gacgcgtgtt tggtgtgtgt caatggcgtc catccttcca tcagatcaga acgatgaaaa 1980

agtcaagcac ggcatgcata gtatatgtat agcttgtttt agtgtggctt tgctgagacg 2040

aatgaaagca acggcgggca tatttttcag tggctgtagc tttcaggctg aaagagacgt 2100

ggcatgcaat aattcaggga attcgtcagc caattgaggt agctagtcaa cttgtacatt 2160

ggtgcgagca attttccgca ctcaggaggg ctagtttgag agtccaaaaa ctataggaga 2220

ttaaagaggc taaaatcctc tccttattta attttaaata agtagtgtat ttgtatttta 2280

actcctccaa cccttccgat tttatggctc tcaaactagc attcagtcta atgcatgcat 2340

gcttggctag aggtcgtatg gggttgttaa tagcatagct agctacaagt taaccgggtc 2400

ttttatattt aataaggaca ggcaaagtat tacttacaaa taaagaataa agctaggacg 2460

aactgctgga ttattactaa atcgaaatgg acgtaatatt ccaggcaaga ataattgttc 2520

gatcaggaga caagtggggc attggaccgg ttcttgcaag caagagccta tggcgtggtg 2580

acacggcgcg ttgcccatac atcatgcctc catcgatgat ccatcctcac ttgctataaa 2640

aagaggtgtc catggtgctc aagctcagcc aagcaaataa gacgacttgt ttcattgatt 2700

cttcaagaga tcgagcttct tttgcaccac aaggtcgagg atccaccatg acggccgaca 2760

acaacaccga ggccctggac agcagcacca ccaaggacgt gatccagaag ggcatcagcg 2820

tggtgggcga cctgctgggc gtggtgggct tccccttcgg cggcgccctg gtgagcttct 2880

acaccaactt cctgaacacc atctggccca gcgaggaccc ctggaaggcc ttcatggagc 2940

aggtggaggc cctgatggac cagaagatcg ccgactacgc caagaacaag gcactggccg 3000

agctacaggg cctccagaac aacgtggagg actatgtgag cgccctgagc agctggcaga 3060

agaaccccgc tgcaccgttc cgcaaccccc acagccaggg ccgcatccgc gagctgttca 3120

gccaggccga gagccacttc cgcaacagca tgcccagctt cgccatcagc ggctacgagg 3180

tgctgttcct gaccacctac gcccaggccg ccaacaccca cctgttcctg ctgaaggacg 3240

cccaaatcta cggagaggag tggggctacg agaaggagga catcgccgag ttctacaagc 3300

gccagctgaa gctgacccag gagtacaccg accactgcgt gaagtggtac aacgtgggtc 3360

tagacaagct ccgcggcagc agctacgaga gctgggtgaa cttcaaccgc taccgccgcg 3420

agatgaccct gaccgtgctg gacctgatcg ccctgttccc cctgtacgac gtgcgcctgt 3480

accccaagga ggtgaagacc gagctgaccc gcgacgtgct gaccgacccc atcgtgggcg 3540

tgaacaacct gcgcggctac ggcaccacct tcagcaacat cgagaactac atccgcaagc 3600

cccacctgtt cgactacctg caccgcatcc agttccacac gcgtttccag cccggctact 3660

acggcaacga cagcttcaac tactggagcg gcaactacgt gagcacccgc cccagcatcg 3720

gcagcaacga catcatcacc agccccttct acggcaacaa gagcagcgag cccgtgcaga 3780

accttgagtt caacggcgag aaggtgtacc gcgccgtggc taacaccaac ctggccgtgt 3840

ggccctctgc agtgtacagc ggcgtgacca aggtggagtt cagccagtac aacgaccaga 3900

ccgacgaggc cagcacccag acctacgaca gcaagcgcaa cgtgggcgcc gtgagctggg 3960

acagcatcga ccagctgccc cccgagacca ccgacgagcc cctggagaag ggctacagcc 4020

accagctgaa ctacgtgatg tgcttcctga tgcagggcag ccgcggcacc atccccgtgc 4080

tgacctggac ccacaagagc gtcgacttct tcaacatgat cgacagcaag aagatcaccc 4140

agctgcccct ggtgaaggcc tacaagctcc agagcggcgc cagcgtggtg gcaggccccc 4200

gcttcaccgg cggcgacatc atccagtgca ccgagaacgg cagcgccgcc accatctacg 4260

tgacccccga cgtgagctac agccagaagt accgcgcccg catccactac gccagcacca 4320

gccagatcac cttcaccctg agcctggacg gggccccctt caaccaatac tacttcgaca 4380

agaccatcaa caagggcgac accctgacct acaacagctt caacctggcc agcttcagca 4440

cccctttcga gctgagcggc aacaacctcc agatcggcgt gaccggcctg agcgccggcg 4500

acaaggtgta catcgacaag atcgagttca tccccgtgaa ctagatctga gctctagatc 4560

cccgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 4620

tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 4680

taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 4740

atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 4800

cgcggtgtca tctatgttac tagatcggga attgggtacc agcttgcatg cctgcagtgc 4860

agcgtgaccc ggtcgtgccc ctctctagag ataatgagca ttgcatgtct aagttataaa 4920

aaattaccac atattttttt tgtcacactt gtttgaagtg cagtttatct atctttatac 4980

atatatttaa actttactct acgaataata taatctatag tactacaata atatcagtgt 5040

tttagagaat catataaatg aacagttaga catggtctaa aggacaattg agtattttga 5100

caacaggact ctacagtttt atctttttag tgtgcatgtg ttctcctttt tttttgcaaa 5160

tagcttcacc tatataatac ttcatccatt ttattagtac atccatttag ggtttagggt 5220

taatggtttt tatagactaa tttttttagt acatctattt tattctattt tagcctctaa 5280

attaagaaaa ctaaaactct attttagttt ttttatttaa taatttagat ataaaataga 5340

ataaaataaa gtgactaaaa attaaacaaa taccctttaa gaaattaaaa aaactaagga 5400

aacatttttc ttgtttcgag tagataatgc cagcctgtta aacgccgtcg acgagtctaa 5460

cggacaccaa ccagcgaacc agcagcgtcg cgtcgggcca agcgaagcag acggcacggc 5520

atctctgtcg ctgcctctgg acccctctcg agagttccgc tccaccgttg gacttgctcc 5580

gctgtcggca tccagaaatt gcgtggcgga gcggcagacg tgagccggca cggcaggcgg 5640

cctcctcctc ctctcacggc accggcagct acgggggatt cctttcccac cgctccttcg 5700

ctttcccttc ctcgcccgcc gtaataaata gacaccccct ccacaccctc tttccccaac 5760

ctcgtgttgt tcggagcgca cacacacaca accagatctc ccccaaatcc acccgtcggc 5820

acctccgctt caaggtacgc cgctcgtcct cccccccccc ccctctctac cttctctaga 5880

tcggcgttcc ggtccatggt tagggcccgg tagttctact tctgttcatg tttgtgttag 5940

atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc 6000

agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg ggatggctct 6060

agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca tagggtttgg 6120

tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt catcttttca 6180

tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga 6240

gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt atgtgtgtgc 6300

catacatatt catagttacg aattgaagat gatggatgga aatatcgatc taggataggt 6360

atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt tcgcttggtt 6420

gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt agaatactgt 6480

ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca tacatcttca 6540

tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca tgttgatgtg 6600

ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg ctctaacctt 6660

gagtacctat ctattataat aaacaagtat gttttataat tattttgatc ttgatatact 6720

tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct tcatacgcta 6780

tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg tgttacttct 6840

gcagggatcc ccgatcatgc aaaaactcat taactcagtg caaaactatg cctggggcag 6900

caaaacggcg ttgactgaac tttatggtat ggaaaatccg tccagccagc cgatggccga 6960

gctgtggatg ggcgcacatc cgaaaagcag ttcacgagtg cagaatgccg ccggagatat 7020

cgtttcactg cgtgatgcga ttgagagtga taaatcgact ctgctcggag aggccgttgc 7080

caaacgcttt ggcgaactgc ctttcctgtt caaagtatta tgcgcagcac agccactctc 7140

cattcaggtt catccaaaca aacacaattc tgaaatcggt tttgccaaag aaaatgccgc 7200

aggtatcccg atggatgccg ccgagcgtaa ctataaagat cctaaccaca agccggagct 7260

ggtttttgcg ctgacgcctt tccttgcgat gaacgcgttt cgtgaatttt ccgagattgt 7320

ctccctactc cagccggtcg caggtgcaca tccggcgatt gctcactttt tacaacagcc 7380

tgatgccgaa cgtttaagcg aactgttcgc cagcctgttg aatatgcagg gtgaagaaaa 7440

atcccgcgcg ctggcgattt taaaatcggc cctcgatagc cagcatggtg aaccgtggca 7500

aacgattcgt ttaatttctg aattttaccc ggaagacagc ggtctgttct ccccgctatt 7560

gctgaatgtg gtgaaattga accctggcga agcgatgttc ctgttcgctg aaacaccgca 7620

cgcttacctg caaggcgtgg cgctggaagt gatggcaaac tccgataacg tgctgcgtgc 7680

gggtctgacg cctaaataca ttgatattcc ggaactggtt gccaatgtga aattcgaagc 7740

caaaccggct aaccagttgt tgacccagcc ggtgaaacaa ggtgcagaac tggacttccc 7800

gattccagtg gatgattttg ccttctcgct gcatgacctt agtgataaag aaaccaccat 7860

tagccagcag agtgccgcca ttttgttctg cgtcgaaggc gatgcaacgt tgtggaaagg 7920

ttctcagcag ttacagctta aaccgggtga atcagcgttt attgccgcca acgaatcacc 7980

ggtgactgtc aaaggccacg gccgtttagc gcgtgtttac aacaagctgt aagagcttac 8040

tgaaaaaatt aacatctctt gctaagctgg gagctcgatc cgtcgacctg cagatcgttc 8100

aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat 8160

catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat gcatgacgtt 8220

atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga 8280

aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact 8340

agatctgcta gccctgcagg aaatttaccg gtgcccgggc ggccagcatg gccgtatccg 8400

caatgtgtta ttaag 8415

<210> 135

<211> 11632

<212> DNA

<213> 人工序列

<220>

<223> 玉米，大肠杆菌，苏云金芽孢杆菌，根癌农杆菌

<400> 135

ggttacagcc tgggctgatc tgtggacggt ggaccatgca aggttgtact gggcttgcaa 60

ggttgtactg ggcctactgg aacagtcata gcccgtgccg tcgtggtgac cgtcgtacgc 120

ggccgatctg gcagactggg caggtcgctg ctccgtgctg tttgtggatg caatgcaact 180

atgcaagagt gatcacggaa aacggacgga gcctgtctgt cctgttgcga cgtagtacaa 240

gcgcctgaac agtgacgcta cgctatgcca cgagcctacg agtggtaggt agtagtacac 300

tggtcagaat ccagcagtgc acccacgccg ctgctgactt tgctgatgag agggaggggt 360

cgagcgagtc tgtgtgaaac cgtgaacccc gccggggcct tcagtacgta cgataccacg 420

agcagtagaa aaaacaacgc caagatggca gagtcaacaa ccgatcacag tacgtatcgc 480

attcacatca agattttaag aacgaccccc ggctggccaa tggcaggcca cttggttgcc 540

cgtgcccgac agagggacac ggcgccatgc cctccgcgcc gcacggacga ggtgtcgtga 600

gaaccggcaa aaaaaaaatc atcgcaagtg cgctgaagtg aagtgccttc ccccgcgttt 660

ccttgcccct ggccggtacc catttggcgc cgattctttt cttgcccccc ggccggccgc 720

tcgctcgcct ttggattctt ccaaagccgc tgatgggatg gtggcgaaca cacccaccac 780

ccgtctttgc ccaaagcgac ccggcacagg ccgcgccggc ttcactaacc actagcgctt 840

gtactaataa aatggtttct agcgtttgtt gctctccttt ttcttttttc gccggttctt 900

cggagccgtg tggacactgg acagcgtcca gtccagcagg catagggtgg tctcggcggc 960

ggtcgtccga cgacgatcga tctccatgag attccgcgac aggccaggac ggaaagctgg 1020

gcccttctca ccaattcgcg tcggagccgg aacaagattc cctcccccaa tcatttcgac 1080

gcgccctttc ttcgccaccc ctcgtggccg tgtttcgcgg ccggccctta tctccttccc 1140

gtgacgcgtt cttttgtagc ttagcggccg gcacgttgct aaccaggcta gcttcgttcg 1200

tttttaatct gcctatcgag aagagaagaa aaattcgtcc atggggccac ggcctcttct 1260

gcaggcattt ggcatgtgaa ggaacccgaa ccagtgaatg gagatggacg gatgctgctc 1320

agatacgcag tcaaacctgc cggcgaaatt acggggggag ctggctggct ggctggctgg 1380

acgccagatc acacatggat gacgcggcac ggcagctagc cgagcaggcg ctctgcgcac 1440

gcaattcaac agaaggcggg aaacgacaat ctgatcatga gcggagaatt aagggagtca 1500

cgttatgacc cccgccgatg acgcgggaca agccgtttta cgtttggaac tgacagaacc 1560

gcaacgctgc aggaattggc cgcagcggcc atttaaatca attgggcgcg ccgaattcga 1620

gctcggtaca agcttgcaca tgacaacaat tgtaagagga tggagaccac aacgatccaa 1680

caatacttct gcgacgggct gtgaagtata gagaagttaa acgcccaaaa gccattgtgt 1740

ttggaatttt tagttattct atttttcatg atgtatcttc ctctaacatg ccttaatttg 1800

caaatttggt ataactactg attgaaaata tatgtatgta aaaaaatact aagcatattt 1860

ttgaagctaa acatgatgtt atttaagaaa atatgttgtt aacagaataa gattaatatc 1920

gaaatggaaa catctgtaaa ttagaatcat cttacaagct aagagatgtt cacgctttga 1980

gaaacttctt cagatcatga ccgtagaagt agctctccaa gactcaacga aggctgctgc 2040

aattccacaa atgcatgaca tgcatccttg taaccgtcgt cgccgctata aacacggata 2100

actcaattcc ctgctccatc aatttagaaa tgagcaagca agcacccgat cgctcacccc 2160

atatgcacca atctgactcc caagctctgt ttcgcattag taccgccagc actccaccta 2220

tagctaccaa ttgagacctt tccagcctaa gcagatcgat tgatcgttag agtcaaagag 2280

ttggtggtac gggtacttta actaccatgg aatgatgggg cgtgatgtag agcggaaagc 2340

gcctccctac gcggaacaac accctcgcca tgccgctcga ctacagcctc ctcctcgtcg 2400

gcgccacaac gagggagccc gtggtcgcag ccaccgacca gcatgtctct gtgtcctcgt 2460

ccgacctcga catgtcatgg caaacagtcg gacgccagca ccagactgac gacatgagtc 2520

tctgaagagc ccgccaccta gaaagatccg agccctgctg ctggtagtgg taaccatttt 2580

cgtcgcgctg acgcggagag cgagaggcca gaaatttata gcgactgacg ctgtggcagg 2640

cacgctatcg gaggttacga cgtggcgggt cactcgacgc ggagttcaca ggtcctatcc 2700

ttgcatcgct cggcgcggag tttacgggga cttatcctta cgacgtgctc taaggttgcg 2760

ataacgggcg gaggaaggcg tgtggcgtgc ggagacggtt tatacacgta gtgtgcggga 2820

gtgtgtttcg tagacgcggg aaagcacgac gacttacgaa ggttagtgga ggaggaggac 2880

acactaaaat caggacgcaa gaaactcttc tattatagta gtagagaaga gattatagga 2940

gtgtgggttg attctaaaga aaatcgacgc aggacaaccg tcaaaacggg tgctttaata 3000

tagtagatat atatatatag agagagagag aaagtacaaa ggatgcattt gtgtctgcat 3060

atgatcggag tattactaac ggccgtcgta agaaggtcca tcatgcgtgg agcgagccca 3120

tttggttggt tgtcaggccg cagttaaggc ctccatatat gattgtcgtc gggcccataa 3180

cagcatctcc tccaccagtt tattgtaaga ataaattaag tagagatatt tgtcgtcggg 3240

cagaagaaac ttggacaaga agaagaagca agctaggcca atttcttgcc ggcaagagga 3300

agatagtggc ctctagttta tatatcggcg tgatgatgat gctcctagct agaaatgaga 3360

gaagaaaaac ggacgcgtgt ttggtgtgtg tcaatggcgt ccatccttcc atcagatcag 3420

aacgatgaaa aagtcaagca cggcatgcat agtatatgta tagcttgttt tagtgtggct 3480

ttgctgagac gaatgaaagc aacggcgggc atatttttca gtggctgtag ctttcaggct 3540

gaaagagacg tggcatgcaa taattcaggg aattcgtcag ccaattgagg tagctagtca 3600

acttgtacat tggtgcgagc aattttccgc actcaggagg gctagtttga gagtccaaaa 3660

actataggag attaaagagg ctaaaatcct ctccttattt aattttaaat aagtagtgta 3720

tttgtatttt aactcctcca acccttccga ttttatggct ctcaaactag cattcagtct 3780

aatgcatgca tgcttggcta gaggtcgtat ggggttgtta atagcatagc tagctacaag 3840

ttaaccgggt cttttatatt taataaggac aggcaaagta ttacttacaa ataaagaata 3900

aagctaggac gaactgctgg attattacta aatcgaaatg gacgtaatat tccaggcaag 3960

aataattgtt cgatcaggag acaagtgggg cattggaccg gttcttgcaa gcaagagcct 4020

atggcgtggt gacacggcgc gttgcccata catcatgcct ccatcgatga tccatcctca 4080

cttgctataa aaagaggtgt ccatggtgct caagctcagc caagcaaata agacgacttg 4140

tttcattgat tcttcaagag atcgagcttc ttttgcacca caaggtcgag gatccaccat 4200

gacggccgac aacaacaccg aggccctgga cagcagcacc accaaggacg tgatccagaa 4260

gggcatcagc gtggtgggcg acctgctggg cgtggtgggc ttccccttcg gcggcgccct 4320

ggtgagcttc tacaccaact tcctgaacac catctggccc agcgaggacc cctggaaggc 4380

cttcatggag caggtggagg ccctgatgga ccagaagatc gccgactacg ccaagaacaa 4440

ggcactggcc gagctacagg gcctccagaa caacgtggag gactatgtga gcgccctgag 4500

cagctggcag aagaaccccg ctgcaccgtt ccgcaacccc cacagccagg gccgcatccg 4560

cgagctgttc agccaggccg agagccactt ccgcaacagc atgcccagct tcgccatcag 4620

cggctacgag gtgctgttcc tgaccaccta cgcccaggcc gccaacaccc acctgttcct 4680

gctgaaggac gcccaaatct acggagagga gtggggctac gagaaggagg acatcgccga 4740

gttctacaag cgccagctga agctgaccca ggagtacacc gaccactgcg tgaagtggta 4800

caacgtgggt ctagacaagc tccgcggcag cagctacgag agctgggtga acttcaaccg 4860

ctaccgccgc gagatgaccc tgaccgtgct ggacctgatc gccctgttcc ccctgtacga 4920

cgtgcgcctg taccccaagg aggtgaagac cgagctgacc cgcgacgtgc tgaccgaccc 4980

catcgtgggc gtgaacaacc tgcgcggcta cggcaccacc ttcagcaaca tcgagaacta 5040

catccgcaag ccccacctgt tcgactacct gcaccgcatc cagttccaca cgcgtttcca 5100

gcccggctac tacggcaacg acagcttcaa ctactggagc ggcaactacg tgagcacccg 5160

ccccagcatc ggcagcaacg acatcatcac cagccccttc tacggcaaca agagcagcga 5220

gcccgtgcag aaccttgagt tcaacggcga gaaggtgtac cgcgccgtgg ctaacaccaa 5280

cctggccgtg tggccctctg cagtgtacag cggcgtgacc aaggtggagt tcagccagta 5340

caacgaccag accgacgagg ccagcaccca gacctacgac agcaagcgca acgtgggcgc 5400

cgtgagctgg gacagcatcg accagctgcc ccccgagacc accgacgagc ccctggagaa 5460

gggctacagc caccagctga actacgtgat gtgcttcctg atgcagggca gccgcggcac 5520

catccccgtg ctgacctgga cccacaagag cgtcgacttc ttcaacatga tcgacagcaa 5580

gaagatcacc cagctgcccc tggtgaaggc ctacaagctc cagagcggcg ccagcgtggt 5640

ggcaggcccc cgcttcaccg gcggcgacat catccagtgc accgagaacg gcagcgccgc 5700

caccatctac gtgacccccg acgtgagcta cagccagaag taccgcgccc gcatccacta 5760

cgccagcacc agccagatca ccttcaccct gagcctggac ggggccccct tcaaccaata 5820

ctacttcgac aagaccatca acaagggcga caccctgacc tacaacagct tcaacctggc 5880

cagcttcagc acccctttcg agctgagcgg caacaacctc cagatcggcg tgaccggcct 5940

gagcgccggc gacaaggtgt acatcgacaa gatcgagttc atccccgtga actagatctg 6000

agctctagat ccccgaattt ccccgatcgt tcaaacattt ggcaataaag tttcttaaga 6060

ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag 6120

catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga 6180

gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat 6240

aaattatcgc gcgcggtgtc atctatgtta ctagatcggg aattgggtac cagcttgcat 6300

gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc 6360

taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc 6420

tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat 6480

aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt 6540

gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt 6600

ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta 6660

gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt 6720

ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga 6780

tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa 6840

aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc 6900

gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca 6960

gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt 7020

ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc 7080

acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca 7140

ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct 7200

ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc 7260

cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta 7320

ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 7380

gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 7440

acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 7500

gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 7560

atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 7620

tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 7680

tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 7740

tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 7800

ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 7860

ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 7920

tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 7980

atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 8040

atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 8100

gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 8160

cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 8220

ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 8280

gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt gcaaaactat 8340

gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc gtccagccag 8400

ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt gcagaatgcc 8460

gccggagata tcgtttcact gcgtgatgcg attgagagtg ataaatcgac tctgctcgga 8520

gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt atgcgcagca 8580

cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg ttttgccaaa 8640

gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga tcctaaccac 8700

aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt tcgtgaattt 8760

tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat tgctcacttt 8820

ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt gaatatgcag 8880

ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag ccagcatggt 8940

gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag cggtctgttc 9000

tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt cctgttcgct 9060

gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa ctccgataac 9120

gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt tgccaatgtg 9180

aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca aggtgcagaa 9240

ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct tagtgataaa 9300

gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg cgatgcaacg 9360

ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt tattgccgcc 9420

aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta caacaagctg 9480

taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgat ccgtcgacct 9540

gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 9600

gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 9660

tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 9720

tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 9780

tctatgttac tagatctgct agccctgcag gaaatttacc ggtgcccggg cggccagcat 9840

ggccgtatcc gcaatgtgtt attaagagtt ggtggtacgg gtactttaac taacgaggtg 9900

tgtcgcgcag cgctcctgca cggatgtagc tttggattgc tggataatgt ctcgcgcaag 9960

cgtcgtattt atttatttat ttattacagc ctccaccgcc gtgcgtgctc cgtttcggat 10020

tataataaaa ctaatattaa ataaaaaaat cggattaaag gatgtttccg aaataaagat 10080

ctccaccaca ggagcgaaag aaaaaaaaag agaaacgggc tatggagaaa tggtgttgcg 10140

agtatacggc ggctccgtcg tcgtcggatc gacatgtaca aagtaggtgc acaaaaggca 10200

aagcaaaatc acctcatcaa agaccaaaag cggagcaaag aatcgatact aaatccacat 10260

gttttttttg ttcctgtcta ctacgtgctg tgcctgtgcg tgaagcacga ttagtacgtg 10320

tactcactct tgtcatattc tttttagtgt cttgtcacta gtcacatgga gtagcaacca 10380

tggctggcga tacccgcgat aaataaaaaa aagagagagg gagtaatata ttagatactc 10440

acccattata aattataaaa tattttagag tttgaatagg tagttcttgt atatttattt 10500

atagaccttc aagtttgtcc gcctctcgag agccgaactt tgttgcccat gcttccccgg 10560

ctcaggtcat gccacctcct tcaccaaggg cacacggaag atctggtgga gcttgtcatc 10620

accccgcgcc cttcaaacat gtgaggatgc gtcgtcgctg gcactagtag cactcattgt 10680

aggcactaca ttgacagttt cctccagata tgtagtgagg aaacacttga acaacacgtt 10740

tgggattaca tatgatgttt tgtttgttca tcaatgataa ttccttcttc ttgcttaatg 10800

attggctcta gaaccgatac atggcacatt tcatcaggaa gggcgcatgc acgaaattaa 10860

actgttatcg atgtttcggt ttctaagttg aagaaaacaa tggctaacaa ctagcccatg 10920

tgagcataac gacaaggcct acaaacaaaa cccaagaaat agctaaatca tggtctggat 10980

ccactctgct atgatagatc accttttcta acatagttca tcctcccatt tgctctcgct 11040

cacctagtgc ctccatcgct gagatcaatg ataagtacca agtgtacgat gaatcccatt 11100

tgtcatgcgt cttgcaagaa tggttggtcc gcttgcagtg ccggtccagc tatggaccca 11160

ggggcctatg tcataactca agcaagacca tacccccata tgctaccaag atgcctttta 11220

agaatcctgg taaaagaaat cggtggaaga cgactcaacg actatcaggc cccatttttt 11280

gggaccatgc tcaaggattt ggctttagca aaagtagata acactatttt ggggagcttg 11340

atctcaagga cacatgaagg aataaagcta ttttagtcaa gacgtcctta aggaacacaa 11400

taagacccta ggtccctaat gactagtgtg ttatatgttt cgagacgctc ctacacctaa 11460

gttcttttag ctatttccat tcacaatgat ggtatatgac ctaggtacca atgccccacg 11520

gagtttctaa cattaagaat gatctaaaac ataaggaccc tagagccagg gcactcctgg 11580

tattaaaaca tttaccagcc cgggccgtcg accacgcgtg ccctatagta ag 11632

<210> 136

<211> 1451

<212> DNA

<213> 玉米

<400> 136

ggttacagcc tgggctgatc tgtggacggt ggaccatgca aggttgtact gggcttgcaa 60

ggttgtactg ggcctactgg aacagtcata gcccgtgccg tcgtggtgac cgtcgtacgc 120

ggccgatctg gcagactggg caggtcgctg ctccgtgctg tttgtggatg caatgcaact 180

atgcaagagt gatcacggaa aacggacgga gcctgtctgt cctgttgcga cgtagtacaa 240

gcgcctgaac agtgacgcta cgctatgcca cgagcctacg agtggtaggt agtagtacac 300

tggtcagaat ccagcagtgc acccacgccg ctgctgactt tgctgatgag agggaggggt 360

cgagcgagtc tgtgtgaaac cgtgaacccc gccggggcct tcagtacgta cgataccacg 420

agcagtagaa aaaacaacgc caagatggca gagtcaacaa ccgatcacag tacgtatcgc 480

attcacatca agattttaag aacgaccccc ggctggccaa tggcaggcca cttggttgcc 540

cgtgcccgac agagggacac ggcgccatgc cctccgcgcc gcacggacga ggtgtcgtga 600

gaaccggcaa aaaaaaaatc atcgcaagtg cgctgaagtg aagtgccttc ccccgcgttt 660

ccttgcccct ggccggtacc catttggcgc cgattctttt cttgcccccc ggccggccgc 720

tcgctcgcct ttggattctt ccaaagccgc tgatgggatg gtggcgaaca cacccaccac 780

ccgtctttgc ccaaagcgac ccggcacagg ccgcgccggc ttcactaacc actagcgctt 840

gtactaataa aatggtttct agcgtttgtt gctctccttt ttcttttttc gccggttctt 900

cggagccgtg tggacactgg acagcgtcca gtccagcagg catagggtgg tctcggcggc 960

ggtcgtccga cgacgatcga tctccatgag attccgcgac aggccaggac ggaaagctgg 1020

gcccttctca ccaattcgcg tcggagccgg aacaagattc cctcccccaa tcatttcgac 1080

gcgccctttc ttcgccaccc ctcgtggccg tgtttcgcgg ccggccctta tctccttccc 1140

gtgacgcgtt cttttgtagc ttagcggccg gcacgttgct aaccaggcta gcttcgttcg 1200

tttttaatct gcctatcgag aagagaagaa aaattcgtcc atggggccac ggcctcttct 1260

gcaggcattt ggcatgtgaa ggaacccgaa ccagtgaatg gagatggacg gatgctgctc 1320

agatacgcag tcaaacctgc cggcgaaatt acggggggag ctggctggct ggctggctgg 1380

acgccagatc acacatggat gacgcggcac ggcagctagc cgagcaggcg ctctgcgcac 1440

gcaattcaac a 1451

<210> 137

<211> 1766

<212> DNA

<213> 玉米

<400> 137

agttggtggt acgggtactt taactaacga ggtgtgtcgc gcagcgctcc tgcacggatg 60

tagctttgga ttgctggata atgtctcgcg caagcgtcgt atttatttat ttatttatta 120

cagcctccac cgccgtgcgt gctccgtttc ggattataat aaaactaata ttaaataaaa 180

aaatcggatt aaaggatgtt tccgaaataa agatctccac cacaggagcg aaagaaaaaa 240

aaagagaaac gggctatgga gaaatggtgt tgcgagtata cggcggctcc gtcgtcgtcg 300

gatcgacatg tacaaagtag gtgcacaaaa ggcaaagcaa aatcacctca tcaaagacca 360

aaagcggagc aaagaatcga tactaaatcc acatgttttt tttgttcctg tctactacgt 420

gctgtgcctg tgcgtgaagc acgattagta cgtgtactca ctcttgtcat attcttttta 480

gtgtcttgtc actagtcaca tggagtagca accatggctg gcgatacccg cgataaataa 540

aaaaaagaga gagggagtaa tatattagat actcacccat tataaattat aaaatatttt 600

agagtttgaa taggtagttc ttgtatattt atttatagac cttcaagttt gtccgcctct 660

cgagagccga actttgttgc ccatgcttcc ccggctcagg tcatgccacc tccttcacca 720

agggcacacg gaagatctgg tggagcttgt catcaccccg cgcccttcaa acatgtgagg 780

atgcgtcgtc gctggcacta gtagcactca ttgtaggcac tacattgaca gtttcctcca 840

gatatgtagt gaggaaacac ttgaacaaca cgtttgggat tacatatgat gttttgtttg 900

ttcatcaatg ataattcctt cttcttgctt aatgattggc tctagaaccg atacatggca 960

catttcatca ggaagggcgc atgcacgaaa ttaaactgtt atcgatgttt cggtttctaa 1020

gttgaagaaa acaatggcta acaactagcc catgtgagca taacgacaag gcctacaaac 1080

aaaacccaag aaatagctaa atcatggtct ggatccactc tgctatgata gatcaccttt 1140

tctaacatag ttcatcctcc catttgctct cgctcaccta gtgcctccat cgctgagatc 1200

aatgataagt accaagtgta cgatgaatcc catttgtcat gcgtcttgca agaatggttg 1260

gtccgcttgc agtgccggtc cagctatgga cccaggggcc tatgtcataa ctcaagcaag 1320

accatacccc catatgctac caagatgcct tttaagaatc ctggtaaaag aaatcggtgg 1380

aagacgactc aacgactatc aggccccatt ttttgggacc atgctcaagg atttggcttt 1440

agcaaaagta gataacacta ttttggggag cttgatctca aggacacatg aaggaataaa 1500

gctattttag tcaagacgtc cttaaggaac acaataagac cctaggtccc taatgactag 1560

tgtgttatat gtttcgagac gctcctacac ctaagttctt ttagctattt ccattcacaa 1620

tgatggtata tgacctaggt accaatgccc cacggagttt ctaacattaa gaatgatcta 1680

aaacataagg accctagagc cagggcactc ctggtattaa aacatttacc agcccgggcc 1740

gtcgaccacg cgtgccctat agtaag 1766

<210> 138

<211> 10818

<212> DNA

<213> 玉米

<400> 138

ccattaaatc gacgaaagca actagatcct gattttgatt acgattacga ttgacgagta 60

tggatcatga ttttattgca tattttatga ttttattgca tattttatta ttttattgtc 120

gatttatgta ctaacttgtt tttgttaaaa taggatgtca aagaaaatga agtctttagc 180

tcgtagtttg cttgggtcga ggaggagctc gaggagcagc tcgaggggtg aggattcagt 240

ttttcagggc acaggttcta ccatgagcag acggagagcg ctggcagaac atttgcctcc 300

acaagatgta agttagttgt taaattacat tatttgagtt acttaatatt gtatgatgta 360

agttatttgt ttcataggat gctgaaattg aggaaccagt ggtagaggat catgcaagag 420

atgatgttga agatgatggt ggagataatg tgggagatga tgctggagac gacgctggtg 480

gggattctgg ggctggggat tctggggctg gtggagattc tgcagctggg tctggaactt 540

ctcgagttaa gagaacgagg aagctgcatt ttgttggacc acctccagag cttccacccg 600

aatctcgggt tgtaataaag cctagtggaa agtgagtgac atatctttgc ttaaatgtta 660

ttgaaagtta tgttttaatt tctacattga tttctgtttg caggacttgg atcgacgact 720

cgttcacagg cacaggacac tacaggcagg tgaacatggt tcttggtaat cttgttcgtc 780

tgcactggcc tggtcttgtg actttgccta ctggcgagtc tgtccccgcc accacttggg 840

agcattatcg ctatggtgtc tgtagaacgt ttggcaacac acaggcacta gtttgggatg 900

cattctgggt atgacttgtt tatactattt tagttattcc atatatgttt gcttttatga 960

taacactatg gtttttgcag aaacggtaca agttgccgga cgatggatca tatgatatga 1020

acgctcgtta cgtgtttgag tttaacgcga acgatgtcgt tgcagatgca atgtactatg 1080

cacgaattca ggctataaag gcatggtaca gagcaaatgc tgatgatcga ccgatgccaa 1140

atacaaaggc cgagtggtca tcaatttact tgacggagga gcaataccta gaggtaaaca 1200

ggttgttgcc tctcatatcg cacaaagcca tgtatttgct tgctttattt aaaaattttg 1260

atgtaggtgt cggtgccgtg gatggccacc cgaccagacg gttatcgggc attgtgcaga 1320

tggtgggctt cccctgactt tcgtgccatt tccgaaagga acaggggaaa ccgtgggact 1380

gagtcgttcc acaactacgg cggtgatggt catgtgcgct tggctaagcg aatggtaagt 1440

cacagtttgt cgtaactttg aatcacatag caaatgtgtc attataactt ttatgtacag 1500

gaagtcaaat ccggccgtac gcccacggat gtggaggtgt atatgcaagg gcatagggcc 1560

ataggggttc tgatcctcag aatcctgatg tgttatgcac tcagacggcc accgaccgtc 1620

tagtgagttt ttgatactct attatgtgtg ttgatattgt ttgcaagggc ataggggtta 1680

tgcacttata tttgatattg tttgcctcca ggcttcgtat gggcaggaga tggttcaacg 1740

ccatggggag gagtacgatt ggaggagcca gccaatcgac cctcagacag catatgctag 1800

cgcaggagga caagctcatg gacggtgaga ttatttgatt tggttttcaa aattgtcatc 1860

atatgcttgc gattcaactg agccatgagt tactatacta agtgcatggt tcactcttgt 1920

aggttgggta tttttgattc tacgattgat tccagagagc tgagacgccg tggacgacaa 1980

tccacatcgt cgtcttcaca gtcgtcccgt tcacgatcag cagcccatga gatagagctt 2040

gcagtgttgc gtcaacaggc agagtaccat caatcagtct tgagggaaca attggagtac 2100

cagaggcaac aatctgaata ccagagacaa caagccgagt accagaagaa gagggacgag 2160

tattatgcaa gcctccaggc ccaaaatcaa gctcttctct cggtaagttg aagtaacatt 2220

ttgtagctta ttttgcaaaa cacttgatgt gtatcttgtt tgttcaacaa tgacttgtat 2280

ataatttgta gcaactagcc caacaagcgg gcgtcccgat gccgacatat gggatgccgc 2340

ctccggactt tgcactgcca atgccaatgt tggcgcctcc acctccacct ccgcctccgc 2400

ctacgtcaca attccctatg gtatgtacac atatgcgtgt gtgacatgtt catagatgtc 2460

ttatgtgttt aaatgaacaa ctgagtggtt actatttcat gtgcttgtgt tatagggatt 2520

tcagacacca cccgcttcag ttgccgcacc tggagatggg tctgggcaag acgacacaac 2580

acattcgtgg gtcaacaacc tattcaacac gcagagtcca gccggaggag gtggctactt 2640

gaaccatcca gacgatggat atgattgatg tgtcgtgatg tttatttatg aaacactttg 2700

caacacttgt ttgtgagaca caatttcagt ttgcaacaac cgtcgaacct atatgttgat 2760

gttaaatttg tgaatgttat tatttatgtg agaatatttg tgattgtgaa tacttattag 2820

aatgtgtata tttgtgattg tgaatgtgaa tgtgtatatg tgcatgaatc tgttttcgtt 2880

ttgtaaatgt cagatttttt aaaaaacaga attttgtgta aattctgtaa tttgttatgt 2940

ccgacggcct agtggtagcc gtcggacata acacatggtt atgtccgacg gcattaacta 3000

ccgtcggaca taagggatgc ttatgtccga cggcctagtg gtagccgtcg gacttaatcc 3060

tgtggggccc acattccgac cggtaaaacg gttgggattt gttatctccg acgggcacac 3120

gcagccgtcg gagatagctt atgtccgacg gctgccgtcg gacattgcac tatttccgac 3180

gagttatctc cgacggctta aagccgtcgg agataaggct ttgccgtcgg aaataatcta 3240

tttccgacgg tttattcctt atgtccgacg gttttggcca tcggacgttt ctccgtttac 3300

tgtagtggaa gggagtgcag tagaagtgca atggcctaat gtccttcacc ataaaaaaaa 3360

caaagttcaa atctttcaga tttatttact cttggagtag catagcatag gtgtacaagg 3420

gaagtgctta taataatggt aacaagatac tcatcctctc atacctgccg tctcactgac 3480

aggaaacggt aggtggcaag ttggtaagct tttcggtttt agccatgtcc gatcccatgt 3540

gtggatcctg tactgtacat cgacatgcga catcttggtt ggcctatctg atctttaatg 3600

tcgccgcgca cagagaggag atccggtctc atgaagtggc tccgcagatt cctcaagggg 3660

ccgaagcccg gcgaaccgag ccgccggcgg ccccaggtgg cggccgggga agaggaggac 3720

gcgctttggc accaacgacc agctagacca aaggtactac tactaccact gtactagtga 3780

ctgagttcct cccttcttct tctacagttc gtctctgtct ctccaaatgg ctctttgatc 3840

tatccaaaca tgccgtttca cagcttcaca tccgattcaa ctcgcatcca ttgcagtgcc 3900

atcttaaact cttagctccg aaaaaggaag ttgctaaaga ctagtacaat atctttcttc 3960

gctgtttcca gatcgatcca cctaggaacg agaatgagga actagtggac cgtgccattg 4020

ccgagcctct tgcagaggct gtcaaaccgc ccagaggtag taccgtagat ggacgaatcc 4080

agatacacat tccatgtcag catggtataa atttctctga aaccgtttca tccctgcatc 4140

ccgttgctgt aaattgctgc gccagagaaa acccataggg gagaagacag caacgacgac 4200

gaagatctgg caagagccgt acaggacagt ctgaatatga acccttacac gccttacaac 4260

ccctatccac cctctcaggc ccaacctaga gggcacaggt caaccgctat cacaatcacc 4320

atttactggc accctaagat attctctaac gcgccaaagc agctcaatgc cgtcagtgtc 4380

cgtgctgcag ggtatgcgga ggctgcaagc atgagatagg gcgtggccat tacttgagct 4440

gcatgggcat ttactggcac cctcagtgct tccgctgcag gtcctgcggt caccttatcc 4500

gtgagaccga ggtaattaag ctcttgcatt ttctttcacc gtggaagtgt gttacagtgt 4560

taccagagat gagatcatat ccgttattct tttcgtcgtg ccttccagtt caccttgctg 4620

ggtgcggatt cgtaccacaa gctgtgctac aaggagctgc atcatccaaa atgcgacgtc 4680

tgccttcagt ttgtaaggcc tcgtgtcctc ggaaaacctg agcgatctgc actacagact 4740

gataaactgc gtacgcgtta gcatttctac accgtgccgt ctcgtcagtg taatgagagg 4800

ctcattcttt gtagatgtgt ttctgcagat cccaacgaac gggagtggct tgatagagta 4860

cagagcccac ccgttctggg gccagaagta ttgcccttcg catgagcgcg acaggacgcc 4920

acgttgctgc agctgtgaga aaatggaggt acaggtacag atactagata gaaaatgtgg 4980

tcgcagtccg atcactcgtt ttcaaactag gttgtacatt gcctgatcat attcaagggc 5040

atcacttttc ggttgtgatt gtgcagccaa ggaacacgaa gtacatgtcg ctgggagacg 5100

gacgcggcct gtgcatggaa tgcctgggat ctgcagtgat ggacacgagc gagtgccagc 5160

ctctgtacca ttctatcaga gactactacg aggggatgga catgagactg gaccagcaga 5220

tacccgtgct cttggttgag cggcaagcgc tcaacgaagc catggaaggg gagagtaaag 5280

tgagtgtttc ttctggttct gccccttttt tttgtgtgtg tttctgcaaa acgtacagcc 5340

ttcggaaaca ctaacgctga ccgcatctgc gaaatccagg gcccacgcca catgcctgag 5400

actaggggcc tatgtctgtc cgaggagcgg actgtgagca gtgtaagtgt tcaacaactc 5460

aagctgtggc ggttactgct gggatgctta gcccacaatg cgacagtttc tgctcttctg 5520

actgtgtgtt acttctgcag atacttagga ggcccagaat tggtggaaac aaccggttac 5580

tagacatgag aactcggcca cagaagctga ctaggagatg tgaagttact gcaatacttg 5640

tcctgtatgg cctccccagg tctggcaatt ttttttttat ctctggagtc tggaggacat 5700

cacttttttg tacctaccgg attcaaatac tgcggttctt ctcacgttct gtgaccggtg 5760

gtgtcgtcgt ttgtgtcaca acgctattgc aggctactga caggttccat cctcgcccat 5820

gagctgatgc acgggtggct gcgtctcaaa ggtacatccg tatatggatg gatggacaaa 5880

acatttcata cacccattta tcatctttat ttatgaattt tcttggaaag ctctaccgga 5940

tcgtactttt cattcaggtt accgaaacct aaacgcggag gtggaagaag gcatatgcca 6000

ggtcatgtct tacttgtggc tggaatcaga gattcttccg tcatcctcga ggcacgcgca 6060

gccttcatca tcctatccag caacatcatc cgagaaaggt ggaatatctc ataccgggaa 6120

gaagctgggc gagttcttca tgcaccagat tgccaatgac acgtcgacgg cctatggtga 6180

cgggttcaga actgcgtacg ctgccgtcaa caagtatggc cttcgccaaa cactgagcca 6240

tatacgccta acaggaggtt tccctgtata ataagagtga aaaaaacata aaatgtccat 6300

gcatgatcat atcgatatca aaaggttata tacatattgg gatgaagttg gctatggaac 6360

actggatgca tagtgattca atttcggtga cctttgagtt ttcaaagagg taatgtcgga 6420

gtaaatcaga aagtaaaccc gtataaagca tggttgagac gattgtttac tctatagtga 6480

tgcatgctac atgcatggcc aagaagagag caacgggcca taggaccatc gttattaccc 6540

atcgttgtta atcaaattta gggctagata aatagtaaac catctatagg aacatccaga 6600

gtcaatctac tctatgtatc ataccgacca ggggcggatc taggtaaaat aaccattgat 6660

gtcatctcca ttaaattata gtatcatcaa cctatttaag tgctaacaat catacatttt 6720

aatgaagatt attaaaatcc attggtgtca catgacacca caaaaatggc ctagatccgc 6780

ccctgatacc gacaaaccta gaaaaatttg taactgagaa ctgatgacca tacacatgaa 6840

catgaattag gactttcaaa gagtccaatc aaagtaaaca attagactaa gcatgtaaga 6900

tagggtgcca gatgttgtat caggcttttg agcacatgtg caacttgtat gtcgtggaac 6960

gtgacaaccg gtcaaggaat gcgcatgtga cggtgtaaaa tcaatataac aacatgaaga 7020

acaatcataa gtataggttg aaactacaca tgataactag tatatctttc taacaacaat 7080

gattagtaca atatgtaccg tggtaaagtg gtgacaccat tagagatcgc attagaacgg 7140

catggcgctt actttaaaaa atgttagaga agcggttatg gtcaaacaga atattatgtg 7200

aatatgcggg aagatgaaca aatctataac acagaaacga aggaaccaaa taggatcagc 7260

ggagagtaca gtgccaacgc gcgacgaaac gaggaagcca gaaaggcacc gccgcatgcc 7320

cgcaccgcgt gactgtcgaa ggcggccgtg agcgctccga catcgaagga gtttatttca 7380

aaaatgggac gaccaacatt gcgcttttca catttgtttc ctaacgttgc actctttcac 7440

atatggcacc gagacacgca atcttgttga caccgctcgt agtccggtcc gggcagtgag 7500

gtcttacctg tcgtggtttc agaaaccggg gataataaga tttgtgttcg gtaaggacgc 7560

agcgcggact cactctgaat ggtcagagga ctcaatgatg gatctgagac aaggggttat 7620

actggtttag gcttgcgccc tagtccaatg ttgatcatag tattgcttag agcgtgttac 7680

agttgagtgc tcgtatctag aagatggggg ttgtcttgct cttttatagc tcaaggatag 7740

atcttacaat gagacttgta ttctgttggg gtcgagctca gcttcctact tctgggtgac 7800

gtagctcctc cggtatcgtc tgctgggtcg tgcgccatcg tatccctggt atggcgtcgc 7860

gtcttatccg ttcgccgtat gagttcttgt agctattctg atgcaaacgt agtggtgcct 7920

ggtgggtctc gcagagtcgg tttgtggtga ggtttagggg cgtctttagt acaacttcat 7980

cttccatcat tccctatgcg tcaccttcca gcatgcgtag gcgtacgctt cgtacagcgt 8040

attaccgcgt cccttctgga cttctggtat gtaggtcact gtagagaccc aatgctgggt 8100

tgattggtcc caccggtcag cgaggatgct ctctagaatg tatctggcgt cgtgattggc 8160

agaggccttc ggtactgctc ccatggttca gacgtggctt ggtggtgatc tgtctcatcg 8220

tgctgacgtg acttgatagt actaggtcgg ctcttacctc ctatagatgt gctcgctaga 8280

aagtccattg tcatcttgct gggttgctcg gcatgtaggt tgatcggtaa atccgcctcg 8340

tcgagttgct cgataatgtt gctcggcggg cgggtatgta ggtagtccga cctcaccggg 8400

ttgttcggca atcccgcctc gccgagttgc tcggtgaacg ggttggtcgg cagccccacc 8460

tcgccaggtt gtttggcaca cgtgttggtc tgttggtggg tcgtcgagag cccttttggg 8520

cttttttggg cacccggttt ctggtacccc acaatacccg agctagagtt ccacatttgc 8580

ccctaccttc cttcccggct ccggcgacaa gcccaggatc ctggtgtaat ggggcgagga 8640

gaagcagttc ttgacggagg agaccagctc catgatcccc aacaaaatga aggagacaac 8700

cgaggcctac ctcggcgtca ccatcaataa cactgttgtc accgtcccag tctatttcaa 8760

tgagtcccag cgccagacta ccaaaaacgt cgccgtcatc tccggccttc accgtcatgc 8820

gcatcatcaa cgagcccacc actgtcgcca tcacctacgg gctcgacaag aaatcgagca 8880

gcaacaacga gaataatgtc gtcatcttcg acctcgacgg cggtaccttt gacgtcgcgc 8940

tccggcggct aaggaccgca ctgccgacga gggcatgagt ggcgccgaga tggaagagaa 9000

gaggagcaca aatggcggtc gtcggcaaag acaaagagaa ctcgagcgtg agtggaggaa 9060

ggggcaaatg tgtaactcca gcttggatat gactccactg accagattac gagcgacatc 9120

aactagattg tgtgtctcag tggctcagtg ccattttttg aggtttgggt gccaatattt 9180

tttcgtagtg gaaggcaccg cgcccatcgg gttttgggag ccaaacgcca aacccgctcg 9240

cctcatattc cgcaacgtac agcggtttca tgggctggtt gaaggcccgg gccgcaaacc 9300

aaccgagtcg ggccgacgcc ctgggagatc cgcacggctg gtctggccca agcaacctgg 9360

tgggttggtg ccaggttaca gcctgggctg atctgtggac ggtggaccat gcaaggttgt 9420

actgggcttg caaggttgta ctgggcctac tggaacagtc atagcccgtg ccgtcgtggt 9480

gaccgtcgta cgcggccgat ctggcagact gggcaggtcg ctgctccgtg ctgtttgtgg 9540

atgcaatgca actatgcaag agtgatcacg gaaaacggac ggagcctgtc tgtcctgttg 9600

cgacgtagta caagcgcctg aacagtgacg ctacgctatg ccacgagcct acgagtggta 9660

ggtagtagta cactggtcag aatccagcag tgcacccacg ccgctgctga ctttgctgat 9720

gagagggagg ggtcgagcga gtctgtgtga aaccgtgaac cccgccgggg ccttcagtac 9780

gtacgatacc acgagcagta gaaaaaacaa cgccaagatg gcagagtcaa caaccgatca 9840

cagtacgtat cgcattcaca tcaagatttt aagaacgacc cccggctggc caatggcagg 9900

ccacttggtt gcccgtgccc gacagaggga cacggcgcca tgccctccgc gccgcacgga 9960

cgaggtgtcg tgagaaccgg caaaaaaaaa aatcatcgca agtgcgctga agtgaagtgc 10020

cttcccccgc gtttccttgc ccctggccgg tacccatttg gcgccgattc ttttcttgcc 10080

ccccggccgg ccgctcgctc gcctttggat tcttccaaag ccgctgatgg gatggtggcg 10140

aacacaccca ccacccgtct ttgcccaaag cgacccggca caggccgcgc cggcttcact 10200

aaccactagc gcttgtacta ataaaatggt ttctagcgtt tgttgctctc ctttttcttt 10260

tttcgccggt tcttcggagc cgtgtggaca ctggacagcg tccagtccag caggcatagg 10320

gtggtctcgg cggcggtcgt ccgacgacga tcgatctcca tgagattccg cgacaggcca 10380

ggacggaaag ctgggccctt ctcaccaatt cgcgtcggag ccggaacaag attccctccc 10440

ccaatcattt cgacgcgccc tttcttcgcc acccctcgtg gccgtgtttc gcggccggcc 10500

cttatctcct tcccgtgacg cgttcttttg tagcttagcg gccggcacgt tgctaaccag 10560

gctagcttcg ttcgttttta atctgcctat cgagaagaga agaaaaattc gtccatgggg 10620

ccacggcctc ttctgcaggc atttggcatg tgaaggaacc cgaaccagtg aatggagatg 10680

gacggatgct gctcagatac gcagtcaaac ctgccggcga aattacgggg ggagctggct 10740

ggctggctgg ctggacgcca gatcacacat ggatgacgcg gcacggcagc tagccgagca 10800

ggcgctctgc gcacgcaa 10818

<210> 139

<211> 6300

<212> DNA

<213> 玉米

<400> 139

gcactgcact gcactgcacg gatgcagctt tggcaacgag gtgtgtcgcg cagcgctcct 60

gcacggatgt agctttggat tgctggataa tgtctcgcgc aagcgtcgta tttatttatt 120

tatttattac agcctccacc gccgtgcgtg ctccgtttcg gattataata aaactaatat 180

taaataaaaa aatcggatta aaggatgttt ccgaaataaa gatctccacc acaggagcga 240

aagaaaaaaa aagagaaacg ggctatggag aaatggtgtt gcgagtatac ggcggctccg 300

tcgtcgtcgg atcgacatgt acaaagtagg tgcacaaaag gcaaagcaaa atcacctcat 360

caaagaccaa aagcggagca aagaatcgat actaaatcca catgtttttt ttgttcctgt 420

ctactacgtg ctgtgcctgt gcgtgaagca cgattagtac gtgtactcac tcttgtcata 480

ttctttttag tgtcttgtca ctagtcacat ggagtagcaa ccatggctgg cgatacccgc 540

gataaataaa aaaaagagag agggagtaat atattagata ctcacccatt ataaattata 600

aaatatttta gagtttgaat aggtagttct tgtatattta tttatagacc ttcaagtttg 660

tccgcctctc gagagccgaa ctttgttgcc catgcttccc cggctcaggt catgccacct 720

ccttcaccaa gggcacacgg aagatctggt ggagcttgtc atcaccccgc gcccttcaaa 780

catgtgagga tgcgtcgtcg ctggcactag tagcactcat tgtaggcact acattgacag 840

tttcctccag atatgtagtg aggaaacact tgaacaacac gtttgggatt acatatgatg 900

ttttgtttgt tcatcaatga taattccttc ttcttgctta atgattggct ctagaaccga 960

tacatggcac atttcatcag gaagggcgca tgcacgaaat taaactgtta tcgatgtttc 1020

ggtttctaag ttgaagaaaa caatggctaa caactagccc atgtgagcat aacgacaagg 1080

cctacaaaca aaacccaaga aatagctaaa tcatggtctg gatccactct gctatgatag 1140

atcacctttt ctaacatagt tcatcctccc atttgctctc gctcacctag tgcctccatc 1200

gctgagatca atgataagta ccaagtgtac gatgaatccc atttgtcatg cgtcttgcaa 1260

gaatggttgg tccgcttgca gtgccggtcc agctatggac ccaggggcct atgtcataac 1320

tcaagcaaga ccataccccc atatgctacc aagatgcctt ttaagaatcc tggtaaaaga 1380

aatcggtgga agacgactca acgactatca ggccccattt tttgggacca tgctcaagga 1440

tttggcttta gcaaaagtag ataacactat tttggggagc ttgatctcaa ggacacatga 1500

aggaataaag ctattttagt caagacgtcc ttaaggaaca caataagacc ctaggtccct 1560

aatgactagt gtgttatatg tttcgagacg ctcctacacc taagttcttt tagctatttc 1620

cattcacaat gatggtatat gacctaggta ccaatgcccc acggagtttc taacattaag 1680

aatgatctaa aacataagga ccctagagcc agggcactcc tggtattaaa acatttaaac 1740

cctattgcct tagtgctgat ttttgttttt tgtttgtagg aggagaaacg agcacttgtt 1800

gcctctcgcg acaatcttga taggctgtac cgtgatgcca gtaactcctt gaccatccta 1860

gagaggagcc accgcttcac catgtctgac ctagatcatc accaccatga gctgcaggcg 1920

tctcaagatg aagtcttgca acttggacga ttgttgtcga ctaaggattc caccatcaag 1980

gatctgcgct tctaaaaagc tcgtcccgca ggagctagag gcggcccagc ttgctattaa 2040

gactctaaag gacaactgca ccgtcctgaa gacccagcgc gataaagcta tggataaagt 2100

tgttcgcgct ggacggatcc tgatgaggag gcacggcgtt gtggtgcctg acgatattgt 2160

tgtcgatgtc aaggccgcgc ctgatgctac aagtcgtccc tctttttctg ttgctcctgc 2220

gaaggatacc gtctgcaagg atgtttcgat gcagtgatgt cctgtaaaac actttactta 2280

ttgagttagt atctccttgg aggatggatg taatatggat tcaatgtgca tgcgacaatt 2340

gtgttagaac tcgaatattc tacgaacagg gtgccggaaa acggccctag cactggcaag 2400

taagatgttc tcttttcctg aagtgttttc aattttagcc ggttgttatg ctattagggt 2460

atagtggtca ccctaaacag cgcaaatgca agtataccgc gttggcttaa ggtgtgttcc 2520

gacttaagtc agttgccttg ctggtagggc atagtggtca ccctgagtaa agtaagtcag 2580

agtatattgc accgacctaa gtcgattgca ctactagcag ggtatagtga tcaccctaag 2640

tcaagtaagc atgagcatat cgcaccgact taggtcatca ccgacttaag ccgattgttc 2700

tgttagcagg gtataatggt caccctaagt cagataagca tgagcatgtc acaccggctt 2760

aagtcgttgc cgacttaagc cgattgctcc gtcagcaggg tatagtggtc accctaataa 2820

gtcaggtaag catgagcata tcgcactggc ttaagtcgtt gccgacttaa gccgattgct 2880

ccgtcagtag ggtatagtgg tcaccctaag tcaagtaagc gtgagcatgt cgcactggct 2940

taagtcgatt gctccgtcag cagggtataa tggtcacttt aagtcaagta agtgtgagca 3000

tgtcgcacca gcttaagtca tcgccgactt aagctgattg ctccattagc agggtatagt 3060

ggtcacccta agttaggtaa tcgtgctgat ttcaagtcta gcccaatcaa agtcagttgt 3120

aagtcaagag tatgaatgcc tttggagaat gaaaacttta ttgatgatga aattctcgga 3180

tttacagagt acaatgttcc ttcaagaatt ttgaggcctt gctaaggata gaattttctg 3240

aggtgttcta tgttccatga gttcccttct gtgccgtcca tttgagtaag ccggtatggt 3300

cccggccgag tgaccgcctc taatatgatg aacgatcctt cccacagtgg tgatagcttg 3360

tgccgccctt cccccgttag aattcggcga aggaccaagt ctcccactgc aaaggatcgg 3420

tgccgcatag ctttatcatg gtagcacctc aaggtctgct ggtacctagc cgactgaatt 3480

actgtgttca atagttcttc ttccagtaca tcaatatctt ccagtctggt cgcttctgct 3540

tcagctatgc tttcgaaagt taatcttggt gccctgaaga ttaggtcagc gggcagcact 3600

gcctctaacc cataaaccat gaaaaacggg gtatttctat gcagagctcg actgggttga 3660

gttctcaggc tctagaccac gtatggcagc tctctgatcc attttcctgc aagcttttca 3720

ctcttgtcaa atattttctt cctgagtgct tctagtatca ttccgttggt tctttctacc 3780

tggccattgg ctcttgggtg tgctactgat gcatacttaa cctggaagct ccgttgctcg 3840

cagaaatcga gttcagagct ggtgaagttg gatcccagat cggtgatgat gttgtttggt 3900

atcccaaacc tgaatattat gtcttgtata aactccacca ctttggctga ggtcaaggaa 3960

gcaattggct tgtactttat ccattttgtg aatttgttaa tggcaaccag tacatgagta 4020

tagcctccct gagccttctt aaaaggtccg atcatgtcca gcccacagca tgcgaacggc 4080

catgttacag gaatggtctg cagctgctgc gcgggtaagt gttgttgctt tgataggaat 4140

tggcatgctt cacacttctg gactaactcg gcaacatcgt tctttattgt tggccaatag 4200

aaaccggatc taaaagcctt cccgaccaga gtccttgacg ctgcatgtat tccacactgc 4260

ccggcgtgga tttcatccaa caattgtttc tcggtagtcg agtgaataca tttcatgagg 4320

actcttgctg cacctctcct gtacagtaag ccccatatga tggtgtagtg ggccaactgc 4380

ctcgcgatgc attccactgc agccttgtca tctggctctt cttcattttt atatacctga 4440

tgataggctc tctccagtcg ttggggtccg actctggttg gctcaaggta ttgcacactt 4500

ccacctgatc caagatgatg cttggttgtg atatttcttg gacgaagatc ccaggtggag 4560

cctgggcccg actggatccc agcttcgaca acgcgtctgc tgctgcgttg cggtctcgtt 4620

ccacatgatg gaactctaat ccttcaaatt tgtcctctag ttttcgcaca accgcgcagt 4680

atttgcccat ggagtcagtc gagcagtcct agtctttgct tatctggatt atgaccacta 4740

gcgaatcacc atataccatc agtttcttga tgccgagtga tacaacaatg cttaaaccat 4800

ggatcagttc ttcatacttt gctgcattat ttgacgctgg aaatagtagc tggagtgcat 4860

aattgtgttg ctcacctcca ggagcaataa agagaatccc tgcacccgct ccctatagtt 4920

tcaacgagcc atcaaagtac attttccaca cctcgataac ctctgggcta tctgggacct 4980

gatgttcagt ccactctgat acgaagtcaa ccagcgcctg agtcttgatt gccgtgcggg 5040

gccagaactc tatgttgtga gctccaagct cacacgccca cttggcgatc cttccaatag 5100

cttctttgtt gtggagaatg tcccctattg ggaatcctat gaccactatg actttgtggt 5160

cgtcaaagta gtgtcggagt ttgcgtgcgg ttagaagtac tgcatacaac aacttctgta 5220

cttgaggata ccttatcttt gagggcccga ggacttcact gatgaagtag actggatgtt 5280

gcaccgggta cacatgtcct tcctccaccc gcttgactac taacgtggtg cttaccacgt 5340

gagtcgtgct ggagatgtat aacatcaaat cttccaccaa ctgattcagc gtagctcgtc 5400

gtggcggctt gagcactggt ggtgtagtca aaaaatttta gttcctctag agcttcctgc 5460

gcctctgtgg tccactgaaa cttgtccacc tttttgagca atttgtagaa ggccatgcct 5520

tgctccccta gtcttgatat gaacctgctc agggctgcca tgcatccagt aagcctctgt 5580

acctttttct atgatcgcaa cacttccatt ctcatgatgg ccttgacctt ttccgggtta 5640

gcttcaatcc cttggtgact gacaatgaat ctgagtaact tccctgcctg tactctgaaa 5700

acacactttt ctgggttgag cttccaccgg taatgcctca ggctattgaa gactagctgc 5760

aaatcttcaa tgaagttttc tgttttgatc accacatcat caacataggc ttccacccgc 5820

ttgccccagt ggtcggctaa gcatgtctga atggctctct ggtaagttgc tcccgtgttc 5880

ttgaggtcga atgacatgaa ggtgtaatag aaagctccaa atggggtgat gaaagcattc 5940

ttctcctcat cttcttttgc taagcagata tgatggtatc tagaatagca gtctaggaag 6000

gacaacatag aacagccagc ggtcgaatca accacctgat ctattctagg gagcccgaag 6060

ggatctttgg tgtctcagac ctgggggacc ctcaaccaaa tcgacaagtg aattttgtgt 6120

cgcgtgtccc tgcccagatg gattagtgca agatgaaaca caagaggagg ggtgaggttt 6180

atattatctt gcaccagggt gcttgcagta ggggatacaa tctttgcgag agagggaacg 6240

gatcccaggt ctcttgagag atctagtgtt gtgaagggga gttcgatgtt tgagcaagcc 6300

Claims

1.一种用于修饰植物细胞基因组中的靶位点的方法，该方法包括：

a)向该植物细胞中引入第一核酸和第二核酸分子，该第一核酸包含至少100个连续核苷酸并且进一步包含转基因，其中该至少100个连续核苷酸与该细胞基因组中的靶位点具有至少90％一致性；并且

b)该第二核酸分子编码以下核酸酶，该核酸酶用于在与对应于(a)的至少100个连续核苷酸的该细胞基因组中的核苷酸序列相邻的该细胞基因组中的核酸酶切割位点处进行定点切割，其中该核酸酶是包含SEQ ID NO:30的经修饰的Cas9核酸酶，

该引入在该第二核酸分子的表达可以发生以产生该核酸酶并且该核酸酶可以在该细胞基因组中的该核酸酶切割位点处切割并且修饰该植物细胞基因组中的靶位点的条件下进行。

2.如权利要求1所述的方法，其中该植物细胞是玉蜀黍细胞。

3.如权利要求2所述的方法，其中该玉蜀黍细胞是转基因玉蜀黍细胞。

4.如权利要求3所述的方法，其中该转基因玉蜀黍细胞是事件MIR604转基因玉蜀黍细胞。